Альтернатива...

  • 7,8K Просмотров
  • Последнее сообщение 17 августа 2010 06:36
dict.org (LingvoDa) написал 07 июня 2005 07:16

Hi all,

Вот тут был затронут вопрос, является ли создание словарей в коммерчески-ориентированном формате, которым является DSL, целесообразным и рациональным:

http://www.lingvoda.ru/forum/actualthread.aspx?bid=7&tid=2240

Есть основания полагать, что это не так и предлагается рассмотреть альтернативный сценарий.

Итак, что имеем:

1. Автор создает словарь
1.1 создается .doc файл в программе Word
1.2 запускается макрос в программе Word, который генерирует словарь в формате DSL.
2. Автор публикует словарь
2.1 словарь преобразовывается из DSL во внутренний формат коммерческой программы Lingvo.
2.2 полученный .LSD публикуется
3. Пользователь работает со словарем
3.1 опубликованный словарь скачивается на компьютер пользователя
3.2 пользователем покупается программа Lingvo
3.3 скаченный словарь подключается к программе Lingvo, после чего готов к использованию

Недостатки такой системы очевидны:

1) DSL далёк от идеала и просто не способен сохранить определенную часть информации.
2) Отсутствует специализированное ПО для создания словаря.
3) Коммерческая ориентация подхода приводит к тому, что люди, на самом деле желающие поделиться своим трудом с другими - делятся им с компанией ABBYY, работники которой выкладывают словари во внутреннем формате программы Lingvo.
4) Отсутствует система предоставления возможности получения доступа ко всем этим словарям online.
5) Отсутствует система обновления опубликованных словарей самими авторами, когда им это удобно сделать.
6) Ввиду закрытости публикуемых словарей, отсутствует принципиальная возможность преборазовать их в другие форматы.

Что хотелось бы иметь:

1) Формат, позволяющий преобразовать словарь в любой другой формат, и конечно же, в DSL.
2) ПО для создания словаря, умеющее работать с этим форматом
3) Систему публикации словарей, всегда доступных online.

Небольшой background.

Существует специально разработанный консорциумом TEI xml-формат для словарей (условно - TEI DICT). Он достаточно гибкий и позволяет описать то, что DSL описывать не умеет. TEI DICT был взят в основу открытого проекта по созданию словарей - FreeDict ( http://freedict.org ). Существует документ, в общих чертах описывающий правила создания словаря в формате TEI DICT ( http://freedict.org/howto/index.html ). В документе наглядно показана схема потоков данных (DataFlow): http://freedict.org/howto/pr01.html , а также предложена схема работы с единым CVS-хранилищем словарей ( http://freedict.org/howto/ch08.html )
Из первой схемы видно, что словари TEI свободно преобразовываются в разные форматы: .ipk, .tld, .dict, причем набор программ, выполняющих эти преобразования уже существует. На схеме не хватает лишь преобразователя TEI -> DSL, но он либо уже написан, либо может быть легко написан (возможно, это сделаю я, если это будет востребованно). Еще немного о форматах. Чуть выше был отмечен формат .dict Это есть не что иное, как БД для сервера dictd, который как раз и используется для организации online доступа к словарям. Такие серверы уже существуют и работаю, ко многим из которых прикручен веб-интерфейс и все из них умеют работать по специальному протоколу dict.

Вот список серверов:
http://luetzschena-stahmeln.de/dictd/index.php

Примеры:

dict://dict.org - 75 словарей, есть много англоязычых толковых
http://www.dict.org - тоже самое, доступ через веб-интерфейс


dict://mova.org - 75 в основном русскоязычных словарей
http://www.mova.org/~cheusov/cgi-bin/dict.cgi - тоже самое, доступ через веб-интерфейс

и т.д.

Итоговый сценарий мог бы выглядеть следующим образом. Пользуясь определенной программой, автор создает словарь в формате TEI DICT. В любой момент автор может создать соответствующий DSL файл (или LSD, если угодно) и опубликовать его на сайте lingvoDA.ru, либо на DICTD сервере, чтобы словарь стал доступным online. В принципе, можно несколько упростить процесс, делигировав публикацию DSL-ей на lingvoDA.ru серверу DICTD, ведь процесс преобразования TEI -> DSL - автоматический.

Хорошая новость заключается в том, что сценарий уже реализован в рамках упомянутого выше проекта FreeDict.Org ( http://feedict.de , http://feedict.org )
Плохая - там отсутствуют две компоненты:

1) Нет ПО для создания словаря
2) Нет конвертатора TEI -> DSL

У меня вопрос, насколько вышеизложенное интересно и согласны ли Вы работать с этой системой, 1 & 2 будут реализованы?

--
Free as in Freedom

Сортировка: Стандарт | Новые | Голоса
dict.org (LingvoDa) написал 07 июня 2005 07:21

fix*
s/согласны ли Вы работать с этой системой, 1 & 2 будут реализованы?/согласны ли Вы работать с этой системой, ЕСЛИ 1 & 2 будут реализованы?

--
Free as in Freedom

I.G. traduttore написал 07 июня 2005 08:05

А зачем мне какой-то новый путаный проект, когда у меня уже есть Lingvo с отличным набором словарей и быстрым поиском? Для моих целей его вполне хватает. И Линукс мне тоже никакой не нужен - Виндоуз у меня уже стоят и я в них нормально ориентируюсь, зачем тратить время и переучиваться. Вот на КПК мне словарь скоро потребуется, но я еще не решил, что лучше, Palm или Pocket PC.

так зашел на огонек написал 07 июня 2005 09:02

по-моему пост выше показательный,
пользователю наплевать в каком формате словари,
ему это по барабану.

пользователю нужно
1)ПО для создания словарей (единицам)
2)ПО для поиска в словарях сделанных в пункте 1 +
к этому ПО должны прилагаться уже существующие большие словарные базы

Вот это и предоставляет ABBY в lingvo

пункт 1 убог, но он нужен малому количеству,
а вот пункт 2 довольно хорош для большинства.

ЗЫ

возможно пункт один будет решен в скором времени
http://www.lingvoda.ru/forum/actualthread.aspx?bid=1&tid=2003&pg=-1

dict.org (LingvoDa) написал 07 июня 2005 10:05

Я не понял, Вы кто, пользователь или автор? Если первое - проходите мимо, Вас это не коснется, разве что появиться возможность воспользоваться свежей версией словаря online, без установки какой-либо программы. И, очевидно, при наличии инета, будет совершенно сиренево - Palm у Вас или что-то другое.

--
Free as in Freedom

dict.org (LingvoDa) написал 07 июня 2005 10:12

Недостатки существующей системы описаны мною выше.

--
Free as in Freedom

так проходил мимо написал 07 июня 2005 11:44

Недостаток один - сложность создания словарей.

Само ABBYY имеет ПО для создания словарей, и dsl генериться из какого-то
внутренего предоставления словарей этого ПО. Но они почему-то не хотят поделиться.

Но я думаю в конце концов появиться удобноее ПО и для создания словарей.

А то что за нормально ПО надо платить, это к сожаления для моего кошелка,
но к радости для моих нервов факт.

Вам тоже когда-нибудь придется с ним смириться.

I.G. traduttore написал 08 июня 2005 02:00

А я вас не понимаю.

Наверное, я пользователь Lingvo, на автора не тяну (но делаю в свободное время свой итальянский словарь идиом). Что значит "Вас это не коснется, разве что появиться возможность воспользоваться свежей версией словаря online, без установки какой-либо программы"? Мне нужен словарь на наладонном компьютере (на обычном комьютере устраивает Лингво). А на десктопе мне сейчас нужны не столько словари безымянных пользователей, сколько "Тетради новых терминов", которые часто с ностальгией вспоминаю. Вот хорошо бы их в лингвовском формате регулярно выпускали :-))

twinkling написал 13 мая 2009 02:54

Лично мне весьма бы пригодилось ПО, обеспечивающее формирование баз данных словарей в каком-нибудь открытом формате с удобным формированием карточек словарных статей, а не как в Лингве, где даже из буфера ничего не вставишь и ненужные окошки с экрана не уберешь при заполнении карточки пользовательского словаря. Если ПО оное с грамотными шаблонами для словарных статей разных типов - так вообще красота, коли не во вред гибкости формирования оной карточки). А будет оно потом в лингвовские базы конвертироваться или нет - мне не важно, если будет полноценно работающая клиентская прога к этим данным опять же в свободном доступе. В данный момент мне для толкового словоря специальных терминов. В таблице а-ля Exel-евской - на мой вкус - ...неэстетично, что-ли, - не нравится, в общем. Почему именно свободное ПО и специализированное - не столько даже из-за бесплатности для себя, сколько, чтоб потом не было ограничений на возможности делиться результатом. Онлайновские возможности - только кстати - совместно наполнять быстрее будет но в таком случае нужны и возможности администрирования. По мне, локальные возможности существеннее - интернета может в какой-то момент и не быть...
Какие-то скрипты писать для форматирования под некие стандарты - сейчас руки не дойдут - скорее сподоблюсь простенкую базу данных средствами Офиса состряпать.

Clairette написал 17 августа 2010 06:36

Меня эта тема тоже очень интересует. Хотелось бы найти бесплатную программу для создания своих словарей в каком-то формате, который можно было бы интегрировать во многие платные словари, такие как Lingvo, Multitran, возможно какие-то другие. Это бы позволило создавать пользовательские словари без привязки к конкретной платной программе. Вот только пока не знаю, существует ли такое решение. Была бы благодарна за информацию.

Close