Прошу совета по созданию настольного словаря

Изображение пользователя judge.

Уважаемые друзья! Прошу подсказать, - есть ли программы(а), которая сгодилась бы для создания собственно, настольного локального словаря на моём десктопе, в произвольном виде...
Например: мне для изучения технического английского необходима программа с удобным интерфесом, в которой при вводе слова показывала бы сразу перевод или предлагала ввести его как новое слово и сохраняла бы для будущего использования.
Прошу прощения, если сумбурно объяснил....
P.S. Оговорюсь, что офисные приложения не хочется использовать. От них тошнит! Спасибо заранее.

0
judge - 4 Сентябрь, 2011 - 19:55
Изображение пользователя judge.

О! Это у нас тут на сайте есть?!! :) Чё-то недоковырял ... Спасибо, дружище. Есть поле для деятельности. :)

+1
DarkneSS - 5 Сентябрь, 2011 - 01:23
Изображение пользователя DarkneSS.

Сейчас в моде GoldenDict

0
Michael72 - 5 Сентябрь, 2011 - 23:54
Изображение пользователя Michael72.

Мне пока что не удалось найти ни одного словаря, — не беря в расчёт Словари Он-Лайн, — которые имели бы встроенную функцию лемматизации. Без данной функции пользователь вынужден перед отправкой запроса в словарь преобразовывать форму слова в базовую словарную форму. В своей статье про лемматизатор, в конце статьи, я сделал кое-какие намётки для создания HTML-словаря со встроенной функцией лемматизации. Можно посмотреть видеоролик, который демонстрирует работу этого HTML-кода. В настоящее время HTML-код подправил и использую для личных целей, но ещё нигде не опубликовал. Но если будет какой-либо интерес, то это подтолкнёт меня сделать это.

0
judge - 8 Сентябрь, 2011 - 20:58
Изображение пользователя judge.

Спасибо и за это. Поучительно. Новое слово узнал - "лемматизация" :) День прошел не зря. Приблизительно это мне и нужно. Только вот, по-видимому придётся самому писать программку. Дело в том, что мне нужен ПУСТОЙ словарь и функция лемматизации должна будет находится в ядре программы (если это корректно звучит).
Проще говоря - словарь должен будет создаваться собственными силами моей детворы (не спрашивайте зачем - это уже другая тема). ОНЛАЙН словари не подходят.

+1
Michael72 - 8 Сентябрь, 2011 - 22:12
Изображение пользователя Michael72.

Я обращался к разработчикам программы StarDict, — там есть возможность общаться по-русски, — с идеей создать в настройках программы такую возможность, чтобы можно было подключать внешний лемматизатор. Т.е. для любого языка пользователь сам создаёт свой лемматизатор как отдельный модуль, программа должно только его подключить. Мне дали понять, что мне никто не запрещает самому всё это сделать, ведь код программы открытый. Но эта задача не моего уровня. Но это так — вступление. Короче, я хочу предложить и тебе такую идею. Если получится создать такую программу, которая умеет подключать лемматизатор, то она бы была интересна и для меня для моей языковой пары — иврит-русский.

0
judge - 9 Сентябрь, 2011 - 20:33
Изображение пользователя judge.

Если сподоблюсь, таки, навернуться на создание своего словаря, то, можете быть спокойны - свяжусь с Вами :). ...например: для более подробных консультаций. Вас я взял на заметку :).
А вот более подробную переписку с разработчиками, о которой шла речь выше, хотелось бы посмотреть ... скажем так - для начала.
С английским у меня не очень, так что, по-возможности покажите переписку с Вашими комментариями.

+1
Жюстина - 9 Сентябрь, 2011 - 21:02
Изображение пользователя Жюстина.

Лемматизация совсем убогое для перевода средство и подойти может только к языкам без родов и падежей, то есть только один язык(не учитывая, сохранившихся в африке), современный английский.

Пример - "одомашненный" - лемма: дом (и как из этого получить адекватный перевод?)

Человеческий язык - это, на много более сложная структура чем просто слова и морфология, компьютерно его можно анализировать только как в шахматных программах, имея набор из миллионов партий, выбрать "статистичиски самое верное решение" хода(слова); этот алгоритм придуман в 70х годах, и гугла им пытается пользоваться, но пока копит именно ту фразовую базу данных.

Промт - результат лемматизации, кстати, при том самой лучшей в мире на данный момент )))

0
Michael72 - 9 Сентябрь, 2011 - 21:15
Изображение пользователя Michael72.

У вас ошибка. Для слова одомашненный лемма — ОДОМАШНИТЬ. Проверьте здесь.

+1
Жюстина - 9 Сентябрь, 2011 - 21:32
Изображение пользователя Жюстина.

а лемма для одомашнить?

одомашненный - причастие, оно ведь по сути то своей больше прилагательное(и внезапно стало глаголом, это-то и есть проблема лемматизаторов - переход в другие части речи)...

относительно одного слова, нужно лемматизировать до конца, а в контексте уже другое дело...

0
Michael72 - 9 Сентябрь, 2011 - 21:54
Изображение пользователя Michael72.

Лемма для одомашнить — ОДОМАШНИТЬ. Данная форма слова уже является леммой. А с проблеммой относительно причастия согласен. Странно, почему так, если в словаре слова в форме причастий имеются. Получается, что для слова одомашненную должно быть ОДОМАШНЕННЫЙ, а тот лемматизатор выдаёт ОДОМАШНИТЬ. Интересно, что в словаре Он-Лайн Babylon тоже с причастием проблема. Спасибо за данное замечание.

+1
Жюстина - 9 Сентябрь, 2011 - 22:57
Изображение пользователя Жюстина.

Словообразование языка знать надо, а не лемматизировать пустое в порожнее!

0
Michael72 - 9 Сентябрь, 2011 - 23:58
Изображение пользователя Michael72.

Нашёл я здесь объяснение тому, что происходит с причастием. Цитирую: В русском языке нормальными формами являются: для существительных - именительный падеж единственного числа, для прилагательных - именительный падеж единственного числа мужского рода, для глаголов, причастий и деепричастий - глагол в инфинитиве.
Очень неудобно получается, но вышеупомянутый лемматизатор работает в рамках определённых правил.

0
Michael72 - 9 Сентябрь, 2011 - 23:29
Изображение пользователя Michael72.

Если термин "ПУСТОЙ словарь" подразумевает возможность создания своих собственных словарных баз, то рекомендую так же для ознакомления эту статью — Как перекодировать словарь Dict -а в словарь для StarDict -а ?. А именно, рекомендую обратить внимание в этой статье на то, что касается утилиты dictfmt. С помощью этой утилиты я создаю свои тематические словари, которые затем очень мне помогают. В качестве примера можно посмотреть мои словари, выложенные на DICT-сервере dict://dictd.xdsl.by, словари которого в частности могут быть доступны через web-интерфейс на сайте Slavic dictionaries on-line.
Исходя из этого, рекомендую писать программу, как ещё один dict-клиент.

0
judge - 10 Сентябрь, 2011 - 00:22
Изображение пользователя judge.

Во! Вот это ближе к телу :) Спасибо. Начал ковырять... :)

0
judge - 9 Сентябрь, 2011 - 22:27
Изображение пользователя judge.

:) Боже ж мой !!! Я, таки, совсем забыл русский язык. Читаю ваши комменты и ужас берёт! Подсохли мозги то уже с возрастом. :) Как хорошо, что есть ещё на свете грамотные люди! :)
Но вернусь к теме топика: Посовещавшись несколько дней с этой абразиной, по имени - Интернет, пришли с товарищем к выводу, что написания собственной программы не избежать... На чем писать будем, пока не решили ... Посмотрим.
Если к моменту создания программки, данный топик не "сотрётся", то предложу на нашем сайте (кубунту.ру) её, то бишь - программку на суд. Предполагаю, что она будет удобной для изучения языков начинающим и детям.

P.S. А Жюстина как всегда - рулит! :) Так держать!

0
Michael72 - 10 Июль, 2013 - 08:57
Изображение пользователя Michael72.

Случайно как-то обратил внимание, что у словаря ABBYY Lingvo имеется такая функциональность, которая вам нужна. Цитирую:
LUD-словари — это простые словари типа слово-перевод.
LUD-словари легко создавать, пополнять и редактировать прямо во время работы с ABBYY Lingvo.

Источник.

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры