Автор Тема: Японские электронные словари  (Прочитано 51676 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн zenzen

  • Бывалый
  • ***
  • Сообщений: 201
  • Карма: 0
  • Пол: Мужской
Re: Японские электронные словари
« Ответ #75 : 27 Февраля 2005 12:59:35 »
Кстати, именно по такой схеме (слово-перевод) построен, пожалуй, самый полный англо-русский словарь www.multitran.ru.

Ага, теперь понятно! Значит, намечается нечто вроде яп.-рус.-яп. аналога Мультитрана? Впервые зашел на их сайт – впечатляет, конечно же.

Тогда, несомненно, следует так же добавить и опциальное поле для комментариев к каждому переводу и примеру. Чем скорее это будет сделано, тем скорее у пользователей появится возможность присылать более качественно оформленные статьи.

Был еще вопрос по более точному определению направления перевода. Например, бриновский Edict может искаться большинством оболочек в обоих направлениях, однако основным является яп.-англ., и это особо оговаривается в приложении. Не вполне понятно, на сколько будет качественным  перевод из одной словарной базы (словаря)  в обоих направлениях, но Мультитран вроде бы и с этим справляется.

Цитировать
По хорошему, конечно, надо бы переписать JARCi на другой язык программирования, не требующий Net Framework. Но это уж как будет время.

Объясню поподробнее, в чем здесь засада. Похоже, что большинство .Net'овских программок требуют своей (той, под которую создавались) версии Net Framework. Причем, установка новой версии не удаляет старую. В результате, у меня уже стоят Net Framework 1.0, 1.1, 2.0 beta. Стоит зайти на Windows Update, и если там имеется кокой-нибудь фикс для Net Framework, он опять-таки загружается отдельно для каждой версии. Все это съедает и много времени, и много места на диске. Но я (и не только я) конечно же, готов потерпеть на стадии разработки прграммы и базы. :)

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #76 : 27 Февраля 2005 17:49:47 »

Тогда, несомненно, следует так же добавить и опциальное поле для комментариев к каждому переводу и примеру. Чем скорее это будет сделано, тем скорее у пользователей появится возможность присылать более качественно оформленные статьи.

Был еще вопрос по более точному определению направления перевода. Например, бриновский Edict может искаться большинством оболочек в обоих направлениях, однако основным является яп.-англ., и это особо оговаривается в приложении. Не вполне понятно, на сколько будет качественным  перевод из одной словарной базы (словаря)  в обоих направлениях, но Мультитран вроде бы и с этим справляется.


Насчет комментариев.
В мультитране реализовано так:
рус слово - анг слово - (комментарий на рус. языке)
Пример:
великан - jumbo - (о человеке, животном)

При таком подходе есть несколько ограничений:
1) при переводе в обе стороны (и с анг. на рус., и с рус. на анг.) комментарий все равно выдается на рус. языке, причем один и тот же комментарий
2) комментарий может стоять только ПОСЛЕ заглавного слова

—————

Я думал, как реализовать комментарий, и пока остановился на таком подходе - просто сделать комментарий частью слова, поместив его в скобки.

В окне "Добавить статью" внизу в поле "Информация" есть подсказка о том, что "комментарии помещайте в скобки".

Таким образом, комментарий может стоять впереди основного слова:
———————————————-
(денежный) капитал
<экон.>
資本金  【 しほんきん 】
———————————————-

... или позади основного слова:
———————————————-
девальвация (снижение паритета валюты)
<экон.>
平価切下げ  【 へいかきりさげ 】
———————————————-

Причем, для каждого слова - комментарий на своем языке:
———————————————-
(昆布の)群落
<рыб.х-во>
заросли (морской капусты)
———————————————-

Сейчас комментарии везде выдаются как часть основного слова, но потом можно будет их легко извлечь и осуществить с ними любые действия. Их можно, например, не показывать в основном списке слов.

Насчет направления перевода. Поскольку словарная база состоит из пар "слово"-"перевод", то перевод может осуществляться в обе стороны. Причем, оба направления равнозначны. Этот подход, как можно убедиться, прекрасно работает у Мультитрана.

Объясню поподробнее, в чем здесь засада. Похоже, что большинство .Net'овских программок требуют своей (той, под которую создавались) версии Net Framework. Причем, установка новой версии не удаляет старую. В результате, у меня уже стоят Net Framework 1.0, 1.1, 2.0 beta. Стоит зайти на Windows Update, и если там имеется кокой-нибудь фикс для Net Framework, он опять-таки загружается отдельно для каждой версии. Все это съедает и много времени, и много места на диске. Но я (и не только я) конечно же, готов потерпеть на стадии разработки прграммы и базы. :)

Меня вообще-то тоже удивляет, почему так сложно распространять программы написанные с помощь .Net языков. Кстати, у меня у самого три версии Net Framework.

Этот Net Framework загружается и ставится довольно долго. И вообще вся эта заморочка с .Net не имела бы смысла, если бы не перевешивалась простотой программирования. Если бы с самого начала на Visual Basic 6.0 писал, то проблем бы не было.

Так что насчет неудобства .Net я в курсе. Будем думать.
« Последнее редактирование: 27 Февраля 2005 17:52:45 от Sapporo »

Оффлайн zenzen

  • Бывалый
  • ***
  • Сообщений: 201
  • Карма: 0
  • Пол: Мужской
Re: Японские электронные словари
« Ответ #77 : 27 Февраля 2005 23:32:29 »
Я думал, как реализовать комментарий, и пока остановился на таком подходе - просто сделать комментарий частью слова, поместив его в скобки.

Хорошо продумано! Тот же 資本金 находится и через "капитал", и через "(денежный) капитал". А вот "денежный капитал" дает уже 貨幣資本. Зато слово "денежный" дает все выражения, где оно встречается в начале, в конце, в середине сочетпния и в скобках...
Да, не все так просто...

В любом случае, с нетерпением жду возможности добавления примеров в базу (через оболочку). По-моему, это все-таки стоит осуществить, прежде чем заниматься серьезным пополнением общей лексики.
« Последнее редактирование: 27 Февраля 2005 23:43:47 от Zenzen »

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #78 : 28 Февраля 2005 00:17:53 »
Да, с комментариями нужно еще повозиться. Сейчас вот думаю, что делать с различными значениями одного слова. Обычно их нумеруют 1).... 2).... 3)....

В Мультитране они, похоже, все в одну кучу скинуты - оно так проще с точки зрения программирования базы.

В любом случае, с нетерпением жду возможности добавления примеров в базу (через оболочку). По-моему, это все-таки стоит осуществить, прежде чем заниматься серьезным пополнением общей лексики.

Не совсем понял. Можно же добавлять примеры как отдельные статьи. Они потом все равно найдутся, так как содержат нужное слово.

Например, если ввести как отдельную статью пример-предложение с тем же "денежным капиталом", то потом по поиску "капитал" этот пример выйдет в списке рядом с самой статьей.
« Последнее редактирование: 28 Февраля 2005 00:20:24 от Sapporo »

Оффлайн zenzen

  • Бывалый
  • ***
  • Сообщений: 201
  • Карма: 0
  • Пол: Мужской
Re: Японские электронные словари
« Ответ #79 : 28 Февраля 2005 11:19:01 »
Сейчас вот думаю, что делать с различными значениями одного слова.

Не совсем понял. Можно же добавлять примеры как отдельные статьи. Они потом все равно найдутся, так как содержат нужное слово.

Ага, вот здесь как раз и сложности появляются. Следуя обычной логике книжных словарей, различные значения одного слова следовало бы пронумеровать. Причем, это не просто цифры, а либо порядковый номер значения, начиная с наиболее распространенного и кончая более узким, либо, как в Кодзиэне, сортировка идет от более древнего значения к более современному (что хорошо для этимологических словарей, но не удобно для переводных). Если же цели сортировки значений не ставится, то можно цифры вообще опустить, но дать понять каким-либо другим способом (хоть через какой-нибудь разделительный знак или "•"), что это различные значения. Проблема в том, что сортировка все равно будет (по алфавиту).

И с примерами... Если их добавлять как простые словарные статьи, без привязки к  определенному слову или определенному значению, то при поиске появятся все примеры, в которых искомое слово встречается. Если примеров много, то таким словарем просто невозможно будет пользоваться. По-моему для примеров необходима привязка к словам и значениям. Конечно же, как опцию можно обеспечить отдельную возможность поиска слова во всех доступных примерах.

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #80 : 28 Февраля 2005 14:45:27 »
Кстати, выловил пару багов, связанных с изменением статей. Залил на сайт обновленную версию v.0.80.

Ага, вот здесь как раз и сложности появляются. Следуя обычной логике книжных словарей, различные значения одного слова следовало бы пронумеровать. Причем, это не просто цифры, а либо порядковый номер значения, начиная с наиболее распространенного и кончая более узким, либо, как в Кодзиэне, сортировка идет от более древнего значения к более современному (что хорошо для этимологических словарей, но не удобно для переводных). Если же цели сортировки значений не ставится, то можно цифры вообще опустить, но дать понять каким-либо другим способом (хоть через какой-нибудь разделительный знак или "•"), что это различные значения. Проблема в том, что сортировка все равно будет (по алфавиту).

Решил все-таки реализовать нумерацию различных значений. Что касается сортировки значений - то будет просто цифрами вразброс, без особой логики. Некоторыми вещами придется пожертвовать. Иначе этот словарь будет готов только лет через 50.   : )

И с примерами... Если их добавлять как простые словарные статьи, без привязки к  определенному слову или определенному значению, то при поиске появятся все примеры, в которых искомое слово встречается. Если примеров много, то таким словарем просто невозможно будет пользоваться. По-моему для примеров необходима привязка к словам и значениям. Конечно же, как опцию можно обеспечить отдельную возможность поиска слова во всех доступных примерах.

Конечно, привязка примеров к конкретному слову - это хорошо. Однако, я лично не думаю, что отказ от этой привязки так уж смертелен.

Возмем тот же мультитран, в котором нет этой привязки. Там примеров (в основном - словосочетаний) очень много. Создатель мультитрана перелопатил больше 200-х бумажных словарей, общая база больше 3-х млн. статей. И что? Примерами все равно можно успешно пользоваться. Как мне кажется, благодаря трем вещам:
1) развитая система тематик (т.е. можно осуществлять фильтрацию по тематикам)
2) морфологический блок, позволяющий искать слова в любой грамм. форме
3) самодостаточность примеров

Насчет самодостаточности объясню подробнее. Для чего вообще привязка эта нужна? Только для того, чтобы понять к какому значению основного слова относится определенный пример . Так из самого примера это и так ясно.

Например, у русского слова "любитель" есть два японских значения:
——————————————-
любитель
1) 愛好家; ファン
2)素人; アマチュア
——————————————-

Возьмем пару примеров, иллюстрирующих употребление этого слова:
——————————————-
любитель музыки
音楽愛好家
——————————————-
фотограф-любитель
アマチュアカメラマン
——————————————-

Из этих самих примеров вполне ясно, какое более узкое значение слова "любитель" они иллюстрируют.

Т.е. в текущей реализации JARCi будет так. Вводишь слово "любитель" в поиск. Тебе выходит список из трех статей:
——————————————-
любитель
любитель музыки
фотограф-любитель
——————————————-

Из этих примеров даже удобнее выбирать то, что ближе подходит к нужному пользователю значению.

Как бы там ни было, привязки к значениям нет ни в мультитране, ни в alc.co.jp (более 1.3 млн. статей). Тем ни менее, это обстоятельство не мешает этим вполне успешным проектам.

Так что в JARCi привязки примеров к конкретным значениям не будет. Эта одна из тех вещей, которыми приходится жертвовать.

Оффлайн zenzen

  • Бывалый
  • ***
  • Сообщений: 201
  • Карма: 0
  • Пол: Мужской
Re: Японские электронные словари
« Ответ #81 : 28 Февраля 2005 20:40:55 »
Продолжаю занудствовать дальше, уже так, больше по инерции.

Насчет самодостаточности объясню подробнее. Для чего вообще привязка эта нужна? Только для того, чтобы понять к какому значению основного слова относится определенный пример . Так из самого примера это и так ясно.

Категорически не согласен. Привязка, а точнее пример нужен для того, чтобы раскрыть, проиллюстрировать употребление, либо определенное значение определенного слова. То есть пример зачастую показывает то, что простой перевод дать не может - ту же сочетаемость слов, оттенки и нюансы. Если же все примеры к разным словам свалить в кучу и перемешать, выстроив затем в алфавитном порядке по-первому слову во фразе/предложении, то самые нужные примеры могут вообще затеряться где-то в огромном списке.

А самодостаточность примеров, это уже другая тема. Примерами, конечно же можно и отдельно пользоваться, как в Asahi Press Sentence. Этот словарь создан для японцев, чтобы они могли деловые письма и пр. методом копи-энд-паст писать.
И там не примеры вовсе, а переведенные фразы из газет и прочих источников.

Цитировать
Возьмем пару примеров, иллюстрирующих употребление этого слова:
——————————————-
любитель музыки
音楽愛好家
——————————————-
фотограф-любитель
アマチュアカメラマン
——————————————-

Это, конечно же тоже примеры-словосочетания, и такие примеры вполне могут идти отдельными статьями без особой привязки. Оба примера представляют какое-то отдельное понятие, предмет, человека, професию и пр. Согласен, что такие примеры вполне самодостаточны.
Я же имею в виду целые фразы и предложения, которых не меньше, а то и больше среди словарных примеров, нежели словосочетаний.

Цитировать
Так что в JARCi привязки примеров к конкретным значениям не будет. Эта одна из тех вещей, которыми приходится жертвовать.


Тут ничего не поделаешь. Хозяин, как, говорится, барин. Пусть хоть такой словарь будет.

Как я понимаю, возможность линков (ссылок) на синонимы, антонимы и пр. тоже не рассматривается?

А ведь все эти линки и привязки чисто технически не так уж и сложно осуществить (на подобии href в html/xml или в той же базе Access). Но, молчу, молчу.

Неужели никому больше тема не интересна?

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #82 : 28 Февраля 2005 22:49:09 »
Продолжаю занудствовать дальше, уже так, больше по инерции.

Лично я к тому "занудству" очень даже положительно отношусь. Конструктивная критика всегда идет на пользу делу.

Категорически не согласен. Привязка, а точнее пример нужен для того, чтобы раскрыть, проиллюстрировать употребление, либо определенное значение определенного слова. То есть пример зачастую показывает то, что простой перевод дать не может - ту же сочетаемость слов, оттенки и нюансы. Если же все примеры к разным словам свалить в кучу и перемешать, выстроив затем в алфавитном порядке по-первому слову во фразе/предложении, то самые нужные примеры могут вообще затеряться где-то в огромном списке.

Ну представим, что все наши примеры-предложения идут одним большим списком и отсортированы по алфавиту. Но при поиске на конкретное слово этот список видоизменяется. Остаются только те предложения, которые содержат нужное нам слово (или словосочетание).

К тому же, можно это главное слово (которое мы искали) выделить и плясать от него. Приведу пример.

Представим, что у нас уже есть большой список из примеров-предложений. Осуществим воображаемый поиск по тому же слову "любитель". Выйдет несколько предложений, в каждом из которых будет выделено наше слово:

————————————————————————————————
Это, видимо, возвращались домой любители ночных киносеансов.
Ну и любитель же ты корпеть над книгами!
Мне рассказывали, что вы большой любитель всяких таинственных случаев, и я решил, что уж страннее этого вам ничего не найти.
Он был любителем карточной игры, постоянно играл, но никогда не выходил за пределы благоразумия.
Вы профессионал или любитель?
Он по образованию физик, а историей занимается как любитель.
Я не любитель спиртного.
...
————————————————————————————————

При таком раскладе найти нужный пример - не такая уж сложная задача.

Еще раз повторю. Подход бумажных словарей - привязывать примеры к конкретным значениям - я считаю правильным. Была бы возможность - я бы это реализовал. Однако это довольно сложно сделать при данной структуре БД.

Как я понимаю, возможность линков (ссылок) на синонимы, антонимы и пр. тоже не рассматривается?

А ведь все эти линки и привязки чисто технически не так уж и сложно осуществить (на подобии href в html/xml или в той же базе Access). Но, молчу, молчу.

А вот что касается антонимов и синонимов, то это впоследствии легко добавить. Действительно, реализовать это несложно - хоть в виде ссылок, хоть в виде отдельной таблицы. Занесем эту идею в список to do.

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #83 : 04 Марта 2005 14:00:20 »
Появилась новая версия. Учтены замечания Zenzen и других пользователей.

———————————————————————————————-
v.0.81

- Можно выбрать язык интерфейса при инсталляции программы.
- Добавлены ярлыки на программу и на файл деинсталляции.
- Возможность управлять автозапуском.
- Возможность включить или отключить появление иконки в системной панели.
- По просьбе пользователей в интерфейс внесено следующее изменение. В поле "Оригинал" в окне "Добавить статью" можно вводить не только английские слова, но и слова на любом другом языке (напр., на корейском). Это позволяет создавать пользовательские 3-х язычные (рус-яп-...) словари.
- Словарная база данных перенесена в ту же папку, где находится программа.

Nevezzda

  • Гость
Re: Японские электронные словари
« Ответ #84 : 04 Марта 2005 19:27:16 »
Простите невежду..но как там сделать, чтобы японский отображался нормально, а то у меня одни вопросики(хотя поддержка яя на компе стоит) ??

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #85 : 04 Марта 2005 22:40:38 »
Простите невежду..но как там сделать, чтобы японский отображался нормально, а то у меня одни вопросики(хотя поддержка яя на компе стоит) ??

С вопросами по JARCi  можете обращаться по эл. почте : [email protected]

————————

Что касается вашего вопроса, то сообщите подробнее о вашей системе (какая версия Windows). Как я уже сказал, можете напрямую писать на [email protected].

Программа была протестирована под родными анг., рус., япон. и корейс. Windows XP. Проблем не было.

Sapporo

  • Гость
Re: Японские электронные словари
« Ответ #86 : 05 Марта 2005 17:00:17 »
Приглашаю продолжить обсуждение JARCi на форуме на самом сайте:
http://jarci.com/bb/

volandray

  • Гость
Re: Японские электронные словари
« Ответ #87 : 02 Декабря 2005 20:27:31 »
http://www.solar-fansubs.net/stuff/daiwaei5.rar
более недоступен, ни у кого копии не осталось?

Оффлайн sapporo2

  • Зарегистрированный
  • *
  • Сообщений: 7
  • Карма: 0
Re: Японские электронные словари
« Ответ #88 : 02 Апреля 2006 23:37:11 »
Касательно JARCi.

Был полностью отсканирован, распознан и введен в базу данных программы рус-яп словарь. Объем базы составил примерно 120 тыс. пар "слово-перевод". Вся работа заняла чуть меньше полугода. Сейчас словарь работает в виде альфа-версии. Правда, на компьютере только одного бета-тестера...

В течение следущего полугода планировался ввод япон-рус словаря аналогичного объема, после чего у нас бы появился полноценный электронный япон-рус словарь, но....

.... было принятно решение о замораживании проекта. Поскольку быстрая экономическая отдача проекта весьма туманна.

Проект не закрыт, а только заморожен на некоторое время.

Однако, некоторые наработки были использованы в нашем новом проекте (www.injapan.ru). Там автоматический переводчик на лету переводит с японского на русский описания к лотам с аукциона Yahoo. Правда, этот переводчик работает с объемом базы где-то 20% от расчетной, так что пока еще все впереди.

Планируем, что успешное развитие этого нового проекта позволит реанимировать JARCi. Сейчас сайт www.jarci.com не работает.
« Последнее редактирование: 02 Апреля 2006 23:39:36 от sapporo2 »