Автор Тема: Help! как выяснить где слово заквнчивается?  (Прочитано 19122 раз)

0 Пользователей и 1 Гость просматривают эту тему.

name

  • Гость
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо

Оффлайн Zavsegdatai

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 1957
  • Карма: 46
  • Пол: Женский
Re: Help! как выяснить где слово заквнчивается?
« Ответ #1 : 10 Ноября 2005 09:30:23 »
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
так же как и в русском - между словами ставится пробел  ;D
In God we trust!

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: Help! как выяснить где слово заквнчивается?
« Ответ #2 : 11 Ноября 2005 03:39:36 »
А еще есть всякие знаки препинания. ;)
Поставивший мне минус в карму,
Да благославлён будет!

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: Help! как выяснить где слово заквнчивается?
« Ответ #3 : 11 Ноября 2005 18:01:30 »
На самом деле проблема интересная и подвязана на машинное распознавание, что Вас, name, скорее всего и интересует. Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было. А если вопрос действительно волнует, то советую состыковаться с разработчиками корейских электронных переводчиков (хотя они вряд ли самым дорогим поделятся :()

name

  • Гость
Re: машинное распознавание слов
« Ответ #4 : 11 Ноября 2005 21:16:54 »
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

name

  • Гость
Re: stemming
« Ответ #5 : 11 Ноября 2005 21:56:53 »
вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\

Оффлайн kwisin

  • Заслуженный
  • *****
  • Сообщений: 1995
  • Карма: -14
  • Пол: Мужской
Re: stemming
« Ответ #6 : 12 Ноября 2005 18:58:55 »
вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\

А что тут непонятного? Если нужно просклонять слово, добавляются падежные окончания. Сарам - человек, сарам-еге - человеку, сарам-ыль - человека и т. д. То же самое со спряжением глаголов, только нет изменения по лицам.
Arbeit macht frei

Оффлайн Zavsegdatai

  • Модератор
  • Заслуженный
  • *****
  • Сообщений: 1957
  • Карма: 46
  • Пол: Женский
Re: Help! как выяснить где слово заквнчивается?
« Ответ #7 : 14 Ноября 2005 11:33:58 »
Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было.

Намек понят...

но, в таком случае надо ГРАМОТНО формулировать вопрос, чтобы "любители посмеяться" не встревали с никому не нужным флудом...
In God we trust!

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: Help! как выяснить где слово заквнчивается?
« Ответ #8 : 14 Ноября 2005 17:58:32 »
No problem. Don't take it personally  :)

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: машинное распознавание слов
« Ответ #9 : 14 Ноября 2005 18:28:11 »
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

Для начала попробуйте решить проблему различения предложений. ОК, сейчас есть и точки, и другие знаки препинания. Более того, есть особые синтаксические формы, которые говорят:" Здесь конец предложения" и без которых (теоретически) нельзя построить ни одну фразу.
Проблема 1: некоторые такие конечные формы материально совпадают с неконечными
Проблема 2: в разговорной речи возможно все и после таких, вроде бы конечных, форм бодро лепят еще пол предложения. Поэтому машинный перевод разговорной речи или худ лит с подобнвми диалогами весьма сложен. Правда это сложно всех языках. Лучше сразу задать  определеный стиль: научный, технический, общественно/ политический и тд Там правила  строже соблюдают. Со словами еще сложнее, так как любой лингвист скажет, что проблема выделения слова в любом языке очень сложна. Более того, нет общепринятого понятия "слово". А программистам за всех отдуваться  >:(

Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?

Оффлайн atk9

  • Заслуженный
  • *****
  • Сообщений: 1434
  • Карма: 17
  • Пол: Мужской
    • Late Hour Dreams
Re: машинное распознавание слов
« Ответ #10 : 14 Ноября 2005 20:18:46 »
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?

Окружением. После второго обязательно именное слово, а после первого - необязательно.
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
А с машинным переводом вообще какая-то белиберда получается. Казалось бы, корейский, как никакой другой (ну, может быть, японский, классический старописьменный монгольский, вымерший маньчжурский еще), приспособлен для того, чтобы анализировать текст и производить с ним дальнейшие манипуляции... Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)
Правда, gerasim отметил случаи отхода от норм, но "машинисты" могли бы это учесть и предусмотреть это.
Есть разные фразеологические конструкции, которые нарушают вроде бы строгую грамматику, но эти случаи наперечет. Напр., конструкция 좋고 나머지, где одна за другой следуют деепричастная форма и имя.

name

  • Гость
Re: Help! как выяснить где слово заквнчивается?
« Ответ #11 : 14 Ноября 2005 21:21:40 »
Спасибо всем за участие. С пробелами уже разобрался. Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Разобрался немного с падежами , не уверен правильно ли. Буду очень благодарен если кто даст ссылку, где можно примеры увидеть.
Основной падеж 은/는
тетрадь - 노트는
Именительный падеж 이/가
  노트가
Родительный падеж 의
  노트의
Дательный падеж 에
노트에
Местный падеж 에서
 노트에서
Винительный падеж 을/를
노트를
Творительный падеж (으)로
노트로
Совместный падеж 와/과
노트과

Оффлайн kwisin

  • Заслуженный
  • *****
  • Сообщений: 1995
  • Карма: -14
  • Пол: Мужской
Re: Help! как выяснить где слово заквнчивается?
« Ответ #12 : 14 Ноября 2005 22:44:34 »
Еще дательный падеж лица -에게 и местный падеж лица -에게서.
Arbeit macht frei

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: Help! как выяснить где слово заквнчивается?
« Ответ #13 : 16 Ноября 2005 18:34:27 »
Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?

Это так называемые формы конечной сказуемости (ФКС). В любой грамматике о них есть масса информaции. Когда-то писал для своих студентов отдельную памятку на этот счет. Если хотите, то напишите в личку - вышлю БEЗBОЗMEЗДНО

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: машинное распознавание слов
« Ответ #14 : 16 Ноября 2005 19:04:48 »


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой  ;)). Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.

name

  • Гость
Re: Help! как выяснить где слово заквнчивается?
« Ответ #15 : 16 Ноября 2005 19:13:52 »
Пришлите в личку все что не жалко . И большое спасибо.  :)

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: машинное распознавание слов
« Ответ #16 : 16 Ноября 2005 19:15:16 »
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: машинное распознавание слов
« Ответ #17 : 16 Ноября 2005 19:30:12 »

Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.

Оффлайн atk9

  • Заслуженный
  • *****
  • Сообщений: 1434
  • Карма: 17
  • Пол: Мужской
    • Late Hour Dreams
Re: машинное распознавание слов
« Ответ #18 : 16 Ноября 2005 19:47:26 »


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.


Ну да, большинство трудных случаев не превосходит по трудности задачи машинного перевода, скажем, с русского на английский. Сочинить в довесок к элементарному словарю конкорданс морфем, прописать правила...
Субъект (топик, тема) и подлежащее - и это все решается. "Девушка-нын лицо-и красивое-хада" элементарно переделывается в "Лицо девушки красивое". Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)

Оффлайн atk9

  • Заслуженный
  • *****
  • Сообщений: 1434
  • Карма: 17
  • Пол: Мужской
    • Late Hour Dreams
Re: машинное распознавание слов
« Ответ #19 : 16 Ноября 2005 19:50:21 »
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Кажется, по новой орфографии надо писать раздельно, но если это устаканившееся сочетание, точнее, сложное слово, то пишется вместе: 새찬, например. :) Такие слова в словаре есть.
Орфография на самом деле не часто меняется. Последняя, несмотря на какие-то вещи, кажется, надолго.

Оффлайн atk9

  • Заслуженный
  • *****
  • Сообщений: 1434
  • Карма: 17
  • Пол: Мужской
    • Late Hour Dreams
Re: машинное распознавание слов
« Ответ #20 : 16 Ноября 2005 19:52:02 »

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.

Ага, это есть. Но они все укладываются в ограниченный набор правил. Не то, что в русском: "взбледнулось". Хотя нет, не корректный пример. Это слово наверняка в словаре есть.

Echter

  • Гость
Машинный перевод
« Ответ #21 : 16 Ноября 2005 23:33:50 »
   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Оффлайн atk9

  • Заслуженный
  • *****
  • Сообщений: 1434
  • Карма: 17
  • Пол: Мужской
    • Late Hour Dreams
Re: Машинный перевод
« Ответ #22 : 17 Ноября 2005 12:45:12 »
   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Ну, про это мы и не говорим. :)
Попробуйте попользоваться русско-английским переводчиком. Результаты плачевные, но... чуточку лучше. Дотянуть бы корейские переводчики хотя бы до такого уровня.

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: машинное распознавание слов
« Ответ #23 : 17 Ноября 2005 18:20:27 »


Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)


Эх, до чего же "вкусная" работа.  Собрать бы банду, да покрутить проблемку. Подписывала меня на это одна фирма, но как-то все заглохло: то ли денег зажали, то ли еще что. А вот японисты, вроде, этим активно занимаются.

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: Help! как выяснить где слово заквнчивается?
« Ответ #24 : 18 Ноября 2005 02:41:33 »
Вот меня интересует вопрос, товарищи, о ликвидации безграмотности.
В плане поиска конца слова наш пролетарский товарищ-народ всегда приводит пример, товарищи,
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?


А еще, товарищи, меня волнует вопрос отсутствия знаков переноса в корейском языке.

Я заметил, что почти все ученики, в начале, ставят знак переноса в конце строки, если слово не помещается. А объяснить им, что в корейском нет переноса иногда Тяжеловато. ПОэтому давайте будем ставить знак переноса! Слава КПСС, товарищи! ;D ;D ;D ;D ;D ;D ;D  ;D  ;D ;D  ;D ;D  ;D
« Последнее редактирование: 18 Ноября 2005 11:42:31 от JJ в Разливе! »
Поставивший мне минус в карму,
Да благославлён будет!

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: машинное распознавание слов
« Ответ #25 : 18 Ноября 2005 02:44:13 »
Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой  ;)).
Смотреть слева.
Поставивший мне минус в карму,
Да благославлён будет!

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: машинное распознавание слов
« Ответ #26 : 18 Ноября 2005 12:24:38 »
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд
про 새, как я учил, то 새 отногсится к разряду словообразовательных предлогов, поэтому пичешся слитно.
К этому же разряу относятся и 왼- и 오른-. вспомните ка 왼쪽, 오른쪽.

по-корейски этот прелог зовется 접두사 в разряде 단어형성법.


Слава КПСС!
Поставивший мне минус в карму,
Да благославлён будет!

Оффлайн gerasim

  • Профессионал
  • ****
  • Сообщений: 316
  • Карма: 8
  • Пол: Мужской
Re: Help! как выяснить где слово заквнчивается?
« Ответ #27 : 24 Ноября 2005 17:58:44 »
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?



Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения  и т.д. возникают. Отмечу, по ходу, что данная фраза была придумана явно не носителем языка (мы в свое время баловались менее безобидными паттернами, но это уже неважно).
Тем не менее, проблема есть, не эта - так другая фраза  подобного свойства в корейском языке найдется.  И не только в корейском, кстати. Вот первое, что пришло в голову: "Стою во мху я по колено", "упал, намоченный".  Тоже не совсем корректные примеры, конечно - орфография различается, но все-таки...

Думается, нужно рассматривать подобные случаи как омонимы. Их же тоже нужно передавать на другой язык по-разному. С другой стороны, омонимы есть в тезаурасах, а такие нерегулярные сочетания-написания нужно еще составлять...

В принципе, безпробельное написание более  характерно для иероглифики. Не силен в вэньяне (китаисты, если чё, то поправьте), но там же, вроде,  существовали какие-то правила, типа: слово может состоять только из двух иероглифов, служебных знаков нет  и т.д. В поэзии-то я точно знаю, количество иероглифов в строке было четко задано (типа 4+3 или 3+2 и т.д.), так что можно было писать и без пробелов

P.S. Пока ковырялся с ответом появилась новая тема от JJ  про омонимию, куда всех с удовольствием и посылаю  :)

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: Help! как выяснить где слово заквнчивается?
« Ответ #28 : 24 Ноября 2005 23:56:05 »


Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения  и т.д. возникают.

 :o
Поставивший мне минус в карму,
Да благославлён будет!

Оффлайн JJ в Разливе!

  • Заслуженный
  • *****
  • Сообщений: 2809
  • Карма: 33
  • Пол: Мужской
    • Just relax!
Re: Help! как выяснить где слово заквнчивается?
« Ответ #29 : 28 Января 2006 01:06:13 »
Корейский язык отличается необычным (и поэтому трудным для нас) строением предложений. Так, глагол всегда стоит в конце предложения. В 1896 г. между словами стали делать промежутки, а с середины ХХ в. корейские тексты стали писаться не сверху вниз, а горизонтально — слева направо. Корейское письмо приобрело совсем почти «западный» вид, когда в нем появились знаки препинания — точки, запятые и т. п.



http://geo.1september.ru/2002/05/5.htm
Поставивший мне минус в карму,
Да благославлён будет!