Восточное Полушарие

Корейский форум => Корейский язык => Тема начата: name от 10 Ноября 2005 01:46:20

Название: Help! как выяснить где слово заквнчивается?
Отправлено: name от 10 Ноября 2005 01:46:20
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: Zavsegdatai от 10 Ноября 2005 09:30:23
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
так же как и в русском - между словами ставится пробел  ;D
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: JJ в Разливе! от 11 Ноября 2005 03:39:36
А еще есть всякие знаки препинания. ;)
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: gerasim от 11 Ноября 2005 18:01:30
На самом деле проблема интересная и подвязана на машинное распознавание, что Вас, name, скорее всего и интересует. Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было. А если вопрос действительно волнует, то советую состыковаться с разработчиками корейских электронных переводчиков (хотя они вряд ли самым дорогим поделятся :()
Название: Re: машинное распознавание слов
Отправлено: name от 11 Ноября 2005 21:16:54
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.
Название: Re: stemming
Отправлено: name от 11 Ноября 2005 21:56:53
вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\
Название: Re: stemming
Отправлено: kwisin от 12 Ноября 2005 18:58:55
вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\

А что тут непонятного? Если нужно просклонять слово, добавляются падежные окончания. Сарам - человек, сарам-еге - человеку, сарам-ыль - человека и т. д. То же самое со спряжением глаголов, только нет изменения по лицам.
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: Zavsegdatai от 14 Ноября 2005 11:33:58
Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было.

Намек понят...

но, в таком случае надо ГРАМОТНО формулировать вопрос, чтобы "любители посмеяться" не встревали с никому не нужным флудом...
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: gerasim от 14 Ноября 2005 17:58:32
No problem. Don't take it personally  :)
Название: Re: машинное распознавание слов
Отправлено: gerasim от 14 Ноября 2005 18:28:11
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

Для начала попробуйте решить проблему различения предложений. ОК, сейчас есть и точки, и другие знаки препинания. Более того, есть особые синтаксические формы, которые говорят:" Здесь конец предложения" и без которых (теоретически) нельзя построить ни одну фразу.
Проблема 1: некоторые такие конечные формы материально совпадают с неконечными
Проблема 2: в разговорной речи возможно все и после таких, вроде бы конечных, форм бодро лепят еще пол предложения. Поэтому машинный перевод разговорной речи или худ лит с подобнвми диалогами весьма сложен. Правда это сложно всех языках. Лучше сразу задать  определеный стиль: научный, технический, общественно/ политический и тд Там правила  строже соблюдают. Со словами еще сложнее, так как любой лингвист скажет, что проблема выделения слова в любом языке очень сложна. Более того, нет общепринятого понятия "слово". А программистам за всех отдуваться  >:(

Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?
Название: Re: машинное распознавание слов
Отправлено: atk9 от 14 Ноября 2005 20:18:46
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?

Окружением. После второго обязательно именное слово, а после первого - необязательно.
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
А с машинным переводом вообще какая-то белиберда получается. Казалось бы, корейский, как никакой другой (ну, может быть, японский, классический старописьменный монгольский, вымерший маньчжурский еще), приспособлен для того, чтобы анализировать текст и производить с ним дальнейшие манипуляции... Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)
Правда, gerasim отметил случаи отхода от норм, но "машинисты" могли бы это учесть и предусмотреть это.
Есть разные фразеологические конструкции, которые нарушают вроде бы строгую грамматику, но эти случаи наперечет. Напр., конструкция 좋고 나머지, где одна за другой следуют деепричастная форма и имя.
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: name от 14 Ноября 2005 21:21:40
Спасибо всем за участие. С пробелами уже разобрался. Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Разобрался немного с падежами , не уверен правильно ли. Буду очень благодарен если кто даст ссылку, где можно примеры увидеть.
Основной падеж 은/는
тетрадь - 노트는
Именительный падеж 이/가
  노트가
Родительный падеж 의
  노트의
Дательный падеж 에
노트에
Местный падеж 에서
 노트에서
Винительный падеж 을/를
노트를
Творительный падеж (으)로
노트로
Совместный падеж 와/과
노트과
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: kwisin от 14 Ноября 2005 22:44:34
Еще дательный падеж лица -에게 и местный падеж лица -에게서.
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: gerasim от 16 Ноября 2005 18:34:27
Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?

Это так называемые формы конечной сказуемости (ФКС). В любой грамматике о них есть масса информaции. Когда-то писал для своих студентов отдельную памятку на этот счет. Если хотите, то напишите в личку - вышлю БEЗBОЗMEЗДНО
Название: Re: машинное распознавание слов
Отправлено: gerasim от 16 Ноября 2005 19:04:48


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой  ;)). Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: name от 16 Ноября 2005 19:13:52
Пришлите в личку все что не жалко . И большое спасибо.  :)
Название: Re: машинное распознавание слов
Отправлено: gerasim от 16 Ноября 2005 19:15:16
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд
Название: Re: машинное распознавание слов
Отправлено: gerasim от 16 Ноября 2005 19:30:12

Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.
Название: Re: машинное распознавание слов
Отправлено: atk9 от 16 Ноября 2005 19:47:26


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.


Ну да, большинство трудных случаев не превосходит по трудности задачи машинного перевода, скажем, с русского на английский. Сочинить в довесок к элементарному словарю конкорданс морфем, прописать правила...
Субъект (топик, тема) и подлежащее - и это все решается. "Девушка-нын лицо-и красивое-хада" элементарно переделывается в "Лицо девушки красивое". Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)
Название: Re: машинное распознавание слов
Отправлено: atk9 от 16 Ноября 2005 19:50:21
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Кажется, по новой орфографии надо писать раздельно, но если это устаканившееся сочетание, точнее, сложное слово, то пишется вместе: 새찬, например. :) Такие слова в словаре есть.
Орфография на самом деле не часто меняется. Последняя, несмотря на какие-то вещи, кажется, надолго.
Название: Re: машинное распознавание слов
Отправлено: atk9 от 16 Ноября 2005 19:52:02

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.

Ага, это есть. Но они все укладываются в ограниченный набор правил. Не то, что в русском: "взбледнулось". Хотя нет, не корректный пример. Это слово наверняка в словаре есть.
Название: Машинный перевод
Отправлено: Echter от 16 Ноября 2005 23:33:50
   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.
Название: Re: Машинный перевод
Отправлено: atk9 от 17 Ноября 2005 12:45:12
   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Ну, про это мы и не говорим. :)
Попробуйте попользоваться русско-английским переводчиком. Результаты плачевные, но... чуточку лучше. Дотянуть бы корейские переводчики хотя бы до такого уровня.
Название: Re: машинное распознавание слов
Отправлено: gerasim от 17 Ноября 2005 18:20:27


Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)


Эх, до чего же "вкусная" работа.  Собрать бы банду, да покрутить проблемку. Подписывала меня на это одна фирма, но как-то все заглохло: то ли денег зажали, то ли еще что. А вот японисты, вроде, этим активно занимаются.
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: JJ в Разливе! от 18 Ноября 2005 02:41:33
Вот меня интересует вопрос, товарищи, о ликвидации безграмотности.
В плане поиска конца слова наш пролетарский товарищ-народ всегда приводит пример, товарищи,
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?


А еще, товарищи, меня волнует вопрос отсутствия знаков переноса в корейском языке.

Я заметил, что почти все ученики, в начале, ставят знак переноса в конце строки, если слово не помещается. А объяснить им, что в корейском нет переноса иногда Тяжеловато. ПОэтому давайте будем ставить знак переноса! Слава КПСС, товарищи! ;D ;D ;D ;D ;D ;D ;D  ;D  ;D ;D  ;D ;D  ;D
Название: Re: машинное распознавание слов
Отправлено: JJ в Разливе! от 18 Ноября 2005 02:44:13
Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой  ;)).
Смотреть слева.
Название: Re: машинное распознавание слов
Отправлено: JJ в Разливе! от 18 Ноября 2005 12:24:38
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд
про 새, как я учил, то 새 отногсится к разряду словообразовательных предлогов, поэтому пичешся слитно.
К этому же разряу относятся и 왼- и 오른-. вспомните ка 왼쪽, 오른쪽.

по-корейски этот прелог зовется 접두사 в разряде 단어형성법.


Слава КПСС!
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: gerasim от 24 Ноября 2005 17:58:44
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?



Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения  и т.д. возникают. Отмечу, по ходу, что данная фраза была придумана явно не носителем языка (мы в свое время баловались менее безобидными паттернами, но это уже неважно).
Тем не менее, проблема есть, не эта - так другая фраза  подобного свойства в корейском языке найдется.  И не только в корейском, кстати. Вот первое, что пришло в голову: "Стою во мху я по колено", "упал, намоченный".  Тоже не совсем корректные примеры, конечно - орфография различается, но все-таки...

Думается, нужно рассматривать подобные случаи как омонимы. Их же тоже нужно передавать на другой язык по-разному. С другой стороны, омонимы есть в тезаурасах, а такие нерегулярные сочетания-написания нужно еще составлять...

В принципе, безпробельное написание более  характерно для иероглифики. Не силен в вэньяне (китаисты, если чё, то поправьте), но там же, вроде,  существовали какие-то правила, типа: слово может состоять только из двух иероглифов, служебных знаков нет  и т.д. В поэзии-то я точно знаю, количество иероглифов в строке было четко задано (типа 4+3 или 3+2 и т.д.), так что можно было писать и без пробелов

P.S. Пока ковырялся с ответом появилась новая тема от JJ  про омонимию, куда всех с удовольствием и посылаю  :)
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: JJ в Разливе! от 24 Ноября 2005 23:56:05


Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения  и т.д. возникают.

 :o
Название: Re: Help! как выяснить где слово заквнчивается?
Отправлено: JJ в Разливе! от 28 Января 2006 01:06:13
Корейский язык отличается необычным (и поэтому трудным для нас) строением предложений. Так, глагол всегда стоит в конце предложения. В 1896 г. между словами стали делать промежутки, а с середины ХХ в. корейские тексты стали писаться не сверху вниз, а горизонтально — слева направо. Корейское письмо приобрело совсем почти «западный» вид, когда в нем появились знаки препинания — точки, запятые и т. п.



http://geo.1september.ru/2002/05/5.htm