• Welcome to Восточное Полушарие.

News:

Друзья! Форум перенесен на новый сервер, обновлено программное обеспечение, конвертированы данные. Изменений очень много, что-то могло сломаться, что-то не заработать, что-то пропасть. Если вы обнаружили проблему на форуме, пожалуйста, напишите на admin[собака]polusharie.com — постараемся исправить! 02.01.2026

Main Menu

Help! как выяснить где слово заквнчивается?

Started by name, 09 November 2005 18:46:20

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

name

Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо

Zavsegdatai

Quote from: name on 09 November 2005 18:46:20
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
так же как и в русском - между словами ставится пробел  ;D
In God we trust!

JJ в Разливе!

А еще есть всякие знаки препинания. ;)
Поставивший мне минус в карму,
Да благославлён будет!

gerasim

На самом деле проблема интересная и подвязана на машинное распознавание, что Вас, name, скорее всего и интересует. Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было. А если вопрос действительно волнует, то советую состыковаться с разработчиками корейских электронных переводчиков (хотя они вряд ли самым дорогим поделятся :()

name

Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

name

вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\

kwisin

Quote from: name on 11 November 2005 14:56:53
вот например по русски книга - книги - книгу - книге - книгой - книгами -  книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\

А что тут непонятного? Если нужно просклонять слово, добавляются падежные окончания. Сарам - человек, сарам-еге - человеку, сарам-ыль - человека и т. д. То же самое со спряжением глаголов, только нет изменения по лицам.
Arbeit macht frei

Zavsegdatai

Quote from: gerasim on 11 November 2005 11:01:30
Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было.

Намек понят...

но, в таком случае надо ГРАМОТНО формулировать вопрос, чтобы "любители посмеяться" не встревали с никому не нужным флудом...
In God we trust!

gerasim


gerasim

Quote from: name on 11 November 2005 14:16:54
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

Для начала попробуйте решить проблему различения предложений. ОК, сейчас есть и точки, и другие знаки препинания. Более того, есть особые синтаксические формы, которые говорят:" Здесь конец предложения" и без которых (теоретически) нельзя построить ни одну фразу.
Проблема 1: некоторые такие конечные формы материально совпадают с неконечными
Проблема 2: в разговорной речи возможно все и после таких, вроде бы конечных, форм бодро лепят еще пол предложения. Поэтому машинный перевод разговорной речи или худ лит с подобнвми диалогами весьма сложен. Правда это сложно всех языках. Лучше сразу задать  определеный стиль: научный, технический, общественно/ политический и тд Там правила  строже соблюдают. Со словами еще сложнее, так как любой лингвист скажет, что проблема выделения слова в любом языке очень сложна. Более того, нет общепринятого понятия "слово". А программистам за всех отдуваться  >:(

Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?

atk9

Quote from: gerasim on 14 November 2005 11:28:11
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а"  от мо-рыль  "незнакомый" ?

Окружением. После второго обязательно именное слово, а после первого - необязательно.
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
А с машинным переводом вообще какая-то белиберда получается. Казалось бы, корейский, как никакой другой (ну, может быть, японский, классический старописьменный монгольский, вымерший маньчжурский еще), приспособлен для того, чтобы анализировать текст и производить с ним дальнейшие манипуляции... Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)
Правда, gerasim отметил случаи отхода от норм, но "машинисты" могли бы это учесть и предусмотреть это.
Есть разные фразеологические конструкции, которые нарушают вроде бы строгую грамматику, но эти случаи наперечет. Напр., конструкция 좋고 나머지, где одна за другой следуют деепричастная форма и имя.

name

Спасибо всем за участие. С пробелами уже разобрался. Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Разобрался немного с падежами , не уверен правильно ли. Буду очень благодарен если кто даст ссылку, где можно примеры увидеть.
Основной падеж 은/는
тетрадь - 노트는
Именительный падеж 이/가
  노트가
Родительный падеж 의
  노트의
Дательный падеж 에
노트에
Местный падеж 에서
노트에서
Винительный падеж 을/를
노트를
Творительный падеж (으)로
노트로
Совместный падеж 와/과
노트과

kwisin

Еще дательный падеж лица -에게 и местный падеж лица -에게서.
Arbeit macht frei

gerasim

Quote from: name on 14 November 2005 14:21:40
Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?

Это так называемые формы конечной сказуемости (ФКС). В любой грамматике о них есть масса информaции. Когда-то писал для своих студентов отдельную памятку на этот счет. Если хотите, то напишите в личку - вышлю БEЗBОЗMEЗДНО

gerasim

Quote from: atk9 on 14 November 2005 13:18:46


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой  ;)). Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.

name

Пришлите в личку все что не жалко . И большое спасибо.  :)

gerasim

Quote from: atk9 on 14 November 2005 13:18:46
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд

gerasim

Quote from: atk9 on 14 November 2005 13:18:46

Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.

atk9

Quote from: gerasim on 16 November 2005 12:04:48
Quote from: atk9 on 14 November 2005 13:18:46


Окружением. После второго обязательно именное слово, а после первого - необязательно.



Во-первых, "необязательно" не значит "никогда" -  поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo,  нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов).  Проблема в том,  что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для  этого придуманы разные аффиксы.


Ну да, большинство трудных случаев не превосходит по трудности задачи машинного перевода, скажем, с русского на английский. Сочинить в довесок к элементарному словарю конкорданс морфем, прописать правила...
Субъект (топик, тема) и подлежащее - и это все решается. "Девушка-нын лицо-и красивое-хада" элементарно переделывается в "Лицо девушки красивое". Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)

atk9

Quote from: gerasim on 16 November 2005 12:15:16
Quote from: atk9 on 14 November 2005 13:18:46
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они  по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно  или раздельно?  Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Кажется, по новой орфографии надо писать раздельно, но если это устаканившееся сочетание, точнее, сложное слово, то пишется вместе: 새찬, например. :) Такие слова в словаре есть.
Орфография на самом деле не часто меняется. Последняя, несмотря на какие-то вещи, кажется, надолго.

atk9

Quote from: gerasim on 16 November 2005 12:30:12

За  падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать,  "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной  и панмале.

Ага, это есть. Но они все укладываются в ограниченный набор правил. Не то, что в русском: "взбледнулось". Хотя нет, не корректный пример. Это слово наверняка в словаре есть.

Echter

   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

atk9

Quote from: Echter on 16 November 2005 16:33:50
   Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
   Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Ну, про это мы и не говорим. :)
Попробуйте попользоваться русско-английским переводчиком. Результаты плачевные, но... чуточку лучше. Дотянуть бы корейские переводчики хотя бы до такого уровня.

gerasim

Quote from: atk9 on 16 November 2005 12:47:26


Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)


Эх, до чего же "вкусная" работа.  Собрать бы банду, да покрутить проблемку. Подписывала меня на это одна фирма, но как-то все заглохло: то ли денег зажали, то ли еще что. А вот японисты, вроде, этим активно занимаются.

JJ в Разливе!

Вот меня интересует вопрос, товарищи, о ликвидации безграмотности.
В плане поиска конца слова наш пролетарский товарищ-народ всегда приводит пример, товарищи,
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?


А еще, товарищи, меня волнует вопрос отсутствия знаков переноса в корейском языке.

Я заметил, что почти все ученики, в начале, ставят знак переноса в конце строки, если слово не помещается. А объяснить им, что в корейском нет переноса иногда Тяжеловато. ПОэтому давайте будем ставить знак переноса! Слава КПСС, товарищи! ;D ;D ;D ;D ;D ;D ;D  ;D  ;D ;D  ;D ;D  ;D
Поставивший мне минус в карму,
Да благославлён будет!