Help! как выяснить где слово заквнчивается?

Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо

Написать комментарий...
Zavsegdatai
15 years ago
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо

так же как и в русском - между словами ставится пробел 😆

Ответить
JJ в Разливе!
15 years ago

А еще есть всякие знаки препинания. 😉

Ответить
gerasim
15 years ago

На самом деле проблема интересная и подвязана на машинное распознавание, что Вас, name, скорее всего и интересует. Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было. А если вопрос действительно волнует, то советую состыковаться с разработчиками корейских электронных переводчиков (хотя они вряд ли самым дорогим поделятся 😞)

Ответить
name
15 years ago

Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

Ответить
name
15 years ago

вот например по русски книга - книги - книгу - книге - книгой - книгами - книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. 😩

Ответить
kwisin
15 years ago
вот например по русски книга - книги - книгу - книге - книгой - книгами - книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. 😩

А что тут непонятного? Если нужно просклонять слово, добавляются падежные окончания. Сарам - человек, сарам-еге - человеку, сарам-ыль - человека и т. д. То же самое со спряжением глаголов, только нет изменения по лицам.

Ответить
Zavsegdatai
15 years ago
Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было.

Намек понят...

но, в таком случае надо ГРАМОТНО формулировать вопрос, чтобы "любители посмеяться" не встревали с никому не нужным флудом...

Ответить
gerasim
15 years ago

No problem. Don't take it personally 🙂

Ответить
gerasim
15 years ago
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.

Для начала попробуйте решить проблему различения предложений. ОК, сейчас есть и точки, и другие знаки препинания. Более того, есть особые синтаксические формы, которые говорят:" Здесь конец предложения" и без которых (теоретически) нельзя построить ни одну фразу.
Проблема 1: некоторые такие конечные формы материально совпадают с неконечными
Проблема 2: в разговорной речи возможно все и после таких, вроде бы конечных, форм бодро лепят еще пол предложения. Поэтому машинный перевод разговорной речи или худ лит с подобнвми диалогами весьма сложен. Правда это сложно всех языках. Лучше сразу задать определеный стиль: научный, технический, общественно/ политический и тд Там правила строже соблюдают. Со словами еще сложнее, так как любой лингвист скажет, что проблема выделения слова в любом языке очень сложна. Более того, нет общепринятого понятия "слово". А программистам за всех отдуваться >😞

Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а" от мо-рыль "незнакомый" ?

Ответить
atk9
15 years ago
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а" от мо-рыль "незнакомый" ?

Окружением. После второго обязательно именное слово, а после первого - необязательно.
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
А с машинным переводом вообще какая-то белиберда получается. Казалось бы, корейский, как никакой другой (ну, может быть, японский, классический старописьменный монгольский, вымерший маньчжурский еще), приспособлен для того, чтобы анализировать текст и производить с ним дальнейшие манипуляции... Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. 🙂
Правда, gerasim отметил случаи отхода от норм, но "машинисты" могли бы это учесть и предусмотреть это.
Есть разные фразеологические конструкции, которые нарушают вроде бы строгую грамматику, но эти случаи наперечет. Напр., конструкция 좋고 나머지, где одна за другой следуют деепричастная форма и имя.

Ответить
name
15 years ago

Спасибо всем за участие. С пробелами уже разобрался. Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Разобрался немного с падежами , не уверен правильно ли. Буду очень благодарен если кто даст ссылку, где можно примеры увидеть.
Основной падеж 은/는
тетрадь - 노트는
Именительный падеж 이/가
노트가
Родительный падеж 의
노트의
Дательный падеж 에
노트에
Местный падеж 에서
노트에서
Винительный падеж 을/를
노트를
Творительный падеж (으)로
노트로
Совместный падеж 와/과
노트과

Ответить
kwisin
15 years ago

Еще дательный падеж лица -에게 и местный падеж лица -에게서.

Ответить
gerasim
15 years ago
Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?

Это так называемые формы конечной сказуемости (ФКС). В любой грамматике о них есть масса информaции. Когда-то писал для своих студентов отдельную памятку на этот счет. Если хотите, то напишите в личку - вышлю БEЗBОЗMEЗДНО

Ответить
gerasim
15 years ago
Окружением. После второго обязательно именное слово, а после первого - необязательно.

Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой 😉). Во-первых, "необязательно" не значит "никогда" - поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo, нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов). Проблема в том, что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для этого придуманы разные аффиксы.

Ответить
name
15 years ago

Пришлите в личку все что не жалко . И большое спасибо. 🙂

Ответить
gerasim
15 years ago
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно или раздельно? Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Ответить
gerasim
15 years ago
Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. 🙂

За падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать, "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной и панмале.

Ответить
atk9
15 years ago

Окружением. После второго обязательно именное слово, а после первого - необязательно.

Во-первых, "необязательно" не значит "никогда" - поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?

Но главное - это "после". Ergo, нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов). Проблема в том, что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для этого придуманы разные аффиксы.

Ну да, большинство трудных случаев не превосходит по трудности задачи машинного перевода, скажем, с русского на английский. Сочинить в довесок к элементарному словарю конкорданс морфем, прописать правила...
Субъект (топик, тема) и подлежащее - и это все решается. "Девушка-нынлицо-икрасивое-хада" элементарно переделывается в "Лицо девушки красивое". Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. 🙂

Ответить
atk9
15 years ago
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.

Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они по ним: кто их знает-соблюдает?

Вот сэ - "новый" как писать: слитно или раздельно? Или уж совсем клинический случай: кы-сарам/кы-нын и тд

Кажется, по новой орфографии надо писать раздельно, но если это устаканившееся сочетание, точнее, сложное слово, то пишется вместе: 새찬, например. 🙂 Такие слова в словаре есть.
Орфография на самом деле не часто меняется. Последняя, несмотря на какие-то вещи, кажется, надолго.

Ответить
atk9
15 years ago
За падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать, "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной и панмале.

Ага, это есть. Но они все укладываются в ограниченный набор правил. Не то, что в русском: "взбледнулось". Хотя нет, не корректный пример. Это слово наверняка в словаре есть.

Ответить
Echter
15 years ago

Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Ответить
atk9
15 years ago
Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.

Ну, про это мы и не говорим. 🙂
Попробуйте попользоваться русско-английским переводчиком. Результаты плачевные, но... чуточку лучше. Дотянуть бы корейские переводчики хотя бы до такого уровня.

Ответить
gerasim
15 years ago
Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. 🙂

Эх, до чего же "вкусная" работа. Собрать бы банду, да покрутить проблемку. Подписывала меня на это одна фирма, но как-то все заглохло: то ли денег зажали, то ли еще что. А вот японисты, вроде, этим активно занимаются.

Ответить
JJ в Разливе!
15 years ago

Вот меня интересует вопрос, товарищи, о ликвидации безграмотности.
В плане поиска конца слова наш пролетарский товарищ-народ всегда приводит пример, товарищи,
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?

А еще, товарищи, меня волнует вопрос отсутствия знаков переноса в корейском языке.

Я заметил, что почти все ученики, в начале, ставят знак переноса в конце строки, если слово не помещается. А объяснить им, что в корейском нет переноса иногда Тяжеловато. ПОэтому давайте будем ставить знак переноса! Слава КПСС, товарищи! 😆 😆 😆 😆 😆 😆 😆 😆 😆 😆 😆 😆 😆

Ответить