Восточное Полушарие
Корейский форум => Корейский язык => Тема начата: name от 10 Ноября 2005 01:46:20
-
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
-
Может мой вопрос и глупый.Так корейский язык я не знаю. Но буду очень благодарен если кто подскажет как выяснить где слово заквнчивается?
спасибо
так же как и в русском - между словами ставится пробел ;D
-
А еще есть всякие знаки препинания. ;)
-
На самом деле проблема интересная и подвязана на машинное распознавание, что Вас, name, скорее всего и интересует. Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было. А если вопрос действительно волнует, то советую состыковаться с разработчиками корейских электронных переводчиков (хотя они вряд ли самым дорогим поделятся :()
-
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.
-
вот например по русски книга - книги - книгу - книге - книгой - книгами - книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\
-
вот например по русски книга - книги - книгу - книге - книгой - книгами - книг -книгах -книгам. Или работать - работаю - работал - работали - работаем и т.д.
А вот по корейски я пока не могу понять как это делать. :-\
А что тут непонятного? Если нужно просклонять слово, добавляются падежные окончания. Сарам - человек, сарам-еге - человеку, сарам-ыль - человека и т. д. То же самое со спряжением глаголов, только нет изменения по лицам.
-
Любителям посмеяться над салагами можете сообщать, что раньше ни пробелов, ни тем более знаков препинания в корейском не было.
Намек понят...
но, в таком случае надо ГРАМОТНО формулировать вопрос, чтобы "любители посмеяться" не встревали с никому не нужным флудом...
-
No problem. Don't take it personally :)
-
Герасим вы правильно заметили меня интересует именно машинное распознавание слов. Если я правильно понимаю, то пробелы разделяют слова, но не совсем. Так как в корейском может бить что-то типа наваямашына как одно слово. Меня в принтсипе интересует система стемминга в корейском. Спасибо всем за помощь.
Для начала попробуйте решить проблему различения предложений. ОК, сейчас есть и точки, и другие знаки препинания. Более того, есть особые синтаксические формы, которые говорят:" Здесь конец предложения" и без которых (теоретически) нельзя построить ни одну фразу.
Проблема 1: некоторые такие конечные формы материально совпадают с неконечными
Проблема 2: в разговорной речи возможно все и после таких, вроде бы конечных, форм бодро лепят еще пол предложения. Поэтому машинный перевод разговорной речи или худ лит с подобнвми диалогами весьма сложен. Правда это сложно всех языках. Лучше сразу задать определеный стиль: научный, технический, общественно/ политический и тд Там правила строже соблюдают. Со словами еще сложнее, так как любой лингвист скажет, что проблема выделения слова в любом языке очень сложна. Более того, нет общепринятого понятия "слово". А программистам за всех отдуваться >:(
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а" от мо-рыль "незнакомый" ?
-
Кстати, вот задачка для "кореозных монстров": как различить мо-рыль "мех-а" от мо-рыль "незнакомый" ?
Окружением. После второго обязательно именное слово, а после первого - необязательно.
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
А с машинным переводом вообще какая-то белиберда получается. Казалось бы, корейский, как никакой другой (ну, может быть, японский, классический старописьменный монгольский, вымерший маньчжурский еще), приспособлен для того, чтобы анализировать текст и производить с ним дальнейшие манипуляции... Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)
Правда, gerasim отметил случаи отхода от норм, но "машинисты" могли бы это учесть и предусмотреть это.
Есть разные фразеологические конструкции, которые нарушают вроде бы строгую грамматику, но эти случаи наперечет. Напр., конструкция 좋고 나머지, где одна за другой следуют деепричастная форма и имя.
-
Спасибо всем за участие. С пробелами уже разобрался. Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Разобрался немного с падежами , не уверен правильно ли. Буду очень благодарен если кто даст ссылку, где можно примеры увидеть.
Основной падеж 은/는
тетрадь - 노트는
Именительный падеж 이/가
노트가
Родительный падеж 의
노트의
Дательный падеж 에
노트에
Местный падеж 에서
노트에서
Винительный падеж 을/를
노트를
Творительный падеж (으)로
노트로
Совместный падеж 와/과
노트과
-
Еще дательный падеж лица -에게 и местный падеж лица -에게서.
-
Очень меня заинтересовало, что это за особые синтаксические формы , где можно о них почитать?
Это так называемые формы конечной сказуемости (ФКС). В любой грамматике о них есть масса информaции. Когда-то писал для своих студентов отдельную памятку на этот счет. Если хотите, то напишите в личку - вышлю БEЗBОЗMEЗДНО
-
Окружением. После второго обязательно именное слово, а после первого - необязательно.
Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой ;)). Во-первых, "необязательно" не значит "никогда" - поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?
Но главное - это "после". Ergo, нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов). Проблема в том, что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для этого придуманы разные аффиксы.
-
Пришлите в личку все что не жалко . И большое спасибо. :)
-
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они по ним: кто их знает-соблюдает?
Вот сэ - "новый" как писать: слитно или раздельно? Или уж совсем клинический случай: кы-сарам/кы-нын и тд
-
Ведь, посмотрите, корейские падежные окончания - это тебе не русские флекции, никаких изменений в слове. В русском: поле - кто-что им.падеж, полю - кому-чему дат. падеж, поля - кого-чего род.падеж. А в корейском корень остается без изменения: 밭 - 밭이 - 밭을 - 밭에 и т.д. Инвентарь служебных морфем известен, структура слова расписана, порядок слов в предложении устойчив донельзя. Вообще корейский - как математическая формула. Не знаю, обратил кто-нибудь на это или нет. Он своей математичностью напоминает немецкий с его прусско-армейской рамочной конструкцией. :)
За падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать, "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной и панмале.
-
Окружением. После второго обязательно именное слово, а после первого - необязательно.
Во-первых, "необязательно" не значит "никогда" - поди объясни это машине. Кроме того, как быть с именными частями ханмунных глаголов?
Но главное - это "после". Ergo, нужно задать машине начинать перевод с конца (как, собствено, и учат студентов всех времен и народов). Проблема в том, что полежащее-то находится в начале и русский перевод начинать лучше именно с него.
Кроме того, существуют так называемые субстантивные (определительные) обороты типа: "В день, когда я получил зарплату, все сульчипы были почему-то закрыты". Здесь и причастное окончание материально совпадает с контрастивно-выделительной частицей, и разницу между субъектом и подлежащим (I love this topic!) не всегда людьми улавливается, а в корейском для этого придуманы разные аффиксы.
Ну да, большинство трудных случаев не превосходит по трудности задачи машинного перевода, скажем, с русского на английский. Сочинить в довесок к элементарному словарю конкорданс морфем, прописать правила...
Субъект (топик, тема) и подлежащее - и это все решается. "Девушка-нын лицо-и красивое-хада" элементарно переделывается в "Лицо девушки красивое". Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)
-
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они по ним: кто их знает-соблюдает?
Вот сэ - "новый" как писать: слитно или раздельно? Или уж совсем клинический случай: кы-сарам/кы-нын и тд
Кажется, по новой орфографии надо писать раздельно, но если это устаканившееся сочетание, точнее, сложное слово, то пишется вместе: 새찬, например. :) Такие слова в словаре есть.
Орфография на самом деле не часто меняется. Последняя, несмотря на какие-то вещи, кажется, надолго.
-
За падежные окончания никто не спорит, а флексии - их есть в корейском языке: немного, но чрезвычайно распространенных. К примеру, сингармоничное -а/-о . Как машине разобрать, "хэпвае" значит: "сделаем, а там поглядим" или же "попробуем сделать". Тут тебе и пробелы, и флексии, и, до кучи, определение наклонения в отдельных ступенях: неофициально-вежливой, авторитaрной и панмале.
Ага, это есть. Но они все укладываются в ограниченный набор правил. Не то, что в русском: "взбледнулось". Хотя нет, не корректный пример. Это слово наверняка в словаре есть.
-
Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.
-
Электронный перевод текстов, совершенно однозначно, не может базироваться только на анализе морфем и их взаимоотношений. Набивка в компьютер всех парадигм слова, таблиц сочетаемости и устойчивых выражений (то, что мы, в принципе, имеем сегодня) может дать адекватный перевод только в случае с гипотетическим рафинированным языком, не выходящим за пределы кодифицированного словоупотребления. Однако абсолютнейшее большинство языковых нюансов остаётся и будет оставаться за рамками словарей и научных работ.
Мне кажется, компьютер сможет делать более-менее нормальные переводы только когда научится оперировать не словами, не фразами, а семантическими полями. А для этого нужен гибкий самообучающийся искусственный интеллект с огромными базами данных.
Ну, про это мы и не говорим. :)
Попробуйте попользоваться русско-английским переводчиком. Результаты плачевные, но... чуточку лучше. Дотянуть бы корейские переводчики хотя бы до такого уровня.
-
Много правил надо писать, но их не больше, чем майкрософт написал для проверки орфографии. :)
Эх, до чего же "вкусная" работа. Собрать бы банду, да покрутить проблемку. Подписывала меня на это одна фирма, но как-то все заглохло: то ли денег зажали, то ли еще что. А вот японисты, вроде, этим активно занимаются.
-
Вот меня интересует вопрос, товарищи, о ликвидации безграмотности.
В плане поиска конца слова наш пролетарский товарищ-народ всегда приводит пример, товарищи,
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?
А еще, товарищи, меня волнует вопрос отсутствия знаков переноса в корейском языке.
Я заметил, что почти все ученики, в начале, ставят знак переноса в конце строки, если слово не помещается. А объяснить им, что в корейском нет переноса иногда Тяжеловато. ПОэтому давайте будем ставить знак переноса! Слава КПСС, товарищи! ;D ;D ;D ;D ;D ;D ;D ;D ;D ;D ;D ;D ;D
-
Почтенейший модератор немного лукавит (сразу же представляется ленинский прищур с хитринкой ;)).
Смотреть слева.
-
Граница слова - можно договориться, что ею служит, как совершенно правильно кто-то сказал выше, пробел, пустое место в тексте.
Ухх, да Вы же сами прекрасно знаете, что корейцы правила орфографии меняют как перчатки, да и не пишут они по ним: кто их знает-соблюдает?
Вот сэ - "новый" как писать: слитно или раздельно? Или уж совсем клинический случай: кы-сарам/кы-нын и тд
про 새, как я учил, то 새 отногсится к разряду словообразовательных предлогов, поэтому пичешся слитно.
К этому же разряу относятся и 왼- и 오른-. вспомните ка 왼쪽, 오른쪽.
по-корейски этот прелог зовется 접두사 в разряде 단어형성법.
Слава КПСС!
-
Пример: 어머니가방에들어갔습니다.
Как тут нам, простым пролетариям, разобраться, куда вошла мама. В 가방 или в 방?
Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения и т.д. возникают. Отмечу, по ходу, что данная фраза была придумана явно не носителем языка (мы в свое время баловались менее безобидными паттернами, но это уже неважно).
Тем не менее, проблема есть, не эта - так другая фраза подобного свойства в корейском языке найдется. И не только в корейском, кстати. Вот первое, что пришло в голову: "Стою во мху я по колено", "упал, намоченный". Тоже не совсем корректные примеры, конечно - орфография различается, но все-таки...
Думается, нужно рассматривать подобные случаи как омонимы. Их же тоже нужно передавать на другой язык по-разному. С другой стороны, омонимы есть в тезаурасах, а такие нерегулярные сочетания-написания нужно еще составлять...
В принципе, безпробельное написание более характерно для иероглифики. Не силен в вэньяне (китаисты, если чё, то поправьте), но там же, вроде, существовали какие-то правила, типа: слово может состоять только из двух иероглифов, служебных знаков нет и т.д. В поэзии-то я точно знаю, количество иероглифов в строке было четко задано (типа 4+3 или 3+2 и т.д.), так что можно было писать и без пробелов
P.S. Пока ковырялся с ответом появилась новая тема от JJ про омонимию, куда всех с удовольствием и посылаю :)
-
Вопрос, конечно, интересный, реминисценции на тему значащего отсутствия, нулевых морфем, наличия у супрасегментных единиц смыслоразличительного значения и т.д. возникают.
:o
-
Корейский язык отличается необычным (и поэтому трудным для нас) строением предложений. Так, глагол всегда стоит в конце предложения. В 1896 г. между словами стали делать промежутки, а с середины ХХ в. корейские тексты стали писаться не сверху вниз, а горизонтально — слева направо. Корейское письмо приобрело совсем почти «западный» вид, когда в нем появились знаки препинания — точки, запятые и т. п.
http://geo.1september.ru/2002/05/5.htm