Автор Тема: Японские субтитры - эффективный способ изучения разговорного японского  (Прочитано 83270 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Я маленько продвинулся с OCR, хотя и не довел до конца - слишком много времени уходит - с ручным вводом.


Читайте здесь второй пост (в первом софт сдох!). Я воспользовался VobSub 2.23, функцией SubResync:

http://www.d-addicts.com/forum/viewtopic_16017.htm

На этом форуме не любят когда просят субтитры, но можно готовые поискать и у них можно чему-то научиться (на английском).

Цитировать
OCR-ING THE JAPANESE SUBTITLES!
——————————————————————————-
The big step. Make the bitmap subtitles to editable Japanese text without inputting everything.
You will need: VobSub 2.23 with all its tools installed. Also Japanese IME Drawpad is absolutely
necessary for non native Japanese (or at least not that good at Japanese).


1) There is a tool called "SubResync" under the VobSub menu. Run it!

2) Click Open and select the .idx (or the .sub) file.

3) Make sure Japanese is selected at the long menu.

4) Click save as and select .ssa (or .srt if you prefer) from the menu. Then save.

5) The real job starts here! The program will recognize the polygons in the bitmap
and will ask you for an input. Just input what you see and go on. You won't be asked
again for that character because the program will automatically recognize it next time
it will find it. That's the idea.


6) Sometimes the program will not recognize the full polygons for a character. Just lick
extend (or undo extend) and adjust it till you get the character. Then input the character as normal.

7) Sometimes if the characters are too small the program will not be able to separate them. Just enter
what you see as usual Smile



8) But what happens if you don't know a Kanji??? The answer is in Japanese IME Drawpad. Using it you can
draw the character, get it recognized and then input it in the program Smile You don't have to draw this any good.
Just make sure you use the kanji writing rules (left to right, up to bottom) and you use all the square area given.
If you input the strokes in the correct order the Kanji will get recognized for sure. It might be okay though even
if you mistake. In any case all you need is the character.
9) Go on until the file finishes. It might take much time in the first time but as you proceed and you do this for
every episode, the latest ones will require just a couple of minutes because the program will be able to OCR
the previous characters.

10) IMPORTANT! The program won't save automatically the OCR settings!!! So if you just quit the program after you
finish you will lose all your OCR data!! So after you finish click save as again and choose the .vsocr option. Then save.
You now do have the OCR settings! Next time, before you load another episode's subtitles do make sure you load this file first and then after you finish save it again over the old one!!!
11) If you do some mistake (input wrong character) you can correct it by opening the .vsocr file. The program will give you a list of all the OCR characters. Find the one and correct it.
12) Unfortunately not all dramas use the same font for their subtitles. So for each drama you need to do everything from the beginning Sad
« Последнее редактирование: 28 Апреля 2008 10:53:15 от Anatoli »
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн kitsunekko

  • Зарегистрированный
  • *
  • Сообщений: 23
  • Карма: 1
  • Пол: Мужской
    • kitsunekko.net
Этот способ хорош тем, что приходится вручную вводить все иероглифы, естественно, если целью всей операции и является их изучение. В субтитрах шрифт обычно разборчивый, но если субтитры старые некоторые иероглифы невозможно разобрать. Я распознавал одну лирику из KareKano 90-х годов со сверхотстойным качеством печати, некоторые иероглифы - просто зубчатые кляксы, так что визуально проверить правильно ли распознало невозможно. Но с песней текст полностью совпал. Так что сложные иероглифы лучше доверить OCR, да и намного быстрее.
Я как-то потерял интерес к распознаванию - старые вобсабы посмотрел и так, а новые редко попадаются благодаря китайцам. Если на двд есть япсаб, обычно они его распознают.
Да и насчет моей проги никаких комментариев - оно хоть работает или вообще кому-то нужно? Я себе задачу распознавания уже решил, максимум пара ошибок при автораспознавании, кеншин был единственным исключением

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Извините, Kitsunekko, если разочаровал, но для вашей программы нужно, чтобы e.Typist работал. У меня он не пошел, отсюда и работаем от сохи, то есть без автоматического OCR. :)
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
На этом форуме много разных японских (а тж. китайских, корейских) субтитров можно найти, ну и переводы, конечно, на английский и другие языки (немецкий, французский, испанский, вьетнамский).
http://www.d-addicts.com/forum/viewforum_13.htm

Есть даже арабский, тагалог, польский, голландский а вот русского нет. Сдается, в России меньше других любят японские сериалы или совсем не любят их переводить. Если кто-нибудь делал переводы субтитров, поделитесь с миром. :)

Здесь список по языкам и названиям:
http://www.d-addicts.com/forum/viewtopic_17098.htm?sid=2b43e7b78fb7e5f4e22796c6dd84a1a6
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн MishaNovosib

  • Новичок
  • *
  • Сообщений: 33
  • Карма: 0
  • Пол: Мужской
Подскажите кто видел или знает, где продают в китае анимэ атрибутику, значки, сумки, и прочее, заранее благодарен.

Оффлайн Iruka

  • Заслуженный
  • *****
  • Сообщений: 2676
  • Карма: 58
  • Пол: Женский
  • Skype: kabukichogirl
Подскажите кто видел или знает, где продают в китае анимэ атрибутику, значки, сумки, и прочее, заранее благодарен.
а ничего, что это какбэ японская часть форума?
Хорошо там, где мы есть... Потому что МЫ там есть;)

Оффлайн imoto

  • Зарегистрированный
  • *
  • Сообщений: 1
  • Карма: 0
  • Пол: Женский
Помогите, пожалуйста, разобраться с .shooter.cn вроде нашла что мне нужно только никак скачать не могу  ??? видела выше давались ссылки на инструкции, но они уже не работают. :'(
Не ищи проторенный путь-найди свой,и пусть другие следуют им

Оффлайн grisha_sensei

  • Зарегистрированный
  • *
  • Сообщений: 8
  • Карма: 0
  • Пол: Мужской
    • 1001 способ заработка в Интернете
Друзья! Кто-нибудь знает, где можно скачать субтитры на японском к сериалу ちゅらさん (Churasan)? Нигде не могу найти  :(

Оффлайн Helloapm

  • Зарегистрированный
  • *
  • Сообщений: 12
  • Карма: 0
  • Пол: Мужской
Мне кажется для начинающих будет более эффективно слушать подкасты.