Автор Тема: Вытаскивание "субтитров" из китайских DVD  (Прочитано 17681 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн qui

  • Новичок
  • *
  • Сообщений: 31
  • Карма: 0
Пытаюсь с помощью Gordian Knot конвертировать китайские DVD в нечто CD-образное. С аудио-видео вроде всё понятно, а вот выдрать субтитры для наложения их на картинку пока не получается. Программку VobSub 2.23 установил, но что-то субтитров не вижу ;(( Если кто-то сталкивался с такого рода задачей, прошу откликнуться и объяснить, что нужно делать.

Оффлайн Andrey

  • Бывалый
  • ***
  • Сообщений: 104
  • Карма: 6
  • Пол: Мужской
А какие субтитры нужны - китайские?  

Я вытаскивал с китайских (гонгконговских) DVD английские субтитры. В данном случае все просто -
нужна программка SubRip.

Echter

  • Гость
  Можно попробовать риппер MovieJack ( http://www.moviejack.org/ ). Великоват правда, 28 Мб, но позволяет при конвертировании в DivX/VCD/SVCD/DVD формат выбирать, на каком языке будет озвучка и титры (если таковые представлены на конкретном диске, разумеется). Есть у меня и лечилка к нему, если что, напишите.
« Последнее редактирование: 21 Июля 2003 18:57:02 от Echter »

Оффлайн qui

  • Новичок
  • *
  • Сообщений: 31
  • Карма: 0
Re: Вытаскивание "субтитров" из китайских DVD
« Ответ #3 : 20 Августа 2003 06:53:58 »
Большое спасибо всем ответившим на мой вопрос. Прошу также премного извинить за столь запоздалое выражение благодарности - некоторое время было не до субтитров. Попробую обзавестись 2-мя указанными программами, а если Асталявиста не выдаст лечилки, то воспользуюсь помощью vom geehrten Echter.

Оффлайн Andrey

  • Бывалый
  • ***
  • Сообщений: 104
  • Карма: 6
  • Пол: Мужской
Re: Вытаскивание "субтитров" из китайских DVD
« Ответ #4 : 20 Августа 2003 23:38:53 »
Собственно, вот ссылка: http://www.divx-digest.tv/software/subtitle/SubRip_1.17.exe

Программа, насколько помню, freeware и лечилки
не требует. :)

И куча других программ для работы с субтитрами:
http://www.divx-digest.com/software/index4.html#subtitles

Оффлайн qui

  • Новичок
  • *
  • Сообщений: 31
  • Карма: 0
Re: Вытаскивание "субтитров" из китайских DVD
« Ответ #5 : 21 Августа 2003 06:49:54 »
Цитировать

И куча других программ для работы с субтитрами:
http://www.divx-digest.com/software/index4.html#subtitles


Как раз вчера был там - SubRip ИМХО иероглифы не поймет, так как по сути - распознавалка. А вот у Vobsub не работает родной сайт, где должно лежать дополнение для 2-х версий китайского, что очень жаль ;((

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Освежаю динозавра (очень старую тему) в надежде найти людей, которые преуспели в выдирании субтитров.

До меня теперь дошло как все работает, после того, как повозился довольно долго.

Пока что использую SubRip, могу извлечь субтритры в графические файлы, то есть успешно распознается поток субтитров и выдрать в отдельные файлы. Для того чтоб, эти файлы конвертировать в текст нужен файл матрицы для соответствующего шрифта (скорее по шрифту, а не по языку, напр.  английский и латинский можно было бы объединить в одну группу, т.к. все символы языка - одинаковые).

Матрицы можно создавать вручную при помощи SubRip, следующий раз тот же символ в идеале уже будет узнан (матрица обновляется). Чем больше работаешь с матрицей, тем меньше ручной работы (матрицу нужно сохранять). Конечно с алфавитными языками проще - столько то букв заглавных и маленьких, цифр, пунктуаций. С китайским и японским сложнее, нужно пройти несколько штук, прежде чем он почти перестал останавливаться, и то, если начать новую тему DVD, кто знает...

Вопрос, есть ли у кого-то на Полушарии такие матрицы (обычно сохраняется в файл с расширением .sum), можете ли поделиться. Такие точно есть у кого-то, так как в наличие у многих уже много китайских и японских субтитров в текстовых файлах. Может быть вы создали сами, может быть кто-то с вами поделился.

Один момент - одна матрица может не работать одинаково с разными производителями DVD, если шрифты выглядят по-другому, или если их делают ка-то нестандартно. Чем ровнее и четче шрифт, тем больше вероятности, что он будет распознан, но матрица созданная для такого шрифта будет работать с таким же DVD.

« Последнее редактирование: 20 Февраля 2006 11:51:54 от Anatoli »
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн raf

  • Пионер
  • **
  • Сообщений: 54
  • Карма: -1
  • Пол: Мужской
Anatoli я не понел, у тебя получилось вытащить иероглифы? Очень интересно.

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Опишите, где у вас проблема. Над чем работаете. С начала очень долго. Если совсем совсем начинающий, извините, не возьмусь объяснять, одной страницы не хватит. 8)

Если вы начинающий, почитайте, что такое SubRip.
« Последнее редактирование: 26 Мая 2008 22:48:18 от Anatoli »
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Обновляю информацию:

Пользовался VobSub 2.23, функция называется Sub Resynch.

Читайте (по-английски, второй пост).
http://www.d-addicts.com/forum/viewtopic_16017_0.htm

Похожа на SubRip, если переводить графику в текст. У SubRip есть небольшое преимущество, можно промежуточный файл сохранить, не доводя весь эпизод/фильм до конца.

千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн Чабудоша

  • Бывалый
  • ***
  • Сообщений: 218
  • Карма: 9
  • Пол: Женский
Anatoli а вы чисто из экономии (диск.пространства) сабы в текст переводите? в принципе idx+sub файлы ужатые не так уж и много весят..
пока необходимости выдирать у меня небыло,пользуюсь плодами чужих трудов,но буде такая надобность подскажите, полученное после манипуляций в subrip , та самая пара idx+sub (если я правильно понимаю),уже синхронизировано с картинкой и звуком, не требует больше никакой доводки?
И последний вопрос (простите я ламер), может вы знаете секрет,можно неподробно ,хоть в общих чертах, как из выдранных сабов и самого фильма в мкв или ави сколотить обратно двд, т.е.такой дисочек который проигрывался бы внешнем плеере.
今天給大家介紹一道小朋友們一定喜歡的 雞包 包 雞包 包 雞包紙 包 紙包雞 包 包雞紙 包 雞包 包 雞包紙包 雞包紙 包 雞。做法也很簡單 只要將雞包包住個雞包再包住個雞包 包住那張雞包紙 再包包包包包住個紙包雞
再包包包 包雞包紙 紙紙紙紙 紙包紙 紙包雞 包雞紙 紙包雞 雞雞雞 紙紙紙 再包雞雞雞。。。

Оффлайн raf

  • Пионер
  • **
  • Сообщений: 54
  • Карма: -1
  • Пол: Мужской
У меня есть один китайский сериал, на одном диски 20 серий. Интересно, можно от тута вытащить иероглифы? Я пользуюсь программой SubRip, вот, с одного диска (учить кит. яз) она видит субтитры, а вот с сериала видит фиал VOB, но показывает, что субтитров там нету. Хотя ведь, когда смотришь фильм они же есть. Что делать?

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Задержал с ответом, извините.

Чабудоша, я только научился немного их выдирать, а не синхронизировать и т.д., вес меня не беспокоит, "софт" субтитры на иностранном языке полезны для его изучения, из графических субтитров текст не скопируешь в словарь или онлайн-переводчик, не добавишь в списки слов, и т.п.

Есть разные программы для сколачивания вильмов из "ави", пока у меня их нет

rafayel, есть фильмы с субтитрами, встроенными в фильм, они часть графики.
« Последнее редактирование: 30 Мая 2008 19:42:33 от Anatoli »
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн raf

  • Пионер
  • **
  • Сообщений: 54
  • Карма: -1
  • Пол: Мужской
Цитировать
есть фильмы  субтитрами, встроенными в фильм, они часть графики.

Я правельно понел, что с таких фильмах не возможно вытащить субтитры?

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Нет, по крайней мере, SubRip такие не берет. За другие отвечать не берусь. Теоретически можно все выдрать при помощи OCR - optical character recognition. Без обид, но вы текст через spellcheck пропускайте, очень много ошибок в русском.  :)
« Последнее редактирование: 30 Мая 2008 19:47:30 от Anatoli »
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн raf

  • Пионер
  • **
  • Сообщений: 54
  • Карма: -1
  • Пол: Мужской
Ясно. Я так и подумал, что у меня субтитры влитые в кадр, это называется уже графика. Во общем я нашел такую программку "Распознавание китайских иероглифов Shangshu OCR 6.0" http://magazeta.com/soft/2008/04/17/chinese-ocr-download/ Ну так хорошая прога., но если сканировать весь фильм или сериал, то это уйдет много времени, да и много хлопот. Во общем мне легче переписать в ручную и то будет полезнее

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Я думаю выдирание субтитров из графики имеет тот же принцип - особенно если субтитры всегда находятся в том же положении (внизу) и используется тот же цвет, формат и стиль, но как я уже сказал, я не знаком с такими программами.
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)

Оффлайн Чабудоша

  • Бывалый
  • ***
  • Сообщений: 218
  • Карма: 9
  • Пол: Женский
Ясно. Я так и подумал, что у меня субтитры влитые в кадр, это называется уже графика. Во общем я нашел такую программку "Распознавание китайских иероглифов Shangshu OCR 6.0" http://magazeta.com/soft/2008/04/17/chinese-ocr-download/ Ну так хорошая прога., но если сканировать весь фильм или сериал, то это уйдет много времени, да и много хлопот. Во общем мне легче переписать в ручную и то будет полезнее
не проще ли сходить на shooter cn.,практически все более или менее новые синоязычные фильмы есть на выбор в srt или графике, иногда даже оба 简/繁,
ну разве что чего-то очень старое или коллекционное не найдется
今天給大家介紹一道小朋友們一定喜歡的 雞包 包 雞包 包 雞包紙 包 紙包雞 包 包雞紙 包 雞包 包 雞包紙包 雞包紙 包 雞。做法也很簡單 只要將雞包包住個雞包再包住個雞包 包住那張雞包紙 再包包包包包住個紙包雞
再包包包 包雞包紙 紙紙紙紙 紙包紙 紙包雞 包雞紙 紙包雞 雞雞雞 紙紙紙 再包雞雞雞。。。

Оффлайн Anatoli

  • Заслуженный
  • *****
  • Сообщений: 1481
  • Карма: 41
  • Пол: Мужской
    • Studying Chinese Language and Chinese Culture
Ясно. Я так и подумал, что у меня субтитры влитые в кадр, это называется уже графика. Во общем я нашел такую программку "Распознавание китайских иероглифов Shangshu OCR 6.0" http://magazeta.com/soft/2008/04/17/chinese-ocr-download/ Ну так хорошая прога., но если сканировать весь фильм или сериал, то это уйдет много времени, да и много хлопот. Во общем мне легче переписать в ручную и то будет полезнее
не проще ли сходить на shooter cn.,практически все более или менее новые синоязычные фильмы есть на выбор в srt или графике, иногда даже оба 简/繁,
ну разве что чего-то очень старое или коллекционное не найдется

В идеальном мире все есть, только нет тех, которые нужны.  :)
千里の道も一歩より始まる (senri-no michi-mo ippo-yori hajimaru)
千里之行, 始于足下 (qian li zhi xing, shi yu zu xia)
رحلة الألف ميل تبدأ بخطوة واحدة (riHlatu l-'alfi miili tabda'u bi-khaTwati waaHidati)