Автор Тема: http://dict.cn/ - можно ли его как-то скачать?  (Прочитано 10458 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн exs85

  • Новичок
  • *
  • Сообщений: 45
  • Карма: 0
Наткнулся на довольно-таки неплохой словарь в сети - http://dict.cn/, постоянно пополняемый... и почти сразу появилось странное желание его заполучить в свои руки целиком... к сожалению, доступ к сети есть не всегда, так что очень хотелось бы его скачать ;)
может быть кто-то сталкивался с уже слитой базой или знает способ как это сделать?
думаю, этот словарь был бы многим интересен - там примеры неплохие, много + постоянно пополняется пользователями, а значит есть актуальная лексика ;)
раньше меня звали s85

Оффлайн exs85

  • Новичок
  • *
  • Сообщений: 45
  • Карма: 0
в общем, я придумал, как его выкачать, равно как и другие онлайновые китайские словари... правда, это длительный процесс... ;)
раньше меня звали s85

Оффлайн Чабудоша

  • Бывалый
  • ***
  • Сообщений: 218
  • Карма: 9
  • Пол: Женский
и как же, не поделитесь? : ;)
今天給大家介紹一道小朋友們一定喜歡的 雞包 包 雞包 包 雞包紙 包 紙包雞 包 包雞紙 包 雞包 包 雞包紙包 雞包紙 包 雞。做法也很簡單 只要將雞包包住個雞包再包住個雞包 包住那張雞包紙 再包包包包包住個紙包雞
再包包包 包雞包紙 紙紙紙紙 紙包紙 紙包雞 包雞紙 紙包雞 雞雞雞 紙紙紙 再包雞雞雞。。。

Оффлайн Hongwei(bing)

  • Заслуженный
  • *****
  • Сообщений: 878
  • Карма: -62
  • Пол: Мужской
кстати словарик класс, на все пять!!!

Оффлайн exs85

  • Новичок
  • *
  • Сообщений: 45
  • Карма: 0
в общем, концепция такая: создал файл запросов к этому словарю - где-то 30000 слов + 3000 отдельных иероглифов
потом это все скармливается программе wget (консольная качалка), сливается в один файл, парсится вручную (в ultraedit и textwrangler), на выходе - файл формата CEDICT
проблема - меня они постоянно банят по IP, а времени на настройку проксей как-то нет - учебный процесс, понимаешь...
надеюсь, получится все выкачать, потом отформатировать - дело техники...
если у кого-то сейчас есть много свободного времени, то могу поделиться искходными файлами...

а так, словарь хороший, но некоторые примеры были зарублены китайскими преподами как неправильные
так что доверяйте, но проверяйте... все-таки его общественность составляет, а не специалисты
раньше меня звали s85