Автор Тема: Препарация и грабинг сайта  (Прочитано 21150 раз)

0 Пользователей и 1 Гость просматривают эту тему.

pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #25 : 13 Января 2006 03:38:30 »
Кстати в открытый доступ они предлагают 28.962 книги, что тоже не мало. Если пройти по ссылке на первой странице на Acient, то до 1159-й страницы все книги доступны.

Интересно столько они занимают места?


pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #26 : 13 Января 2006 03:51:28 »
А смотри, деньги-то смешные  – 7 миллионов, а такой объем в цифру перевели. Только я так и не понял, доступ к закрытым материалам для кого сделан?


pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #27 : 14 Января 2006 18:25:35 »
Для Фоззи. Кстати там есть и 續修四庫全書 . Наверное, оттуда и содрали. Весь вопрос в том, с каким качеством в ослиный пдф перевели. Посмотрел 22 том, что под рукой был, на глаз явных различий нет.


Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Препарация и грабинг сайта
« Ответ #28 : 14 Января 2006 19:29:18 »
Для Фоззи. Кстати там есть и 續修四庫全書 . Наверное, оттуда и содрали. Весь вопрос в том, с каким качеством в ослиный пдф перевели. Посмотрел 22 том, что под рукой был, на глаз явных различий нет.
Да, спасибо, глянул - только там, похоже все тома (и ещё много чего лишнего  ;D - вроде бы должно быть 1800 томов, а поиск даёт 2584 результата).
Плюс некоторые книги из этого сборника лежат отдельно - я скачал, сообразно текущим интересам, 尔雅一切註音, сравнил со 188 томом, разница есть (см. картинки).
« Последнее редактирование: 14 Января 2006 20:25:49 от Fozzie »
據梧

pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #29 : 14 Января 2006 19:53:56 »
Вроде на cadal получше будет.

По количеству. Некоторые почему-то по два раза прописаны. Один линк доступен, а другой нет.

2528 續修四庫全書一一○九 •子部•譜錄類
2529 續修四庫全書一一○九子部譜錄類


Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Препарация и грабинг сайта
« Ответ #30 : 14 Января 2006 20:25:17 »
Вроде на cadal получше будет.
Нет - это из-за разницы в изданиях: тот же 188 том, что тут, что в emule - качество практически одно и то же.
Цитировать

По количеству. Некоторые почему-то по два раза прописаны. Один линк доступен, а другой нет.
2528 續修四庫全書一一○九 •子部•譜錄類
2529 續修四庫全書一一○九子部譜錄類
Не знаю из-за чего... Может разные издания? Мне подробности смотреть сложно - Firefox отображает этот сайт с большими искажениями.
Да, и вверху я немного ошибся - там всего должно быть 1800 томов.
據梧

pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #31 : 14 Января 2006 20:37:10 »
А там никаких подробностей нет. Указано одно издательство上海古籍出版社, больше ничего.

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Препарация и грабинг сайта
« Ответ #32 : 14 Января 2006 20:59:12 »
А там никаких подробностей нет. Указано одно издательство上海古籍出版社, больше ничего.
Если кликнуть на название у меня вылезает страница с кашей в которой проглядывают цифры 1758-01-01. Имею мысль, что это дата публикации оригинального текста. :)

據梧

pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #33 : 16 Января 2006 20:56:46 »
Это можно сделать в Workflow Manager (у меня, как и у всех, Document Express Enterprise 5.1).

что-то не пойму, а как?  :)

Оффлайн Fozzie

  • Заслуженный
  • *****
  • Сообщений: 702
  • Карма: 10
  • Пол: Мужской
Re: Препарация и грабинг сайта
« Ответ #34 : 16 Января 2006 21:12:12 »
что-то не пойму, а как?  :)
Запускаешь WM. В закладке "Input" выбираешь файлы через "Choose files..." (очень много за раз он почему-то не любит, но 300 хавает).
Потом в закладке "Output" выставляешь "Separate Document(s) by" на "One document only". Далее в меню "Job" -> "Start all jobs" И будет тебе счастье...
Если в документе более 300 страниц, то делаешь частями, а потом объединяешь результаты. Пока так.

Кстати, у меня нет Document Express Editor'а... :(
據梧

pnkv

  • Гость
Re: Препарация и грабинг сайта
« Ответ #35 : 16 Января 2006 21:26:11 »
Кстати, у меня нет Document Express Editor'а... :(

Зайди на сервер Б - пятый диск.  :)