• Welcome to Восточное Полушарие.

News:

Друзья! Форум перенесен на новый сервер, обновлено программное обеспечение, конвертированы данные. Изменений очень много, что-то могло сломаться, что-то не заработать, что-то пропасть. Если вы обнаружили проблему на форуме, пожалуйста, напишите на admin[собака]polusharie.com — постараемся исправить! 02.01.2026

Main Menu

Препарация и грабинг сайта

Started by Олег, 11 January 2006 10:42:12

Previous topic - Next topic

0 Members and 1 Guest are viewing this topic.

pnkv

Есть такой сайт, хитро сделанный
http://210.32.137.91/

На нем хранится некоторое количество книг в формате DJVU, но то ли они на другом сайте расположены, то ли еще где, но скачать телепортом их не удается. И найти ссылки, где эти страницы DJVU расположены также не получается.

Есть ли способ скачать книги целиком, а не сохраняя их по отдельной странице?

Вот, например, эту книгу:
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/oebbrowser.html


pnkv

Quote from: Echter on 11 January 2006 12:52:55   Книга лежит на сервере в таком формате:
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/ptiff/00000001.djvu
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/ptiff/00000002.djvu
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/ptiff/00000003.djvu
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/ptiff/...............djvu

Спасибо, но опять таки возникает вопрос, а как это скачать за раз? Если в телепорт вставлять ссылку
http://210.32.137.91/dlib/ebooks/anc/06/010000/06009270/ptiff/
то он не видит файлы, находящиеся в папке ptiff, а возможности закачки по шаблону там нет.

Fozzie

Элементарно, Ватсон!  ;D
Ставишь себе FlashGet, а в нём есть такая фишка как "Пакетное задание" (см. рисунок). Я таким образом вытянул все картинки иероглифов с Mojikyo (правда за это они, похоже, забанили мой рабочий IP).
據梧

pnkv

Здорово!
Теперь я даже и не знаю, а есть ли необходимость в создании библиотеки при форуме.
;D

Fozzie

Quote from: Олег on 11 January 2006 14:24:44
Теперь я даже и не знаю....
(C) "Особенности национальной охоты"  ;D ;D ;D
據梧

Fozzie

А сайт-то вкусненький! ::)
Я с ходу нашёл там пару очень нужных мне книг по 山海經. Теперь пойду разбираться, что же это конкретно я скачал...  ;D
據梧

groovy_merchant

Сайт прекрасный. Вот только некоторые книжки не дает - или на айпи ругается, или говорит, что кто-то там читает. Можно ли по идентификатору книжки найти ее фиксированый сетевой адрес?

pnkv

Да, интересно было бы узнать, какой ай-пи его устроит. А что кто-то там читает – похоже на отмазку. Был ли у кого случай, когда «читающая» книга потом становилась доступной?

Кроме того ряд книг доступен только партнерам, что тоже печально.


pnkv

Еще такой вопрос, а как отдельные DJVU соединить в целый файл. В LizardTech Document Express Editor такой функции не нашел.

Fozzie

Quote from: Олег on 11 January 2006 18:03:56
Еще такой вопрос, а как отдельные DJVU соединить в целый файл. В LizardTech Document Express Editor такой функции не нашел.
Э-э-э... А "Вещий", случаем, не от слова "чемоданы"?  ;D
Это можно сделать в Workflow Manager (у меня, как и у всех, Document Express Enterprise 5.1).
據梧

pnkv

Ааа, ну понял. У меня с помощью Insert Page.

Fozzie

Quote from: Олег on 11 January 2006 20:13:09
Ааа, ну понял. У меня с помощью Insert Page.
900 раз Insert Page? Важковато буде...
據梧

pnkv

Quote from: Fozzie on 11 January 2006 20:28:00
Quote from: Олег on 11 January 2006 20:13:09
Ааа, ну понял. У меня с помощью Insert Page.
900 раз Insert Page? Важковато буде...

нет, там можно пакетно добавлять. Хотя, стоит перейти на Enterprise.

Fozzie

Quote from: Олег on 11 January 2006 20:35:10
Хотя, стоит перейти на Enterprise.
Коль пошли такие сайты - ставь, Олежка, Enterprise!  ;D
據梧

Glasha

Только расстраивают. Книжек десять нужных сразу подряд - то айпи, то только партнёрам, то читают. У меня и охота пропала искать, что там вообще откроется. Пока ничего не выходит

Glasha

Или у меня айпи какой-то особенный? Например, захотела ещё про Лян Шумина прочитать - и все 32 книги не получилось.

pnkv

Quote from: Glasha on 12 January 2006 14:38:56
Или у меня айпи какой-то особенный? Например, захотела ещё про Лян Шумина прочитать - и все 32 книги не получилось.

а ссылка какая?




Echter

Quote from: Glasha on 12 January 2006 14:25:22
Только расстраивают. Книжек десять нужных сразу подряд - то айпи, то только партнёрам, то читают...

   Судя по всему, не читают, а "проверяют качество". Вполне возможно, эти книги ещё даже не отсканированы.
   А IP, наверное, нужен китайский. Можно попробовать китайский прокси.

pnkv

Небольшое наблюдение.

Если в поиске файл отмечен словом Read (c большой буквы), то он недоступен.
Если с маленькой – read – то:
1.   если имеет в пути /anc/ - то доступен
2.   все прочие недоступны.

Насколько я понимаю – anc от ancient, т.е. доступны файлы не имеющие проблем с копирайтом. Все книги с древними текстами, но современными комментариями также недоступны.


pnkv

#22
Ага, вот у них в поиске есть опция – Ancient, тогда будут отбираться только доступные книги.

==========

Попробовал выставлять - вообще ничего не ищет. Бредовая система.

Glasha

Ну, утешительней думать, что читают. Вычитывают то есть. А если они ещё не отсканировали книги, а просто дразнят окружающих, то как-то совсем грустно.

Fozzie

Да, сайт непростой (хотя лично мне он дал две весьма ценные для меня книги).
Почитал их FAQ. Очень понравилась фраза:
Quote4. If a publisher requests removal of a title from the database, what fee would they have to pay for its removal?

The current cost is $200.
В обязательном порядке включить подобный пункт в устав английского клуба!!!  ;D
據梧