Вы не зашли.
Страниц: 1
Знаю что некоторые участники форума очень серьёзно работают с этим ресурсом. Я сам лишь пару раз побаловался, но тем не менее, за пару часов работы с jacar, стали ясны некоторые неудобства в работе с архивом (что никак не умаляет подвига японских товарищей - низкий им поклон за такие подарки).
Нашел пару, пусть не слишком изящных, но вполне действенных решений.
Момент первый. Вытаскивание картинок.
Возможно кому-то проще их выковыривать из DjVU-файла посредством фотошопа, я лишь предложу свой способ.
Итак, по умолчанию мы видим документ через DjVU-утилиту встроенную в браузер (идентичную обычным просмоторщикам DjVU-файлов). Видим интересующую картинку в документе, - запоминаем её номер
1. Переходим в режим "Jpeg". Выбираем искомую страницу документа.
2. Выставляем увеличение 300 или 600 %. Видим левый верхний угол изображения в нужном увеличении, причем сохранить можем только этот уголок в разрешении 800х600. Это неинтересно.
3. Кликаем правой кнопкой мыши на картинку.
4. Жмём "свойства". В свойствах есть строка "адрес:". Копируем этот адрес.
5. Вставляем этот адрес в менеджер закачек (например download master), но, прежде чем начать закачку, вносим правку в URL.
Взятый URL выглядит вот так (к примеру):
http://jpeg.jacar.go.jp/lizardtech/iserv/getimage?cat=Jacar&item=a1201800/bet01800/0876/index.djvu&wid=800&hei=600&lev=3&cp=0.5,0.5&method=fit&oif=jpeg&page=0
6. Важное выделено жирным. Если вначале вы выбрали увеличение 300% то оптимально заменить цифирку 600 (в URL) на 4096 (думаю ясно что 800х600 это "отпускное" разрешение), а цифру 800 на 5120. Т.е. jacar предлагаем вам забрать картинку в окошке 800х600, а вы просите: "ненене, братка, отдай-ка в 5120х4096" Он добрый - отдаст.
Жмёте в менеджере "начать закачку". Скачиваете.
Это не всё.
7. Скачанный файл не имеет разрешения, т.е. открыть его нельзя.
Переименуйте файл. Например назовите его A03023088700_4.jpg. Важное опять-таки выделено жирным. Мы не только присваиваем файлу удобное имя (например код документа и номер страницы), но и нужное разрешение (".jpg"!)
8. PROFIT!
Методом научного тыка установлено что увеличению 300% примерно соответствует размер окна 5120х4096, а увеличению 600% - 8960х7168 (вес жпегов в этом случае приблизится к 7-8 мб). Впрочем, эти цифры совершенно не строгие, - ничего не мешает вам выбрать свои.
Кстати это только кажется что способ "муторный". Это описывать долго, а делать - быстро. Короче говоря - делать так, или извлекать из DjVU - просто дело вкуса.
Момент второй. Разрозненные файлы.
Я так и не понял как можно сохранять DjVU документ в виде целого файла а не россыпи (jacar даёт сохранять только в виде "одна страница=один DjVU файл"). Поступил просто.
1. Берется любой редактор pdf (pdf-creator или nitro pdf или любой другой). Запускается. (Кстати фэны формата DjVU могут использовать редактор этого формата).
2. Далее в jacar'е жмём на кнопку "напечатать" (рядом с "сохранить", в виде принтера). В открывшимся окошке нам предложат напечатать на бумаге "все" страницы. Под "всеми" jacar подразумевает ту страницу что сейчас открыта в окошке просмотра, и только её!.
3. Вверху окошка (где выбор принтера) вместа принтера выбираем программу-редактор pdf файлов.
4. Ниже убираем метку с "напечатать все" и переставляем её на "напечать с: ... по:....". Выставляем значения от 1 тире количество страниц в документе. Т.е. если в документе 64 стр. у вас должно быть: "напечатать с 1 по 64".
5. Оправляете на "печать".
6. В pdf-редакторе появляются все 64 страницы документа в соответствующем порядке.
7. Жмём "сохранить pdf документ" и присваиваем ему удобное имя. Например "A03023088700"
8. PROFIT!!
В итоге (по идее) после обработки вышеописаннными методами нескольких документов у нас будет папка в которой находятся чересполосно целые pdf-ки а непосредственно рядом с ними (при выставлении "упорядочть значки по имени") относящиеся к ним картинки. Наверно это удобно.
Если всё вышеперечисленное - боянистый боян или суета сует - прошу прощения.
P.S. Было бы неплохо, если данная тема не будет состоять из одного лишь нулевого поста.
Отредактированно Эвмел (05.01.2010 13:30:02)
LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.
Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).
Если предполагается OCR полезна утилита unpaper.
Распознаю либо Tesseract-OCR (только для английских/французских/немецких текстов), либо FineReader, в зависимости от того, что дает лучшие результаты.
Отредактированно vs18 (05.01.2010 14:05:01)
vs18 написал:
Оригинальное сообщение #165414
LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.
А как это сделать на самом jacar'е? Там же вроде тоже LizardTech-ский плагин устанавливается, но как с ним сохранить файл целиком я так и не понял.
vs18 написал:
Оригинальное сообщение #165414
Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).
Спасибо. Зело пользительные примочки.
Эвмел написал:
Оригинальное сообщение #165417
А как это сделать на самом jacar'е?
Ой прошу прощения! Только что получилось сохранить целиком (хотя раньше не получалось. странно). Может быть потому что я только что установил предложенную утилиту DjVUlib? Ей богу раньше сохранялись только отдельные файлы. Чудеса.
Отредактированно Эвмел (05.01.2010 14:23:55)
Никаких чудес. "Родной" лизардтековский плагин без проблем сохраняет документы как постранично, так и в одном файле - больше ничего устанавливать не надо.
Лично я сохраняю в BMP, а потом,если надо,преобразую в JPG, а потом уменьшаю,увеличиваю,обрезаю и т. п. Но мне кажется при любом раскладе с текстом и рисунками все нормально,с фото - полный ж.
Страниц: 1