jacar'овские заморочки / Цусимские форумы

Глокий Куздр · 05.01.2010 13:12:14

Знаю что некоторые участники форума очень серьёзно работают с этим ресурсом. Я сам лишь пару раз побаловался, но тем не менее, за пару часов работы с jacar, стали ясны некоторые неудобства в работе с архивом (что никак не умаляет подвига японских товарищей - низкий им поклон за такие подарки).
Нашел пару, пусть не слишком изящных, но вполне действенных решений.

Момент первый. Вытаскивание картинок.

Возможно кому-то проще их выковыривать из DjVU-файла посредством фотошопа, я лишь предложу свой способ.

Итак, по умолчанию мы видим документ через DjVU-утилиту встроенную в браузер (идентичную обычным просмоторщикам DjVU-файлов). Видим интересующую картинку в документе, - запоминаем её номер
1. Переходим в режим "Jpeg". Выбираем искомую страницу документа.
2. Выставляем увеличение 300 или 600 %. Видим левый верхний угол изображения в нужном увеличении, причем сохранить можем только этот уголок в разрешении 800х600. Это неинтересно.
3. Кликаем правой кнопкой мыши на картинку.
4. Жмём "свойства". В свойствах есть строка "адрес:". Копируем этот адрес.
5. Вставляем этот адрес в менеджер закачек (например download master), но, прежде чем начать закачку, вносим правку в URL.
Взятый URL выглядит вот так (к примеру):

http://jpeg.jacar.go.jp/lizardtech/iserv/getimage?cat=Jacar&item=a1201800/bet01800/0876/index.djvu&wid=800&hei=600&lev=3&cp=0.5,0.5&method=fit&oif=jpeg&page=0

6. Важное выделено жирным. Если вначале вы выбрали увеличение 300% то оптимально заменить цифирку 600 (в URL) на 4096 (думаю ясно что 800х600 это "отпускное" разрешение), а цифру 800 на 5120. Т.е. jacar предлагаем вам забрать картинку в окошке 800х600, а вы просите: "ненене, братка, отдай-ка в 5120х4096" Он добрый - отдаст.
Жмёте в менеджере "начать закачку". Скачиваете.
Это не всё.
7. Скачанный файл не имеет разрешения, т.е. открыть его нельзя.
Переименуйте файл. Например назовите его A03023088700_4.jpg. Важное опять-таки выделено жирным. Мы не только присваиваем файлу удобное имя (например код документа и номер страницы), но и нужное разрешение (".jpg"!)
8. PROFIT!
Методом научного тыка установлено что увеличению 300% примерно соответствует размер окна 5120х4096, а увеличению 600% - 8960х7168 (вес жпегов в этом случае приблизится к 7-8 мб). Впрочем, эти цифры совершенно не строгие, - ничего не мешает вам выбрать свои.
Кстати это только кажется что способ "муторный". Это описывать долго, а делать - быстро. Короче говоря - делать так, или извлекать из DjVU - просто дело вкуса.

Момент второй. Разрозненные файлы.

Я так и не понял как можно сохранять DjVU документ в виде целого файла а не россыпи (jacar даёт сохранять только в виде "одна страница=один DjVU файл"). Поступил просто.
1. Берется любой редактор pdf (pdf-creator или nitro pdf или любой другой). Запускается. (Кстати фэны формата DjVU могут использовать редактор этого формата).
2. Далее в jacar'е жмём на кнопку "напечатать" (рядом с "сохранить", в виде принтера). В открывшимся окошке нам предложат напечатать на бумаге "все" страницы. Под "всеми" jacar подразумевает ту страницу что сейчас открыта в окошке просмотра, и только её!.
3. Вверху окошка (где выбор принтера) вместа принтера выбираем программу-редактор pdf файлов.
4. Ниже убираем метку с "напечатать все" и переставляем её на "напечать с: ... по:....". Выставляем значения от 1 тире количество страниц в документе. Т.е. если в документе 64 стр. у вас должно быть: "напечатать с 1 по 64".
5. Оправляете на "печать".
6. В pdf-редакторе появляются все 64 страницы документа в соответствующем порядке.
7. Жмём "сохранить pdf документ" и присваиваем ему удобное имя. Например "A03023088700"
8. PROFIT!!

В итоге (по идее) после обработки вышеописаннными методами нескольких документов у нас будет папка в которой находятся чересполосно целые pdf-ки а непосредственно рядом с ними (при выставлении "упорядочть значки по имени") относящиеся к ним картинки. Наверно это удобно.

Если всё вышеперечисленное - боянистый боян или суета сует - прошу прощения.

P.S. Было бы неплохо, если данная тема не будет состоять из одного лишь нулевого поста.

Отредактированно Эвмел (05.01.2010 13:30:02)

vs18 · 05.01.2010 14:02:13

LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.

Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).

Если предполагается OCR полезна утилита unpaper.

Распознаю либо Tesseract-OCR (только для английских/французских/немецких текстов), либо FineReader, в зависимости от того, что дает лучшие результаты.

Отредактированно vs18 (05.01.2010 14:05:01)

Глокий Куздр · 05.01.2010 14:15:43

vs18 написал:
Оригинальное сообщение #165414
LizardTech DjVu Browser Plug-in позволяет сохранять многостраничные документы.

А как это сделать на самом jacar'е? Там же вроде тоже LizardTech-ский плагин устанавливается, но как с ним сохранить файл целиком я так и не понял.

vs18 написал:
Оригинальное сообщение #165414
Для преобразования файлов DjVu в TIFF я использую утилиту ddjvu из пакета DjVulibre (для преобразования PDF в TIFF - Ghostscript).

Спасибо. Зело пользительные примочки.

Глокий Куздр · 05.01.2010 14:22:35

Эвмел написал:
Оригинальное сообщение #165417
А как это сделать на самом jacar'е?

Ой прошу прощения! Только что получилось сохранить целиком (хотя раньше не получалось. странно). Может быть потому что я только что установил предложенную утилиту DjVUlib? Ей богу раньше сохранялись только отдельные файлы. Чудеса.

Отредактированно Эвмел (05.01.2010 14:23:55)

Евгений Пинак · 06.01.2010 14:24:31

Никаких чудес. "Родной" лизардтековский плагин без проблем сохраняет документы как постранично, так и в одном файле - больше ничего устанавливать не надо.

Geomorfolog · 15.01.2010 15:54:27

Лично я сохраняю в BMP, а потом,если надо,преобразую в JPG, а потом уменьшаю,увеличиваю,обрезаю и т. п. Но мне кажется при любом раскладе с текстом и рисунками все нормально,с фото - полный ж.

#1 05.01.2010 13:12:14

jacar'овские заморочки

#2 05.01.2010 14:02:13

Re: jacar'овские заморочки

#3 05.01.2010 14:15:43

Re: jacar'овские заморочки

vs18 написал:

vs18 написал:

#4 05.01.2010 14:22:35

Re: jacar'овские заморочки

Эвмел написал:

#5 06.01.2010 14:24:31

Re: jacar'овские заморочки

#6 15.01.2010 15:54:27

Re: jacar'овские заморочки

Board footer