Создание книг в формате DjVu

         

Редактирование:


После того, как бумажная книга отсканирована, получившиеся сканы в графическом формате *.tif нужно отредактировать, перед тем, как закодировать их в формат DjVu. Это нужно сделать как для улучшения внешего вида будующей книги, так и для уменьшения её размера.

На первом этапе редактирование получившихся сканов нужно провести в самом ABBYY FineReader v7.0. Кстати, размер получающегося пакета довольно большой - примерно 1,5-1,8 гигабайта, и при редактировании потребуется ещё где-то 300-400 мегабайт. Так что не забудьте до начала сканирования обеспечить на жёстком диске 2-2,5 гигабайт места.

При предварительном редактировании получившихся сканов в ABBYY FineReader v7.0 можно сделать следующее: если вы сканировали сразу 2 страницы книги за один проход сканера, то Вам нужно, во-первых, повернуть на 90 градусов все страницы пакета (это немного увеличивает размер пакета), а во-вторых, разрезать сдвоенные страницы. Разрезать сдвоенные страницы лучше всего при помощи ABBYY FineReader v7.0, потому что это единственная программа, которая делает это автоматически на интеллектуальной основе, а не механически, как скажем, СканКромсатор (которым я так и не воспользовался ни разу: уж больно он навороченный, и хелп к нему есть лишь к первой версии, а последняя версия - 5-я). Повернуть на 90 градусов все страницы пакета можно через меню в ABBYY FineReader v7.0.

Далее в любом случае (сдвоенные страницы или нормальные) нужно создать пустой проект. Затем в этом новом проекте задаём опции: Сервис -> Опции -> "Очистить от мусора" (крайне полезная опция, всегда используйте её) и, если у Вас сдвоенные страницы, там же ставим галочку "Делить разворот книги". Далее, при новом открытом пакете в меню "Файл" выбираем пункт "Открыть изображение" и выбираем все файлы-сканы из старого проекта. Нажимаем "Открыть". Начнёт заполняться новый проект и при этом к каждому добавлемому файлу будут применяться выбранные опции проекта (очистка от мусора, разрезание сдвоенных страниц).
Вы спросите, а почему бы сразу не поставить эти 2 галочки в опциях проекта, ещё до сканирования? Дело в том, что "Очистить от мусора" ещё можно выставить и действительно обойтись 1 проектом, а вот "Делить разворот книги" сразу поставить нельзя, потому что некоторые страницы разрезаются неправильно, и нужно их потом в Adobe PhotoShop v5.0 вручную разрезать. Необходимо упомянуть, что программа ABBYY FineReader, начиная с версии как минимум 4, автоматически исправляет неправильный наклон страниц (по-английски "Deskew"). Это же вроде бы делает СканКромсатор, я не пробовал, ничего не могу сказать.

Окончательное редактирование сканов осуществляется в Adobe PhotoShop v5.0. Я делаю вот что: Сначала создаю в Adobe PhotoShop v5.0 пустой файл-шаблон с такими размерами (которые подбираю опытным путём), чтобы он был чуть-чуть больше "зоны значимости" на каждом скане, т.е. той части площади скана, которая содержит интересующую нас информацию (остальное - поля) и с желаемым разрешением. Потом я просто вручную копирую каждый скан и, вставляя его в шаблон (который, понятно, меньше скана), центрирую скан мышкой относительно шаблона на глаз так, чтобы получились ровные поля. Затем сохраняю теперь уже будующую страницу книги в пункте меню Файл - Сохранить Копию, а изменения в шаблоне - не сохраняю. И так далее, до конца сканов. Попутно "доворачиваю" вручную те сканы, которые ABBYY FineReader v7.0 плохо повернул в нормальное положение, в Adobe PhotoShop v5.0 так: Изображение -> Перевернуть холст -> Произвольный. Вводим произвольный угол поворота, разделяя дробную часть угла запятой. Пункт "Произвольный" будет поначалу неактивным, чтобы активизировать его, нужно изображение преобразовать так: Изображение -> Режим из Bitmap в Ч-Б, а потом, после поворота, обратно в Ч-Б.

Следующим этапом я вручную редактирую в Adobe PhotoShop v5.0 будующие страницы книги - тут Ваша фантазия не ограничена. Я убираю мусор в основном и т.п.

Есть ещё несколько программ предназначенных именно для редактирования сканов бумажных книг (СканКромсатор, SilverFast, RasterID и пр.). Я их здесь не рассматриваю, просто ещё не успел с ними разобраться. Говорят, СканКромсатор - хорошая программа.


Содержание раздела