Микроэлектроника и полупроводниковые приборы
Главная | Каталог статей | Регистрация | Вход
Воскресенье
20.08.2017
21:45
Вы вошли как Гость | RSS
Главная » Статьи » Статьи

Инструкция по обработке документов

   Предположим, что вы великодушно решили поделиться с кем-нибудь своей домашней работой, лекциями или важной методичкой. Что же вы делаете? Конечно, если вы хороший человек, то вы перепечатаете весь текст в Word'е, построите графики в Origin, нарисуете схемы в специализированных пакетах и аккуратно наберете все формулы. Но, осмелюсь предположить, что вы все-таки самый обыкновенный человек, поэтому вам лень этим заниматься - вы просто взяли и сфотографировали листик, предварительно положив его на ваше любимое цветастое одеяло с котятами, а потом выложили этот файл в сеть, написав, что если держишь оригинал в руках, то сможешь что-то там разобрать. Данная инструкция позволит вам одновременно и потакать собственной лени и льстить своему самолюбию, получая благодарности за отличный файл.

   Первым делом, запомните, что сканер лучше фотоаппарата, и он может сэкономить много нервов и вам и другим. Аккуратно положите документ в сканер, хорошенько прижмите середину, если это тетрадь или книга, и начинайте сканировать в режиме Grayscale с разрешением 300 dpi. Если стандартные программы вашего принтера абсолютно кривые, не позволяют задавать маску названий для файлов и прочее, то используйте сторонние программы - тот же InfranView. Если вы все сделали по инструкции, то переходите к пункту 4.

   Если же вы фотографируете, то запомните, что документ - это не ваш любимый таракан Янычар, поэтому фотографировать его надо на максимальном разрешении, при хорошем освещении и отключив все фильтры. Однако, в большинстве случаев, то ли сканер проглотил крокодил, то ли лекции вы фотографировали в каморке под лестницей, стоя на одной ноге, однако, вот какой результат мы получаем: плохое освещение, криво лежит, еще и кусок стола в столовой захватили.

                                   

Приступая к работе, запомните одну важную истину: никогда не работайте с оригинальным файлом, только с копией! 

   1) Обратите внимание на те участки документа, в которых расположены графики и текст, написанный цветными чернилами. Цветные чернила повышают читабельность текста, однако ужасно портят нам жизнь при обработке документа, поэтому или сами прекратите или попросите того, у кого брали лекции, прекратить писать светлыми цветными чернилами. Запомните проблемные участки и оставьте их в покое.

   2) Качаем программу ScanKromsator (здесь использовалась версия 5.93), загоняем в нее файл. Выбираем Image - Convert to grey. В левой панели листаем до вкладки Quality, ставим галочку на Enhance image и жмем на Gray enhance (если программа выдаст ошибку об отсутствии файла CRDE2001.dll, то скачиваем его и кладем в windows\system32). В некоторых случаях, имеет смысл в первой вкладке открывшегося окна (Background cleaner) поставить галочки Correct low contrast, Increase black, Enable и нажать на правую кнопку с лупой - это даст эффект ужирения текста, что повысит его читабельность. Однако это может привести к "съеданию" мелких элементов, вроде индексов, что недопустимо.

                                   

В большинстве случаев, сразу листаем до вкладки Illumination, ставим галочку Correct illumination, выбираем метод Safe или Soft и жмем на правую кнопку с лупой. Потом возвращаемся на Contrast, ставим галочку Auto-levels и жмем на кнопку с лупой. В основном меню выбираем вкладку Image - Save.

   3) Открываем получившийся файл в графическом редакторе, ищем уже известные нам проблемные места. Если они едва различимы, то исправьте это: вставьте из оригинального файла и очень аккуратно обработайте этот участок, напечатайте этот текст сами и т.д. Обычно, они просто очень блеклые, поэтому выделяем их, применяем по желанию фильтр Sharpen и подкручиваем Contrast. Так или иначе, эти участки должны не выглядеть серыми многоугольниками, а быть практически черно-белыми.

UPDATE: при обработке большого количества файлов (отфотанная тетрадь) есть более быстрый, но менее качественный способ. Для начала, конвертируем все файлы в Greycale каким-нибудь автоматическим конвертером (например, XnView), затем загружаем все эти файлы в ScanKromsator, отмечаем все файлы галочкой при помощи опции Apply up to current на последнем файле. В левой панели листаем до вкладки Quality, ставим галочку на Enhance image и жмем на Gray enhance: листаем до вкладки Illumination, ставим галочку Correct illumination, выбираем метод Safe или Soft, снимаем галочку, снова ставим ее, но зажав кнопку Ctrl. Потом возвращаемся на Contrast, ставим 7 и, зажав кнопку Ctrl, ставим галочку. В левой панели выбираем Binarization и, зажав Ctrl, выбираем MiddleDark или, иногда, LowDark. И переходим к пункту 4.

   4) Открываем получившийся файл (если вы сканировали, то открываем получившийся скан - если он окрашен неравномерно, то читаете пункт второй, и делаете операцию Correct illumination). Ищем сверху, слева от кнопки Process!, кнопку с ножницами. В появившемся меню выбираем Pre-rotate (если необходимо развернуть страницу), Split Pages (если страница сдвоена) и Safe top/bottom [UPD. Не забываем снять галочку со Skip marked files]. На экране появятся жуткие синие резаки - проверим, правильно ли они режут всякий мусор по краям экрана и в месте стыка страниц. Если они захватили что-то лишнее или, наоборот, оставили много мусора, то аккуратно двигаем их. Если у вас несколько файлов, то проверяем их все (перелистывание осуществляется клавишами q и w).

                                   

В левой панели во вкладке Page должны стоять галочки Split (если страница сдвоена), Despecle (если есть мусор и случайные пятна) и Deskew (если страница расположена криво). Если страница развернется некорректно, то поставьте галочку Art (L и R - для левой и правой страниц, соответственно) или Ortho, если текст идет перпендикулярно листу. Во вкладке Book можно выбрать размер полей (gap). Во вкладке Files выберите конечный путь для сохранения файла (если вы сканировали и хотите получить очень хорошее качество, то выберите DPI - 600). Проверьте, что во вкладке Quality все галочки сняты. Если у вас несколько файлов, то, чтобы применить параметры сразу ко всем им, зажимаем клавишу Ctrl, прежде чем что-то менять. Проверяем, что зеленые галочки стоят напротив всех наших файлов и жмем Process!. Идем пить чай.

5)В появившемся окне Result view, проверяем полученный результат. Если что-то нас не устраивает, то идем на сайт djvu-soft.narod.ru и вдумчиво читаем всю документацию о сканировании и программе ScanKromsator. Если все хорошо, то жмем на зеленую кисточку, выбираем способ выделения и убираем весь ненужный мусор: черные полосы на краях, пятна, полоску полей и т.д. При необходимости сместить страницу, жмем правой кнопкой мыши и выбираем Shift image...

                                   

6)Качаем программу DjVu Editor Pro (либо DjVu Solo 3.1), которая является частью Document Express Professional. Открываем первый файл (страницу) документа. Заходим во вкладку Edit - Add pages after и добавляем все остальные страницы документа. Убедившись, что они идут в правильном порядке, нажимаем File - Encode as DjVu, выбираем Bundled (одним файлом), Bitonal (двухцветное).

7)Проверяем наш чудесный файл и с чувством выполненного долга выкладываем на mippp.ucoz.ru. Конечный файл занимает всего 26 Kb, в то время как оригинальная фотография - 3,02 Mb, и все это заняло меньше 5 минут.

                                   

P.S. ScanKromsator позволяет работать с уже готовыми DjVu-файлами, что позволяет вам исправить выложенные кем-то методички и прочие файлы, в которых обитают сдвоенные криво расположенные страницы. После чего, выкладываем результат на mippp.ucoz.ru.

Категория: Статьи | Добавил: Mippp (05.08.2009)
Просмотров: 1428 | Рейтинг: 0.0/0 |
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Форма входа
Категории раздела
Статьи [7]
Поиск
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
МиППП ИФИТ © 2017
Создать бесплатный сайт с uCoz