Как убрать серый фон при сканировании документов

Как убрать серый фон при сканировании документов

В программе ABBYY FineReader вы можете менять следующие настройки:

Выбрать необходимые параметры вы можете непосредственно в диалогах открытия или сканирования изображений (если вы используете для сканирования интерфейс ABBYY FineReader), а также на закладке Сканировать/Открыть диалога Настройки (меню Сервис>Настройки…).

Внимание! Если вы изменили настройки программы в диалоге Настройки, то необходимо отсканировать или открыть изображение заново. Только после этого ваше изображение будет обработано с новыми настройками.

На закладке Сканировать/Открыть диалога Настройки вы можете задать следующие настройки:

Автоматический анализа и распознавание изображений

Анализ и распознавание документа FineReader по умолчанию выполняются автоматически. При необходимости вы можете изменить этот режим. Возможны следующие варианты:

  • Распознавание изображений (включая предобработку)

При добавлении в документ FineReader выполняется автоматическая предобработка изображений в соответствии с настройками, выбранными в группе Предобработка изображения. Анализ и распознавание документа также производятся автоматически.

  • Анализ изображений (включая предобработку)

Выполняются автоматическая предобработка изображений и анализ документа, распознавание нужно запускать вручную.

Выполняется только автоматическая предобработка изображений. Анализ и распознавание документа нужно будет запускать вручную. Такой режим, как правило, используется для документов, имеющих сложную структуру.

Чтобы добавить отсканированные или открытые изображения в документ FineReader без обработки, снимите выделение с опции Автоматически обрабатывать добавленные страницы. Такой режим позволяет быстро открыть большой документ. Используйте его, если вы хотите распознать некоторые страницы, а не документ целиком, или сохранить исходные документы как изображения.

Параметры предобработки изображений

ABBYY FineReader позволяет автоматически устранить дефекты, которые свойственны отсканированным изображениям и цифровым снимкам.

При сканировании книг или открытии изображений сдвоенных страниц, программа автоматически разделит изображения на отдельные страницы.

Программа определит ориентацию страниц, добавляемых в документ FineReader, и при необходимости исправит ее.

Программа определит и при необходимости исправит перекос на фотографиях и отсканированных разворотах книг.

  • Устранить трапециевидные искажения

Программа определит и при необходимости исправит трапециевидные искажения и неровность строк текста на фотографиях и отсканированных разворотах книг.

Программа автоматически определит и исправит неровность строк текста на изображениях без исправления трапециевидных искажений.

При необходимости программа инвертирует цвета на изображении, чтобы привести текст к стандартному виду: темный текст на светлом фоне.

Программа найдет на изображении и удалит цветные печати, а также пометки, сделанные ручкой. Это позволит улучшить качество распознавания текста под ними. Работает на отсканированных документах с белым фоном. Не рекомендуется выбирать эту опцию для фотографий и документов с цветным фоном.

  • Исправить разрешение изображений

Программа определит оптимальное для изображения разрешение и при необходимости исправит его.

Программа определит и обрежет ненужные края цифровых фотографий.

Программа приведет фон документа к белому и подберет оптимальную яркость, что позволит улучшить качество цифровых фотографий.

Программа удалит шумы с цифровых фотографий.

Программа устранит нечеткость цифровых фотографий.

Замечание. Вы можете не использовать опции предобработки изображений при сканировании или открытии страниц документа, а выполнить необходимую обработку в уже открытом документе с помощью редактора изображений. Подробнее см. «Обработка изображений».

Интерфейс сканера, который будет использоваться при сканировании

Для задания параметров сканирования в программе ABBYY FineReader по умолчанию используется встроенный диалог сканирования ABBYY FineReader, который позволяет указать:

  • Разрешение, режим сканирования и яркость.
  • Область сканирования.
  • Нужно ли автоматически обрабатывать изображения.

Совет. Вы можете выбрать как именно будет обработано изображение: какие дефекты изображений будут устранены, нужно ли выполнять анализ и распознавание документа. Для этого включите опцию Автоматически обрабатывать добавленные страницы и нажмите кнопку Настройки….

  • Настройки для сканирования многостраничных документов:
    1. Использовать автоподатчик (ADF)
    2. Применять автоматическое двустороннее сканирование (если данная возможность поддерживается сканером)
    3. Установить задержку между сканированием страниц на указанное количество секунд

    Если встроенный диалог по какой-то причине несовместим со сканером, то для настройки параметров сканирования используется диалог драйвера сканера. Вид окна и описание его элементов вы найдете в документации, прилагаемой к сканеру.

    Иногда нет времени для того чтобы создать новый документ и необходимо срочно:

    • отредактировать сканированный чертеж или схему, внести в документ дополнения, комментарии;
    • вставить в сканированный рисунок формы документа поля для заполнения;
    • просто получить чистый, без помарок и лишнего грязного фона документ.

    Для этого сканированный документ предварительно необходимо преобразовать в черно-белый, при необходимости устранить перекос, и очистить от "мусора".
    Предвижу вопрос — почему бы не включить при сканировании черно-белый режим? Можно, но качество полученного изображения в этом случае будет на порядок ниже, чем в рассмотренном примере.

    Существуют специализированные программы для этих целей, такие как Spotlight Pro, но они сложны в использовании, и для их освоения требуется значительное время.

    Я хочу предложить более простой, но эффективный вариант обработки сканированных документов, с помощью программы оптического распознавания текста ABBYY FineReader 9.0.

    Сканировать документ, можно непосредственно из интерфейса программы или вставить для обработки уже сканированный рисунок.

    Читайте также:  Как скопировать цифру в фотошопе

    Для наглядности и усложнения задачи, мы возьмем уже сканированный разворот книги, с перекосом страниц и пожелтевшими от времени страницами. Используя программу ABBYY FineReader 9.0, преобразуем рисунок в черно-белый, исправим перекос и очистим от мусора.

    1. Запускаем программу ABBYY FineReader и в меню Сервис, выбираем команду Опции.
      В открывшемся окне, во вкладке Сканировать/Открыть, отмечаем пункт Не обрабатывать полученные изображения, так как распознавать текст мы не будем — нам нужно только изображение. Выбираем параметры Обработки изображения:

      Рис 2

      Как видим из рисунка, выбрав соответствующие пункты обработки изображения, мы практически полностью можем автоматизировать нашу работу.

    2. В меню Файл, выбираем команду Открыть PDF/изображение. , и выбираем наше изображение (программа поддерживает все распространенные форматы рисунков, а так же pdf и DjVu файлы). В результате, мы получим две страницы черно-белого изображения с исправленным перекосом.


    Рис. 3

    Теперь очистим изображение от мусора — мелких точек. Для этого, просто нажмем 1-3 раза кнопку Очистить изображение, при этом наблюдаем за процессом удаления мусора. при первом нажатии удаляются более мелкие точки, а при последующих, крупнее.

    Его можно распечатать, не тратя лишнюю краску на кляксы и грязь, отправить по электронной почте другу, без угрызения совести за не качественный скан, а так же сохранить для дальнейшего использования в любом из поддерживаемых форматов.

    Для сохранения изображения в меню Файл, выбираем команду Сохранить изображение как. . Выбираем любой из поддерживаемых форматов:
    Bitmap, черно-белый (*.bmp; *.dib; *.rle)
    Bitmap, серый (*.bmp; *.dib; *.rle)
    Bitmap, цветной (*.bmp; *.dib; *.rle)
    DCX, черно-белый (*.dcx)
    DCX, серый (*.dcx)
    DCX, цветной (*.dcx)
    JBIG2 (*.jb2; *.jbig2)
    JPEG 2000, серый (*.jp2; *.j2k)
    JPEG 2000, цветной (*.jp2; *.j2k)
    JPEG, серый (*.jpg; *.jpeg)
    JPEG, цветной (*.jpg; *.jpeg)
    PCX, черно-белый (*.pcx)
    PCX, серый (*.pcx)
    PCX, цветной (*.pcx)
    PNG, черно-белый (*.png)
    PNG, серый (*.png)
    PNG, цветной (*.png)
    TIFF, черно-белый, несжатый (*.tif; *.tiff)
    TIFF, черно-белый, packbits (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: LZW (*.tif; *.tiff)
    TIFF, черно-белый, Group4 (*.tif; *.tiff)
    TIFF, серый, несжатый (*.tif; *.tiff)
    TIFF, серый, Packbits (*.tif; *.tiff)
    TIFF, серый, сжатие: JPEG (*.tif; *.tiff)
    TIFF, серый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, серый, сжатие: LZW (*.tif; *.tiff)
    TIFF, цветной, несжатый (*.tif; *.tiff)
    TIFF, цветной, Packbits (*.tif; *.tiff)
    TIFF, цветной, сжатие: JPEG (*.tif; *.tiff)
    TIFF, цветной, сжатие: ZIP (*.tif; *.tiff)
    TIFF, цветной, сжатие: LZW (*.tif; *.tiff)
    PDF (*.pdf)


    Очищенные сканы страниц от "мусора" и с исправленным искажением строк.

    Хочется отметить, многие в настоящее время переводят свои документы (чертежи, схемы, книги. ) в электронный вид. При большом объеме работ, удобнее использовать для этих целей фотоаппарат. С некоторыми моделями сканеров и фотоаппаратов, поддерживающих функцию переснятия документов, программа ABBYY FineReader, идет в комплекте. При выборе инструмента для перевода документов в электронный вид, следует учесть это, так как FineReader, с учетом её основного назначения — оптического распознавания текста, для тех, кто работает с документами не менее полезная программа, чем текстовый редактор.

    В этом уроке я покажу вам, как я чищу сканы старых книг и сохраняю их в едином PDF файле для последующей печати. Для работы я использую программу «Adobe Photoshop» и графический планшет «Wacom».

    Сразу хочу обратить внимание, что мой способ основывается только на чистке (ретуши) изображения без распознавания текста в программе «ABBYY FineReader». Это целесообразно, когда необходимо сохранить первоначальную верстку, например если в тексте много изображений, сложно подобрать шрифт или же издание слишком ценное и необходимо печатать так как есть.

    Заранее предупреждаю, что наличие графического планшета обязательно. Без него качественно почистить сканы не получится. Совсем. Но не стоит отчаиваться, если у вас его нет. Купить планшет можно не так дорого, тем более, всегда можно заказать такую технику напрямую из Китая. Как раз об этом на сайте propereplet.ru есть замечательная обзорная статья.

    Для урока я выбрал брошюру «Приготовленіе макаронъ, вермишели и лапши домашнимъ способомъ» автора А.Румянцева. Она напечатана в 1914 году изданием журнала «Домашній ремесленникъ». Для примера чистить буду только одну страницу.

    Исходник в формате PDF. Имеем даже не сканы, а фотографии разворотов брошюры. Сложности в обработке вызывают неравномерное освещение страниц, искажение перспективы от съемки под углом, изгиба страниц и от объектива (дисторсия). Хуже быть не может. Это как раз то, что нам нужно!

    Шаг 1. Импортируем PDF
    Для начала открываем PDF файл в программе. Я использую версию CC 2015.5. Выбираем ту страницу, которая нам нужна. Не обязательно открывать все страницы, скорее всего вы не успеете обработать все за один раз. Настройки не трогаю, нажимаю ОК.

    Шаг 2. Кадрируем изображение
    Выбираю инструмент «Рамка» и выделяю первую страницу с разворота. Нажимаю клавишу «Enter». Все что было за рамкой удаляется.


    Шаг 3. Исправление перспективы
    Выбираю инструмент «Кадрирование перспективы». Четырьмя точками обозначаю прямоугольник текстового блока. Затем с помощью потягивания за стороны выделенной области произвольно расширяю зону выделения примерно до размера страницы. Нажимаю клавишу «Enter».


    После применения изменений, очертания текстового блока приобретают прямоугольную форму. Готовый результат.

    Строчки и края текстового блока могут остаться неровными. Эти искажения появляются от изгибов бумаги, зачастую у корешкового поля. Далее я постараюсь исправить все неровности текста с помощью инструмента «Деформация».

    Шаг 4. Деформация изображения
    Выбираю инструмент Редактирование > Трансформирование > Деформация

    С помощью потягивания за опорные точки и рычаги, или же за само изображение деформирую его так, как мне нужно. Для удобства выставляю вспомогательные направляющие по краям блока. Они вытягиваются из боковой и верхней линеек. При достижении нужного результата нажимаю клавишу «Enter».

    Вспомогательные направляющие можно убрать обратно в линейки. При этом на панели инструментов должен быть выбран инструмент «Перемещение»

    Шаг 5. Создание маски слоя с текстом
    Выбираю инструмент «Прямоугольная область» и выделяю текстовый блок вместе с номером страницы.
    Далее в панели «Слои» выбираю слой с текстом и нажимаю кнопку «Добавить слой-маску»

    Часть изображения, которая была за границей выделения скрылась. У слоя с текстом появится значок маски

    Шаг 6. Обесцвечивание текста
    Для того, чтобы убрать весь цвет из текста создаю новый корректирующий слой «Черно-белое…» в панели «Слои».

    Затем в открывшейся панели «Свойства» нажимаю «Авто» а потом выставляю «Желтые» примерно на 200. Также можно попробовать подтянуть «Красные». Зависит от того, какого цвета бумага страницы. Делается это для высветления фона страницы и настраивается сугубо индивидуально.

    Шаг 5. Создание белого фонового слоя
    Далее создаю слой-заливку «Цвет…» в панели «Слои»

    Выбираю белый цвет (#ffffff) и располагаем слой ниже слоя с текстом.

    Шаг 6. Высветление фона
    Создаю новый корректирующий слой «Уровни…» в панели «Слои». Тут нужно поиграть с настройками двигая три бегунка так, чтобы в самом светлом месте фон стал абсолютно белым а буквы черными, но без сильной грязи.

    Если страница сканирована/сфотографирована с неравномерной яркостью фона, то фон будет высветляться не полностью, а только пятном, и некоторые участки фона останутся темными. Не пытайтесь высветлить все за раз. Иначе в светлых участках текст будет блекнуть.

    Для решения этой проблемы я буду использовать несколько дублей слоев с текстом для разных частей изображения, к каждому из которых будет привязан свой корректирующий слой-маска «Уровни» в виде обтравочной маски.

    Привязываю корректирующий слой «Уровни» к слою с текстом. Для этого располагаю корректирующий слой выше, чем слой с текстом, кликаю слой «Уровни» ПКМ и выбираю «Создать обтравочную маску».
    Если все сделать правильно, то у слоя «Уровни» сбоку появится характерный значок со стрелкой
    Это означает, что этот корректирующий слой влияет только на нижележащий слой.

    После этого дублирую слой с текстом и привязанный к нему корректирующий слой. Для этого выделяю оба стоя, зажимаю клавишу «Alt» и ЛКМ и тяну оба слоя в окне «Слои» вниз до изменения курсора на двойную стрелку. Затем отпускаю ЛКМ и слои дублируются.

    Далее убираю видимость нижележащего слоя с текстом. Для этого нажимаю на значок глаза рядом со слоем. Корректирующий слой тоже скроется автоматически.

    Переходим к вышележащему слою с текстом. Кликаем по значку маски у данного слоя.

    Выбираю инструмент «Кисть» (автоматически должен выставиться черный цвет т.к. выбран режим маски) и стираю кистью весь текст, вид которого меня не устраивает. Если стерли лишнее, выбираете белый цвет на панели инструментов и восстанавливаете кистью те места, которые хотите вернуть.

    В этом и заключается принцип работы с маской. Черный цвет скрывает, а белый выявляет изображение. И всегда можно вернуть, то что скрыто.

    Далее делаю видимым второй слой с текстом. Захожу в настойки корректирующего слоя «Уровни» (для этого дважды кликаю ЛКМ по специальному значку рядом со слоем в панели «Слои») и меняю настройки так, чтобы фон становился светлее. Тот текст, что был в самом светлом месте не будет пропадать т.к. он дублирован на вышележащем слое.

    Дублирую второй слой вместе с обтравочной маской ниже и скрываю дубликат. Чтобы не запутаться в слоях, их можно переименовать так, как удобно вам.

    Перехожу на второй слой с текстом в режиме маски и скрываю все темные участки текста.

    Далее делаю видимым третий слой с текстом и повторяю тот же алгоритм:
    1) настраиваю корректирующий слой «Уровни»
    2) дублирую слой с текстом вместе с обтравочной маской и скрываю их
    3) перехожу на нужный нам слой с текстом в режиме маски и скрываю темные участки
    4) делаю видимым и перехожу на следующий слой с текстом

    Так делается до тех пор, пока весь текст не высветлится. После окончания этих действий всегда можно вернутся к любому слою и подправить как маску, так и корректирующий слой. В конечном итоге у меня получился вот такой результат.

    Шаг 7. Чистка (ретушь) текста
    Когда текст высветлен и вы полностью удовлетворены результатом, необходимо объединить все слои.

    После объединения изменить маски и корректирующие слои будет не возможно.

    Для объединения кликаю ПКМ любой слой и выбираем во всплывающем меню «Объединить видимые». Перед этим убедитесь в том, что не осталось скрытых слоев. В итоге получился один слой с текстом.

    Создаю новый слой-заливку «Цвет…» в панели «Слои». Выбираю белый цвет и располагаю его ниже слоя с текстом.

    Создаю новый корректирующий слой «Уровни…» в панели «Слои» все три маркера передвигаю в крайнее правое положение. Этот слой временный и нужен для выявления всех дефектов фона.

    Располагаю его выше слоя с текстом.

    Далее создаю маску у слоя с текстом и выбираем на панели инструментов инструмент «Кисть»

    Выбираю черный цвет (он должен выставиться автоматически) и начинаю удалять все дефекты изображения. Для регулировки размера кисти кликните ПКМ на любой участок изображения и появится соответствующая панель. Жесткость советую ставить на 100%.

    Если до этого во всех операциях можно было обойтись без планшета, то при ретуши добиться хорошего результата за разумное время при помощи мыши нельзя. Поэтому дальнейшая чистка производится только с помощью графического планшета.

    Чищу текст построчно, чтобы не сбиться и не возвращаться к тому, что уже сделал. Чищу как снаружи, так и внутри букв, иногда прорисовываю буквы, если какая-то часть неразборчива (черное пятно).

    Также иногда дублирую четкие буквы взамен нечитаемых. Но в пределах разумного.

    Вообще степень очистки зависит от важности документа и вашего энтузиазма. Как говорится лучшее – враг хорошего, поэтому лучше заранее определить степень качества ретуши, иначе можно делать эту работу бесконечно долго, особенно когда у вас несколько сотен страниц.

    После того как весь текст почищен удаляем корректирующий слой «Уровни» и объединяем оставшиеся слои. Сохраняем готовый документ в формате TIFF. Сохранять необходимо именно в этом формате, потому что постоянное пересохранение файла (что неизбежно) в данном формате не приводит к потере качества изображения, чего не скажешь о других форматах, например JPEG.

    Шаг 8. Подгонка страниц под единый формат
    При исправлении перспективы страниц неизбежно искажается соотношение сторон текстового блока.

    Поэтому после всех операций все страницы брошюры получились с разным соотношением сторон.

    Далее я подгоняю эти параметры под один размер.

    Для того, что бы найти исходное соотношение сторон, можно сопоставить страницу с текстом с тестовым вариантом, набранным похожим шрифтом, например «Old Standard». Или же просто выбрать станицу, подходящую на ваш взгляд в качестве образца, и по ее размерам отредактировать все остальные.

    Если же вы обрабатываете сканы, а не фотографии, то исправлять перспективу не требуется, так как при сканировании никаких искажений возникнуть не должно.

    Также необходимо сделать у всех страниц одинаковые поля с учетом вылетов под обрезку. Размеры верхнего и нижнего поля я беру, как в оригинале, боковые поля — исходя из размеров текстового поля и самой страницы.

    Все эти операции также провожу в программе «Adobe Photoshop». Создаю новый документ по размеру печатной страницы. В моем случае это 148,5*210 мм. Направляющими отмечаю границы вылетов и полей. Располагаю текстовый блок по этому шаблону и пересохраняю все страницы в новом размере.

    Пронумеровываю файлы согласно номеру страницы.

    На этом этапе нужно быть внимательным, так как количество строк на разных страницах может отличаться. Это нужно учитывать при расположении текстового блока относительно шаблона.

    Шаг 9. Создание готового PDF файла для печати
    После того, как все страницы готовы, объединяю их в PDF файл. Для этого выбираю инструмент Файл > Автоматизация > PDF-презентация…

    В открывшемся окне нажимаю кнопку «Обзор…» и выбираю все файлы страниц, которые хотим поместить в документ. Нажимаю ОК. Слева появился перечень файлов в том порядке, в котором они будут располагаться в документе. Параметры вывода оставляю без изменений, нажимаю «Сохранить».

    Выбираю папку для сохранения файла, нажимаю ОК. Открывается окно с параметрами сохранения PDF. Оставляю все без изменений, единственное — проверяю параметр «Качество изображения». Должно быть выбрано «Наилучшее». Нажимаю «Сохранить PDF». Автоматически начнут поочередно открываться все страницы документа. Не закрывайте программу, пока данная операция не завершится.

    На этом все. В итоге я получил PDF-файл, готовый для печати.

    Ссылка на основную публикацию
    Как снимали фильм кинг конг 1976
    Средняя оценка: 1976. США. 134 минуты. Жанр: боевик / драма / приключенческий. Режиссер: Джон Гиллермин.Продюсер: Дино Ди Лаурентис, Сценарий: Лоренцо...
    Как сделать диаграмму в кореле
    Конечно, в кореле эта задача решается менее эффектно, чем в илле, но всё-таки решается. Допустим, нам нужна круговая диаграмма, на...
    Как сделать многоуровневый список в excel
    В данной статье рассматривается методика быстрого создания многоуровневых (каскадных) выпадающих списков в Excel на основе умных таблиц для моделирования иерархических...
    Как следить за андроидом через айфон
    Статья будет полезна тем, кто хочет отследить за местоположение человека на карте, у которого на руках смартфон или планшет на...
    Adblock detector