Настройка параметров распознавания FineReader
Правильно установленные параметры распознавания помогут вам быстро получить качественный документ, пригодный для дальнейшего редактирования. Выбор параметров зависит не только от объема и сложности исходного документа, но и от последующего его использования.
Выбрать необходимые параметры вы можете на закладке Распознать диалога Опции (меню Сервис>Опции…).
Распознавание страниц, добавленных в документ ABBYY® FineReader®, выполняется в автоматическом режиме с текущими настройками программы. Вы можете отключить автоматический анализ и распознавание добавленных изображений на закладке Сканировать/Открыть диалога Опции (меню Сервис>Опции…).
Если вы изменили язык распознавания, выделили области на изображении вручную или изменили другие настройки программы, выполните распознавание вручную.
На закладке Распознать диалога Опции вы можете изменить настройки для следующих групп опций:
Режим распознавания. Выберите один из режимов распознавания. В ABBYY® FineReader® 10.0 предусмотрено два режима распознавания:
- Тщательное распознавание. Данный режим пригоден для распознавания как простых, так и к сложных документов. Например, для документов, содержащих текст на цветном фоне, или для документов, содержащих таблицы, в том числе таблицы без линий сетки и таблицы с цветными ячейками. Замечание. По сравнению с Быстрым режимом распознавания Тщательный режим требует больше времени, но обеспечивает лучшее качество распознавания.
- Быстрое распознавание. Данный режим рекомендуется для обработки больших объемов документов с простым оформлением и хорошим качеством печати.
Для выбора режима распознавания в группе Режим распознавания выберите одну из опций: «Тщательное распознавание» или «Быстрое распознавание».
Распознавание Таблиц. Выберите способ распознавания таблиц.
- Искать таблицы с явно заданными разделителями Включите данную опцию, чтобы только таблицы с черными разделителями были распознаны как таблица.
- В каждой ячейке таблицы не более одной строки текста Включите данную опцию, чтобы при распознавании в каждую ячейку таблицы помещалось не больше одной строки текста. Если данная опция отключена, ячейки таблицы могут содержать несколько строк текста, то есть быть многострочными.
Обучение. По умолчанию режим распознавание с обучением отключен. Для того, чтобы в процессе распознавания проводилось обучение неизвестным символам, отметьте опцию Распознавание с обучением. Распознавание с обучением используется для распознавания следующих текстов:
- для набора которых использованы декоративные шрифты;
- в которых встречаются специальные символы (например, отдельные математические символы);
- большого объема (более 100 страниц) текста плохого качества. При распознавании вы можете использовать встроенные эталоны или создать собственный эталон. Для этого выберите нужную опцию в группе Обучение.