Создание нового языка в FineReader
Процесс распознавания в программе ABBYY® FineReader® устроен таким образом, что в течение самого процесса программа опирается на знание о языке, указанном в качестве языка распознавания.
При обработке текстов, содержащих много неестественных конструкций, таких как, например, артикулы, увеличивается вероятность возникновения ошибок распознавания. Перед распознаванием подобного документа необходимо создать новый язык.
Для этого в меню Сервис выберите пункт Редактор языков…. После чего в диалоге Редактор языков нажмите кнопку «Новый…».
В открывшемся диалоговом окне установите переключатель в положение Создать новый язык на основе существующего и выберите язык, на основе которого планируете создать.
После нажатия кнопки «ОК» перед вами откроется диалоговое окно «Свойства языка». В этом окне необходимо определить все необходимые параметры и имя нового языка.
- В поле Базовый язык при этом будет указан язык, на основе которого вы создаете новый язык. В данном поле отображается язык, который вы выбрали в диалоге Свойства языка. В выпадающем списке вы также можно выбрать любой другой язык.
- В поле Алфавит языка указан алфавит языка, на основе которого вы создаете новый язык. Нажмите кнопку, чтобы отредактировать алфавит.
- Словарь, который будет использоваться системой при распознавании и проверке распознанного текста. Для выбора возможны следующие варианты:
- Нет, не подключать словарь к языку.
- Встроенный словарь. Здесь используется словарь, поставляемый с программой.
- Пользовательский словарь. Чтобы наполнить словарь или подключить старый пользовательский словарь или текстовый файл в Windows (ANSI)–кодировке (слова должны быть разделены пробелами или другими символам, не включенными в алфавит), нажмите кнопку Свойства…
В качестве замечания необходимо отметить, что при проверке орфографии словарные слова пользовательского языка не выделяются, если в тексте они встретились в том виде, в котором они заданы в словаре, или в стандартном виде: всеми маленькими, всеми большими буквами, с большой буквы.