пятница, 27 марта 2015 г.

Обработка документов после сканирования

По долгу службы приходится обрабатывать большое кол-во бумажных документов.

Разные отделы мне приносят копии заключенных договоров.

Далее на основе этих договоров я формирую ежеквартальные отчеты.

 

Естественно встал вопрос автоматизации этого процесса.

Как сделать так чтобы поменьше делать?

Решение было следующим:

1.       Сканировать документы в папку;

2.       Распознавать каждый документ в FineReader с конвертацией в PDF;

3.       Сохранять PDF документы по целевым каталогам;

4.       В файле отчета (формат MS Excel) макросом подтягиваем из каталога новые документы с созданием гиперссылки на него.

После этого в файле отчета в отдельных строках стоят отдельные документы. Остается только нажимать на гиперссылку документа. Документ уже распознанный. Можно просто в нем выделять куски текста и забирать их в отчет. Таким образом извлечение данных из документов становится простым делом.

 

Итак в этой статье покажу, как происходит процесс распознавания документа за минимальное время.

 

Переходим в папку со сканированными документами. И на очередном файле сканированного документа (обычно в формате TIF или PDF) жмем правую кнопку мыши для вызова контекстного меню и выбора соответствующего пункта.

 

 

 

FineReader начнет процесс распознавания и передачи результата в формате PDF.

 

 

Далее распознанный файл откроется в обработчике PDF.

 

 

Теперь останется только сохранить его в целевой папке.

 

 

Таким образом на нашем диске будет сохранен распознанный скан документа.

Причем можно будет осуществлять поиск внутри документа.

 

На следующем изображении можно видеть список из множества файлов.

 

 

А вот как это все уже будет выглядеть в файле отчета. Для каждого файла есть гиперссылка (макрос новые файлы из каталога выбрал). Достаточно на нее нажать и файл откроется.

 

 

Надеюсь эта методика поможет многим оптимизировать и ускорить свою работу.

Удачи.

 

Комментариев нет:

Отправить комментарий