По долгу службы приходится обрабатывать большое кол-во бумажных документов.
Разные отделы мне приносят копии заключенных договоров.
Далее на основе этих договоров я формирую ежеквартальные отчеты.
Естественно встал вопрос автоматизации этого процесса.
Как сделать так чтобы поменьше делать?
Решение было следующим:
1. Сканировать документы в папку;
2. Распознавать каждый документ в FineReader с конвертацией в PDF;
3. Сохранять PDF документы по целевым каталогам;
4. В файле отчета (формат MS Excel) макросом подтягиваем из каталога новые документы с созданием гиперссылки на него.
После этого в файле отчета в отдельных строках стоят отдельные документы. Остается только нажимать на гиперссылку документа. Документ уже распознанный. Можно просто в нем выделять куски текста и забирать их в отчет. Таким образом извлечение данных из документов становится простым делом.
Итак в этой статье покажу, как происходит процесс распознавания документа за минимальное время.
Переходим в папку со сканированными документами. И на очередном файле сканированного документа (обычно в формате TIF или PDF) жмем правую кнопку мыши для вызова контекстного меню и выбора соответствующего пункта.
FineReader начнет процесс распознавания и передачи результата в формате PDF.
Далее распознанный файл откроется в обработчике PDF.
Теперь останется только сохранить его в целевой папке.
Таким образом на нашем диске будет сохранен распознанный скан документа.
Причем можно будет осуществлять поиск внутри документа.
На следующем изображении можно видеть список из множества файлов.
А вот как это все уже будет выглядеть в файле отчета. Для каждого файла есть гиперссылка (макрос новые файлы из каталога выбрал). Достаточно на нее нажать и файл откроется.
Надеюсь эта методика поможет многим оптимизировать и ускорить свою работу.
Удачи.
Комментариев нет:
Отправить комментарий