|
|
Обзор подготовлен
С помощью решения ABBYY были автоматизированы ввод и обработка бланков при проведении переписи населения в Таджикистане. В результате срок обработки данных сократился почти в 3 раза.
Первая перепись населения Таджикистана была проведена Агентством по статистике при президенте Республики Таджикистан в 2000 г. Полученные в ходе первой переписи населения данные обрабатывались вручную. При этом на ввод всего объема информации потребовалось более 1,5 лет.
Вторая перепись населения и жилищного фонда Таджикистана была намечена на сентябрь 2010 г. Учитывая уже имеющийся опыт, руководство Агентства по статистике сочло необходимым воспользоваться решением по автоматизированному вводу информации с бланков путем их сканирования и автоматического распознавания.
Подготовка ко второй переписи населения Республики Таджикистан началась за несколько лет до старта кампании. Финансирование осуществлялось государством, а само мероприятие проводилось по рекомендации Конференции европейских статистиков по проведению переписей населения и жилищного фонда.
Для автоматизированного ввода информации с бланков было выбрано решение ABBYY FormReader. С его использованием в 2008 г. осуществили пробную перепись населения, и результаты полностью оправдали ожидания.
Вторая национальная перепись населения и жилищного фонда Республики Таджикистан прошла в несколько этапов при финансировании из средств государственного бюджета, при поддержке Всемирного Банка и Фонда ООН в области народонаселения (ЮНФПА). Обход домохозяйств и заполнение бланков переписи проводили с 21 по 30 сентября 2010 года. А непосредственное сканирование и ввод данных начали в феврале и полностью завершили в сентябре 2011 года.
Для автоматизации процесса проведения переписи была выбрана последняя версия ABBYY FormReader – система ABBYY FlexiCapture. Это решение оптимально для реализации крупного проекта, в ходе которого десятки тысяч документов проходят ежедневную обработку, и в процесс вовлечены сотни операторов.
Сотрудники Агентства по статистике при президенте Республики Таджикистан и специалисты ABBYY отладили общую систему обработки данных – от регистрации портфелей переписчиков до создания выходных статистических таблиц. Были подготовлены более 200 рабочих мест для кодировщиков и операторов, налажено взаимодействие с существующей инфраструктурой и базами данных, а также проведено обучение временного персонала. Особое внимание уделили созданию дополнительных алгоритмов и правил для повторной проверки заполнения данных на бланках и их комплектности. Кроме того, специально для этого проекта в ABBYY разработали 12 видов бланков на двух языках – таджикском и русском.
Внедрение решения ABBYY FlexiCapture освободило операторов от ручного набора текста, оставив только задачу контролировать правильность ввода данных. Это позволило значительно увеличить скорость ввода и обработки информации: если в ходе прошлой переписи при ручном методе ввода данных один оператор вводил в день в среднем 500 бланков, то при использовании системы ABBYY этот показатель возрос до 1500.
«При выборе подрядчика мы остановились на ABBYY, потому что в этой компании нам не только предложили программный комплекс для качественной обработки данных переписи населения Таджикистана и поделились опытом аналогичных проектов, но и обеспечили полную техническую поддержку всего проекта, - комментирует Бахтия Мухаммадиева, директор Агентства по статистике при президенте Республики Таджикистан. - Эффект от внедрения системы оказался впечатляющим – нам удалось в кратчайшие сроки и с минимальными затратами завершить обработку 13 млн односторонних и двусторонних бланков, получив достоверные и полные данные».
В общей сложности в процессе второй переписи населения в Таджикистане ввод и обработка информации заняла около 8 месяцев, тогда как тот же объем работ при ручном вводе данных занял 18 месяцев. Кроме того, значительно сократилось количество ошибок, которые допускали при ручном вводе данных. Все обработанные данные хранятся в электронном виде в архиве.