|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
24.02.2018, 09:38 | #1 |
Форумчанин
Регистрация: 02.02.2009
Сообщений: 842
|
Распознование скана паспорта
По работе нам часто нужно вводить паспортные данные. При этом в большинстве случаев у нас есть скан паспорта. Вот подумалось, а почему нельзя распознать данные со скана? Тем самым уменьшить человеческий труд.
Вопрос: 1. Существуют ли реализации такой возможности где либо? Нужно как минимум для образца. 2. Может есть уже созданные алгоритмы. И можно получить да же исходный код или хотя бы описание. (а вдруг). 3. Может будут советы и рекомендации по теме. Как и чем это лучше осуществить, как и что использовать и т.п.
С уважением, Алексей.
|
24.02.2018, 10:05 | #2 |
Форумчанин
Регистрация: 09.05.2017
Сообщений: 736
|
Ну машинописный текст же можно уже давно распознавать - ABBYY FineReader. А какой текст-то вообще: машинописный или от руки? Да и ручной текст тоже можно разобрать - см. стандартную программу в Windows.
Напишу программу на C++ и Asm для AVR. Черчение: sergeisky@yahoo.com.
Последний раз редактировалось Cuprum5; 24.02.2018 в 10:08. Причина: Добавил про ручной текст. |
24.02.2018, 11:14 | #3 |
Лис
Старожил
Регистрация: 18.09.2015
Сообщений: 2,409
|
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал . |
24.02.2018, 11:14 | #4 |
Старожил
Регистрация: 12.01.2011
Сообщений: 19,500
|
Ушел с форума, https://www.programmersforum.rocks, alex.pantec@gmail.com, https://github.com/AlexP11223
ЛС отключены Аларом. |
24.02.2018, 11:17 | #5 |
Старожил
Регистрация: 04.02.2011
Сообщений: 4,551
|
Смотря что нужно разобрать. Если фотоморду по базе данных злодеев - то это к ФСБ. Если текст, действительно, FineReader - на раз. А если только инд. номер - не знаю, как у вас, у нас в РБ он пробит точками по краю листа паспорта, его даже без сканера можно, создав простейшую считку. Я предлагал такую хрень при разработке системы для голосования - сказали: Нэ нада !
Pavia - очень познавательная инфа. Не знал. Последний раз редактировалось digitalis; 24.02.2018 в 11:20. |
24.02.2018, 12:38 | #6 |
Форумчанин
Регистрация: 02.02.2009
Сообщений: 842
|
В данном случае нужно распознать текст. Распознать сам текст не проблема, как минимум печатный. НО ИМХО проблема как подготовить скан к распознаванию, так не известно в каком месте листа будет паспорт, угол его поворота, две или одна страница на листе.
ИМХО самое сложное.
С уважением, Алексей.
|
24.02.2018, 14:00 | #7 | |
Лис
Старожил
Регистрация: 18.09.2015
Сообщений: 2,409
|
Цитата:
И так же с поворотом классифицируешь буквы на значение поворота. С двумя так же классифицируешь по буквам и размеру текста. База(dataset) из 10 000 сканов паспортов надеюсь имеется?
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал . |
|
24.02.2018, 14:16 | #8 | |
Форумчанин
Регистрация: 02.02.2009
Сообщений: 842
|
Цитата:
С уважением, Алексей.
|
|
24.02.2018, 14:21 | #9 | |
Форумчанин
Регистрация: 02.02.2009
Сообщений: 842
|
Цитата:
Есть старых старых договор ) Но не столько к сожалению.
С уважением, Алексей.
|
|
24.02.2018, 17:28 | #10 |
Лис
Старожил
Регистрация: 18.09.2015
Сообщений: 2,409
|
tae1980
Тогда проще как в сбере проработать интерфейс ввода паспортных данных. Контекстная справка значительно ускоряет ввод. У меня оператор паспортные данные ввёл секунд за 20. Когда как со сканером у вас будет столько же если не больше, пока оператор повернётся до сканера пока отсканирует это 10-15 секунд, а потом ещё распознавание 3-5 и проверка данных. Причем проверку должен делать человек, а это 3-60 секунд. А ещё не забывайте, что паспортные данные нужно обновлять. Плюс качество распознавания. Текстовые документы они имеют стандартный шифр, поворот размер там качество высокое 99٫95% вернее 5 на 10000 символов. А тут нет стандартов нет однородных символов, всё разнородно. Поэтому не несомненно качество ниже может 2 из 1000, а может и того хуже 3 из 100. В любой нормальной библиотеке есть такие функции. А вот Тут только направления. А вот алгоритмы надо прорабатывать искать думать самому. И обязательно идеи проверять на наборе заранее подготовленных данных - датасете. Потому что работает на 1 фотографии не обязано работать на других. А если на одной плохо работает зато набору можно разделить на 2 класса и уже снизить процент не удач.
Хорошо поставленный вопрос это уже половина ответа. | Каков вопрос, таков ответ.
У дзен программиста программа делает то что он хотел, а не то что он написал . |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Распознавание паспорта РФ | Ципихович Эндрю | Фриланс | 2 | 10.04.2017 09:47 |
Заказчик просит выслать ему скан паспорта | TwiX | Свободное общение | 22 | 03.11.2011 18:54 |
Возможен ли отлов ошибок "чужих" программ без скана экрана на предмет окон-ошибок? | Человек_Борща | Общие вопросы Delphi | 4 | 21.04.2011 00:18 |
Распознование номера паспорта. | Herly | Общие вопросы Delphi | 4 | 31.08.2010 09:36 |
Распознование пятен | Yusya | Помощь студентам | 1 | 04.03.2009 16:27 |