А.В. Ермоленко
Актуальные вопросы судебно-психологической экспертизы и комплексной экспертизы с участием психолога. Перспективы научного и прикладного исследования почерка. Сборник материалов III международной научно-практической конференции // Под ред. В.Ф. Енгалычева, Е.В. Леоновой Калуга, 16–19 мая 2019 г. – Калуга: Издво КГУ им. К.Э. Циолковского, 2019. – 210 с.
Современная наука располагает большим объёмом знаний, позволяющих профессиональному эксперту-криминалисту решать задачу идентификации почерка с высокой степенью достоверности. В силу судебной направленности данная работа является прецизионной, трудоёмкой и требующей профессиональной специальной техники (Куприянова, 1992). Вместе с тем, существует ряд прикладных задач по превентивному недопущению принятия решений по фальсифицированным рукописным документам, к примеру, в сфере оказания государственных услуг. Одной из сфер деятельности таких услуг является государственная охрана частного имущества.
Специфика охраны имущества посредством охранных сигнализаций, выведенных на пульты централизованного наблюдения, в целях аутентичности и юридической ответственности предполагает представление документов исключительно в рукописной форме. Объём представляемых документов по услугам охраны значителен, и установление подлинности документа является важным, но не позволяет задействовать дорогостоящую специальную судебную технику и экспертов-графологов. Актуальным является вопрос разработки и внедрения программного обеспечения, позволяющего оператору, не являющемуся профессионалом в области графологии, быстро и достаточно достоверно дать оценку о подлинности рукописного документа (Ермоленко, 2007), а в идеале и о его поисково-установочных особенностях (Chernov, 2018).
Классическая схема компьютерной графологической экспертизы почерка сводится к двум главным фазам: раздельный и сравнительный анализ почерка. Переходя на язык ЭВМ, раздельный анализ представляет собой выделение числовых характеристик рукописного текста (предобработка образа), а сравнительный анализ является непосредственным этапом принятия решения.
Выполним исследование подписей и рукописных записей в том числе по копиям документов
Задачи архитектуры прикладной системы идентификации автора почерка
1. Предобработка визуального образа. На данном этапе из сканированного растрового изображения рукописного текста выделяются наиболее характерные признаки, являющиеся уникальными для каждого автора. При этом всё множество характеристик рукописного текста может быть разделено на два направления для исследований:
-
общетекстовые или строковые характеристики текста;
-
символьные характеристики букв и их соединений.
2. Передача формализованного описания образа в блок принятия решений. Здесь осуществляется преобразование числовых характеристик рукописного текста к формализованному виду и передача этих значений в нейросетевой или нечёткий решатель.
3. Принятие решения. Принятие решения осуществляется нейросетевой или нечёткой системой принятия решения заранее обученной соответствующей обучающей выборкой. Итоговое решение принимается путём обобщения по обеим группам параметров на выходе нечёткого решателя.
Рис. 1. Схема обработки образа рукописного текста при компьютерной идентификации автора почерка
Левая ветка схемы принятия решений о подлинности почерка подразумевает детерминацию основных геометрических характеристик текста и их формализацию. В рамках предлагаемого подхода предлагается к изучению 10 геометрических характеристик, таких как углы наклона букв и строк, их минимаксные значения, соотношение длин пробелов к строкам и словам в статике и динамике и другие статистические показатели, восстанавливаемые ЭВМ по классическим алгоритмам обработки неструктурированных растровых изображений.
Правая ветка схемы подразумевает детерминацию характеристик, трудно различимых человеком, но легко анализируемых машиной, таких как межсимвольные соединения букв. Предлагаются к накоплению базы данных о характеристиках петлевых соединений, прямых штрихов окончаний букв, 3-х и 4-х лучевых соединений. Детерминация самих букв и слов из общего образа текста осуществляется механизмами общестрокового анализа из левой ветки характеристик.
Блок принятия решений построен как синтез нейронной сети обратного распространения ошибки с квазиньютоновским алгоритмом обучения (BFGS-формулы) и решающего устройства на нечёткой логике по Мамдани. В предлагаемой концепции принятие решения по группам параметров (левая – строковая и правая – символьная) производится нейронной сетью, а общее решение – нечёткой логикой.
Рассмотрим особенности алгоритмов выделения и формализации отдельных характеристик почерка вначале для определения углов наклона букв и строк. Для работы алгоритмов предлагается механизм «виртуальных линеек» (Ермоленко, 2007). Геометрической интерпретацией алгоритма является перемещение линейки под различным углом наклона с целью поиска максимально совпавших точек написания символов. Применительно к ЭВМ, в канве текстового изображения ищется «линейка», на пересечении с которой находится максимальное количество чёрных пикселей (фрагментов буквы). Угол отклонения линейки от вертикали образует угол наклона букв. При функционировании алгоритма вводится ограничение по максимальному углу наклона буквы a_max=h, где h – высота исследуемой буквы, a_max – максимальное отклонение линейки (рис. 2).
Рис. 2. Алгоритм определения угла наклона букв
Анализ траектории строки реализован в два этапа. На первом (технологическом) этапе определяется только средняя линия написания строки и её угол наклона. Технологический угол наклона строк необходим как величина коррекции почерка по горизонтали при выделении слов и строк для детального анализа. Значение угла определяется на основании теоремы об углах между параллельными прямыми, как
где i показывает отклонение рассматриваемого пикселя от правой (левой) границы строки. Для значения вертикального отклонения x оно служит индексом. Изменяя значения i от 0 до L с шагом 1, получаем a-ю базовую линейку с отклонением от вертикали a по катету максимального для такого отклонения прямоугольного треугольника (рис. 3).
Рис. 3. Алгоритм определения угла наклона букв
Переход от растрового изображения почерка к его составным элементам решён пороговой кластеризацией образа рукописного текста (Бондаренко, 2003) последующей фильтрацией, генерацией краевых виртуальных столбцов и повторной фильтрацией с учётом виртуализации. Заключительным этапом обработки кластеризованного изображения рукописного текста является аппроксимация траектории написания строки и формализация характеристик почерка левой ветки схемы, указанной на рис. 1, а также детерминация слов и букв для тонкого межсимвольного анализа правой ветки той же схемы. Кластеризация проводится по столбцам, ширина которых не превышает l ≤ k ≤ L , где k составляет от 1 до 7%, а L – ширина всего изображения.
Рис. 4. Результат работы алгоритма кластеризации
По окончании генерации краевых виртуальных столбцов аппроксимацию траектории строки достаточно выполнить методом наименьших квадратов 1-го порядка, получив матрицу размерности m*n, где m – неизвестное заранее и определяемое в процессе кластеризации количество строк в тексте. Каждый элемент этой матрицы представляет собой координаты центра кластера по x и по y.
Для хранения параметров линий написания строк создаётся двупольная структура длиной m, для которой необходимо находить отличную от нуля невязку Δi=уi-bxi-c с параметрами b и c такими,чтобы сумма квадратов разностей была наименьшей, т.е. требуется обратить в минимум выражение:
Дифференцирую функцию невязки по неизвестным параметрам b и c, и, приравнивая производные к нулю, получаем следующую систему уравнений:
Система (4) есть система двух линейных уравнений относительно неизвестных параметров b и c, решая которую методом последовательного исключения получаем значения коэффициентов m-й строки (Пупков, Егупов, 2004):
Получение геометрической формализации строки позволяет перейти к пошаговому анализу слов текста, детерминировать пробелы и провести их статистический анализ как по средним, так и по минимаксным величинам и перейти к тонкому межсимвольному анализу элементов отдельных букв.
Для формализации особенностей написания символа автором используется кодирование символов трапециями с динамически изменяемыми основаниями с последующим переходом к неориентированному графу. Анализ вершин графа позволяет перейти к матрице и списку смежности кодированного математически символа, определить вспомогательный список. Выход сокращённого вспомогательного списка показывает координаты и углы четырёх межсимвольных характеристик, таких как прямой штрих, петлевые соединения, 3-х и 4-х лучевые соединения букв (рис. 5).
Рис. 5. Кодирование символов и детерминация углов 3-х лучевых соединений
При построении решающего устройства на основе технологий искусственного интеллекта в качестве обучающей и тестирующей выборки используется не матрица прямых входов параметров почерка, а матрица разностей значений между ними, что позволяет в N-1 раз (где N – число образцов почерка в выборке) увеличить размер обоих выборок.
Размерность обучающей выборки (6) составляет
где М – число признаков; N – число образцов.
Изучение свойств различных топологий нейронных сетей и алгоритмов их обучения (Комарцова, 2004) применительно к предложенной схеме накопления входной признаковой базы характеристик почерка позволила прийти к выводу, что оптимальным по качеству ошибки обобщения и обучения, а также скорости сходимости является квазиньютоновский алгоритм обучения нейронной сети обратного распространения ошибки, функционирующий в тандеме с блоком принятия итогового решения нечёткой логикой с выходной функцией принадлежности по Мамдани.
В заключении стоит отметить, что представленный выше подход к компьютерной детерминации характеристик почерка реализован в прототип программного комплекса и подтверждает принципиальную возможность проведения превентивной компьютерной экспертизы входящих рукописных документов в кратчайших срок и с достоверностью, приемлемой для больших социально-экономических систем, оперирующих с большим массивом аутентичных рукописных документов.
Список литературы:
1. Куприянова А.А. Теоретические основы и методика судебно-почерковедческих исследований. Автореферат кандидатской диссертации. М.: Изд-во НИИ МВД, 1992. 58 с.
2. Ермоленко А.В., Козличенков А.А., Корлякова М.О. Разработка модели предметной области для анализа идентичности почерка. Научная сессия МИФИ 2007. IX Сборник научных трудов. В 17 томах. Т. 3. Интеллектуальные системы и технологии. М.: МИФИ, 2007. С. 164-166.
3. Бондаренко А.В., Галактионов В.А., Горемычкин В.И., Ермаков А.В., Желтов С.Ю. Исследование подходов к построению систем автоматического считывания символьной информации. М.: ИПМ им. М.В. Келдыша РАН, 2003. 217 с.
4. Методы классической и современной теории автоматического управления: Учебник в пяти тт.; 2-е издание изд., перераб. и доп. Т. 5.: Методы современной теории автоматического управления / Под ред. К.А. Пупкова, Н.Д. Егупова. М.: Издательство МГТУ им. Н.Э. Баумана, 2004. 744 с.
5. Комарцова Л.Г., Максимов А.В. Нейрокомпьютеры: Учеб. пособие для вузов. 2-е изд., перераб. и доп. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. 400 с.
6. Chernov Y., Engalychev V. Formal handwriting analysis as an instrument for forensic and criminal psychology // Armenian journal of mental health: Current issues of forensic psychology. 2018 (9). № 1, pp. 140-143.