Купин А.Ф., Коваленко А.С. К вопросу о возможностях применения систем искусственного интеллекта при криминалистическом исследовании документов и их реквизитов // Теория и практика судебной экспертизы. 2023. Т. 18. № 4. С. 28–35. https://doi.org/10.30764/1819-2785-4-28-35
Введение
Системы искусственного интеллекта находят применение в различных сферах человеческой деятельности, таких как медицинские технологии, научные исследования, банковская деятельность, разработка систем вооружения и безопасности и тому подобное. Не является исключением и судебная экспертиза, требующая постоянного внедрения новых технологий, отвечающих требованиям и вызовам современного общества и способных решать задачи судебной экспертизы в реалиях непрерывного развития науки и техники.
Идея создания и использования систем, способных имитировать когнитивные функции человека при анализе больших объемов данных и решении сложных аналитических задач возникла с появлением вычислительных машин, которые впервые были описаны в 1936 году Аланом Тьюрингом (Alan Turing). Одним из первых термин «искусственный интеллект» использовал исследователь Джон Маккарти (John McCarthy) на организованной им конференции в Дартмутском университете в 1956 году [1, с. 22].
Особая важность развития и внедрения технологии искусственного интеллекта подчеркивается в утвержденной Президентом РФ в октябре 2019 года Национальной стратегии развития искусственного интеллекта до 2030 года. В соответствии с документом под искусственным интеллектом следует понимать комплекс технологических решений, позволяющий имитировать когнитивные функции человека (включая самообучение и поиск решений без заранее заданного алгоритма) и получать при выполнении конкретных задач результаты, сопоставимые, как минимум, с результатами интеллектуальной деятельности человека. Аналогичное определение приводится в ГОСТ Р 59276-2020 «Системы искусственного интеллекта. Способы обеспечения доверия. Общие положения».
Выполним исследование документов на наличие признаков монтажа.
Применение систем искусственного интеллекта для решения задач почерковедческой и техникокриминалистической экспертизы документов
Применительно к вопросам, возникающим в процессе осуществления правоохранительной деятельности, можно выделить следующие основные группы задач, при решении которых представляется эффективным использование технологий искусственного интеллекта:
-
идентификация;
-
предсказание;
-
выявление.
В качестве примера задач первой группы можно привести решение вопроса об отнесении подписи к подложным или подлинным в результате проведения идентификации исполнителя.
Задачи предсказания связаны с прогнозированием значений зависимой переменной на основе одной или нескольких независимых (предикторных) [2, c. 639]. То есть они подразумевают определение на основе анализа статистических данных будущих состояний определенной системы или ее отдельных показателей, например роста или снижения преступности в регионе, мест сокрытия трупов или места нахождения преступника [3, c. 5]. Так, А.А. Бессоновым была описана система, позволяющая с определенной точностью прогнозировать расстояние от места преступления до места жительства преступника, его возраст, наличие психического заболевания и судимости, а также некоторые другие характеристики [4, с. 48–51].
Третья группа задач связана с выявлением структуры закономерностей, позволяющих осуществлять идентификацию и прогнозирование [2, c. 639; 5, с. 64].
Одним из актуальных и перспективных направлений применения искусственного интеллекта в судебной экспертизе представляется исследование документов. В частности, системы искусственного интеллекта могут быть использованы для сравнения подписей и фрагментов рукописных записей в разных документах с целью установления фактов выполнения их одним либо несколькими исполнителями. Обусловлено это в первую очередь тем, что в случае появления сомнений в их подлинности по причине различия общих и частных признаков (наклона, размера, формы отдельных элементов и пр.) проверка занимает длительное время и требует применения специальных знаний. К тому же установить факт подделки подписи (рукописной записи) другим лицом либо выполнения ее непосредственно самим исполнителем, от имени которого она значится, удается не всегда. К этому приводит ряд причин: относительная краткость и (или) простота конструктивного строения исследуемой подписи (рукописной записи); различия в условиях выполнения изучаемой подписи (рукописной записи) в исследуемом документе (например, в состоянии возбуждения, стресса, алкогольного опьянения и др.) и сравниваемых образцах; искажения признаков в исследуемых почерковых объектах, связанных, например, с обстоятельствами воспроизведения подписи (рукописной записи) с подражанием почерку другого лица и т. д.
Не теряет актуальности исследование документов прошлых лет, которые заполнялись исключительно рукописным способом, но со временем частично утратили свое содержание под воздействием факторов внешней среды, а также иных причин (особенностей манеры письма, проявляющейся в рукописи в виде частично не дописываемых либо не читаемых штрихов отдельных букв и цифр, а также использования вариантов букв, отличных от норм прописи и т. д.). Поэтому представляется актуальным использование технологий искусственного интеллекта для распознавания содержания рукописных текстов, фрагменты букв и цифр которых частично не дописаны либо искажены в силу естественных или искусственных причин. Кроме того, некоторые задачи криминалистики и судебной экспертизы, для решения которых могут быть использованы технологии искусственного интеллекта, были приведены Д.В. Бахтеевым [6, с. 46; 7, c. 70], который в их числе выделяет возможность автоматизации выявления признаков подлога документов.
Понятие и основные виды архитектуры нейронных сетей
Наиболее эффективным способом организации искусственного интеллекта являются искусственные нейронные сети. Они имитируют работу человеческого мозга, представляя собой его упрощенную модель. При этом важно понимать, что это абстрактные модели, созданные для решения каких-либо задач, а не попытка приблизиться к реальной структуре мозга человека и понять его работу [8, c. 24].
Под нейроном в искусственной нейронной сети понимается вычислительная единица, проводящая вычисления на основе входной информации и передающая полученный результат на вход следующего слоя или на выход сети. В зависимости от положения в структуре сети выделяют входные, скрытые и выходные нейроны. Связь между нейронами называется синапсом и характеризуется таким параметром, как синаптический вес, на основании значения которого обрабатывается входная информация. Таким образом, информация в искусственной нейронной сети передается между нейронами, а структура и вес связей между ними определяют ее поведение [9, с. 7; 10, c. 1333].
Несмотря на существование множества вариантов архитектуры нейронных сетей, это направление научных исследований находится в состоянии непрерывного развития, в связи с чем постоянно появляются их новые виды. Наиболее полная классификация была составлена исследователями Института Азимова (The Asimov Institute) [11]. Отметим, что многие из представленных в классификации нейронных сетей используются для решения специфических задач и не имеют широкого применения. К их наиболее распространенным видам относят следующие.
1. Сети прямого распространения (feed forward neural networks, FFNN) [12, c. 403].
2. Многослойные сети или перцептроны (perceptrons, P) [12, c. 389].
3. Рекуррентные сети (recurrent neural networks, RNN) [13, c. 184].
4. Сверточные сети (convolutional neural networks, CNN) [14, c. 2283].
Для судебной экспертизы, в частности при исследовании документов, наибольший интерес представляют сверточные нейронные сети, так как именно этот класс архитектур используется при решении задач, связанных с обработкой изображений.
Принцип работы сверточных нейронных сетей
Сама концепция сверточной сети заим- ствована из области исследований зрительной коры головного мозга и основывается на принципах работы биологической зрительной системы [8, с. 177]. Информация с сетчатки глаза доходит до мозга через зрительный нерв, который входит в таламус – отдел мозга, обрабатывающий информацию от органов чувств, где происходит первичная обработка информации, которая затем поступает в зрительную кору [8, c. 178].
Зрительная кора делится на несколько зрительных зон, отличающихся друг от друга архитектурой, физиологией и функциональной специализацией (рис. 1). Именно такая система нашла отражение в сверточных нейронных сетях: на высоких уровнях выделяются общие абстрактные признаки, на нижних – более конкретные.
Рис.1. Зоны зрительной коры головного мозга
Помимо строгих иерархических связей в рассматриваемой системе присутствуют непоследовательные связи между зонами (например, информация из зоны 1 передается не только в зону 2, но и в зону 5), что используется при построении сверточных сетей. Также в таких системах существует обратная связь – передача сигнала от высоких уровней к более низким [9, с. 180].
Аналогично принципам работы зрительной системы сверточная нейронная сеть работает с небольшими участками считанного изображения. Его входной сигнал подается на вход нейрона в пределах ограниченной области заданного размера, после чего выделенная область смещается на заданный шаг и новый фрагмент подается на вход второго нейрона группы [8, с. 1843; 15, c. 679]. Так происходит сканирование всего изображения, каждый фрагмент которого подается на соответствующий нейрон. Весовые коэффициенты в пределах одной группы одинаковые.
Далее обозначенный процесс сканирования повторяется для каждой группы нейронов сверточного слоя. В пределах одного слоя эти группы идентичны и различаются только весовыми коэффициентами. Значение, получаемое на входе нейрона, вычисляется по формуле:
где:
α, β - коэффициенты смещения,
n - размер окна сканирования,
xi,j - входной сигнал,
ω - весовой коэффициент,
h - шаг сканирования.
Такая формула называется сверткой. Матрица весовых коэффициентов каждой группы нейронов называется ядром фильтра, которое позволяет выделять характерные признаки на изображении. То есть нейроны каждой группы активизируются тогда, когда на участке изображения появляется фрагмент, подходящий под их ядро фильтра. В результате на выходе формируется набор карт признаков или каналов, значимые величины в каждой из которых показывают наличие того или иного признака в определенном месте изображения.
Выходное значение для карт признаков вычисляется по формуле:
где:
f() - функция активации,
Yα,β - сумма на входе соответствующего нейрона (1).
Для сверточных сетей в качестве функции активации как правило используется гиперболический тангенс:
где:
x – входное значение;
e - экспонента.
Далее карты признаков передаются на вход следующего слоя нейронов, который, обрабатывая полученные данные, проводит их обобщение, выделяет геометрические фигуры и различные пересечения. Последующие слои работают по аналогичному принципу: принимают на вход многоканальные изображения и выделяют в них общие признаки.
Помимо сверточных слоев, в нейронной сети могут быть pooling слои, которые применяются для сжатия карт и выделения самых значимых из них. Общая схема работы сверточной нейронной сети представлена на рисунке 2.
Рис. 2. Общая схема работы сверточной нейронной сети
В случае если осуществляется обработка изображения, представленного в цветовой модели RGB, каждая цветовая компонента обрабатывается отдельным фильтром.
К выходному слою сверточной сети для дальнейшей обработки информации, как правило, добавляется сеть прямого распространения или перцептрон [12, c. 389]. Такие сети называются глубокие сверточные сети (deep convolutional neural networks, DCNN).
Таким образом, сверточные нейронные сети состоят из двух видов слоев: сверточные (convolutional) и субдискретизирующие (subsampling, подвыборка), которые, чередуясь между собой, формируют входной вектор признаков для следующей сети [14, с. 2285].
Особенности разработки и применения систем искусственного интеллекта для криминалистического исследования документов и их реквизитов
Как следует из формулы (1) и рассмотренного принципа работы сверточной нейронной сети, одним из основополагающих факторов, определяющих результат вычисления, является правильная настройка весовых коэффициентов, которая осуществляется с помощью методов машинного обучения.
Машинное обучение используется для настройки параметров работы сети и повышения ее точности и представляет собой алгоритмы поиска правил преобразования данных в заранее заданном пространстве гипотез с использованием в качестве обратной связи уже известного результата [3, c. 638]. Суть машинного обучения заключается в том, что исследователь вводит данные и ожидаемые от их обработки ответы и получает правила, уже применимые к новым данным для получения оригинальных ответов [16, с. 210].
Таким образом, разработка нейронной сети включает в себя подбор тестовых и обучающих наборов данных – датасетов (dataset) – для обучения спроектированной модели сети, в результате которого происходит настройка и корректировка ее параметров. При создании тестовых и обучающих наборов данных должны учитываться особенности той предметной области, для которой создается нейронная сеть, поэтому при разработке такого программного обеспечения необходимо использование не только знаний специалистов в области технологий искусственного интеллекта, но и специальных знаний эксперта. Именно эксперт, являясь специалистом в предметной области, для которой разрабатывается программное обеспечение, может оказать продуктивное содействие при подборе обучающих и тестовых наборов данных и дать грамотную оценку полученным результатам. В этой связи на этапе разработки нейронной сети представляется целесообразным привлечение экспертов, обладающих соответствующими специальными знаниями в тех родах экспертиз, для решения задач которых создается программное обеспечение.
Именно от правильной настройки параметров нейронной сети на начальных стадиях ее построения зависит точность получаемых результатов. В этой связи особую важность приобретает предоставление грамотно подобранных наборов данных. Так, при создании тестовых и обучающих наборов данных важно проконтролировать, чтобы включаемые в них данные были непротиворечивы и отражали общие и частные признаки анализируемых объектов.
Еще одним существенным фактором является количество входящих в набор объектов. В качестве приемлемого количества однотипных изображений для формирования базы для обучения и тестирования нейронной сети специалистами по сбору и анализу больших данных приводится значение 80 000.
Как уже было замечено, при подготовке наборов данных важное значение имеет специфика предметной области, для которой разрабатывается программное обеспечение. Например, для обучения нейронной сети, задачей которой является сравнение подписей с целью установления фактов их выполнения одним либо несколькими исполнителями, в качестве объектов, составляющих набор данных, выступают оцифрованные изображения подписей. При этом при оцифровке изображений для включения в набор данных следует использовать методы и средства, максимально сохраняющие качество изображения.
В последующем обученная с помощью подготовленных наборов данных нейронная сеть не требует повторной настройки параметров и может применяться для автоматизированного решения экспертных задач.
При этом факт применения такого программного обеспечения должен быть отражен в заключении эксперта. В частности, во вводной части заключения при описании использованных средств эксперту следует указать наименование и версию примененной программы. Кроме того, должно быть указано, что данная программа основывается на технологиях искусственного интеллекта. Процесс работы с таким программным обеспечением также должен быть описан в исследовательской и синтезирующей частях заключения эксперта.
Применяя программное обеспечение, основанное на технологиях искусственного интеллекта, необходимо учитывать, что любая нейронная сеть имеет определенный уровень доверия и может быть подвержена ошибкам первого и второго рода, которые не всегда удается распознать. Поэтому, разрабатывая программное обеспечение в этой области следует руководствоваться алгоритмами, позволяющими понять механизм принятия решений, которые ложатся в основу доказывания в дальнейшем.
Основанное на технологиях искусственного интеллекта программное обеспечение не является универсальным средством решения экспертных задач, а выступает как вспомогательный инструмент и должно использоваться в совокупности с другими методами и средствами производства экспертизы.
Заключение
Технологии искусственного интеллекта имеют большой потенциал для решения широкого спектра задач судебной экспертизы, в частности, судебной почерковедческой и технико-криминалистической экспертиз документов. Правильно построенная и обученная модель нейронной сети позволит также упростить процедуру проверки подписей и иных рукописных записей в различных документах, увеличить скорость ее проведения, повысить достоверность результатов. Такая проверка может проводиться не только сотрудниками правоохранительных органов, но также и работниками других организаций и учреждений, не связанных напрямую с деятельностью по обеспечению правопорядка и общественной безопасности. Например, специалистами банков, работниками музеев, образовательных организаций при сопоставлении подписей и рукописных записей в разных документах, установлении содержания (прочтения) рукописных текстов, фрагменты букв и цифр которых частично искажены либо не дописаны.
Для разработки соответствующего программного обеспечения, которое может быть внедрено в экспертную практику и в последующем использовано для автоматизированного решения задач судебной экспертизы, необходим синтез знаний специалистов в области искусственного интеллекта и специальных знаний экспертов, так как именно эксперт понимает ту предметную область, в которой планируется применить те или иные технологии искусственного интеллекта, и может оказать продуктивное содействие в создании тестовых и обучающих наборов данных и последующей оценке результатов обучения нейронной сети. Также важно понимать, что основанное на технологиях искусственного интеллекта программное обеспечение не является универсальным инструментом решения экспертных задач и должно использоваться в совокупности с другими методами и средствами производства экспертизы.
Список литературы:
1. Джонс М.Т. Программирование искусственного интеллекта в приложениях / Пер. с англ. А.И. Осипова. М.: ДМК Пресс, 2011. 312 с.
2. Бессонов А.А. Искусственный интеллект и математическая статистика в криминалистическом изучении преступлений: монография. М.: Проспект, 2021. 816 с.
3. Бахтеев Д.В. Искусственный интеллект в следственной деятельности: задачи и проблемы // Российский следователь. 2020. № 9. С. 3–9. https://doi.org/10.18572/1812-3783-2020-9-3-6
4. Бессонов А.А. Использование алгоритмов искусственного интеллекта в криминалистическом изучении преступной деятельности (на примере серийных преступлений) // Вестник Университета имени О.Е. Кутафина. 2021. № 2 (78). С. 45–53. https://doi. org/10.17803/2311-5998.2021.78.2.045-053
5. Earl B.H. Artificial intelligence. New York: Academic Press, 1975. 559 p.
6. Бахтеев Д.В. Искусственный интеллект в криминалистике: состояние и перспективы использования // Российское право: образование, практика, наука. 2018. № 2 (104). С. 43–49.
7. Бахтеев Д.В. Компьютерное зрение и распознавание образов в криминалистике // Российское право: образование, практика, наука. 2019. № 3 (111). С. 66–74. https://doi.org/10.34076/2410-2709-2019-3-66-74
8. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. СПб.: Питер, 2018. 480 с.
9. Buduma N., Lacascio N. Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms. O’Reilly Media, 2017. 298 p.
10. Lake B.M., Salakhutdinov R., Tenenbaum J.B. Human-Level Concept Learning through Probabilistic Program Induction // Science. 2015. Vol. 350. Iss: 6266. P. 1332–1338. https://doi.org/10.1126/science.aab3050
11. Fjodor Van Veen. The Neural Network Zoo // The Asimov Institute. 14.09.2016. https://www.asimovinstitute.org/neural-network-zoo/
12. Rosenblatt F. The Perceptron: a Probabilistic Model for Information Storage and Organization in the Brain // Psychological Review. 1958. Vol. 65. No. 6. P. 386–408. https://doi.org/10.1037/h0042519
13. Elman J.L. Finding Structure in Time // Cognitive Science. 1990. Vol. 14. No. 2. P. 179–211. https://doi.org/10.1207/s15516709cog1402_1
14. Lecun Y., Bottou L., Bengio Y., Haffner P. Gradient-Based Learning Applied to Document Recognition // Proceedings of the IEEE. 1998. Vol. 86. No. 11. P. 2278–2324. https://doi.org/10.1109/5.726791
15. Дикий Д.И., Артемьева В.Д. Исследование применимости искусственных нейронных сетей для верификации пользователей по динамике почерка // Научно-технический вестник информационных технологий, механики и оптики. 2017. Т. 17. № 4. С. 677–684. https://doi.org/10.17586/2226-1494-2017- 17-4-677-684
16. Chollet F., Allaire J.J. Deep Learning with R. Manning Publications, 2018. 360 p.