Россинская Е.Р. Система теории цифровизации судебно-экспертной деятельности // Теория и практика судебной экспертизы. 2024. Т. 19. № 3. С. 20–32. https://doi.org/10.30764/1819-2785-2024-3-20-32
Введение
К началу XXI века традиционно в общей теории экспертологии (ранее в общей теории судебной экспертизы) выделились четыре частные теории, положения которых в равной степени распространяются как на процесс экспертного исследования в целом, так и на экспертные исследования отдельных родов экспертиз [1, с. 60] – теория экспертной идентификации, теория экспертной диагностики, теория экспертного прогнозирования и теория экспертной профилактики.
Теория экспертной идентификации включает в себя общие принципы, методологические рекомендации и критерии для выделения из множества материальных объектов определенного лица или предмета, связанного с изучаемым событием.
Теория экспертной диагностики содержит общие принципы, методологические рекомендации и условия установления определенных свойств и состояний объектов, выявления динамики событий, причин явлений и процессов [2, с. 68–76].
Развивающаяся в последние годы теория экспертного прогнозирования основывается на перманентных изменениях в социально-экологической системе вообще и в преступной деятельности в частности, обусловливающих возникновение новых объектов и задач и, как следствие, появление новых родов и видов экспертиз, новых экспертных технологий. Кроме того, в условиях интеграции и дифференциации научного знания актуальными являются исследования прогностического характера, направленные на выявление новых возможностей экспертного исследования вещественных доказательств.
Предметом теории экспертной профилактики являются принципы и закономерности функционирования системы экспертной профилактической деятельности в предупреждении преступлений, а также при выявлении и предупреждении экспертных ошибок как в процессе экспертных исследований, так и при оценке и использовании разультатов судебных экспертиз в процессе судопроизводства [3, с. 24–26].
В первой половине XXI века в судебноэкспертной деятельности (СЭД) возникли новые вызовы в связи с глобальным процессом интеграции информационно-коммуникационных технологий во все сферы жизнедеятельности современного общества.
Выполним судебную экспертизу в короткие сроки
Заметим, что использование информационных компьютерных технологий – явление далеко не новое. В СЭД такие технологии применяются уже более 40 лет, а в судебной экспертологии давно рассматриваются как информационно-компьютерное обеспечение в разделе «Организационное обеспечение судебно-экспертной деятельности» [4, с. 48]. Однако тогда данное направление касалось исключительно технологических аспектов экспертных исследований и включало:
-
использование универсальных аппаратных средств и универсального программного обеспечения;
-
разработку компьютерных систем анализа изображений;
-
создание баз данных и автоматизированных информационно-поисковых систем (АИПС) по конкретным объектам экспертизы, в том числе криминалистических и справочно-вспомогательных учетов;
-
автоматизацию сбора и обработки экспериментальных данных (измерительновычислительные комплексы);
-
создание программных комплексов либо отдельных программ выполнения вспомогательных расчетов по известным формулам и алгоритмам;
-
создание гибридных человеко-машинных систем и программных комплексов автоматизированного решения экспертных задач [5, с. 57–74].
В связи с широким распространением в первой четверти XXI века компьютерной преступности, когда информационно-коммуникационные компьютерные технологии стали применяться при совершении практически любых видов преступлений, а аналоговые способы отображения следов преступлений сменились на электронные, во всех родах и видах судебных экспертиз появились новые объекты исследования – цифровые следы. Причем это коснулось не только судебной компьютерно-технической экспертизы, но и фоноскопической, видеотехнической и фототехнической экспертиз, которые в силу перехода фиксации изображения и звука в цифровой формат иначе не могли бы развиваться [6–8]. Однако сейчас и у большинства судебных экспертиз (дактилоскопических, портретных, лингвистических, экономических, судебно-технических экспертиз документов и других) появились объекты в цифровом виде, что стало причиной возникновения целого ряда теоретических, правовых и организационных проблем. Для их решения нами была предложена концепция новой частной теории (учения) цифровизации судебно-экспертной деятельности и определены ее роль и место в системе частных теорий общей теории судебной экспертологии [9, с. 173–176; 10, с. 27–40].
Предмет теории цифровизации СЭД составляют закономерности судебно-экспертного исследования цифровых следов, образующихся вследствие возникновения, движения и преобразования компьютерной информации, имеющей доказательственное или розыскное значение в уголовном, гражданском, административном судопроизводстве.
Объекты теории цифровизации СЭД – это цифровые следы, компьютерные средства и системы как носители розыскной и доказательственной криминалистически значимой информации, а также технологии их судебно-экспертного исследования [10, с. 36].
Был сделан вывод, согласно которому теория цифровизации СЭД может быть отнесена к частным экспертным теориям, положения которых распространяются в целом на процессы любых экспертных исследований, в силу того, что цифровые следы постепенно становятся объектами все более широкого круга видов судебных экспертиз.
Таким образом, частная теория цифровизации судебно-экспертной деятельности представляет собой систематизацию знаний об основных направлениях трансформации объектов судебных экспертиз, экспертных методологии и технологии, экспертной дидактики. Дальнейшее развитие этой частной теории, по нашему мнению, лежит в русле формирования ее системы как методологической и технологической основы использования IT-технологий в экспертных исследованиях любых объектов судебной экспертизы.
Основная часть
Предлагаемая нами система теории цифровизации СЭД схематично представлена на рисунке 1.
Рис. 1. Система теории цифровизации судебно-экспертной деятельности.
1. К общим положениям теории цифровизации СЭД относятся ее предмет, объекты и задачи. Поскольку предмет и объекты теории были определены выше, рассмотрим задачи теории цифровизации судебно-экспертной деятельности. В их числе:
-
изучение объективных закономерностей судебно-экспертного исследования цифровых следов, образующихся вследствие возникновения, движения и преобразования компьютерной информации, имеющей доказательственное или розыскное значение;
-
установление направлений и прогнозирование технологических возможностей сбора и экспертного исследования цифровых следов и их носителей;
-
определение общих направлений развития алгоритмизации и цифровизации методов и методик судебно-экспертного исследования и их анализ;
-
исследование перспектив внедрения алгоритмов машинного обучения (нейросетей) в судебно-экспертную деятельность;
-
анализ и решение дидактических проблем новых компетенций в судебной экспертологии, связанных с глобальной цифровизацией.
В предыдущих публикациях мы наметили две составляющие данной теории: судебно-экспертное исследование цифровых следов и систему информационно-компьютерного обеспечения СЭД [10, с. 37]. Рассмотрим эти направления подробнее. Начнем с первой составляющей, связанной с цифровыми следами.
В настоящее время в литературе цифровые следы описаны достаточно подробно. Сформулирована дефиниция цифрового следа как криминалистически значимой компьютерной информации о событиях или действиях, отраженной в материальной среде в процессе ее возникновения, обработки, хранения и передачи [11, с. 6–9; 12, с. 7–14; 13, с. 40–57; 14, с. 54–55].
2. Применение компьютерных средств и систем для совершения различных видов преступлений в соответствии со всеобщим законом отражения привело к формированию нового механизма следообразования, который связан с процессами возникновения, обработки и передачи компьютерной информации. Согласно определению Э. Таненбаума, «цифровой компьютер – это машина, которая может решать задачи, исполняя данные ей команды» [15, с. 56–139]. Архитектура компьютера на своих нижних уровнях предусматривает ограниченный набор простых команд. Машинный код – набор инструкций, составленный из таких команд – выполняется непосредственно центральным процессором компьютера и труден для восприятия даже специалистами в области программирования. Еще ниже, в основе архитектуры компьютера, находится цифровой логический уровень, который реализуется в виде набора объектов, называемых вентилями. С их использованием осуществляются простые логические операции с цифровыми сигналами, которые в современной компьютерной технике представлены в двоичной системе счисления, то есть в виде символов 1 и 0. На расположенных выше уровнях архитектуры, содержащих огромное количество вентилей, строится ядро вычислительной системы. Передача цифровых данных, то есть физическая трансляция битового потока в виде сигналов между конечными компьютерными системами для их дальнейшей обработки осуществляется с помощью распространения электромагнитных волн или оптических импульсов в компьютерных сетях (локальных и глобальной сети Интернет) [16, с. 23–49].
Воспринимать такую информацию можно только с помощью специализированных программных и аппаратных средств, которые декодируют и отображают ее в привычном и понятном для человека виде – графическом, текстовом или звуковом.
Отсюда цифровые следы являются следами материальными, поскольку отражаются на материальных объектах – вентилях компьютерной системы. Природа цифровых следов технологическая, аналогично другим технологическим следам, например следам орудий и инструментов, так как их формирование связанно с IT-технологиями. Следует подчеркнуть, что, ввиду своей лабильности и сложности структуры хранения, цифровые следы могут быть зафиксированы и изъяты в полном объеме без изменения содержания только с использованием IT-технологий.
Механизм следобразования может быть различным в зависимости от носителя, на котором отображены цифровые следы. В электронном виде цифровые следы хранятся только на твердотельных накопителях с флеш-памятью, например флеш-картах и SSD (Solid-State Drive) – носителях информации, работающих по принципу сохранения электронного заряда устройства на микросхемах. При электромагнитном механизме следообразования компьютерная информация хранится на магнитных дисках (HDD) и лентах. Следы могут быть механическими, например, на оптическом диске под воздействием лазера. Однако, независимо от того, являются ли сигналы, с помощью которых хранится, обрабатывается или передается информация, электрическими, магнитными или оптическими, в их основе лежат цифровые технологии.
Цифровые следы обладают рядом отличительных свойств:
-
существуют в виде компьютерной информации;
-
отличаются высокой скоростью трансформации и возможностью восприятия только с помощью специальных компьютерных устройств и программ;
-
требуют специальных методов и технологий обнаружения, фиксации, изъятия и сохранения;
-
обязательно подтверждаются данными, свидетельствующими об их целостности, например, хеш-суммами.
Цифровые следы могут быть представлены на экспертизу в различных формах:
-
на отдельных носителях, например, на жестком магнитном диске (HDD), флешнакопителе и др.;
-
непосредственно в компьютерных системах и сетях, в мобильных коммуникаторах, облачных хранилищах, на планшетах, серверах;
-
в виде электронных документов;
-
в цифровом виде с помощью различных программных продуктов, например, в формате подписей или дактилоскопических отпечатков, изображенных на экранах мониторов, скриншотов переписки в социальных сетях и мессенджерах;
-
на бумажных носителях – отображаемые образы цифровых следов, например, распечатки скриншотов, электронных документов и др.
К видам цифровых следов относят: дампы оперативной памяти и дампы трафиков; файлы и их обрывки; программные продукты; текстовые и графические документы; файлы мультимедиа; базы данных; отчеты и журналы приложений и пр. Цифровые следы содержат криминалистически значимую компьютерную информацию в виде изображений лиц; видеои аудиозаписей; фотоизображений; звучащей речи; текстовых или графических банковских и иных экономических документов [17, с. 212–213].
Общими задачами судебных экспертиз, назначаемых при изучении цифровых следов, в первую очередь, являются задачи судебных компьютерно-технических экспертиз, предмет которых составляют факты и обстоятельства, связанные с закономерностями разработки и эксплуатации компьютерных средств и систем, обеспечивающих реализацию информационных технологий; исследуемые и устанавливаемые в уголовном, гражданском, административном судопроизводстве с использованием специальных знаний в области программирования и алгоритмизации, электроники, электротехники, информационных систем и процессов, радиотехники и связи, вычислительной техники и автоматизации [18, с. 62–87].
Класс судебных компьютерно-технических экспертиз включает следующие роды:
-
судебная аппаратно-компьютерная экспертиза – исследование закономерностей эксплуатации аппаратных средств компьютерной системы – материальных носителей информации (персональных компьютеров, периферийных устройств, сетевых аппаратных средств, интегрированных систем, а также любых комплектующих всех указанных компонент);
-
судебная программно-компьютерная экспертиза, которая проводится для осуществления экспертного исследования программного обеспечения и исследует определенную часть цифровых следов, имеющую отношение к функционированию программных средств, результатам этих процессов и самим компьютерным программам (их вредоносности, контрафактности);
-
судебная информационно-компьютерная экспертиза (данных) – исследование, при котором осуществляется поиск и анализ данных (созданных пользователем или порожденных, например, вредоносными программами), свидетельствующих о произошедшем событии;
-
судебная компьютерно-сетевая экспертиза, которая основывается, прежде всего, на функциональном предназначении компьютерных средств, реализующих какую-либо сетевую информационную технологию. С ее помощью в компьютерных средствах и системах выявляются файлы, содержащие порнографическую информацию, информацию экстремистского характера, информацию о наркотических вещества и их прекурсорах, исследуется переписка по электронной почте, сообщения в социальных сетях и мессенджерах.
Цифровые следы могут являться объектами и других родов (видов) судебных экспертиз, например, в фоноскопической, автороведческой, лингвистической, почерковедческой, фототехнической, видео-технической, портретной, судебно-бухгалтерской, финансово-экономической, судебно-технической экспертизе документов и других. Данное обстоятельство оказало существенное влияние на методологию и методики экспертного исследования, компетенцию судебных экспертов. Также следует учитывать и специфику тех или иных цифровых следов в зависимости от рода (вида) экспертиз, которая непременно должна найти отражение в частных теориях этих родов (видов) экспертиз.
Во многих родах судебных экспертиз на первоначальной стадии исследования эксперт выявляет следы, обнаружение которых невозможно без использования инструментальных методов. Это особенно актуально для цифровых следов, которые могут быть найдены при проведении судебно-экспертного исследования. Однако теперь для эффективной работы с цифровыми следами эксперты также должны обладать глубокими знаниями в области IT-технологий. Для целого ряда судебных экспертиз подобная трансформация квалификации давно произошла, поскольку, например, в фоноскопической, видео-технической и фототехнической экспертизах объекты уже более 20 лет предоставляются в цифровом виде. В этих экспертизах используются комплексные экспертные методики, из-за чего эксперты владеют комплексом компетенций. Но все же стоит отметить, что вышесказанное относится к ситуациям, когда объекты представлены в цифровом виде на отдельных носителях информации. Если же такие цифровые следы находятся, например, на сервере, то для их извлечения требуются специальные знания в области судебной компьютерно-технической экспертизы.
Для многих «традиционных» экспертиз также возникла потребность в использовании компьютерных технологий. Рассмотрим эту ситуацию на примере судебной бухгалтерской экспертизы, когда от эксперта требуется обнаружить и самостоятельно изъять из компьютерной системы документы бухгалтерской отчетности, фактически являющиеся цифровыми следами. Работа с цифровыми следами не входит в компетенцию эксперта-экономиста, поэтому сначала эксперт компьютерно-технической экспертизы должен установить, получены ли массивы бухгалтерской информации с помощью легитимной версии бухгалтерской программы или привнесены в компьютер как-то иначе, а затем корректно скопировать необходимые документы на внешний носитель. Эксперт судебно-бухгалтерской экспертизы, даже если и владеет необходимыми технологиями (что весьма проблематично), не имеет права ими воспользоваться, поскольку пока это находится вне пределов его компетенции по экспертной специальности.
В результате цифровой трансформации, произошедшей во всех отраслях экономики, сформировался новый инновационный вид судебных экономических экспертиз – судебная экспертиза операций с цифровыми финансовыми активами, которые осуществляются исключительно в сети Интернет и носят транснациональный характер. Специфика таких экспертных исследований требует от эксперта не только экономических специальных знаний, но и знаний в области IT-технологий. При этом в судебной экспертизе операций с криптоактивами все объекты представляют собой цифровые следы [19, с. 60–64]. Очевидно, что для производства подобных экспертиз необходимо расширение компетенции судебных экспертов в соответствии с требованиями комплексной методики.
Важно отметить, что при любом исследовании объектов, являющихся цифровыми следами, судебный эксперт должен иметь представление о технологиях изъятия криминалистически значимой информации, представленной в такой форме, уметь оценивать легитимность, пригодность и достаточность этих объектов для проведения судебной экспертизы и получения обоснованного вывода. Таким образом, необходимость экспертного исследования цифровых следов обусловливает существенные модификации методик экспертного исследования и новый этап развития экспертных технологий.
3. Перейдем к рассмотрению информационно-технологического раздела теории цифровизации СЭД, формирование которого (хотя он именовался тогда автоматизацией) началось в 70-е годы прошлого века [5, с. 57–58]. Задачами автоматизации были разработка баз данных и АИПС по конкретным объектам экспертизы, создание измерительно-вычислительных комплексов (включающих аналитическое оборудование, атласы спектров, рентгенограмм и других данных для автоматической обработки результатов исследований) и программ выполнения вспомогательных расчетов по известным формулам и алгоритмам [20].
Развитие компьютерных технологий в конце 80-х – 90-х годов прошлого века способствовало разработке баз знаний для формирования автономных экспертных систем судебно-экспертного назначения. Экспертная система – это программный комплекс для ЭВМ, способный накапливать и обобщать знания и эмпирический опыт эксперта в какой-либо предметной области, а затем работать в качестве советчика при рядовом специалисте. При этом качество решений, рекомендуемых экспертной системой, сопоставимо с качеством решений экспертов [21, с. 6–8]. Эти программные комплексы использовали метод экспертных оценок признаков объектов судебных экспертиз для осуществления поддержки принятия решений – совокупности процедур, обеспечивающих лицо, принимающее решение, необходимой информацией и рекомендациями [22, с. 147; 23; с. 5–8].
Закономерности информационно-компьютерного обеспечения судебно-экспертной деятельности, информатизации и компьютеризации судебной экспертизы, включающие закономерности активного использования информационных компьютерных технологий, создания и совершенствования информационных систем судебно-экспертного назначения и информационно-телекоммуникационных сетей специального назначения, являются одними из основных закономерностей судебной экспертологии [4, с. 48–50].
Цифровые следы как носители розыскной и доказательственной информации дали новый импульс к развитию технологий алгоритмизации и цифровизации методов и методик судебно-экспертного исследования.
В XXI веке на смену экспертным системам, описывающим алгоритм действий по выбору решения в зависимости от конкретных условий, пришли методы искусственного интеллекта, направленные на создание принципиально новых научно-технических продуктов для автономного решения различных задач, анализа данных, автоматического машинного обучения, разработки алгоритмов принятия решений и прогнозирования событий или тенденций.
Благодаря развитию программно-аппаратных комплексов, включая использование графических процессоров и распределенных архитектур вычислительных систем, появилась возможность аккумулировать большие массивы данных (Big Data), собранных автоматическим способом, позволяющие устанавливать новые закономерности и приобретать знания, которые невозможно было получить из локальных фрагментов данных.
Одними из наиболее распространенных алгоритмов искусственного интеллекта являются нейронные сети, которые в настоящее время широко применяются для решения самых разных задач: распознавания образов, анализа больших объемов данных, прогнозирования различных тенденций, обучения и оптимизация других алгоритмов, процессов и систем [24, с. 20–23].
Использование нейросетей вызвало значительное увеличение количества цифровых следов как продуктов их работы. Нейросетевые технологии применяются и в противоправной деятельности, например для создания ботов для фишинг-атак и манипуляций через фейковый контент, который все сложнее отличить от подлинного. Так, с использованием технологий астротурфинга генерируются фальшивые отзывы о товарах с маркетплейсов, фотографии никогда не существовавших людей, дипфейки, точно имитирующие живых лиц; для совершения вымогательств создаются call-центры на основе ботов с озвученными видеоизображениями конкретных людей.
Вышеперечисленные и многие другие цифровые следы работы нейросетей исследуются различными родами судебных экспертиз, где неоценимую помощь могут оказать все те же нейронные сети.
Применение нейросетей в судебной экспертизе обусловлено общедоступностью алгоритмов машинного обучения и лавинообразным нарастанием разработки новых. Пока, как показывают наши исследования [24, с. 24–26], используются нейросети контролируемого обучения, причем валидация в них осуществляется с применением традиционно определенных признаков, выявленных вручную. Производство судебных экспертиз – это практическая деятельность, целью которой является получение доказательственной информации, от качества которой будет зависеть исход судебного разбирательства. В связи с этим необходимо с осторожностью вводить нейросети и другие технологии искусственного интеллекта в судебно-экспертную деятельность, внедрять в качестве нового инструментария судебного эксперта только после глубокой теоретической подготовки и всесторонней апробации.
При производстве судебных экспертиз возможны ошибки гносеологического и деятельностного характера, поэтому далее рассмотрим прогнозирование экспертных ошибок при внедрении нейросетей в СЭД.
Согласно учению судебной экспертологии об экспертном прогнозировании, гносеологической основой прогноза служит философская категория причинности, а логической основой – экстраполяция знаний.
Процесс экстраполяции использования нейросетей в судебной экспертизе в прогнозных целях включает:
-
исходные данные для прогнозирования – знание о прошлом или настоящем процесса экспертного исследования;
-
основание для прогнозирования, то есть знания о необходимых или вероятных направлениях развития экспертных технологий;
-
перенос знаний об использовании нейросетей из других сфер деятельности, получение прогноза, то есть вероятного вывода в будущем;
-
оценку прогноза с точки зрения как его достоверности, так и содержания, то есть той ситуации, которая может возникнуть в судебной экспертизе, если прогноз осуществится;
-
реализацию прогноза, то есть формирование системы рекомендаций, обеспечивающих преодоление негативных последствий применения нейросетей в экспертной деятельности.
При создании экспертных методик на основе нейросетей важно учитывать модельный риск – риск возникновения нежелательных последствий из-за ошибок процессов разработки и применения алгоритмов, используемых в принятии решений. Источники модельного риска, связанные с неактуальностью и недостатком данных, их предвзятостью и некорректностью, а также предвзятостью моделей и неверной интерпретацией результатов отображены на рисунке 2 [25].
Рис. 2. Источники модельного риска.
Создание экспертных методик на основе нейросетей необходимо начать с определения способов сбора данных. Выше уже было отмечено, что пока в судебно-экспертной деятельности следует применять алгоритмы обучения с учителем (контролируемого обучения).
Обучение с учителем – это подход к машинному обучению, основанный на использовании наборов размеченных данных, например, признаков на пулях и гильзах в баллистической экспертизе [26, с. 1–9]. Эти наборы данных применяются для классификации данных или точного прогнозирования результатов. Используя размеченные входы и выходы, модель может сопоставлять входные данные с полученными результатами, проверяя их на точность, и таким образом постепенно обучаться.
Существует два типа обучения с учителем: классификация и регрессия. В задачах классификации используется алгоритм точного распределения тестовых данных по категориям. Распространенными алгоритмами классификации являются метод опорных векторов, деревья решений и случайный лес [27, с. 31–190]. Другой тип контролируемого обучения – регрессия, при котором используется алгоритм, способный прогнозировать ответ из неограниченного числового множества. Например, есть данные о посещениях занятий и итоговых оценках студентов, и на основании этого требуется определить (спрогнозировать) посещаемость по итоговым оценкам.
Для разработки экспертных методик на основе нейросетей необходимо создание баз данных датасетов (Dataset), которые будут содержать собранные, аннотированные и подготовленные данные по родам и видам судебных экспертиз (признаков), используемые для тренировки и тестирования моделей машинного обучения. Каждый образец представляет собой входные признаки и соответствующий им выходной или целевой признак. Первым шагом в создании датасета является сбор данных, а затем их аннотация – процесс обозначения данных метками, которые указывают на интересующие признаки. Например, для задачи классификации в баллистической экспертизе аннотация может включать в себя присвоение меток к следам нарезов на пуле. Далее идет фильтрация данных, которая дает возможность удалить выбросы, неполные данные или повторы и позволяет избежать переобучения модели. Последним этапом является проверка качества датасета, которая включает в себя анализ сбалансированности, проверку правильности аннотаций и другие метрики. Готовый к использованию датасет может быть размещен в репозитории данных об объектах различных родов судебных экспертиз.
Такими источниками данных для судебно-экспертных датасетов, которые еще предстоит разработать, выступают существующие экспертные методики и многочисленная научная литература по судебной экспертологии, а также существующие экспертно-криминалистические учеты, которые ведутся на федеральном и региональном уровнях в ЭКЦ МВД России и ЭКЦ МВД, ГУВД, УВД субъектов РФ. Кроме того, источниками данных могут быть и справочноинформационные фонды (СИФ), которые формируются и ведутся в государственных судебно-экспертных учреждениях (СЭУ) и представляют собой натурные коллекции объектов и описания предметов, материалов, веществ, следы которых чаще всего обнаруживаются на местах происшествий. СИФы построены применительно к конкретным родам экспертиз, объектам или методам экспертного исследования и, как правило, являются АИПС.
Главными проблемами всех этих возможных исходных данных являются разобщенность, поскольку они сосредоточены в рамках различных ведомств, осуществляющих СЭД, недостаточная структурированность и, зачастую, отсутствие в них нужных сведений по современным объектам и методам экспертных исследований. Многие судебно-экспертные методики, разработанные в разных ведомствах, часто противоречат друг другу. Статьи с описанием новых экспертных методик публикуются в ведомственных изданиях, что затрудняет ознакомление с ними. К тому же, поскольку эти методики связаны с исследованием вещественных доказательств по уголовным делам, они имеют ограничения по доступу.
Все это пока не дает возможности говорить о создании единых датасетов и репозиториев по родам и видам экспертиз как хранилищ, содержащих собранные, аннотированные данные, поскольку их формирование требует, в первую очередь, согласования методических подходов различных ведомств к исследованию объектов судебных экспертиз. Тем не менее задачу необходимо хотя бы поставить и наметить направление ее решения в общероссийском масштабе, поскольку негосударственные судебно-экспертные фирмы и частные судебные эксперты уже начали бесконтрольно использовать нейросети при производстве экспертиз. Опасность этого заключается в невозможности в таких случаях проверять обоснованность выводов, поскольку правоприменители в достаточной степени не владеют специальными знаниями и, как показывает практика, слишком доверяют тем экспертным заключениям, где много математических выкладок и формул.
4. Выше уже упоминалось об изменениях компетенций судебных экспертов в связи с трансформациями методологии и технологий судебно-экспертных исследований. Внедрение искусственного интеллекта и нейросетей в судебно-экспертную деятельность обусловливает необходимость появления новых компетенций в судебной экспертологии, которые рассмотрим далее в русле решения задач машинного обучения.
А. Подготовка данных проходит в два этапа: сначала определяют, какие типы данных есть в наличии, а затем проводят проверку их качества. Данные могут быть представлены в виде таблиц, необработанных текстов, изображений или даже графов. С каждым из этих типов данных хорошо работают ных (Data Analyst) – специалиста, который описывает данные, выявляет в них тренды, анализирует полученные результаты для понимания влияния разных признаков друг на друга. Эти данные хранятся в датасетах, и аналитики должны уметь с помощью языка запросов извлекать их, отбирать релевантные экспертные признаки (как правило, только самые актуальные). На практике предлагается оставить 20–30 самых подходящих [25]. Этот этап понадобится при использовании нейросетей, обучаемых с учителем. В дальнейшем, более продвинутые, глубокие нейронные сети, вероятно, смогут сами извлекать признаки из неструктурированных данных: текстов, фотографий, аудиои видеоизображений.
Аналитик экспертных данных должен обладать знаниями судебной экспертологии и иметь опыт экспертной работы, широкий кругозор и высокий уровень компетенции в данном роде (виде) судебной экспертизы (знать свойства и признаки объектов, методики и методические подходы экспертных исследований и пр.). Если данный специалист не имеет естественнонаучного или инженерного образования, то он должен пройти профессиональную переподготовку по математике, теории вероятностей и математической статистике. Для ведения аналитики, тестирования гипотез, проведения A/B-тестов [25] аналитики используют Python – высокоуровневый язык программирования, отличающийся эффективностью, простотой и универсальностью использования, широко применяемый в машинном обучении и обработке больших данных. Знание IT-инструментов ограничивается Python и SQL.
В. Задача инженера экспертных данных (Data Engineer) заключается в структурировании данных в хранилище данных, контроле за их целостностью и качеством, а также отслеживании доступов к ним. Такой специалист владеет современными технологиями и подходами в области обработки данных, анализирует их, строит модели и тестирует данные. В проектах по экспертному прогнозированию и прогнозной аналитике он может осуществлять содействие в поиске данных. Для успешной работы инженер данных должен разбираться в судебно-экспертных технологиях и знать теоретические и прикладные основы экспертологии.
С. Инженер машинного обучения (Machine Learning Engineer) обучает модель на данных, оценивает ее качество, проверяет, насколько она эффективна и соответствует ли заданным результатам (ML-метрикам), устраняет ошибки. Если точность модели падает, инженер выявляет причины и переобучает алгоритм, адаптируя его под изменения данных. Инженер по машинному обучению должен быть специалистом в области IT-технологий, то есть обладать знаниями алгоритмов машинного обучения, математической статистики, теории вероятностей, а также иметь опыт работы в области машинного обучения, разработки программного обеспечения, обработки данных или смежных областях.
Выводы
В заключении необходимо отметить, что использование нейросетей и других алгоритмов искусственного интеллекта в судебно-экспертных исследованиях открывает совершенно новые перспективы получения криминалистически значимой доказательственной и ориентирующей информации. И поскольку предвидятся серьезные риски широкого применения подобного инструментария, процесс его создания должен осуществляться на государственном уровне.
Полагаем, что необходимо поддерживать разработчиков отдельных датасетов и нейросетей обучения с учителем по родам экспертиз в СЭУ различных ведомств и выносить результаты их работы не только на научные конференции, но и докладывать о них и обсуждать на заседаниях Правительственной комиссии по координации судебно-экспертной деятельности в Российской Федерации и Технического комитета по стандартизации «Судебная экспертиза».
Президент Российской Федерации Владимир Владимирович Путин на пленарном заседании Международной конференции по искусственному интеллекту и машинному обучению отметил, что «за последние годы в науке, технологиях и социальной сфере России в полтора раза расширилось использование решений в области искусственного интеллекта». В связи с этим актуальной и целесообразной представляется постановка вопроса о создании системы искусственного интеллекта в судебно-экспертной деятельности в рамках Федеральной программы «Искусственный интеллект» либо инициирование принятия новой федеральной программы «Искусственный интеллект в судебной экспертизе», как это предлагают авторы из ФБУ РФЦСЭ имени профессора А.Р. Шляхова при Минюсте России [28, с. 72].