Услуги

Строительно-техническая экспертиза

Биологические и экологические экспертизы

Рецензии на экспертизы

Использование количественных характеристик изображения документов для идентификации лазерных принтеров

Изображение сгенерировано нейросетью

Петров С.М. Использование количественных характеристик изображения документов для идентификации лазерных принтеров // Теория и практика судебной экспертизы. 2021. Т. 16. № 2. С. 69–88. https://doi.org/10.30764/1819-2785-2021-2-69-88


Введение

Лазерные принтеры, МФУ и копиры заняли в 2020 г. около 70 % рынка печатающих устройств, основными производителями на котором являются фирмы Hewlett-Packard (41 %), Canon (21 %), Epson (16 %) и Brother (9 %). В связи с этим закономерно внимание, которое судебные эксперты уделяют электрофотографическим печатающим устройствам и напечатанным с их помощью документам. Это находит отражение в большом количестве научно-исследовательских и методических публикаций как отечественных, так и зарубежных исследователей.

Однако до сих пор в российской экспертной практике единственным методом идентификации лазерных принтеров являлся метод, основанный на сравнении следов дефектов фотобарабана [1, 2]. Иные подходы, например идентификация по скрытым меткам [2] или по следам механизма подачи бумаги [3, 4], а также по частотноконтрастной характеристике устройства [5], существенного влияния на экспертную практику не оказали.

Метод идентификации по следам дефектов фотобарабана основан на сравнении качественных признаков печатающего устройства. Его логическим развитием было бы включение в перечень признаков не только дефектов фотобарабана, отображающихся на документе в виде мелких повторяющихся пятен, но и других недостатков печати, имеющих достаточно выраженную форму и локализацию и однозначно связанных с неисправностью деталей печатающего механизма. Тем не менее даже такое расширение перечня признаков не позволяет решить задачу идентификации в произвольном случае, поскольку визуально обнаруживаемые дефекты печати возникают только при продолжительной эксплуатации принтера. Как следствие, задача идентификации произвольного лазерного принтера не может быть решена, если метод основывается только на системе качественных признаков идентифицируемого устройства [6].

В 2000 г. А.В. Гортинский показал перспективы использования количественных признаков знакосинтезирующих печатающих устройств при их идентификации. Принципиальная возможность данного подхода обусловлена тем, что в силу конечной точности изготовления и сборки узлов и деталей принтера одноименные детали разных устройств не будут иметь одинаковых размеров, однако их параметры будут находиться в некотором диапазоне допустимых величин (допусков) [7]. В результате печатающее устройство приобретает индивидуальную для каждого экземпляра совокупность отклонений размеров и иных свойств его узлов и деталей от номинальных значений. В процессе эксплуатации детали взаимодействуют между собой и находятся под воздействием агрессивных факторов рабочей среды. Это приводит к их износу, который, не влияя до некоторых пор на работоспособность изделия, в целом придает ему более «яркую» индивидуальность, выделяя его из числа таких же. Именно это свойство было успешно использовано для решения задачи идентификации матричных принтеров.

ЧИТАЙТЕ ТАКЖЕ

Техническая экспертиза документов

Рецензирования химических экспертиз
Подробнее →

Чтобы применить подобный подход к идентификации лазерных принтеров, необходимо найти такие измеримые количественные свойства напечатанного на принтере документа, которые являются прямым отображением индивидуальной для конкретного печатающего устройства комбинации свойств его различных деталей. Таким свойством может стать плотность печати, явная неоднородность которой легко выявляется на распечатках сплошных заливок, в особенности выполненных на принтерах с картриджами значительного срока эксплуатации (рис. 1).


Рис. 1. Результаты печати сплошной заливки на трех различных принтерах.

Таким образом, решение задачи идентификации лазерных принтеров напрямую зависит, c одной стороны, от возможности связать колебания плотности печати с теми или иными свойствами узлов и деталей печатающего устройства, с другой – от возможности дать объективную количественную оценку плотности печати при исследовании произвольного документа.

Цель данной работы – определение возможности количественной оценки колебаний плотности печати на лазерных принтерах для их последующей идентификации. Задачи исследования: выявление зависимости между колебаниями плотности печати и свойствами узлов и деталей печатающего устройства; оценка значимости количественных характеристик плотности печати для идентификации устройства.


Принцип работы лазерного принтера и основные дефекты печати

Лазерные принтеры – одна из разновидностей электрофотографических печатающих устройств. Основной узел таких устройств – это фоторецептор, обычно в форме цилиндра (фотобарабан); его поверхность покрыта слоем вещества, способного воспринимать и удерживать электрический заряд и терять его под воздействием оптического излучения. Данное воздействие приводит к образованию на поверхности фоторецептора участков с различным зарядом, таким образом на поверхности формируется скрытое электростатическое изображение.

Главное отличие лазерных принтеров от аналоговых электрофотографических устройств заключается в том, что источником оптического излучения в них является оптический квантовый генератор (лазер), формирующий узконаправленный поток монохромного излучения. Механизмы развертки лазерного луча и модуляции интенсивности излучения позволяют построчно формировать на фоторецепторе скрытое изображение.

Среди монохромных печатающих устройств наибольшее распространение получили устройства, реализующие принцип электрофотографической печати с негативной магнитной системой проявления. В их число входят принтеры, выпускаемые компаниями Hewlett-Packard, Canon и Xerox. Основные элементы конструкции такого вида устройств [8] показаны на рисунке 2.


Рис. 2. Общая схема лазерного принтера с негативной магнитной системой проявления.

1 – фотобарабан; 2 – вал заряда; 3 – лазерный сканер; 4 – вал проявки; 5 – бункер с тонером; 6 – дозирующее лезвие; 7 – вал переноса; 8 – лист бумаги; 9 – ракель; 10 – бункер с отработкой; 11 – элиминатор; 12 – нагревательный вал; 13 – прижимной вал; 14 – валы подачи бумаги

Цикл их работы состоит из следующих этапов.

1. На вал заряда подается переменное напряжение с отрицательным смещением, за счет постоянной составляющей которого поверхность фотобарабана приобретает равномерный отрицательный заряд.

2. Луч лазера засвечивает необходимые участки барабана, в результате они теряют отрицательный заряд, а на поверхности фотобарабана формируется невидимое электростатическое изображение.

3. Магнитный вал проявки захватывает тонер из бункера; дозирующее лезвие выравнивает слой тонера на поверхности вала. За счет трения о дозирующее лезвие частицы тонера приобретают отрицательный заряд. В зоне проявки они образуют магнитную кисть, выстраиваясь по силовым линиям магнитного поля, создаваемого неподвижным магнитным сердечником вала проявки, затем прилипают к экспонированным участкам поверхности фотобарабана, не имеющей заряда, и отталкиваются от участков, сохранивших свой заряд. Невидимое изображение на поверхности фотобарабана проявляется, окрашиваясь тонером.

4. На вал переноса подается положительное напряжение, и бумага приобретает положительный заряд. Благодаря этому частицы тонера переносятся с фотобарабана на бумагу.

5. Тонер, оставшийся после переноса на поверхность фотобарабана, счищается с нее ракелем и попадает в бункер отработки.

6. Скрытое электростатическое изображение, оставшееся на поверхности фотобарабана, стирается за счет воздействия которое подается на вал заряда. Цикл печати завершен.

7. Бумага подается в узел закрепления, который состоит из прижимного вала и нагревателя. Нагреватель расплавляет тонер, который, остывая, закрепляется на поверхности бумаги.

Подробный анализ конструкции деталей принтера и их взаимодействия при печати, а также механизма переноса тонера из бункера на лист бумаги показывает, что все детали печатающего механизма в той или иной степени оказывают влияние на плотность печати, определяемую как количество тонера, поступающего на единицу площади листа. Неоднородность свойств рабочих поверхностей фотобарабана, валов и лезвий, конечная точность их изготовления и сборки устанавливают принципиальную невозможность обеспечить постоянную плотность печати по всей поверхности листа. Износ и загрязнение рабочих деталей в процессе эксплуатации приводят ко все более неравномерной плотности печати в разных частях листа. Это проявляется в первую очередь в виде вертикальных и горизонтальных полос (рис. 1). В полиграфии такой дефект обозначается термином «полошение» [9].

Из анализа печатающего механизма следует, что причина горизонтального полошения (колебания плотности печати вдоль длинной стороны листа, параллельно направлению движения листа в принтере) – неоднородность свойств рабочих поверхностей фотобарабана и валов печатающего механизма и колебания угловой скорости их вращения [10]. Наиболее заметный вклад в горизонтальное полошение вносят фотобарабан и вал проявки. Поскольку длина окружности валов меньше высоты листа, полосы от одного вала повторяются на листе несколько раз. Это позволяет определить длины окружностей валов, которые соответствуют периоду чередования полос.

Основная причина вертикального полошения (колебания плотности печати вдоль короткой стороны листа, перпендикулярно направлению движения листа в принтере) заключается в неравномерном распределении тонера дозирующим лезвием по поверхности вала проявки. Изменение величины зазора между лезвием и валом проявки, вызванное деформацией, износом и загрязнением лезвия, определяется случайными факторами. Соответственно, рисунок полошения в виде чередующихся вертикальных полос различной ширины и интенсивности уникален и может быть использован в качестве идентификационного признака печатающего устройства.


Материалы и методы

В текстовом редакторе MS Word был подготовлен трехстраничный документ, который распечатали на принтерах HP LaserJet 1005, HP LaserJet 1010 (2 шт.), HP LaserJet 1102 (2 шт.), HP LaserJet P2015, Canon LBP 6310 и Kiocera cd1028 в одном экземпляре. По всей площади первой страницы печатали сплошную черную заливку (рис. 3, слева). При этом лазерный излучатель все время работал с максимальной мощностью, и оптические искажения лазерного сканера не влияли на итоговое изображение.

На второй (рис. 3, центр) и третьей (рис. 3, справа) страницах распечатали текст, набранный шрифтом Courier New кеглем 12 пт. Выбор моноширинной гарнитуры обусловлен простотой выделения в массиве печатного текста строк и столбцов символов, а также отсутствием эффекта «слипания» соседних символов в напечатанном тексте, что характерно для антиквенных шрифтов. Весь текст второй страницы набран одним символом «н», на третьей странице – произвольный текст.


Рис. 3. Тестовый документ.

В полиграфии для определения параметров красочного слоя используют измерения оптической плотности. Однако применяемые для этого денситометры приспособлены для единичных измерений. В настоящей работе интерес представляет неравномерность плотности печати по всему листу, при этом определение оптической плотности хотя бы в сотне точек уже крайне трудоемко, а необходимо устанавливать еще и координаты точек измерения.

Поскольку на плотность печати, помимо самого печатающего механизма, оказывают влияние и внешние факторы, такие как температура и влажность воздуха, а также качество используемой для печати бумаги, то результаты точных измерений оптической плотности запечатанных участков документа с помощью денситометра могут различаться и для документов, заведомо напечатанных на одном и том же принтере. В связи с этим, принимая во внимание особенности работы механизма принтера, более существенными будут не точность единичного измерения оптической плотности печати, а отличия между плотностью печати в разных частях листа, которые можно выразить в относительных единицах.

Из этого следует, что необходимости в использовании измерительных приборов нет, но есть основания полагать, что достаточный объем информации об объекте исследования (документе) можно получить из его цифровой фотографии. Так, если рассмотреть отдельный участок документа, который на его изображении отображается единственным пикселем, то очевидно, что яркость пикселя будет находиться в обратной зависимости от количества частиц тонера, располагающихся на этом участке (если тонер не насыпан горкой, что невозможно при нормальных условиях печати). Для цифровых фотографий значения яркости пикселей кодируются числами от 0 до 255 в каждом цветовом канале (либо в единственном канале для полутонового изображения).

Числовое представление яркости дает обширные возможности как для преобразования данных, так и для их статистического анализа. Например, чтобы оперировать не значениями яркости пикселей, а значениями условной плотности тонера, достаточно вычесть значение яркости из 255, что аналогично применению операции инвертирования к изображению. Полученное число будет с некоторой погрешностью пропорционально оптической плотности, зависящей от физического числа частиц тонера на единице площади. Таким образом, цифровая фотография может не только предоставить эксперту возможность запечатлеть объект, но и выступить инструментом его исследования.

Оптимальным устройством для получения цифрового изображения документа, напечатанного на листе формата А4 лазерным принтером с разрешением печати 300–1200 dpi, будет планшетный сканер с матрицей CCD и разрешением 1200–2400 dpi, программное обеспечение которого делает возможным задавать параметры сканирования вручную. В рамках настоящего исследования использовали сканер Epson Perfection 4990 Photo.

Специализированные программы, позволяющие анализировать изображение документа с целью идентификации печатающего устройства, в настоящее время отсутствуют, поэтому для анализа и получения численных данных об изображении используют программу ImageJ, разработанную для научных исследований изображений различных объектов [11]. Она позволяет определять яркость пикселей на выбранной вертикальной или горизонтальной линии. Другой полезной для анализа изображений документов функцией является Analyze Particles. С ее помощью могут быть получены данные о площади печатных элементов.

Статистическую обработку данных можно проводить в программе MS Excel, а для графического представления результатов – использовать как упомянутые ImageJ и MS Excel, так и Advanced Grapher и Surfer. При отсутствии специализированного программного обеспечения наиболее эффективным способом автоматизации процесса анализа изображений, обработки и представления результатов является программирование в среде Mathlab, GNU Octave или Python.


Получение и предварительная подготовка изображений

Распечатки сканировали с разрешением 1200 точек на дюйм, для уменьшения объема файла изображения сохраняли как полутоновые (greyscale, 8-bit). Для исключения влияния на результаты сканирования автоматической коррекции изображения использовали линейную тональную кривую. Необходимые настройки программы Epson Scan показаны на рисунке 4, где рамками красного цвета выделены кнопка настройки гистограммы в главном окне и необходимые параметры сканирования.


Рис. 4. Настройки программы Epson Scan, использовавшиеся для исследования.

Изображения сохраняли в формате JPG с минимальным сжатием. Использование других форматов нежелательно из-за большого объема файлов (например, формат BMP), либо в связи с необходимостью задавать масштаб обработке в программе ImageJ (формат TIFF).

Перед исследованием изображения документа необходимо убедиться, что отсутствует наклон изображения, обусловленный перекосом листа при печати или сканировании. Для этого следует открыть файл в ImageJ, выбрать инструмент Rectangle и навести его на точку начала строки или горизонтальной линии. Координаты выбранной точки изображения, отсчитываемые от его левого верхнего угла, отображаются в главном окне (рис. 5).


Рис. 5. Отображение координат курсора в главном окне программы ImageJ (выделено красным).

Если начало строки (горизонтальной линии) имеет координаты X1, Y1, а окончание – X2, Y2, то угол наклона изображения имеет величину:


Изображение можно повернуть через меню «Image\Transform\Rotate». Положительное значение угла соответствует повороту по часовой стрелке, отрицательное – против.


Исследование плотности печати

На документах с обширными участками сплошной заливки может визуально наблюдаться как вертикальное, так и горизонтальное полошение (рис. 1). Это позволяет определить его «рисунок» и провести сравнительное исследование, не прибегая к каким-либо дополнительным средствам. Однако сопоставление не самый эффективный способ сравнительного исследования, особенно когда полошение недостаточно выражено. Графики яркости пикселей более информативны при анализе колебаний плотности печати, чем непосредственное визуальное исследование изображений.

Чтобы выявить характер полошения, необходимо определить значения яркости пикселей в направлении, перпендикулярном направлению полос, то есть для вертикального следует определить изменения значений яркости в строках пикселей, для горизонтального – в столбцах. Наиболее наглядные результаты получаются при рассмотрении экспериментальных распечаток сплошных заливок (первая страница тестового документа).

Для решения поставленной задачи средствами программы ImageJ необходимо (рис. 6) выполнить следующие этапы.


Рис. 6. Определение яркости пикселей изображения в программе ImageJ: 1 – главное окно программы; 2 – окно изображения; 3 – окно графика; 4 – окно значений.

1. Запустить программу ImageJ и открыть исследуемое изображение.

2. Инвертировать изображение с помощью опции меню «Edit\Invert» (на рисунке 6 показано инвертированное изображение сплошной черной заливки), поскольку получаемые с помощью программы графики показывают значения яркости пикселей, а исследуемым параметром является находящаяся в обратной зависимости от яркости плотность печати.

3. Выделить на изображении область интереса (отмечена контуром желтого цвета в окне изображения на рисунке 6) с помощью инструмента Rectangle (первая кнопка на панели инструментов в основном окне программы).

4. Выбрать функцию Plot Profile в меню Analyze в основном окне программы.

5. Нажать кнопку List в открывшемся окне, отображающем график усредненной по столбцам яркости пикселей.

6. Сохранить полученные результаты через меню «File\Save As» или скопировать их в буфер обмена последовательностью команд меню «Edit\Select All», «Edit\Copy» в открывшемся окне Plot Values.

Кнопка Live в окне графика позволяет включить интерактивный режим, при котором данные в окнах графика и значений обновляются сразу после изменения выделенной области в окне изображения.

По умолчанию рассчитываются средние значения яркости пикселей в столбцах выделенной области, что позволяет определить колебания плотности печати по горизонтали (вертикальное полошение). Для исследования горизонтального полошения, проявляющегося как колебания плотности печати по вертикали, необходимо в окне графика нажать кнопку More, выбрать пункт Plot Options и в открывшемся окне отметить опцию Vertical profile. Внесенные изменения настроек активируются при следующем вызове функции Plot Profile через меню главного окна.

Данные из окна Plot Values содержат номер столбца или строки пикселей, отсчитываемый от верхнего левого угла изображения, и среднее значение яркости пикселей в этом столбце (строке). В качестве разделителя целой и дробной части значения яркости используется точка. Если для дальнейшего анализа производится копирование этих данных в MS Excel, ее следует заменить на запятую.

Сравнение графиков, построенных для двух разных документов, позволяет более наглядно показать имеющиеся совпадения и различия колебаний плотности печати (рис. 7, 8).


Рис. 7. Сопоставление фрагментов изображений двух разных документов.


Рис. 8. Сопоставление графиков поперечной плотности печати документов, показанных на рисунке 5.

Вертикальное полошение на сплошной заливке можно сравнить с динамическим следом в трасологии: график плотности печати сплошной заливки выступает аналогом профилограммы следа. При этом так же, как амплитуда колебаний профилограммы, зависит от силы давления следообразующего объекта, амплитуда колебаний графика плотности печати зависит от интенсивности распечатанных заливок. Так, в верхней части рисунка 9 показаны одномасштабные графики плотности печати, полученные на черной, серой и светло-серой заливках, напечатанных одним принтером.


Рис. 9. Одномасштабные и нормализованные графики плотности печати заливок разной интенсивности.

Прямое сопоставление формы одномасштабных графиков может быть затруднительным, но поскольку объектами сравнения являются не изображения, а массивы числовых данных, их можно нормализовать. В настоящей работе нормализация данных выполнялась средствами программы MS Excel и включала следующие операции.

1. Копирование результатов из окна Plot Values программы ImageJ на лист MS Excel.

2. Замена точек, разделяющих целые и дробные части чисел, на запятые.

3. Удаление значений, соответствующих неокрашенным краям изображения, учет которых в дальнейших расчетах приводит к искажению результатов.

4. Вычисление среднего значения плотности печати.

5. Деление всех значений плотности печати на среднее.

По неизменным координатам и нормализованным к среднему значениям плотности печати строят графики, которые показывают совпадения и различия распределения плотности печати более наглядно, чем графики, построенные по исходным данным (рис. 9, внизу).

Наряду с наглядностью представления результатов, преимуществом численных данных является возможность их статистического анализа. Таким образом, если исследовать горизонтальное полошение, можно получить график, аналогичный приведенному на рисунке 10, где имеется несколько похожих по форме участков, что явно указывает на наличие повторяющихся особенностей.


Рис. 10. График продольной плотности печати сплошной заливки.

Как было указано выше, горизонтальное полошение является результатом воздействия валов печатающего механизма, поэтому можно предполагать, что некоторые из этих повторяющихся особенностей имеют характерные размеры, равные длине окружности валов.

Вопросам исследования горизонтального полошения посвящен ряд публикаций зарубежных авторов [12, 13], где колебания яркости изображения рассматриваются как пространственный сигнал, содержащий гармоники, длины волн которых равны длинам окружностей валов печатающего механизма и величине шага зубьев шестерен передачи. Для выявления периодических компонент в таком сигнале предлагается использовать преобразование Фурье. Результатом преобразования является спектр, который показывает амплитуды и длины волн колебаний, имеющихся в исследуемом сигнале.

В ходе настоящего исследования с помощью программы Matlab проводили спектральный анализ графиков продольной плотности печати сплошных заливок и полутоновых изображений, напечатанных на различных принтерах.

В результате установили, что на всех полученных спектрах выделяются гармоники с длинами волн от нескольких единиц до десятков миллиметров. Например, на спектре (рис. 11) выделяются гармоники с длинами волн 72, 48 и 32 мм, которые с некоторой погрешностью соответствуют длине окружности фотобарабана, магнитного вала и вала заряда принтера, на котором была напечатана исследуемая сплошная заливка.


Рис. 11. Спектр Фурье графика продольной плотности печати.

На распечатках, полученных с помощью принтеров с фотобарабанами большого диаметра, точность спектрального анализа в длинноволновой части заметно снижается. Это связано с тем, что за время печати листа фотобарабан успевает совершить только 2–3 оборота. В коротковолновой части спектра во всех случаях гармоники выделяются с высокой точностью, поэтому при наличии сведений об основных параметрах шестерен зубчатых передач появляется теоретическая возможность определить марку и модель принтера, на котором напечатан исследуемый документ, а в случае существенных дефектов зубчатой передачи – идентифицировать конкретное устройство. Представляется, что спектральный анализ горизонтальных колебаний плотности печати является одним из перспективных методов исследования сплошных заливок и полутоновых изображений, а исследование изменений плотности печати сплошных заливок в продольном и поперечном направлении позволяет получить сведения, которые могут иметь важное значение как для групповой, так и для индивидуальной идентификации лазерных принтеров.


Исследование площади одноименных печатных элементов

Приведенный выше метод определения плотности печати невозможно применить к текстовым документам, которые на практике встречаются намного чаще, чем документы, имеющие протяженные участки сплошных заливок. Для анализа плотности печати на текстовых массивах необходимо усреднять значения яркости только тех пикселей, которые формируют изображение печатных элементов.

Достоинством предложенного П.В. Зотовым и В.М. Зотовым [14] метода является возможность без какой-либо дополнительной подготовки исследовать массивы текста, набранные шрифтами различных начертаний и размеров. Но поскольку выбранный авторами алгоритм фактически сводится к преобразованию массива текста в сплошную заливку, данный метод обладает теми же недостатками, что и непосредственное визуальное сравнение сплошных заливок.

В ряде тематических работ отмечается, что изображения одинаковых печатных элементов, напечатанных на лазерном принтере в разных частях листа, претерпевают различные искажения, включая изменения их пропорций и площади [15, 16].

В статье Дж. Чана (J.S. Tchan) приведены данные о результатах измерений площади символов [16]. Используемый автором способ измерений имеет высокую точность, однако требует больших временных затрат, в связи с чем в ходе исследования определялась площадь только отдельных символов в разных частях листа.

Если пожертвовать точностью определения площади символов, можно использовать более простые средства и методы, что позволит определить площадь большого числа символов и более наглядно представить полученные результаты. Такое исследование было проведено в рамках настоящей работы. В качестве объекта использовали текст второй страницы тестового документа (рис. 1). Использование в массиве текста единственного символа позволяет проводить непосредственное сравнение полученных результатов без их дополнительной статистической обработки.

При использовании программы ImageJ для вычисления площади символов необходимо выполнить следующие операции.

1. Запустить программу и открыть исследуемое изображение.

2. Воспользовавшись меню , в окне Thereshold определить порог бинаризации7, применить операцию к открытому изображению, нажав кнопку Apply (рис. 12).


Рис. 12. Меню Image программы ImageJ и окно «Thereshold».

3. Воспользовавшись меню «Analyze\Set Measurements», в окне Set Measurements выбрать вычисляемые параметры Area и Center of mass (рис. 13).


Рис. 13. Меню Analyze программы ImageJ и окно Set Measurements.

4. В окне изображения с помощью инструмента Rectangle выделить область интереса (рис. 14).


Рис. 14. Окно изображения, в котором выделена отмеченная желтой рамкой область интереса – строка символов.

5. Воспользовавшись меню «Analyze\ Analyze Particles», в окне Analyze Particles задать минимальный и максимальный размеры анализируемых фигур, выбрать опцию Display results (рис. 15).


Рис. 15. Меню Analyze программы ImageJ, окна Analyze Particles и Results.

6. После подтверждения настроек в окне Analyze Particles вычисления выполняются автоматически, результаты, представленные в окне Results, можно сохранить через меню «File\Save As» или скопировать в буфер обмена последовательностью команд меню «Edit\Select All», «Edit\Copy».

Скопировав полученные результаты на лист MS Excel и заменив разделители целой и дробной части чисел, по данным третьего (XM) и второго (Area) столбцов можно построить график зависимости площади символа от его расположения в строке. Такие графики для первых трех строк текста показаны на рисунке 16, для всех 44 строк тестовой страницы – на рисунке 17.


Рис. 16. График распределения площадей трех строк одноименных символов.


Рис. 17. Совмещение точечного графика распределения площадей одноименных символов в 44 строках документа и нормализованного графика плотности сплошной заливки, напечатанной тем же принтером.

Совмещение точечного графика распределения площадей одноименных символов и нормализованного графика поперечной плотности печати, полученного на распечатке сплошной заливки, выполненной на том же принтере, показывает очевидную корреляцию между площадью символов и плотностью печати сплошной заливки. Это позволяет предполагать, что наблюдаемые колебания плотности печати сплошной заливки и площади печатных элементов имеют общие причины.

Значения площади символов группируются в отдельные столбцы, имеющие совпадающие или близкие значения координаты ХМ (рис. 17). Источником значений площади в каждом из этих столбцов являются столбцы символов в массиве текста. Такое выраженное разделение значений по столбцам характерно только для текстов, набранных моноширинным шрифтом. Значения площади в каждом из столбцов графика различаются на 10–15 %, разница между минимальным и максимальным значениями площади может составлять 20–25 %, в результате чего все полученное распределение приобретает вид волнистой полосы. Исходя из характера влияния, оказываемого деталями принтера на распределение тонера, можно полагать, что высота этих столбцов и ширина полосы в целом зависят от неоднородности свойств, интенсивности износа и загрязнения поверхности фотобарабана и валов печатающего механизма, а расположение, ширина и амплитуда «волн» в значительной степени – от величины зазора между валом проявки и дозирующим лезвием.

Сравнение распределений для текстов, напечатанных на принтерах одной модели, показывает, что влияние конкретной конструкции принтера и картриджа на форму распределения трудноили вовсе неразличимо на фоне влияния, которое оказывают на нее неоднородность свойств, износ и загрязнение деталей печатающего механизма (рис. 18).


Рис. 18. Графики распределения площадей символов в документах, напечатанных на двух различных принтерах HP LaserJet 1102, имеющих различный износ.

Для исследования колебаний площади символов в продольном направлении график распределения необходимо строить по данным четвертого (YM) и второго (Area) столбцов данных (рис. 19).


Рис. 19. Графики распределения площадей символов в документах, напечатанных на двух различных принтерах HP LaserJet 1102, имеющих различный износ.

На графиках продольного распределения наблюдается явная периодичность колебаний полос распределения. Принимая во внимание «длину волны» этих колебаний, можно сделать вывод, что основной вклад в колебания вносят фотобарабаны принтеров.

Анализ работы механизма печатающего устройства позволяет предположить, что по мере его износа увеличивается неоднородность свойств поверхности фотобарабана, и уменьшается ее общая способность удерживать тонер. Это должно приводить к увеличению ширины полосы распределения (за счет неоднородности свойств фотобарабана) и снижению ее среднего уровня (за счет уменьшения площади символов). На графиках (рис. 18 и 19) распределение, соответствующее более изношенному принтеру, имеет большую ширину и расположено ниже, что не противоречит выдвинутой гипотезе. Вместе с тем для ее подтверждения необходим более детальный анализ изменений на протяжении всего срока эксплуатации картриджа.

Используя обе координаты символов, средствами программ Matlab или Surfer можно построить графики распределения площадей в виде контурных диаграмм, где для каждой точки, координаты которой соответствуют координатам центра масс символа, цвет определяется площадью этого символа, а цвет промежуточных точек вычисляется методом интерполяции. В качестве примера таких контурных диаграмм на рисунке 20 показаны диаграммы, построенные по тем же данным, что и графики на рисунках 18 и 19.


Рис. 20. Контурные диаграммы площади символов для двух принтеров HP LaserJet 1102.

Исследование графиков распределения площадей символов в документах, напечатанных на разных принтерах, показывает, что высота расположения, ширина и форма полос продольного и поперечного распределений образуют совокупность признаков печатающего устройства, обладающую достаточно высокой степенью индивидуальности (рис. 21), что позволяет использовать данные признаки как для дифференциации, так и для идентификации печатающих устройств.


Рис. 21. Графики распределения площадей символов в документах, напечатанных на 6 различных принтерах.


Исследование площади произвольных печатных элементов

В отличие от использованных в исследовании экспериментальных текстов, реальные документы содержат все символы алфавита и цифры. Очевидно, что площади этих символов сильно отличаются, что необходимо учитывать при построении распределения. Возможным решением будет использование не абсолютной, а относительной площади символа.

Предположим, что в массиве текста, набранного шрифтом одного начертания и размера, имеется n символов «a». Обозначим площадь произвольного символа ai как Si, где i – порядковый номер символа в последовательности одноименных, принимающий значение от 1 до n. Тогда среднее значение площади символов «а» можно вычислить по формуле:


Введем понятие относительной площади символа, определяемой как


Если значение Si показывает абсолютную площадь символа, выраженную в кв. пикселях, то Si определяет, во сколько раз площадь этого символа отличается от ее среднего значения.

График поперечного распределения относительной площади символов, построенный для второй страницы тестового документа (рис. 22), ничем, кроме значений вертикальной оси, не отличается от графика, показанного на рисунке 17.


Рис. 22. Точечный график распределения относительных площадей одноименных символов в 44 строках документа.

Чтобы построить такой график для произвольного текста, необходимо сначала вычислить S для каждой совокупности одноименных символов, а затем Si для каждого символа этой совокупности. Выделение совокупностей одноименных символов и расчет их относительных площадей вручную достаточно трудоемок. Однако отработанный алгоритм и некоторые технические приемы позволяют выполнить эти действия в обозримые сроки.

Исследование выполняется поэтапно: от наиболее частотных букв алфавита к менее частотным. Частотность букв русского алфавита [17] приведена в таблице.


Таблица. Частотность букв русского алфавита (по данным Национального корпуса русского языка).

Наиболее целесообразно проводить исследование в следующем порядке.

1. Открыть в графическом редакторе цифровую фотографию документа и удалить изображения всех символов, кроме исследуемого на данном этапе (например, строчная «о»), сохранить результат в отдельном файле (рис. 23).


Рис. 23. Изображение исходного документа и отредактированное изображение, из которого удалены все символы, кроме анализируемого.

2. Открыть полученный файл в программе ImageJ и определить площади символов, как описано в предыдущем разделе.

3. Скопировать полученные данные в MS Excel, вычислить среднюю площадь символов, затем, используя формулы и ссылки на постоянные ячейки, сформировать столбец значений относительной площади.

4. Скопировать значения координат и относительных площадей на отдельный лист.

5. Построить график распределения площадей (рис. 24).


Рис. 24. Точечный график распределения относительных площадей символов «о» в документе.

6. В случае, если полученный график недостаточно полно описывает форму распределения, перейти к следующей по частотности букве, выполнить пункты 1–3, добавить полученные значения координат и относительных площадей на лист с предыдущими результатами, вновь построить график.

Прописные буквы и цифры, встречающиеся реже всего, целесообразно обрабатывать в последнюю очередь. Для того чтобы распределение было статистически более представительным, буквы «е» и «ё», «и» и «й» можно объединить в единый массив. Диакритические знаки не будут учитываться при вычислении площади, если правильно подобрать значение нижней границы параметра Size (рис. 15). Символы, встречающиеся на странице менее 5 раз, можно не анализировать.

После вычисления относительной площади достаточного количества символов можно построить итоговый график распределения относительных площадей (рис. 25). Сравнение графиков распределения абсолютных (рис. 17) и относительных (рис. 25) площадей показывает, что форма распределений с достаточной точностью совпадает, а значит, выбранная схема нормализации работоспособна, и полученное распределение так же, как и описанное в предыдущем разделе, можно использовать для идентификации или дифференциации принтеров.


Рис. 25. Точечный график распределения относительных площадей всех символов в документе.

Некоторым недостатком сравнения относительных площадей является то, что из сравнительного исследования «выпадает» абсолютная площадь символов. Как видно из из рисунка 21, площадь одноименных символов, напечатанных на разных принтерах, может сильно различаться. При сравнении относительных площадей символов, напечатанных на разных принтерах, графики будут различаться по форме полосы распределения и, возможно, по ее ширине, но не по высоте. Для того чтобы учесть и этот признак, помимо сопоставления значений относительных площадей разных символов, целесообразно проводить и сравнение значений абсолютных площадей одноименных символов.


Выводы

Результаты проведенного исследования позволяют сделать следующие выводы.

1. Плотность печати на лазерных принтерах неоднородна по листу и определяется групповыми и индивидуальными особенностями печатающего механизма принтера.

2. Площадь символов текста коррелирует с плотностью печати.

3. Анализ формы распределения плотности печати и формы распределения площади символов по странице позволяют выявить индивидуальные особенности печатающего механизма принтера.

4. Для выявления указанных признаков печатающего устройства могут быть использованы доступные технические и программные средства.

Предлагаемые методы исследования достаточно просты в реализации, позволяют получить наглядные результаты и могут способствовать решению задач криминалистической идентификации и дифференциации лазерных принтеров.

Список литературы:

1. Шашкин С.Б. Основы судебно-технической экспертизы документов, выполненных с использованием средств полиграфической и оргтехники (теоретический, методологический и прикладной аспекты) / Теория и практика судебной экспертизы. Сборник статей / Составитель А.В. Пахомов. СПб.: Питер, 2003. C. 325–592.

2. Стариков Е.В., Белоусов А.Г., Белоусов Г.Г., Кузнецов В.В. Комплексное криминалистическое исследование средств защиты ценных бумаг и денежных билетов. Учебное пособие. М.: ГУ ЭКЦ МВД России, 2002. 64 с.

3. LaPorte G.M. The Use of an Electrostatic Detection Device to Identify Individual and Class Characteristics on Documents Produced by Printers and Copiers – A Preliminary Study // Journal of Forensic Sciences. 2004. Vol. 49. Issue 3. P. 610–620. https://doi.org/10.1520/JFS2003307

4. Четверкин П.А., Ефименко А.В. Идентификация средств оргтехники по следам бумагопроводящих механизмов // Теория и практика судебной экспертизы. 2015. № 3 (39). С. 89–98.

5. Ефименко А.В. Судебно-техническая экспертиза документов, изготовленных с использованием электрофотографических печатающих устройств. Монография. Саратов: СЮИ МВД России, 2010. 180 с.

6. Шведова К.А. Классификации современных способов полиграфической печати (технико-криминалистический аспект) // Судебная экспертиза. 2020. № 4 (64). С. 141–150. https://doi.org/10.25724/VAMVD.QSTU

7. Лебедев Л.В., Мнацаканян В.У., Погонин А.А., Схиртладзе А.Г., Тимирязев В.А., Шрубченко И.В. Технология машиностроения. Учебник для вузов. М.: Академия, 2006. 528 с.

8. Печеровый В.В. Профилактика и ремонт МФУ и лазерных принтеров Canon и Hewlett Packard. М.: Ремонт и сервис, 2013. 102 с.

9. Мильчин А.Э. Издательский словарь-справочник. М.: ОЛМА-Пресс, 2003. 560 с.

10. Ewe M.T.S., Chiu G.T.C., Grice J., Allebach J.P., Chan C.S., Foote W. Banding Reduction in Electrophotographic Processes Using Piezoelectric Actuated Laser Beam Deflection Device // Journal of Imaging Science and Technology. 2002. Vol. 46. No. 5. P. 433–442.

11. Конюхов А.Л. Руководство к использованию программного комплекса ImageJ для обработки изображений. Учебное методическое пособие. Томск: ТУСУР, 2012. 105 с.

12. Chiang P.-J., Khanna N., Mikkilineni A.K., Segovia M.V.O., Suh S., Allebach J.P., Chiu G.T.C., Delp E.J. Printer and Scanner Forensics // IEEE Signal Processing Magazine. 2009. Vol. 26. No. 2. P. 72–83. http://doi.org/10.1109/msp.2008.931082

13. Ali G., Chiang P.-J., Mikkilineni A.K., Allebach J.P., Chiu G.T., Delp E.J. Intrinsic and Extrinsic Signatures for Information Hiding and Secure Printing with Electrophotographic Devices. IS&T’s NIP19: International Conference on Digital Printing Technologies. 2003. P. 511– 515.

14. Зотов П.В., Зотов В.М. Математическая модель выявления неравномерности распределения тонера электрофотографических печатающих устройств // Известия Волгоградского государственного технического университета. 2013. № 14 (117). С. 14–18.

15. Wu Y., Kong X. Xin’gang Y., Yiping G. Printer Forensics Based on Page Document’s Geometric Distortion / 16th IEEE International Conference on Image Processing (November 7–10, 2009, Cairo, Egypt). 2009. P. 2909–2912. http://doi.org/10.1109/ICIP.2009.5413420

16. Tchan J. Forensic Examination of Laser Printers and Photocopiers Using Digital Image Analysis to Assess Print Characteristics // Journal of Imaging Science and Technology. 2007. Vol. 51. No. 4. P. 299–309. http://doi.org/10.2352/j.imagingsci.technol

17. Ляшевская О.Н., Шаров С.А. Частотный словарь современного русского языка на материалах Национального корпуса русского языка. М.: Азбуковник, 2009. 1112 c.

Обсуждение

0 комментариев

Свежие новости

Похожие материалы

Ваши данные отправлены