Изменение № 2 ГОСТ Р ИСО/МЭК 19794-5-2006 Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица
Утверждено и введено в действие Приказом Федерального агентства по техническому регулированию и метрологии от 25.07.2013 № 444-ст
Дата введения - 2013-10-01
Введение дополнить абзацем (после второго):
«Также настоящий стандарт устанавливает требования к формату обмена биометрическими данными для хранения трехмерных изображений лица».
Раздел 3 дополнить ссылкой:
«ИСО/МЭК 15948:2004 Информационные технологии. Компьютерная графика и обработка изображения. Мобильная сетевая графика (PNG). Функциональная спецификация».
Подраздел 4.16 изложить в новой редакции:
«4.16 двухмерное изображение (2D image): Двухмерное представление яркости и/или текстуры объекта в определенных условиях освещения».
Раздел 4 дополнить подразделами - 4.24 - 4.34:
«4.24 трехмерное изображение (3D image): Представление поверхности в трехмерном пространстве.
4.25 трехмерная карта точек (3D point map): Трехмерная сеть точек, представляющая объект съемки, в которой каждая точка записывается с помощью значений координат х, у и z в трехмерном пространстве.
4.26 трехмерное представление вершин (3D vertex representation): Представление, использующее трехмерные координаты вершин и треугольники между ними для кодирования трехмерной поверхности.
4.27 антропометрическая точка (anthropometric landmark): Контрольная точка на лице, используемая для распознавания и классификации людей.
4.28 код антропометрической точки (anthropometric landmark code): Код, состоящий из двух частей, который уникальным образом идентифицирует антропометрическую точку.
4.29 прямоугольная система координат (Cartesian coordinate system): Трехмерная прямоугольная система координат.
4.30 цилиндрическая система координат (cylindrical coordinate system): Трехмерная система координат, описывающая положение точки в пространстве с помощью трех координат радиуса, азимута и высоты.
4.31 карта глубины (range image): Числовая матрица, кодирующая точки поверхности в трехмерном пространстве, в которой координаты ячейки кодируют положение точки (первые две координаты), а значение в этой ячейке кодирует третью координату.
4.32 формат PNG (PNG format): Стандарт сжатия изображения без потерь, спецификация которого установлена в ИСО/МЭК 15948.
4.33 текстура (texture): Двухмерное представление яркости и/или цвета объекта съемки в определенных условиях освещения.
4.34 матрица текстурной проекции (texture projection matrix): Матрица с размером 3´4 для преобразования трехмерной координаты поверхности из прямоугольной системы координат в двухмерную координату текстурного изображения, в котором используются трехмерные однородные координаты точки в трехмерном пространстве, а также двухмерные однородные координаты точки в двухмерном пространстве.
Примечание - Более подробная информация приведена в [13]».
Подраздел 5.1 изложить в новой редакции:
«5.1 Общие положения
Формат записи изображения лица, определенный настоящим стандартом, предназначен для хранения данных изображения лица в записи биометрических данных. Каждая запись должна относиться к одному и тому же индивиду, содержать не менее одного изображения лица и может дополнительно включать геометрические представления лица (карты глубины, трехмерные карты точек, трехмерные представления вершин). Данная запись встраивается в блок биометрических данных, соответствующий требованиям ЕСФОБД. Структура записи представлена на рисунках 2 и 3 (рисунки 2 и 3 помещены на вкладках).
Рисунок 2 - Формат записи изображения лица
Примечание - Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки. Светло-серые прямоугольники обозначают обязательные поля, требования к значениям которых не установлены. Темносерые прямоугольники обозначают необязательные поля. Следует обратить внимание на то, что блок информации о трехмерном изображении и блок данных трехмерного изображения являются обязательными для трехмерных типов.
Рисунок
3 - Блок информации о трехмерном изображении и три возможных блока данных
трехмерного изображения,
обозначенных в настоящем стандарте
Примечание - Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки, светло-серые прямоугольники обозначают обязательные поля, требования к значениям которых не установлены, а темно-серые - необязательные для заполнения поля.
Для соответствия данному формату заголовок и вся структура данных должны соответствовать требованиям ЕСФОБД, а данные изображения лица кодироваться в формате JPEG или JPEG2000.
В настоящем стандарте при ссылках на элементы формата записи изображения лица «поле» обозначает минимальную область данных, например, поле типа изображения лица или поле типа данных изображения; «блок» - группу полей, например блок информации о лице или блок информации об изображении; а «запись» - биометрическую запись, которая состоит из заголовка записи изображения лица и одной или более областей данных записи изображения лица.
Все данные представлены в двоичном формате за исключением полей идентификатора формата и номера версии стандарта, являющихся строками ASCII с нулевым символом на конце.
В формате не используются разделители записей или отметки полей. Разграничение полей осуществляется только путем подсчета байтов.
Структура записи изображения лица организована следующим образом:
а) заголовок записи изображения лица фиксированного размера (14 байтов), содержащий информацию о записи, включая число представлений изображений лица и длину всей записи в байтах;
б) блок данных записи изображения лица для каждого изображения лица, содержащий:
- блок информации о лице, фиксированного размера (20 байтов), в котором определяются различимые характеристики объекта, например пол;
- несколько (или ни одного) блоков контрольных точек фиксированного размера (8 байтов), определяющих двухмерные или трехмерные контрольные точки на лице;
- блок информации об изображении фиксированного размера (12 байтов), в котором определяются цифровые параметры изображения, например тип изображения лица и его горизонтальные и вертикальные размеры;
- данные изображения, состоящие из блоков данных, которые кодированы в формате JPEG или JPEG2000;
- блок информации о трехмерном изображении (92 байта) для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием свойств этих данных);
- блок данных трехмерного изображения для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием трехмерной геометрии лица).
В одной записи ЕСФОБД могут быть определены несколько изображений (трехмерных представлений) одного и того же биометрического объекта. Это обеспечивается включением нескольких блоков данных записи изображения лица после заголовка записи изображения лица и перед блоком подписи ЕСФОБД. Блоки данных записи изображения лица, содержащие данные двухмерного изображения, можно сохранять совместно с блоками данных записи изображения лица, содержащими также и данные трехмерного изображения. Структура такого встраивания изображена на рисунке 3а.
Рисунок
3а - Встраивание нескольких двухмерных и трехмерных изображений
в одну запись»
Подраздел 5.4. Таблицу 2 изложить в новой редакции:
«Таблица 2 - Блок заголовка записи изображения лица
Поле |
Длина |
Возможные значения |
Примечания |
Идентификатор формата |
4 байта |
0´46414300 (‘F’ ‘А’ ‘С’ 0´0) |
Указывает данные представления |
Номер версии стандарта |
4 байта |
0´30323000 (‘0’ ‘2’ ‘0’ 0´0) |
«020» в формате ASCII |
Длина записи |
4 байта |
48 < длина записи £ 232-1 |
Включает заголовок записи изображения лица и данные записи изображения лица |
Число изображений лица/трехмерных представлений |
2 байта |
1 £ число £ 65535 |
|
Пункт 5.4.2 изложить в новой редакции:
«5.4.2 Номер версии стандарта
Поле номера версии стандарта (4 байта) должно содержать три символа строки ASCII с нулевым символом на конце.
Первый и второй символы обозначают номер версии стандарта, третий символ - номер поправки или изменения данной редакции.
Номер данной версии стандарта ИСО/МЭК 19794-5 должен быть 0´30323000; «020» - номер версии 2, номер поправки/изменения 0».
Подраздел 5.6 с пунктами 5.6.1 - 5.6.3 изложить в новой редакции:
«5.6 Блок контрольной точки
Необязательный для заполнения блок контрольной точки (8 байтов) определяет тип, код и положение контрольной точки на изображении лица. Число блоков контрольной точки определяется в поле «Число контрольных точек» блока информации о лице. Структура такого блока представлена в таблице 8.
Таблица 8 - Блок контрольной точки
Поле |
Размер, байт |
Значение |
Примечания |
Тип контрольной точки |
1 |
см. пункт 5.6.1 |
Определяет тип контрольной точки |
Код контрольной точки |
1 |
см. пункт 5.6.2 |
Определяет контрольную точку, например левый глаз |
X координата, Y координата |
2 |
Определяет координату контрольной точки. Для типов контрольной точки 0´01 и 0´02 эта координата обозначает соответствующий номер пикселя, принимая за 0 верхний левый пиксель изображения. Для типов контрольной точки 0´03 значение кодирует соответствующую координату точки в трехмерной системе координат |
|
Z координата |
2 |
Определяет Z координату контрольной точки. Для контрольных точек типа 0´01 и типа 0´02 это поле игнорируется. Для контрольной точки типа 0´03 значение кодирует Z координату в трехмерной системе координат |
Контрольные точки могут указываться как контрольные точки стандарта MPEG-4 в соответствии с ИСО/МЭК 14496-2 (приложение С) или как антропометрические точки с двухмерными или трехмерными координатами. Определение антропометрических точек и их взаимосвязь с набором контрольных точек MPEG-4 приводятся в 5.6.5.
Горизонтальное и вертикальное положения контрольных точек указываются в координатах текстурного изображения или в прямоугольной системе координат (см. 5.9.2.1).
Поле типа контрольной точки (1 байт) определяет тип контрольной точки, записанной в блоке контрольной точки. Это поле должно иметь значение 0´01 для обозначения двухмерной контрольной точки стандарта MPEG-4 в соответствии с ИСО/МЭК 14496-2 (приложение С), представленной двухмерными координатами в системе координат изображения. Поле должно иметь значение 0´02 для обозначения контрольной точки как двухмерной антропометрической контрольной точки, представленной двухмерными координатами в системе координат изображения. Значение 0´03 для этого поля устанавливается для обозначения трехмерной антропометрической контрольной точки, представленной своими координатами в трехмерной системе координат. Все другие значения поля зарезервированы для будущего определения новых типов контрольных точек.
Таблица 8а - Тип контрольной точки
Описание |
Значение |
Комментарий |
MPEG-4 |
0´01 |
Горизонтальное и вертикальное положения контрольной точки измеряются в пикселях со значениями, варьирующимися в диапазоне от 0 до Ширины-1 и Высоты-1 соответственно. Поле Z координаты не указывается |
Двухмерная антропометрическая точка |
0´02 |
Контрольная точка является антропометрической точкой двухмерного изображения и ее координаты измеряются в пикселях со значениями, варьирующимися в диапазоне от 0 до Ширины-1 и Высоты-1 соответственно. Поле Z координаты не указывается |
Трехмерная антропометрическая точка |
0´03 |
X координата, Y координата и Z координата являются 2-х байтными значениями с постоянным показателем точности 0,02 мм в диапазоне от минус 655,34 мм до 655,34 мм. Контрольная точка является трехмерной точкой в декартовой системе координат. Пример: значение «10001» соответствует «-655,34 мм + 10001 ´ 0,02 мм = -455,32 мм» |
Зарезервировано для будущего использования |
0´04 - 0´FF |
Зарезервировано для будущего использования |
Поле кода контрольной точки (1 байт) определяет контрольную точку, записанную в блоке контрольной точки.
Для типа контрольной точки 0´01 в этом блоке должны быть сохранены коды контрольных точек MPEG-4, указанные в 5.6.3 в соответствии с ИСО/МЭК 14496-2:2004 (приложение С) и определенные как контрольные точки MPEG-4 или дополнительные контрольные точки глаз и ноздрей из 5.6.4.
Для типов контрольных точек 0´02 или 0´03 в этом блоке записываются коды контрольных точек, определенных в 5.6.5.
5.6.3 Контрольные точки MPEG-4
Коды, присвоенные контрольным точкам в соответствии с ИСО/МЭК 14496-2 (приложение С) показаны на рисунке 6. Код каждой контрольной точки задается условными обозначениями в формате «А.В». Значение А является основным, а значение В - дополнительным. Кодировка контрольной точки производится записью значения (1 байт), полученного по формуле А* 16 + В.
Код каждой контрольной точки, показанной на рисунке 7, задается основным значением А и дополнительным значением В. Например, код для левого угла левого глаза задается основным значением 3 и дополнительным значением 7».
Наименование и подрисуночную надпись рисунка 6 изложить в новой редакции (рисунок 6 остается без изменений):
«• - Контрольные точки, имеющие соответствующие им антропометрические точки
° - Другие контрольные точки
Рисунок 6 - Коды контрольных точек MPEG-4 по ИСО/МЭК 14496-2».
Наименование рисунка 7 изложить в новой редакции (рисунок 7 остается без изменений):
«Рисунок 7 - Контрольные точки центров глаз и ноздрей, определяемые относительно середины отрезков между контрольными точками MPEG-4».
Пункт 5.6.4 изложить в новой редакции (таблица 9 остается без изменений):
«5.6.4 Контрольные точки центров глаз и ноздрей
Контрольные точки центров глаз 12.1 (левого) и 12.2 (правого) определяются как середины отрезков, соединяющих углы глаз (3.7, 3.11) и (3.8, 3.12) соответственно. Контрольная точка центра левой ноздри 12.3 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.1, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольная точка центра левой ноздри 12.4 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.2, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольные точки центров глаз и ноздрей изображены на рисунке 7, а их значения приведены в таблице 9».
Раздел 5 дополнить пунктами - 5.6.5 - 5.6.7:
«5.6.5 Антропометрические точки
Антропометрические точки расширяют модель MPEG-4 новыми точками, которые уже давно используются в криминалистике и антропологии для идентификации человека с помощью двух изображений лица или изображения лица и черепа.
На рисунке 7а и в таблице 9а приводится определение антропометрических точек. Набор точек представляет собой черепно-лицевые контрольные точки на голове и лице. Последние используются в криминалистике для идентификации по принципу «Лицо с лицом» или «Череп с лицом». Некоторые из этих точек имеют эквиваленты в MPEG-4, другие - не имеют.
Рисунок 7а - Антропометрические точки, которые имеют (красные)
и не имеют (синие)
эквиваленты в MPEG-4 Определения данных точек приведены
в таблице 9а.
Таблица 9а - Определения антропометрических точек
Идентификатор точки |
Код точки |
Код точки MPEG-4 |
Название антропометрической точки |
Определение точки |
v |
1.1 |
11.4 |
верхушечная (vertex) |
Наивысшая точка головы при ее ориентации на Франкфуртскую горизонталь. Определение Франкфуртской горизонтали приводится в приложении Г |
g |
1.2 |
|
надбровная (glabella) |
Наиболее выступающая средняя точка между бровями |
op |
1.3 |
|
затылочная (opisthocra nion) |
Точка в затылочной части головы, наиболее удаленная от надбровной точки |
eu |
1.5 1.6 |
|
теменная (eurion) |
Наиболее выступающие боковые точки на каждой стороне черепа в области теменной и височной костей |
ft |
1.7 1.8 |
|
лобно-височная (fronto-temporale) |
Точки на каждой стороне лба, сбоку от возвышения височной линии |
tr |
1.9 |
11.1 |
волосяная (trichion) |
Точка на границе волосистой части лба по срединной линии |
zy |
2.1 2.2 |
|
скуловая (zygion) |
Наиболее выступающая снаружи точка скуловой части |
go |
2.3 2.4 |
2.15 2.16 |
нижнечелюстная (gonion) |
Наиболее выступающая боковая точка угла нижней челюсти рядом с центром угла нижней челюсти |
sl |
2.5 |
|
подгубная (sublabiale) |
Нижний край нижней губы или верхний край подбородка |
pg |
2.6 |
2.10 |
погонион (pogonion) |
Передняя точка подбородочного выступа, расположенная на поверхности кожи перед идентичной костной точкой нижней челюсти |
gn |
2.7 |
2.1 |
низшая точка подбородка (или подбородочная точка) (menton, gnathion) |
Наиболее низкая срединная точка на нижнем крае нижней челюсти |
cdl |
2.9 2.10 |
|
выступ мыщелкового отростка нижней челюсти (condylion laterale) |
Наиболее выступающая снаружи точка на поверхности мыщелкового отростка нижней челюсти |
en |
3.1 3.2 |
3.11 3.8 |
эндокантион (endocanthion) |
Точка у внутренней смычки глазной щели |
ex |
3.3 3.4 |
3.7 3.12 |
экзокантион (или эктокантион) (exocanthion, ectocanthion) |
Точка у наружной смычки глазной щели |
p |
3.5 3.6 |
3.5 3.6 |
центральная точка зрачка (center point of pupil) |
Центральная точка зрачка при положении головы в состоянии покоя и направлении взгляда прямо вперед |
or |
3.7 3.8 |
3.9 3.10 |
орбитале (orbitale) |
Наиболее нижняя точка на нижнем крае глазницы |
ps |
3.9 3.10 |
3.1 3.2 |
точка верхнего века (palpebrale superius) |
Наиболее высокая точка в средней части свободного края верхнего века |
pi |
3.11 3.12 |
3.3 3.4 |
точка нижнего века (palpebrale inferius) |
Наиболее нижняя точка в средней части свободного края нижнего века |
os |
4.1 4.2 |
|
орбитале верхняя (orbitale superius) |
Наиболее высокая точка на нижнем крае брови |
sci |
4.3 4.4 |
4.3 4.4 |
надбровная (superciliare) |
Наиболее высокая точка верхнего края средней части брови |
n |
5.1 |
|
верхненосовая (nasion) |
Точка пересечения носолобного шва с передней срединной линией |
se |
5.2 |
|
средняя точка носолобного шва (или субназион) (sellion, subnasion) |
Наиболее глубокая точка, расположенная в нижней части носолобного угла |
al |
5.3 5.4 |
9.1 9.2 |
аларе (alare) |
Наиболее выступающая боковая точка крыла носа |
prn |
5.6 |
9.3 |
кончик носа (pronasale) |
Наиболее выступающая точка кончика носа |
sn |
5.7 |
9.15 |
нижненосовая (subnasale) |
Средняя точка угла носовой перегородки, в которой соединяются нижний край носовой перегородки с верхней губой |
sbal |
5.9 5.10 |
|
нижняя точка крыла носа (subalare) |
Точка на нижнем крае основания крыла носа, в которой основание крыла носа переходит в кожный покров верхней губы |
ac |
5.11 5.12 |
9.1 9.2 |
точка изгиба крыла носа (или вершина крыла носа) (alar curvature) |
Наиболее выступающая снаружи точка на изгибе крыла носа |
mf |
5.13 5.14 |
9.6 9.7 |
максиллофронтале (mаxillofrontale) |
Точка пересечения основания носа и средней линии от эндо- кантиона |
cph |
6.1 6.2 |
8.9 8.10 |
контрольная точка (christa philtri) криста фильтри |
Точка в возвышенной части подносового желобка сразу над контуром красной каймы губ |
ls |
6.3 |
8.1 |
точка лабиале (или лабрале) верхняя (labiale, labrale superius) |
Средняя точка верхнего контура красной каймы губ |
li |
6.4 |
8.2 |
точка лабиале (или лабрале) нижняя (labiale, labrale inferius) |
Средняя точка нижнего контура красной каймы губ |
ch |
6.5 6.6 |
8.3 8.4 |
хейлион (cheilion) |
Точка угла рта |
sto |
6.7 |
|
стомион (stomion) |
Воображаемая точка пересечения вертикальной средней лицевой линии и горизонтального среза между слегка закрытыми губами, при этом зубы сжаты в естественном положении |
sa |
7.1 7.2 |
10.1 10.2 |
вершина уха (superaurale) |
Наиболее высокая точка свободной части ушной раковины |
sba |
7.3 7.4 |
10.5 10.6 |
нижняя точка уха (subaurale) |
Наиболее нижняя точка свободной части мочки уха |
pra |
7.5 7.6 |
10.9 10.10 |
передняя точка уха (preaurale) |
Самая передняя точка уха, расположенная прямо напротив основания завитка ушной раковины |
ра |
7.7 7.8 |
|
задняя точка уха (postaurale) |
Наиболее выступающая назад точка свободной части уха |
obs |
7.9 7.10 |
10.3 10.4 |
верхняя точка крепления уха к голове (otobasion superious) |
Точка крепления завитка ушной раковины к височной области |
obi |
7.11 7.12 |
|
нижняя точка крепления уха к голове (otobasion inferious) |
Точка крепления мочки уха к щеке |
ро |
7.13 7.14 |
|
точка верхнего края наружного слухового прохода (мягкая) (porion (soft)) |
Наиболее высокая точка верхней части наружного слухового прохода |
t |
8.1 8.2 |
|
козелковая точка (tragion) |
Углубление в верхней части козелка |
Антропометрическая точка имеет следующий формат: «А.В», «А» определяет область на изображения лица, которой принадлежит эта контрольная точка, например нос, рот и т. д. «В» определяет отдельную точку в определенной параметром «А» области лица. Если контрольная точка имеет два симметричных образования (левое и правое), правое образование всегда имеет большее и четное значение параметра «А». В результате все контрольные точки на левой части изображения лица имеют нечетные дополнительные коды, а на правой - четные. Параметры «А» и «В» имеют значения в диапазоне от 1 до 15. Поэтому код А* 16 + В записывается в поле кода контрольной точки размером 1 байт.
5.6.6 Трехмерные антропометрические точки
Ошибка определения положения трехмерной антропометрической точки должна составлять не более 3 мм. Точка должна находиться от ближайшей точки поверхности на расстоянии не более 3 мм. Точкой на поверхности считается вершина, точка на ребре или точка на грани поверхности.
5.6.7 Z координата
Это поле не используется, если тип контрольной точки относится к контрольным точкам MPEG-4 или двухмерным антропометрическим точкам. Если тип контрольной точки относится к трехмерным антропометрическим точкам, это поле вместе с положением по горизонтали и положением по вертикали обозначает контрольную точку в трехмерной прямоугольной системе координат. Метрические координаты трехмерных контрольных точек вычисляются путем умножения X, Y и Z координат на постоянный коэффициент масштаба, равный 0,02 мм. Поле типа контрольной точки кодирует тип контрольной точки и определяет способ интерпретации Z координаты».
Пункт 5.7.1 изложить в новой редакции:
«5.7.1 Тип изображения лица
Поле типа изображения лица, согласно таблице 10, должно содержать информацию о типе изображения лица, записанного в блоке данных изображения и, при наличии, в блоке данных трехмерного изображения. Фронтальный тип изображения лица является полным фронтальным, условным фронтальным, либо полным фронтальным трехмерным или условным фронтальным трехмерным типом изображения лица. Поэтому не используется отдельное значение «фронтальный».
Таблица 10 - Коды типов изображения лица
Тип изображения лица |
Код |
Основной |
0´00 |
Полный фронтальный |
0´01 |
Условный фронтальный |
0´02 |
Зарезервировано для будущего использования |
0´03 - 0´7F |
Основной трехмерный |
0´80 |
Полный фронтальный трехмерный |
0´81 |
Условный фронтальный трехмерный |
0´82 |
Зарезервировано для будущего использования |
0´83 - 0´FF |
Основной тип изображения лица определен в разделе 6. Фронтальный, полный фронтальный и условный фронтальный типы изображения лица определены в разделах 7, 8 и 9 соответственно. Для данных типов изображения лица используется понятие «наследование». Например, фронтальный тип изображения лица наследует все требования, установленные для основного типа изображения лица, что означает, что фронтальный тип изображения лица подчиняется всем нормативным требованиям, установленным для основного типа изображения лица. Структура наследования типов изображения лица показана на рисунке 8. Взаимосвязь определена стрелками, идущими от дочерних элементов к родительским.
Рисунок 8 - Типы двухмерных изображений лица и их наследование
Примечание - Нормативные требования к основному, фронтальному, полному фронтальному и условному фронтальному типов изображения лица приведены в разделах 6, 7, 8 и 9 соответственно.
Если двухмерная запись, отвечающая требованиям основного, полного фронтального или условного фронтального типов изображений соответственно, содержит трехмерные данные, это определяется установкой единицы для старшего бита поля типа изображения лица, в результате чего код типа изображения лица задается в диапазоне от 0´80 до 0´82.
Трехмерные типы изображения лица приведены в разделах 10, 11 и 12 соответственно».
Раздел 5 дополнить подразделами - 5.9 с пунктами 5.9.1 - 5.9.14, подпунктами 5.9.2.1, 5.9.2.2 и 5.10 с пунктами 5.10.1 - 5.10.8:
«5.9 Блок информации о трехмерном изображении
Блок информации о трехмерном изображении состоит из следующих полей: длина блока информации о трехмерном изображении, тип системы координат, матрица текстурной проекции, масштаб, смещение, тип трехмерного представления, вспомогательные данные трехмерного изображения, зарезервированное для будущего использования поле, тип источника трехмерного изображения, тип устройства получения трехмерного изображения, синхронность получения двухмерного и трехмерного изображения, синхронность получения текстурной карты и трехмерного изображения, продолжительность получения трехмерного изображения, продолжительность получения текстурной карты, тип текстурной карты и спектр текстурной карты.
5.9.1 Длина блока информации о трехмерном изображении
Данное поле (4 байта) определяет размер блока информации о трехмерном изображении и данных трехмерного изображения, включая необязательные поля и блоки (при их наличии).
5.9.2 Тип системы координат
Исходные данные трехмерного изображения регистрируются в собственной системе координат устройства. С использованием значений внутренних параметров устройства получения трехмерного изображения данные трехмерного изображения могут быть преобразованы в метрические мировые координаты. Однако у этого способа имеется два недостатка:
- происходит потеря периодической структуры данных, созданной устройством получения трехмерного изображения, что приводит, например, к различиям в расстояниях между точками ввода данных;
- для обеспечения периодичности структуры в мировой системе координат требуется интерполяция. При этом исходные данные не сохраняются. Это может быть вполне приемлемо для многих приложений, однако настоящий стандарт предназначен в том числе и для сохранения исходных данных.
По этой причине настоящим стандартом предусмотрено несколько способов хранения данных трехмерного изображения в различных представлениях. Все представления поддерживают прямоугольную систему координат. Представление карты глубины дополнительно поддерживает цилиндрическую систему координат. В дальнейшем применение системы координат может быть ограничено для различных типов изображения лица (разделы 10 - 12 и подраздел А.7).
Преобразование в метрические мировые координаты определено соответствующими коэффициентами пересчета и неявными правилами (например, используемыми в типе трехмерной антропометрической точки), определенными в настоящем стандарте (см. 5.9.2.1 и 5.9.2.2).
Поле типа системы координат (1 байт) определяет систему координат данных трехмерного изображения посредством значений, указанных в таблице 14а.
Таблица 14а - Тип системы координат
Описание |
Значение |
Прямоугольная система координат |
0´00 |
Цилиндрическая система координат |
0´01 |
Зарезервировано для будущего использования |
0´02 - 0´FF |
Различные системы координат определяются в 5.9.2.1 и 5.9.2.2.
5.9.2.1 Прямоугольная система координат (рисунок 8а)
В прямоугольной системе координат начало отсчета данных, полученных с датчика, обычно используется в качестве начала отсчета системы координат.
Преобразование прямоугольных координат в метрические прямоугольные координаты производится следующим образом:
X = х * Масштаб Х + Смещение Х; Y = у * Масштаб Y+ Смещение Y; Z = z * Масштаб Z + Смещение Z |
(1) |
Для некоторых типов изображения лица началом отсчета системы прямоугольных координат является нос, т.е. контрольная точка prn, определенная в таблице 9а.
Примечание - Для определенных типов изображения лица определяются ограничения в отношении положения головы. Фронтальное положение определяется Франкфуртской горизонталью FH (см. приложение Г) в качестве плоскости XOZ и вертикальной плоскостью симметрии в качестве плоскости YOZ с осью Z, направленной в сторону взгляда лица.
Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое:
- требованиями к анатомическому расположению соответствующего двухмерного изображения лица;
- соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции.
Рисунок 8а - Пример прямоугольной системы координат
5.9.2.2 Цилиндрическая система координат (рисунок 8б)
Точка в цилиндрической системе координат задается координатами α, h, r. Угол α и ось h определяются таким образом, что они составляют правостороннюю систему координат.
Преобразование цилиндрических координат в метрические прямоугольные координаты производится следующим образом:
X = r * Масштаб Z * sin (α * Масштаб X) + Смещение Х; Y = h * Масштаб Y + Смещение Y; Z = r * Масштаб Z * cos (α * Масштаб X) + Смещение Z |
(2) |
Масштаб Х, Масштаб Y, Масштаб Z, Смещение Х, Смещение Y и Смещение Z являются обязательными постоянными величинами для преобразования. Масштаб Х измеряется в радианах. Масштаб Y, Масштаб Z, Смещение X, Смещение Y и Смещение Z измеряются в миллиметрах. Следует обратить внимание на то, что большие значения полей Масштаб X Масштаб Y или Масштаб Z указывают на низкое разрешение в соответствующем измерении.
Обычно начало отсчета данных, полученных с датчика, используется в качестве начала отсчета системы цилиндрических координат.
Для определенных типов изображения лица началом отсчета системы цилиндрических координат является нос, т. е. контрольная точка prn, определенная в таблице 9а.
Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое:
- требованиями к анатомическому расположению соответствующего двухмерного изображения лица;
- соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции.
Преобразование из цилиндрической в прямоугольную систему координат производится с помощью преобразования, определенного в 5.9.2.2, а затем с помощью преобразования, обратного преобразованию, определенному в 5.9.2.1.
Рисунок 8б - Пример цилиндрической системы координат
Примечание - FH означает Франкфуртскую горизонталь в соответствии с приложением Г.
5.9.3 Матрица текстурной проекции
Матрица текстурной проекции Р (размер 3´4, тип float, 48 байт) предназначена для отображения данных трехмерного изображения на текстурное двухмерное изображение блока данных изображения. Матрица записывается по рядам, начиная с верхнего левого угла.
Проецирование точки в трехмерном пространстве [X, Y, Z] на текстурное изображение блока данных изображения производится умножением матрицы текстурной проекции Р на так называемые однородные трехмерные координаты точки [13]:
[x, y, w]Т = Р*[X, Y, Z, 1]Т. |
(3) |
Однородные трехмерные координаты являются вектором четырех чисел [X, Y, Z, 1]Т. В данном случае X, Y, Z- это координаты точки в метрической прямоугольной системе координат. В результате умножения получается вектор [х, у, w]Т так называемых однородных двухмерных координат со вспомогательной координатой w. Для того чтобы получить двухмерные координаты пикселей текстурного изображения, следует разделить первые две координаты однородных двухмерных координат на соответствующую третью координату w. Таким образом, [x:w, y:w] - это результирующие координаты пикселей текстурного изображения, связанного с определенной трехмерной точкой [X, Y, Z]Т. Получаемые координаты являются значениями с плавающей точкой. В настоящем стандарте не регламентируются правила округления или интерполяции полученных значений до целочисленных значений координат пикселей.
При использовании цилиндрической системы координат для проецирования данных трехмерного изображения на текстуру требуется преобразовать трехмерные данные сначала в метрическую прямоугольную систему координат. В случае наложения на текстуру проецируется первая трехмерная точка по линии взгляда (ближайшая к наблюдателю).
В следующих двух блоках хранятся все параметры, необходимые для расчета метрических значений глубины на основе данных трехмерного изображения.
5.9.4 Масштабирование и смещение
Как указано в 5.9.2.1 и 5.9.2.2, Масштаб Х, Масштаб Y, Масштаб Z, Смещение Х, Смещение Y, Смещение Z применяются в преобразовании цифровых координат в метрические. Это относится ко всем трехмерным представлениям, описанным в настоящем стандарте. Значения этих полей определены в физических единицах - миллиметрах. Масштаб Х имеет размерность физических единиц «мм» при использовании прямоугольных координат, а при использовании цилиндрических координат - «радианы». Каждый параметр является обязательным значением с плавающей точкой длиной в четыре байта.
Большие значения полей Масштаб Х, Масштаб Y или Масштаб Z указывают на низкое разрешение в соответствующем измерении. Для различных типов изображений могут быть ограничены верхние пределы значений полей Масштаб Х, Масштаб Y и Масштаб Z (разделы 10 - 12 и А.7).
Масштаб Х, Масштаб Y в карте глубины представляют пространственное разрешение, а в карте точек - интервалы квантования трехмерного пространства. Масштаб Z в любом из этих представлений определяет интервал квантования.
5.9.5 Тип трехмерного представления
Поле типа трехмерного представления (1 байт) определяет тип представления, кодирующего данные трехмерного изображения (таблица 14б).
Таблица 14б - Тип трехмерного представления
Описание |
Значение |
Карта глубины |
0´00 |
Трехмерная карта точек |
0´01 |
Данные вершин |
0´02 |
Зарезервировано для будущего использования |
0´03 - 0´FF |
5.9.6 Вспомогательные данные трехмерного изображения
Маска вспомогательных данных трехмерного изображения - это битовая маска размером в один байт. При этом биты в каждой позиции маски, перечисленные в таблице 14в, должны быть установлены в значение 1, если имеется соответствующая информация о трехмерном изображении, и в значение 0 - если такая информация отсутствует. Поэтому битовая маска, состоящая из одних нулей, указывает на отсутствие каких-либо опций. Позиция маски начинается с нуля (с младшего значащего бита). Маска указывает, присутствует ли в записи карта ошибок/ошибки в вершинах и/или текстурная карта.
Таблица 14в - Вспомогательные данные трехмерного изображения
Описание |
Позиция маски |
Наличие карты ошибок или ошибок в вершинах |
0 |
Наличие текстурной карты |
1 |
Зарезервировано для будущего использования |
2 - 7 |
5.9.7 Тип источника трехмерного изображения
По аналогии с полем тип источника в блоке информации об изображении лица, в котором содержится информация об источнике данных изображения лица, поле тип источника трехмерного изображения (1 байт) должно использоваться для указания типа источника, использованного для получения данных о трехмерном изображении. Кроме того, самый старший разряд (Most Significant Bit, MSB) определяет то, какая технология сканирования используется для данного типа источника: активная или пассивная (таблица 14г).
Таблица 14г - Тип источника трехмерного изображения
Описание |
Значение (пассивная технология) |
Значение (активная технология) |
Не определено |
0´00 |
0´00 |
Стереоскопический сканер |
0´81 |
0´01 |
Движущаяся (монохроматическая) лазерная линия |
Недоступна |
0´02 |
Структурированная подсветка |
Недоступна |
0´03 |
Подсветка с цветовым кодированием |
Недоступна |
0´04 |
ToF (времяпролетная технология) |
Недоступна |
0´05 |
Восстановление формы по теням |
0´86 |
0´06 |
Зарезервировано для будущего использования |
0´87 - 0´FF |
0´07 - 0´80 |
5.9.8 Тип устройства получения трехмерного изображения
Поле типа устройства получения трехмерного изображения (2 байта) описывает уникальный для производителя идентификатор типа устройства получения трехмерного изображения. Значение, состоящее из одних нулей, является допустимым и означает, что тип устройства получения трехмерного изображения не определен. Разработчики приложений могут получить значение этого кода у производителя.
5.9.9 Синхронность получения двухмерного и трехмерного изображения
Обязательное поле синхронности получения двухмерного и трехмерного изображения (2 байта) определяет временную взаимосвязь между данными трехмерного изображения и двухмерным изображением блока данных изображения. Поле не содержит ссылки на необязательное текстурное изображение блока данных трехмерного изображения. Значение равно разнице во времени между началом процесса получения двухмерного изображения и началом процесса получения трехмерного изображения, указанной в миллисекундах (мс). Допускаются положительные и отрицательные значения. В настоящем стандарте отрицательная разница во времени означает, что процесс получения трехмерного изображения начался раньше процесса получения двухмерного изображения. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0´8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0´7FFF соответствует максимальной положительной разнице во времени плюс 32767 мс. Значение 0´8000 является допустимым и указывает, что синхронность получения трехмерного изображения не определена (таблица 14д).
Таблица 14д - Синхронность получения двухмерного и трехмерного изображения
Описание |
Значение |
Разница во времени между началом получения двухмерного изображения и началом получения трехмерного изображения, указанная в миллисекундах (мс), кодированная в системе дополнения до двух |
0´0000 - 0´7FFF 0´8001 - 0´FFFF |
Не определено |
0´8000 |
5.9.10 Синхронность получения текстурной карты и трехмерного изображения
Обязательное поле синхронности получения текстурной карты и трехмерного изображения (2 байта) определяет временную взаимосвязь между данными трехмерного изображения и текстурными данными текстурной карты необязательное поле блока данных трехмерного изображения. Значение равно разнице во времени между началом процесса получения текстурной карты и началом процесса получения трехмерного изображения, указанное в миллисекундах (мс).
Примечание - Поле не имеет отношения к синхронности между получением двухмерного изображения в блоке данных изображения и данными трехмерного изображения.
Допускаются положительные и отрицательные значения. В настоящем стандарте отрицательная разница во времени означает, что получение трехмерного изображения началось раньше получения двухмерного изображения. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0´8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0´7FFF соответствует максимальной положительной разнице во времени 32767 мс. Значение 0´8000 является допустимым и указывает, что синхронность получения текстурной карты и трехмерного изображения не определена (таблица 14е).
Таблица 14е - Синхронность получения текстурной карты и трехмерного изображения
Описание |
Значение |
Разница во времени между началом процесса получения текстурной карты и началом процесса получения трехмерного изображения, выраженная в миллисекундах (мс), кодированная в системе дополнения до двух |
0´0000 - 0´7FFF 0´8001 - 0´FFFF |
Не определено |
0´8000 |
5.9.11 Продолжительность получения трехмерного изображения
Продолжительность получения трехмерного изображения существенно различается при использовании различных методов сканирования и может напрямую повлиять на качество данных (при движении объекта регистрации во время получения данных). Поле продолжительности получения трехмерного изображения (2 байта) определяет значение интервала времени между началом процесса получения трехмерного изображения и его окончанием, выраженное в миллисекундах (мс). Значение 0´FFFF является допустимым и указывает, что поле не определено (таблица 14ж).
Таблица 14ж - Продолжительность получения трехмерного изображения
Описание |
Значение |
Продолжительность получения трехмерного изображения, выраженная в миллисекундах (мс) |
0´0000 - 0´7FFFE |
Не определено |
0´FFFF |
5.9.12 Продолжительность получения текстурной карты
Текстурная карта (необязательное поле) записи трехмерного изображения может быть получена как одновременно, так и не одновременно с данными трехмерного изображения. Поле продолжительности получения текстурной карты (2 байта) определяет значение интервала времени между началом и окончанием получения текстурной карты, выраженное в миллисекундах (мс). Значение 0´FFFF является допустимым и указывает, что поле не определено (таблица 14и).
Примечание - Значение поля продолжительности получения текстурной карты не является временем, необходимым для получения двухмерного изображения блока данных изображения.
Таблица 14и - Продолжительность получения текстурной карты
Описание |
Значение |
Продолжительность получения текстурной карты, выраженная в миллисекундах (мс) |
0´0000 - 0´FFFE |
Не определено |
0´FFFF |
5.9.13 Тип текстурной карты
Поле типа текстурной карты (1 байт) определяет тип кодирования блока текстурной карты. Если в поле вспомогательных данных трехмерного изображения задано наличие текстурной карты в записи, то следует указать формат JPEG (ИСО/МЭК 10918-1 и рекомендации МСЭ-ТТ.81), либо формат JPEG 2000 (ИСО/МЭК 15444-1) или формат PNG (ИСО/МЭК 15948:2004). Для формата JPEG данные должны быть отформатированы в соответствии со стандартом формата обмена файлами JPEG (JPEG File Interchange Format, JFIF), версия 1.02.
Если в поле вспомогательных данных трехмерного изображения указано, что для записи не задано наличие текстурной карты, тип текстурной карты должен иметь значение «не определено» (таблица 14к).
Таблица 14к- Коды типов текстурной карты
Описание |
Значение |
Не определено |
0´00 |
JPEG |
0´01 |
JPEG2000 |
0´02 |
PNG |
0´03 |
Зарезервировано для будущего использования |
0´04 - 0´FF |
5.9.14 Спектр текстурной карты
Поле спектра текстурной карты (1 байт) определяет значение спектра, в котором получена текстурная карта, указанная в 5.10.8. В то время как для получения двухмерного изображения лица всегда используется видимый диапазон спектра, при получении текстурной карты условия могут быть иными. Если в поле вспомогательных данных трехмерного изображения указано, что в записи присутствует текстурная карта, то следует также указать значение поля спектра текстурной карты.
Если в поле вспомогательных данных трехмерного изображения задано, что в записи текстурная карта отсутствует, спектр текстурной карты должен иметь значение «не определено» (таблица 14л).
Таблица 14л - Коды типов текстурной карты
Описание |
Значение |
Не определено |
0´00 |
Видимый (380 нм - 780 нм) |
0´01 |
В ближней инфракрасной области спектра (фотографический) (780 нм - 1000 нм) |
0´02 |
В коротковолновой инфракрасной области спектра (1000 нм - 1400 нм) |
0´03 |
Другой |
0´04 |
Зарезервировано для будущего использования |
0´05 - 0´FF |
5.10 Блок данных трехмерного изображения
Блок данных трехмерного изображения содержит данные трехмерного представления. Предусмотрено три варианта хранения данных трехмерного изображения: карта глубины, трехмерная карта точек или данные вершин. Допускается запись дополнительной информации в поле карты ошибок и ошибок в вершинах, а также в поле текстурной карты.
Карты глубины предназначены для кодирования значений глубины от определенной точки ракурса до проекции объекта на плоскость или цилиндрическую поверхность. Карта глубины допускает кодирование только одного значения глубины на пиксель, что ограничивает топологическую сложность кодируемой поверхности. Тем не менее, для изображений лица, особенно фронтальных изображений лица, такое представление является хорошей аппроксимацией. В меньшей степени карта глубины подходит для кодирования информации о глубине при отсутствии фронтального положения. Кроме того, данные карты глубины (в отличие от данных трехмерной карты точек) в большей степени подвергаются обработке (сглаживание, изменение шага дискретизации, интерполяция и т.д.).
Трехмерная карта точек в большей степени подходит для обмена и хранения необработанных данных трехмерного изображения, полученных от устройства получения трехмерного изображения. Сохранение данных в их первичной форме может привести к увеличению объема хранимых данных.
Поле данных вершин определяет трехмерные точки с непостоянным шагом дискретизации, что обычно приводит к разреженному кодированию. Ввиду того, что выборка точек вершин при представлении данных вершин является вариативной, полученный результат может иметь форму либо очень компактных представлений, либо очень точных представлений при использовании большого числа вершин.
Поле типа трехмерного представления (см. 5.9.5) определяет формат данных трехмерного изображения, который применялся в фактической записи.
5.10.1 Разрядность карты глубины
Поле разрядности карты глубины (1 байт) определяет число бит, используемых для представления каждого пикселя карты глубины (таблица 14м). Это поле предусмотрено для быстрого и простого доступа к данной информации, поскольку разрядность глубины можно также получить из заголовка записи PNG.
Таблица 14м - Коды разрядности карты глубины
Описание |
Значение |
8 бит |
0´00 |
16 бит |
0´01 |
Зарезервировано для будущего использования |
0´02 - 0´FF |
5.10.2 Карта глубины
Поле карты глубины содержит данные глубины в двухмерном формате. Карта глубины должна храниться в формате PNG (ИСО/МЭК 15948). Формат PNG обеспечивает сжатие без потерь как для 8-битных, так и для 16-битных данных изображения в градациях серого. Разрядность данных в PNG изображении записывается в заголовок PNG и указывается в поле разрядности карты глубины (см. 5.10.1). Разрядность карты глубины (8 бит или 16 бит) должна быть определена из заголовка PNG записи.
Размер поля карты глубины является переменным, поскольку зависит от алгоритма сжатия. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины. Эти значения указаны в заголовке PNG записи.
Значение пикселя 0´FF в случае 8-битного кодирования и 0´FFFF в случае 16-битного кодирования изображения указывает на отсутствие данных о глубине.
5.10.3 Ширина и высота трехмерной карты точек
Поля определяют ширину и высоту трехмерной карты точек, в которой хранятся данные трехмерного изображения. Оба поля (2 байта) могут иметь значения в диапазоне от 0 до 65535.
5.10.4 Трехмерная карта точек
Трехмерная карта точек предназначена для записи исходных данных, полученных с трехмерного сканера.
Карта представляет собой трехканальное изображение, сжатое без потерь в формате PNG, с 16-битным кодированием каждого канала. Первый канал содержит значения X, второй - Y, а третий - Z координат точек. Значение (X, Y, Z) = (0´FFFF, 0´FFFF, 0´FFFF) означает недействительную трехмерную точку.
Координаты определяются в произвольной прямоугольной системе координат. Информация о связности точек явным образом не сохраняется. Для действительных значений координаты соседних пикселей соответствуют соседним точкам на поверхности лица.
Блок данных вершин переменной длины содержит блок координат вершин, необязательный блок нормалей вершины, необязательный блок ошибок в вершине и необязательный блок текстурных координат. Каждый из указанных блоков содержит наборы значений характеристик вершин. Число вершин определено в поле числа вершин (2 байта).
Координаты каждой вершины определяются ее X координатой, Y координатой и Z координатой в соответствии с 2-байтными полями X координаты вершины, Y координаты вершины и Z координаты вершины соответственно. Значения определяют местоположение с фиксированной точностью в соответствии с 10.3.2.
Если флаг нормали равен 0´01, то соответствующий вектор нормали в каждой вершине должен быть определен в 2-байтовых полях координат Нормаль X, Нормаль Y, Нормаль Z.
Необязательное поле ошибки в вершине (1 байт) содержит дополнительную информацию о вершине в соответствии с описанием в таблице 14п (см. 5.10.7 настоящего стандарта). Если в поле вспомогательных данных трехмерного изображения задано наличие карты ошибок, то поле ошибки в вершине должно быть определено для каждой вершины.
Необязательные поля текстурной координаты X и текстурной координаты Y определяют соответствующие X- и Y-позиции пикселя на текстурной карте, при этом значение (0,0) соответствует верхнему левому углу. Если в поле вспомогательных данных трехмерного изображения определено наличие текстурной карты, то текстурная координата X и текстурная координата Y должны быть определены для каждой вершины.
Число треугольных граней определяется в соответствующем поле числа треугольных граней (4 байта).
Трехмерное представление вершин позволяет определять дополнительные нормали для вершин. Наличие нормалей определяется значением в поле флага нормали (1 байт).
Таблица 14н - Коды флагов нормали
Описание |
Значение |
Информация о нормали не используется в данных вершин |
0´00 |
Информация о нормали используется в данных вершин |
0´01 |
Зарезервировано для будущего использования |
0´02 - 0´FF |
5.10.6 Данные треугольных граней
Поле данных треугольных граней переменной длины содержит список параметров треугольных граней. Число описаний треугольных граней задается в поле числа треугольных граней (см. 5.10.5). Каждая треугольная грань задается тремя 2-байтовыми индексами вершин в списке данных вершин, образующих треугольную грань. Для определения внешней стороны треугольной грани порядок расположения индексов вершин должен соответствовать движению против часовой стрелки.
Необязательное поле карты ошибок содержит информацию о способе обработки данных трехмерного изображения до его записи в форме трехмерного представления. Карта ошибок кодируется в формате PNG как 8-битное изображение в градациях серого. Размер карты (в байтах) является переменным, поскольку он зависит от эффективности алгоритма сжатия изображения. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, в том случае, если они связаны с картой глубины, либо размеры, равные произведению ширины трехмерной карты точек на высоту трехмерной карты точек в том случае, если они связаны с трехмерной картой точек.
Значения пикселя t в диапазоне от 0 до 200 зарезервированы для будущего использования. Значения t, равные 201 и более, определяют потенциальный или исправленный дефект данных трехмерного изображения либо соответствующего изображения текстуры (таблица 14п).
Более полная информация об использовании значений в пикселях для трехмерного представления вершин приведена в 5.10.5.
Описание |
Значение |
Зарезервировано для будущего использования |
0 - 200 |
Значение глубины интерполировано, тип интерполяции не указан |
201 |
Значение глубины интерполировано, использовалась линейная интерполяция |
202 |
Значение глубины интерполировано, использовалась бикубическая интерполяция |
203 |
Значение необязательной текстуры изображения содержит потенциальные ошибки (текстура имеет шум, засветка и т. д.) |
204 |
Значение необязательной текстуры изображения было исправлено при последующей обработке (обработке изображения) |
205 |
Зарезервировано для будущего использования |
206 - 255 |
Текстурная карта необязательное поле должна использоваться только для хранения текстурных данных изображения лица, которые получены с помощью сканирующего устройства во время получения трехмерного изображения и поэтому могут отличаться по своей геометрии от стандартных двухмерных изображений лица, сохраненных в блоке данных изображения в той же записи. Текстурная карта не заменяет обязательное двухмерное изображение лица в блоке данных изображения. Чтобы соответствовать настоящему стандарту, изображения лица в блоке данных изображения любого типа трехмерного изображения должны отвечать соответствующим требованиям настоящего стандарта, указанным в разделах 5 - 9. Более подробная информация представлена в разделах 10, 11 и 12.
Формат текстурной карты указывается в поле типа текстурной карты. Карта может быть представлена как 8-битное или 16-битное изображение в градациях серого, либо как 24-битное цветное изображение. Размер карты (в байтах) является переменным, поскольку зависит от эффективности алгоритма сжатия. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, в том случае, если они связаны с картой глубины, либо размеры, равные произведению ширины трехмерной карты точек на высоту трехмерной карты точек в том случае, если они связаны с трехмерной картой точек. Несжатые данные имеют переменные размеры, если они связаны с трехмерным представлением вершин».
Пункт 7.2.2 изложить в новой редакции:
«7.2.2 Требования к положению головы
Качество работы автоматизированных систем распознавания лиц зависит от положения головы. Положение головы должно быть фронтальным. Необходимо, чтобы поворот и наклон головы были не более 5° от фронтального положения (см. 5.5.8). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8° (см. 5.5.8). На рисунке 8в представлен пример отклонения головы ±8°.
Рисунок 8в - Пример отклонения головы ±8°
В соответствии с рекомендациями для фронтального типа изображения лица (см. А.2.2) поворот головы должен быть не более 5° по вертикали от фронтального положения (см. 5.5.8).
Такое ограничение накладывается на положение головы индивида для всех приложений, использующих данный формат».
Пункты 8.3.1 - 8.3.6 изложить в новой редакции:
В пунктах 8.3.2 - 8.3.6 установлен минимальный набор требований к соотношениям размеров лица и всего изображения, что обеспечивает нахождение всей головы и контура плеч в поле изображения. Требования данного подраздела могут быть выполнены для изображений с горизонтальной и вертикальной ориентацией кадра. Портретное изображение с контуром головы и нанесенными размерами А, В, ВВ, СС и DD, которые рассмотрены далее, показано на рисунке 9. Видимым должно быть изображение головы от подбородка до макушки (см. 8.3.5) и по всему горизонтальному размеру (см. 8.3.4).
Дополнительные требования к размерам изображения головы, установленные для проездных документов, приведены в А.3.2.
Примечание - Для цифровых изображений должны выполняться нормативные требования к минимальному расстоянию между центрами глаз (см. 8.4.1) и к минимальному размеру головы. В А.3.1.1 более подробно рассмотрен вопрос о связи между частотой пространственной дискретизации и требованиями 8.3.2 - 8.3.6.
8.3.2 Требования к положению лица по горизонтали
Серединные по горизонтали точки рта и переносицы должны лежать на воображаемой вертикали АА, совпадающей с осью симметрии лица. Воображаемая линия ВВ определяется как линия, проходящая через центр правого и левого глаза. Точка пересечения линий АА и ВВ - центр изображения лица (точка М). Значение координаты Х точки M должно находиться между 45 % и 55 % горизонтального размера изображения.
8.3.3 Требования к положению лица по вертикали
Значение координаты Y точки М должно находиться между 30 % и 50 % вертикального размера изображения. Допускается исключение для детей младше 11 лет, в этом случае предельное верхнее значение составляет 60 % (то есть точка центра головы находится ниже на изображениях детей младше 11 лет).
Примечание - Начало отсчета системы координат - верхний левый угол изображения.
Рисунок
9 - Геометрические характеристики изображения лица полного
фронтального типа
Примечание - Рисунок является дериватом документа AAMVA DL/ID-2000.
8.3.4 Требования к горизонтальному размеру головы на изображении
Горизонтальный размер головы определяют как расстояние между двумя воображаемыми вертикальными линиями, проходящими через верхнюю и нижнюю доли уха в месте прилегания ушной раковины к голове. Горизонтальный размер головы обозначен СС на рисунке 9.
Для гарантии того, что изображение будет полностью включать лицо, горизонтальный размер головы СС должен находиться в диапазоне от 50 % до 75 % ширины изображения (А).
8.3.5 Требования к вертикальному размеру головы на изображении
Вертикальный размер головы DD определяют как расстояние по вертикали между основанием подбородка и макушкой согласно рисунку 9. Макушка головы является верхушкой головы, волосы не учитываются.
Для гарантии того, что изображение будет полностью включать лицо, вертикальный размер головы DD должен находиться в диапазоне от 60 % до 90 % высоты изображения (В). Допускается исключение для детей младше 11 лет, в этом случае предельное нижнее значение составляет 50 %.
8.3.6 Обобщенные требования к фотографированию
В таблице 15 сведены требования к фотографированию для изображений лица полного фронтального типа, установленные в 8.3.1 - 8.3.5.
Таблица 15 - Обобщенные требования к фотографированию для изображений лица полного фронтального типа
Номер пункта настоящего стандарта |
Наименование требования |
Требование |
8.3.1 |
Общие требования |
Лицо полностью присутствует на изображении |
8.3.2 |
Положение лица по горизонтали |
0,45 А £ Мх £ 0,55 А |
8.3.3 |
Положение лица по вертикали |
0,3 В £ Му £ 0,5 В |
8.3.3 |
Положение лица по вертикали (для детей младше 11 лет) |
0,3 B £ Mу £ 0,6 B |
8.3.4 |
Горизонтальный размер головы на изображении |
0,5 А£ СС £ 0,75 А |
8.3.5 |
Вертикальный размер головы на изображении |
0,6 В £ DD £ 0,9 В |
8.3.5 |
Вертикальный размер головы на изображении (для детей младше 11 лет) |
0,5 В £ DD £ 0,9 В |
На рисунке 8г представлен стандартный пример изображения для паспорта. Внешний прямоугольник обозначает максимальные размеры головы, определенные в соответствии с требованиями 8.3.4 и 8.3.5. Внутренний прямоугольник представляет минимальные размеры головы, рассчитанные исходя из размеров изображения.
Рисунок
8г - Пример изображения с минимальными и максимальными размерами
головы, рассчитанными по размерам изображения»
Стандарт дополнить разделами - 10, 11, 12 (с подразделами 10.1 - 10.3, 11.1 - 11.4, 12.1 - 12.4, с пунктами 10.2.1, 10.2.2, 10.3.1, 10.3.2, 11.5.1 - 11.5.3, 11.6.1, 11.6.2, 11.7.1):
10.1 Требования наследования для основного трехмерного типа изображения
Основной трехмерный тип изображения - это базовый класс всех трехмерных типов изображения лица. Все трехмерные типы изображения лица должны отвечать требованиям настоящего раздела.
Основной трехмерный тип изображения наследует все требования основного типа изображения лица.
Все обязательные (не являющиеся дополнительными) поля блока информации о трехмерном изображении должны быть определены. При этом некоторые обязательные поля могут оставаться неопределенными, если было задано соответствующее значение. См. определение отдельных полей для получения более подробной информации.
10.2 Требования к основному трехмерному типу изображения с использованием представления трехмерной карты точек
10.2.1 Требования к типу системы координат
Значение поля типа системы координат для основного трехмерного типа изображения с использованием представления трехмерной карты точек должно равняться 0´00, то есть необходимо использовать прямоугольную систему координат.
10.2.2 Требования к масштабированию и смещению
Для основного трехмерного типа изображения с использованием представления трехмерной карты точек используются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений:
Масштаб Х = Масштаб Y = Масштаб Z = 0,02 мм;
Смещение Х = Смещение Y = Смещение Z = -655,34 мм.
10.3 Требования к основному трехмерному типу изображения с использованием трехмерного представления вершин
10.3.1 Требования к типу системы координат
Значение поля типа системы координат для основного трехмерного типа изображения с использованием трехмерного представления вершин должно равняться 0´00, то есть должна использоваться прямоугольная система координат.
10.3.2 Требования к масштабированию и смещению
Для основного трехмерного типа изображения с использованием трехмерного представления вершин применяются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений:
Масштаб Х = Масштаб Y = Масштаб Z = 0,02 мм;
Смещение Х = Смещение Y = Смещение Z = -655,34 мм.
Полный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям.
11.1 Требования наследования
Полный фронтальный трехмерный тип изображения лица наследует требования основного типа трехмерного изображения, указанные в 10.1. Кроме того, он наследует все требования полного фронтального типа изображения.
11.2 Требования к типу системы координат
Значение поля типа системы координат для полного фронтального трехмерного типа изображения должно равняться 0´00, то есть следует использовать прямоугольную систему координат. Началом отсчета системы координат является нос, то есть контрольная точка prn в соответствии с определением в таблице 9а.
11.3 Требования к положению головы в трехмерном представлении
Поворот и наклон головы должны быть не более 5° от фронтального положения (5.5.6 и 5.5.8). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8°. Указанные ограничения относятся ко всем приложениям, использующим настоящий формат.
11.4 Требования к калибровке точности текстурной проекции
Калибровка точности устройства получения изображения должна быть настолько высокой, чтобы среднее значение рассогласования между текстурой полного фронтального двухмерного изображения и данными трехмерного изображения после проекции с использованием матрицы текстурной проекции составляло менее 1 мм.
Примечание - Данное значение не является показателем точности, полученной при движении устройства или объекта. Показатель наблюдаемого эффекта - синхронность получения двухмерного и трехмерного изображения (см. 5.9.9).
11.5 Требования к полному фронтальному трехмерному типу изображения с использованием карты глубины
11.5.1 Требования к масштабированию
Разрешение сохраненных данных глубины в значительной степени зависит от значения Масштаба Z. В целях сохранения качества установлено максимальное значение Масштаба Z, равное 1 мм для полного фронтального трехмерного типа изображения.
По этой же причине установлены максимальные значения Масштаба Х и Масштаба Y, равные 1 мм для полного фронтального трехмерного типа изображения в прямоугольной системе координат.
Следует отметить, что в любом случае Масштаб Х и Масштаб Y описывают частоту дискретизации, а не частоту физических измерений датчика.
11.5.2 Требования к охвату лица
Данные трехмерного изображения должны охватывать минимальные прямоугольные размеры [-l,75w, l,75w] ´ [-l,75w, 2,55w] («внешнюю область») в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центр глаз) в соответствии с 5.6.4. На рисунке 11 показан пример изображения лица с выделенной внешней областью.
Рисунок
11 - Пример двухмерного изображения с минимальным охватом лица
(«внешняя область»)
11.5.3 Требования к недействительным точкам в трехмерном изображении
Не более 50 % пикселей на карте глубины в области, определенной в подразделе 11.5, могут иметь нулевое значение, указывающее на недействительное значение глубины. Во «внутренней области», определенной как [-l,5w, l,5w] ´ [-l,8w, l,8w] в прямоугольной системе координат с началом отсчета в контрольной точке prn, не более 20 % пикселей могут иметь нулевое значение, указывающее на недействительное значение глубины. В этом случае w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. На рисунке 12 показан пример изображения лица с выделенной внутренней областью.
Рисунок 12 - Пример двухмерного изображения с выделенной внутренней областью
11.6 Требования к полному фронтальному трехмерному типу изображения с использованием представления трехмерной карты точек
11.6.1 Требования к ширине и высоте карты точек
Разрешение трехмерной карты точек находится в прямой зависимости от ширины и высоты трехмерной карты точек. Чтобы обеспечить обмен данными трехмерного изображения высокого разрешения, минимальные размеры типов полных фронтальных трехмерных изображений с использованием представления трехмерной карты точек должны быть равны следующим значениям:
- минимальная ширина трехмерной карты точек - 140 пикселей;
- минимальная высота трехмерной карты точек - 170 пикселей.
11.6.2 Требования к охвату лица
Для биометрического сравнения особенно важно, чтобы во внешней области, в соответствии с определением в 11.5, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображений с использованием трехмерной карты точек не менее 70 % точек должны иметь Х и Y координаты со значением -l,75w £ Х £ l,75w и -l,75w £ Y £ 2,55w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4.
11.7 Требования к полному фронтальному трехмерному типу изображения с использованием трехмерного представления вершин
11.7.1 Требования к охвату лица
Для биометрического сравнения особенно важно, чтобы во внутренней области, определенной в соответствии с 11.5, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображений с использованием представления вершин не менее 1000 точек должны иметь X и Y координаты со значением -l,5w £ X £ l,5w и -l,8w £ Y £ l,8w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. Наряду с этим должна быть как минимум одна вершина на квадратный сантиметр, спроецированная на плоскость внутренней области с покрытием 80 % внутренней области.
Условный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям.
12.1 Требования наследования
Условный фронтальный трехмерный тип изображения лица наследует все требования, установленные для основного типа изображения лица и требования для полного фронтального типа изображения лица в соответствии с подразделами 11.2 - 11.6. Кроме того, он наследует все требования условного фронтального типа изображения.
12.2 Требования к условному фронтальному трехмерному типу изображения с использованием представления карты глубины
Условный фронтальный трехмерный тип изображения лица с использованием представления карты глубины наследует все требования полного фронтального трехмерного изображения с использованием представления карты глубины в соответствии с 11.7.
12.3 Требования к условному фронтальному трехмерному типу изображения с использованием представления трехмерной карты точек
Условный фронтальный трехмерный тип изображения лица с использованием представления трехмерной карты точек наследует все требования полного фронтального трехмерного изображения с использованием представления трехмерной карты точек в соответствии с 11.8.
12.4 Требования к условному фронтальному трехмерному типу изображения с использованием представления вершин
Условный фронтальный трехмерный тип изображения лица с использованием представления вершин наследует все требования полного фронтального трехмерного изображения с использованием представления вершин в соответствии с 11.9».
Раздел А.2 дополнить пунктом - А.2.2а (перед пунктом А.2.2):
«А.2.2а Требование к положению головы
Положение головы должно быть фронтальным. Отклонение от фронтального положения головы должно быть не более 5° в направлениях поворота, наклона и отклонения (см. 5.5.8)».
Пункт А.3.1.1 дополнить абзацем:
«Если бумажные фотографии были отсканированы при разрешении 120 точек на сантиметр (300 dpi), то требование минимального расстояния между центрами глаз в 90 пикселей соответствует расстоянию примерно в 8 мм между глазами. Аналогично для фотографий, отсканированных при разрешении 120 точек на сантиметр (300 dpi), требование минимального расстояния между центрами глаз в 120 пикселей соответствует расстоянию примерно в 10 мм между глазами».
Пункт А.3.2.3 изложить в новой редакции:
«А.3.2.3 Обобщенные рекомендации к фотографированию
Для удобства в таблице 17 перечислены требования к геометрическим параметрам и положению головы, рассмотренные в А.2.2а, А.3.2.1, А.3.2.2.
Таблица 17 - Обобщенные рекомендации к фотографированию для полных фронтальных типов изображений лица для проездных документов
Пункт |
Определение |
Рекомендация |
А.2.2а |
Положение головы |
Поворот должен быть меньше 5° в отношении углов поворота, углов наклона и углов отклонения |
А.3.2.1 |
Отношение горизонтального и вертикального размеров изображения |
1,25 £ В/А £ 1,34 |
А.3.2.2 |
Горизонтальный размер головы на изображении |
1,4 СС £ А £ 2 СС |
А.3.2.2 |
Вертикальный размер головы на изображении |
0,7 В £ DD £ 0,8 В |
А.3.2.2 |
Вертикальный размер головы на изображении (дети младше 11 лет) |
0,5 В £ DD £ 0,8 В |
Приложение А дополнить разделами - А.5, А.6, А.7, А.8, А.9:
«А.5 Экспериментальные исследования по регистрации полных фронтальных изображений для проездных документов. Спецификации и данные, используемые для анализа
В данном приложении представлены исследования, результатом которых явилось обоснование допустимых отклонений в отношении расстояния между центрами глаз, положения лица по горизонтали и вертикали, отношения горизонтального размера головы к ширине изображения и вертикального размера головы к высоте изображения.
А.5.1 Спецификации и данные, используемые для анализа
Для анализа использовались параметры и допустимые отклонения, являющиеся либо:
1) строгими допустимыми отклонениями в соответствии с требованиями настоящего стандарта и рекомендаций ИКАО (Международная организация гражданской авиации) [8];
2) с увеличенными допустимыми отклонениями в соответствии с требованиями рекомендаций ИКАО [9] для приложений регистрации паспортных изображений.
Данными для исследований послужили паспортные фотографии граждан 4 государств, использующих электронные паспорта в большом количестве. Все указанные изображения были применены в выданных электронных паспортах.
Целью исследования являлось определение соответствия стандартных паспортных фотографий требованиям настоящего стандарта, в частности, требованиям к:
1) положению лица;
2) количеству пикселей между центрами глаз;
3) положению лица по горизонтали;
4) положению лица по вертикали;
5) отношению горизонтального размера головы к ширине изображения;
6) отношению вертикального размера головы к высоте изображения.
Таблица 19 - Базы изображений, использованные для анализа
База изображений страны |
Число изображений |
Размер (ширина´высота) изображения в пикселях |
Формат |
0 |
1000 |
413´31 |
JPEG |
А |
1988 |
384´480 |
JPEG |
В |
1911 |
449´599 |
JPEG |
С |
2229 |
416´536 |
JPEG |
Полученные данные по базам изображений далее сравнивались друг с другом и с допустимыми значениями, которые определены в настоящем стандарте.
А.5.2 Результаты исследований
А.5.2.1 Расстояние между центрами глаз
В соответствии с требованиями настоящего стандарта размер головы для полного фронтального изображения должен быть не менее 180 пикселей, что соответствует расстоянию между центрами глаз приблизительно в 90 пикселей (см. 8.4.1).
На рисунке 21 представлено распределение расстояний между центрами глаз для четырех исследуемых баз данных.
Практически во всех случаях выполняется требование к горизонтальному размеру головы. Среднее расстояние между центрами глаз составляет 123,4 пикселя.
А.5.2.2 Положение лица по горизонтали
Согласно требованиям настоящего стандарта значение координаты X (точка Мх) точки М центра лица должно находиться между 45 % и 55 % ширины изображения (см. 8.3.2).
На рисунке 22 представлено распределение положения лица по горизонтали (Мx/А) для четырех исследуемых баз данных.
Среднее значение положения лица по горизонтали для 7128 изображений составляет 49 % ширины изображения. Требованию к положению лица по горизонтали удовлетворяет 95,4 % исследуемых паспортных фотографий.
А.5.2.3 Положение лица по вертикали
В соответствии с требованиями настоящего стандарта значение координаты Y (точка Мy) точки М центра лица должно находиться между 30 % и 50 % высоты изображения В (см. 8.3.3), с исключением для детей младше 11 лет. На рисунке 23 представлено распределение (1 - Му/В) для четырех исследуемых баз данных.
Среднее значение положения лица по вертикали (1 - Му/В) (положения глаз по вертикали, то есть положения горизонтальной линии, проходящей через центры глаз) для 7128 изображений составляет 56 % высоты изображения. Это соответствует значению координаты Y точки М (Мy), равному 44 % высоты изображения.
А.5.2.4 Отношение горизонтального размера головы к ширине изображения
В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком ширина головы СС должна находиться в диапазоне от 50 % до 75 % ширины изображения (см. 8.3.4). На рисунке 24 представлено распределение отношения горизонтального размера головы к ширине изображения для четырех исследуемых баз данных.
Среднее значение отношения горизонтального размера головы к ширине изображения для 7128 изображений составляет 0,62. Для большинства изображений выполняется требование к отношению горизонтального размера головы к ширине изображения.
А.5.2.5 Отношение вертикального размера головы к высоте изображения
В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком на изображении полного фронтального типа на лицо от макушки до подбородка (DD) должно приходиться от 60 % до 90 % вертикальной длины изображения (В) (см. 8.3.5). На рисунке 25 представлено распределение отношения вертикального размера головы к высоте изображения для четырех исследуемых баз данных.
Среднее значение отношения вертикального размера головы к высоте изображения для 7128 изображений составляет 0,73. Требованию к отношению вертикального размера головы к высоте изображения отвечают 98,2 % исследуемых паспортных фотографий
Рисунок 21
- Нормированное распределение расстояния между центрами глаз на
исследуемых паспортных фотографиях; красная пунктирная линия указывает значение
90 пикселей, соответствующее минимуму для полного фронтального изображения
Рисунок
22 - Нормированное распределение положения лица по горизонтали на
исследуемых паспортных фотографиях. Красные пунктирные линии указывают
на предельные значения, указанные в настоящем стандарте
Рисунок
23 - Распределение положения лица по вертикали (1 - Мy/B) на исследуемых
паспортных фотографиях. Красные пунктирные линии указывают на предельные
значения, указанные в настоящем стандарте
Рисунок
24 - Распределение отношения горизонтального размера головы к ширине
изображения на исследуемых паспортных фотографиях. Красные пунктирные линии
указывают на предельные значения, указанные в настоящем стандарте
Рисунок
25 - Распределение отношения горизонтального размера головы к высоте
изображения на исследуемых паспортных фотографиях
А.5.3 Обсуждение ошибок исследования
Данное исследование основано исключительно на измерениях, выполненных автоматизированным программным обеспечением контроля качества изображений (QA-SW). Так называемая проверка экспериментальными данными, то есть анализ измеренных вручную значений, для всех исследуемых изображений не проводилась. Такая проверка проводилась на ранней стадии исследования, где было обнаружено, что используемое программное обеспечение контроля качества является достаточно точным и способно представить надежную статистику для данного исследования.
Дополнительное исследование для сравнения программного обеспечения контроля качества, используемого в настоящем исследовании, с другими программными комплексами контроля качества на большом количестве паспортных фотографий показало следующие отклонения:
- QA-SW расстояние между центрами глаз: +5 %;
- QA-SW положение лица по горизонтали: ±1 %;
- QA-SW положение лица по вертикали: ±1 %;
- QA-SW отношение горизонтального размера головы к ширине изображения: ±1 %;
- QA-SW отношение вертикального размера головы к высоте изображения: ±1 %.
Таким образом, погрешность определения параметров составляет 1 %, за исключением параметра «расстояние между центрами глаз», который может иметь немного большее значение, чем в действительности.
А.5.4 Выводы
Проведенные исследования касаются геометрических параметров лица на паспортных фотографиях, имеющих большое значение при проведении биометрического сравнения. Результаты исследований основаны на статистической оценке результатов автоматизированного анализа изображений, выполненного с помощью программного обеспечения контроля качества. Даже при ошибках программного обеспечения на отдельных изображениях выводы, основанные на объединении результатов по приблизительно 7200 изображениям, являются достоверными.
Таким образом, вышеприведенный анализ показал, что требования, установленные настоящим стандартом, являются достижимыми при использовании современных технологий и существующих приложений. Таблица 20 и рисунок 26 демонстрируют результаты данного исследования. Так как использованные для него изображения были получены от четырех стран, где электронные паспорта выдаются в большом количестве, настоящие результаты можно рассматривать в качестве показательных для сферы применения данного анализа.
Таблица 20 - Сводные сведения соответствия выборки изображений требованиям, определенным в настоящем стандарте
Критерий |
Минимум |
Максимум |
Процент соответствующих изображений |
Расстояние между центрами глаз (в пикселях) |
90,00 |
- |
99,9 % |
Положение лица по горизонтали |
0,45 |
0,55 |
95,4 % |
Положение лица по вертикали |
0,50 |
0,70 |
94,0 % |
Отношение горизонтального размера головы к ширине изображения |
0,50 |
0,75 |
98,4 % |
Отношение вертикального размера головы к высоте изображения |
0,60 |
0,90 |
98,2 % |
Рисунок
26 - Соответствие исследуемых паспортных фотографий требованиям
8.3.1 - 8.3.6 настоящего стандарта (в процентах)
А.6 Экспериментальные исследования влияния расстояния между центрами глаз и положения головы (отклонения) на эффективность биометрического сравнения
А.6.1 Расстояние между центрами глаз
Расстояние между центрами глаз (то есть пространственное разрешение изображения) является наиболее важным критерием для успешного распознавания лица. Для оценки влияния расстояния между центрами глаз при распознавании лица проведены исследования на изображениях с различным разрешением с использованием современного алгоритма сравнения лиц. На рисунке 27 показано увеличение вероятности правильной верификации при увеличении расстояния между центрами глаз. Данные результаты применимы для оценки эффективности поиска «один- ко-многим» (ранговая статистика).
Зависимость эффективности от расстояния между центрами глаз
Рисунок
27 - Зависимость вероятности правильной верификации от расстояния
между центрами глаз при ВЛД = 0,1 %
А.6.2 Положение головы (отклонение)
В автоматизированных системах распознавания лиц эффективно проводится коррекция угла отклонения изображения лица. На рисунке 28 показана эффективность распознавания лица при повороте изображений на плоскости (вокруг оси отклонения).
Для тестирования была использована база данных «Color Feret» (994 эталонных и 736 тестовых изображений). На первом этапе все изображения (тестовые и эталонные) были повернуты таким образом, чтобы угол отклонения головы был равен нулю. При проведении тестирования все тестовые изображения были повернуты на +5°, а все эталонные - на -5°, затем наоборот. Такая же обработка выполнена для +10°, -10°, +15° и -15° соответственно. Таким образом, разница углов отклонения образцов изображений и изображений галереи составила 0°, 10°, 20° и 30°. На рисунке 29 представлены примеры изображений с различными значениями угла отклонения.
Оценка снижения эффективности работы алгоритма при повороте изображения в плоскости проводилась относительно значения вероятности правильной верификации при ВЛД = 0,1 % и угле отклонения, равном нулю, то есть все значения вероятности правильной верификации были нормализованы по этому значению.
Необходимо отметить, что тестирование включает худший сценарий, так как максимальным значением разницы углов отклонения, при котором соблюдается требование настоящего стандарта, является ±10°. Таким образом, влияние на эффективность работы алгоритма при углах отклонения в пределах требования настоящего стандарта будет значительно меньше.
Очевидно, что до ±8° значимого снижения эффективности не наблюдается. Данные результаты применимы для оценки эффективности поиска «один-ко-многим» (ранговая статистика с рангом, равным 1). Как правило, разработчики программного обеспечения автоматического распознавания лиц имеют возможность проводить настройку допустимых значений для поворота изображений на плоскости. Программный продукт, использованный при данном тестировании, был настроен на допуск 10° отклонения для одного изображения, т. е. на максимальную разность угла отклонения в 20°, что явилось причиной снижения эффективности при тестах на ±15°.
Зависимость эффективности от угла отклонения головы
Рисунок
28 - Зависимость вероятности правильной верификации
от угла отклонения при ВЛД = 0,1 %
Рисунок
29 - Примеры изображений с отклонением головы.
Углы отклонения равны 0°, +5°, -5°, +10°, -10°, +15°, -15° (слева направо)
А.7 Рекомендации для полного фронтального трехмерного типа изображения лица
Помимо требований раздела 11 для полного фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования.
А.7.1 Рекомендации для двухмерного изображения лица полного фронтального трехмерного типа изображения
Необходимо следовать рекомендациям для полного фронтального типа изображения лица.
А.7.2 Замечания по совместимости
В настоящее время существует большое количество реализаций, соответствующих основному стандарту. Для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица полного фронтального трехмерного изображения в качестве полного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи полного фронтального изображения, что обеспечивает функциональную совместимость.
А.7.3 Требования к положению головы для полного фронтального трехмерного типа изображения
Угол отклонения головы должен быть не более 5° (см. 5.5.8).
А.7.4 Требования к синхронности получения двухмерного и трехмерного изображений
Поле синхронности получения двухмерного и трехмерного изображений должно быть определено и не может быть заполнено значением 0´FFFF (не определено).
А.7.5 Требования к продолжительности получения трехмерного изображения
Поле продолжительности получения трехмерного изображения должно быть определено и не может быть заполнено значением 0´FFFF (не определено).
А.7.6 Рекомендации для полного фронтального трехмерного типа изображения с использованием представления карты глубины
А.7.6.1 Требования к масштабированию
Разрешение записанных данных глубины в значительной степени зависит от Масштаба Z Для обеспечения качества для полного фронтального трехмерного типа изображения должно быть установлено максимальное значение Масштаба Z равное 0,8 мм.
По этой же причине следует установить максимальные значения Масштаба Х и Масштаба Y, равные 0,8 мм, для полного фронтального трехмерного типа изображения с использованием представления карты глубины в прямоугольной системе координат.
А.7.6.2 Требования к недействительным точкам карты глубины
Не более 20 % пикселей карты глубины в области, определенной в 11.5, могут иметь нулевое значение, определяющее недействительное значение глубины. Кроме того, во «внутренней области», определенной как [-l,5w, l,5w] ´ [-l,8w, l,8w] в прямоугольной системе координат с началом отсчета в контрольной точке prn, не более 10 % пикселей могут иметь нулевое значение, определяющее недействительное значение глубины. Здесь w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4.
А.7.7 Рекомендации для полного фронтального трехмерного типа изображения с использованием представления трехмерной карты точек
А.7.7.1 Требования к ширине и высоте трехмерной карты точек
В качестве рекомендации для трехмерных типов изображений с использованием представления трехмерной карты точек необходимо, чтобы минимальные размеры трехмерной карты точек составляли следующие значения:
- минимальная ширина трехмерной карты точек - 175 пикселей;
- минимальная высота трехмерной карты точек - 213 пикселей.
А.7.7.2 Требования к охвату лица
В качестве рекомендации для трехмерных типов изображений с использованием представления трехмерной карты точек необходимо, чтобы не менее 90 % точек имели X и Y координаты со значением -l,75w £ Х £ l,75w и -l,75w £ Y £ 2,55w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4.
А.7.8 Рекомендации для полного фронтального трехмерного типа изображения с использованием трехмерного представления вершин
А.7.8.1 Требования к охвату лица
В качестве рекомендации для трехмерных типов изображений с использованием представления вершин необходимо, чтобы не менее 1500 точек имели X и Y координаты со значением -l,5w £ X £ l,5w и -l,8w £ Y £ l,8w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. Кроме того, 90 % площади внутреннего региона должно отвечать условию, при котором на каждый квадратный сантиметр плоскости внутреннего региона будет приходиться как минимум одна спроецированная точка.
А.8 Рекомендации для условного фронтального трехмерного типа изображений
Помимо требований раздела 12, для фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования.
А.8.1 Рекомендации для двухмерного изображения лица условного фронтального трехмерного типа изображения
Необходимо следовать рекомендациям для условного фронтального типа изображения лица.
А.8.2 Замечания по совместимости
В настоящее время существует большое количество реализаций, соответствующих основному стандарту.
Таким образом, для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица условного фронтального трехмерного изображения в качестве условного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи условного фронтального изображения, что обеспечивает функциональную совместимость.
А.8.3 Требования к положению головы для условного фронтального трехмерного типа изображения
Угол отклонения головы должен быть не более 5° (см. 5.5.8).
А.8.4 Требования к синхронности получения двухмерного и трехмерного изображений
Поле синхронности получения двухмерного и трехмерного изображений должно быть определено и не может быть заполнено значением 0´FFFF (не определено).
А.8.5 Требования к продолжительности получения трехмерного изображения
Поле продолжительности получения трехмерного изображения должно быть определено и не может быть заполнено значением 0´FFFF (не определено).
А.8.6 Рекомендации для условного фронтального трехмерного типа изображения с использованием представления карты глубины
Необходимо следовать рекомендациям, приведенным в подразделе А.7.6.
А.8.7 Рекомендации для условного фронтального трехмерного типа изображения с использованием представления трехмерной карты точек
Требуется следовать рекомендациям, приведенным в А.7.7.
А.8.8 Рекомендации для условного фронтального трехмерного типа изображения с использованием трехмерного представления вершин
Необходимо следовать рекомендациям, приведенным в А.7.8.
А.9 Краткое изложение обязательных требований и рекомендаций для трехмерных типов изображений
А.9.1 Нормативная система координат и требования к положению головы для основного трехмерного типа изображения
Требования приведены в таблице А.3.
Наименование систем координат |
Карта глубины |
Карта точек |
Вершины |
Прямоугольная система координат |
Поддерживается |
Поддерживается |
Поддерживается |
Цилиндрическая система координат |
Поддерживается |
Не поддерживается |
Не поддерживается |
Значения масштаба и смещения, используемые при преобразовании координат |
Поддерживается |
Не поддерживается, фиксированное масштабирование и смещение |
Не поддерживается, фиксированное масштабирование и смещение |
Ограничения на положение головы (поворот, наклон, отклонение) |
Нет |
Нет |
Нет |
А.9.2 Нормативная система координат и требования к положению головы для полного фронтального трехмерного типа изображения
Требования приведены в таблице А.4
Наименование систем координат |
Карта глубины |
Карта точек |
Вершины |
Прямоугольная система координат |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Цилиндрическая система координат |
Не поддерживается |
Не поддерживается |
Не поддерживается |
Значения масштаба и смещения, используемые при преобразовании координат |
Поддерживается |
Не поддерживается, фиксированное масштабирование и смещение |
Не поддерживается, фиксированное масштабирование и смещение |
Ограничения на положение головы (поворот, наклон, отклонение), в градусах |
(±5, ±5, ±8) |
(±5, ±5, ±8) |
(±5, ±5, ±8) |
А.9.3 Нормативная система координат и требования к положению головы для условного фронтального трехмерного типа изображения
Требования приведены в таблице А.5
Наименование систем координат |
Карта глубины |
Карта точек |
Вершины |
Прямоугольная система координат |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Цилиндрическая система координат |
Не поддерживается |
Не поддерживается |
Не поддерживается |
Значения масштаба и смещения, используемые при преобразовании координат |
Поддерживается |
Не поддерживается, фиксированное масштабирование и смещение |
Не поддерживается, фиксированное масштабирование и смещение |
Ограничения на положение головы (поворот, наклон, отклонение), в градусах |
(±5, ±5, ±8) |
(±5, ±5, ±8) |
(±5, ±5, ±8) |
А.9.4 Рекомендуемая система координат и требования к положению головы для полного фронтального трехмерного типа изображения
Требования приведены в таблице А.6.
Наименование систем координат |
Карта глубины |
Карта точек |
Вершины |
Прямоугольная система координат |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Цилиндрическая система координат |
Не поддерживается |
Не поддерживается |
Не поддерживается |
Значения масштаба и смещения, используемые при преобразовании координат |
Поддерживается |
Не поддерживается, фиксированное масштабирование и смещение |
Не поддерживается, фиксированное масштабирование и смещение |
Ограничения на положение головы (поворот, наклон, отклонение), в градусах |
(±5, ±5, ±5) |
(±5, ±5, ±5) |
(±5, ±5, ±5) |
А.9.5 Рекомендуемая система координат и требования к положению головы для условного фронтального трехмерного типа изображения
Требования приведены в таблице А.7.
Наименование систем координат |
Карта глубины |
Карта точек |
Вершины |
Прямоугольная система координат |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Нос как начало системы отсчета |
Цилиндрическая система координат |
Не поддерживается |
Не поддерживается |
Не поддерживается |
Значения масштаба и смещения, используемые при преобразовании координат |
Поддерживается |
Не поддерживается, фиксированное масштабирование и смещение |
Не поддерживается, фиксированное масштабирование и смещение |
Ограничения на положение головы (поворот, наклон, отклонение), в градусах |
(±5, ±5, ±5) |
(±5, ±5, ±5) |
(±5, ±5, ±5) |
Стандарт дополнить приложением - Г:
Франкфуртская горизонталь
Франкфуртская горизонталь введена в качестве стандартной плоскости для ориентации головы. Она определяется линией, проходящей через правую козелковую точку (передняя часть уха) и низшую точку правой глазницы [14], [15].
Следует обратить внимание, что при определении Франкфуртской горизонтали могут возникнуть трудности, поскольку она связана с положением уха, которое может быть скрыто прической».
Элемент «Библиография» дополнить позициями - [12] - [15]:
«[12] Anthropometry of the Head and Face, second edition, Leslie G. Farkas, Raven Press, New York, 1994
[13] The Methods of Plane Projective Geometry Based on the Use of General Homogenous Coordinates, E. A. Maxwell, Cambridge University Press, 1960
[14] Air Standardization Coordinating Committee (ASCC). (1991). A basis for common practices in the conduct of anthropometric surveys (Air Standard 61/83). Washington, DC
[15] Ranke, J. (ed.). (1884). Verständigung über ein gemeinsames craniometrisches Verfahren (Frankfurter Verständigung). Archive Anthropologie, 15, 1 - 8».
(ИУС № 10 2013 г.)