ГОСТ Р 51170-98
ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
КАЧЕСТВО СЛУЖЕБНОЙ ИНФОРМАЦИИ
Термины и определения
ГОССТАНДАРТ РОССИИ
Москва
Предисловие
1 РАЗРАБОТАН Московским научно-исследовательским центром (МНИЦ) Государственного комитета Российской Федерации по связи и информатизации и Московским государственным университетом путей сообщения (МГУПС)
ВНЕСЕН Техническим комитетом по стандартизации ТК 22 «Информационные технологии»
2 ПРИНЯТ И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 12 мая 1998 г. № 184
3 ВВЕДЕН ВПЕРВЫЕ
4 ПЕРЕИЗДАНИЕ
СОДЕРЖАНИЕ
3.2 Формально-технические составляющие свойств данных. 3 3.3 Социально-психологические составляющие свойств данных. 3 3.4 Показатели формально-технических составляющих свойств данных. 3 |
Установленные в стандарте термины расположены в систематизированном порядке, отображающем систему понятий в данной области знания.
Для каждого понятия установлен один стандартизованный термин.
В алфавитном указателе термины приведены отдельно с указанием номера статьи.
Приведенные определения можно при необходимости изменять, вводя в них производные признаки, раскрывая значение используемых в них терминов, указывая объекты, входящие в объем определяемого понятия. Изменения не должны нарушать объем и содержание понятий, определенных в настоящем стандарте.
Термины и определения общесистемных понятий, необходимые для понимания текста стандарта, приведены в приложении Б.
Стандартизованные термины набраны полужирным шрифтом.
ГОСТ Р 51170-98
ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
КАЧЕСТВО СЛУЖЕБНОЙ ИНФОРМАЦИИ
Термины и определения
Quality of technological and official information.
Terms and definitions
Дата введения 1999-01-01
Настоящий стандарт устанавливает термины и определения основных понятий в области качества служебной (технологической и официальной) информации.
Термины, установленные настоящим стандартом, обязательны для применения во всех видах документации и литературы в области качества служебной информации, входящих в сферу работ по стандартизации и/или использующих результаты этих работ.
В настоящем стандарте использована ссылка на ГОСТ 15971-90 Системы обработки информации. Термины и определения
3.1.1 качество служебной информации: Совокупность свойств служебной информации, обусловливающих ее пригодность удовлетворять определенные потребности в соответствии с ее назначением
3.1.2 информационная технология: Система методов и способов переработки информации
3.1.3 средства переработки информации: Технические устройства, программы ЭВМ, базы данных и знаний, используемые при переработке информации
3.1.4 данные: По ГОСТ 15971
3.1.5 технологический процесс переработки данных: Совокупность действий, направленных на изменение состояния данных
3.1.6 обработка данных: Технологическая операция, в результате которой изменяет свое значение хотя бы один из показателей, характеризующих состояние данных (объем данных при этом не изменяется)
3.1.7 контроль данных: Технологическая операция, состоящая в сравнении значений показателей, характеризующих состояние данных с определенными значениями
3.1.8 обобщение данных: Технологическая операция, в результате которой из исходных данных получают новые данные уменьшенного объема
3.1.9 внутренние свойства данных: Совокупность свойств, характерных для данных, используемых в определенной среде (системе) и сохраняющихся при их переносе в другую среду (систему)
3.1.10 внешние свойства данных: Совокупность свойств, характерных для данных, находящихся (используемых) в определенной среде (системе) и изменяющихся при переносе в другую среду (систему)
3.1.11 достоверность данных: Свойство данных не иметь скрытых ошибок
3.1.12 кумулятивность: Свойство данных небольшого объема достаточно полно отображать действительность
3.1.13 временные свойства данных: Свойства данных сохранять во времени способность правильно отображать действительность
3.1.14 недоступность данных: Свойство данных, состоящее в невозможности несанкционированного их использования или изменения
3.1.15 формально-технические составляющие свойств данных: Составляющие свойств данных, не учитывающие мотивы деятельности людей, связанные с качеством данных
3.1.16 социально-психологические составляющие свойств данных: Составляющие свойств данных, учитывающие влияние на их качество личностных свойств людей, находящихся под воздействием социальных и психологических факторов в процессе сбора, переработки и использования данных
3.1.17 показатель качества служебной информации: Количественная характеристика одного или нескольких свойств, составляющих качество служебной информации
3.2.1 безошибочность данных: Свойство данных не иметь скрытых случайных ошибок (составляющая свойства достоверности)
3.2.2 сжатость данных: Свойство данных сохранять способность отображать действительность после их обобщения (составляющая свойства кумулятивность)
3.2.3 оперативность данных: Свойство данных соответствовать временны́м характеристикам процесса, который эти данные отображает (составляющая временны́х свойств)
3.2.4 идентичность данных: Свойство данных соответствовать состоянию объекта; нарушение идентичности связано со старением данных по рассогласованию признаков (составляющих временны́х свойств)
3.2.5 защищенность данных: Свойство данных быть защищенными от несанкционированного доступа (составляющая недоступности)
3.3.1 истинность данных: Свойство данных не иметь искажений, внесенных намеренно человеком (составляющая свойства достоверности)
3.3.2 селекционность данных: Свойство данных соответствовать личным взглядам потребителя и его готовности к восприятию данных (составляющая свойства кумулятивности)
3.3.3 срочность данных: Свойство данных соответствовать требуемому сроку их представления (составляющая временны́х свойств)
3.3.4 значимость данных: Свойство данных сохранять ценность для потребителя с течением времени (составляющая временны́х свойств)
3.3.5 конфиденциальность данных: Свойство данных не подлежать огласке (составляющая свойства недоступности)
3.4.1.1 вероятность ошибки: Вероятность наличия хотя бы одной ошибки в данных определенного объема, для которого эта ошибка искажает содержание данных
3.4.2.1 функция своевременности: Вероятность своевременной переработки данных, рассматриваемая как функция заданного времени
3.4.2.2 вероятность своевременной переработки данных: Вероятность того, что время переработки данных не превысит заданное (значение функции своевременности)
3.4.2.3 среднее время переработки данных: Математическое ожидание времени выполнения технологического процесса переработки данных
3.4.3.1 коэффициент совпадения: Вероятность того, что в произвольный момент времени отображаемое в данных явление совпадает с реальным (в пределах требуемой детализации и степени точности)
3.4.3.2 функция совпадения: Вероятность того, что отображаемое в данных явление совпадает с реальным (в пределах требуемой детализации и степени точности) в момент времени t, отсчитываемый от начала обновления данных, рассматриваемая как функция t.
3.4.4.1 вероятность доступа к данным: Вероятность того, что в пределах заданного ограниченного времени (и/или ограниченного числа действий по преодолению защиты) доступ к данным будет получен
3.4.4.2 функция защищенности: Условная вероятность получения доступа к данным при условии, что выполнено определенное число m несанкционированных действий, рассматриваемая как функция m
3.4.4.3 опасность доступа: Условная вероятность получения доступа к данным при выполнении некоторого несанкционированного действия при условии, что при выполнении всех предыдущих действий доступ к данным не был получен
3.4.4.4 среднее время преодоления защиты: Математическое ожидание времени выполнения несанкционированных действий по преодолению защиты до получения доступа к данным
3.4.4.5 среднее число действий по преодолению защиты: Математическое ожидание числа несанкционированных действий по преодолению защиты до получения доступа к данным
3.4.4.6 коэффициент затрат действий на доступ: Отношение математического ожидания числа действий до получения доступа к данным в системе без средств защиты к математическому ожиданию числа действий в такой же системе, имеющей средства защиты данных
3.4.4.7 коэффициент затрат времени на доступ: Отношение математического ожидания затрат времени на доступ к данным в системе без средств защиты данных к математическому ожиданию затрат времени на доступ к данным в такой же системе, имеющей средства защиты данных
безошибочность данных |
|
вероятность доступа к данным |
|
вероятность ошибки |
|
вероятность своевременной переработки данных |
|
время переработки данных среднее |
|
время преодоления защиты среднее |
|
данные |
|
достоверность данных |
|
защищенность данных |
|
значимость данных |
|
идентичность данных |
|
истинность данных |
|
качество служебной информации |
|
контроль данных |
|
конфиденциальность данных |
|
коэффициент затрат времени на доступ |
|
коэффициент затрат действий на доступ |
|
коэффициент совпадения |
|
кумулятивность |
|
недоступность данных |
|
обобщение данных |
|
обработка данных |
|
опасность доступа |
|
оперативность данных |
|
показатель качества служебной информации |
|
процесс переработки данных технологический |
|
свойства данных внешние |
|
свойства данных внутренние |
|
свойства данных временны́е |
|
селекционность данных |
|
сжатость данных |
|
составляющие свойств данных социально-психологические |
|
составляющие свойств данных формально-технические |
|
средства переработки информации |
|
срочность данных |
|
технология информационная |
|
функция защищенности |
|
функция своевременности |
|
функция совпадения |
|
число действий по преодолению защиты среднее |
Пояснения к некоторым терминам
К терминам «Качество служебной информации», «данные» (3.1.1, 3.1.4)
Стандарт рассматривает служебную информацию (данные) как продукт функционирования информационной системы (ИС) в отличие от похода, когда данные рассматриваются как самостоятельная формальная модель. Данные являются предметом производства (продуктом) ИС, предназначенные для сбора, поиска, преобразования, накопления, хранения и других действий над данными. Определение термина «качество служебной информации» аналогично определению термина «качество продукции».
К термину «технологический процесс переработки данных» (3.1.5)
Технологические процессы переработки данных (ТППД) осуществляются в информационных системах. При этом ИС рассматривают как технологическую систему, т.е. совокупность средств технологического оснащения (комплекс технических и программных средств), предмета производства (данных) и исполнителей (человека-оператора), обеспечивающих осуществление заданных технологических процессов в заданных условиях.
К терминам «обработка данных», «контроль данных», «обобщение данных» (3.1.6, 3.1.7, 3.1.8)
Технологические операции - элементарные акты технологического процесса переработки данных, выделяемые в моделях ТППД для решения задач обеспечения качества служебной информации. Перечисленные типы технологических операций переработки данных характерны не только для ТППД, но и для любых дискретных производственных процессов. Примерами операций обработки данных являются: передача по каналам связи, перенос на машинные носители, хранение и др. Примеры операций контроля: визуальный контроль по экрану дисплея введенных в ЭВМ данных, контроль на четность и др. Примером операции обобщения является вычисление среднего значения.
Качество служебной информации во многом зависит от структуры ТППД, которую определяют в основном правила организации контроля (например наличие или отсутствие повторной обработки данных после исправления ошибок; кратность контроля; повторный контроль и обработка всего объема данных или той его части, где обнаружены ошибки и др.). В задачах обеспечения качества служебной информации важно также различать комплексный контроль, при выполнении которого могут быть обнаружены ошибки, внесенные в данные на всех предшествующих контролю этапах ТППД, и локальный контроль, при котором возможно обнаружить ошибки, внесенные лишь на отдельных операциях или группах операции ТППД.
Ввиду того, что обработка является одним из видов технологических операций, в качестве обобщающего используют термин «переработка данных».
К терминам «внутренние свойства данных», «внешние свойства данных», «достоверность данных», «кумулятивность», «временны́е свойства данных», «недоступность данных», «формально-технические свойства данных», «безошибочность данных», «сжатость данных», «оперативность данных», «идентичность данных», «защищенность данных», «истинность данных», «селекционность данных», «срочность данных», «значимость данных», «конфиденциальность данных» (3.1.9, 3.1.10, 3.1.11, 3.1.12, 3.1.13, 3.1.14, 3.1.15, 3.1.16, 3.2.1, 3.2.2, 3.2.3, 3.2.4, 3.2.5, 3.3.1, 3.3.2, 3.3.3, 3.3.4, 3.3.5).
Связь перечисленных свойств показана на рисунке А.1.
В свойстве достоверности выделяют безошибочность данных (3.2.1) и их истинность (3.3.1).
Случайные ошибки в данных обусловлены, как правило, ненамеренными искажениями содержания сведений человеком, сбоями технических средств и ошибками программ ЭВМ. При анализе истинности данных рассматривают намеренные искажения данных человеком - источником сведений.
Для обеспечения кумулятивности важно уменьшить объем перерабатываемых данных, обеспечив потребителя всеми необходимыми ему сведениями. Эту задачу можно решить без учета и с учетом опыта и квалификации конкретного потребителя данных, применяя соответственно формально-технические и социально-психологические приемы. К числу формально-технических приемов относятся, например, агрегирование - получение сводных показателей различного уровня обобщения; построение наборов данных по различным разрезам, т.е. выбор отдельных показателей из массивов исходных данных. Эти и другие формальные приемы направлены на построение моделей типа «многое в одном», когда действительность отображается с помощью малого числа символов. Соответствующее свойство данных - их сжатость (3.2.2). Учет опыта, квалификации и других свойств личности потребителя данных можно осуществлять «настройкой» ТППД на конкретного потребителя. Данные, специально отобранные для конкретного их потребителя, обладают свойством селекционности (3.3.2).
При рассмотрении временны́х свойств данных важны два фактора: согласованность динамики ТППД и динамики изменения ситуации (должно быть предусмотрено обновление - актуализация - данных по мере изменения ситуации); согласованность динамики процесса переработки данных с регламентом представления их пользователю ИС. Соответственно этим факторам различают:
- способность данных отображать динамику изменения ситуации. При этом рассматривают или время запаздывания появления в данных соответствующих признаков объектов, или расхождение реальных признаков объектов и тех же признаков, отображаемых в данных. Соответственно выделяют оперативность (3.2.3) и идентичность (3.2.4). Нарушение идентичности связано со старением данных по рассогласованию признаков, при котором происходит расхождение значений реальных признаков объектов, и значений этих признаков, отображаемых в данных;
Рисунок А.1 - Составляющие качества данных
- способность данных соответствовать динамике изменения социально-психологических взглядов и мотивов. При этом рассматривают или время запаздывания данных, которые должны быть представлены пользователю ИС к заданному сроку, определяемому социально-психологическими мотивами, или уменьшение потребности в данных у пользователя ИС с течением времени. Соответственно различают срочность (3.3.3) и значимость (3.3.4). Нарушение значимости связано с изменением ценности данных для потребителей.
При рассмотрении недоступности выделяют технические вопросы защиты данных от несанкционированного доступа (свойство защищенности (3.2.5)) и социально-психологические вопросы классификации данных по степени их конфиденциальности и секретности (свойство конфиденциальности (3.3.5)).
К термину «показатель качества служебной информации» (3.1.17)
Качественная или количественная характеристика свойства продукта ИС называется признаком. Количественная характеристика свойства продукта называется параметром продукта. Он характеризует любые свойства продукции, в том числе входящие в состав ее качества. Параметр продукции ИС, характеризующий свойство, входящее в состав качества служебной информации, называется показателем качества служебной информации.
К термину «вероятность ошибки» (3.4.1.1)
В качестве показателя безошибочности данных иногда используют вероятность P отсутствия ошибок в данных определенного объема. Ввиду того, что значения P близки к единице, удобнее использовать вероятность Q наличия хотя бы одной ошибки в данных определенного объема. (Очевидно, что P + Q = 1). В качестве такого объема данных может быть использован любой объем, для которого справедливо условие: наличие в нем хотя бы одной ошибки недопустимо, так как искажает содержание сведений. В определении показателя необходимо указать тот объем данных, которому соответствует значение показателя, например вероятность ошибки в знаке и т.д.
К терминам «функция своевременности», «вероятность своевременной переработки данных», «среднее время переработки данных», «коэффициент совпадения», «функция совпадения» (3.4.2.1, 3.4.2.2, 3.4.2.3, 3.4.3.1, 3.4.3.2)
При оценке технических составляющих временны́х свойств данных можно рассматривать или случайный процесс изменения разности Δx(t) между реальным и отображаемым в данных процессами эволюции характеристик объекта, или время запаздывания Δt появления соответствующих признаков объекта в служебной информации (рисунок А.2). Если основное внимание уделять динамике ТППД, следует рассматривать случайный процесс изменения времени запаздывания данных. При этом используют показатели оперативности данных и методы их оценки. Если необходимо оценить степень совпадения признаков реального явления и его отображения в данных, то следует рассматривать случайный процесс Δx(t).
Рисунок А.2 - Реализации процесса эволюции
параметров (а) и качественных
признаков (б) реального объекта (1) и его отображения в
информации (2)
При оценке оперативности данных время Tc выполнения совокупности операций, входящих в состав ТППД, сравнивается с заданным временем t. В качестве показателя оперативности используют характеристики времени выполнения совокупности операций, составляющих ТППД:
Tc = φ (T1, ..., Tj, ..., Tn), (А.1)
где Tj, (j = 1, ..., п) - время выполнения j-й операции (n - количество операций в ТППД);
φ определяется структурой ТППД.
Наиболее часто применяют функцию распределения
Fc(t) = P {Tc ≤ t}, (A.2)
которая получила название функции своевременности. В виде случаев удобно использовать математическое ожидание M[Tc] времени выполнения совокупности операций, входящих в состав ТППД.
При оценке идентичности данных выделяют два типа ИС по периодичности использования в них данных: в случайные моменты времени и регламентированно. Как правило, в системах первого типа данные обновляются при изменении состояний отображаемого в них явления; в системах второго типа - непосредственно перед использованием данных. Для ИС, в которых данные используют в случайные моменты времени, в качестве показателя идентичности следует использовать коэффициент совпадения (3.4.3.1), для систем с регламентированным использованием данных - функцию совпадения (3.4.3.2).
К терминам «вероятность доступа к данным», «функция защищенности», «опасность доступа», «среднее время преодоления защиты», «среднее число действий по преодолению защиты», «коэффициент затрат действий на доступ», «коэффициент затрат времени на доступ» (3.4.4.1, 3.4.4.2, 3.4.4.3, 3.4.4.4, 3.4.4.5, 3.4.4.6)
Функция защищенности G(m) (3.4.4.2) характеризует не только соответствующее свойство данных, но и степень приспособленности средства защиты к выполнению своей задачи. Важный частный случай G(m = l) - вероятность получения доступа к данным при выполнении первого несанкционированного действия. Зная функцию G(m), m ≥ 1, можно определить опасность доступа (3.4.4.3):
(А.3)
- условную вероятность получения доступа к данным при выполнении m-го несанкционированного действия при условии, что за предыдущие m - 1 действий доступ к данным не был получен. Иногда в качестве показателя защищенности данных удобно использовать математическое ожидание числа несанкционированных действий (3.4.4.5) или времени, затрачиваемого на их выполнение (3.4.4.4) для преодоления защиты и получения доступа к данным.
Ключевые слова: безошибочность данных, внешние свойства данных, внутренние свойства данных, данные, достоверность данных, защищенность данных, информационная технология, истинность данных, контроль данных, обобщение данных, обработка данных, оперативность данных, сжатость данных, средства переработки информации, технологический процесс переработки данных, функция своевременности