Целью классификации данных, которые хранятся в информационных базах, является упрощение их поиска и последующей обработки. От правильной группировки объектов информации зависит надежность их защиты. Неточное распределение по категориям может привести к слабой защищенности конфиденциальных сведений или к необоснованно высоким затратам на обеспечение информационной безопасности. При выборе методов классификации придерживаются определенных правил, учитывающих качественные и количественные характеристики объектов, а также связи между ними.
Данными называют информацию, которая хранится и обрабатывается в компьютерных системах.
Используются различные формы представления информации:
В качестве признаков классификации используют физические или технические характеристики объектов, сходство или различие в их предназначении, результаты сравнения с каким-либо эталоном.
В зависимости от используемых классификационных признаков объекты информации подразделяют на:
Программы классификации обрабатывают информацию, объединяют объекты по определенным признакам, формируют пакеты, удобные для исследования, хранения в информационной базе и переноса на электронные носители. При этом используются логический, физический и концептуальный принципы группировки объектов информации.
Логический подход подразумевает поиск способов представления исходных данных, а также выбор методов оптимального структурирования простых объектов.
Физический подход – это решение вопроса о наиболее подходящем формате конечного представления классифицируемых объектов на носителях информации (в бумажных документах, на оптических дисках, в памяти компьютера или на USB-устройствах).
Концептуальный подход подразумевает выбор метода (модели) компьютерной обработки объектов и общей концепции их группировки при составлении массивов.
Существуют разнообразные модели концептуального представления. У каждой из них имеются сильные и слабые стороны:
ID | Фамилия | Имя | Род занятий | Год рождения |
1 | Иванов | Александр | Врач | 1990 |
2 | Петрова | Мария | Студентка | 2001 |
3 | Сидорова | Наталья | Пенсионерка | 1958 |
4 | Николаев | Игорь | Инженер | 1985 |
С помощью такой модели невозможно точно отразить связи иерархического или реляционного типа, существующие между объектами.
Для классификации применяется «новая информационная технология» компьютерной обработки данных с помощью специальных программ. При этом задаются алгоритмы действий, которые позволяют машине выявить сходство или отличие между объектами.
Производится машинное обучение:
Для введения информации в компьютер используют языки программирования Python, SQL и другие. Вычисления производятся методами математической статистики с использованием алгоритмов imports from sklearn, import load iris, model fit.
«СёрчИнформ FileAuditor» проводит автоматическую классификацию данных в файловой системе, которые содержат конфиденциальную информацию.
Использование всевозможных способов представления информации и методов их классификации позволяет систематизировать большое количество всевозможных данных.
При этом выявляются связи и отношения между объектами, что упрощает сбор и аналитическую обработку информации, ее размещение в хранилищах и необходимую защиту.
02.12.2020
Подпишитесь на нашу рассылку и получите
свод правил информационной безопасности
для сотрудников в шуточных