Классификация структур данных

Аудит и классификация данных
на базе системы

СёрчИнформ FileAuditor
30 дней для тестирования «СёрчИнформ FileAuditor»ОФОРМИТЬ ЗАЯВКУ
Время чтения
Шрифт

При разработке программного обеспечения требуется уделять внимание, в каких структурах и в каком формате представлены данные, послужившие основой для создания программной оболочки, обрабатываемые прикладными программами, СУБД и служащие основой для отчетности или принятия управленческих решений.

По каким признакам проводится дифференциация

Структура данных – это заданное количество элементов и взаимодействий. Классификация производится по многим параметрам, но есть единые критерии, по которым оценивается каждый тип структуры. Она может быть физической и логической. Первая показывает, как именно данные отражаются в памяти компьютера, модели формирования памяти или хранения. Структура данных, определяемая вне емкости памяти машины, называется абстрактной или логической. 

Есть и другие классификации, составленные по разным критериям.

По составу:

  • простые, которые не делятся на элементы объемом больше бита. С физической точки зрения для этого типа конкретно указаны размер и место размещения в памяти компьютера. С логической – это неделимая единица;
  • сложные (интегрированные). Они состоят из объектов, представляют собой простые или интегрированные структуры.

Элементы системы данных взаимосвязаны между собой или нет, по этому критерию они подразделяются на:

  • несвязные, предлагаются на выбор векторы, массивы, строки, стеки, очереди;
  • связные (списки).

Связывающие данные элементы показывают взаимоотношение частей целого между собой и порядок расположения в структуре. Готовая модель может быть создана один раз и навсегда или подвергаться изменениям. 

По признаку вариативности выделяют:

  • статические модели, практически не меняющие количество и объем элементов;
  • полустатические;
  • динамические, предполагающие широкий перечень вариантов изменения параметров данных.

Под изменчивостью понимается возможность изменения количества элементов, их иерархии или характера связей. 

Еще один критерий – порядок расположения элементов:

  • линейный порядок данных;
  • нелинейный – древовидный, список из связей на нескольких уровнях, сформированный в виде графа.

Линейные модели также разделяются по критерию распределения элементов в памяти сервера:

  • произвольное связное расположение элементов данных (односвязные или двухсвязные перечни);
  • последовательное (выражается в виде векторов, строк, массивов, других вариантов группировки данных).

Каждому типу структуры данных соответствует допустимый для него тип данных, выбранный по следующим характеристикам:

  • объем памяти, предоставленной для определенного типа модели размещения данных, и способ размещения информации в памяти машины;
  • значения, разрешенные для используемого типа данных, задающие допустимые рамки – семантические, смысловые и т.д.;
  • операции, выполняемые с данными.

Классификация систем данных помогает построить более совершенный программный код, минимизирующий вероятность появления недекларируемых возможностей.


«СёрчИнформ FileAuditor» проводит автоматическую классификацию данных в файловой системе, которые содержат конфиденциальную информацию. 


Простые структуры данных служат кирпичиками, из которых складываются более сложные конструкции. Они бывают числовыми, битовыми, логическими, символьными, указателями. От типа данных зависит количество отведенных на них памяти и формат размещения в ней. 

Простые структуры, объединяясь по определенному признаку, превращаются в статические. Они не изменяются, объем памяти, выделенной для их размещения, остается постоянным на протяжении всего цикла жизни структуры. Пример подобной модели – вектор или одномерный массив данных. В нем содержится фиксированное количество однотипных элементов. Каждый из них получает индекс, помогающий найти его в памяти без использования связей между элементами, обращаясь к нему по имени и номеру. Физически элементы вектора располагаются в ячейках памяти, идущих подряд. Объем памяти, выделенной под структуру, определяется типом элемента и изначально заданным количеством элементов данных.

Комплексные структуры данных чаще всего представляют в виде многомерной матрицы, где вектор сложен из ряда позиций данных, каждая из которых – также одномерный вектор. Такой тип представления характерен для релятивных баз данных.

Второй тип многомерных структур, наиболее часто встречающийся в программировании, – множества. В них содержатся неповторяющиеся элементы одного типа (числа, двоичный код), при этом каждый элемент не должен превышать в объеме 256 бит. 

Записи – это сложная структура, не имеющая четкой систематизации. Каждая запись – совокупность полей, в которых содержатся данные разных типов. Доступ к полям производится по именам. Они используются для описания явлений предметной области – сотрудников, клиентов, продукции, содержат различные характеристики. В машинной памяти структура отображается как последовательность полей или как связный список.

Полустатические системы данных имеют переменную длину за счет изменения количества элементов. Обычно это связные списки данных. В динамических структурах меняются количество и тип элементов.

При программировании СУБД или CRM-систем используют большинство из существующих структур данных, так как они решают разные задачи – от описания функции программы до предоставления информации в удобном для пользователя виде.

03.12.2020

ПОПРОБУЙТЕ «СЁРЧИНФОРМ FILEAUDITOR»!

Полнофункциональное ПО без ограничений по пользователям и функциональности.

ПОДПИШИТЕСЬ НА ПОЛЕЗНЫЕ СТАТЬИ

Рассказываем о тенденциях отрасли, утечках и способах борьбы с ними