Контент-анализ данных - SearchInform

Контент-анализ данных

Защита информации
с помощью DLP-системы

Контент-анализ – это метод обработки информации, с помощью которого ведется не только качественная, но и количественная оценка данных. При сопоставлении показателей производятся математические расчеты для обнаружения закономерностей. Процедура контент-анализа осуществляется поэтапно. Она проводится либо в дополнение к общему анализу какой-либо информации, либо используется как независимый прием исследования.

Где применяется подобный анализ

С помощью контент-анализа исследуется текстовая информация в журналистике, социологии, психологии, истории, культурологии, политологии. 

По результатам анализа изучают темпы развития бизнеса, шансы на получение преимуществ перед конкурентами. С помощью такого метода осуществляется управление кадрами.

Анализ применяется для оценки качества художественных или технических текстов. 

Методика контент-анализа дает возможность узнать об отношении населения к какой-либо политической программе, изучить эффективность рекламы, уровень популярности телевизионных передач.

Пример. Сотрудники центра социологии проводят анализ работы отдельных радиоканалов и собирают информацию о популярности обсуждаемых тем. Все сообщения кодируются, затем проводится контент-анализ с подсчетом времени, отведенного отдельным программам. В результате даются рекомендации по поводу повышения рейтинга каналов путем изменения тематики.

Контент-анализ включает следующие операции:

  • выделение категорий, по которым производится анализ;
  • выявление индикаторов (факторов, присущих исследуемым объектам), то есть задач, которые решает анализ;
  • статистические расчеты для получения результатов.

Достоинство контент-анализа состоит в возможности обработки объемной информации (например, из газет, собранных за многие годы) и сравнения событий, отдаленных по времени. 

Анализ таким методом позволяет выявлять скрытые признаки и тенденции, которые остаются незамеченными в повседневной жизни. Фактам дается математически точная оценка.

Однако у этого метода имеются ограничения. События, подвергаемые анализу, могут быть изложены авторами текстов (например, историками или писателями) с искажениями и неточностями. Результаты, полученные на основе изучения фактов, описанных разными людьми, могут существенно отличаться.

Поэтому оценка контента при таком анализе не всегда является абсолютной истиной.

Этапы проведения исследования

В контент-анализе за основу берут следующие индикаторы (смысловые единицы):

  • определенные термины или символы;
  • толкования фактов, спорные моменты;
  • тематика текстов, теле- и радиопередач;
  • исторические, политические, социальные события.

Контент-анализ включает три этапа: подготовительный, исполнительный и этап обработки собранных материалов.

Этап подготовки

На этом этапе определяют цели контент-анализа, разрабатывают программу действий, выделяют определенные факторы (смысловые единицы). Уточняют объем работы, составляют схему исследования данных (классификатор), а также соответствующие инструкции с методами обработки информации. 

Классификатор представляет собой перечень категорий анализа и единиц счета.

Аналитические категории 

Это проблемы и темы, которые затрагиваются в ходе контент-анализа (например, «семейные отношения», «проблемы со здоровьем», «карьерный рост»). Данные выбирают из письменных источников, результатов социологического опроса, анкетирования.

При составлении схемы исходят из того, что источники являются достоверными, а категории, по которым проводится анализ, имеют конкретный смысл и однозначное толкование. 

Единицы счета

В контент-анализе так называют количественные отношения между анализируемыми факторами (например, частота появления в тексте каких-либо понятий или пропорции между отдельными характеристиками).

Единицами счета при таком анализе могут быть:

  • количество печатных знаков в тексте, описывающем событие;
  • процентное соотношение объема выбранной информации и общего объема изучаемого текста;
  • число абзацев и колонок в таблице с данными;
  • количество рисунков определенного содержания;
  • длина пленки, ушедшей на видео- или аудиозапись;
  • время, потраченное на озвучивание конкретного факта за определенный период (неделя, месяц и т. д.).

Содержание инструкций и кодировочных матриц

Инструкции составляют для сотрудников, которые занимаются компьютерным кодированием анализируемой информации. В них указывают категории и аналитические признаки, а также единицы счета, употребляемые при контент-анализе.

Для занесения полученных результатов создается кодировочная матрица – специальная анализ-таблица. По вертикали располагаются исследуемые категории, а в горизонтальной шапке – названия источников информации. На пересечении столбцов и строк помещают результаты расчетов, по которым производится анализ.

Этап исполнения 

Специалисты проводят кодировку данных в соответствии с подготовленной инструкцией.

Качество контент-анализа («устойчивость результатов») напрямую зависит от правильности составления инструкций и точности их исполнения. Кодировщик должен обладать достаточными знаниями в исследуемой области, выполнять свою работу добросовестно. Кодировка требует большого внимания и терпения.

При несоблюдении таких условий могут быть пропущены отдельные единицы контент-анализа, зафиксированы ненужные сведения или неправильные соотношения между анализируемыми показателями.

При кодировании за основу берут следующие характеристики:

  • частота проявления факта или события (например, заключения браков между людьми разного вероисповедания);
  • направленность событий (позитивная-негативная, согласие-опровержение);
  • интенсивность (преувеличение проблемы или ее смягчение);
  • пространство (внимание, уделяемое этому факту на фоне других).

Типы кодирования

Различают манифестный и латентный контент-анализ, в каждом из которых используют соответствующий тип кодирования.

При манифестном кодировании фиксируются явные, открытые признаки (например: количество слова «оранжевый» в тексте). Компьютер абсолютно точно подсчитывает количество заданных категорий. Недостаток состоит в том, что техника не может различать слова, одинаковые по написанию, но разные по смыслу (омонимы), поэтому такой способ кодирования при контент-анализе применим не всегда.

Латентное позволяет выявлять неявные (косвенные) признаки (например, выяснить, в каком жанре описана сюжетная сцена, какие намечаются тенденции в развитии экологической политики). 

Этап обработки сведений и получения результатов

Обработка кодировочных матриц производится с помощью специальных сопоставительных таблиц и коэффициентов корреляции.

При анализе большого количества данных используют методы математической статистики, с помощью которых определяют частоту событий и проценты распределения различных показателей.

Обработка характеристик ведется путем проведения так называемого «факторного анализа», то есть вычисления зависимости результатов от определенных факторов.

Для того чтобы сопоставить положительные и отрицательные результаты оценки события при анализе пользуются математической формулой расчета «коэффициента Яниса» (С).

Когда число положительных оценок превышает число отрицательных:

Коэффициент Яниса, когда число положительных оценок превышает число отрицательных

где f – число оценок со знаком «+»;
n – число оценок со знаком «-»;
r – объем текста, имеющего отношение к конкретной проблеме;
t – общий объем анализируемого текста.

Когда число отрицательных оценок превышает число положительных:

Коэффициент Яниса, когда число отрицательных оценок превышает число положительных

В некоторых случаях вычисляют «удельный вес» фактов или событий, то есть отношение показателей, касающихся частного явления, к общей массе анализируемых характеристик.

Применение контент-анализа в бизнесе

Проведение контент-анализа позволяет успешно реализовывать новые бизнес-проекты, обеспечивать их окупаемость и маркетинговое продвижение.

Прежде чем приступать к разработке собственной бизнес-стратегии, специалисты анализируют спрос и предложение на рынке готовой продукции, изучают опыт конкурентов.

При проведении анализа конкурентов исследуют влияние на успешность бизнеса таких факторов, как:

  • характеристика потребителей продукции (преобладающий пол, возраст, семейное и социальное положение, район проживания);
  • актуальность бизнеса (спрос на продукцию, соответствие ее выпуска запросам потребителей);
  • релевантность маркетингового продвижения товара или услуги (полезность рекламы). результаты исследования позволяют понять, какие приемы или мероприятия способствуют популяризации проекта (расширение интернет-рекламы, проведение конкурсов, оповещение клиентов о скидках и акциях).

Для выявления конкурентов по бизнесу обычно используют поисковые программы, изучают маркетинговые предложения в социальных сетях. О популярности конкурентов можно судить по количеству запросов пользователей и отзывам клиентов.

Для отслеживания эффективности рекламы товаров и услуг обращают внимание на такие показатели, как:

  • равномерность и частота появления новых рекламных публикаций в группе заинтересованных пользователей;
  • количество людей в такой группе (если их меньше 1 000, то результаты контент-анализа могут не соответствовать действительности);
  • количество просмотров рекламы (чем их больше, тем точнее аналитические показатели);
  • вовлеченность клиентов, то есть наличие комментариев под тематическими и продающими постами.

При продвижении уникального бизнеса и отсутствии явных конкурентов проводят анализ деятельности смежных производителей, решающих сходные задачи.

***

Контент-анализ позволяет с помощью математических расчетов определить показатели, характерные для различных событий и явлений, произвести сравнение между ними, выявить общие закономерности.

Подобный аналитический метод применяется в различных сферах жизни и деятельности людей, поскольку с его помощью можно исследовать большие массивы информации, обнаруживать связи между отдаленными событиями, выявлять скрытые тенденции. 

Контент-анализ используется при составлении бизнес-планов, изучении перспектив внедрения новых проектов. Такой метод применяется также для оценки исторических и политических событий, социальных явлений.

13.10.2020

Подпишитесь на нашу рассылку и получите свод правил информационной безопасности для сотрудников в шуточных стишках-пирожках.