Анализ использования данных

Аудит и классификация данных
на базе системы

СёрчИнформ FileAuditor
30 дней для тестирования «СёрчИнформ FileAuditor»ОФОРМИТЬ ЗАЯВКУ
Время чтения
Шрифт

Не только большинство областей научного знания, но и бизнес нуждается в комплексном анализе информации с применением данных, формируемых в процессе деятельности компании. Такое исследование позволяет получить данные, которые станут основой для принятия решений. На изучении данных основаны технологии нейронных сетей и машинного обучения, становящиеся одним из основных методов управления производством.

Особенности изучения особенностей работы с данными

Необходимость анализа в бизнесе не подвергается сомнению. Находя взаимосвязи между явлениями и выявляя закономерности, можно повысить качество принятия управленческих решений. Часто глубокое исследование известных переменных позволяет приходить к неожиданным выводам. При работе с данными необходимо уделять внимание их качеству. 

Информация, подвергаемая исследованию, бывает следующих типов:

  • численная (стоимость товара, объем продаж по регионам, уровень дохода целевого клиента);
  • интервальная (доля рынка, шаг роста продаж по сравнению с предыдущим периодом);
  • ранговая (используется при исследовании лояльности потребителей, например, «Боржоми» нравится россиянам больше, чем «Ессентуки»);
  • номинальная (характеристика объекта, например, профессия, семейное положение).

Релевантные выводы будут получены только при определенном количестве данных. В статистике и бизнес-анализе данных используется термин «малая выборка», где исследуется не менее 30 событий. Если изучается несколько групп явлений, то количество событий умножается на число групп.

Современные методы исследования

Изучение различных вопросов с использованием данных, как числовых, так и семантических, позволяет улучшить качество бизнес-процессов. Для целей бизнеса информация собирается методом анкетирования, опросов, из первичных учетных документов и CRM-систем, наборы данных могут быть заказаны у специализированных консалтинговых организаций. Выбор метода исследования зависит от категории вопросов, на которые необходимо получить ответ.

Алгоритмы исследования делятся одномерные и многомерные. В одномерном сравнение характеристик проводится только по одному параметру. Многомерный анализ данных позволяет одновременно исследовать взаимоотношения двух и более переменных и устанавливать корреляцию и причинно-следственные связи между ними.

Наиболее часто используются факторный и кластерный методы. Факторный позволяет выявить параметры, определяющие наиболее значимые различия между переменными, классифицировать данные и сократить количество используемых переменных. На практике применение метода эффективно для оценки имиджа компании, составления социально-психологического портрета потребителя, изучения уровня доверия партнеров к банку или финансовой компании.

При применении кластерного метода данные со схожими параметрами распределяются по группам, кластерам, которые уже сами подлежат изучению. Подход позволяет сократить объем логических операций. 

В ходе кластерного анализа формируется портрет целевой аудитории бренда:

1. Проводится выборка данных из клиентской базы.

2. Организуется анкетирование.

3. Определяются параметры, на основании которых проводится исследование.

4. Изучаются ответы респондентов, выявляются сходства и различия между ними, исключаются нерелевантные значения, шумы, искажения.

5. Создаются правила кластеризации, на основании которых респонденты объединяются в группы.

6. Определяется оптимальное число кластеров.

7. Результатом исследования становится таблица, в которой клиенты сгруппированы по их предпочтениям.

Факторный метод исследования на основе данных различного происхождения широко применяется:

  • в социологии. Позволяет разделить респондентов на разные социальные и демографические группы;
  • в маркетинге. Потребители и товары сегментируются по предпочтениям, уровню продаж, региональным особенностям;
  • в менеджменте. Для изучения активности конкурентов или отраслей.

Многомерные методы изучения данных доступны в Excel и специализированных программах.


«СёрчИнформ FileAuditor» позволяет провести классификацию данных в автоматизированном режиме и узнать, сколько в компании данных, содержащих конфиденциальные сведения. 


Нейронные сети

С развитием искусственного интеллекта широкое применение приобрел метод анализа использования данных с помощью нейронных сетей. Он применяется в различных областях науки, производства, коммерции. 

Задачи, которые ставятся перед нейронными сетями:

  • Классификация образов. Разработаны программные продукты, распознающие буквы, речь в аудиофайлах, графические ритмы, применяемые при изучении электрокардиограмм, биометрической информации. 
  • Кластеризация и классификация. Данные сжимаются, исследуются, из них извлекаются знания новой природы.
  • Аппроксимация функций. Метод позволяет обеспечить шумоподавление при приеме звуковых сигналов безотносительно к типу звуковой информации.
  • Предсказания и прогнозы. Нейронные сети способны предсказать направления движения биржевых котировок и изменения погоды.
  • Ассоциативная память. Используется при создании мультимедийных баз данных.
  • Управление. Нейронные сети применяются в программах беспилотного управления кораблям или самолетами.

Схема изучения данных при помощи технологии нейронных сетей состоит из следующих этапов:

  • выбор топологии сети из девяти возможных типов;
  • подбор характеристик сети. Производится экспериментальным путем, определяется количество нейронов, направление их движения и другие параметры;
  • подбор характеристик обучения – времени, количества данных, максимально допустимых отклонений и ошибок;
  • обучение сети;
  • проверка качества обучения.

Нейронные сети с успехом были применены для изучения электоральных предпочтений и предсказания результатов выборов в США. Сетям нужно было найти ответ на пять вопросов:

  1. Была ли серьезная конкуренция при выдвижении конкурентов от правящей партии?
  2. Были ли серьезные социальные взрывы в течение текущего срока?
  3. В год выборов наблюдался экономический рост или спад?
  4. Происходили ли существенные изменения в политической жизни?
  5. Была ли активна третья партия?

Ответы на эти вопросы помогли точно предсказать результаты выборов.

Практические примеры

В бизнесе изучение качества обработки данных решает множество практических задач. Применяются как статистические методы изучения числовой информации, так и интеллектуальный анализ (data mining) семантических данных.

Интеллектуальный анализ данных в CRM-системах

Компании, работающие с большим количеством клиентов, активно используют CRM-системы. При изучении хранящейся в них информации о клиентах и продажах применяются следующие алгоритмы:

  • дерево решений;
  • градиентный бустинг (метод машинного обучения, нивелирующий смещение значений);
  • логистическая регрессия;
  • нейронные сети.

В работе аналитического механизма используются данные о продажах и клиентах, которые обрабатываются по алгоритмам:

  • Регрессии, или нахождения взаимосвязи между входными и выходными параметрами. Она применяется для предсказания спроса, оценки эластичности цен, вероятности превращения клиента в постоянного, расчетов загруженности склада или магазина, оценки влияния различных факторов на спрос.
  • Классификации, или распределения параметров между различными функциональными группами. В рамках этого алгоритма оценивается потенциал клиента и его платежеспособность, проводятся процедуры скоринга, осуществляется оценка кредитных рисков, оцениваются перспективы сделки или рекламной кампании.
  • Кластеризации, или разбиения объектов на группы схожих элементов (кластеры). При использовании метода сравнивают поведение объектов из разных кластеров. Алгоритм используется в маркетинговом анализе для выявления товаров со схожей структурой спроса, клиентов с общими особенностями потребительского поведения.
  • Ассоциации. Производится исследование одновременно происходящих трансакций, выявляются зависимости. Метод хорош для анализа кросс-продаж и оптимизации складских запасов.

Перед началом исследования необходимо проверить качество данных, устранить дубликаты, погрешности, шумы, выбросы. Качественно подобранные данные анализируются в прикладных программах, допустимо их применение в моделях нейронных сетей.

Анализ данных и маркетинговое исследование рынка

Анализ информации с применением специальных программ в маркетинговом исследовании рынка становится инструментом, существенно повышающим конкурентные преимущества компании. В качестве основного метода традиционно применяется многомерный статистический анализ использования данных, в ходе которого изученная информация отражается в виде графиков. 

Алгоритм исследования опирается на статистические методы:

  • кластерный и факторный анализ;
  • многомерное шкалирование;
  • дискриминантный анализ;
  • дерево классификации;
  • нейронные сети;
  • генетические алгоритмы;
  • нечеткая логика.

Во всех методах, кроме нечеткой логики, объекты классифицируются с созданием кластеров с непересекающимися данными, для нечеткой логики пересечение возможно. Анализ использования данных дает возможность оценить эффективность применения маркетинговых инструментов.

Изучать маркетинговые решения можно при помощи уже выпущенных на рынок программных продуктов. Но некоторые компании предпочитают создавать собственные разработки для решения конкретных задач. 

Среди популярных онлайн-инструментов называют:

  • Roistat.ru. Сервис сквозной аналитики для интернет-рекламы с расширенным функционалом, например, исследования эффективности работы с лидами. Программа имеет бесплатный пробный период;
  • Comagic.ru. Помимо качественной аналитики, в программе есть сервис коллтрекинга, позволяющий анализировать звонки клиентов, регистрируемые в CRM-системах. Преимущества программы – невысокая цена, бесплатная установка и техническая поддержка;
  • Сalltracking.ru. Продукт для коллтрекинга и качественного веб-аналитики;
  • Carrotquest.io. Сервис включает множество функций, в том числе, e-mail и CRM-маркетинг.

Качество изучения напрямую зависит от двух факторов – качество данных и выбранной технологии исследования. 

16.12.2019

ПОДПИШИТЕСЬ НА ПОЛЕЗНЫЕ СТАТЬИ

Рассказываем о тенденциях отрасли, утечках и способах борьбы с ними