Современные технологии позволяют без труда находить любую информацию. Больше не нужно часами сидеть в библиотеке, достаточно воспользоваться Интернетом и поисковой строкой. Однако большой объем информации требует грамотного анализа. Как отфильтровать ненужные данные?
Анализ – это заключение, или вывод из полученных данных. Данные могут анализироваться с помощью следующих методов и действий:
Любой из способов должен дать какой-либо результат, который поможет принять решение или выстроить правильный алгоритм действий. Например, бухгалтер хочет проанализировать прибыль компании. Он сделает это с помощью математического метода. Вывод покажет, упала прибыль или нет, что поможет выстроить стратегический план на следующий период.
Существует множество типов анализа данных. Одни относятся к узкой специализации, другие включают ряд подходов (длительное наблюдение, проведение экспериментов).
Выделяют несколько распространенных типов анализа данных:
Последний тип не используется в разовых алгоритмах анализа данных. Механистический тип – это изучение системы с помощью большого числа экспериментов. Чаще всего невозможно за один раз проанализировать данные механистическим образом.
Типы анализа напрямую связаны с последовательностью действий. Сам по себе тип может функционировать отдельно, но при полном анализе данных необходимо соблюдать последовательность. Некорректно начинать анализ с типа, который по логике должен использоваться на втором или третьем шаге.
Ниже представлена правильная последовательность всех типов анализа данных.
Описательный. Это начальный метод, подразумевающий сбор информации. В него также включается поиск достоверных источников. Качество исходных данных очень важно, иначе будет сделан неверный вывод.
Отыскав данные по теме, нужно провести их фильтрацию. Даже если источник достоверен, следует отсеять ненужные данные. Однако фильтровать данные по мере их нахождения – работа сложная и не всегда верная. Естественно, определенное отсеивание на стадии поиска есть, но оно не должно быть чересчур скрупулезным.
Теперь по порядку. Качественное ознакомление с информацией проводится следующей последовательностью действий:
Важное уточнение: фильтрация применяется на протяжении всего анализа данных. Однако, выявление ненужной или «фейковой» информации должно проводиться на первом этапе. Иначе часть работы будет строиться на лжи.
Разведочный. Этап «разведки» преобразовывает данные в графику. Голые цифры или факты в таблице – неудобный формат анализа. Поэтому собранную информацию можно преобразовать в графический формат. Диаграммы, графики, гистограммы – любая визуальная составляющая поможет объективнее посмотреть на информацию.
В график следует перевести данные, которые помечены как «особо важные». Увидев иллюстрацию, аналитик сможет заметить все пробелы, выделить нужную переменную и не упустить из виду нужную информацию.
Какой именно график подойдет, нужно решить исходя из специфики данных. Так, для оценки роста и падения лучше всего подходит диаграмма Парето, а для разделения объекта на части – круговая диаграмма.
Индуктивный. Этот тип анализа поможет сделать статистические выводы по собранной и описанной в предыдущих шагах информации.
Качественный статистический вывод невозможен без вопроса. Каждый факт нужно подвергнуть сомнению.
Примеры:
Чем больше будет задано вопросов по предоставленным данным, тем больше ошибок или наоборот, соответствий будет найдено.
Прогностический. Данный тип анализа подразумевает прогнозирование сферы, в которой работает аналитик. Во многих областях жизни можно увидеть закономерность, запомнить «симптомы». Аналитики в сфере бизнеса могут предсказать рост или падение акций, увеличение или снижение продаж и так далее.
Начинается прогнозирование с определения класса данных. Чем выше класс, (то есть данные имеют множество ассоциаций, основаны на фактах и влияют на другие сферы), тем проще найти закономерность.
Допустим, бизнесмен желает просчитать будущую прибыль. Он берет данные о продажах за последний квартал. В них указано количество проданного товара, розничная стоимость и налоги, а также конкретный период. Если товар – солнечные очки, а квартал пришелся на лето, то бизнесмен может прогнозировать, что осенью продажи могут упасть на N пунктов.
Дать точный прогноз можно только при наличии достоверной информации «из прошлого». Поэтому важно убедиться в точности фактов и цифр.
Для наиболее точного прогнозирования используется логическая регрессия. На основе регрессии работает машинное обучение и нейронные сети.
Казуальный. На данном этапе устанавливается причинно-следственная связь между прошлым, настоящим и возможным будущим. В первую очередь необходимо понять, что привело к настоящему. Исходя из графиков, статистических выводов и недалеких прогнозов делается вывод.
Почему упала прибыль? Почему этот пост набрал большего всего «лайков»? Без предыдущих шагов невозможно определить причину и следствие любого результата.
Но есть ограничения. Возможно, тот или иной положительный результат получился не за счет качественного подхода, а по стечению обстоятельств. Чтобы это выяснить, потребуются дополнительные эксперименты.
Анализ данных – скрупулезная работа, требующая внимательности. Чем больше инструментов в руках аналитика, тем качественнее будет сделан вывод. Следует повышать квалификацию в каждом этапе, оптимизируя и ускоряя рабочий процесс.
09.12.2019
Подпишитесь на нашу рассылку и получите
свод правил информационной безопасности
для сотрудников в шуточных