Современные информационные системы анализа данных - SearchInform

Современные информационные системы анализа данных

Защита информации
с помощью DLP-системы

Важными моментами обеспечения успешной деятельности компании является сбор и обработка информации, касающейся состояния рынка, тенденций развития бизнеса, финансовых и других проблем. Требуется регулярное проведение анализа данных, собранных из различных источников, чтобы своевременно реагировать на происходящие изменения, поддерживать бизнес на достойном уровне. Для того чтобы ускорить сбор и изучение данных, используются многочисленны системы бизнес-анализа (business intelligence – BI). Их применение значительно облегчает внедрение новых проектов, подведение итогов и составление прогнозов будущего развития.

Особенности аналитической обработки информации

Количество информации, накапливаемой в базах данных компании, постоянно растет. Чтобы эффективно использовать разнообразные сведения, их требуется систематизировать, представить в удобном для изучения виде. Для обработки больших массивов с разрозненными данными (big data) в бизнес-аналитике используются BI-системы, включающие разнообразные технологии и инструменты.

Такие программные продукты позволяют:

  • выявить и извлечь нужные данные из накопленной разрозненной информации;
  • упорядочить сведения, представить их в единообразном виде;
  • проанализировать информацию, придать ей наглядную форму и сохранить для последующего использования.

Подобная обработка позволяет выявить закономерности в изменении данных, понять причину снижения важных показателей. Data Mining (углубленный, интеллектуальный анализ) помогает спрогнозировать дальнейшее протекание бизнес-процессов, принять решение по поводу устранения неблагоприятных ситуаций. 

При углубленном анализе используются методы математической обработки данных (статистика и оптимизация). Применяются технологии машинного обучения (Machine Learning), «искусственный интеллект». Источниками информации служат разнообразные базы данных, а для извлечения и сбора сведений используются компьютерные технологии.

Преимущества BI-систем

Использование современных информационных систем для обработки и анализа big data имеет следующие преимущества:

  • программы несложны для установки и освоения;
  • универсальны (используются при глубоком анализе информации по продажам, учету кадров, финансовым операциям, выдаче кредитов и т. д.).
  • располагают разнообразными средствами графической визуализации.

Обработка и изучение информации с использованием технологий BI позволяет производить прогнозирование и составление планов расширения бизнеса.

Вычисляются возможные риски изменения производственных технологий, привлечения новых клиентов. Благодаря анализу данных определяется вероятность получения желаемых результатов.

Углубленное исследование позволяет аналитикам вносить предложения по введению новшеств. Например, увеличить объем продаж путем создания кросс-пакетов (реализации товаров или услуг в определенной комбинации).

Аналитическая система просчитывает выгоду сотрудничества с различными поставщиками и заказчиками.

Как производится обработка информации

Информационно-аналитические программы выбирают необходимые сведения из учетных систем предприятия, сортируют их по определенным признакам.

Проводится предварительная унификация данных, которые извлекаются из базы в неоднородном виде (цифры, текст). В общем массиве могут быть пропуски, неуточненные сведения. Поэтому анализу предшествует определенная подготовка: система «очищает» информацию, исключает дублирование, кодирует и группирует ее в таблицы (матрицы). 

В столбцах располагаются данные определенного типа, а в строках – параметры, по которым производится сравнение. В процессе унификации формируются так называемые реляционные базы данных, имеющие общие признаки. Они представлены в табличной форме. Для создания запросов используется язык программирования SQL.

После проведения аналитической работы пользователь получает отчет с ее результатами.

Business intelligence продукты включают инструменты для создания запросов одновременно к нескольким источникам информации. 

Выдача результатов обычно производится в графической форме, понятной для менеджеров, не являющихся IT-специалистами.

Работа с системой осуществляется поэтапно:

1. Производится подключение к источникам данных;

2. Создаются метаданные (описания признаков, помогающих найти исследуемые объекты). От точности описаний зависит скорость анализа данных, корректность результатов и форма их представления в отчетах;

3. Формируются пакеты метаданных, расположенных в определенной логической последовательности. При этом устраняются описания, которые можно истолковать неоднозначно;

4. Производится аналитическая обработка информации, выдается отчет по углубленному анализу.

5. Программируются алгоритмы, которые должен произвести компьютер, чтобы выполнить поставленные задачи. При этом используется «машинное обучение». Компьютер «обучают» самостоятельно разрабатывать последовательность действий, что избавляет программистов от необходимости управлять каждым шагом вручную.

Различают два типа машинного обучения:

  • «С учителем» – в компьютер вводят набор входных данных и желаемых ответов. Программа сопоставляет их между собой, находит закономерность, в соответствии с которой действует в дальнейшем;
  • «Без учителя» – система самостоятельно находит взаимосвязи между исследуемыми объектами, компьютер получает сигналы к действию через процессорные нейросети. Машина занимается анализом информации и решением поставленных задач, используя полученные «знания». 

Классификация аналитических систем 

Программные продукты, используемые в бизнес-аналитике, подразделяются на следующие типы:

  • Средства для формирования хранилищ и витрин анализируемых данных;
  • Инструменты быстрой аналитической обработки многомерных данных, выделяемых по нескольким признакам (OLAP). С их помощью можно, например, узнать, сколько студентов из разных стран СНГ обучалось в МГУ в 2012 году. Примеры такого ПО: MS Analysis Services, Cognos PowerPlay, Business Objects, MicroStrategy;
  • Системы EIS и DSS, применяемые для сбора информации, моделирования бизнес-решений и управления деятельностью компании (например, АБФИ – анализ банковской и финансовой информации, LanFinance);
  • Программы для работы с запросами и отчетами (Cognos);
  • Инструменты Data Mining (средства для подготовки исходных данных, создания алгоритмов машинного обучения). К ним относятся: 
  • Программы для очистки информации, создания матриц, статистической обработки и графической визуализации отчетов, работающие на языках Python и R (Pandas, Numphy, Sklearn, Statsmodels, Pybrain и другие);
  • Инструменты для моделирования, сравнения результатов и выявления их точности (Weka);
  • RapidMiner-платформы для обработки текстовых документов несколькими пользователями, прогнозирования бизнес-ситуаций, машинного обучения.

Примеры аналитических систем

Большой популярностью пользуются такие BI-платформы, как QlikView, Tableau, Power BI и Klipfolio.

QlikView

Здесь имеются функции, позволяющие автоматически распознавать взаимосвязи между данными, что ускоряет создание отчетов в виде дашбордов (комбинированных диаграмм и графиков). Аналитическую обработку данных, извлекаемых из многих источников, облегчает их сохранение в оперативной памяти сервера. Отчеты составляются в виде документов pdf.

Tableau

Используются программные инструменты, позволяющие сравнивать показатели бизнес-процессов за различные периоды, анализировать изменения и выявлять общие тенденции. Данные извлекаются из реляционных баз, облачных хранилищ и других источников, переводятся в наглядную графическую форму. Анализировать данные в режиме реального времени могут одновременно несколько пользователей. Имеется несколько способов, позволяющих им легко обмениваться полученными результатами.

Power BI

Преимуществами этого сервиса является возможность подключения к разнообразным источникам и приложениям, позволяющим производить очистку, стандартизацию и визуализацию исследуемой информации. Возможно отслеживание анализируемых показателей в режиме реального времени, создание интерактивных дашбордов, отправка отчетов другим пользователям. Имеется бесплатная версия продукта.

Klipfolio

С помщью этой платформы обрабатывается информация из разнообразных источников (реляционных БД, файловых хранилищ MS Excel, CSV, XML, JSON). Возможно подключение неограниченного числа пользователей. Данные выражаются в виде разнообразных графиков и формул, размещаемых на дашборде, отслеживаются в реальном времени. Подключаются разнообразные приложения. 

***

Выбирая средства для аналитической обработки информации и составления отчетов, специалисты учитывают объемы данных, специфику деятельности компании, технические возможности программ, простоту их настройки.

Используемое программное обеспечение должно быть доступным для освоения, чтобы с ним могли работать экономисты, маркетологи, менеджеры по персоналу, не имеющие специальных знаний в области компьютерных технологий. Это ускорит сбор и обработку данных.

При выборе важно обращать внимание на наличие хранилища информации, а также инструментов для визуализации результатов, моделирования бизнес-процессов.

06.10.2020

Подпишитесь на нашу рассылку и получите свод правил информационной безопасности для сотрудников в шуточных стишках-пирожках.