Интерактивная аналитическая обработка (OLAP) — это технология, которая используется для организации больших бизнес-баз данных и поддержки бизнес-аналитики. Базы данных OLAP делятся на один или несколько кубов, и каждый куб организован и разработан администратором куба в соответствии с способом получения и анализа данных, чтобы было проще создавать и использовать необходимые отчеты сводной таблицы и сводной диаграммы.
В этой статье
Что такое бизнес-аналитика?
Бизнес-аналитик часто хочет получить общую картину бизнеса, увидеть более широкие тенденции, основанные на агрегированных данных, и увидеть эти тенденции, разбитые на любое количество переменных. Бизнес-аналитика — это процесс извлечения данных из базы данных OLAP, а затем анализа этих данных для получения сведений, которые можно использовать для принятия обоснованных бизнес-решений и принятия мер. Например, OLAP и бизнес-аналитика помогают ответить на следующие типы вопросов о бизнес-данных:
-
Как суммарный объем продаж всех продуктов за 2007 год сравнивается с общим объемом продаж за 2006 год?
-
Как наша прибыльность к дате соотносится с тем же периодом времени за последние пять лет?
-
Сколько денег потратили клиенты старше 35 лет в прошлом году, и как это поведение изменилось с течением времени?
-
Сколько продуктов было продано в двух конкретных странах или регионах в этом месяце по сравнению с тем же месяцем в прошлом году?
-
Каково распределение рентабельности каждой возрастной группы клиентов (как в процентах, так и в общей сумме) по категориям продуктов?
-
Найдите лучших и нижних продавцов, дистрибьюторов, поставщиков, клиентов, партнеров или клиентов.
Что такое интерактивная аналитическая обработка (OLAP)?
Базы данных OLAP упрощают запросы бизнес-аналитики. OLAP — это технология базы данных, оптимизированная для запросов и создания отчетов вместо обработки транзакций. Исходными данными для OLAP являются базы данных OLTP, которые обычно хранятся в хранилищах данных. Данные OLAP являются производными от этих исторических данных и объединяются в структуры, которые позволяют выполнять сложный анализ. Данные OLAP также организованы иерархически и хранятся в кубах, а не в таблицах. Это сложная технология, которая использует многомерные структуры для быстрого доступа к данным для анализа. Эта организация позволяет отчету сводной таблицы или сводной диаграмме легко отображать высокоуровневые сводки, такие как итоги продаж по всей стране или региону, а также отображать сведения о сайтах, где продажи особенно сильны или слабы.
Базы данных OLAP предназначены для ускорения получения данных. Так как сервер OLAP, а не Microsoft Office Excel, вычисляет сводные значения, при создании или изменении отчета в Excel необходимо отправлять меньше данных. Такой подход позволяет работать с гораздо большими объемами исходных данных, чем если бы данные были организованы в традиционной базе данных, где Excel извлекает все отдельные записи, а затем вычисляет суммированные значения.
Базы данных OLAP содержат два основных типа данных: меры, являющиеся числовыми данными, объемы и средние значения, используемые для принятия обоснованных бизнес-решений, и измерения, которые являются категориями, которые используются для организации этих мер. Базы данных OLAP помогают упорядочивать данные по многим уровням детализации, используя те же категории, которые вы знакомы для анализа данных.
В следующих разделах подробно описывается каждый компонент:
Куб Структура данных, которая агрегирует меры по уровням и иерархиям каждого из измерений, которые требуется проанализировать. Кубы объединяют несколько измерений, таких как время, география и линейки продуктов, с обобщенными данными, такими как данные о продажах или запасах. Кубы не являются "кубами" в строго математическом смысле, так как они не обязательно имеют равные стороны. Тем не менее, они являются меткой метафорой для сложной концепции.
Измерять Набор значений в кубе, основанных на столбце в таблице фактов куба и обычно представляют собой числовые значения. Меры — это центральные значения в кубе, которые предварительно обрабатываются, агрегируются и анализируются. Распространенные примеры включают продажи, прибыль, доходы и затраты.
Член Элемент в иерархии, представляющий одно или несколько вхождений данных. Член может быть уникальным или неуникальным. Например, 2007 и 2008 представляют уникальные элементы на уровне года измерения времени, тогда как январь представляет собой неуниковые члены на уровне месяца, так как в измерении времени может быть более одного января, если он содержит данные за более чем один год.
Вычисляемый элемент Член измерения, значение которого вычисляется во время выполнения с помощью выражения. Вычисляемые значения элементов могут быть производными от значений других элементов. Например, вычисляемый член Profit можно определить путем вычитания значения элемента Затраты из значения элемента Sales.
измерение Набор из одной или нескольких организованных иерархий уровней в кубе, которые пользователь понимает и использует в качестве основы для анализа данных. Например, географическое измерение может включать уровни для страны или региона, штата или провинции и города. Кроме того, измерение времени может включать иерархию с уровнями для года, квартала, месяца и дня. В отчете сводной таблицы или отчете сводной диаграммы каждая иерархия становится набором полей, которые можно развернуть и свернуть, чтобы выявить более низкие или более высокие уровни.
Иерархия Логическая древовидная структура, которая упорядочивает члены измерения таким образом, что каждый элемент имеет один родительский элемент и ноль или несколько дочерних элементов. Дочерний элемент является членом следующего нижнего уровня иерархии, которая напрямую связана с текущим элементом. Например, в иерархии времени, содержащей уровни Квартал, Месяц и День, январь является дочерним элементом Qtr1. Родительский элемент — это член на следующем более высоком уровне иерархии, которая напрямую связана с текущим элементом. Родительское значение обычно является консолидацией значений всех его дочерних элементов. Например, в иерархии времени, содержащей уровни Квартал, Месяц и День, Qtr1 является родительским элементом января.
Уровень В иерархии данные можно упорядочить на более низкий и более высокий уровни детализации, такие как уровни года, квартала, месяца и дня в иерархии времени.
Функции OLAP в Excel
Получение данных OLAP Вы можете подключаться к источникам данных OLAP так же, как и к другим внешним источникам данных. Вы можете работать с базами данных, созданными с помощью microsoft SQL Server OLAP Services версии 7.0, Microsoft SQL Server Analysis Services версии 2000 и Microsoft SQL Server Analysis Services версии 2005, серверных продуктов Microsoft OLAP. Excel также может работать со сторонними продуктами OLAP, совместимыми с OLE-DB для OLAP.
Данные OLAP можно отображать только как отчет сводной таблицы или отчет сводной диаграммы или в функции листа, преобразованной из отчета сводной таблицы, но не в виде диапазон внешних данных. Отчеты сводной таблицы OLAP и отчеты сводной диаграммы можно сохранять в шаблонах отчетов, а также создавать файлы подключения к данным Office (ODC) для подключения к базам данных OLAP для запросов OLAP. При открытии ODC-файла Excel отображает пустой отчет сводной таблицы, готовый для размещения.
Создание файлов куба для автономного использования Вы можете создать автономный файл куба (CUB- файл) с подмножеством данных из серверной базы данных OLAP. Используйте автономные файлы куба для работы с данными OLAP, если вы не подключены к сети. Куб позволяет работать с большими объемами данных в отчете сводной таблицы или отчете сводной диаграммы, чем в противном случае, и ускоряет извлечение данных. Файлы куба можно создавать, только если используется поставщик OLAP, например Microsoft SQL Analysis Services Server версии 2005, который поддерживает эту функцию.
Действия сервера Действие сервера — это необязательная, но полезная функция, которую администратор куба OLAP может определить на сервере, который использует член куба или меру в качестве параметра в запросе для получения сведений в кубе или запуска другого приложения, например браузера. Excel поддерживает действия сервера URL-адреса, отчета, набора строк, детализации и развертывания до сведений, но не поддерживает проприетарный, оператор и набор данных.
Ключевые показатели эффективности Ключевой показатель эффективности — это специальная вычисляемая мера, определяемая на сервере, которая позволяет отслеживать "ключевые показатели эффективности", включая состояние (соответствует ли текущее значение определенному числу?). и тренд (какое значение с течением времени?). При отображении этих значков сервер может отправлять связанные значки, похожие на новый значок Excel, чтобы указать выше или ниже уровней состояния (например, значок стоп-индикатора) или указывает, имеет ли значение тенденцию вверх или вниз (например, значок стрелки направления).
Форматирование сервера Администраторы кубов могут создавать меры и вычисляемые члены с помощью правил форматирования цветов, форматирования шрифтов и условного форматирования, которые могут быть обозначены как корпоративное стандартное бизнес-правило. Например, серверный формат для прибыли может быть числовым форматом валюты, цветом ячейки зеленого цвета, если значение больше или равно 30 000, и красным, если значение меньше 30 000, и шрифтом полужирным шрифтом, если значение меньше 30 000, и обычным, если больше или равно 30 000. Дополнительные сведения см. в статье Проектирование макета и формата отчета сводной таблицы.
Язык интерфейса Office Администратор куба может определять переводы данных и ошибок на сервере для пользователей, которым нужно просматривать сведения сводной таблицы на другом языке. Эта функция определяется как свойство подключения к файлу, а параметр страны или региона компьютера пользователя должен соответствовать языку интерфейса.
Программные компоненты, необходимые для доступа к источникам данных OLAP
Поставщик OLAP Чтобы настроить источники данных OLAP для Excel, вам потребуется один из следующих поставщиков OLAP:
-
Поставщик Microsoft OLAP Excel включает драйвер источника данных и клиентское программное обеспечение, необходимое для доступа к базам данных, созданным с помощью служб OLAP Microsoft SQL Server версии 7.0, Microsoft SQL Server OLAP Services версии 2000 (8.0) и Microsoft SQL Server Analysis Services версии 2005 (9.0).
-
Сторонние поставщики OLAP Для других продуктов OLAP необходимо установить дополнительные драйверы и клиентское программное обеспечение. Чтобы использовать функции Excel для работы с данными OLAP, сторонний продукт должен соответствовать стандарту OLE-DB для OLAP и быть совместимым с Microsoft Office. Сведения об установке и использовании стороннего поставщика OLAP см. у системного администратора или поставщика продукта OLAP.
Серверные базы данных и файлы кубов Клиентское программное обеспечение OLAP для Excel поддерживает подключения к двум типам баз данных OLAP. Если база данных на сервере OLAP доступна в сети, исходные данные можно получить напрямую. Если у вас есть автономный файл куба, содержащий данные OLAP, или файл определение кубов, вы можете подключиться к нему и получить из него исходные данные.
Источники данных Источник данных предоставляет доступ ко всем данным в базе данных OLAP или автономном файле куба. После создания источника данных OLAP вы можете создать на нем отчеты и вернуть данные OLAP в Excel в виде отчета сводной таблицы или отчета сводной диаграммы или в функции листа, преобразованной из отчета сводной таблицы.
Microsoft Query Запрос можно использовать для получения данных из внешней базы данных, такой как Microsoft SQL или Microsoft Access. Вам не нужно использовать запрос для получения данных из сводной таблицы OLAP, подключенной к файлу куба. Дополнительные сведения см. в статье Использование Microsoft Query для получения внешних данных.
Различия функций между исходными данными OLAP и не OLAP
При работе с отчетами сводной таблицы и отчетами сводной диаграммы из OLAP исходные данные и других типов исходных данных вы заметите некоторые различия в функциях.
Извлечение данных Сервер OLAP возвращает новые данные в Excel при каждом изменении макета отчета. При использовании других типов внешних исходных данных вы запрашиваете все исходные данные одновременно или можете задать параметры запроса только при отображении различных элементов полей фильтра отчета. У вас также есть несколько других вариантов обновления отчета.
В отчетах, основанных на исходных данных OLAP, параметры поля фильтра отчета недоступны, фоновый запрос недоступен, а параметр оптимизации памяти недоступен.
Примечание: Параметр оптимизации памяти также недоступен для источников данных OLEDB и отчетов сводной таблицы на основе диапазона ячеек.
Типы полей Исходные данные OLAP, измерение поля можно использовать только в качестве строк (рядов), столбцов (категорий) или полей страницы. Поля мер можно использовать только в качестве полей значений. Для других типов исходных данных все поля можно использовать в любой части отчета.
Доступ к подробным данным Для исходных данных OLAP сервер определяет доступные уровни сведений и вычисляет сводные значения, поэтому подробные записи, составляющие сводные значения, могут быть недоступны. Однако сервер может предоставить поля свойств, которые можно отобразить. Другие типы исходных данных не имеют полей свойств, но можно отобразить базовые сведения для значений полей данных и элементов, а также отображать элементы без данных.
Поля фильтра отчета OLAP могут не содержать элемент All , а команда Показать страницы фильтра отчета недоступна.
Порядок начальной сортировки Для исходных данных OLAP элементы сначала отображаются в том порядке, в котором сервер OLAP возвращает их. Затем можно отсортировать или вручную изменить порядок элементов. Для других типов исходных данных элементы в новом отчете сначала отображаются в порядке возрастания по имени элемента.
Расчеты Серверы OLAP предоставляют сводные значения непосредственно для отчета, поэтому вы не можете изменить функции сводки для полей значений. Для других типов исходных данных можно изменить функцию сводки для поля значения и использовать несколько сводных функций для одного поля значения. Вы не можете создавать вычисляемые поля или вычисляемые элементы в отчетах с исходными данными OLAP.
Промежуточные итоги В отчетах с исходными данными OLAP невозможно изменить функцию summary для промежуточных итогов. С помощью других типов исходных данных можно изменять функции сводки промежуточных итогов и отображать или скрывать промежуточные итоги для всех полей строк и столбцов.
Для исходных данных OLAP можно включать или исключать скрытые элементы при вычислении промежуточных итогов и общих итогов. Для других типов исходных данных можно включать скрытые элементы поля фильтра отчета в промежуточные итоги, но скрытые элементы в других полях по умолчанию исключаются.