Спуск и консолидация

Спуск и консолидация — это специальная техника анализа, используемая при изучении данных. Пользователь имеет возможность переходить вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями. Например, если при анализе данных об объемах продаж в Сумской области выполнить операцию drill-down для измерения "Регион", то на экране будут отображены такие его элементы как "Сумы", "Шостка", и "Ахтырка". В результате дальнейшей детализации элемента "Сумы" будут отображены элементы "Заречный р-н", "Ковпаковский р-н", "Сумский р-н" и т. д. Даже трехмерный куб сложно отобразить на экране компьютера так, чтобы были видны значения интересующих мер, еще более сложно визуализировать кубы с количеством измерений, большим трех. Для представления данных, хранящихся в кубе, применяются, как правило, привычные двумерные, т.е. табличные, представления, имеющие сложные иерархические заголовки строк и столбцов. Двумерное представление куба можно получить, "разрезав" его поперек одной или нескольких осей (измерений), в этом случае фиксируются значения всех измерений, кроме двух, т.е. получается обычная двумерная таблица. В горизонтальной оси таблицы (заголовки столбцов) представлено одно измерение, в вертикальной (заголовки строк) — другое, а в ячейках таблицы — значения мер. При этом набор мер фактически рассматривается как одно из измерений — выбирается для показа либо одна мера (и тогда можно разместить в заголовках строк и столбцов два измерения), либо показывается несколько мер (и тогда одну из осей таблицы займут названия мер, а другую — значения единственного "неразрезанного" измерения).
Пример.
На рисунке изображены:

слева — двумерный срез куба для одной меры Unit Sales (продано штук) и двух "неразрезанных" измерений — Store (Магазин) и Время (Time)
справа представлено лишь одно "неразрезанное" измерение — Store, но зато здесь отображаются значения нескольких мер — Unit Sales (продано штук), Store Sales (сумма продажи) и Store Cost (расходы магазина)
внизу — двумерное представление куба, когда "неразрезанными" остается более двух измерений. При этом на осях среза (строках и столбцах) будут размещены два или более измерений "разрезаемого" куба.


Поддержка многомерной модели данных и выполнение многомерного анализа данных осуществляются отдельным приложением или процессом, называемым OLAP-сервером. Клиентские приложения могут запрашивать требуемое многомерное представление и в ответ получать те или иные данные. При этом OLAP-серверы могут хранить многомерные данные разными способами
В процессе анализа пользователь может менять точку зрения на данные (так называемая операция смены логического взгляда), просматривая данные в различных разрезах и разрешая конкретные задачи. Над кубами могут выполняться различные операции, включая прогнозирование и условное планирование (анализ типа “что, если”). Причем операции выполняются над кубами, т.е. произведение, например, даст в результате произведение-гиперкуб, каждая ячейка которого является произведением ячеек соответствующих гиперкубов-множителей.
Однако куб сам по себе для анализа не пригоден. Если еще можно адекватно представить или изобразить трехмерный куб, то с шести — или девятнадцатимерным дело обстоит значительно хуже. Поэтому перед употреблением из многомерного куба извлекают обычные двумерные таблицы. Эта операция называется "разрезанием" куба. Термин этот образный, аналитик как бы берет и "разрезает" измерения куба по интересующим его меткам. Этим способом аналитик получает двумерный срез куба и с ним работает. Соответственно, "неразрезанными", как правило, остаются только два измерения — по числу измерений таблицы. Бывает, "неразрезанным" остается только измерение — если куб содержит несколько видов числовых значений, они могут откладываться по одному из измерений таблицы.
Если внимательно всмотреться в таблицу, на основании которой был создан куб, можно заметить, что находящиеся в ней данные, скорее всего, не являются первичными, а получены в результате суммирования по более мелким элементам. Например, предприятие делится на производства, производства на цеха, цеха на участки, и т.д. Станки можно объединять в группы оборудования и т.д. В терминах OLAP такие многоуровневые объединения называется иерархиями. Средства OLAP дают возможность в любой момент перейти на нужный уровень иерархии. Причем, как правило, для одних и тех же элементов поддерживается несколько видов иерархий: например участок-цех-производство. Исходные данные берутся из нижних уровней иерархий, а затем суммируются для получения значений более высоких уровней. Для того чтобы ускорить процесс перехода, просуммированные значения для разных уровней хранятся в кубе. Таким образом, то, что со стороны пользователя выглядит одним кубом, грубо говоря, состоит из множества более примитивных кубов.

‹ Кубы OLAP
Вверх
Члены и метки. Иерархии. Аналитические операции. ›

Айтистанция
Добавить комментарий