Visualizzazioni totali

lunedì 21 febbraio 2011

Il cubo: OLAP

OLAP (On-Line Analytical Processing) designa un insieme di tecniche software per l'analisi interattiva e veloce di grandi quantità di dati, che è possibile esaminare in modalità piuttosto complesse. Questa è la componente tecnologica base del data warehouse e, ad esempio, serve alle aziende per analizzare i risultati delle vendite, l'andamento dei costi di acquisto merci, al marketing per misurare il successo di una campagna pubblicitaria, ad una università i dati di un sondaggio ed altri casi simili.
Un sistema OLAP permette di:
  • studiare una grande quantità di dati
  • vedere i dati da prospettive diverse
  • supportare i processi decisionali


Una struttura OLAP creata per questo scopo è chiamata cubo multidimensionale. Ci sono diversi modi per creare un cubo, ma il più conosciuto è quello che utilizza uno schema "a stella"; al centro c'è la tabella dei "fatti" che elenca i principali elementi su cui sarà costruita l'interrogazione, e collegate a questa tabella ci sono varie tabelle delle "dimensioni" che specificano come saranno aggregati i dati.
Il Cubo OLAP può essere immaginato come un'estensione del foglio di lavoro a due dimensioni ed ha da tre a un arbitrario numero di caratteristiche o dimensioni di analisi, e per questo il termine più appropriato è ipercubo.
Il Cubo OLAP è composto da dati numerici, detti misure, che sono categorizzati all'interno di dimensioni. Ogni lato del cubo rappresenta una dimensione. Una dimensione è caratterizzata da un insieme di attributi con livelli di gerarchia e corrispondono alle successive righe e colonne dell’analisi. Una misura è la proprietà dei fatti da analizzare a valore numerico e corrisponde quindi ai valori che vengono calcolati in seguito. Tutte le dimensioni presenti in un’analisi possono essere associate, arrivando ad un numero a piacere di combinazioni. I singoli membri di una dimensione possono essere in relazione tra loro in modo gerarchico e una dimensione può avere più di una gerarchia.
Il cubo OLAP consente di creare una reportistica come tabella pivot, l'inserimento di elementi e campi calcolati che rielaborano i dati di partenza, e operazioni di roll-up e drill-down, se le dimensioni sono organizzate all'interno di una gerarchia.
Le principali tecniche di visualizzazione per rendere i dati di più facile comprensione sono:
  • Slice and dice: permette di lavorare solo su alcune delle occorenze delle dimensioni e solo su alcune delle dimensioni proposte. In questo modo è possibile analizzare solo quella parte di dati utili al fine dell'analisi specifica.
  • Drill-down: permette di condurre un'analisi a ritroso sui dati, permettendo di analizzare ogni singolo dato da un punto di vista gerarchico.
  • Roll-UP: permette di mostrare i dati ad un livello superiore di aggregazione.
  • Filtering: tecnica utilizzata per filtrare i dati attraverso l'uso di un algoritmo.

Nessun commento:

Posta un commento