martedì 11 maggio 2010

SISTEMI INFORMATIVI AZIENDALI:OLTP OLAP



OLTP:acronimo di On Line Transaction Processing, è un insieme di tecniche di software utilizzate per l'analisi dei dati. A differenza delle analisi con tecnologia OLAP(Online Analitytical Processing), la tecnologia OLTP non prevede la creazione di banche dati separate, infatti le analisi vengono effettuate direttamente sui dati di esercizio. Questa soluzione permette di avere i dati sempre aggiornati ed evita fasi intermedie di trasformazione dei dati , tuttavia per la sua stessa natura non è facilmente applicabile in situazioni dove la quantità di dati da analizzare sia molto elevata.

Il termine OLAP (On line Analitical processing) identifica sia gli strumenti, che le tecniche di analisi di grosse quantità di dati.

Grazie alla vista multidimensionale dei dati. Rappresenta la tecnologia più avanzata che permette di manipolare i dati nella maniera più semplice.

Dal momento in cui si sostituisce la solita griglia con un’interfaccia OLAP, gli utenti possono essere in grado, in modo indipendente, di realizzare svariati queries ad-hoc, filtrare i dati, ruotare la tabella, espandere i dati, ottenere le somme desiderate, ecc. Il principale oggetto di un applicazione OLAP è il CUBO, che fornisce una rappresentazione multidimensionale dei dati. Il cubo contiene i dati sia a livello di dettaglio, che in forma aggregata. Il cubo si appoggia su una serie di elementi di base: le dimensioni (Dimension) sono le tabelle che contengono gli attributi descrittivi delle misure (es: provincia, regione, descrizione del prodotto, categoria del prodotto, ecc). I lati del cubo contengono le dimensioni, mentre la singola cella contiene il valore relativo all’intersezione delle dimensioni.Le misure (Measures) descrivono l’aspetto quantitativo (es: ogni vendita è misurata dal valore e della quantità). Le misure sono quindi valori aggregati ed analizzabili. L’ aggregazione di una misura è eseguita in una porzione di dimensione in base ad un dato algoritmo (somma, media, etc.).Il cubo si crea suddividendo campi del database sorgente in dimensioni e misure.Il primo passo da eseguire nel progetto del cubo, è la costruzione dell' istruzione SQL, con la quale si estraggono i dati dal database per alimentare il cubo. La tabella risultante, conterrà tutte le dimensioni da analizzare e le relative misure. Dopo aver costruito l'istruzione SQL, selezionando il tipo progetto cubo, viene emesso il Wizard, nel quale trascinate le dimensioni e le misure della tabella risultante. Dopo aver eseguito questa semplice funzione, confermando si attiva il cubo.Si possono ordinare i dati di qualsiasi dimensione, in ordine ascendente o discendente di dimensione (Sorting); si possono ordinare i dati di qualsiasi colonna o di qualsiasi riga, in ordine ascendente o discendente di misura della dimensione selezionata; si possono filtrare i dati di qualsiasi dimensione includendo solo quelli desiderati (Filtering); si possono visualizzare i dati delle dimensioni sia in forma espansa che compressa, automaticamente per tutte le dimensioni verticali e/o orizzontali, oppure sulle singole dimensioni; si possono visualizzare i dati di una dimensione nei livelli di maggior dettaglio, effettuandone l'espansione, o comprimere le dimensioni, visualizzando i dati aggregati ai livelli superiori. Con questa funzione, esplorate i dati espandendoli dai valori sommati, ai relativi dettagli lungo la direzione desiderata(Drilldown/Drill/up). Quest'ultimo lo possiamo comparare alla funzione di slice and dice, una delle principali funzionalità olap, è ciò che consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione: creazione di master-detail e rotazione degli assi delle rappresentazioni a matrice.In questi casi viene generalmente preferito l'utilizzo di analisi di tipo OLAP.

REPORTISTICA

i sistemi di reportistica sono un sottoambito dei sistemi informativi e per generalità di attribuzione anche dei sistemi di business Intelligence e ne costituiscono una estensione legata all'evoluzione informatica.
L' obiettivo di un sistema di Reportistica all'interno dei sistemi informativi è generalmente quello di fruire documentazione analitica sulle attività di rilievo dell'organizzazione all'interno della quale è sviluppato: tale base informativa ha l'obiettivo di essere un 'univoca, prassi organizzativa e perciò non suscettibile di rilievi e incongruenze interpretative.





Cos´è l´ETL?


I processi di estrazione, trasformazione e caricamento comprendono step multipli che hanno come obiettivo il trasferimento dei dati dalle applicazioni di produzione ai sistemi di Business Intelligence :



  1. Estrazione dei dati dalle applicazioni di produzione e dai database (ERP, CRM, RDBMS, file ecc.) .


  2. Trasformazione di questi dati per la loro riconciliazione su tutti i sistemi sorgente, eseguire calcoli o parsing di stringhe, arricchirli con informazioni di lookup esterne e confrontare il formato richiesto dal sistema target (Third Normal Form Star Schema, Slowly Changing Dimensions, ecc.).


  3. Caricamento dei dati risultanti nelle varie applicazioni BI: Data Warehouse o Enterprise Data Warehouse, Data Mart, applicazioni Online Analytical Processing (OLAP) o “cubi”, ecc.

La latenza dei processi ETL varia da batch (a volte mensilmente o settimanalmente, ma più spesso quotidianamente), a near-real-time con aggiornamenti più frequenti (ogni ora, ogni minuto, ecc).

Le sfide dell´ETL
Ci sono numerose difficoltà da fronteggiare per ottenere un´implementazione efficiente ed affidabile dei processi ETL.
I volumi di dati crescono in maniera esponenziale, e i processi ETL devono elaborare grandi quantità di dati granulari (prodotti venduti, chiamate telefoniche, transazioni bancarie.).Alcuni sistemi BI raramente vengono aggiornati incrementalmente mentre altri richiedono un caricamento completo ad ogni iterazione.
Con l´aumento della complessità dei sistemi informatici, anche la disparità delle sorgenti aumenta. I processi ETL richiedono una connettività di vasta portata per i pacchetti di applicazioni (ERP, CRM, ecc.), database, mainframe, file, Servizi Web, ecc.
Le strutture e le applicazioni di Business Intelligence comprendono data warehouse, data mart, applicazioni OLAP per l´analisi, il reporting, il dashboarding, lo scorecarding, ecc. Tutte queste strutture target hanno diversi requisiti di trasformazione dei dati e diverse latenze.
Le trasformazioni coinvolte nei processi ETL possono essere altamente complesse. I dati devono essere aggregati, sottoposti a parsing, calcolati, elaborati statisticamente, ecc. Le trasformazioni specifiche BI sono anch´esse necessarie, come lo Slowly Changing Dimensions.
Mentre la BI tende alla simultaneità real-time, i data warehouse e data mart devono essere aggiornati più spesso e le finestre di tempo del caricamento diventano sempre più brevi.

DATA WAREHOUSE ( O DW)
Un data warehouse ( o dw) (termine inglese traducibile con magazzino di dati) è un archivio informatico contenente i dati di un 'organizzazione. I DW sono progettati per consentire di produrre facilmente relazione ed analisi.
Il termine Data Warehouse e' ormai entrato nel vocabolario di tutti i responsabili dei sistemi informativi ed in quello degli amministratori di basi dati(DBAs: DataBase Administrators). Ogni sistema informativo di discrete dimensioni contiene al suo interno un Data Warehouse o, almeno, ne applica alcune delle tecniche e gli strumenti.
Ma cos'e' un Data WareHouse (DWH)?
Il DWH e' una base dati che mantiene tutte le informazioni sulle attivita' dell'azienda e che viene utilizzata dal management per prendere decisioni strategiche.
Da dove provengono i dati del DWH?
Dai sistemi informativi dell'azienda. I dati vengono semplicemente raccolti ed inseriti nel data warehouse con programmi di caricamento. Quindi vengono acceduti con programmi di analisi dei dati o ribaltati su DB specializzati (Data Mart)
Chi ha inventato i DWH?
I sistemi EIS (Enterprise Information System), MIS (Management Information System), DSS (Decision Support System), OLAP (OnLine Analytical Processing )... sono sempre esistiti. E lo stesso vale per la denormalizzazione, le time-series, l'analisi multimensionale, i VLDBMS (Very Large Database Management System), ... Non c'e' nulla di particolarmente nuovo o innovativo nei DWH. W.H.Inmon e' tuttavia considerato il padre dei DWH. Infatti ne ha coniato il termine, ha scritto diversi libri, ha fatto un mucchio di conferenze e, beato lui, di soldi! Il suo merito e' soprattutto quello di aver raccolto in una concezione unica una serie di concetti e strumenti gia' noti e sfruttati in modo singolo.

Nessun commento:

Posta un commento