La Normalizzazione e Denormalizzazione sono entrambe tecniche accettabili nei loro rispettivi contesti in quello di analisi ed estrazione .
La Normalizzazione genericamente sta ad indicare un processo che modifica degli oggetti per conformarli a un criterio prestabilito di regolarità; nel particolare, in statistica, è un processo che ci porta a poter confrontare distribuzioni diverse di valori, limitandoli in un intervallo predefinito;
ha come effetto la diminuzione di ridondanza, quindi ottimizza anche lo spazio occupato all'interno del database ed evita di riportare dati ripetutamente; di norma andrebbe fatta nella fase progettuale, identificando i dati raggruppabili in tabelle separate per metterli in relazione con le tabelle del database. La normalizzazione nella fase iniziale di una ricerca ci porta ad avere un database più funzionale, espandibile ed ottimizzato.
Abbiamo tre tipologie di normalizzazione:
- Prima forma normale: è il caso in cui ogni tupla (riga di una matrice delle relazioni di un database relazionale; è l’entità base che si memorizza nel database) contiene un singolo valore per ogni attributo: si spostano i dati in tabelle separate, raggruppate per tipologie.
- Seconda forma normale: soddisfa la prima e inoltre ogni attributo che non fa parte della chiave è indipendente da ogni chiave. La chiave determina l'univocità di ogni record in ogni tabella.
- Terza forma normale: la regola è eliminare i campi che sono validi per più record (si creano delle tabelle per raggrupparli); si utilizza per dati frequentemente modificati.
-Esistono, inoltre, 4° e 5° forma normale, ma sono molto meno utilizzate perché alla diminuzione della ridondanza si affianca un degrado delle prestazioni (es: più tempo di esecuzione).
IN INFORMATICA :
Tabelle
Sono dei costrutti che consentono di disporre il testo in una struttura di righe e colonne, al fine di rappresentare e organizzare al meglio i dati .
Righe ( record) ovvero registrazioni di tipo individuale.
Colonne ( campi) unità minima di informazioni; gruppi di informazioni omogenee. Ad esempio un oggetto di un database strutturato in dati che contiene un insieme di campi o elementi.
Celle intersezione di ogni riga con ogni colonna, da luogo alla misura .
Unità statistica unità di misura informatica che misura la quantità di informazioni.
Carattere unità minima di informazione, può quindi essere una lettera, un numero una dimensione.
IN STATISTICA:
Tabelle
Consentono di disporre il testo in una struttura di righe e colonne , al fine di rappresentare e organizzare al meglio i dati.
Righe ( record) rappresentano le unità statistiche o entità; ovvero le unità elementari su cui si osservano i caratteri oggetti di studio.
Colonne rappresentano i caratteri o variabili ovvero ciò e si vuole osservare dell'unità statistica.
Celle intersezione di ogni riga con ogni colonna, da lugo alla modalità.
Unità Statistica elemento di base della popolazione sul quale viene rilevata la caratteristica oggetto di studio; può essere una persona fisica , giuridica, o qualunque evento o istituzione.
Carattere aspetto dell'unità statistica sul quale si vuole indagare , le cui manifestazioni sono chiamate modalità, può essere Quantitativo se le modalità sono espresse mediante una grandezza misurabile o numerabile( valore).
SPREADSHEET e DBMS: differenze e analogie
Spreadsheet in inglese significa foglio di calcolo, altrimenti detto foglio elettronico Il principio su cui si basa è semplice: fornire una tabella, detta anche foglio di lavoro, formata da celle in cui si possono inserire dati, numeri o formule.
Le celle, sono la base fondamentale del foglio di calcolo per essere riconoscibili, sono costituite da una lettera e un numero.
Le colonne sono indicate dalle lettere, le righe dai numeri.I fogli di calcolo automatizzati offrono un gran numero di funzionalità per il calcolo e la creazione di grafici per la visualizzazione e la modifica di dati tabulari. Possono inoltre essere utilizzati efficacemente per memorizzare elenchi di informazioni, attualmente il foglio di calcolo maggiormente utilizzato è Microsoft Excel.
Man mano che i requisiti degli elenchi crescono in complessità, può diventare difficile gestire i dati in un foglio di calcolo.
Un'applicazione di database relazionale è più adatta alla creazione e all'utilizzo di elenchi complessi, si parla in questi casi di DBMS (database management system) è un sistema software progettato per consentire la creazione e manipolazione efficiente di database (ovvero di collezioni di dati strutturati) solitamente da parte di più utenti. I DBMS svolgono un ruolo fondamentale in numerose applicazioni informatiche, dalla contabilità, alla gestione delle risorse umane e alla finanza fino a contesti tecnici come la gestione di rete o la telefonia. Molto conosciuto Microsoft Access o anche Oracle. La progettazione del database (database design) è il processo decisionale su come organizzare i dati in possesso in tipi di record e su come ciascun tipo di record si relaziona con gli altri.
ha come effetto la diminuzione di ridondanza, quindi ottimizza anche lo spazio occupato all'interno del database ed evita di riportare dati ripetutamente; di norma andrebbe fatta nella fase progettuale, identificando i dati raggruppabili in tabelle separate per metterli in relazione con le tabelle del database. La normalizzazione nella fase iniziale di una ricerca ci porta ad avere un database più funzionale, espandibile ed ottimizzato.
Abbiamo tre tipologie di normalizzazione:
- Prima forma normale: è il caso in cui ogni tupla (riga di una matrice delle relazioni di un database relazionale; è l’entità base che si memorizza nel database) contiene un singolo valore per ogni attributo: si spostano i dati in tabelle separate, raggruppate per tipologie.
- Seconda forma normale: soddisfa la prima e inoltre ogni attributo che non fa parte della chiave è indipendente da ogni chiave. La chiave determina l'univocità di ogni record in ogni tabella.
- Terza forma normale: la regola è eliminare i campi che sono validi per più record (si creano delle tabelle per raggrupparli); si utilizza per dati frequentemente modificati.
-Esistono, inoltre, 4° e 5° forma normale, ma sono molto meno utilizzate perché alla diminuzione della ridondanza si affianca un degrado delle prestazioni (es: più tempo di esecuzione).
IN INFORMATICA :
Tabelle
Sono dei costrutti che consentono di disporre il testo in una struttura di righe e colonne, al fine di rappresentare e organizzare al meglio i dati .
Righe ( record) ovvero registrazioni di tipo individuale.
Colonne ( campi) unità minima di informazioni; gruppi di informazioni omogenee. Ad esempio un oggetto di un database strutturato in dati che contiene un insieme di campi o elementi.
Celle intersezione di ogni riga con ogni colonna, da luogo alla misura .
Unità statistica unità di misura informatica che misura la quantità di informazioni.
Carattere unità minima di informazione, può quindi essere una lettera, un numero una dimensione.
IN STATISTICA:
Tabelle
Consentono di disporre il testo in una struttura di righe e colonne , al fine di rappresentare e organizzare al meglio i dati.
Righe ( record) rappresentano le unità statistiche o entità; ovvero le unità elementari su cui si osservano i caratteri oggetti di studio.
Colonne rappresentano i caratteri o variabili ovvero ciò e si vuole osservare dell'unità statistica.
Celle intersezione di ogni riga con ogni colonna, da lugo alla modalità.
Unità Statistica elemento di base della popolazione sul quale viene rilevata la caratteristica oggetto di studio; può essere una persona fisica , giuridica, o qualunque evento o istituzione.
Carattere aspetto dell'unità statistica sul quale si vuole indagare , le cui manifestazioni sono chiamate modalità, può essere Quantitativo se le modalità sono espresse mediante una grandezza misurabile o numerabile( valore).
SPREADSHEET e DBMS: differenze e analogie
Spreadsheet in inglese significa foglio di calcolo, altrimenti detto foglio elettronico Il principio su cui si basa è semplice: fornire una tabella, detta anche foglio di lavoro, formata da celle in cui si possono inserire dati, numeri o formule.
Le celle, sono la base fondamentale del foglio di calcolo per essere riconoscibili, sono costituite da una lettera e un numero.
Le colonne sono indicate dalle lettere, le righe dai numeri.I fogli di calcolo automatizzati offrono un gran numero di funzionalità per il calcolo e la creazione di grafici per la visualizzazione e la modifica di dati tabulari. Possono inoltre essere utilizzati efficacemente per memorizzare elenchi di informazioni, attualmente il foglio di calcolo maggiormente utilizzato è Microsoft Excel.
Man mano che i requisiti degli elenchi crescono in complessità, può diventare difficile gestire i dati in un foglio di calcolo.
Un'applicazione di database relazionale è più adatta alla creazione e all'utilizzo di elenchi complessi, si parla in questi casi di DBMS (database management system) è un sistema software progettato per consentire la creazione e manipolazione efficiente di database (ovvero di collezioni di dati strutturati) solitamente da parte di più utenti. I DBMS svolgono un ruolo fondamentale in numerose applicazioni informatiche, dalla contabilità, alla gestione delle risorse umane e alla finanza fino a contesti tecnici come la gestione di rete o la telefonia. Molto conosciuto Microsoft Access o anche Oracle. La progettazione del database (database design) è il processo decisionale su come organizzare i dati in possesso in tipi di record e su come ciascun tipo di record si relaziona con gli altri.
Analogie e differenze
Database e fogli di calcolo hanno molte analogie se prendiamo ad esempio le due più conosciute applicazioni, Excel e Access riscontriamo che entrambe consentono infatti di eseguire potenti query per ordinare e filtrare i dati, eseguire calcoli, utilizzare maschere per aggiungere, modificare, eliminare e consultare i dati con facilità, utilizzare visualizzazioni tabella pivot e grafico pivot per gestire i dati in modo interattivo, generare rapporti sui dati e visualizzarli in più formati, e ancora, importare dati da database esterni creare pagine web, infine entrambe le applicazioni organizzano i dati in colonne, dette anche campi, nonostate tutte queste somiglianze bisogna comunque tenere a mente che Excel rimane un foglio di calcolo mentre in un database i dati vengono memorizzati in tabelle molto simili ai fogli di lavoro, ma progettate per l'esecuzione di query complesse in relazione ai dati memorizzati in altre tabelle e posizioni, nonché in campi di altre tabelle.

Nessun commento:
Posta un commento