Concetti base statistico-informatici
- Unità statistica: elemento di base della popolazione sul quale viene rilevata la caratteristica oggetto di studio; può essere una persona fisica, giuridica o qualunque evento o istituzione.
- Carattere: il carattere o variabile è il fenomeno oggetto di studio. Abbiamo due tipologie distinte di caratteri: i caratteri "qualitativi", se le modalità sono espresse mediante espressioni verbali o attributi, e i caratteri "quantitativi", se le modalità sono espresse mediante una grandezza misurabile o numerabile (valore). Le diverse manifestazioni attraverso cui si esprime il fenomeno sono dette modalità del carattere.
- Matrice dei dati: tabella in cui i dati sono organizzati in righe e colonne. Nelle righe troviamo le unità statistiche, nelle colonne i caratteri. Nelle celle risultanti dall'intersezione di righe e colonne troviamo i già citati "valori", che rappresentano dunque la combinazione di una unità statistica con un particolare carattere. Le righe prendono il nome di "record" in informatica e di "unità" in statistica, mentre le colonne, che rappresentano i domini in cui sono inseriti i vari record o unità, sono chiamate "variabili" o "caratteri" in statistica e "campi" in informatica. I diversi valori che risultano dall'intersezione di righe e colonne, ossia i diversi stati che record e unità assumono, sono indicati come "modalità del carattere" in statistica e come "misura" in informatica.
- Tabelle di contingenza (o tabelle a doppia entrata): vengono utilizzate in statistica al fine di analizzare le relazioni vigenti fra 2 o più variabili di tipo categoriale. Le tabelle di contingenza servono per determinare se la distribuzione di una variabile dipende in maniera condizionata (o contingente) dall'altra variabile. Incrociando le due variabili disposte rispettivamente una in riga e l'altra in colonna si ottiene il numero di unità statistiche che possiedono congiuntamente la modalità i-esima della variabile posta nel senso delle righe e la caratteristica j-esima di quella posta nel senso delle colonne.
- Tabella di frequenza: tabella nella quale i singoli valori rappresentano la frequenza, assoluta o relativa, del verificarsi congiunto delle modalità incrociate nella tabella. Se si pongono in relazione due variabili X e Y, il valore nij all’incrocio della riga i e della colonna j, è il numero di volte in cui, nel campione esaminato, le unità possiedono la modalità xi di X e la modalità yj di Y.
Nessun commento:
Posta un commento