correlazione
correlazione in statistica, legame di interdipendenza fra due o più variabili statistiche quantitative. Fra due variabili esiste correlazione quando al variare dell’una anche l’altra varia in modo apparentemente non casuale. Per esempio, all’aumentare di una variabile anche l’altra può tendere ad aumentare (correlazione positiva o diretta) oppure a diminuire (correlazione negativa o indiretta). Mentre con l’analisi della correlazione si stabilisce se due o più variabili variano “insieme”, con la → regressione si cerca un effettivo modello funzionale per cui un carattere Y dipenda da un altro carattere X, e quindi Y = ƒ(X), o da più caratteri X1, …, Xn, e quindi Y = ƒ(X1, …, Xn) (→ regressione multipla). Se il legame fra due variabili quantitative è approssimabile con una funzione lineare, cioè esprimibile mediante una retta, si parla di correlazione lineare (detta anche collinearità), misurata dall’indice di → Bravais-Pearson. A volte, se non è possibile utilizzare distribuzioni note di riferimento (quando per esempio il campione è piccolo) per determinare la correlazione si analizza il legame tra i posti occupati in una graduatoria (ranghi) di due caratteri associati alle stesse unità, anziché il legame tra il valore delle variabili. In questo tipo di analisi la correlazione è misurata dal coefficiente di → correlazione per ranghi.
Per analizzare l’esistenza di correlazione tra due variabili statistiche si fa talvolta ricorso a un primo esame qualitativo attraverso un grafico cartesiano (detto diagramma a dispersione o a scatter), che assume la forma di una nuvola di punti, di cui si analizza la regolarità. Va osservato che la presenza di correlazione tra due variabili non significa che l’una delle due variabili sia causa dell’altra. Le due variabili potrebbero avere una concausa comune oppure il loro variare insieme potrebbe essere del tutto casuale: si parla in tali casi di correlazione spuria.
È la correlazione che si considera quando si hanno più di due variabili; è detta anche correlazione doppia se le variabili sono tre. Date n variabili statistiche X1, …, Xn, se si considera X1 come variabile dipendente (criterio) e X2, …, Xn come variabili indipendenti (esplicatori o predittori), allora, individuata la funzione lineare
calcolata con il metodo dei minimi quadrati, che quindi rende minima l’espressione (X1 − X′ )2, il coefficiente di correlazione multipla di X1 rispetto a X2, …, Xn è l’ordinario coefficiente di correlazione tra X1 e X′ (→ correlazione, coefficiente di). Anche nel caso della correlazione multipla può essere utile una prima analisi effettuata costruendo la matrice di correlazione formata da tutti i coefficienti di correlazione lineari rij delle singole variabili. Tale matrice ha la diagonale principale uguale a 1 ed è simmetrica.
☐ In geometria proiettiva, è detta anche correlazione una trasformazione lineare che in uno spazio proiettivo realizza il principio di → dualità, facendo corrispondere a punti iperpiani e a iperpiani punti mantenendo le relazioni di incidenza. È tale quindi una trasformazione lineare che in uno spazio di dimensione 2 nel piano porta punti in rette e rette in punti mentre in uno spazio di dimensione 3 porta punti in piani e piani in punti.