Excel è uno strumento potente che ha alcune funzioni e funzionalità sorprendenti quando si lavora con le statistiche.
Trovare una correlazione tra due serie di dati è uno dei calcoli statistici più comuni quando si lavora con set di dati di grandi dimensioni,
Alcuni anni fa lavoravo come analista finanziario e, sebbene non fossimo molto coinvolti in dati statistici, trovare la correlazione era qualcosa che dovevamo ancora fare abbastanza spesso.
In questo tutorial, ti mostrerò due modi davvero semplici per calcola il coefficiente di correlazione in Excel. C'è già una funzione integrata per farlo, e puoi anche usare il Data Analysis Toolpak.
Quindi iniziamo!
Cos'è il coefficiente di correlazione?
Poiché questa non è una classe statistica, lascia che ti spieghi brevemente qual è il coefficiente di correlazione, quindi passeremo alla sezione in cui calcoliamo il coefficiente di correlazione in Excel.
Un coefficiente di correlazione è un valore che indica quanto strettamente sono correlate due serie di dati.
Un esempio comunemente usato è il peso e l'altezza di 10 persone in un gruppo. Se calcoliamo il coefficiente di correlazione per i dati di altezza e peso per queste persone, otterremo un valore compreso tra -1 e 1.
Un valore inferiore a zero indica una correlazione negativa, il che significa che se l'altezza aumenta il peso diminuisce, o se il peso aumenta all'altezza diminuisce.
E un valore maggiore di zero indica una correlazione positiva, il che significa che se l'altezza aumenta, il peso aumenta, e se l'altezza diminuisce, il peso diminuisce.
Più il valore è vicino a 1, più forte è la correlazione positiva. Quindi un valore di .8 indicherebbe che i dati di altezza e peso sono fortemente correlati.
Nota: esistono diversi tipi di coefficienti di correlazione e statistiche, ma in questo tutorial esamineremo il più comune che è il coefficiente di correlazione di PearsonOra, vediamo come calcolare questo coefficiente di correlazione in Excel.
Calcolo del coefficiente di correlazione in Excel
Come ho detto, ci sono un paio di modi per calcolare il coefficiente di correlazione in Excel.
Utilizzo della formula CORRELAZIONE
CORRELAZIONE è una funzione statistica introdotta in Excel 2007.
Supponiamo di avere un set di dati come mostrato di seguito in cui si desidera calcolare il coefficiente di correlazione tra l'altezza e il peso di 10 persone.
Di seguito è la formula che farebbe questo:
=CORREL.(B2:B12,C2:C12)
La funzione CORRELAZIONE di cui sopra accetta due argomenti: la serie con i punti dati dell'altezza e la serie con i punti dati del peso.
E questo è tutto!
Non appena premi invio, Excel esegue tutti i calcoli nel back-end e ti fornisce un singolo numero di coefficiente di correlazione Pearson.
Nel nostro esempio, quel valore è leggermente superiore a 0,5, il che indica che esiste una correlazione positiva abbastanza forte.
Questo metodo è meglio utilizzato se hai due serie e tutto ciò che desideri è il coefficiente di correlazione.
Ma se hai più serie e vuoi scoprire il coefficiente di correlazione di tutte queste serie, puoi anche considerare di utilizzare il pacchetto di strumenti di analisi dei dati in Excel (trattato di seguito)
Utilizzo del pacchetto di strumenti per l'analisi dei dati
Excel dispone di un pacchetto di strumenti per l'analisi dei dati che può essere utilizzato per calcolare rapidamente vari valori statistici (incluso ottenere il coefficiente di correlazione).
Ma il Data Analysis Toolpak è disabilitato per impostazione predefinita in Excel. Quindi il primo passo sarebbe quello di riabilitare lo strumento di analisi dei dati e quindi utilizzarlo per calcolare il coefficiente di correlazione di Pearson in Excel.
Abilitazione del Toolpak per l'analisi dei dati
Di seguito sono riportati i passaggi per abilitare il Toolpak di analisi dei dati in Excel:
- Fare clic sulla scheda File
- Fare clic su Opzioni
- Nella finestra di dialogo Opzioni di Excel che si apre, fai clic sull'opzione Componenti aggiuntivi nel riquadro della barra laterale
- Nel menu a discesa Gestisci, seleziona Componenti aggiuntivi di Excel
- Fare clic su Vai. Questo aprirà la finestra di dialogo dei componenti aggiuntivi
- Controlla l'opzione Strumenti di analisi
- Fare clic su Ok
I passaggi precedenti aggiungerebbero un nuovo gruppo nella scheda Dati nella barra multifunzione di Excel chiamato Analisi. All'interno di questo gruppo, avresti l'opzione Analisi dei dati
Calcolo del coefficiente di correlazione utilizzando Data Analysis Toolpak
Ora che hai di nuovo lo strumento di analisi disponibile nella barra multifunzione, vediamo come calcolare il coefficiente di correlazione utilizzandolo.
Supponiamo di avere un set di dati come mostrato di seguito e di voler scoprire la correlazione tra le tre serie (altezza e peso, altezza e reddito e peso e reddito)
Di seguito sono riportati i passaggi per eseguire questa operazione:
- Fare clic sulla scheda Dati
- Nel gruppo Analisi, fare clic sull'opzione Analisi dati
- Nella finestra di dialogo Analisi dei dati che si apre, fare clic su "Correlazione"
- Fare clic su OK. Questo aprirà la finestra di dialogo Correlazione
- Per l'intervallo di input, seleziona le tre serie, comprese le intestazioni
- Per "Raggruppati per", assicurati che "Colonne" sia selezionato
- Seleziona l'opzione - "Etichetta nella prima riga". Ciò assicurerà che i dati risultanti abbiano le stesse intestazioni e sarebbe molto più facile capire i risultati
- Nelle opzioni di output, scegli dove desideri la tabella risultante. Andrò con la cella G1 sullo stesso foglio di lavoro. Puoi anche scegliere di ottenere i risultati in un nuovo foglio di lavoro o in una nuova cartella di lavoro
- Fare clic su OK
Non appena lo fai, Excel calcolerà il coefficiente di correlazione per tutte le serie e ti fornirà una tabella come mostrato di seguito:
Tieni presente che la tabella risultante è statica e non si aggiornerebbe nel caso in cui uno dei punti dati nella tabella cambi. In caso di modifica, sarà necessario ripetere nuovamente i passaggi precedenti per generare una nuova tabella dei coefficienti di correlazione.
Quindi questi sono due metodi rapidi e facili per calcolare il coefficiente di correlazione in Excel.
Spero che tu abbia trovato utile questo tutorial!