Come eseguire l'analisi dei dati di base in Excel

Come eseguire l'analisi dei dati di base in Excel / Produttività

La maggior parte delle volte quando si eseguono statistiche, si desidera utilizzare un software statistico. Questi strumenti sono costruiti per fare calcoli come t-test, test chi-quadro, correlazioni e così via. Excel non è pensato per l'analisi dei dati. Ma ciò non significa che non puoi farlo.

Sfortunatamente, le funzioni statistiche di Excel non sono sempre intuitive. E di solito ti danno risultati esoterici. Quindi, invece di usare le funzioni di statistiche, useremo il componente aggiuntivo delle statistiche di Excel: il tool di analisi dei dati.

Il Toolpak, nonostante la sua spiacevole ortografia, include una vasta gamma di funzionalità statistiche utili. Vediamo cosa possiamo fare con le statistiche di Excel.

Aggiunta del tool di analisi dei dati Excel

Mentre tu può fare statistiche senza il Data Analysis Toolpak, è molto più facile con esso. Per installare il Toolpak in Excel 2016, vai a File> Opzioni> Componenti aggiuntivi.

Clic Partire accanto a “Gestisci: componenti aggiuntivi di Excel.”

Nella finestra risultante, seleziona la casella accanto a Toolkit di analisi e quindi fare clic ok.

Se hai correttamente aggiunto il Data Analysis Toolpak ad Excel, vedrai a Analisi dei dati pulsante nel Dati scheda, raggruppata in Analisi sezione:

Se vuoi ancora più energia, assicurati di controllare gli altri componenti aggiuntivi di Excel Power Up Excel con 10 componenti aggiuntivi per elaborare, analizzare e visualizzare i dati come un Power Up di Excel con 10 componenti aggiuntivi per elaborare, analizzare e visualizzare i dati Come un Pro Vanilla Excel è sorprendente, ma puoi renderlo ancora più potente con i componenti aggiuntivi. Qualunque siano i dati che è necessario elaborare, è probabile che qualcuno abbia creato un'app Excel per questo. Ecco una selezione. Leggi di più .

Statistiche descrittive in Excel

Indipendentemente dal test statistico che stai utilizzando, probabilmente vorrai ottenere le statistiche descrittive di Excel per prime. Questo ti darà informazioni su mezzi, mediane, varianza, deviazione standard e errore, curtosi, asimmetria e una varietà di altre figure.

Eseguire statistiche descrittive in Excel è facile. Clic Analisi dei dati nella scheda Dati, selezionare Statistiche descrittive, e seleziona il tuo intervallo di input. Fare clic sulla freccia accanto al campo dell'intervallo di input, fare clic e trascinare per selezionare i dati e premere accedere (o fare clic sulla freccia giù corrispondente), come nella GIF di seguito.

Dopodiché, assicurati di dire a Excel se i tuoi dati hanno etichette, se vuoi l'output in un nuovo foglio o sullo stesso, e se vuoi le statistiche di riepilogo e altre opzioni.

Dopo, colpisci ok, e otterrai le tue statistiche descrittive:

T-Test dello studente in Excel

Il t-test è uno dei test statistici più elementari ed è facile da calcolare in Excel con Toolpak. Clicca il Analisi dei dati pulsante e scorrere verso il basso fino a visualizzare il t-opzioni di test.

Hai tre scelte:

  • t-Test: Paired Two Sample for Means dovrebbe essere usato quando le tue misure o osservazioni sono state abbinate. Usalo quando prendi due misurazioni degli stessi soggetti, come misurare la pressione sanguigna prima e dopo un intervento.
  • t-Test: Two-Sample Assuming Equal Variances dovrebbe essere usato quando le tue misurazioni sono indipendenti (che di solito significa che sono state fatte su due gruppi di soggetti diversi). Discuteremo del “varianze uguali” parte in un momento.
  • t-Test: Two-Sample Assuming Variances Unequal è anche per misurazioni indipendenti, ma viene usato quando le tue varianze non sono uguali.

Per verificare se le varianze dei tuoi due campioni sono uguali, dovrai eseguire un test F. Trova F-Test a due campioni per le varianze nell'elenco Strumenti di analisi, selezionalo e fai clic su ok.

Inserisci i tuoi due set di dati nelle caselle dell'intervallo di input. Lascia il valore alfa a 0.05 a meno che tu non abbia ragione di cambiarlo - se non sai cosa significa, lascia semplicemente. Infine, fai clic ok.

Excel ti fornirà i risultati in un nuovo foglio (a meno che tu non abbia selezionato Gamma di uscita e una cella nel tuo foglio corrente):

Stai guardando il valore P qui. Se è inferiore a 0.05, lo hai varianze disuguali. Quindi per eseguire il t-test, dovresti usare l'opzione varianze non uguali.

Per eseguire a t-test, selezionare il test appropriato dalla finestra degli strumenti di analisi e selezionare entrambi i set di dati nello stesso modo in cui si faceva per il test F. Lascia il valore alfa a 0.05 e premi ok.

I risultati includono tutto ciò che è necessario segnalare per a t-test: i mezzi, i gradi di libertà (df), la statistica t ei valori P per entrambi i test a una e due code. Se il valore P è inferiore a 0,05, i due campioni sono significativamente differenti.

Se non sei sicuro se utilizzare uno o due code t-prova, dai un'occhiata a questo spiegatore dell'UCLA.

ANOVA in Excel

Excel Data Analysis Toolpak offre tre tipi di analisi della varianza (ANOVA). Sfortunatamente, non ti dà la possibilità di eseguire i test di follow-up necessari come Tukey o Bonferroni. Ma puoi vedere se c'è una relazione tra alcune variabili diverse.

Ecco i tre test ANOVA in Excel:

  • ANOVA: fattore singolo analizza la varianza con una variabile dipendente e una variabile indipendente. È preferibile utilizzare più t-prova quando hai più di due gruppi.
  • ANOVA: Two-Factor con replica è simile al paired t-test; comporta più misurazioni su singoli soggetti. Il “a due fattori” parte di questo test indica che ci sono due variabili indipendenti.
  • ANOVA: due fattori senza replica coinvolge due variabili indipendenti, ma nessuna replica in misura.

Qui esamineremo l'analisi a fattore singolo. Nel nostro esempio, guarderemo tre serie di numeri, etichettati “Intervento 1,” “Intervento 2,” e “Intervento 3.” Per eseguire un ANOVA, fare clic su Analisi dei dati, quindi selezionare ANOVA: fattore singolo.

Seleziona l'intervallo di input e assicurati di indicare a Excel se i tuoi gruppi si trovano in colonne o righe. Ho anche selezionato “Etichette nella prima riga” qui in modo che i nomi dei gruppi vengano visualizzati nei risultati.

Dopo aver colpito ok, otteniamo i seguenti risultati:

Si noti che il valore P è inferiore a 0,05, quindi abbiamo un risultato significativo. Ciò significa che c'è una differenza significativa tra almeno due dei gruppi nel test. Ma perché Excel non fornisce test per determinare quale i gruppi differiscono, il meglio che puoi fare è osservare le medie visualizzate nel sommario. Nel nostro esempio, Intervention 3 è come se fosse probabilmente quello che differisce.

Questo non è statisticamente valido. Ma se vuoi solo vedere se c'è una differenza e vedere quale gruppo lo sta probabilmente causando, funzionerà.

L'ANOVA a due fattori è più complicato. Se vuoi saperne di più su quando utilizzare il metodo a due fattori, guarda questo video da Sophia.org e il “senza replica” e “con la replica” esempi tratti da statistiche reali.

Correlazione in Excel

Il calcolo della correlazione in Excel è molto più semplice di t-test o ANOVA. Utilizzare il Analisi dei dati pulsante per aprire la finestra degli strumenti di analisi e selezionare Correlazione.

Seleziona il tuo intervallo di input, identifica i tuoi gruppi come colonne o righe e comunica a Excel se hai etichette. Dopo, colpisci ok.

Non otterrai alcuna misura significativa, ma puoi vedere come ogni gruppo è correlato con gli altri. Il valore di uno è una correlazione assoluta, a indicare che i valori sono esattamente gli stessi. Più vicino a uno il valore di correlazione, più forte è la correlazione.

Regressione in Excel

La regressione è uno dei test statistici più comunemente utilizzati nel settore e Excel offre una sorprendente quantità di energia per questo calcolo. Eseguiremo una rapida regressione multipla in Excel qui. Se non hai familiarità con la regressione, consulta la guida di HBR sull'uso della regressione per le aziende.

Diciamo che la nostra variabile dipendente è la pressione sanguigna, e le nostre due variabili indipendenti sono il peso e l'assunzione di sale. Vogliamo vedere quale è un migliore predittore della pressione sanguigna (o se sono entrambi buoni).

Clic Analisi dei dati e selezionare Regressione. È necessario fare attenzione quando si compilano le caselle di intervallo di input questa volta. Il Ingresso gamma Y. box dovrebbe contenere la tua singola variabile dipendente. Il Input X Range la casella può includere più variabili indipendenti. Per una semplice regressione, non preoccuparti del resto (anche se ricorda di dire a Excel se hai selezionato le etichette).

Ecco come appare il nostro calcolo:

Dopo aver colpito ok, otterrai una grande lista di risultati. Ho evidenziato il valore P qui sia per il peso che per l'assunzione di sale:

Come puoi vedere, il valore P per il peso è maggiore di 0,05, quindi non c'è una relazione significativa lì. Il valore P per il sale, tuttavia, è inferiore a 0,05, a indicare che è un buon predittore della pressione arteriosa.

Se hai intenzione di presentare i tuoi dati di regressione, ricorda che puoi aggiungere una linea di regressione a un grafico a dispersione in Excel. È un grande aiuto visivo Come visualizzare l'analisi dei dati con Power Tools di Excel Come visualizzare l'analisi dei dati con Power Tools di Excel Excel lo sta uccidendo con le sue funzionalità avanzate di gestione dei dati. Una volta che hai usato uno dei nuovi strumenti, li vuoi tutti. Diventa un maestro della tua analisi dei dati con gli utensili elettrici! Leggi di più per questa analisi.

Excel Statistics: Sorprendentemente Capace

Mentre Excel non è noto per il suo potere statistico, in realtà racchiude alcune funzionalità davvero utili. Soprattutto una volta scaricato il componente aggiuntivo delle statistiche di Data Analysis Toolpak. Spero che tu abbia imparato a usare Toolpak e che ora puoi giocare da solo per capire come usare più delle sue funzioni.

Con questo ormai alle spalle, porta le tue competenze di Excel a un livello superiore con i nostri articoli sull'utilizzo della funzionalità Goal Seek di Excel per un maggior numero di scricchiolii, padronanza delle istruzioni IF in Excel e aggiunta di elenchi a discesa come celle in Excel.

Ho anche collegato ad altri siti che hanno tutorial di buone statistiche in cui abbiamo dovuto saltare oltre concetti confusi. Assicurati di controllare la nostra guida per liberare risorse statistiche Scopri le statistiche gratuitamente con queste 6 risorse Scopri le statistiche gratuitamente con queste 6 risorse Statistiche ha una reputazione di soggetto difficile da capire. Ma imparare dalle risorse giuste ti aiuterà a capire i risultati del sondaggio, i rapporti elettorali e le assegnazioni delle classi di statistiche in pochissimo tempo. Leggi di più, anche.

Scopri di più su: Microsoft Excel, foglio di calcolo.