Descrizione delle funzioni statistiche di sicurezza in Excel

Riepilogo

Questo articolo descrive la funzione CONFIDENZa in Microsoft Office Excel 2003 e in Microsoft Office Excel 2007, illustra come viene usata la funzione e confronta i risultati della funzione per Excel 2003 e per Excel 2007 con i risultati di fiducia in precedenza versioni di Excel.

Il significato di un intervallo di confidenza viene spesso frainteso e proviamo a dare una spiegazione delle istruzioni valide e non valide che possono essere apportate dopo aver determinato un valore di CONFIDENZa dai dati.

Altre informazioni

La funzione CONFIDENZa (Alpha, Sigma, n) restituisce un valore che puoi usare per creare un intervallo di confidenza per una media di popolazione. L'intervallo di confidenza è un intervallo di valori centrati in base a una media campione Nota. Le osservazioni nel campione si presume che provengano da una distribuzione normale con la deviazione standard nota, Sigma, e il numero di osservazioni nell'esempio è n.

Sintassi

CONFIDENCE(alpha,sigma,n)

Parametri: alfa è una probabilità e 0 < alfa < 1. Sigma è un numero positivo e n è un valore integer positivo che corrisponde alle dimensioni del campione.

In genere, alfa è una piccola probabilità, ad esempio 0,05.

Esempio di utilizzo

Supponiamo che i punteggi quoziente d'intelligenza (IQ) seguano una distribuzione normale con deviazione standard 15. Puoi testare IQs per un campione di 50 studenti nella tua scuola locale e ottenere una media campione di 105. Si vuole calcolare un intervallo di confidenza di 95% per la media della popolazione. Un intervallo di confidenza di 95% o 0,95 corrisponde a alfa = 1-0,95 = 0,05.

Per illustrare la funzione CONFIDENZa, creare un foglio di lavoro di Excel vuoto, copiare la tabella seguente e quindi selezionare la cella a1 nel foglio di lavoro di Excel vuoto. Scegliere Incolla dal menu Modifica.

Nota: In Excel 2007 fare clic su Incolla nel gruppo Appunti della scheda Home .

Le voci nella tabella seguente riempiono le celle a1: B7 nel foglio di lavoro.

Alfa

0,05

StDev

15

m

50

media campione

105

= CONFIDENZA (B1, B2, B3)

= INV.NORM.ST (1-B1/2) * B2/SQRT (B3)

Dopo aver incollato questa tabella nel nuovo foglio di lavoro di Excel, fare clic sul pulsante Opzioni Incolla e quindi su associa la formattazione di destinazione.

Con l'intervallo incollato ancora selezionato, scegliere colonna dal menu formato e quindi fare clic su Adatta selezione.

Nota: In Excel 2007, con l'intervallo di celle incollato selezionato, fare clic su formato nel gruppo celle della scheda Home e quindi fare clic su Adatta larghezza colonne.

La cella A6 Mostra il valore di ATTENDIBILità. La cella A7 Mostra lo stesso valore perché una chiamata a CONFIDENCE (Alpha, Sigma, n) restituisce il risultato dell'elaborazione:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Non sono state apportate modifiche direttamente alla RISERVAtezza, ma inv.Norm.St è stato migliorato in Microsoft Excel 2002 e quindi sono stati apportati altri miglioramenti tra Excel 2002 ed Excel 2007. Di conseguenza, la RISERVAtezza può restituire risultati diversi (e migliorati) in queste versioni successive di Excel, perché la fiducia si basa su Inv.Norm.St.

Questo non significa che si debba perdere fiducia per le versioni precedenti di Excel. Le imprecisioni in inv.Norm.St si sono verificate generalmente per i valori dell'argomento molto vicino a 0 o molto vicino a 1. In pratica, Alpha è in genere impostato su 0,05, 0,01 o forse 0,001. I valori di Alpha devono essere molto più piccoli di quelli, ad esempio 0,0000001, prima che gli errori di arrotondamento in inv.Norm.St siano probabilmente notati.

Nota: Vedere l'articolo su Inv.Norm.St per una discussione sulle differenze di calcolo in inv.Norm.St.

Per altre informazioni, fare clic sul numero dell'articolo della Microsoft Knowledge Base seguente per visualizzare l'articolo:

826772 Funzioni statistiche di Excel: inv.Norm.St

Interpretazione dei risultati di fiducia

Il file della Guida di Excel per la sicurezza è stato riscritto per Excel 2003 e per Excel 2007 perché tutte le versioni precedenti del file della guida hanno fornito consigli fuorvianti per l'interpretazione dei risultati. L'esempio afferma "Supponiamo che, nel nostro esempio di abbonati di 50, la durata media della corsa al lavoro sia di 30 minuti con una deviazione standard della popolazione di 2,5. Possiamo essere sicuri di 95 per cento che la media della popolazione è nell'intervallo 30 +/-0,692951 "dove 0,692951 è il valore restituito da CONFIDENCE (0.05, 2,5, 50).

Per lo stesso esempio, la conclusione recita: "la durata media della corsa al lavoro è pari a 30 ± 0,692951 minuti oppure da 29,3 a 30,7 minuti". Presumibilmente, questa è anche un'affermazione relativa alla media della popolazione che rientra nell'intervallo [30-0,692951, 30 + 0,692951] con la probabilità 0,95.

Prima di eseguire l'esperimento che ha prodotto i dati per questo esempio, uno statistico classico (in contrapposizione a uno statistico bayesiano) non può fare alcuna dichiarazione sulla distribuzione della probabilità della popolazione. Uno statistico classico affronta invece i test di ipotesi.

Ad esempio, uno statistico classico può voler eseguire un test di ipotesi su due lati basato sulla supposizione di una distribuzione normale con deviazione standard nota (ad esempio 2,5), un particolare valore preselezionato della media della popolazione, µ 0 e un livello di significatività preselezionato (ad esempio 0,05). Il risultato del test sarà basato sul valore della media campione osservato (ad esempio 30) e l'ipotesi null che la media della popolazione è µ 0 verrebbe rifiutata a un livello di significatività 0,05 se la media del campione osservato fosse troppo distante da µ 0 in entrambe le direzioni. Se l'ipotesi null viene rifiutata, l'interpretazione è che un campione significa che lontano o in seguito da µ 0 si verificherebbe per caso meno del 5% del tempo sotto la supposizione che µ 0 sia la media della popolazione effettiva. Dopo aver effettuato questo test, uno statistico classico non può ancora fare alcuna dichiarazione sulla distribuzione della probabilità della popolazione media.

Un statistico bayesiano, invece, inizierà con una distribuzione di probabilità assunta per la media della popolazione (denominata una distribuzione a priori), che raccoglierebbe prove sperimentali allo stesso modo dello statistico classico e userebbe questa evidenza per rivedere la distribuzione di probabilità per la media della popolazione e quindi ottenere una distribuzione a posteriori. Excel non offre funzioni statistiche che aiuteranno uno statistico bayesiano in questo sforzo. Le funzioni statistiche di Excel sono tutte progettate per gli statistici classici.

Gli intervalli di confidenza sono correlati ai test di ipotesi. Dato l'evidenza sperimentale, un intervallo di confidenza rende una dichiarazione concisa sui valori della popolazione ipotizzata Media µ 0 che produrrebbe l'accettazione dell'ipotesi null che la media della popolazione è µ 0 e i valori di µ 0 che produrrebbe il rigetto dell'ipotesi null che la media della popolazione sia µ 0. Uno statistico classico non può fare alcuna dichiarazione circa la possibilità che la media della popolazione rientri in un intervallo specifico, perché lei o lui non fa mai supposizioni a priori su questa distribuzione di probabilità e queste ipotesi sarebbero necessarie se si dovesse usare le evidenze sperimentali per modificarle.

Esplorare la relazione tra test di ipotesi e intervalli di confidenza usando l'esempio all'inizio di questa sezione. Con la relazione tra CONFIDENZa e inv.Norm.St riportata nell'ultima sezione, è necessario:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Dato che la media campione è 30, l'intervallo di confidenza è 30 +/-0,692951.

Ora consideriamo un test di ipotesi su due lati con il livello di significatività 0,05 come descritto in precedenza che presuppone una distribuzione normale con deviazione standard 2,5, una dimensione del campione di 50 e una media di popolazione ipotizzata specifica, µ 0. Se questa è la media effettiva della popolazione, la media del campione proverrà da una distribuzione normale con media della popolazione µ 0 e deviazione standard, 2,5/SQRT (50). Questa distribuzione è simmetrica rispetto a µ 0 e si vuole rifiutare l'ipotesi null se ABS (Sample Mean-µ 0) > un valore di cutoff. Il valore di cutoff sarebbe tale che se µ 0 fosse la media della popolazione vera, un valore di media campione-µ 0 maggiore di questo cutoff o un valore di µ 0-campione medio maggiore di questo limite si verificherebbe per ogni probabilità 0,05/2. Questo valore di cutoff è

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Quindi rifiutare l'ipotesi null (media della popolazione = µ 0) se una delle istruzioni seguenti è vera:

esempio di media-µ 0 > 0. 692951
0-esempio di media > 0. 692951

Dato che sample media = 30 nell'esempio, queste due istruzioni diventano le istruzioni seguenti:

30-µ 0 > 0. 692951
µ 0-30 > 0. 692951

Riscrivendoli in modo che venga visualizzato solo µ 0 a sinistra, vengono restituite le istruzioni seguenti:

µ 0 < 30-0. 692951
µ 0 > 30 + 0. 692951

Questi sono esattamente i valori di µ 0 che non sono inclusi nell'intervallo di confidenza [30-0,692951, 30 + 0,692951]. Di conseguenza, l'intervallo di confidenza [30-0,692951, 30 + 0,692951] contiene i valori di µ 0, dove l'ipotesi null che la media della popolazione è µ 0 non verrebbe rifiutata, in base all'evidenza di esempio. Per i valori di µ 0 al di fuori di questo intervallo, l'ipotesi null che la media della popolazione è µ 0 verrebbe rifiutata in base all'evidenza di esempio.

Conclusioni

Le imprecisioni nelle versioni precedenti di Excel si verificano in genere per valori estremamente piccoli o estremamente grandi di p in inv.Norm.St (p). La sicurezza viene valutata chiamando inv.Norm.St (p), quindi la precisione di inv.Norm.St è un potenziale problema per gli utenti di fiducia. Tuttavia, i valori di p usati in pratica non possono essere abbastanza estremi da causare errori di arrotondamento significativi in inv.Norm.St e le prestazioni di ATTENDIBILità non devono essere un problema per gli utenti di qualsiasi versione di Excel.

La maggior parte di questo articolo è incentrata sull'interpretazione dei risultati di ATTENDIBILità. In altre parole, abbiamo chiesto: "Qual è il significato di un intervallo di confidenza?" Gli intervalli di confidenza vengono spesso fraintesi. Purtroppo, i file della Guida di Excel in tutte le versioni di Excel precedenti a Excel 2003 hanno contribuito a questo malinteso. Il file della Guida di Excel 2003 è stato migliorato.

Nota:  Questa pagina è stata tradotta automaticamente e potrebbe contenere errori di grammatica o imprecisioni. L'intento è quello di rendere fruibile il contenuto. Queste informazioni sono risultate utili' Questo è l'articolo in inglese per riferimento.

Amplia le tue competenze su Office
Esplora i corsi di formazione
Ottieni in anticipo le nuove caratteristiche
Partecipa al programma Office Insider