Den normale fordelingsformel er baseret på to enkle parametre - middelværdi og standardafvigelse - hvilket kvantificerer egenskaber ved et givet datasæt. Mens middelværdien angiver den "centrale" eller gennemsnitsværdien af hele datasættet, angiver standardafvigelsen "spread" eller variationen af datapunkter omkring den gennemsnitlige værdi.
Overvej følgende 2 datasæt:
Datasæt 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Datasæt 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
For Datasæt1, betyder = 10 og standardafvigelse (stddev) = 0
For Dataset2, middel = 10 og standardafvigelse (stddev) = 2. 83
Lad os plotte disse værdier for DataSet1:
Tilsvarende for DataSet2:
Den røde vandrette linje i begge ovenstående grafer angiver "middel" eller gennemsnitsværdien af hvert datasæt (10 i begge tilfælde). De lyserøde pile i den anden graf indikerer spredningen eller variationen af dataværdier fra middelværdien. Dette er repræsenteret ved standardafvigelsesværdien på 2. 83 i tilfælde af DataSet2. Da DataSet1 har alle værdier samme (som 10 hver) og ingen variationer, er stddev-værdien nul, og derfor er der ingen pink-pile.
Stddev-værdien har nogle få signifikante og nyttige egenskaber, som er yderst hjælpsomme i dataanalyse. For en normal distribution er dataværdierne symmetrisk fordelt på hver side af middelværdien. For ethvert normalt distribueret datasæt, tegner graf med stddev på vandret akse og nr. af dataværdierne på lodret akse, opnås følgende graf.
Egenskaber for en normalfordeling
- Den normale kurve er symmetrisk omkring gennemsnittet;
- Middelværdien er i midten og deler området i to halvdele;
- Det samlede areal under kurven er lig med 1 for gennemsnit = 0 og stdev = 1;
- Fordelingen er fuldstændig beskrevet af dens middelværdi og stddev
Som det fremgår af ovenstående graf repræsenterer stddev følgende:
- 68. 3% af dataværdier ligger inden for 1 standardafvigelse af middelværdien (-1 til +1)
- 95. 4% af dataværdier er inden for 2 standardafvigelser af middelværdien (-2 til +2)
- 99. 7% af dataværdier er inden for 3 standardafvigelser af middelværdien (-3 til +3)
Området under den klokkeformede kurve angiver, hvorvidt den ønskede sandsynlighed for en given interval:
- mindre end X: - e. g. sandsynlighed for, at dataværdier er mindre end 70
- større end X - e. g. sandsynligheden for, at dataværdier er større end 95
- mellem X 1 og X 2 - e. g. sandsynlighed for dataværdier mellem 65 og 85
hvor X er en værdi af interesse (eksempler nedenfor).
Plottning og beregning af området er ikke altid praktisk, da forskellige datasæt vil have forskellige gennemsnitlige og stddev-værdier.For at lette en ensartet standardmetode for nemme beregninger og anvendelighed til virkelige problemer i verden, blev standardkonvertering til Z-værdier indført, som udgør en del af Normal Fordelingstabel .
Z = (X - mean) / stddev, hvor X er den tilfældige variabel.
Denne omdannelse tvinger i grunden middel og stddev til at standardiseres til henholdsvis 0 og 1, hvilket gør det muligt at anvende et standard defineret sæt Z-værdier (fra Normalfordelingstabel ) til nem beregning . Et snapshot af standard z-værdi tabel med sandsynlighedsværdier er som følger:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00000 |
0. 00399 |
0. 00.798 |
0. 01197 |
0. 01595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04.380 |
0. 04.776 |
0. 05172 |
0. 05.567 |
0. 05.966 |
… |
0. 2 |
0. 0793 |
0. 08317 |
0. 08.706 |
0. 09.095 |
0. 09.483 |
0. 09.871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19.497 |
0. 19847 |
0. 20194 |
0. 20540 |
0. 20.884 |
… |
0. 6 |
0. 22575 |
0. 22.907 |
0. 23237 |
0. 23.565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25.804 |
0. 26115 |
0. 26.424 |
0. 26.730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
For at finde sandsynligheden for z-værdi på 0. 239865 , afrund det først til 2 decimaler (dvs. 0,24). Se derefter efter de første 2 signifikante cifre (0. 2) i rækkerne og for mindst signifikante ciffer (resterende 0. 04) i kolonnen. Det vil føre til værdien på 0. 09483. |
|
Her kan du finde den fulde normalfordelingstabel med præcision op til 5 decimaler for sandsynlighedsværdier (inklusive dem for negative værdier).
Lad os se nogle virkelige eksempler. Højden af personer i en stor gruppe følger et normalt distributionsmønster. Antag at vi har et sæt på 100 individer, hvis højder er optaget, og gennemsnittet og stddev beregnes til henholdsvis 66 og 6 tommer.
Her er et par eksempler på spørgsmål, der let kan besvares ved hjælp af z-værdi tabel:
Hvad er sandsynligheden for, at en person i gruppen er 70 tommer eller mindre?Spørgsmålet er at finde
- kumulativ værdi på
P (X <= 70) i. e. i hele datasættet på 100, hvor mange værdier vil være mellem 0 og 70.
Vi skal nu finde P <= 0. 67) = 0. 24857 (fra z-tabellen ovenfor)
i. e. der er en 24 857% sandsynlighed for, at en person i gruppen vil være mindre end eller lig med 70 inches.
Men hold på - ovenstående er ufuldstændigt.Husk, vi søger sandsynlighed for alle mulige højder op til 70 i. e. fra 0 til 70. Ovennævnte giver dig kun delen fra gennemsnit til ønsket værdi (f.eks. 66 til 70). Vi skal medtage den anden halvdel - fra 0 til 66 - for at nå frem til det rigtige svar.
Da 0 til 66 repræsenterer halvdelen (dvs. en ekstrem til mid-way-middel), er sandsynligheden simpelthen 0. 5.
Således er den korrekte sandsynlighed for, at en person er 70 tommer eller mindre = 0. 24857 + 0. 5 = 0. 74857 =
74. 857%
Grafisk (ved at beregne området) er disse to summerede regioner, der repræsenterer løsningen: Hvad er sandsynligheden for at en person er 75 tommer eller højere?
i. e. Find
- Supplerende
kumulative P (X> = 75). Z = (X - middel) / stddev = (75-66) / 6 = 9/6 = 1. 5 P (Z> = 1, 5) = 1 - P (Z <= 1. 5) = 1 - (0,5 + 0,43319) = 0, 06681 = 6. 681%
Hvad er sandsynligheden for at en person er mellem 52 tommer og 67 tommer?
Find P (52 <= x <= 67).
- P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2.33 <= z <= 0. 17)
= P (Z <= 0,17) -p (Z <= -0,233) = (0,55-0,5749) - (.40905) =
Dette
normalt distributionstabellen
(og z-værdier) finder almindeligvis brug for eventuelle sandsynlighedsberegninger på forventede kursbevægelser på aktiemarkedet for aktier og indekser. De bruges i rækkeviddebaseret handel, identificere uptrend eller downtrend, support eller modstandsniveauer og andre tekniske indikatorer baseret på normale distributionskoncepter af middel- og standardafvigelse.
Jobless Recovery: Den nye normale siden 1990
Bare fordi økonomien vender tilbage fra en recession betyder ikke ledighed vil følge.
Den schweiziske valutachok forklaret
Hvad man skal forvente for verdensøkonomien efter det schweiziske valutachok.
Hvorfor foretrækker den ændrede interne afkastrate (MIRR) den normale interne afkast?
Se hvorfor den ændrede interne afkast er ofte en overlegen beregning af den klassiske interne afkast for vurdering af projekter.