Hypotesetest i økonomi: koncept og eksempler

S2 - #5-6b - Hypotesetesting med binomisk fordeling (November 2024)

S2 - #5-6b - Hypotesetesting med binomisk fordeling (November 2024)
Hypotesetest i økonomi: koncept og eksempler
Anonim

Din investeringsrådgiver foreslår dig en månedlig indkomstinvesteringsordning, der lover et variabelt afkast hver måned. Du vil kun investere i det, hvis du er sikker på et gennemsnit på $ 180 månedlig indkomst. Din rådgiver fortæller dig også, at ordningen i de sidste 300 måneder havde returneret med en gennemsnitlig værdi på $ 190 og standardafvigelsen på $ 75. Skal du investere i denne ordning?

Hypotesetestning er til støtte for sådan beslutningstagning.

Denne artikel forudsætter læsernes fortrolighed med begreberne af en normal distributionstabel, formel, p-værdi og relaterede grundlæggende statistikker.

For mere om praktiske anvendelser af data til bestemmelse af risiko henvises til "5 måder at måle den gensidige fondsrisiko på."

Hypotesetestning (eller signifikansprøvning) er en matematisk model til at teste et krav, en ide eller en hypotese om en parameter af interesse i en given befolkningssæt ved hjælp af data målt i et prøve sæt. Beregninger udføres på udvalgte prøver for at indsamle mere afgørende information om hele befolkningens karakteristika, hvilket muliggør en systematisk måde at teste krav eller ideer om hele datasættet på.

Her er et simpelt eksempel: (A) En skoleleder rapporterer, at elever i hendes skole scorer gennemsnitligt 7 ud af 10 i eksamen. For at teste denne "hypotese" registrerer vi karakterer på f.eks. 30 studerende (prøve) fra hele skolens elevpopulation (siger 300) og beregner gennemsnittet af prøven. Vi kan derefter sammenligne den (beregnede) prøve gennemsnit til den (rapporterede) befolkningsmiddel og forsøge at bekræfte hypotesen.

Et andet eksempel: (B) Den årlige afkast af en bestemt investeringsfond er 8%. Antag, at fond har eksisteret i 20 år. Vi tager en tilfældig stikprøve af fondens årlige afkast for f.eks. Fem år (stikprøve) og beregner dets gennemsnit. Vi sammenligner derefter den (beregnede) prøve-middel til den (hævdede) befolkning, der betyder at verificere hypotesen.

Der findes forskellige metoder til hypotesetestning. Følgende fire grundlæggende trin er involveret:

Trin 1: Definer hypotesen:

Normalt angives den rapporterede værdi (eller kravstatistik) som hypotesen og antages at være sand. For ovenstående eksempler vil hypotesen være:

  • Eksempel A: Studerende i skolen scorer i gennemsnit 7 ud af 10 i eksamener
  • Eksempel B: Årlig afkast af investeringsforeningen er 8% pr. År

Dette erklærede Beskrivelsen udgør " Null-hypotesen (H 0 ) " og er antaget for at være sand. Som en juryforsøg starter ved at antage uskyld fra den mistænkte efterfulgt af beslutsomhed, om antagelsen er fejlagtig. Tilsvarende begynder hypotesetest ved at angive og antage "Null-hypotesen", og så afgør processen, om antagelsen sandsynligvis vil være sand eller falsk.

Det vigtige punkt at bemærke er, at vi tester null hypotesen, fordi der er et element af tvivl om dens gyldighed. Uanset hvilken information der er imod den angivne null-hypotese, er den fanget i Alternativ hypotesen (H 1 ). For de ovennævnte eksempler vil alternative hypoteser være:

  • Studerende scorer et gennemsnit, der er ikke svarende til 7
  • Den årlige afkast af investeringsforeningen er ikke lige til 8% om året

Sammenfattende er alternativ hypotese en direkte modsigelse af nullhypotesen.

Som i en prøve antager juryen mistænktes uskyld (null hypotese). Anklageren skal bevise ellers (alternativt). Tilsvarende må forskeren bevise, at nullhypotesen er enten sand eller falsk. Hvis anklageren ikke bekræfter den alternative hypotese, skal juryen give slip på den "mistænkte" (basere beslutningen om null hypotesen). Ligeledes, hvis forskeren undlader at bevise alternativ hypotese (eller simpelthen ikke gør noget), antages nulhypotesen at være sand.

Trin 2: Angiv beslutningskriterierne

Beslutningskriterierne skal baseres på visse parametre af datasæt, og det er her forbindelsen til normal distribution kommer ind på billedet.

Som i standardstatistikpostulatet om prøveudtagningsfordeling, "For enhver stikstørrelse n er prøveudtagningsfordelingen for X-tjør normal, hvis befolkningen X, hvorfra prøven er trukket, normalt fordeles. "Sandsynlighederne for alle andre mulige prøveorganer man kunne vælge, er normalt fordelt på.

Til e. g. , fastslå, om det gennemsnitlige daglige afkast af alle aktier på XYZ-børsen omkring nytår er større end 2%.

H 0 : Null-hypotesen: middel = 2%

H 1 : Alternativ hypotese: middelværdi> 2% (Dette er det vi vil bevise)

Tag prøven (sige 50 bestande ud af i alt 500) og beregne gennemsnittet af prøven.

For en normal fordeling ligger 95% af værdierne inden for 2 standardafvigelser af populationens gennemsnit. Derfor tillader denne normale fordeling og centralgrænseforudsætningen for prøvedatasættet os at etablere 5% som et signifikansniveau. Det er fornuftigt, at der under denne antagelse er mindre end en 5% sandsynlighed (100-95) for at få outliers, der er ud over 2 standardafvigelser fra populationsmiddelet. Afhængigt af datasætets art kan andre signifikansniveauer tages ved 1%, 5% eller 10%. For økonomiske beregninger (inklusive adfærdsmæssig finansiering) er 5% den generelt accepterede grænse. Hvis vi finder nogen beregninger, der går ud over de sædvanlige 2 standardafvigelser, har vi et stærkt tilfælde af bortfaldere til at afvise nulhypotesen. Standardafvigelser er yderst vigtige for at forstå statistiske data. Få mere at vide om dem ved at se Investopedias video på standardafvigelser.

Det er grafisk repræsenteret som følger:

I eksemplet ovenfor, hvis gennemsnittet af prøven er meget større end 2% (siger 3,5%), afviser vi nulhypotesen.Den alternative hypotese (gennemsnitlig> 2%) accepteres, hvilket bekræfter, at den gennemsnitlige daglige afkast af lagrene faktisk er over 2%.

Men hvis gennemsnittet af prøven sandsynligvis ikke er signifikant større end 2% (og forbliver på omkring 2,2%), så kan vi IKKE afvise nulhypotesen. Udfordringen kommer på, hvordan man beslutter sig for sådanne nærtstående sager. For at konkludere fra udvalgte prøver og resultater skal et niveau af betydning bestemmes, hvilket gør det muligt at konkludere om nulhypotesen. Den alternative hypotese muliggør etablering af niveauet af betydning eller "kritisk værdi" -konceptet til at afgøre sådanne nærtstående tilfælde. Som i standarddefinitionen er "En kritisk værdi en cutoff-værdi, der definerer grænserne ud over hvilke mindre end 5% af prøven midler kan opnås, hvis nullhypotesen er sand. Prøveorganer opnået ud over en kritisk værdi vil resultere i en beslutning om at afvise nulhypotesen. "I ovenstående eksempel, hvis vi har defineret den kritiske værdi som 2. 1% og beregnet gennemsnit kommer til 2. 2%, så afviser vi null hypotesen. En kritisk værdi etablerer en klar afgrænsning om accept eller afvisning.

Flere eksempler at følge - Lad os først se på nogle flere vigtige trin og begreber.

Trin 3: Beregn teststatistik:

Dette trin involverer beregning af de ønskede tal (er), kendt som teststatistik (som gennemsnit, z-score, p-værdi osv.) For den valgte prøve. De forskellige værdier, der skal beregnes, er dækket i et senere afsnit med eksempler.

Trin 4: Lav konklusioner om hypotesen

Med den beregnede værdi (r) bestemmer du nulhypotesen. Hvis sandsynligheden for at få en prøveværdi er mindre end 5%, er konklusionen at nægte nullhypotesen. Ellers accepterer og behold nullhypotesen.

Typer af fejl i beslutningsprocessen:

Der kan være fire mulige resultater i stikprøvebaseret beslutningstagning med hensyn til korrekt anvendelse af hele befolkningen:

Beslutning om at beholde

Beslutning om at afvise > Gælder for hele befolkningen

Korrekt

Forkert

(TYP 1 Fejl - a)

Gælder ikke hele befolkningen

Forkert

(TYPE 2 Fejl - b)

Korrekt

De "korrekte" tilfælde er dem, hvor de beslutninger, der er truffet på prøverne, virkelig gælder for hele befolkningen. Fejlfaldene opstår, når man beslutter at beholde (eller afvise) nulhypotesen baseret på prøveberegninger, men beslutningen gælder ikke rigtig for hele befolkningen. Disse tilfælde udgør type 1 (alfa) og type 2 (beta) fejl, som angivet i tabellen ovenfor.

Hvis du vælger den korrekte kritiske værdi, kan du eliminere type 1-alfa-fejlene eller begrænse dem til et acceptabelt interval.

Alpha angiver fejlen på niveau af betydning, og bestemmes af forskeren. For at opretholde standard 5% signifikans eller konfidensniveau for sandsynlighedsberegninger opretholdes dette ved 5%.

I henhold til de gældende beslutningsstandarder og definitioner:

"Dette (alpha) kriterium er sædvanligvis sat til 0.05 (a = 0. 05), og vi sammenligner alfa-niveauet med p-værdien. Når sandsynligheden for en type I-fejl er mindre end 5% (p <0, 05), beslutter vi at afvise nulhypotesen; ellers beholder vi nullhypotesen. "

  • Det tekniske udtryk, der anvendes til denne sandsynlighed, er
  • p-værdi . Det defineres som "sandsynligheden for at opnå et prøveudfald, da værdien angivet i nullhypotesen er sand. P-værdien for at opnå et prøveudfald sammenlignes med niveauet af betydning ". En Type II-fejl eller en beta-fejl defineres som "sandsynligheden for, at nulhypotesen fejlagtigt opretholdes, når den faktisk ikke er anvendelig for hele befolkningen. "
  • Nogle få eksempler viser denne og andre beregninger.

Eksempel 1. Der eksisterer en månedlig indkomstinvesteringsordning, der lover variabel månedlig afkast. En investor vil kun investere i det, hvis han er sikret en gennemsnitlig indkomst på 180 dollar. Han har en prøve på 300 måneders afkast, som har et gennemsnit på $ 190 og standardafvigelsen på $ 75. Skal han eller hun investere i denne ordning?

Lad os lave problemet. Investor vil investere i ordningen, hvis han eller hun er forsikret om hans ønskede gennemsnitlige afkast på $ 180. Her,

H

0 : Nul hypotesen: middel = 180 H

1 : Alternativ hypotese: middel> 180 Metode 1 -

Kritisk værdi tilgang : Identificer en kritisk værdi X

L for prøveværdien, som er stor nok til at afvise nullhypotesen - i. e. afvise nulhypotesen, hvis prøven betyder> = kritisk værdi X L P (identificer en Type I-alfafejl) = P (afvis H

0 i betragtning af at H 0 er sandt), , som ville opnås, når prøveværdien overstiger de kritiske grænser i. e.

= P (givet at H

0 er sandt) = alfa Grafisk

Under alpha = 0. 05 (dvs. 5% signifikansniveau), Z

0. 05 = 1. 645 (fra Z-tabellen eller normalfordelingstabellen) => X

L = 180 +1. 645 * (75 / sqrt (300)) = 187. 12 Da gennemsnittet (190) er større end den kritiske værdi (187,12), nul-hypotesen afvises, og konklusionen er, at det gennemsnitlige månedlige afkast er faktisk større end $ 180, så investor kan overveje at investere i denne ordning.

Metode 2 - Ved hjælp af standardiseret teststatistik

: Man kan også bruge den standardiserede værdi z.

Teststatistik, Z = (prøve middelværdi - populationsmiddel) / (std-dev / sqrt (antal prøver) dvs.

Så bliver afvisningsområdet

Z = (190 - 180) / 75 / sqrt (300)) = 2. 309

Vores afvisningsregion med 5% signifikansniveau er Z> Z

0. 05 = 1. 645 Da Z = 2. 309 er større

Metode 3 - P-værdiberegning:

Vi sigter på at identificere P (middelværdi> = 190, når gennemsnittet = 180) < = P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0. 0084 = 0. 84%

Følgende tabel at konkludere p-værdi beregninger konkluderer, at der er bekræftet bevis for, at gennemsnitlige månedlige afkast er højere end 180.

p-værdi

Inference

mindre end 1%

Bekræftet bevis

understøttende alternativ hypotese

mellem 1% og 5% Stærkt bevis

understøttende alternativ hypotese > mellem 5% og 10%

svag beviser understøttende alternativ hypotese

større end 10%

Intet bevis understøttende alternativ hypotese

Eksempel 2: En ny aktiemægler (XYZ) krav at hans mæglervirksomheder er lavere end din nuværende børsmæglers (ABC) Data, der er tilgængelige fra et uafhængigt forskningsfirma, indikerer, at den gennemsnitlige og std-dev af alle ABC-mæglerklienter er henholdsvis 18 dollar og 6 dollar.

Der tages en prøve på 100 kunder hos ABC, og mæglervirksomheder beregnes med de nye rater af XYZ-mægler. Hvis gennemsnittet af stikprøven er $ 18. 75 og std-dev er det samme ($ 6), kan der laves nogen konklusion om forskellen i den gennemsnitlige mæglerregning mellem ABC og XYZ mægler? H

0

: Null-hypotesen: middel = 18

H 1 : Alternativ hypotese: middel 18 (Dette er det vi vil bevise)

Afvisningsregion: Z <= - z 2. 5 og Z> = Z

2. 5 (antager 5% signifikansniveau, delt 2. 5 hver på hver side) Z = (prøve middelværdi) / (std-dev / sqrt (antal prøver) = (18 75 - 18) / (6 / (sqrt (100)) = 1. 25 Denne beregnede Z-værdi falder mellem de to grænser defineret af

- Z

2. 5

= -1 96 og Z

2. 5 = 1. 96. Dette konkluderer, at der ikke er tilstrækkelig dokumentation for at konkludere, at der er nogen forskel mellem satserne på din eksisterende og nye mægler. Alternativt, P-værdien = P (Z1, 25) = 2 * 0. 1056 = 0. 2112 = 21. 12%, der er større end 0. 05 eller 5%, hvilket fører til samme konklusion.

Grafisk , repræsenteres af følgende:

Kritikpunkter for hypotetisk testmetode:

-

Statistisk metode baseret på forudsætninger

- Fejlberet som detaljeret i alfa- og beta-fejl

- Fortolkning af p-værdi kan være ambigøs, hvilket fører til forvirrende resultater Den nederste linje

Hypotesetestning tillader en matematisk model at validere et krav eller en ide med sikkert konfidensniveau. Men ligesom flertallet af statistiske værktøjer og modeller er dette også bundet af nogle få begrænsninger. Brugen af ​​denne model til at træffe økonomiske beslutninger bør overvejes med kritik og holde alle afhængigheder i tankerne. Alternativ metoder som Bayesian Inference er også værd at udforske til lignende analyser.