Indholdsfortegnelse:
Hvis du nogensinde har spekuleret på, hvordan to eller flere ting vedrører hinanden, eller hvis du nogensinde har haft din chef, spørg dig om at oprette en prognose eller analysere forhold mellem variabler, så ville læring regression Vær værd din tid.
I denne artikel lærer du det grundlæggende om simpel lineær regression - et værktøj, der ofte bruges til prognoser og økonomisk analyse. Vi vil begynde med at lære de grundlæggende principper for regression, først lære om kovarians og korrelation, og derefter gå videre til at bygge og tolke en regressionsproduktion. En masse software som Microsoft Excel kan gøre alle regressionsberegninger og output til dig, men det er stadig vigtigt at lære den underliggende mekanik.
Variabler
I centrum af regression er forholdet mellem to variabler kaldt de afhængige og uafhængige variabler. Antag for eksempel, at du vil forudsige salg til din virksomhed, og du har konkluderet, at din virksomheds salg går op og ned afhængigt af ændringer i BNP.
Det salg, du forventer, vil være den afhængige variabel, fordi deres værdi "afhænger" af værdien af BNP, og BNP ville være den uafhængige variabel. Du skal derefter bestemme styrken af forholdet mellem disse to variabler for at forudsige salg. Hvis BNP stiger / falder med 1%, hvor meget vil dit salg stige eller falde?
Covariance
Formlen til beregning af forholdet mellem to variabler kaldes kovarians. Denne beregning viser dig retningen af forholdet såvel som dets relative styrke. Hvis en variabel stiger, og den anden variabel har tendens til også at stige, vil kovariansen være positiv. Hvis en variabel går op og den anden tendens til at gå ned, så vil kovariansen være negativ.
Det faktiske tal, du får ved at beregne dette, kan være svært at fortolke, fordi det ikke er standardiseret. En kovarians på fem kan for eksempel fortolkes som et positivt forhold, men forholdets styrke kan kun siges at være stærkere end hvis tallet var fire eller svagere end hvis tallet var seks.
Korrelationskoefficient
Vi skal standardisere kovariansen for at give os bedre mulighed for at fortolke og bruge det i prognoser, og resultatet er korrelationsberegningen. Korrelationsberegningen tager simpelthen kovariansen og dividerer den ved produktet af standardafvigelsen for de to variabler. Dette vil binde korrelationen mellem en værdi på -1 og +1.
En korrelation på +1 kan fortolkes for at antyde, at begge variabler bevæger sig perfekt positivt med hinanden, og at -1 betyder, at de er fuldstændig negativt korrelerede. I vores tidligere eksempel, hvis korrelationen er +1, og BNP stiger med 1%, vil salget stige med 1%.Hvis korrelationen er -1, vil en 1% stigning i BNP resultere i et fald på 1% i salget - det nøjagtige modsatte.
Regressionsligning
Nu hvor vi ved, hvordan forholdet mellem de to variabler beregnes, kan vi udvikle en regressionsligning til at forudsige eller forudsige den variabel, vi ønsker. Nedenfor er formlen for en simpel lineær regression. "Y" er den værdi, vi forsøger at forudsige, "b" er regressionens hældning, "x" er værdien af vores uafhængige værdi, og "a" repræsenterer y-afsnit. Regressionsligningen beskriver blot forholdet mellem den afhængige variabel (y) og den uafhængige variabel (x).
Afsnit, eller "a," er værdien af y (afhængig variabel), hvis værdien af x (uafhængig variabel) er nul. Så hvis der ikke var nogen ændring i BNP, ville dit firma stadig gøre noget salg - denne værdi, når BNP-omstillingen er nul, er aflytningen. Se nedenstående graf for at se en grafisk gengivelse af en regressionsligning. I denne graf er der kun fem datapunkter repræsenteret af de fem prikker i grafen. Lineær regression forsøger at estimere en linje, som bedst passer til dataene, og ligningen af den linje resulterer i regressionsligningen.
Figur 1: Den bedste pasform |
Kilde: Investopedia |
Excel
Nu når du forstår nogle af baggrunden, der går ind i regressionsanalyse, lad os lave et simpelt eksempel ved hjælp af Excel's regressionsværktøjer. Vi bygger videre på det foregående eksempel på at forsøge at prognose næste års salg baseret på ændringer i BNP. Nedenstående tabel viser nogle kunstige datapunkter, men disse tal kan nemt nås i det virkelige liv.
År | Salg | BNP |
2013 | 100 | 1. 00% |
2014 | 250 | 1. 90% |
2005 | 275 | 2. 40% |
2016 | 200 | 2. 60% |
2017 | 300 | 2. 90% |
Bare øjet på bordet kan du se, at der vil være en positiv sammenhæng mellem salg og BNP. Begge har tendens til at gå op sammen. Brug Excel, alt du skal gøre er at klikke på rullemenuen Værktøjer , vælg Dataanalyse og vælg derefter Regression . Popup-boksen er let at udfylde derfra; Din Input Y Range er din "Salg" kolonne, og din Input X Range er ændringen i BNP kolonne; Vælg udgangsområde for hvor du vil have dataene vist på dit regneark, og tryk på OK. Du bør se noget, som ligner det, der er angivet i tabellen nedenfor.
Regressionsstatistik | Koefficienter | ||
Flere R | 0. 8292243 | Intercept | 34. 58409 |
R Square | 0. 687.613 | BNP | 88. 15552 |
Justeret R Square | 0. 583484 |
- |
- |
Standardfejl | 51. 021807 | - |
- |
Observationer | 5 |
- |
- |
Fortolkning
De store udgange, du skal bekymre dig om for simpel lineær regression, er R-kvadreret , aflytnings- og BNP-koefficienten. R-kvadreret nummer i dette eksempel er 68. 7% - dette viser, hvor godt vores model forudsiger eller forudsiger det fremtidige salg. Næste har vi et afsnit på 34.58, som fortæller os, at hvis omsætningen i BNP forventes at være nul, vil vores salg være omkring 35 enheder. Endelig fortæller BNP korrelationskoefficienten på 88,15 os, at hvis BNP stiger med 1%, vil salget sandsynligvis stige med omkring 88 enheder.
The Bottom Line
Så hvordan vil du bruge denne enkle model i din virksomhed? Nå, hvis din forskning får dig til at tro på, at den næste BNP-ændring vil være en vis procentdel, kan du tilslutte den procentdel til modellen og generere en salgsforventning. Dette kan hjælpe dig med at udvikle en mere objektiv plan og budget for det kommende år.
Selvfølgelig er dette bare en simpel regression, og der er modeller, som du kan opbygge, der bruger flere uafhængige variabler kaldet flere lineære regressioner. Men flere lineære regressioner er mere komplicerede og har flere problemer, der ville have brug for en anden artikel at diskutere.