Backtesting og Forward Testing: Betydningen af ​​korrelation

My Secret, Yet Simple Way To Backtest Any Trading Strategy Easily (November 2024)

My Secret, Yet Simple Way To Backtest Any Trading Strategy Easily (November 2024)
Backtesting og Forward Testing: Betydningen af ​​korrelation
Anonim

Traders, der er ivrige efter at prøve en handelsidee på et levende marked, gør ofte fejlen ved at stole helt på backtesting resultater for at afgøre, om systemet vil være rentabelt. Mens backtesting kan give forhandlere værdifulde oplysninger, er det ofte vildledende, og det er kun en del af evalueringsprocessen. Test af udprøvning og fremadrettet test giver yderligere bekræftelse vedrørende et systems effektivitet og kan vise et system s ægte farver, før der er reelle penge på linjen. God sammenhæng mellem backtesting, out-of-sample og forward performance testresultater er afgørende for at bestemme levedygtigheden af ​​et handelssystem. (Vi tilbyder nogle tip om denne proces, der kan hjælpe med at forfine dine nuværende handelsstrategier. Læs mere Backtesting: Fortolkning af fortiden .)

Backtesting Basics Backtesting refererer til at anvende et handelssystem til historiske data for at verificere, hvordan et system ville have udført i den angivne tidsperiode. Mange af dagens handelsplatforme understøtter backtesting. Traders kan teste ideer med et par tastetryk og få indsigt i effektiviteten af ​​en ide uden at risikere penge på en handelskonto. Backtesting kan evaluere enkle ideer, såsom hvordan en glidende gennemsnitlig crossover ville udføre på historiske data eller mere komplekse systemer med forskellige input og udløsere.

Så længe en ide kan kvantificeres, kan den backtestes. Nogle erhvervsdrivende og investorer kan søge en kvalificeret programmers ekspertise til at udvikle ideen til en testbar form. Typisk involverer dette en programmør, der koder ideen ind i det proprietære sprog, der hostes af handelsplatformen. Programmøren kan indarbejde brugerdefinerede inputvariabler, der tillader erhvervsdrivende at "justere" systemet. Et eksempel på dette ville være i det enkle glidende gennemsnitlige crossover-system, der er nævnt ovenfor: erhvervsdrivende ville være i stand til at indlæse (eller ændre) længderne af de to flytende gennemsnit, der anvendes i systemet. Den erhvervsdrivende kunne backtest for at bestemme, hvilke længder af glidende gennemsnit, der ville have udført det bedste på de historiske data. (Få mere indsigt i Electronic Trading Tutorial .)

Optimeringsstudier
Mange handelsplatforme tillader også optimeringsundersøgelser. Dette indebærer at indtaste en rækkevidde for den angivne indgang og lade computeren "lave matematikken" for at finde ud af, hvilken input der ville have udført det bedste. En multi-variabel optimering kan gøre matematikken for to eller flere variabler kombineret for at bestemme, hvilke niveauer sammen ville have opnået det bedste resultat. For eksempel kan forhandlere fortælle programmet hvilke input de gerne vil tilføje til deres strategi; disse ville derefter blive optimeret til deres ideelle vægte givet de testede historiske data.

Backtesting kan være spændende, fordi et urentabelt system ofte kan forvandles magisk til en pengefremstillings maskine med få optimeringer. Desværre fører tweaking til et system for at opnå det højeste niveau af fortjenstløshed ofte et system, der vil udføre dårligt i reel handel. Denne overoptimering skaber systemer, der kun ser godt ud på papir.

Kurveindretning er brugen af ​​optimeringsanalyser for at skabe det højeste antal vindende handler med det største overskud på de historiske data, der blev brugt i testperioden. Selvom det ser imponerende ud i backtesting-resultater, fører kurvemontering til upålidelige systemer, da resultaterne i det væsentlige er specielt designet til kun den pågældende data og tidsperiode.

Backtesting og optimering giver mange erhvervsdrivende mange fordele, men det er kun en del af processen, når man vurderer et potentielt handelssystem. En erhvervsdrivendes næste skridt er at anvende systemet på historiske data, der ikke er blevet brugt i den oprindelige backtesting-fase. (Det glidende gennemsnit er let at beregne, og når det er tegnet på et diagram, er det et kraftfuldt visuelt trendspottingsværktøj. Læs mere om Simple Moving Averages, der gør tendenser .)

In- Prøve vs Uprøvedata
Når du tester en ide om historiske data, er det fordelagtigt at reservere en tidsperiode med historiske data til testformål. De oprindelige historiske data, som ideen testes og optimeres på, kaldes dataene i stikprøven. Det datasæt, der er reserveret, kaldes data uden for stikprøven. Denne opsætning er en vigtig del af evalueringsprocessen, fordi den giver mulighed for at teste ideen om data, der ikke har været en komponent i optimeringsmodellen. Som følge heraf vil ideen ikke blive påvirket på nogen måde af dataene uden for stikprøven, og handlende vil kunne bestemme, hvor godt systemet kan udføre på nye data; jeg. e. i real-life handel.

Inden du foretager nogen backtesting eller optimering, kan handlende afsætte en procentdel af de historiske data, der skal reserveres til test uden for prøve. En metode er at opdele de historiske data i tredjedele og adskille en tredjedel til brug ved prøveudprøvning. Kun de in-sample data skal anvendes til den første test og enhver optimering. Figur 1 viser en tidslinje, hvor en tredjedel af de historiske data er reserveret til prøveudprøvning, og to tredjedele anvendes til stikprøveprøvningen. Skønt Figur 1 viser dataene uden for prøve i begyndelsen af ​​testen, ville typiske procedurer have den ude af prøveeksemplet umiddelbart forud for den fremadrettede ydeevne.

Figur 1: En tidslinje, der repræsenterer den relative længde af in-sample og out-of-sample data anvendt i backtesting processen.

Når først et handelssystem er udviklet ved hjælp af in-sample data, er det klar til at blive anvendt på data uden for stikprøven. Traders kan evaluere og sammenligne præstationsresultaterne mellem in-sample og out-of-sample data.

Korrelation henviser til ligheder mellem præstationerne og de generelle trends i de to datasæt.Korrelationsmålinger kan bruges til evaluering af strategiske effektivitetsrapporter, der er oprettet i testperioden (en funktion, som de fleste handelsplatforme giver). Jo stærkere sammenhængen mellem de to, desto bedre er sandsynligheden for, at et system vil fungere godt i fremadprøveprøvning og live handel. Figur 2 illustrerer to forskellige systemer, der blev testet og optimeret på in-sample data, og derefter anvendt til data uden for prøve. Diagrammet til venstre viser et system, der klart var kurveformet til at fungere godt på dataene i stikprøven og fuldstændig mislykkedes på data uden for prøven. Diagrammet til højre viser et system, der har fungeret godt på både in- og ud-af-prøve data.

Figur 2: To egenkapitalkurver. Handelsdataene før hver gule pil repræsenterer prøveudprøvning. Handlerne, der genereres mellem de gule og røde pile, tyder på test uden for prøven. Handlerne efter de røde pile er fra de fremadrettede testfaser.

Hvis der er ringe sammenhæng mellem testen i stikprøve og ud af prøve, som det venstre diagram i figur 2, er det sandsynligt, at systemet er blevet overoptimeret og vil ikke fungere godt i livehandel. Hvis der er stærk korrelation i præstationen, som det ses i det rigtige diagram i figur 2, indebærer den næste fase af evalueringen en ekstra type test uden test, kendt som fremadrettet testprøvning. (For mere at læse om prognoser henvises til Finansielle prognoser: Den bayesiske metode .)

Basis for fremadrettede præstationsprøvninger Forward performance test, også kendt som papirhandel, giver forhandlere et andet sæt ud -af-stikdata, som skal evaluere et system. Forward performance test er en simulering af den faktiske handel og involverer at følge systemets logik i et live marked. Det kaldes også papirhandel, da alle handler udføres kun på papir; det vil sige, handelsposter og udgange dokumenteres sammen med ethvert overskud eller tab for systemet, men ingen egentlige handler udføres. Et vigtigt aspekt ved fremtidsprøvning er at følge systemets logik nøjagtigt; ellers bliver det vanskeligt, om ikke umuligt at evaluere dette trin af processen nøjagtigt. Handlende bør være ærlige om handel indgange og udgange og undgå adfærd som kirsebær picking handler eller ikke inkludere en handel på papir rationalisere at "Jeg ville aldrig har taget den handel." Hvis handel ville have fundet sted efter systemets logik, skal den dokumenteres og evalueres.

Mange mæglere tilbyder en simuleret handelskonto, hvor handler kan placeres og det tilsvarende resultat og tab beregnes. Ved hjælp af en simuleret handelskonto kan der skabes en semi-realistisk atmosfære, hvor man kan øve handel og vurdere systemet yderligere.

Figur 2 viser også resultaterne for fremadprøveprøvning på to systemer. Igen går det system, der er repræsenteret i venstre diagram, ikke godt ud over den indledende testning på in-sample data. Systemet, der vises i det rigtige diagram, fortsætter imidlertid med at fungere godt gennem alle faser, herunder fremadprøveprøvning.Et system, der viser positive resultater med en god sammenhæng mellem in-sample, out-of-sample og forward performance test, er klar til at blive implementeret på et levende marked.

Bundlinjen Backtesting er et værdifuldt værktøj til rådighed på de fleste handelsplatforme. At dele historiske data i flere sæt for at give stikprøve og prøveudprøvning kan give forhandlere et praktisk og effektivt middel til at evaluere en handelsidee og et system. Da de fleste handlende anvender optimeringsteknikker i backtesting, er det vigtigt at evaluere systemet på rene data for at bestemme dets rentabilitet. Hvis du fortsætter testen uden for prøve med fremadrettet test af ydeevne, er der et andet sikkerhedsniveau, inden du sætter et system i markedet, der risikerer rigtig kontanter. Positive resultater og god korrelation mellem in-sample og out-of-sample backtesting og forward performance test øger sandsynligheden for, at et system vil fungere godt i den faktiske handel. (For et omfattende overblik over teknisk analyse, se Teknisk analyse: Indledning .)