Eksponentiell flytende gjennomsnitt - EMA BREAKING DOWN Eksponensiell flytende gjennomsnitt - EMA De 12 og 26-dagers EMAene er de mest populære kortsiktige gjennomsnittene, og de brukes til å skape indikatorer som den flytende gjennomsnittlige konvergensdivergensen (MACD) og prosentvis prisoscillator (PPO). Generelt brukes 50- og 200-dagers EMAer som signaler for langsiktige trender. Traders som ansetter teknisk analyse, finner glidende gjennomsnitt veldig nyttige og innsiktige når de brukes riktig, men skaper kaos når de brukes feil eller blir feilfortolket. Alle de bevegelige gjennomsnittene som vanligvis brukes i teknisk analyse, er av sin natur sakende indikatorer. Følgelig bør konklusjonene fra å bruke et glidende gjennomsnitt til et bestemt markedskart være å bekrefte et markedskryss eller for å indikere dets styrke. Svært ofte, etter hvert har en glidende gjennomsnittlig indikatorlinje endret seg for å reflektere et betydelig trekk i markedet, og det optimale punktet for markedsinngang har allerede gått. En EMA tjener til å lette dette dilemmaet til en viss grad. Fordi EMA-beregningen plasserer mer vekt på de nyeste dataene, klemmer prishandlingen litt strammere og reagerer derfor raskere. Dette er ønskelig når en EMA brukes til å utlede et handelsinngangssignal. Tolke EMA Som alle bevegelige gjennomsnittsindikatorer, er de mye bedre egnet for trending markeder. Når markedet er i en sterk og vedvarende opptrinn. EMA-indikatorlinjen vil også vise en uptrend og vice versa for en nedtrend. En årvåken handelsmann vil ikke bare være oppmerksom på retningen til EMA-linjen, men også forholdet mellom endringshastigheten fra en linje til den neste. For eksempel, da prisvirkningen av en sterk opptrend begynner å flate og reversere, vil EMAs endringshastighet fra en linje til den neste begynne å redusere til den tid som indikatorlinjen flater og endringshastigheten er null. På grunn av den slanke effekten, ved dette punktet, eller til og med noen få barer før, bør prishandlingen allerede ha reversert. Det følger derfor at observere en konsistent reduksjon i endringshastigheten til EMA, kunne seg selv brukes som en indikator som ytterligere kunne motvirke dilemmaet forårsaket av den bølgende effekten av bevegelige gjennomsnitt. Vanlige bruksområder til EMA-EMAer brukes ofte i forbindelse med andre indikatorer for å bekrefte betydelige markedsbevegelser og å måle deres gyldighet. For handelsmenn som handler intradag og rasktflyttende markeder, er EMA mer anvendelig. Ofte bruker handelsmenn EMAer for å bestemme en handelspartiskhet. For eksempel, hvis en EMA på et daglig diagram viser en sterk oppadgående trend, kan en intradaghandlere strategi være å handle kun fra den lange siden på en intradagskart. EWMA-tilnærmingen har en attraktiv funksjon: det krever relativt lite lagrede data. For å oppdatere vårt estimat når som helst, trenger vi bare et tidligere estimat av variansraten og den nyeste observasjonsverdien. Et sekundært mål for EWMA er å følge endringer i volatiliteten. For små verdier, påvirker de siste observasjonene estimatet omgående. For verdier nærmere en, endres estimatet sakte basert på de siste endringene i avkastningen til den underliggende variabelen. RiskMetrics-databasen (produsert av JP Morgan og offentliggjort tilgjengelig) bruker EWMA med for oppdatering av daglig volatilitet. VIKTIG: EWMA-formelen antar ikke et langsiktig gjennomsnittlig variansnivå. Konseptet om volatilitet betyr at reversering ikke er fanget av EWMA. ARCHGARCH-modellene er bedre egnet til dette formålet. Et sekundært mål for EWMA er å spore forandringer i volatiliteten, så for små verdier påvirker siste observasjon estimatet omgående, og for verdier nærmere en, endres estimatet sakte til de siste endringene i avkastningen til den underliggende variabelen. RiskMetrics-databasen (produsert av JP Morgan) og offentliggjort i 1994, bruker EWMA-modellen til å oppdatere daglig volatilitetsestimat. Selskapet fant at over en rekke markedsvariabler, gir denne verdien prognosen for variansen som kommer nærmest til realisert variansrate. De realiserte variansene på en bestemt dag ble beregnet som et likevektt gjennomsnitt på de påfølgende 25 dagene. På samme måte, for å beregne den optimale verdien av lambda for datasettet, må vi beregne den realiserte volatiliteten på hvert punkt. Det finnes flere metoder, så velg en. Deretter beregner du summen av kvadratfeil (SSE) mellom EWMA estimat og realisert volatilitet. Endelig, minimer SSE ved å variere lambdaverdien. Høres enkelt Det er. Den største utfordringen er å bli enige om en algoritme for å beregne realisert volatilitet. For eksempel valgte folket på RiskMetrics de påfølgende 25 dagene for å beregne realisert variansrate. I ditt tilfelle kan du velge en algoritme som bruker daglig volum, HILO og eller OPEN-CLOSE priser. Spørsmål 1: Kan vi bruke EWMA til å estimere (eller prognose) volatilitet mer enn ett skritt foran EWMA-volatilitetsrepresentasjonen antar ikke en langsiktig gjennomsnittlig volatilitet, og dermed for enhver prognoshorisont utover ett trinn, returnerer EWMA en konstant verdi: Eksponentiell utjevning Eksponensiell utjevning er en teknikk som kan brukes på tidsseriedata, enten for å produsere glatt data for presentasjon, eller for å lage prognoser. Tidsseriedataene i seg selv er en sekvens av observasjoner. Det observerte fenomenet kan være en hovedsakelig tilfeldig prosess. eller det kan være en ordnet, men støyende. prosess. Mens i det enkle glidende gjennomsnittet blir de tidligere observasjonene vektet likt, eksponentiell utjevning tilordner eksponentielt avtagende vekter over tid. Eksponensiell utjevning er vanligvis brukt på finansmarkedet og økonomiske data, men det kan brukes med noen diskrete sett med gjentatte målinger. Den enkleste formen for eksponensiell utjevning bør bare brukes til data uten systematisk trend eller sesongbestandige komponenter. 1 Rå datasekvensen er ofte representert ved liktegning ved begynnelsen av tiden ltmathgtt 0ltmathgt, og utgangen av den eksponentielle utjevningsalgoritmen er vanligvis skrevet som ltmathgt ltmathgt, som kan betraktes som et best estimat av hva den neste verdien av ltmathgtxltmathgt vil være. Når sekvensen av observasjoner begynner på tidspunktet, blir den enkleste formen for eksponensiell utjevning gitt av formlene: 2 Løpende start s0amp x0 s amp alpha x (1-alfa) s, tgt0 ende ltmathgt hvor ltmathgtalphaltmathgt er utjevningsfaktoren. og det ble tatt i bruk. Bakgrunn Det enkle glidende gjennomsnittet Intuitivt, den enkleste måten å glatte en tidsserier på er å beregne et enkelt, eller uvevet, glidende gjennomsnitt. Den glatte statistikken s t er da bare gjennomsnittet av de siste k observasjonene: hvor valget av et heltall k 160gt1601 er vilkårlig. En liten verdi av k vil ha mindre utjevningseffekt og være mer lydhør overfor de siste endringene i dataene, mens en større k vil ha en større utjevningseffekt og gi et mer uttalt lag i den jevne sekvensen. En ulempe med denne teknikken er at den ikke kan brukes på de første k 1601-vilkårene i tidsseriene uten å tilføye verdier opprettet på andre måter. Dette betyr effektivt ekstrapolering utenfor eksisterende data, og gyldigheten av denne delen vil derfor være tvilsom og ikke en direkte representasjon av dataene. Det introduserer også en faseskift i dataene på halvvinduets lengde. For eksempel hvis dataene var alle de samme bortsett fra et høyt datapunkt, vil toppen i de glatte dataene vises en halv lengde i vinduet enn når det faktisk skjedde. Hvor fasen av resultatet er viktig, kan dette rett og slett korrigeres ved å skifte den resulterende serien tilbake med halvparten av vinduets lengde. En stor ulempe med SMA er at den lar gjennom en signifikant mengde signalet kortere enn vinduets lengde. Verre, det svinger faktisk det. Dette kan føre til uventede gjenstander, som topper i det glatte resultatet som vises der det var troughs i dataene. Det fører også til at resultatet blir mindre glatt enn forventet, siden noen av de høyere frekvensene ikke fjernes riktig. Det vektede glidende gjennomsnittet En litt mer komplisert metode for å utjevne en rå tidsserie xt, er å beregne et veid glidende gjennomsnitt ved først å velge et sett med vektningsfaktorer lbrace w1, w2, prikker, wk rbrace ltmathgt slik at ltmathgt sum k wn 1 ltmathgt og deretter bruke disse vekter for å beregne den glatte statistikken st: st sum k wn x w1xt w2x cdots wkx. ltmathgt I praksis blir vektningsfaktorene ofte valgt for å gi mer vekt til de nyeste betingelsene i tidsserien og mindre vekt til eldre data. Legg merke til at denne teknikken har samme ulempe som den enkle bevegelige gjennomsnittsteknikken (dvs. den kan ikke brukes før minst k observasjoner er gjort), og at det medfører en mer komplisert beregning ved hvert trinn av utjevningsprosedyren. I tillegg til denne ulempen kan det være vanskelig om det ikke er umulig å rekonstruere et endringssignal nøyaktig (fordi eldre prøver kan gis mindre vekt) hvis dataene fra hvert trinn av gjennomsnittet ikke er tilgjengelige for analyse. Hvis antall trinn manglet er kjent, kan vekting av verdier i gjennomsnittet justeres for å gi like vekt til alle ubesvarte prøver for å unngå dette problemet. Den eksponentielle glidende gjennomsnittlige eksponensielle utjevning ble først foreslått av Robert Goodell Brown i 1956, 3 og utvidet deretter av Charles C. Holt i 1957. 4 Formuleringen nedenfor, som er den som vanligvis er brukt, tilskrives Brown og kalles Browns Simple eksponensiell utjevning. 5 Den enkleste form for eksponensiell utjevning er gitt ved formelen: ltmathgtst alpha cdot x (1-alpha) cdot s ltmathgt. Hvor er utjevningsfaktoren. og 0160lt160160lt1601. Med andre ord er den glatte statistikken s t et enkelt veid gjennomsnitt av den nåværende observasjonen x t og den tidligere glatte statistikken s t 1. Begrepet utjevningsfaktor anvendt her er noe misvisende, da større verdier faktisk reduserer nivået av utjevning, og i begrensningssaken med 1 er utgangsserien bare den samme som den opprinnelige serien (med lag av en tidsenhet) . Enkel eksponensiell utjevning er lett å påføre, og det gir en glatt statistikk så snart to observasjoner er tilgjengelige. Verdier av nær en har mindre utjevningseffekt og gir større vekt på de siste endringene i dataene, mens verdier av nærmere null har en større utjevningseffekt og er mindre lydhør overfor de siste endringene. Det er ingen formelt korrekt prosedyre for å velge. Noen ganger er statistikernes dom brukt til å velge en passende faktor. Alternativt kan en statistisk teknikk brukes til å optimalisere verdien av. For eksempel kan metoden for minste kvadrater benyttes til å bestemme verdien av som summen av mengdene (s n -1 160160 x n -1) 2 er minimert. I motsetning til noen andre utjevningsmetoder krever denne teknikken ikke noe minimum antall observasjoner som skal gjøres før det begynner å produsere resultater. I praksis vil imidlertid et godt gjennomsnitt ikke oppnås før flere prøver har blitt gjennomsnittet sammen for eksempel, vil et konstant signal ta omtrent 3 trinn for å nå 95 av den faktiske verdien. For nøyaktig å rekonstruere opprinnelige signalet uten tap av informasjon, må alle stadier av eksponentielt glidende gjennomsnitt også være tilgjengelige, fordi eldre prøver forfall i vekt eksponentielt. Dette er i kontrast til et enkelt glidende gjennomsnitt, hvor noen prøver kan hoppes over uten så mye tap av informasjon på grunn av konstant vekting av prøver i gjennomsnittet. Hvis et kjent antall prøver vil bli savnet, kan man også justere et veid gjennomsnitt for dette ved å gi likevekt til den nye prøven og alle de som skal hoppes over. Denne enkle form for eksponensiell utjevning er også kjent som et eksponentielt vektet glidende gjennomsnitt (EWMA). Teknisk kan den også klassifiseres som en autoregressiv integrert glidende gjennomsnittlig (ARIMA) (0,1,1) modell uten konstant sikt. 6 Velge den innledende glatte verdien Merk at i den ovennevnte definisjonen s 1 initialiseres til x 0. Fordi eksponensiell utjevning krever at vi i hver fase har forrige prognose, er det ikke tydelig hvordan vi får metoden startet. Vi kan anta at den første prognosen er lik den opprinnelige verdien av etterspørselen, men denne tilnærmingen har en alvorlig ulempe. Eksponensiell utjevning legger stor vekt på tidligere observasjoner, så den opprinnelige verdien av etterspørselen vil ha en urimelig stor effekt på tidlige prognoser. Dette problemet kan løses ved å la prosessen utvikle seg i et rimelig antall perioder (10 eller mer) og bruke gjennomsnittet av etterspørselen i disse perioder som den første prognosen. Det er mange andre måter å sette denne innledende verdien på, men det er viktig å merke seg at jo mindre verdien av. Jo mer sensitive din prognose vil være på valget av denne første jevnere verdien s 1. 7 Optimalisering For hver eksponensiell utjevningsmetode må vi også velge verdien for utjevningsparametrene. For enkel eksponensiell utjevning er det bare én utjevningsparameter (), men for de metodene som følger er det vanligvis mer enn en utjevningsparameter. Det er tilfeller der utjevningsparametrene kan velges på en subjektiv måte, forutsigeren spesifiserer verdien av utjevningsparametrene basert på tidligere erfaring. En mer robust og objektiv måte å oppnå verdier for de ukjente parametrene som er inkludert i en eksponensiell utjevningsmetode er imidlertid å estimere dem fra de observerte dataene. De ukjente parametrene og startverdiene for en eksponensiell utjevningsmetode kan estimeres ved å minimere SSE. Feilene er spesifisert som ltmathgte y - hat ltmathgt for t1,, T (prognostiseringsfeilene for ett trinn fremover). Derfor finner vi verdiene til de ukjente parametrene og de innledende verdiene som minimerer. I motsetning til regresjonssaken (der vi har formler som returnerer verdiene til regresjonskoeffisientene som minimerer SSE), innebærer dette et ikke-lineært minimeringsproblem, og vi må bruke et optimaliseringsverktøy for å utføre dette. Hvorfor er det eksponentielt Ved direkte substitusjon av den definerende ligningen for enkel eksponensiell utjevning i seg selv finner vi det begynnelsen stempel alpha x (1-alfa) s 3pt amp alpha x alpha (1-alfa) x (1-alfa) 2 s 3pt amp alpha leftx (1-alfa) x (1-alfa) 2 x (1-alfa) 3 x cdots (1-alfa) x høyre (1-alfa) x0. slutten ltmathgt Med andre ord, ettersom tiden går over den glatte statistikken, blir t det vektede gjennomsnittet av et større og større antall av de tidligere observasjonene x tn. og vektene som er tilordnet tidligere observasjoner, er generelt proporsjonale med betingelsene for den geometriske progresjonen. En geometrisk progresjon er den diskrete versjonen av en eksponentiell funksjon. så dette er hvor navnet på denne utjevningsmetoden oppsto. Sammenligning med glidende gjennomsnitt Eksponentiell utjevning og glidende gjennomsnitt har tilsvarende feil ved å innføre et lag i forhold til inngangsdataene. Selv om dette kan korrigeres ved å flytte resultatet med halvparten av vinduets lengde for en symmetrisk kjernen, for eksempel et glidende gjennomsnitt eller gauss, er det uklart hvor passende dette ville være for eksponensiell utjevning. De har begge begge omtrent den samme fordeling av prognosefeil når 2 (k1). De adskiller seg i at eksponensiell utjevning tar hensyn til alle tidligere data, mens glidende gjennomsnitt bare tar hensyn til k forbi datapunkter. Beregningsmessig snakker de også forskjellig i at glidende gjennomsnitt krever at de siste k datapunkter holdes, mens eksponensiell utjevning bare trenger den siste prognosen som skal holdes. 9 Dobbel eksponensiell utjevning Enkel eksponensiell utjevning går ikke bra når det er en trend i dataene. 2 I slike situasjoner ble flere metoder utarbeidet under navnet dobbel eksponensiell utjevning eller eksponensiell utjevning i andre rekkefølge. 10 Den grunnleggende ideen bak dobbel eksponensiell utjevning er å introdusere et begrep som tar hensyn til muligheten for at en serie utviser noen form for trend. Denne hellingskomponenten er selv oppdatert via eksponensiell utjevning. En metode, som iblant refereres til som Holt-Winters dobbel eksponensiell utjevning 11, virker som følger: 12 Igjen er den rå datasekvensen av observasjoner representert ved x t, begynner på tidspunktet t 1601600. Vi bruker s t til å representere den glatte verdien for tid t. og b t er vårt beste estimat av trenden på tidspunktet t. Utgangen av algoritmen er nå skrevet som F tm. et estimat av verdien av x på tidspunktet tm, mgt0 basert på rå data opp til tid t. Dobbel eksponensiell utjevning er gitt av formlene begynner s1amp x1 b1amp x1 - x0 ende Og for t gt 1 ved ltmathgt hvor er datautjevningsfaktoren. 0160lt160160lt1601, og er trendutjevningsfaktoren. 0160lt160160lt1601. start F amp st mbt end ltmathgt Innstilling av startverdi b 0 er et spørsmål om preferanse. Et annet alternativ enn det som er oppført ovenfor, er (x n - x 0) n for noen n160gt1601. Merk at F 0 er udefinert (det er ingen estimering for tid 0), og i henhold til definisjonen F 1 s 0 b 0. som er godt definert, og dermed ytterligere verdier kan evalueres. En andre metode, referert til som Browns lineær eksponensiell utjevning (LES) eller Browns dobbel eksponensiell utjevning virker som følger. 13 begynner s0amp x0 s 0amp x0 s amp alpha x (1-alfa) s alfa s (1-alfa) s F amp ved mbt, slutt ltmathgt hvor en t. det estimerte nivået ved tid t og b t. Den estimerte trenden ved tid t er: start atamp 2st - s t btamp frac alpha (st - s t). end ltmathgt Trippel eksponensiell utjevning Tredobbelt eksponensiell utjevning tar hensyn til sesongmessige endringer, samt trender. Sesonglighet er nektet å være tendensen til tidsseriedata for å vise oppførsel som gjentar seg hver L-periode. Begrepet sesong er brukt til å representere tidsperioden før oppførsel begynner å gjenta seg selv. Det finnes ulike typer sesongmessighet: mutiplikativ og additiv i naturen. Hvis vi hver måned i desember selger 10.000 flere leiligheter som vi gjør i november, er sesongene additiv i naturen. Kan representeres av en absolutt økning. Men hvis vi selger 10 flere leiligheter i sommermånedene enn vi gjør i vintermånedene, er sesongmessigheten mutiplicativ i naturen. Mutiplicative seasonality kan representeres som en konstant faktor, ikke en absolutt mengde. 14 Trippel eksponensiell utjevning ble først foreslått av Holts-student, Peter Winters, i 1960. 15 Anta at vi har en sekvens av observasjoner x t, som begynner på tidspunktet t 1601600 med en syklus med sesongmessig endring av lengde L. Metoden beregner en trendlinje for dataene, så vel som sesongindekser som vekterer verdiene i trendlinjen basert på hvor tidspunktet faller i lengden av syklusen L. s t representerer den glatte verdien av den konstante delen for tiden t. b t representerer sekvensen av beste estimater av den lineære trenden som legges over på sesongmessige endringer. c t er sekvensen av sesongmessige korreksjonsfaktorer. c t er den forventede andelen av den forutsagte trenden når som helst t mod L i syklusen som observasjonene påtar seg. Som en tommelfingerregel er det nødvendig med minst to fulle sesonger (eller 2 l perioder) av historiske data for å initialisere et sett med sesongmessige faktorer. Utgangen av algoritmen skrives igjen som F tm. et estimat av verdien av x på tidspunktet tm, mgt0 basert på rå data opp til tid t. Tredobbelt eksponensiell utjevning er gitt ved formlene 2 hvor er datautjevningsfaktoren. 0160lt160160lt1601, er trendutjevningsfaktoren. 0160lt160160lt1601, og er sesongmessig forandringsutjevningsfaktor. 0160lt160160lt1601. Den generelle formelen for innledende trendestimat b 0 er: Stille inn de første estimatene for sesongindeksene c i for 1,2. L er litt mer involvert. Hvis N er antall komplette sykluser i dataene dine, så: start ciamp frac sum frac quad forall iamp 1,2, ldots, L end ltmathgt hvor begynner Ajamp frac x quad forall jamp 1,2, ldots, N end ltmathgt Note at A j er gjennomsnittsverdien av x i j t-syklusen til dataene dine. Gjennomsnittlige og eksponensielle utjevningsmodeller Som et første skritt i å bevege seg utover gjennomsnittlige modeller, kan random walk-modeller og lineære trendmodeller, nonseasonal mønstre og trender ekstrapoleres bruker en flytende gjennomsnitt eller utjevningsmodell. Den grunnleggende forutsetningen bak gjennomsnittlige og utjevningsmodeller er at tidsseriene er lokalt stasjonære med et sakte varierende middel. Derfor tar vi et flytende (lokalt) gjennomsnitt for å anslå dagens verdi av gjennomsnittet, og deretter bruke det som prognosen for nær fremtid. Dette kan betraktes som et kompromiss mellom den gjennomsnittlige modellen og den tilfeldige-walk-uten-drift-modellen. Den samme strategien kan brukes til å estimere og ekstrapolere en lokal trend. Et glidende gjennomsnitt kalles ofte en quotsmoothedquot-versjon av den opprinnelige serien, fordi kortsiktig gjennomsnittsverdi medfører utjevning av støtene i den opprinnelige serien. Ved å justere graden av utjevning (bredden på det bevegelige gjennomsnittet), kan vi håpe å finne en slags optimal balanse mellom ytelsen til de gjennomsnittlige og tilfeldige turmodellene. Den enkleste typen gjennomsnittlig modell er. Enkel (likevektet) Flytende gjennomsnitt: Værvarselet for verdien av Y på tidspunktet t1 som er laget på tidspunktet t, er det enkle gjennomsnittet av de nyeste m-observasjonene: (Her og andre steder vil jeg bruke symbolet 8220Y-hat8221 til å stå for en prognose av tidsserien Y som ble gjort så tidlig som mulig ved en gitt modell.) Dette gjennomsnittet er sentrert ved period-t (m1) 2, noe som innebærer at estimatet av det lokale middel vil ha en tendens til å ligge bak den sanne verdien av det lokale gjennomsnittet med ca. (m1) 2 perioder. Således sier vi at gjennomsnittsalderen for dataene i det enkle glidende gjennomsnittet er (m1) 2 i forhold til perioden for prognosen beregnes. Dette er hvor lang tid det vil være å prognostisere prognoser bak vendepunkter i dataene . For eksempel, hvis du er i gjennomsnitt de siste 5 verdiene, vil prognosene være omtrent 3 perioder sent i å svare på vendepunkter. Merk at hvis m1, den enkle glidende gjennomsnittlige (SMA) modellen er lik den tilfeldige turmodellen (uten vekst). Hvis m er veldig stor (sammenlignbar med lengden på estimeringsperioden), svarer SMA-modellen til den gjennomsnittlige modellen. Som med hvilken som helst parameter i en prognosemodell, er det vanlig å justere verdien av k for å oppnå den beste kvote kvoten til dataene, dvs. de minste prognosefeilene i gjennomsnitt. Her er et eksempel på en serie som ser ut til å vise tilfeldige svingninger rundt et sakte varierende middel. Først kan vi prøve å passe den med en tilfeldig walk-modell, noe som tilsvarer et enkelt bevegelige gjennomsnitt på 1 sikt: Den tilfeldige turmodellen reagerer veldig raskt på endringer i serien, men i så måte velger den mye av kvotenivået i data (tilfeldige svingninger) samt quotsignalquot (det lokale gjennomsnittet). Hvis vi i stedet prøver et enkelt glidende gjennomsnitt på 5 termer, får vi et smidigere sett med prognoser: Det 5-tiden enkle glidende gjennomsnittet gir betydelig mindre feil enn den tilfeldige turmodellen i dette tilfellet. Gjennomsnittsalderen for dataene i denne prognosen er 3 ((51) 2), slik at den har en tendens til å ligge bak vendepunktene med tre perioder. (For eksempel ser det ut til at en nedtur har skjedd i perioden 21, men prognosene vender seg ikke til flere perioder senere.) Legg merke til at de langsiktige prognosene fra SMA-modellen er en horisontal rettlinje, akkurat som i tilfeldig gang modell. Således antar SMA-modellen at det ikke er noen trend i dataene. Mens prognosene fra den tilfeldige turmodellen ganske enkelt er lik den siste observerte verdien, er prognosene fra SMA-modellen lik et veid gjennomsnitt av de siste verdiene. De konfidensgrenser som beregnes av Statgraphics for de langsiktige prognosene for det enkle glidende gjennomsnittet, blir ikke større da prognoseperioden øker. Dette er åpenbart ikke riktig. Dessverre er det ingen underliggende statistisk teori som forteller oss hvordan konfidensintervallene skal utvide seg for denne modellen. Det er imidlertid ikke så vanskelig å beregne empiriske estimater av konfidensgrensene for lengre horisontprognoser. For eksempel kan du sette opp et regneark der SMA-modellen skulle brukes til å prognose 2 trinn foran, 3 trinn fremover, etc. i den historiske dataprøven. Du kan deretter beregne utvalgsstandardavvikene til feilene i hver prognosehorisont, og deretter konstruere konfidensintervaller for langsiktige prognoser ved å legge til og trekke ut multipler av riktig standardavvik. Hvis vi prøver et 9-sikt enkelt glidende gjennomsnitt, får vi enda jevnere prognoser og mer av en bremseeffekt: Gjennomsnittsalderen er nå 5 perioder (91) 2). Hvis vi tar et 19-årig glidende gjennomsnitt, øker gjennomsnittsalderen til 10: Legg merke til at prognosene nå faller bakom vendepunkter med ca 10 perioder. Hvilken mengde utjevning er best for denne serien Her er et bord som sammenligner feilstatistikken sin, også et gjennomsnitt på tre sikt: Modell C, 5-års glidende gjennomsnitt, gir den laveste verdien av RMSE med en liten margin over 3 term og 9-sikt gjennomsnitt, og deres andre statistikker er nesten identiske. Så, blant modeller med svært like feilstatistikk, kan vi velge om vi foretrekker litt mer respons eller litt mer glatt i prognosene. (Tilbake til toppen av siden.) Browns Simple Exponential Smoothing (eksponentielt vektet glidende gjennomsnitt) Den enkle glidende gjennomsnittsmodellen beskrevet ovenfor har den uønskede egenskapen som den behandler de siste k-observasjonene, like og fullstendig ignorerer alle foregående observasjoner. Intuitivt bør tidligere data diskonteres på en mer gradvis måte - for eksempel bør den siste observasjonen få litt mer vekt enn 2. siste, og den 2. siste skal få litt mer vekt enn den 3. siste, og så videre. Den enkle eksponensielle utjevning (SES) - modellen oppnår dette. La 945 betegne en quotsmoothing constantquot (et tall mellom 0 og 1). En måte å skrive modellen på er å definere en serie L som representerer dagens nivå (dvs. lokal middelverdi) av serien som estimert fra data til nå. Verdien av L ved tid t beregnes rekursivt fra sin egen tidligere verdi slik: Således er den nåværende glattede verdien en interpolering mellom den forrige glattede verdien og den nåværende observasjonen, hvor 945 styrer nærheten til den interpolerte verdien til den nyeste observasjon. Forventningen for neste periode er bare den nåværende glatte verdien: Tilsvarende kan vi uttrykke neste prognose direkte i forhold til tidligere prognoser og tidligere observasjoner, i en hvilken som helst av de tilsvarende versjoner. I den første versjonen er prognosen en interpolasjon mellom forrige prognose og tidligere observasjon: I den andre versjonen blir neste prognose oppnådd ved å justere forrige prognose i retning av den forrige feilen med en brøkdel av 945. Er feilen gjort ved tid t. I den tredje versjonen er prognosen et eksponentielt vektet (dvs. nedsatt) glidende gjennomsnitt med rabattfaktor 1-945: Interpolasjonsversjonen av prognoseformelen er den enkleste å bruke hvis du implementerer modellen på et regneark: det passer inn i en enkeltcelle og inneholder cellehenvisninger som peker på forrige prognose, forrige observasjon og cellen der verdien av 945 er lagret. Merk at hvis 945 1 er SES-modellen tilsvarer en tilfeldig turmodell (uten vekst). Hvis 945 0 er SES-modellen ekvivalent med den gjennomsnittlige modellen, forutsatt at den første glattede verdien er satt lik gjennomsnittet. (Gå tilbake til toppen av siden.) Gjennomsnittsalderen for dataene i prognosen for enkel eksponensiell utjevning er 1 945 i forhold til perioden for prognosen beregnes. (Dette skal ikke være åpenbart, men det kan enkelt vises ved å vurdere en uendelig serie.) Derfor har den enkle, glidende gjennomsnittlige prognosen en tendens til å ligge bak vendepunktene med rundt 1 945 perioder. For eksempel, når 945 0,5 lag er 2 perioder når 945 0.2 lag er 5 perioder når 945 0,1 lag er 10 perioder, og så videre. For en gitt gjennomsnittlig alder (det vil si mengden lag), er prognosen for enkel eksponensiell utjevning (SES) noe bedre enn SMA-prognosen (Simple Moving Average) fordi den legger relativt mer vekt på den siste observasjonen - dvs. det er litt mer quotresponsivequot for endringer som oppstod i den siste tiden. For eksempel har en SMA-modell med 9 vilkår og en SES-modell med 945 0,2 begge en gjennomsnittlig alder på 5 for dataene i prognosene, men SES-modellen legger mer vekt på de siste 3 verdiene enn SMA-modellen og ved Samtidig er det ikke 8220forget8221 om verdier som er mer enn 9 år gamle, som vist i dette diagrammet. En annen viktig fordel ved SES-modellen over SMA-modellen er at SES-modellen bruker en utjevningsparameter som er kontinuerlig variabel, slik at den lett kan optimaliseres ved å bruke en quotsolverquot-algoritme for å minimere den gjennomsnittlige kvadratfeilen. Den optimale verdien av 945 i SES-modellen for denne serien viser seg å være 0,2961, som vist her: Gjennomsnittsalderen for dataene i denne prognosen er 10,2961 3,4 perioder, noe som ligner på et 6-sikt enkelt glidende gjennomsnitt. De langsiktige prognosene fra SES-modellen er en horisontal rett linje. som i SMA-modellen og den tilfeldige turmodellen uten vekst. Vær imidlertid oppmerksom på at konfidensintervallene som beregnes av Statgraphics, divergerer nå på en rimelig måte, og at de er vesentlig smalere enn konfidensintervallene for den tilfeldige turmodellen. SES-modellen antar at serien er noe mer forutsigbar enn den tilfeldige turmodellen. En SES-modell er faktisk et spesielt tilfelle av en ARIMA-modell. slik at den statistiske teorien om ARIMA-modeller gir et solid grunnlag for beregning av konfidensintervall for SES-modellen. Spesielt er en SES-modell en ARIMA-modell med en ikke-sesongforskjell, en MA (1) og ikke en konstant periode. ellers kjent som en quotARIMA (0,1,1) modell uten constantquot. MA (1) - koeffisienten i ARIMA-modellen tilsvarer mengden 1-945 i SES-modellen. For eksempel, hvis du passer på en ARIMA (0,1,1) modell uten konstant til serien analysert her, viser den estimerte MA (1) - koeffisienten seg å være 0,7029, som er nesten nøyaktig en minus 0,2961. Det er mulig å legge til antagelsen om en konstant lineær trend uten null som en SES-modell. For å gjøre dette oppgir du bare en ARIMA-modell med en ikke-sesongforskjell og en MA (1) - sikt med en konstant, dvs. en ARIMA-modell (0,1,1) med konstant. De langsiktige prognosene vil da ha en trend som er lik den gjennomsnittlige trenden observert over hele estimeringsperioden. Du kan ikke gjøre dette i forbindelse med sesongjustering, fordi sesongjusteringsalternativene er deaktivert når modelltypen er satt til ARIMA. Du kan imidlertid legge til en konstant langsiktig eksponensiell trend for en enkel eksponensiell utjevningsmodell (med eller uten sesongjustering) ved å bruke inflasjonsjusteringsalternativet i prognoseprosedyren. Den aktuelle kvoteringskvoten (prosentvekst) per periode kan estimeres som hellingskoeffisienten i en lineær trendmodell som er montert på dataene i forbindelse med en naturlig logaritme transformasjon, eller det kan være basert på annen uavhengig informasjon om langsiktige vekstutsikter . (Tilbake til toppen av siden.) Browns Lineær (dvs. dobbel) Eksponensiell utjevning SMA-modellene og SES-modellene antar at det ikke er noen trend av noe slag i dataene (som vanligvis er OK eller i det minste ikke altfor dårlig for 1- trinnvise prognoser når dataene er relativt støyende), og de kan modifiseres for å inkorporere en konstant lineær trend som vist ovenfor. Hva med kortsiktige trender Hvis en serie viser en varierende vekstnivå eller et syklisk mønster som skiller seg tydelig ut mot støyen, og hvis det er behov for å prognose mer enn 1 periode framover, kan estimering av en lokal trend også være et problem. Den enkle eksponensielle utjevningsmodellen kan generaliseres for å oppnå en lineær eksponensiell utjevning (LES) modell som beregner lokale estimater av både nivå og trend. Den enkleste tidsvarierende trendmodellen er Browns lineær eksponensiell utjevningsmodell, som bruker to forskjellige glatte serier som er sentrert på forskjellige tidspunkter. Forutsigelsesformelen er basert på en ekstrapolering av en linje gjennom de to sentrene. (En mer sofistikert versjon av denne modellen, Holt8217s, blir diskutert nedenfor.) Den algebraiske form av Brown8217s lineær eksponensiell utjevningsmodell, som den enkle eksponensielle utjevningsmodellen, kan uttrykkes i en rekke forskjellige, men liknende former. Denne standardmodellen er vanligvis uttrykt som følger: La S betegne den enkeltglattede serien som er oppnådd ved å anvende enkel eksponensiell utjevning til serie Y. Dvs. verdien av S ved period t er gitt av: (Husk at, under enkle eksponensiell utjevning, dette ville være prognosen for Y ved periode t1.) Lad deretter Squot betegne den dobbeltslettede serien oppnådd ved å anvende enkel eksponensiell utjevning (ved hjelp av samme 945) til serie S: Endelig prognosen for Y tk. for noe kgt1, er gitt av: Dette gir e 1 0 (det vil si lure litt, og la den første prognosen være den samme første observasjonen) og e 2 Y 2 8211 Y 1. hvoretter prognosene genereres ved å bruke ligningen ovenfor. Dette gir de samme monterte verdiene som formelen basert på S og S dersom sistnevnte ble startet med S 1 S 1 Y 1. Denne versjonen av modellen brukes på neste side som illustrerer en kombinasjon av eksponensiell utjevning med sesongjustering. Holt8217s Lineær eksponensiell utjevning Brown8217s LES-modell beregner lokale estimater av nivå og trend ved å utjevne de siste dataene, men det faktum at det gjør det med en enkelt utjevningsparameter, stiller en begrensning på datamønstrene som den kan passe: nivået og trenden er ikke tillatt å variere til uavhengige priser. Holt8217s LES-modellen løser dette problemet ved å inkludere to utjevningskonstanter, en for nivået og en for trenden. Til enhver tid t, som i Brown8217s modell, er det et estimat L t på lokalt nivå og et estimat T t av den lokale trenden. Her beregnes de rekursivt fra verdien av Y observert ved tid t og de forrige estimatene av nivået og trenden ved to likninger som gjelder eksponensiell utjevning til dem separat. Hvis estimert nivå og trend ved tid t-1 er L t82091 og T t-1. henholdsvis, da var prognosen for Y tshy som ville vært gjort på tidspunktet t-1, lik L t-1 T t-1. Når den faktiske verdien er observert, beregnes det oppdaterte estimatet av nivået rekursivt ved å interpolere mellom Y tshy og dens prognose, L t-1 T t 1, med vekt på 945 og 1- 945. Forandringen i estimert nivå, nemlig L t 8209 L t82091. kan tolkes som en støyende måling av trenden på tidspunktet t. Det oppdaterte estimatet av trenden beregnes deretter rekursivt ved å interpolere mellom L t 8209 L t82091 og det forrige estimatet av trenden, T t-1. ved bruk av vekter av 946 og 1-946: Fortolkningen av trend-utjevningskonstanten 946 er analog med den for nivåutjevningskonstanten 945. Modeller med små verdier på 946 antar at trenden bare endrer seg veldig sakte over tid, mens modeller med større 946 antar at det endrer seg raskere. En modell med en stor 946 mener at den fjerne fremtiden er veldig usikker, fordi feil i trendberegning blir ganske viktig når det regnes med mer enn en periode framover. (Tilbake til toppen av siden.) Utjevningskonstantene 945 og 946 kan estimeres på vanlig måte ved å minimere gjennomsnittlig kvadratfeil i de 1-trinns prognosene. Når dette gjøres i Statgraphics, viser estimatene seg å være 945 0.3048 og 946 0.008. Den svært små verdien av 946 betyr at modellen tar svært liten endring i trenden fra en periode til den neste, så i utgangspunktet prøver denne modellen å estimere en langsiktig trend. I analogi med begrepet gjennomsnittlig alder av dataene som brukes til å estimere det lokale nivået i serien, er gjennomsnittsalderen for dataene som brukes til estimering av lokal trenden, proporsjonal med 1 946, men ikke akkurat lik den . I dette tilfellet viser det seg å være 10 006 125. Dette er et svært nøyaktig tall, forutsatt at nøyaktigheten av estimatet av 946 er virkelig 3 desimaler, men det er av samme generelle størrelsesorden som prøvestørrelsen på 100, så denne modellen er i gjennomsnitt over ganske mye historie i estimering av trenden. Prognoseplanet nedenfor viser at LES-modellen anslår en litt større lokal trend i slutten av serien enn den konstante trenden som er estimert i SEStrend-modellen. Også den estimerte verdien på 945 er nesten identisk med den som oppnås ved å montere SES-modellen med eller uten trend, så dette er nesten den samme modellen. Nå ser disse ut som rimelige prognoser for en modell som skal estimere en lokal trend. Hvis du 8220eyeball8221 ser dette, ser det ut som om den lokale trenden har vendt nedover på slutten av serien. Hva har skjedd Parametrene til denne modellen har blitt estimert ved å minimere den kvadriske feilen på 1-trinns prognoser, ikke langsiktige prognoser, i hvilket tilfelle trenden gjør ikke en stor forskjell. Hvis alt du ser på er 1-trinns feil, ser du ikke det større bildet av trender over (si) 10 eller 20 perioder. For å få denne modellen mer i tråd med øyehals ekstrapoleringen av dataene, kan vi manuelt justere trendutjevningskonstanten slik at den bruker en kortere basislinje for trendestimering. Hvis vi for eksempel velger å sette 946 0,1, er gjennomsnittsalderen for dataene som brukes til å estimere den lokale trenden 10 perioder, noe som betyr at vi gjennomsnittsverdi trenden over de siste 20 perioder eller så. Here8217s hva prognosen tomten ser ut hvis vi setter 946 0,1 mens du holder 945 0.3. Dette ser intuitivt fornuftig ut på denne serien, selv om det er sannsynlig farlig å ekstrapolere denne trenden mer enn 10 perioder i fremtiden. Hva med feilstatistikken Her er en modell sammenligning for de to modellene vist ovenfor, samt tre SES-modeller. Den optimale verdien av 945. For SES-modellen er ca. 0,3, men tilsvarende resultater (med henholdsvis litt mer responstid) oppnås med 0,5 og 0,2. (A) Holts lineær eksp. utjevning med alfa 0,3048 og beta 0,008 (B) Holts lineær eksp. utjevning med alfa 0,3 og beta 0,1 (C) Enkel eksponensiell utjevning med alfa 0,5 (D) Enkel eksponensiell utjevning med alfa 0,3 (E) Enkel eksponensiell utjevning med alfa 0,2 Deres statistikk er nesten identisk, slik at vi virkelig kan velge på grunnlag av 1-trinns prognosefeil i dataprøven. Vi må falle tilbake på andre hensyn. Hvis vi sterkt tror at det er fornuftig å basere dagens trendoverslag på hva som har skjedd i løpet av de siste 20 perioder eller så, kan vi gjøre en sak for LES-modellen med 945 0,3 og 946 0,1. Hvis vi ønsker å være agnostiker om det er en lokal trend, kan en av SES-modellene være enklere å forklare, og vil også gi mer mid-of-the-road prognoser for de neste 5 eller 10 periodene. (Tilbake til toppen av siden.) Hvilken type trend-ekstrapolering er best: Horisontal eller lineær Empirisk bevis tyder på at hvis dataene allerede er justert (om nødvendig) for inflasjon, kan det være uhensiktsmessig å ekstrapolere kortsiktig lineær trender veldig langt inn i fremtiden. Trender som tyder på i dag, kan løsne seg i fremtiden på grunn av ulike årsaker som forverring av produkt, økt konkurranse og konjunkturnedganger eller oppgang i en bransje. Av denne grunn utfører enkel eksponensiell utjevning ofte bedre ut av prøven enn det ellers kunne forventes, til tross for sin kvadratiske kvadratiske horisontal trend-ekstrapolering. Dampede trendmodifikasjoner av den lineære eksponensielle utjevningsmodellen brukes også i praksis til å introdusere en konservatismeddel i sine trendprognoser. Den demonstrede LES-modellen kan implementeres som et spesielt tilfelle av en ARIMA-modell, spesielt en ARIMA-modell (1,1,2). Det er mulig å beregne konfidensintervall rundt langsiktige prognoser produsert av eksponentielle utjevningsmodeller, ved å betrakte dem som spesielle tilfeller av ARIMA-modeller. (Pass på: ikke alle programmer beregner konfidensintervaller for disse modellene riktig.) Bredden på konfidensintervaller avhenger av (i) RMS-feilen i modellen, (ii) type utjevning (enkel eller lineær) (iii) verdien (e) av utjevningskonstanten (e) og (iv) antall perioder fremover du forutsetter. Generelt sprer intervallene raskere da 945 blir større i SES-modellen, og de sprer seg mye raskere når lineær snarere enn enkel utjevning brukes. Dette emnet blir diskutert videre i ARIMA-modellene i notatene. (Gå tilbake til toppen av siden.)
Comments
Post a Comment