1 4 Enkel Flytte Gjennomsnitt


Flytte gjennomsnitt Gjeldende gjennomsnitt Med konvensjonelle datasett er gjennomsnittlig verdi ofte den første, og en av de mest nyttige, oppsummerte statistikkene for å beregne. Når data er i form av en tidsserie, er seriemengden et nyttig mål, men reflekterer ikke dataens dynamiske natur. Gjennomsnittlige verdier som beregnes over kortere perioder, enten før den nåværende perioden eller sentrert i den nåværende perioden, er ofte mer nyttige. Fordi slike middelverdier vil variere, eller flytte, som den nåværende perioden beveger seg fra tid t 2, t 3. etc. er de kjent som bevegelige gjennomsnitt (Mas). Et enkelt glidende gjennomsnitt er (typisk) det uveide gjennomsnittet av k tidligere verdier. Et eksponentielt vektet glidende gjennomsnitt er i det vesentlige det samme som et enkelt glidende gjennomsnitt, men med bidrag til gjennomsnittet vektet av deres nærhet til gjeldende tid. Fordi det ikke er en, men en hel rekke bevegelige gjennomsnittsverdier for en gitt serie, kan settet Mas selv bli plottet på grafer, analysert som en serie, og brukes til modellering og prognoser. En rekke modeller kan bygges ved hjelp av bevegelige gjennomsnitt, og disse er kjent som MA-modeller. Hvis slike modeller er kombinert med autoregressive (AR) modeller, er de resulterende komposittmodellene kjent som ARMA - eller ARIMA-modeller (jeg er for integrert). Enkle bevegelige gjennomsnitt Siden en tidsserie kan betraktes som et sett med verdier, kan t 1,2,3,4, n gjennomsnittet av disse verdiene beregnes. Hvis vi antar at n er ganske stor, og vi velger et heltall k som er mye mindre enn n. vi kan beregne et sett med blokk gjennomsnitt eller enkle bevegelige gjennomsnitt (av rekkefølge k): Hvert mål representerer gjennomsnittet av dataverdiene over et intervall av k observasjoner. Merk at den første mulige MA for ordre k gt0 er den for t k. Mer generelt kan vi slippe det ekstra abonnementet i uttrykkene ovenfor og skrive: Dette sier at estimert gjennomsnitt på tidspunktet t er det enkle gjennomsnittet av den observerte verdien ved tid t og de foregående k -1-trinnene. Hvis det legges vekt på som reduserer bidraget til observasjoner som er lengre bort i tiden, sies det glidende gjennomsnittet å være eksponensielt jevnt. Flytende gjennomsnitt blir ofte brukt som en form for prognoser, hvorved estimert verdi for en serie på tiden t 1, S t1. er tatt som MA for perioden til og med tiden t. f. eks dagens estimat er basert på et gjennomsnitt av tidligere registrerte verdier fram til og med gårdager (for daglige data). Enkle bevegelige gjennomsnitt kan ses som en form for utjevning. I eksemplet som er vist nedenfor, er luftforurensningsdatasettet vist i introduksjonen til dette emnet blitt utvidet med en 7-dagers glidende gjennomsnittlig (MA) - linje, vist her i rødt. Som det ser ut, jevner MA-linjen ut toppene og troughene i dataene og kan være svært nyttig når det gjelder å identifisere trender. Standard forward-beregning formel betyr at de første k -1 datapunktene ikke har noen MA-verdi, men deretter utvider beregningene til det endelige datapunktet i serien. PM10 daglige middelverdier, Greenwich kilde: London Air Quality Network, londonair. org. uk En grunn til å beregne enkle bevegelige gjennomsnitt på måten som er beskrevet er at det gjør det mulig å beregne verdier for alle tidsluker fra tid tk frem til i dag, og Som en ny måling er oppnådd for tid t 1, kan MA for tid t 1 legges til settet som allerede er beregnet. Dette gir en enkel prosedyre for dynamiske datasett. Det er imidlertid noen problemer med denne tilnærmingen. Det er rimelig å argumentere for at gjennomsnittsverdien i løpet av de siste 3 periodene skal være plassert ved tidspunktet t -1, ikke tiden t. og for en MA over et jevnt antall perioder, bør det kanskje ligge midt mellom to tidsintervaller. En løsning på dette problemet er å bruke sentrale MA beregninger, der MA på tidspunktet t er gjennomsnittet av et symmetrisk sett med verdier rundt t. Til tross for det åpenbare meritter, er denne tilnærmingen ikke vanligvis brukt fordi det krever at data er tilgjengelig for fremtidige hendelser, noe som kanskje ikke er tilfelle. I tilfeller der analysen er helt av en eksisterende serie, kan bruk av sentrert Mas være å foretrekke. Enkle bevegelige gjennomsnitt kan betraktes som en form for utjevning, fjerne noen høyfrekvente komponenter i en tidsserie og markere (men ikke fjerne) trender på samme måte som det generelle begrepet digital filtrering. Faktisk er glidende gjennomsnitt en form for lineært filter. Det er mulig å bruke en bevegelig gjennomsnittsberegning til en serie som allerede har blitt utjevnet, dvs. utjevning eller filtrering av en allerede glatt serie. For eksempel, med et bevegelige gjennomsnitt på rekkefølge 2, kan vi betrakte det som beregnet ved hjelp av vekter, så MA ved x 2 0,5 x 1 0,5 x 2. På samme måte MA på x 3 0,5 x 2 0,5 x 3. Hvis vi bruk et andre nivå av utjevning eller filtrering, vi har 0,5 x 2 0,5 x 3 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dvs. 2-trinns filtrering prosess (eller convolution) har produsert et variabelt vektet symmetrisk glidende gjennomsnitt, med vekter. Flere konvolutter kan produsere ganske komplekse vektede glidende gjennomsnitt, hvorav noen har blitt funnet å være særlig bruk i spesialiserte felt, som for eksempel i livsforsikringsberegninger. Flytte gjennomsnitt kan brukes til å fjerne periodiske effekter dersom det beregnes med periodikkets lengde som kjent. For eksempel, med månedlige data kan sesongvariasjoner ofte fjernes (hvis dette er målet) ved å bruke et symmetrisk 12-måneders glidende gjennomsnitt med alle månedene vektet likt, bortsett fra det første og det siste som veies med 12. Dette skyldes at det vil være 13 måneder i den symmetriske modellen (nåværende tid, t. - 6 måneder). Summen er delt med 12. Lignende prosedyrer kan vedtas for en veldefinert periodicitet. Eksponentielt vektede glidende gjennomsnitt (EWMA) Med den enkle glidende gjennomsnittsformelen: Alle observasjoner er likevektede. Hvis vi kalte disse likevektene, alfa t. hver av k-vekter vil være lik 1 k. så summen av vektene ville være 1, og formelen ville være: Vi har allerede sett at flere applikasjoner av denne prosessen resulterer i at vektene varierer. Med eksponentielt vektede glidende gjennomsnitt blir bidraget til middelverdien fra observasjoner som er fjernet i tid, redusert, og derved legges vekt på nyere (lokale) hendelser. I hovedsak er en utjevningsparameter, 0lt al1l, introdusert, og formelen er revidert til: En symmetrisk versjon av denne formelen vil være av formen: Hvis vektene i den symmetriske modellen er valgt som betingelsene i betingelsene for binomial ekspansjonen, (1212) 2q. de vil summe til 1, og når q blir stor, vil omtrentlig normalfordelingen. Dette er en form for kjernevikting, med binomialet som kjernefunksjon. Den to-trinns konvolusjon som er beskrevet i det foregående avsnitt er nettopp dette arrangementet, med q 1, som gir vekter. Ved eksponensiell utjevning er det nødvendig å bruke et sett med vekter som summerer til 1 og som reduserer størrelsen geometrisk. Vektene som brukes er typisk av skjemaet: For å vise at disse vektene summerer til 1, vurder utvidelsen av 1 som en serie. Vi kan skrive og utvide uttrykket i parentes ved hjelp av binomialformelen (1- x) s. hvor x (1-) og p -1, som gir: Dette gir en form for vektet glidende gjennomsnitt av skjemaet: Denne summeringen kan skrives som en tilbakevendingsrelasjon: som forenkler beregningen sterkt og unngår problemet at vektningsregimet bør strengt være uendelig for vektene til summen til 1 (for små verdier av alfa. dette er vanligvis ikke tilfelle). Notasjonen som brukes av ulike forfattere varierer. Noen bruker bokstaven S for å indikere at formelen er i hovedsak en glatt variabel, og skriv: mens kontrollteori litteraturen ofte bruker Z i stedet for S for eksponentielt vektede eller jevnte verdier (se for eksempel Lucas og Saccucci, 1990, LUC1 , og NIST-nettsiden for flere detaljer og arbeidede eksempler). Formlene som er nevnt ovenfor kommer fra Roberts arbeid (1959, ROB1), men Hunter (1986, HUN1) bruker et uttrykk for formen: som kan være mer hensiktsmessig for bruk i noen kontrollprosedyrer. Med alfa 1 er gjennomsnittlig estimering bare dens målte verdi (eller verdien av forrige datapost). Med 0,5 er estimatet det enkle glidende gjennomsnittet for nåværende og tidligere målinger. I prognosemodellene er verdien S t. brukes ofte som estimat eller prognoseverdi for neste tidsperiode, det vil si som estimatet for x på tidspunktet t 1. Dermed har vi: Dette viser at prognosen på tidspunktet t 1 er en kombinasjon av det forrige eksponentielt veide glidende gjennomsnittet pluss en komponent som representerer den veide prediksjonsfeilen, epsilon. på tidspunktet t. Forutsatt at en tidsserie er gitt og det kreves en prognose, er det nødvendig med en verdi for alfa. Dette kan estimeres fra eksisterende data ved å evaluere summen av kvadrert prediksjon feil oppnådd med varierende verdier av alfa for hver t 2,3. sette det første estimatet til å være den første observerte dataværdien, x 1. I kontrollapplikasjoner er verdien av alfa viktig, da den brukes til å bestemme de øvre og nedre kontrollgrensene, og påvirker den forventede gjennomsnittlige kjølelengde (ARL) før disse kontrollgrensene er brutt (under antagelsen om at tidsseriene representerer et sett av tilfeldige, identisk distribuerte uavhengige variabler med vanlig varians). Under disse forholdene er variansen av kontrollstatistikken: (Lucas og Saccucci, 1990): Kontrollgrenser settes vanligvis som faste multipler av denne asymptotiske variansen, f. eks. - 3 ganger standardavviket. Hvis f. eks. Alpha 0,25 og dataene som overvåkes antas å ha en Normal fordeling, N (0,1), når den er i kontroll, vil kontrollgrensene være - 1,134 og prosessen vil nå en eller annen grense i 500 trinn gjennomsnittlig. Lucas og Saccucci (1990 LUC1) utlede ARLene for et bredt spekter av alfaverdier og under ulike forutsetninger ved bruk av Markov Chain-prosedyrer. De tabulerer resultatene, inkludert å gi ARLer når gjennomsnittet av kontrollprosessen har blitt forskjøvet med noen flere av standardavviket. For eksempel, med en 0,5 skift med alfa 0,25 er ARL mindre enn 50 timers trinn. Tilnærmingene beskrevet ovenfor er kjent som enkelt eksponensiell utjevning. ettersom prosedyrene blir brukt en gang til tidsserien, og deretter utføres analyser eller kontrollprosesser på det resulterende glatte datasettet. Hvis datasettet inneholder en trend og sesongkomponenter, kan to - eller tre-trinns eksponensiell utjevning brukes som et middel til å fjerne (eksplisitt modellering) disse effektene (se videre avsnittet om prognose nedenfor og NIST-arbeidet). CHA1 Chatfield C (1975) Analyse av Times Series: Teori og praksis. Chapman og Hall, London HUN1 Hunter J S (1986) Det eksponentielt vektede glidende gjennomsnittet. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Eksponentielt vektede Flytte Gjennomsnittlige kontrollsystemer: Egenskaper og forbedringer. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolldiagramtester basert på geometriske bevegelige gjennomsnitt. Technometrics, 1, 239-2506.2 Flytende gjennomsnitt ma 40 elecsales, rekkefølge 5 41 I den andre kolonnen i denne tabellen vises et glidende gjennomsnitt av rekkefølge 5, noe som gir et estimat av trendsyklusen. Den første verdien i denne kolonnen er gjennomsnittet av de fem første observasjonene (1989-1993). Den andre verdien i 5-MA kolonnen er gjennomsnittet av verdiene 1990-1994 og så videre. Hver verdi i 5-MA kolonnen er gjennomsnittet av observasjonene i femårsperioden sentrert på tilsvarende år. Det er ingen verdier for de to første årene eller de siste to årene fordi vi ikke har to observasjoner på hver side. I formelen ovenfor inneholder kolonne 5-MA verdiene for hatten med k2. For å se hva trendsyklusestimatet ser ut, plotter vi det sammen med de opprinnelige dataene i figur 6.7. plot 40 elecsales, main quotResidential electricity salesquot, ylab quotGWhquot. xlab quotYearquot 41 linjer 40 ma 40 elecsales, 5 41. col quotredquot 41 Legg merke til hvordan trenden (i rødt) er jevnere enn de opprinnelige dataene og fanger hovedrørelsen til tidsseriene uten alle de små svingningene. Den bevegelige gjennomsnittlige metoden tillater ikke estimater av T hvor t er nær seriens ender, derfor strekker den røde linjen ikke til kantene på grafen på hver side. Senere vil vi bruke mer sofistikerte metoder for trendsyklusestimering som gjør det mulig å anslå estimater nær endepunktene. Ordren av det bevegelige gjennomsnittet bestemmer glattheten i trend-syklusestimatet. Generelt betyr en større ordre en jevnere kurve. Følgende graf viser effekten av å endre rekkefølgen på det bevegelige gjennomsnittet for el-salgsdata for bolig. Enkle bevegelige gjennomsnitt som disse er vanligvis av merkelig rekkefølge (f. eks. 3, 5, 7 osv.) Dette er slik at de er symmetriske: I et bevegelige gjennomsnitt av rekkefølge m2k1 er det k tidligere observasjoner, k senere observasjoner og midtobservasjonen som er i gjennomsnitt. Men hvis m var jevn, ville det ikke lenger være symmetrisk. Flytte gjennomsnitt av glidende gjennomsnitt Det er mulig å bruke et glidende gjennomsnitt til et glidende gjennomsnitt. En grunn til å gjøre dette er å lage en jevn rekkefølge som beveger gjennomsnittlig symmetrisk. For eksempel kan vi ta et glidende gjennomsnitt på rekkefølge 4, og deretter bruke et annet glidende gjennomsnitt av rekkefølge 2 til resultatene. I tabell 6.2 er dette gjort for de første årene av australske kvartalsvise ølproduksjonsdata. beer2 lt - window 40 ausbeer, start 1992 41 ma4 lt 40 øl2, ordre 4. senter FALSK 41 ma2x4 lt 40 øl2, orden 4. senter SANN 41 Notatet 2times4-MA i den siste kolonnen betyr en 4-MA etterfulgt av en 2-MA. Verdiene i siste kolonne er oppnådd ved å ta et glidende gjennomsnitt av rekkefølge 2 av verdiene i forrige kolonne. For eksempel er de to første verdiene i 4-MA-kolonnen 451,2 (443410420532) 4 og 448,8 (410420532433) 4. Den første verdien i kolonnen 2times4-MA er gjennomsnittet av disse to: 450,0 (451.2448.8) 2. Når en 2-MA følger et glidende gjennomsnitt av like rekkefølge (som 4), kalles det et sentrert glidende gjennomsnitt på rekkefølge 4. Dette skyldes at resultatene nå er symmetriske. For å se at dette er tilfelle, kan vi skrive 2times4-MA på følgende måte: start hodes amp frac Bigfrac (y y y y) frac (y y y y) Stor forsterker frac14y frac14y frac14y frac18y. ende Det er nå et veid gjennomsnitt av observasjoner, men det er symmetrisk. Andre kombinasjoner av bevegelige gjennomsnitt er også mulige. For eksempel brukes en 3times3-MA ofte, og består av et glidende gjennomsnitt av rekkefølge 3 etterfulgt av et annet glidende gjennomsnitt av rekkefølge 3. Generelt bør en jevn rekkefølge MA følges av en jevn rekkefølge MA for å gjøre den symmetrisk. På samme måte bør en merkelig ordre MA følges av en merkelig ordre MA. Beregner trendsyklusen med sesongdata Det vanligste bruket av sentrert glidende gjennomsnitt er å estimere trendsyklusen fra sesongdata. Vurder 2times4-MA: hatten frac y frac14y frac14y frac14y frac18y. Når det gjelder kvartalsdata, blir hvert kvartal av året gitt like vekt som de første og siste vilkårene gjelder for samme kvartal i påfølgende år. Følgelig vil sesongvariasjonen bli gjennomsnittet ut, og de resulterende verdiene av hat t vil ha liten eller ingen sesongvariasjon igjen. En lignende effekt ville bli oppnådd ved bruk av en 2 x 8-MA eller en 2 x 12-MA. Generelt er en 2-timers m-MA ekvivalent med et vektet glidende gjennomsnitt av rekkefølge m1 med alle observasjoner som tar vekt 1m unntatt de første og siste vilkårene som tar vekter 1 (2m). Så hvis sesongperioden er jevn og av rekkefølge m, bruk en 2-timers m-MA for å estimere trendsyklusen. Hvis sesongperioden er merkelig og av ordre m, bruk en m-MA for å estimere trendsyklusen. Spesielt kan en 2times 12-MA brukes til å estimere trendsyklusen av månedlige data, og en 7-MA kan brukes til å estimere utviklingssyklusen av daglige data. Andre valg for rekkefølgen av MA vil vanligvis føre til at trend-syklus estimater blir forurenset av sesongmessigheten i dataene. Eksempel 6.2 Produksjon av elektrisk utstyr Figur 6.9 viser en 2times12-MA anvendt på ordreindeksen for elektrisk utstyr. Legg merke til at den glatte linjen viser ingen sesongmessighet, det er nesten det samme som trend-syklusen vist i figur 6.2, som ble estimert ved hjelp av en mye mer sofistikert metode enn flytende gjennomsnitt. Ethvert annet valg for rekkefølge av glidende gjennomsnitt (unntatt 24, 36, etc.) ville ha resultert i en jevn linje som viser noen sesongmessige svingninger. plott 40 elecequip, ylab quotNew ordre indexquot. Col quotgrayquot, hovedkurselektrisk produksjonsproduksjon (euroområde) kvitt 41 linjer 40 ma 40 elecequip, rekkefølge 12 41. kol quotequot 41 Veidede glidende gjennomsnitt Sammendrag av bevegelige gjennomsnitt resulterer i veide glidende gjennomsnitt. For eksempel er 2x4-MA diskutert ovenfor ekvivalent med en vektet 5-MA med vekter gitt av frac, frac, frac, frac, frac. Generelt kan en vektet m-MA skrives som hat t sum k aj y, hvor k (m-1) 2 og vekter er gitt med a, prikker, ak. Det er viktig at vektene alle summerer til en og at de er symmetriske slik at aj a. Den enkle m-MA er et spesielt tilfelle der alle vekter er lik 1m. En stor fordel ved vektede glidende gjennomsnitt er at de gir et jevnere estimat av trend-syklusen. I stedet for observasjoner som går inn og ut av beregningen i full vekt, økes vektene langsomt og senker sakte ned, noe som resulterer i en jevnere kurve. Noen spesifikke sett med vekter er mye brukt. Noen av disse er gitt i tabell 6.3.1-4 Enkel Flytende Gjennomsnitt Når et lagerdiagram viser flytende gjennomsnitt for ulike intervaller, er grafen med kortere tidsintervall kjent som det raskt bevegelige gjennomsnittet da endringer i sluttkursene skjer på en dag - i dag, vil det raskt bevegelige gjennomsnittet reflektere endringene raskere enn langsomt gjennomsnittlig vilje Når et lagerdiagram viser avstandsverdier i to forskjellige intervaller, er grafen med lengre tidsintervall kjent som det langsomme glidende gjennomsnittet som endringer i lukking Prisene oppstår på en daglig basis, det raskt bevegelige gjennomsnittet vil gjenspeile endringene raskere enn den langsomme glidende gjennomsnittsviljen

Comments