Generella säsongsbetonade ARIMA-modeller: (0,1,1) x (0,1,1) etc. Översikt av säsongsbetonad ARIMA-modellering: Den säsongsmässiga delen av en ARIMA-modell har samma struktur som den icke-säsongsbetonade delen: det kan ha en AR-faktor, en MA-faktor, och eller en ordning med differentiering. I den säsongsmässiga delen av modellen arbetar alla dessa faktorer över multiplar av lag s (antalet perioder under en säsong). En säsongsbetonad ARIMA-modell klassificeras som en ARIMA-modell (p, d, q) x (P, D, Q), där Pnumber av säsongens autoregressiva (SAR) termer, Dnumber av säsongsskillnader, Qnumber med säsongsrörliga medelvärden Vid identifieringen av en säsongsmodell är det första steget att avgöra huruvida en säsongsskillnad behövs, förutom eller kanske istället för en säsongsbetonad skillnad. Du bör titta på tidsserier och ACF - och PACF-tomter för alla möjliga kombinationer av 0 eller 1 icke-säsongsskillnad och 0 eller 1 säsongsskillnad. Varning: Använd aldrig någonsin mer än en säsongsskillnad, eller mer än två totala skillnader (säsongsbetonad och utan säsong kombinerad). Om säsongsmönstret är både starkt och stabilt över tid (t. ex. högt på sommaren och lågt på vintern eller vice versa), ska du förmodligen använda en säsongsskillnad oavsett om du använder en säsongsmässig skillnad, eftersom det här kommer förhindra att säsongsmönstret avviker från de långsiktiga prognoserna. Låt oss lägga till detta i vår lista med regler för att identifiera modeller Regel 12: Om serien har ett starkt och konsekvent säsongsmönster, bör du använda en ordningsföljd av säsongsskillnader - men använd aldrig mer än en ordningsföljd av säsongsskillnader eller mer än 2 order av total differensiering (seasonalnasonasonal). Signaturen för rent SAR eller rent SMA-beteende liknar signaturen av rent AR eller rent MA-beteende, förutom att mönstret uppträder över multiplar av lag s i ACF och PACF. Till exempel har en ren SAR (1) - process spikar i ACF vid lags s, 2s, 3s, etc. medan PACF skärs av efter lag s. Omvänt har en ren SMA (1) - process spikar i PACF vid lags s, 2s, 3s, etc. medan ACF avbryts efter fördröjning s. En SAR-signatur uppträder vanligtvis när autokorrelationen under säsongperioden är positiv e, medan en SMA-signatur vanligtvis uppstår när säsongens autokorrelation är negativ. Därmed: Regel 13: Om autokorrelationen under säsongperioden är positiv. Överväg att lägga till en SAR-term i modellen. Om autokorrelationen under säsongperioden är negativ. överväg att lägga till en SMA-term i modellen. Försök att undvika att blanda SAR - och SMA-termer i samma modell och undvik att använda mer än något av något slag. Vanligtvis är en SAR (1) eller SMA (1) termen tillräcklig. Du kommer sällan att stöta på en äkta SAR (2) eller SMA (2) - process och har ännu sällan tillräckligt med data för att uppskatta 2 eller flera säsongskoefficienter utan att estimeringsalgoritmen kommer in i en kvotbackback loop. quot Även om en säsongsbetonad ARIMA-modell verkar ha bara några parametrar, kom ihåg att backforecasting kräver uppskattning av en eller två säsonger värt av implicita parametrar för att initiera den. Därför bör du ha minst 4 eller 5 säsonger av data för att passa en säsongsbetonad ARIMA-modell. Förmodligen är den mest använda säsongsmässiga ARIMA modellen modellen (0,1,1) x (0,1,1) - dvs. en MA (1) xSMA (1) modell med både säsongsbetonad och en säsongsbetonad skillnad. Detta är i grunden en kvotasonal exponentiell smoothingquot-modell. När säsongsbetonade ARIMA-modeller är utrustade med loggade data kan de spåra ett multiplicativt säsongsmönster. Exempel: Reviderad AUTOSALE-serie Minns att vi tidigare förutspådde försäljningsserien för detaljhandeln genom att använda en kombination av deflation, säsongjustering och exponentiell utjämning. Låt oss nu försöka montera samma serie med säsongsbetonade ARIMA-modeller, med samma samplingsdata från januari 1970 till maj 1993 (281 observationer). Som tidigare kommer vi att arbeta med deflaterad automatisk försäljning - dvs. vi kommer att använda serien AUTOSALECPI som ingångsvariabel. Här är tidsserierna och ACF - och PACF-diagrammen i den ursprungliga serien, vilka erhålls i prognosproceduren genom att plotta quotresidualsquot av en ARIMA (0,0,0) x (0,0,0) modell med konstant: The quotsuspension bridgequot mönster i ACF är typiskt för en serie som är både icke-stationär och starkt säsongsbetonad. Det är uppenbart att vi behöver minst en ordning med differentiering. Om vi tar en icke-säsongsskillnad, är de motsvarande diagrammen följande: De olika serierna (resterna av en slumpmässig walk-on-growth-modell) ser mer eller mindre stationära ut, men det finns fortfarande mycket stark autokorrelation under säsongsperioden (lag 12). Eftersom säsongsmönstret är starkt och stabilt vet vi (från regel 12) att vi kommer att vilja använda en ordning med säsongsskillnader i modellen. Här ser du hur bilden ser ut efter en säsongsskillnad (endast): Den säsongsvariationerade serien visar ett mycket starkt mönster av positiv autokorrelation, vilket vi påminner om från vårt tidigare försök att passa en säsongsmässig slumpmässig promenadmodell. Det här kan vara en kvotens signaturquot - eller det kan signalera behovet av en annan skillnad. Om vi tar både en säsongsmässig och icke-säsongsskillnad erhålls följande resultat: Det här är förstås de rester från den säsongsmässiga slumpmässiga trendmodellen som vi tidigare monterade på försäljningsdata. Vi ser nu telltale tecken på mild overdifferensiering. De positiva spikarna i ACF och PACF har blivit negativa. Vad är den korrekta ordningen för differentiering En ytterligare information som kan vara till hjälp är en beräkning av felstatistiken i serien på varje nivå av differentiering. Vi kan beräkna dessa genom att passa motsvarande ARIMA-modeller där endast differens används. De minsta felen, både i beräkningsperioden och i valideringsperioden, erhålls genom modell A, som använder en skillnad av varje typ. Detta, tillsammans med utseendet på tomterna ovan, föreslår starkt att vi bör använda både en säsongsbetonad och en nonseasonal skillnad. Observera att förutom den gratuösa konstanta termen är modell A SRT-modellen, medan modell B bara är SRW-modellen. Som vi noterade tidigare när man jämförde dessa modeller verkar SRT-modellen passa bättre än SRW-modellen. I analysen som följer kommer vi att försöka förbättra dessa modeller genom att lägga till säsongsbetonade ARIMA villkor. Återgå till början av sidan. Den ofta använda ARIMA-modellen (0,1,1) x (0,1,1): SRT-modellen plus MA (1) och SMA (1) termer Återgå till den sista uppsättningen diagram ovan, observera det med en skillnad på varje typ finns en negativ spik i ACF vid lag 1 och även en negativ spik i ACF vid lag 12. medan PACF visar ett mer gradvis citadecayotmönster i närheten av båda dessa lager. Genom att tillämpa våra regler för att identifiera ARIMA-modeller (specifikt regel 7 och regel 13) kan vi nu dra slutsatsen att SRT-modellen skulle förbättras genom att tillägga en MA (1) term och en SMA (1) term. Genom regel 5 utesluter vi också konstanten eftersom två order av differentiering är inblandade. Om vi gör allt detta får vi modellen ARIMA (0,1,1) x (0,1,1). vilket är den vanligaste säsongsbetonade ARIMA-modellen. Dess prognosekvation är: där 952 1 är MA (1) - koefficienten och 920 1 (kapital theta-1) är SMA (1) - koefficienten. Observera att det här är bara den säsongsmässiga slumpmässiga trendmodellen som fancied-up genom att lägga till multiplar av felen vid lags 1, 12 och 13. Också observera att koefficienten för lag-13-felet är produkten av MA (1) och SMA (1) koefficienter. Denna modell är begreppsmässigt liknande Winters-modellen, eftersom den effektivt tillämpar exponentiell utjämning till nivå, trend och säsongssituation på en gång, även om den bygger på mer solida teoretiska fundament, särskilt när det gäller beräkning av konfidensintervall för långsiktiga prognoser. Dess kvarvarande tomter är i detta fall följande: Även om en liten mängd autokorrelation förblir vid lag 12 är det totala utseendet på tomterna bra. Modellerna som visar resultat visar att de uppskattade MA (1) och SMA (1) koefficienterna (erhållna efter 7 iterationer) är faktiskt signifikanta: Prognoserna från modellen liknar den säsongsmässiga slumpmässiga trendmodellen - dvs. de plockar upp säsongsmönstret och den lokala trenden i slutet av serien - men de är lite slätare eftersom både säsongsmönster och trend effektivt ses som medelvärde (i en exponentiell utjämning) över den sista några årstider: Vad gör den här modellen verkligen Du kan tänka på det på följande sätt. Först beräknar man skillnaden mellan varje monthly8217s värde och ett 8220 exponentialt viktat historiskt genomsnitt8221 för den månaden som beräknas genom att applicera exponentiell utjämning till värden som observerades under samma månad i tidigare år, där mängden utjämning bestäms av SMA (1 ) koefficienten. Då tillämpas det enbart exponentiell utjämning på dessa skillnader för att kunna förutse avvikelsen från det historiska genomsnittet som kommer att observeras nästa månad. Värdet av SMA (1) - koefficienten nära 1,0 tyder på att många säsonger av data används för att beräkna det historiska genomsnittet för en viss månad av året. Minns att en MA (1) - koefficient i en ARIMA-modell (0,1,1) motsvarar 1-minus-alfa i motsvarande exponentiell utjämningsmodell, och att medelåldern för data i en exponentiell utjämningsmodellprognos är 1 apha. SMA (1) - koefficienten har en liknande tolkning med avseende på medelvärden mellan säsonger. Här tyder sitt värde på 0,91 att medelåldern för de data som används för att uppskatta det historiska säsongsmönstret är lite mer än 10 år (nästan hälften av datasatsen), vilket innebär att ett nästan konstant säsongsmönster antas. Det mycket mindre värdet på 0,5 för MA (1) - koefficienten tyder på att relativt liten utjämning görs för att uppskatta den aktuella avvikelsen från det historiska genomsnittet för samma månad, så nästa månad8217s förutspådda avvikelse från dess historiska medelvärde kommer att ligga nära avvikelserna från det historiska genomsnittet som observerades under de senaste månaderna. ARIMA-modellen (1,0,0) x (0,1,0) med konstant: SRW-modell plus AR (1) termen Den tidigare modellen var en modell för säsongsrelaterad trend (SRT) finjusterad genom tillsats av MA 1) och SMA (1) koefficienter. En alternativ ARIMA-modell för denna serie kan erhållas genom att ersätta en AR (1) term för nonseasonal skillnaden - dvs. genom att lägga till en AR (1) term till serien SRM (Seasonal Random Walk). Detta kommer att göra det möjligt för oss att bevara säsongsmönstret i modellen samtidigt som den totala skillnaden sänks, vilket ökar stabiliteten hos trendprojektionerna om så önskas. (Minns det med en säsongsskillnad ensam, ser serien ut en stark AR (1) signatur.) Om vi gör det får vi en ARIMA (1,0,0) x (0,1,0) modell med konstant, vilket ger följande resultat: AR-koefficienten är verkligen mycket signifikant, och RMSE är bara 2,06 jämfört med 3,00 för SRW-modellen (modell B i jämförelsesrapporten ovan). Prognosekvationen för denna modell är: Tilläggstiden på högra sidan är en multipel av säsongsskillnaden observerad under den senaste månaden, vilket medför att korrigeringen av effekten av ett ovanligt gott eller dåligt år korrigeras. Här betecknar 981 1 AR (1) - koefficienten, vars uppskattade värde är 0,73. Om till exempel om försäljningen förra månaden var X dollar före försäljningen ett år tidigare, skulle kvantiteten 0,73X läggas till prognosen för denna månad. 956 betecknar CONSTANT i prognosekvationen, vars uppskattade värde är 0,20. Den uppskattade MEAN, vars värde är 0,75, är medelvärdet för den säsongsvariationerade serien, vilket är den årliga trenden i de långsiktiga prognoserna för denna modell. Konstanten är (per definition) lika med medeltiderna 1 minus AR (1) - koefficienten: 0,2 0,75 (1 8211 0,73). Prognosplotten visar att modellen verkligen gör ett bättre jobb än SRW-modellen för att spåra cykliska förändringar (dvs ovanligt bra eller dåliga år): MSE för denna modell är dock fortfarande betydligt större än vad vi fick för ARIMA (0, 1,1) x (0,1,1) modell. Om vi tittar på rester av rester ser vi utrymme för förbättringar. Resterna visar fortfarande ett tecken på cyklisk variation: ACF och PACF föreslår behovet av både MA (1) och SMA (1) koefficienter: En förbättrad version: ARIMA (1,0,1) x (0,1,1) med konstant Om vi lägger till de angivna MA (1) och SMA (1) termerna till föregående modell, erhåller vi en ARIMA (1,0,1) x (0,1,1) modell med konstant vars prognosförening är This är nästan detsamma som ARIMA-modellen (0,1,1) x (0,1,1), förutom att den ersätter den icke-säsongsskillnad med en AR (1) term (en kvotentialskillnad) och den innehåller en konstant term som representerar långsiktig trend. Därför antar denna modell en mer stabil trend än ARIMA-modellen (0,1,1) x (0,1,1), och det är den huvudsakliga skillnaden mellan dem. De modellanpassade resultaten är följande: Observera att den uppskattade AR (1) - koefficienten (981 1 i modellekvationen) är 0,96, som ligger mycket nära 1,0 men inte så nära att det föreslås att det absolut borde ersättas med en första skillnad: dess standardfel är 0,02, så det är ca 2 standardfel från 1.0. Den andra statistiken av modellen (de uppskattade MA (1) och SMA (1) koefficienterna och felstatistiken i estimerings - och valideringsperioderna är annars nästan identiska med de för ARIMA (0,1,1) x (0,1 , 1) modell. (De uppskattade MA (1) och SMA (1) koefficienterna är 0,45 och 0,91 i denna modell vs 0,48 och 0,91 i den andra.) Den uppskattade MEAN på 0,68 är den förutsagda långsiktiga trenden (genomsnittlig årlig ökning). Detta är i huvudsak samma värde som erhölls i (1,0,0) x (0,1,0) - med-konstant modell. Standardfelet för det uppskattade medelvärdet är 0,26, så skillnaden mellan 0,75 och 0,68 är inte signifikant. Om konstanten inte inkluderades i den här modellen skulle den vara en dämpad trendmodell: trenden i de mycket långsiktiga prognoserna skulle gradvis utplansas. Punktprognoserna från denna modell ser ganska ut som de som är av typen 0,1,1 (0,1,1), eftersom den genomsnittliga trenden liknar den lokala trenden i slutet av serien. Förtroendeintervallet för denna modell utökas dock något mindre på grund av antagandet att trenden är stabil. Observera att konfidensgränserna för de tvååriga prognoserna nu ligger inom de horisontella rutorna vid 24 och 44, medan de av modellen (0,1,1) x (0,1,1) inte var: Säsongens ARIMA jämfört med exponentiell utjämning och säsongjustering: Nu kan vi jämföra prestanda de två bästa ARIMA-modellerna mot enkla och linjära exponentiella utjämningsmodeller tillsammans med multiplicativ säsongjustering och Winters-modellen, som visas i bilderna på prognoser med säsongsjustering: Felstatistiken för Prognoserna för alla framtidsprognoser är extremt nära i det här fallet. Det är svårt att välja en 8220winner8221 baserat på dessa siffror ensamma. Återgå till början av sidan. Vilka är skillnaderna mellan de olika säsongsmodellerna De tre modellerna som använder multiplicativ säsongsjustering handlar om säsongsmässighet på ett tydligt sätt - dvs. säsongens index bryts ut som en explicit del av modellen. ARIMA-modellerna hanterar säsongsmässigt på ett mer implisitt sätt - vi kan inte se i ARIMA-produktionen hur genomsnittet i december säger, skiljer sig från medeltalet juli. Beroende på om det anses viktigt att isolera säsongsmönstret kan detta vara en faktor vid valet mellan olika modeller. ARIMA-modellerna har fördelen att de, när de initialiseras, har färre kvoter än de exponentiella utjämnings - och justeringsmodellerna, och som sådana kan de vara mindre benägna att överföra data. ARIMA-modellerna har också en mer solid underliggande teori med avseende på beräkningen av konfidensintervaller för längre horisontprognoser än de andra modellerna. Det finns mer dramatiska skillnader bland modellerna med avseende på beteendet hos sina prognoser och konfidensintervall för prognoser mer än en period framåt. Det är här de antaganden som görs med hänsyn till förändringar i trend och säsongsmönster är mycket viktiga. Mellan de två ARIMA-modellerna beräknar en (modell A) en tidsvarierande trend, medan den andra (modell B) innehåller en långsiktig genomsnittlig trend. (Vi kunde, om vi önskade, utplåna den långsiktiga trenden i modell B genom att undertrycka den konstanta termen.) Bland modellerna för exponentiell utjämning plus plus antar en (modell C) en platt trend medan den andra modell D) antar en tidsvarierande trend. Wintersmodellen (E) antar också en tidsvarierande trend. Modeller som antar en konstant trend är relativt säkrare i sina långsiktiga prognoser än modeller som inte gör det, och det brukar återspeglas i hur mycket konfidensintervall för prognoser blir bredare vid längre prognoshorisonter. Modeller som inte antar tidsvarierande trender har vanligtvis smalare konfidensintervaller för längre horisontprognoser, men smalare är inte bättre om inte detta antagande är korrekt. De två exponentiella utjämningsmodellerna kombinerat med säsongsjustering förutsätter att säsongsmönstret har varit konstant under de 23 åren i dataprovet, medan de andra tre modellerna inte gör det. I den mån säsongsmönstret står för det mesta av månad till månadens variation i uppgifterna är det viktigt att förutse vad som kommer att hända flera månader in i framtiden. Om säsongsmönstret tros ha förändrats långsamt över tiden, skulle en annan metod vara att bara använda en kortare datalogik för att anpassa modellerna som uppskattar fasta säsongsindex. För rekordet är här prognoserna och 95 konfidensgränser för maj 1995 (24 månader framåt) som produceras av de fem modellerna: Poängprognoserna är faktiskt förvånansvärt nära varandra i förhållande till bredden av alla konfidensintervall. SES-poängprognosen är den lägsta, eftersom den är den enda modellen som inte antar en uppåtgående trend i slutet av serien. ARIMA (1,0,1) x (0,1,1) c-modellen har de minsta konfidensgränserna, eftersom det förutsätter mindre tidsvariation i parametrarna än de andra modellerna. Dessutom är dess prognosprognos något större än de andra modellernas, eftersom den extrapolerar en långsiktig trend snarare än en kortsiktig trend (eller ingen trend). Winters modellen är minst stabil i modellerna och dess prognos har därför de största konfidensgränserna, vilket framgår av detaljerade prognosplottor för modellerna. Och prognoserna och konfidensgränserna för ARIMA-modellen (0,1,1) x (0,1,1) och de av LESseasonaljusteringsmodellen är nästan identiska att logga eller inte logga någonting som vi ännu inte har gjort, men kan ha, är en logtransformation som en del av modellen. Seasonal ARIMA-modeller är i sig additiva modeller, så om vi vill fånga ett multiplicativt säsongsmönster. Vi måste göra det genom att logga in data innan du monterar ARIMA-modellen. (I Statgraphics skulle vi bara behöva ange kvadratisk Logquot som ett modelleringsalternativ - ingen stor sak.) I det här fallet verkar deflationstransformationen ha gjort ett tillfredsställande jobb för att stabilisera amplituden för säsongscyklerna, så det gör inte verkar vara en tvingande anledning att lägga till en loggförändring vad gäller långsiktiga trender. Om resterna visade en markant ökning av variationen över tiden, kan vi bestämma oss annars. Det är fortfarande fråga om huruvida felet i dessa modeller har en konsekvent varians över månaderna på året. Om de inte gör det, kan konfidensintervall för prognoser tendera att vara för breda eller för smala enligt säsongen. Resterande vs-tid-tomter visar inte ett uppenbart problem i detta avseende, men för att vara noggrann skulle det vara bra att titta på felvariationen per månad. Om det verkligen finns ett problem, kan en loggomvandling fixa den. Gå tillbaka till början av sidan. Spreadsheet genomförandet av säsongjustering och exponentiell utjämning Det är enkelt att utföra säsongsjustering och passa exponentiella utjämningsmodeller med Excel. Skärmbilderna och diagrammen nedan är hämtade från ett kalkylblad som har upprättats för att illustrera multiplicativ säsongsjustering och linjär exponentiell utjämning på följande kvartalsförsäljningsdata från Outboard Marine: För att få en kopia av kalkylarkfilen själv klickar du här. Den version av linjär exponentiell utjämning som kommer att användas här för demonstration är Brown8217s version, bara för att den kan implementeras med en enda kolumn med formler och det finns bara en utjämningskonstant för att optimera. Vanligtvis är det bättre att använda Holt8217s version som har separata utjämningskonstanter för nivå och trend. Prognosprocessen fortskrider enligt följande: (i) Första uppgifterna är säsongrensade (ii) så skapas prognoser för säsongrensade data via linjär exponentiell utjämning och (iii) slutligen är de säsongrensade prognoserna kvoterade för att få prognoser för den ursprungliga serien . Säsongsjusteringsprocessen utförs i kolumnerna D till G. Det första steget i säsongjustering är att beräkna ett centrerat glidande medelvärde (utfört här i kolumn D). Detta kan göras genom att ta medeltalet av två ettåriga medelvärden som kompenseras av en period i förhållande till varandra. (En kombination av två förskjutna medelvärden i stället för ett enda medel behövs för centreringsändamål när antalet årstider är jämnt.) Nästa steg är att beräkna förhållandet till glidande medelvärde, dvs. de ursprungliga uppgifterna dividerat med det rörliga genomsnittet i varje period - vilket görs här i kolumn E. (Detta kallas också kvotrend-cyclequot-komponenten i mönstret, i den mån trend - och konjunkturseffekter kan anses vara allt som förblir efter medeltal över en helårs värde av data. Naturligtvis kan förändringar från månad till månad som inte beror på säsongsmässighet bestämas av många andra faktorer, men tolvmånadersgenomsnittet släpper i stor utsträckning över dem.) Beräknat säsongsindex för varje säsong beräknas genom att medeltalvärdera alla förhållanden för den aktuella säsongen, vilket görs i cellerna G3-G6 med en AVERAGEIF-formel. Medelvärdena är sedan återkalnade så att de summeras till exakt 100 gånger antalet perioder i en säsong, eller 400 i detta fall, vilket görs i cellerna H3-H6. Nedan i kolumn F används VLOOKUP-formler för att infoga det lämpliga säsongsindexvärdet i varje rad i datatabellen, enligt kvartalet av det representerar. Det centrerade rörliga genomsnittet och de säsongrensade uppgifterna ser ut så här: Observera att det glidande medlet oftast ser ut som en mjukare version av den säsongrensade serien, och den är kortare i båda ändarna. Ett annat arbetsblad i samma Excel-fil visar tillämpningen av den linjära exponentiella utjämningsmodellen till säsongrensade data, som börjar i kolumn G. Ett värde för utjämningskonstanten (alfa) anges ovanför prognoskolumnen (här i cell H9) och För enkelhets skyld tilldelas serienavnet quotAlpha. quot (namnet är tilldelat med kommandot quotInsertNameCreatequot.) LES-modellen initieras genom att de första två prognoserna ställs lika med det första verkliga värdet av den säsongrensade serien. Formeln som används här för LES-prognosen är recirkulär form av Brown8217s modell: Denna formel är inmatad i cellen som motsvarar den tredje perioden (här, cell H15) och kopieras därifrån. Observera att LES-prognosen för den aktuella perioden avser de två föregående observationerna och de två föregående prognosfelen, liksom värdet av alfa. Således avser prognosformeln i rad 15 endast data som var tillgängliga i rad 14 och tidigare. (Självklart, om vi ville använda enkla istället för linjär exponentiell utjämning, kunde vi istället ersätta SES-formeln. Vi kan också använda Holt8217s snarare än Brown8217s LES-modell, vilket skulle kräva ytterligare två kolumner med formler för att beräkna nivån och trenden som används i prognosen.) Felen beräknas i nästa kolumn (här kolumn J) genom att subtrahera prognoserna från de faktiska värdena. Roten medelkvadratfelet beräknas som kvadratroten av felets varians plus kvadraten av medelvärdet. (Detta följer av den matematiska identiteten: MSE VARIANCE (fel) (AVERAGE (fel)). 2.) Vid beräkning av medelvärdet och variansen av fel i denna formel är de två första perioderna uteslutna eftersom modellen inte faktiskt börjar prognosera tills den tredje perioden (rad 15 på kalkylbladet). Det optimala värdet av alfa kan hittas antingen genom att manuellt byta alfa tills den minsta RMSE finns, annars kan du använda quotSolverquot för att utföra en exakt minimering. Värdet av alfa som Solver hittat visas här (alfa0.471). Det är vanligtvis en bra idé att plotta felet i modellen (i transformerade enheter) och även att beräkna och plotta sina autokorrelationer vid lags på upp till en säsong. Här är en tidsserie-plot av de (säsongrensade) felen: Felautokorrelationerna beräknas med hjälp av funktionen CORREL () för att beräkna korrelationerna av felen med sig självfördröjda av en eller flera perioder - detaljer visas i kalkylbladsmodellen . Här är en plot av autokorrelationerna av felen vid de första fem lagsna: Autokorrelationerna på lags 1 till 3 ligger mycket nära noll, men spetsen vid lag 4 (vars värde är 0,35) är lite besvärligt - det tyder på att säsongsjusteringsprocessen har inte varit helt framgångsrik. Det är emellertid faktiskt endast marginellt signifikant. 95 signifikansband för att testa om autokorrelationer skiljer sig signifikant från noll är ungefär plus-eller-minus 2SQRT (n-k), där n är provstorleken och k är fördröjningen. Här är n 38 och k varierar från 1 till 5, så kvadratroten-av-n-minus-k är omkring 6 för dem alla, och gränserna för att testa den statistiska signifikansen av avvikelser från noll är därför ungefär plus - eller-minus 26 eller 0,33. Om du varierar värdet av alfa för hand i denna Excel-modell kan du observera effekten på tidsserierna och autokorrelationsdiagrammen för felen, liksom på det roten-kvadratiska felet, vilket kommer att illustreras nedan. Nedan i kalkylbladet är prognostiseringsformeln quotbootstrappedquot in i framtiden genom att bara ersätta prognoser för faktiska värden vid den punkt där den faktiska data löper ut - dvs. där quotthe futurequot börjar. (Med andra ord, i varje cell där ett framtida datavärde skulle inträffa läggs en cellreferens in som pekar på prognosen för den perioden.) Alla övriga formler kopieras helt enkelt ovanifrån: Observera att fel för prognoser för framtiden beräknas alla vara noll. Det betyder inte att de faktiska felen kommer att vara noll, men snarare återspeglar den bara det faktum att vi förutspår att framtida data kommer att motsvara prognoserna i genomsnitt. De resulterande LES-prognoserna för säsongrensade data ser så här ut: Med detta speciella värde av alfa, vilket är optimalt för prognoser med en period framåt, är den prognostiserade trenden något uppåt, vilket återspeglar den lokala trenden som observerades under de senaste 2 åren eller så. För andra värden av alfa kan en väldigt annorlunda trendprojektion erhållas. Det är vanligtvis en bra idé att se vad som händer med den långsiktiga trendprojektionen när alfa varieras, eftersom det värde som är bäst för kortsiktiga prognoser inte nödvändigtvis är det bästa värdet för att förutsäga den mer avlägsna framtiden. Till exempel är här resultatet som erhålls om värdet av alfa manuellt ställs in på 0,25: Den prognostiserade långsiktiga trenden är nu negativ snarare än positiv. Med ett mindre värde av alfa lägger modellen större vikt vid äldre data i dess uppskattning av nuvarande nivå och trend och dess långsiktiga prognoser speglar den nedåtgående trend som observerats under de senaste 5 åren snarare än den senaste uppåtgående trenden. Detta diagram illustrerar också tydligt hur modellen med ett mindre värde av alfa är långsammare att svara på quotturning pointsquot i data och tenderar därför att göra ett fel på samma tecken under många perioder i rad. Dess 1-stegs prognosfel är större i genomsnitt än de som erhållits tidigare (RMSE på 34,4 i stället för 27,4) och starkt positivt autokorrelerade. Lag-1 autokorrelationen 0,56 överstiger väsentligen värdet 0,33, beräknat ovan för en statistiskt signifikant avvikelse från noll. Som ett alternativ till att sänka värdet av alfa för att introducera mer konservatism i långsiktiga prognoser, läggs en kvotränningsdämpningsquot-faktor ibland till modellen för att den planerade trenden ska flata ut efter några perioder. Det sista steget i att bygga prognosmodellen är att quoteraasonizequot LES prognoserna genom att multiplicera dem med lämpliga säsongsindex. De resesaliserade prognoserna i kolumn I är alltså helt enkelt produkten av säsongsindexen i kolumn F och de säsongrensade LES-prognoserna i kolumn H. Det är relativt lätt att beräkna konfidensintervaller för enstegsprognoser som gjorts av denna modell: först beräkna RMSE (root-mean-squared-felet, vilket är bara kvadratroten till MSE) och beräkna sedan ett konfidensintervall för den säsongrensade prognosen genom att lägga till och subtrahera två gånger RMSE. (Generellt är ett 95 konfidensintervall för en prognos för en period framöver ungefär lika med punktprognosen plus-eller-minus-två gånger den beräknade standardavvikelsen för prognosfel, förutsatt att felfördelningen är ungefär normal och provstorleken är tillräckligt stor, säg 20 eller mer. Här är RMSE istället för standardavvikelsen för provets standardavvikelse den bästa uppskattningen av standardavvikelsen för framtida prognosfel eftersom det tar hänsyn både till slumpmässiga variationer.) Förtroendebegränsningarna för den säsongrensade prognosen återförsäljas sedan. tillsammans med prognosen, genom att multiplicera dem med lämpliga säsongsindex. I detta fall är RMSE lika med 27,4 och den säsongrensade prognosen för den första framtida perioden (dec-93) är 273,2. så är det säsongrensade 95 konfidensintervallet från 273,2-227,4 218,4 till 273,2227,4 328,0. Multiplicera dessa gränser med Decembers säsongsindex på 68,61. vi uppnår lägre och övre konfidensgränser på 149,8 och 225,0 kring prognosen för 93-procentiga prognoser på 187,4. Förtroendebegränsningar för prognoser mer än en period framöver kommer i allmänhet att öka som prognoshorisonten ökar på grund av osäkerhet om nivå och trend samt säsongsfaktorer, men det är svårt att beräkna dem generellt med analytiska metoder. (Det lämpliga sättet att beräkna konfidensgränser för LES-prognosen är att använda ARIMA-teorin, men osäkerheten i säsongsindex är en annan fråga.) Om du vill ha ett realistiskt konfidensintervall för en prognos mer än en period framåt, tar du alla källor till felaktigt är det bästa sättet att använda empiriska metoder: till exempel för att få ett konfidensintervall för en 2-stegs prognos, kan du skapa en annan kolumn i kalkylbladet för att beräkna en prognos för två steg före varje period ( genom att förstärka prognosen med ett steg framåt). Beräkna sedan RMSE för de tvåstegsförutsägda prognosfelen och använd detta som utgångspunkt för ett konfidensintervall på 2 steg. Tidsseriemetoder Tidsseriemetoder är statistiska tekniker som utnyttjar historiska data som samlats över en tidsperiod . Tidsseriemetoder antar att det som inträffat i det förflutna kommer att fortsätta att ske i framtiden. Som namnetidsserierna föreslår, beräknar dessa metoder prognosen till endast en faktor - tid. De innefattar bland annat glidande medelvärde, exponentiell utjämning och linjär trendlinje och de är bland de mest populära metoderna för prognoser för kortdistans mellan service - och tillverkningsföretag. Dessa metoder antar att identifierbara historiska mönster eller trender för efterfrågan över tid kommer att upprepa sig. Flytta genomsnittet En prognos för tidsserier kan vara så enkel som att använda efterfrågan under den aktuella perioden för att förutsäga efterfrågan under nästa period. Detta kallas ibland en naiv eller intuitiv prognos. 4 Till exempel, om efterfrågan är 100 enheter i veckan, är prognosen för nästa veckors efterfrågan 100 enheter om efterfrågan visar sig vara 90 enheter istället, då efterfrågan på följande veckor är 90 enheter, och så vidare. Denna typ av prognostiseringsmetod tar inte hänsyn till historiskt efterfrågan beteende som det endast bygger på efterfrågan under den aktuella perioden. Det reagerar direkt på de normala, slumpmässiga rörelserna i efterfrågan. Den enkla glidande metoden använder flera efterfrågningsvärden under det senaste förflutet för att utveckla en prognos. Detta tenderar att dämpa eller släta ut de slumpmässiga ökningarna och minskningarna av en prognos som endast använder en period. Det enkla glidande medlet är användbart för att förutse efterfrågan som är stabil och visar inte något uttalat efterfrågan beteende, såsom en trend eller ett säsongsmönster. Flyttande medelvärden beräknas för specifika perioder, till exempel tre månader eller fem månader, beroende på hur mycket prognosen önskar släta efterfrågningsdata. Ju längre den rörliga genomsnittliga perioden, desto smidigare blir det. Formeln för att beräkna det enkla rörliga genomsnittet är att beräkna ett enkelt rörligt medelvärde. Instant Paper Clip Office Supply Company säljer och levererar kontorsmaterial till företag, skolor och byråer inom en 50-mils radie av sitt lager. Kontorsleveransverksamheten är konkurrenskraftig, och möjligheten att leverera order snabbt är en faktor för att få nya kunder och hålla gamla. (Kontor beställer vanligtvis inte när de är låga på leveranser, men när de slutar helt. Därför behöver de sina beställningar omedelbart.) Företagets chef vill vara säker med tillräckligt många förare och fordon är tillgängliga för att snabbt kunna leverera order och De har tillräcklig inventering i lager. Därför vill chefen kunna förutse antalet order som kommer att inträffa under nästa månad (dvs. att förutse efterfrågan på leveranser). Från register över leveransorder har ledningen ackumulerat följande data under de senaste 10 månaderna, från vilken man vill beräkna 3- och 5-månaders glidande medelvärden. Låt oss anta att det är slutet av oktober. Prognosen som följer av antingen 3- eller 5-månaders glidande medelvärde är typiskt för nästa månad i sekvensen, vilket i det här fallet är november. Det glidande medelvärdet beräknas från efterfrågan på order under de föregående 3 månaderna i sekvensen enligt följande formel: 5-månaders glidande medelvärde beräknas från de föregående 5 månaderna av efterfrågningsdata enligt följande: 3- och 5-månaders Flytta genomsnittliga prognoser för alla månader av efterfrågadata visas i följande tabell. Faktum är att endast prognosen för november baserat på den senaste månatliga efterfrågan skulle användas av chefen. De tidigare prognoserna för tidigare månader tillåter oss emellertid att jämföra prognosen med den faktiska efterfrågan för att se hur exakt prognosmetoden är - det vill säga hur bra det gör. Tre - och femmånadersgenomsnitt Både glidande genomsnittliga prognoser i tabellen ovan tenderar att släta ut variabiliteten i de faktiska data. Denna utjämningseffekt kan observeras i följande figur där 3-månads - och 5-månadsgenomsnittet har överlagts på ett diagram över de ursprungliga dataen: Det 5-månaders glidande genomsnittet i föregående figur släpper ut fluktuationerna i större utsträckning än 3 månaders glidande medelvärde. Det 3-månadersgenomsnittet återspeglar emellertid närmare de senaste uppgifterna som finns tillgängliga för kontorsleverantören. I allmänhet är prognoser som använder det längre glidande genomsnittet långsammare att reagera på de senaste förändringarna i efterfrågan än vad som gjordes med hjälp av kortare glidande medelvärden. De extra dataperioderna dämpar den hastighet som prognosen svarar på. Att fastställa lämpligt antal perioder att använda i en glidande genomsnittlig prognos kräver ofta en viss mängd försök och felprov. Nackdelen med den glidande genomsnittliga metoden är att den inte reagerar på variationer som uppstår av en orsak, såsom cykler och säsongseffekter. Faktorer som orsakar förändringar ignoreras generellt. Det är i princip en mekanisk metod som speglar historiska data på ett konsekvent sätt. Emellertid har den glidande medelmetoden fördelen att det är lätt att använda, snabbt och relativt billigt. I allmänhet kan denna metod ge en bra prognos på kort sikt, men det bör inte skjutas för långt in i framtiden. Viktat rörligt medelvärde Den glidande genomsnittliga metoden kan justeras för att bättre reflektera fluktuationer i data. I den viktade glidande genomsnittsmetoden tilldelas vikter till de senaste data enligt följande formel: Efterfrågningsdata för PM Computer Services (visad i tabellen för Exempel 10.3) verkar följa en ökande linjär trend. Företaget vill beräkna en linjär trendlinje för att se om den är mer exakt än exponentiella utjämning och justerade exponentiella utjämningsprognoser som utvecklats i exempel 10.3 och 10.4. De värden som krävs för minsta kvadratberäkningarna är följande: Med dessa värden beräknas parametrarna för linjär trendlinje enligt följande: Därför är linjär trendlinjekvation Att beräkna en prognos för period 13, låt x 13 i linjär trendlinje: Nedanstående diagram visar linjär trendlinje jämfört med aktuella data. Trendslinjen verkar tydligt reflektera de faktiska uppgifterna - det vill säga vara en bra passform - och skulle därmed vara en bra prognosmodell för detta problem. En nackdel med den linjära trenderlinjen är emellertid att den inte kommer att anpassas till en förändring i trenden, eftersom de exponentiella utjämningsprognosmetoderna kommer att det antas att alla framtida prognoser kommer att följa en rak linje. Detta begränsar användningen av denna metod till en kortare tidsram där du kan vara relativt säker på att trenden inte kommer att förändras. Säsongsjusteringar Ett säsongsmönster är en repetitiv ökning och minskning av efterfrågan. Många efterfrågevaror uppvisar säsongsbeteende. Klädförsäljningen följer årliga säsongsmönster, med efterfrågan på varma kläder ökar på hösten och vintern och sjunker under våren och sommaren då efterfrågan på svalare kläder ökar. Efterfrågan på många detaljhandelsvaror, inklusive leksaker, sportutrustning, kläder, elektroniska apparater, skinka, kalkoner, vin och frukt, ökar under semesterperioden. Efterfrågan på hälsokort ökar i samband med speciella dagar som Alla hjärtans dag och mors dag. Säsongsmönster kan också ske varje månad, veckovis eller till och med dagligen. Vissa restauranger har högre efterfrågan på kvällen än vid lunch eller på helgerna i motsats till vardagar. Trafik - därmed försäljning - på köpcentra hämtar på fredag och lördag. Det finns flera metoder för att reflektera säsongsmönster i en prognos för tidsserier. Vi beskriver en av de enklare metoderna med en säsongsfaktor. En säsongsfaktor är ett numeriskt värde som multipliceras med den normala prognosen för att få en säsongrensad prognos. En metod för att utveckla en efterfrågan på säsongsmässiga faktorer är att dela efterfrågan på varje säsongsperiod efter den totala årliga efterfrågan enligt följande formel: De resulterande säsongsfaktorerna mellan 0 och 1,0 är i själva verket den del av den totala årliga efterfrågan som tilldelas varje säsong. Dessa säsongsfaktorer multipliceras med den årliga prognostiserade efterfrågan för att ge justerade prognoser för varje säsong. Beräkna ett prognos med säsongsjusteringar. Wishbone Farms växer kalkoner för att sälja till köttbearbetningsföretag under hela året. Men högsäsong är uppenbarligen under fjärde kvartalet, från oktober till december. Wishbone Farms har upplevt efterfrågan på kalkoner under de senaste tre åren som visas i följande tabell: Eftersom vi har tre års efterfrågadata kan vi beräkna säsongsfaktorerna genom att dela den totala kvartalsbehovet för de tre åren med total efterfrågan under alla tre år : Sedan vill vi multiplicera den prognostiserade efterfrågan på nästa år, 2000, genom varje säsongsfaktor för att få den prognostiserade efterfrågan för varje kvartal. För att uppnå detta behöver vi en efterfråganprognos för 2000. I det här fallet, eftersom efterfrågadata i tabellen verkar uppvisa en generellt ökande trend, beräknar vi en linjär trendlinje för de tre år av data i tabellen för att få en grov prognosuppskattning: Prognosen för 2000 är således 58,17 eller 58,170 kalkoner. Med hjälp av denna årliga prognosen för efterfrågan jämförs de säsongrensade prognoserna SF i för år 2000 med jämförelse av dessa kvartalsprognoser med de faktiska efterfrågningsvärdena i tabellen, de verkar vara relativt goda prognosberäkningar som återspeglar både säsongsvariationerna i data och den allmänna uppåtgående trenden. 10-12. Hur är den glidande medelmetoden som liknar exponentiell utjämning 10-13. Vilken effekt på exponentiell utjämningsmodell kommer att öka utjämningskonstanten har 10-14. Hur skiljer sig justerad exponentiell utjämning från exponentiell utjämning 10-15. Vad bestämmer valet av utjämningskonstanten för trend i en justerad exponentiell utjämningsmodell 10-16. I kapitelexemplen för tidsseriemetoder antogs startprognosen alltid vara densamma som den faktiska efterfrågan under den första perioden. Föreslå andra sätt att startprognosen kan härledas vid faktisk användning. 10-17. Hur skiljer den linjära trendlinjeprognosmodellen från en linjär regressionsmodell för prognoser 10-18. Av de tidsseriemodeller som presenteras i detta kapitel, inklusive det glidande medelvärdet och det vägda glidande medlet, exponentiell utjämning och justerad exponentiell utjämning och linjär trendlinje, vilken anser du bäst Varför 10-19. Vilka fördelar har justerad exponentiell utjämning över en linjär trendlinje för prognostiserad efterfrågan som uppvisar en trend 4 K. B. Kahn och J. T. Mentzer, prognoser inom konsument - och industrimarknaderna, Journal of Business Forecast 14, nr. 2 (sommaren 1995): 21-28.
No comments:
Post a Comment