Bewegungsdurchschnitte Bewegungsdurchschnitte Bei herkömmlichen Datensätzen ist der Mittelwert oft der erste und eine der nützlichsten Zusammenfassungsstatistiken zu berechnen. Wenn Daten in Form einer Zeitreihe vorliegen, ist das Serienmittel ein nützliches Maß, entspricht aber nicht der Dynamik der Daten. Mittelwerte, die über kurzgeschlossene Perioden berechnet werden, die entweder der aktuellen Periode vorausgeht oder auf der aktuellen Periode zentriert sind, sind oft nützlicher. Weil diese Mittelwerte variieren oder sich bewegen, wenn sich die aktuelle Periode von der Zeit t 2, t 3 usw. bewegt, werden sie als gleitende Mittelwerte (Mas) bezeichnet. Ein einfacher gleitender Durchschnitt ist (typischerweise) der ungewichtete Durchschnitt der k vorherigen Werte. Ein exponentiell gewichteter gleitender Durchschnitt ist im Wesentlichen derselbe wie ein einfacher gleitender Durchschnitt, aber mit Beiträgen zum Mittelwert, der durch ihre Nähe zur aktuellen Zeit gewichtet wird. Weil es nicht eine, sondern eine ganze Reihe von gleitenden Durchschnitten für jede gegebene Serie gibt, kann der Satz von Mas selbst auf Graphen aufgetragen, als Serie analysiert und bei der Modellierung und Prognose verwendet werden. Eine Reihe von Modellen kann mit gleitenden Durchschnitten konstruiert werden, und diese sind als MA-Modelle bekannt. Wenn solche Modelle mit autoregressiven (AR) Modellen kombiniert werden, sind die resultierenden zusammengesetzten Modelle als ARMA - oder ARIMA-Modelle bekannt (die I ist für integriert). Einfache Bewegungsdurchschnitte Da eine Zeitreihe als ein Satz von Werten betrachtet werden kann, kann t 1,2,3,4, n der Mittelwert dieser Werte berechnet werden. Wenn wir annehmen, daß n ziemlich groß ist und wir eine ganze Zahl k wählen, die viel kleiner als n ist. Wir können einen Satz von Blockdurchschnitten oder einfache gleitende Mittelwerte (der Ordnung k) berechnen: Jede Maßnahme repräsentiert den Mittelwert der Datenwerte über ein Intervall von k Beobachtungen. Beachten Sie, dass die erste mögliche MA der Ordnung k gt0 die für t k ist. Im Allgemeinen können wir den zusätzlichen Index in den obigen Ausdrücken fallen lassen und schreiben: Dies besagt, dass der geschätzte Mittelwert zum Zeitpunkt t der einfache Durchschnitt des beobachteten Wertes zum Zeitpunkt t und der vorhergehenden k -1 Zeitschritte ist. Wenn Gewichte angewendet werden, die den Beitrag von Beobachtungen, die weiter weg in der Zeit sind, verringern, wird der gleitende Durchschnitt exponentiell geglättet. Bewegliche Mittelwerte werden oft als eine Form der Prognose verwendet, wobei der Schätzwert für eine Reihe zum Zeitpunkt t 1, S t1. Wird als MA für den Zeitraum bis einschließlich Zeit t genommen. z. B. Die heutige Schätzung basiert auf einem Durchschnitt der bisher aufgezeichneten Werte bis einschließlich gestern (für Tagesdaten). Einfache gleitende Durchschnitte können als eine Form der Glättung gesehen werden. In dem unten dargestellten Beispiel wurde der in der Einleitung zu diesem Thema gezeigte Luftverschmutzungs-Datensatz um eine 7-Tage-Gleitende Durchschnitt (MA) - Linie erweitert, die hier in rot dargestellt ist. Wie man sehen kann, glättet die MA-Linie die Gipfel und Tröge in den Daten und kann sehr hilfreich bei der Identifizierung von Trends sein. Die Standard-Vorwärtsberechnungsformel bedeutet, dass die ersten k -1 Datenpunkte keinen MA-Wert haben, aber danach rechnen die Berechnungen bis zum endgültigen Datenpunkt in der Serie. PM10 tägliche Mittelwerte, Greenwich Quelle: London Air Quality Network, londonair. org. uk Ein Grund für die Berechnung einfacher gleitender Durchschnitte in der beschriebenen Weise ist, dass es ermöglicht, Werte für alle Zeitschlitze von der Zeit tk bis zur Gegenwart berechnet werden, und Da eine neue Messung für die Zeit t 1 erhalten wird, kann die MA für die Zeit t 1 dem bereits berechneten Satz hinzugefügt werden. Dies stellt eine einfache Prozedur für dynamische Datensätze zur Verfügung. Allerdings gibt es einige Probleme mit diesem Ansatz. Es ist vernünftig zu argumentieren, dass der Mittelwert über die letzten 3 Perioden, sagen wir, zum Zeitpunkt t -1 liegen sollte, nicht Zeit t. Und für eine MA über eine gerade Anzahl von Perioden vielleicht sollte es sich am Mittelpunkt zwischen zwei Zeitintervallen befinden. Eine Lösung für dieses Problem ist die Verwendung von zentrierten MA-Berechnungen, bei denen das MA zum Zeitpunkt t der Mittelwert eines symmetrischen Satzes von Werten um t ist. Trotz seiner offensichtlichen Verdienste wird dieser Ansatz im Allgemeinen nicht verwendet, weil es erfordert, dass Daten für zukünftige Ereignisse verfügbar sind, was möglicherweise nicht der Fall ist. In Fällen, in denen die Analyse vollständig aus einer bestehenden Serie besteht, kann die Verwendung von zentriertem Mas vorzuziehen sein. Einfache gleitende Durchschnitte können als eine Form der Glättung betrachtet werden, wobei einige hochfrequente Komponenten einer Zeitreihe entfernt werden und die Trends in ähnlicher Weise wie der allgemeine Begriff der digitalen Filterung hervorgehoben werden (aber nicht entfernen) werden. In der Tat sind gleitende Mittelwerte eine Form des linearen Filters. Es ist möglich, eine gleitende Durchschnittsberechnung auf eine Reihe anzuwenden, die bereits geglättet worden ist, d. h. Glätten oder Filtern einer bereits geglätteten Reihe. Zum Beispiel können wir mit einem gleitenden Durchschnitt von Ordnung 2, wie sie mit Gewichten berechnet werden, also die MA bei x 2 0,5 x 1 0,5 x 2 betrachten. Ebenso ist die MA bei x 3 0,5 x 2 0,5 x 3. Wenn wir Eine zweite Glättung oder Filterung anwenden, haben wir 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 dh die zweistufige Filterung Prozess (oder Faltung) hat einen variabel gewichteten symmetrischen gleitenden Durchschnitt mit Gewichten erzeugt. Mehrere Windungen können sehr komplexe gewichtete Bewegungsdurchschnitte erzeugen, von denen einige von besonderem Gebrauch in spezialisierten Bereichen, wie in Lebensversicherungsberechnungen, gefunden wurden. Bewegliche Mittelwerte können verwendet werden, um periodische Effekte zu entfernen, wenn sie mit der Länge der Periodizität als bekannt berechnet werden. Zum Beispiel, mit monatlichen Daten saisonale Variationen können oft entfernt werden (wenn dies das Ziel ist), indem Sie einen symmetrischen 12-Monats-gleitenden Durchschnitt mit allen Monaten gleich gewichtet, mit Ausnahme der ersten und letzten, die mit 12 gewichtet werden. Dies ist, weil es wird 13 Monate im symmetrischen Modell (aktuelle Zeit, t. - 6 Monate). Die Summe wird durch 12 geteilt. Ähnliche Verfahren können für jede klar definierte Periodizität angenommen werden. Exponentiell gewichtete Bewegungsdurchschnitte (EWMA) Mit der einfachen gleitenden Durchschnittsformel: Alle Beobachtungen werden gleich gewichtet. Wenn wir diese gleichen Gewichte nennen, alpha t. Jedes der k Gewichte würde 1 k betragen. So wäre die Summe der Gewichte 1, und die Formel wäre: Wir haben bereits gesehen, dass mehrere Anwendungen dieses Prozesses dazu führen, dass die Gewichte variieren. Bei exponentiell gewichteten Bewegungsdurchschnitten wird der Beitrag zum Mittelwert aus Beobachtungen, die in der Zeit mehr entfernt werden, reduziert und damit neue (lokale) Ereignisse hervorgehoben. Im wesentlichen wird ein Glättungsparameter, 0lt alpha lt1, eingeführt und die Formel überarbeitet: Eine symmetrische Version dieser Formel wäre von der Form: Werden die Gewichte im symmetrischen Modell als Begriffe der Binomialexpansion ausgewählt, (1212) 2q. Sie werden auf 1 summieren, und wenn q groß wird, wird die Normalverteilung angenähert. Dies ist eine Form der Kernel-Gewichtung, wobei die Binomie als Kernfunktion fungiert. Die im vorigen Unterabschnitt beschriebene zweistufige Faltung ist genau diese Anordnung, wobei q 1 die Gewichte ergibt. Bei der exponentiellen Glättung ist es notwendig, einen Satz von Gewichten zu verwenden, die auf 1 summieren und die Größe geometrisch verkleinern. Die verwendeten Gewichte sind typischerweise in der Form: Um zu zeigen, dass diese Gewichte auf 1 summieren, betrachten wir die Ausdehnung von 1 als Reihe. Wir können den Ausdruck in Klammern mit der Binomialformel (1- x) p schreiben und erweitern. Wobei x (1-) und p -1, was ergibt: Dies ergibt dann eine Form des gewichteten gleitenden Durchschnitts der Form: Diese Summation kann als eine Wiederholungsrelation geschrieben werden, die die Berechnung stark vereinfacht und das Problem vermeidet, dass das Gewichtungsregime Sollte strikt unendlich sein, damit die Gewichte auf 1 summieren (für kleine Werte von alpha ist dies normalerweise nicht der Fall). Die Notation, die von verschiedenen Autoren verwendet wird, variiert. Manche verwenden den Buchstaben S, um anzuzeigen, daß die Formel im wesentlichen eine geglättete Variable ist und schreibt: Während die Kontrolle Theorie Literatur oft Z anstelle von S für die exponentiell gewichteten oder geglätteten Werte verwendet (siehe z. B. Lucas und Saccucci, 1990, LUC1 , Und die NIST-Website für weitere Details und bearbeitete Beispiele). Die oben zitierten Formeln stammen aus der Arbeit von Roberts (1959, ROB1), aber Hunter (1986, HUN1) verwendet einen Ausdruck der Form: die für die Verwendung in einigen Kontrollverfahren besser geeignet ist. Bei alpha 1 ist die mittlere Schätzung einfach der gemessene Wert (oder der Wert des vorherigen Datenelementes). Mit 0,5 ist die Schätzung der einfache gleitende Durchschnitt der aktuellen und früheren Messungen. Bei der Vorhersage der Modelle ist der Wert S t. Wird oft als Schätz - oder Prognosewert für den nächsten Zeitraum verwendet, dh als Schätzung für x zum Zeitpunkt t 1. Damit haben wir: Dies zeigt, dass der Prognosewert zum Zeitpunkt t 1 eine Kombination aus dem vorherigen exponentiell gewichteten gleitenden Durchschnitt ist Plus eine Komponente, die den gewichteten Vorhersagefehler darstellt, epsilon. Zum Zeitpunkt t. Unter der Annahme, dass eine Zeitreihe gegeben ist und eine Prognose erforderlich ist, ist ein Wert für Alpha erforderlich. Dies kann aus den vorhandenen Daten abgeschätzt werden, indem die Summe der quadratischen Vorhersagefehler mit variierenden Werten von alpha für jedes t 2,3 ausgewertet wird. Einstellung der ersten Schätzung als der erste beobachtete Datenwert x 1. Bei den Steuerungsanwendungen ist der Wert von alpha wichtig, der bei der Bestimmung der oberen und unteren Kontrollgrenzen verwendet wird und die erwartete durchschnittliche Lauflänge (ARL) beeinflusst Bevor diese Kontrollgrenzen kaputt sind (unter der Annahme, dass die Zeitreihe einen Satz von zufälligen, identisch verteilten unabhängigen Variablen mit gemeinsamer Varianz darstellt). Unter diesen Umständen ist die Varianz der Kontrollstatistik: (Lucas und Saccucci, 1990): Kontrollgrenzen werden gewöhnlich als feste Vielfache dieser asymptotischen Varianz gesetzt, z. B. - 3 mal die Standardabweichung. Wenn beispielsweise Alpha 0,25 und die zu überwachenden Daten eine Normalverteilung N (0,1) haben, wenn die Kontrolle begrenzt wird, werden die Regelgrenzen - 1.134 sein und der Prozeß erreicht eine oder andere Grenze in 500 Schritten im Durchschnitt. Lucas und Saccucci (1990 LUC1) leiten die ARLs für eine breite Palette von Alpha-Werten und unter verschiedenen Annahmen mit Markov Chain Verfahren ab. Sie tabellieren die Ergebnisse, einschließlich der Bereitstellung von ARLs, wenn der Mittelwert des Kontrollprozesses um ein Vielfaches der Standardabweichung verschoben wurde. Zum Beispiel ist bei einer 0,5-Schicht mit alpha 0,25 die ARL weniger als 50 Zeitschritte. Die oben beschriebenen Ansätze werden als einzelne exponentielle Glättung bezeichnet. Da die Prozeduren einmal auf die Zeitreihen angewendet werden und dann analysiert oder kontrolliert werden, werden Prozesse auf dem resultierenden geglätteten Datensatz durchgeführt. Wenn der Datensatz einen Trend und saisonale Komponenten enthält, kann eine zweidimensionale oder dreistufige Exponentialglättung als Mittel zur Beseitigung (expliziten Modellierung) dieser Effekte angewendet werden (siehe weiter unten den Abschnitt "Vorhersage" und das NIST-Beispiel). CHA1 Chatfield C (1975) Die Analyse der Times-Serie: Theorie und Praxis. Chapman und Hall, London HUN1 Hunter J S (1986) Der exponentiell gewichtete gleitende Durchschnitt. J von Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Exponentiell gewichtete Moving Average Control Schemes: Eigenschaften und Erweiterungen. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Kontrolltabelle Tests basierend auf geometrischen Moving Averages. Technometrics, 1, 239-250Verwaltung der Varianz der exponentiell gewichteten Diese Vorschau zeigt die Seiten 38ndash42. Melden Sie sich an, um den vollständigen Inhalt anzuzeigen. Ableiten der Varianz des exponentiell gewichteten gleitenden Durchschnitts z i. 0 22 0 2 var () var (1)) var () 2 j t t j j j tj j Zx x n 6154861548 6154861555 61548 61605 61485 61501 61605 61485 61501 6167361689 6150161485 61669 6167461690 6167061686 616961686 61501 6167161687 61485 6167261688 9,39. Äquivalenz der gleitenden durchschnittlichen und exponentiell gewichteten gleitenden Durchschnittskontrollen. Zeigen Sie, dass, wenn 61548 2 (w 1) für das EWMA-Kontrollschema ist, dieses Diagramm äquivalent zu einem w-periodischen gleitenden Durchschnittskontrolldiagramm in dem Sinne ist, dass die Steuergrenzen im stationären Zustand identisch sind. Für das EWMA-Diagramm sind die Steady-State-Regelgrenzen 3 (2) xn 61555 61617 61485. Einsetzen von 61548 2 (w 1), 2 13 1 33 2 2 1 wxxx wn wn nw 6155561555 61483 61617 61501 61617 61501 61617 61485 61483. Die sind die gleichen wie die Grenzen für die MA-Chart. 9,40. Fortsetzung der Übung 9.39. Zeigen Sie, dass, wenn 61548 2 (w 1), dann die durchschnittlichen ldquoagesrdquo der Daten, die bei der Berechnung der Statistik z i und M i verwendet werden, identisch sind. Das Durchschnittsalter der Daten in einem w-Periode-gleitenden Durchschnitt beträgt 1 0 11 2 w j w j w 61485 61501 61485 61501 61669. Im EWMA beträgt das Gewicht, das einem Stichprobenmittel gegeben wird, vor 61548 (1 - 61548) j. So ist das Durchschnittsalter 0 1) j j j 61605 61501 61485 6148561501 61669. Durch gleichzeitige Durchschnittsalter: 2 2 1 w w 6148561485 61501 61501 61483 Diese Vorschau hat absichtlich verschwommene Abschnitte. Melden Sie sich an, um die Vollversion anzuzeigen. KUMULATIVE SUMME UND EXPONENTIELL GEWICHTETE BEWEGLICHE DURCHSCHNITTSTEUERUNGSKARTEN 9-39 9.41. Zeigen Sie, wie die Regelgrenzen für das gleitende Durchschnittskontrolldiagramm geändert werden, wenn rationale Untergruppen der Größe n gt 1 in jeder Periode beobachtet werden und das Ziel des Kontrolldiagramms darin besteht, den Prozessmittel zu überwachen. Für n gt 1, 00 33 Kontrollgrenzen w n wn 6155561555 6154961549 6167061686 61501 61617 61501 61617 6167161687 6167261688 9.42. Ein Shewhart x-Diagramm hat eine Mittellinie bei 10 mit UCL 16 und LCL 4. Angenommen, Sie möchten dieses Diagramm mit einem EWMA-Kontrollschema mit 61548 0,1 und der gleichen Kontrollgrenze in 61555 - Einheiten ergänzen, wie sie auf dem x-Diagramm verwendet werden. Was sind die Werte der steady-state oberen und unteren Kontrollgrenzen auf dem EWMA-Diagramm x Chart: CL 10, UCL 16, LCL 4 UCL CL 16 10 6 xxxkkk 61555 6150161483 6150161485 61501 EWMA-Diagramm: UCL CL (2) CL 0.1 ( 2 0,1) 10 6 (0,2294) 11,3765 LCL 10 6 (0,2294) 8,6236 ln 61548 61501 61483 61485 61501 61483 61485 61501 61483 61501 61501 61485 61501 9,43 Ein EWMA-Kontrollschema verwendet 61548 0,4. Wie breit sind die Grenzen auf dem Shewhart-Kontrollschema, ausgedrückt als Vielfaches der Breite der stationären EWMA-Grenzwerte Für EWMA sind Steady-State-Grenzwerte (2) L 61555 61548 6161761485 Für Shewhart sind Steady-State-Grenzen k 61617) 0,4 (2 0,4) 0,5 kL 61501 9-40 KAPITEL 9 KUMULATIVE SUMME UND EXPONENTIELL GEWICHTTE BEWEGLICHE DURCHSCHNITTSTEUERUNGSKARTEN 9.44. Betrachten Sie die Ventilausfalldaten in Beispiel 7.6. Richten Sie ein CUSUM-Diagramm ein, um die Zeit zwischen den Ereignissen zu überwachen, die den in diesem Beispiel dargestellten transformierten Variablenansatz verwenden. Verwenden Sie standardisierte Werte von h 5 und k frac12. Die beiden Alternativen, um ein CUSUM-Diagramm mit transformierten Daten zu zeichnen, sind: 1. Verwandeln Sie die Daten, das Ziel (falls gegeben) und die Standardabweichung (falls gegeben), dann verwenden Sie diese Ergebnisse im Dialogfeld CUSUM-Diagramm oder 2. Verwandeln Sie das Ziel (Falls gegeben) und Standardabweichung (falls gegeben), dann verwenden Sie die Box-Cox-Registerkarte unter CUSUM-Optionen, um die Daten zu transformieren. Die Lösung unten verwendet Alternative 2. Diese Vorschau hat absichtlich verschwommene Abschnitte. Melden Sie sich an, um die Vollversion anzuzeigen. KUMULATIVE SUMME UND EXPONENTIELL GEWICHTETE BEWEGLICHE DURCHSCHNITTSTEUERUNGSKARTEN 9-41 9.44. Fortsetzung Von Beispiel 7.6 verwandeln Sie die Zeit-zwischen-Ausfälle (Y) - Daten in eine annähernd normale Verteilung mit X Y 0.2777. TY 700, TX 700 0.2777 6.167, k 0.5, h 5 MTB gt Stat gt Kontrollkarten gt Zeitgewichtete Diagramme gt CUSUM Ein einseitiger unterer CUSUM wird benötigt, um eine Erhöhung der Ausfallrate zu detektieren, oder gleichermaßen eine Abnahme der Zeit - Zwischen-fehlern Bewerten Sie den unteren CUSUM auf dem Minitab-Diagramm, um die Stabilität zu beurteilen. Dies ist das Ende der Vorschau. Melden Sie sich an, um auf den Rest des Dokuments zuzugreifen. Diese Hausaufgabenhilfe wurde auf 10302016 für den Kurs IE 672, der von Professor Abdou während des Herbstes 03914 unter NJIT gelehrt wurde, hochgeladen. Klicken Sie hier, um die Dokumentdetails zu bearbeiten. Ich habe ein Problem, ein Stück Papier zu verstehen. Schätzen Sie jeden Hinweis oder Hilfe. Es sagt: Ein Sensor zeichnet Z (i) in Intervallen von 1 Sekunde auf und berechnet die Hintergrundwerte U (i) mit der Formel: wobei R ein konstanter Faktor ist und U (0) aus Vormessdaten berechnet wird. Nun, irgendeine Idee, ob diese Formel berühmt ist Ist es ein zweimaliges Gauß-Mischgeräusch Dann sagt es genau so: Die Varianz U (i) dieser Werte wird aus den berechneten Werten U (i) berechnet: wobei k Sigma ist Faktor und T ist die gegebene Messzeit. Ich habe keine Ahnung, wie die Varianz so etwas wurde. Ich verstehe den Begriff T und die sqrt Funktion aber die Gesamtformel, keine Ahnung.
No comments:
Post a Comment