Bei der Berechnung eines laufenden gleitenden Durchschnittes ist die Platzierung des Mittelwertes in der mittleren Zeitspanne sinnvoll. Im vorigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und als nächstes in die Periode 3 gelegt. Wir hätten den Durchschnitt in die Mitte des Zeitintervall von drei Perioden, also neben Periode 2 Das funktioniert gut mit ungeraden Zeiträumen, aber nicht so gut für gleichzeitige Zeiträume Also wo würden wir den ersten gleitenden Durchschnitt platzieren, wenn M 4.Technisch, würde der Moving Average fallen T 2 5, 3 5. Um dieses Problem zu vermeiden, glätten wir die MA s mit M 2 So weglassen wir die geglätteten Werte. Wenn wir eine gerade Anzahl von Ausdrücken beurteilen, müssen wir die geglätteten Werte glätten. Die folgende Tabelle zeigt die Ergebnisse mit M 4. David, Ja, MapReduce ist beabsichtigt, auf einer großen Menge an Daten zu operieren Und die Idee ist, dass im Allgemeinen die Karte und reduzieren Funktionen sollte nicht darauf achten, wie viele Mapper oder wie viele Reduzierstücke gibt es, das ist nur Optimierung Wenn Sie Denken Sie sorgfältig über den Algorithmus, den ich gepostet habe, können Sie sehen, dass es nicht wichtig ist, welcher Mapper bekommt, welche Teile der Daten jeder Eingabedatensatz für jede reduzierende Operation verfügbar ist, die es benötigt Joe K Sep 18 12 um 22 30.In bester meiner Verständnis gleitenden Durchschnitt ist nicht schön Karten zu MapReduce Paradigma seit seiner Berechnung ist im Wesentlichen Schiebefenster über sortierte Daten, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten Lösung Ich sehe, ist wie folgt a Um benutzerdefinierte Partitionierer zu machen, um zu machen Zwei verschiedene Trennwände in zwei Läufen In jedem Lauf werden Ihre Reduzierstücke unterschiedliche Datenbereiche erhalten und gleitenden Durchschnitt berechnen, wo es angemessen ist, zu veranschaulichen. Im ersten Lauf werden Daten für Reduzierstücke R1 Q1, Q2, Q3, Q4 R2 Q5, Q6, Q7 sein , Q8.hier Sie cacluate gleitenden Durchschnitt für einige Qs. In nächsten Lauf Ihre Reduzierer sollten Daten wie R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14.Und caclulate den Rest der sich bewegenden Mittelwerte Dann müssen Sie Ergebnisse zusammenfassen. Idea der benutzerdefinierten Partitionierer, dass es zwei Modi der Operation haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung In einem Pseudocode wird es wie diese Partitionstaste aussehen SHIFT MAXKEY numOfPartitions wo SHIFT wird aus der Konfiguration genommen MAXKEY Maximalwert der Taste, die ich annehmen Einfachheit, die sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split begrenzt ist und kann nicht über Split s Grenze gleiten. Eine andere Lösung wäre, um benutzerdefinierte Logik der Aufteilung der Eingangsdaten zu implementieren ist es Teil der InputFormat Es kann Getan werden, um 2 verschiedene Folien zu tun, ähnlich wie partitioning. answered Sep 17 12 bei 8 59.Die Daten stark vorgeschlagen, eine 5- bis 6-jährige Zyklizität der Tollwut-Inzidenz dieser Zyklus war am deutlichsten mit einem zentrierten gleitenden Durchschnitt der Anzahl der Fälle Diagnostiziert pro Monat. Erstens, für jede der 36 Komponenten des CPI, nehme ich die Abweichung der monatlichen Inflation, Mathematical Expression Ausgelassen, aus dem 36-Monats-zentrierten gleitenden Durchschnitt der Inflation in der CPI-U.5 Perzentile der Verteilung in Der Index aus dem 36-Monats-zentrierten gleitenden Durchschnitt der Inflation in der CPI-U. Hier sind die Schritte bei der Berechnung eines vierfachen zentrierten gleitenden Durchschnitt um Beobachtung drei. Ein weiterer Weg, um dies zu beschreiben, dann ist zu sagen, dass ein Vier - Langfristig zentriert gleitenden Durchschnitt ist ein zweidimensionaler Durchschnitt eines vierfachen gleitenden Durchschnitt. Data in diesem Artikel, die sich auf Serie Gipfel und Täler für Schwarze und Hispanics reflektieren 3-Monats-zentriert gleitende Durchschnitte.
Comments
Post a Comment