BREAKING DOWN T-Test Eine Form der Hypothesenprüfung, der t-Test ist nur einer von vielen Tests, die für diesen Zweck verwendet werden. Statistiker müssen andere Tests als den t-Test verwenden, um mehr Variablen zu untersuchen, sowie für Test mit größeren Stichprobengrößen. Für eine große Stichprobengröße verwenden Statistiker einen z-Test. Weitere Testoptionen sind der Chi-Quadrat-Test und der f-Test. Statistische Analyse des T-Tests Die Formel, die verwendet wird, um den Test zu berechnen, ist ein Verhältnis: Der obere Teil des Verhältnisses ist der einfachste Teil, um zu berechnen und zu verstehen, da es einfach der Unterschied zwischen den Mitteln oder Durchschnittswerten der beiden Proben ist. Die untere Hälfte des Verhältnisses ist eine Messung der Dispersion oder Variabilität der Scores. Der untere Teil dieses Verhältnisses ist als Standardfehler der Differenz bekannt. Um diesen Teil des Verhältnisses zu berechnen, wird die Varianz für jede Probe bestimmt und dann durch die Anzahl der Individuen, die das Muster oder die Gruppe bilden, geteilt. Diese beiden Werte werden dann addiert und eine Quadratwurzel aus dem Ergebnis genommen. ZB betrachten Sie, daß ein Analytiker die Menge studieren möchte, die Pennsylvanians und Kalifornier, pro Monat, auf Kleidung ausgeben. Es wäre nicht praktisch, die Ausgabengewohnheiten eines jeden Einzelnen (oder einer Familie) in beiden Staaten aufzuzeichnen, so dass eine Stichprobe der Ausgabengewohnheiten einer ausgewählten Gruppe von Individuen aus jedem Staat entnommen wird. Die Gruppe kann von jeder kleinen bis mittleren Grße für dieses Beispiel sein, nehmen wir an, daß die Stichprobengruppe 200 Individuen ist. Die durchschnittliche Menge für Pennsylvanians kommt zu 500 die durchschnittliche Menge für Kalifornier ist 1.000. Die t-Test Fragen, ob die verschiedenen zwischen den Gruppen repräsentativ für einen wahren Unterschied zwischen den Menschen in Pennsylvania und die Menschen in Kalifornien im Allgemeinen oder wenn es wahrscheinlich ein sinnloser statistischer Unterschied ist. In diesem Beispiel, wenn theoretisch alle Pennsylvanianer 500 pro Monat auf Kleidung und alle Kalifornier verbrachte 1.000 pro Monat auf Kleidung, ist es höchst unwahrscheinlich, dass 200 zufällig ausgewählte Einzelpersonen alle verbrachte diese genaue Menge, jeweils Staat. Wenn also ein Analytiker oder ein Statistiker die im obigen Beispiel aufgeführten Ergebnisse lieferte, ist es sicher, dass der Unterschied zwischen den Probengruppen einen signifikanten Unterschied zwischen den Populationen insgesamt darstellt Finden Periodizität in jeder regelmäßigen Reihe von Daten ist es, sein Leistungsspektrum nach der Beseitigung aller allgemeinen Trend zu prüfen. (Dies eignet sich gut für automatisiertes Screening, wenn die Gesamtleistung auf einen Standardwert, wie Einheit, normalisiert wird.) Die vorläufige Trendentfernung (und die optionale Differenzierung, um die serielle Korrelation zu entfernen) ist wesentlich, um Verzerrungsperioden mit anderen Verhaltensweisen zu vermeiden. Das Leistungsspektrum ist die diskrete Fourier-Transformation der Autokovarianz-Funktion einer entsprechend geglätteten Version der Originalreihe. Wenn Sie an die Zeitreihe denken, wenn Sie eine physikalische Wellenform abtasten, können Sie abschätzen, wie stark die gesamte Wellenleistung innerhalb der jeweiligen Frequenz liegt. Das Leistungsspektrum (oder Periodogramm) zeichnet die Leistung gegenüber der Frequenz auf. Zyklische (das heißt, sich wiederholende oder saisonale Muster) zeigen sich als große Spikes, die sich an ihren Frequenzen befinden. Als Beispiel betrachten wir diese (simulierte) Zeitreihe von Resten aus einer täglichen Messung für ein Jahr (365 Werte). Die Werte schwanken um 0 ohne deutliche Trends, was zeigt, dass alle wichtigen Trends beseitigt sind. Die Fluktuation erscheint zufällig: keine Periodizität ist offensichtlich. Heres ein anderes Diagramm der gleichen Daten, gezogen, um uns zu sehen mögliche periodische Muster. Wenn Sie wirklich hart aussehen, können Sie in der Lage, eine laute, aber sich wiederholende Muster, das 11 bis 12 Mal auftritt zu erkennen. Die langwierigen Sequenzen von Werten oberhalb von Null und unter Null ergeben zumindest eine positive Autokorrelation, die zeigt, daß diese Reihe nicht vollständig zufällig ist. Heres das Periodogramm, gezeigt für Frequenzen bis zu 91 (ein Viertel der gesamten Serie Länge). Es wurde mit einem Welch-Fenster konstruiert und auf Einheitsfläche normiert (für das gesamte Periodogramm, nicht nur das hier gezeigte Teil). Die Macht sieht aus wie weißes Rauschen (kleine zufällige Schwankungen) plus zwei prominente Spikes. Sie sind schwer zu verpassen, arent sie Die größere tritt bei einer Periode von 12 und die kleinere bei einer Periode von 52. Dieses Verfahren hat damit einen monatlichen Zyklus und einen wöchentlichen Zyklus in diesen Daten. Das ist wirklich alles da drauf. Zur automatischen Erkennung von Zyklen (Saisonalität), scannen Sie das Periodogramm (das ist eine Liste von Werten) für relativ große lokale Maxima. Seine Zeit zu zeigen, wie diese Daten erstellt wurden. Die Werte werden aus einer Summe von zwei Sinuswellen, eines mit der Frequenz 12 (der quadrierten Amplitude 34) und eines anderen mit der Frequenz 52 (der quadrierten Amplitude 14) erzeugt. Das sind die Spikes im Periodogramm. Ihre Summe wird als dicke schwarze Kurve dargestellt. Iid Normales Rauschen der Varianz 2 wurde dann hinzugefügt, wie die hellgrauen Balken zeigen, die sich von der schwarzen Kurve zu den roten Punkten erstrecken. Dieses Rauschen führte die Low-Level-Wiggles am unteren Rand des Periodogramms, die sonst nur eine flache 0 wäre. Völlig zwei Drittel der gesamten Veränderung der Werte ist nicht-periodisch und zufällig, das ist sehr laut: das ist, warum seine So schwierig, die Periodizität nur durch einen Blick auf die Punkte. Dennoch (teilweise weil theres so viel Daten), die Frequenzen mit dem Periodogramm zu finden ist einfach und das Ergebnis ist klar. Anweisungen und gute Ratschläge für die Berechnung Periodogramme erscheinen auf der Website Numerical Recipes: suchen Sie nach dem Abschnitt über Leistungsspektrum Schätzung mit der FFT. R hat Code für die Periodogrammschätzung. Diese Illustrationen wurden in Mathematica 8 erstellt das Periodogramm wurde mit seiner Fourier-Funktion berechnet. Antwort # 1 am: August 19, 2010, 09:12:31 am »Die Annahme nach Entfernen aller allgemeinen Trendquotis der Achilles Heel, wie es viele Zeittrends, viele Ebenenverschiebungen, die alle in Ihrem Beispiel ausgeschlossen wurden. Die Idee, dass die Input-Serie deterministisch in der Natur fliegt in der Angesichts der möglichen Präsenz von saisonaler und regelmäßiger ARIMA-Struktur. Unbehandelte ungewöhnliche Ein-Zeit-Werte verzerren jedes periodogrammbasierte Identifikationsschema aufgrund einer Abwärts-Bias auf die Periodogramm-Schätzungen, die eine Nicht-Signifikanz ergeben. Wenn wöchentliche und oder monatliche Effekte irgendwann in der Vergangenheit geändert wurden, würde das Periodogrammbasierte Verfahren ndash IrishStat Sep 29 11 at 0:06 Irish Ich denke, Ihr Kommentar kann etwas übertreiben. Es ist am elementarsten, um zu suchen und behandeln quotUnusual Einmal-Valuesquot (aka Ausreißer), so dass dies nur erwähnt, um zu betonen, dass einige Zeitreihe Schätzer empfindlich auf Ausreißer sein kann. "Deterministisch in der Natur stellt die Grundideen falsch dar: Niemand vermutet, dass es einen Determinismus gibt (was durch die große Menge an Rauschen in der Simulation belegt wird). Die Simulation enthält ein definitives periodisches Signal als Modell - immer annähernd in Wirklichkeit - nur um den Zusammenhang zwischen dem Periodogramm und der Saisonalität zu veranschaulichen. (Fortsetzung.) Ndash whuber 9830 Sep 29 11 at 16:41 Ja, Änderungen in der Saisonalität können das Periodogramm (und die acf etc.), insbesondere Änderungen in der Frequenz (unwahrscheinlich) oder Phase (möglich) verdecken. Die Referenzen in meinem Beitrag geben eine Lösung zu behandeln, dass: sie empfehlen, mit einem beweglichen Fenster für Periodogramm Schätzung. Es gibt eine Kunst zu diesem und klar gibt es Fallstricke, so dass viel Zeitreihe Analyse profitieren von fachmännischen Behandlung, wie Sie befürworten. Aber die Frage fragt, ob es Zitronenmethoden gibt, um Saisonalität zu erkennen und unbestreitbar ist das Periodogramm eine statistisch leistungsfähige, rechentechnisch effiziente, leicht interpretierbare Option. Ndash whuber 9830 Sep 29 11 am 16:46 In meiner Welt mit sinescosines sind quotdeterministic effectsquot viel wie Monat des Jahres Indikatoren. Das Anpassen eines vordefinierten Modells beschränkt die eingefügten Werte auf ein benutzerdefiniertes Muster, oftmals unter Standard. Die Daten sollten toquot aufgelistet werden, um der analytisch unterstützten Computersoftware zu helfen, effektiv zwischen festen und stochastischen Eingaben nb zu unterscheiden. Ich beziehe mich auf ARIMA verzichtet Strukturen als stochastische oder adaptive quotdriversquot wie die angepassten Werte anpassen, um Änderungen in der Geschichte der Serie. Meiner Meinung nach die Verwendung der Periodogramm quotoversells einfache statistische Modellierung ndash IrishStat Die Wiederholung der gleichen Sache könnte nicht sinnvoll sein. Allerdings könnte es auch schön sein, den Absatz unterhalb des Periodogramms zu fixieren, um zu sagen, dass sich die Spikes bei einer Gleichfrequenz von 12 und 52 Mal pro Jahr befinden und nicht für eine Periode von quot. Fixing the plot auch zu sagen, quotfrequencyquot anstelle von quotperiodquot könnte auch schön, wenn Sie denken, es39s nicht zu nervig. Ndash Celelibi Saisonalität kann und ändert sich oft im Laufe der Zeit so Zusammenfassung Maßnahmen können völlig unzureichend sein, um Struktur zu erkennen. Man muss auf Vergänglichkeit in ARIMA Koeffizienten und oft Änderungen in der saisonalen Dummies zu testen. Zum Beispiel in einem 10-Jahres-Horizont kann es Juni-Effekt für die ersten k Jahre gewesen sein, aber die letzten 10-k Jahre gibt es Hinweise auf einen Juni-Effekt. Ein einfacher zusammengesetzter Juni-Effekt könnte nicht signifikant sein, da der Effekt nicht über die Zeit konstant war. In ähnlicher Weise kann sich auch eine saisonale ARIMA-Komponente verändert haben. Es ist darauf zu achten, dass lokale Verschiebungen und / oder lokale Zeittrends berücksichtigt werden, während sichergestellt wird, dass die Varianz der Fehler über die Zeit konstant geblieben ist. Man sollte nicht Transformationen wie GLSwighted least Squares oder Power Transformations wie logssquare roots, etc. auf die ursprünglichen Daten, sondern auf die Fehler aus einem vorläufigen Modell bewerten. Die Gaußschen Annahmen haben nichts mit den beobachteten Daten zu tun, sondern alle mit den Fehlern des Modells zu tun. Dies ist auf die Grundlagen der statistischen Tests zurückzuführen, die das Verhältnis einer nicht-zentralen Chi-Quadrat-Variablen zu einer zentralen Chi-Quadrat-Variablen verwenden. Wenn Sie eine Beispielserie aus Ihrer Welt posten möchten, würde ich mich freuen, Ihnen und der Liste eine gründliche Analyse zur Erkennung der Saisonstruktur zu vermitteln. Antwort # 1 am: September 12, 2010, 07:48:39 am »Charlies Antwort ist gut, und seine wo Id starten. Wenn Sie keine ACF-Graphen verwenden möchten, können Sie k-1 Dummy-Variablen für die k Zeitperioden anlegen. Dann können Sie sehen, ob die Dummy-Variablen sind signifikant in einer Regression mit den Dummy-Variablen (und wahrscheinlich ein Trend-Begriff). Wenn Ihre Daten vierteljährlich sind: Dummy Q2 ist 1, wenn dies das zweite Quartal ist, sonst 0 Dummy Q3 ist 1, wenn dies das dritte Quartal ist, sonst 0 Dummy Q4 ist 1, wenn dies das vierte Quartal ist, sonst 0 Note Viertel 1 ist die Base Case (alle 3 Dummies null) Vielleicht möchten Sie auch überprüfen, Zeitreihe Zersetzung in Minitab - oft als klassische Zersetzung. Am Ende, möchten Sie vielleicht etwas moderner, aber dies ist ein einfacher Ort zu starten. Ich bin ein bisschen neu für R mich, aber mein Verständnis der ACF-Funktion ist, dass, wenn die vertikale Linie über die obere gestrichelte Linie oder unterhalb der unteren gestrichelten Linie geht, gibt es einige Autoregression (einschließlich Saisonalität) . Versuchen Sie, Erstellen eines Vektors von Sinus Antwort Sinescosine etc kann für einige physikalisch-elektrische Zeitreihen nützlich sein, aber Sie müssen bewusst sein, MSB. Modellspezifikation Bias. Ndash IrishStat Autoregression bedeutet nicht Saisonalität. Ndash Jens 22 November um 12:32 Uhr Ihre Antwort 2017 Stack Exchange, Inc
No comments:
Post a Comment