So berechnen Sie die Varianz

Autor: Carl Weaver
Erstelldatum: 28 Februar 2021
Aktualisierungsdatum: 18 Kann 2024
Anonim
Varianz und Standardabweichung (Beispiel: ungeordnet, mit Zurücklegen)
Video: Varianz und Standardabweichung (Beispiel: ungeordnet, mit Zurücklegen)

Inhalt

Die Varianz misst die Ausbreitung eines Datensatzes. Eine geringe Varianz zeigt an, dass die Werte in der Menge in unmittelbarer Nähe zueinander gruppiert sind. Die hohe Varianz zeigt wiederum an, dass die Zahlen weiter verteilt sind. Dieses Konzept hat mehrere Verwendungszwecke in der Statistik. Durch den Vergleich der Varianz zwischen zwei Datensätzen (z. B. Ergebnisse für männliche und weibliche Patienten) kann beispielsweise untersucht werden, ob eine bestimmte Variable einen spürbaren Effekt verursacht. Dies ist auch beim Erstellen statistischer Modelle sehr nützlich, da eine geringe Varianz ein Zeichen dafür sein kann, dass Sie die Daten überanpassen.

Schritte

Methode 1 von 2: Berechnung der Varianz einer Stichprobe

  1. Schreiben Sie den Datensatz für Ihre Probe. In den meisten Fällen haben Statistiker nur Zugriff auf eine Stichprobe oder eine Teilmenge der von ihnen untersuchten Population. Anstatt beispielsweise die Bevölkerungskosten "aller Autos in Deutschland" zu analysieren, könnte ein Statistiker eine Zufallsstichprobe von einigen tausend Autos analysieren. Er kann diese Stichprobe verwenden, um die Kosten deutscher Autos abzuschätzen, aber es ist unwahrscheinlich, dass das Ergebnis genau mit den tatsächlichen Zahlen übereinstimmt.
    • Beispiel: Wenn Sie die Anzahl der täglich in einem Café verkauften Cookies analysieren, können Sie sechs zufällige Tage abtasten und die folgenden Ergebnisse erzielen: 17, 15, 23, 7, 9, 13. Dies ist eine Stichprobe, keine Population, da für jeden Tag, an dem die Cafeteria geöffnet war, keine Daten vorliegen.
    • Wenn Sie haben alle Datenpunkte für eine Population, fahren Sie mit der folgenden Methode fort.

  2. Schreiben Sie die Stichprobenvarianzformel. Die Varianz eines Datensatzes gibt an, wie verteilt sie sind. Je näher an Null, desto näher sind sie beieinander. Verwenden Sie beim Arbeiten mit Beispieldatensätzen die folgende Formel, um die Varianz zu berechnen:
    • = /(n - 1)
    • stellt die Varianz dar, die immer in quadratischen Einheiten gemessen wird.
    • repräsentiert einen Begriff aus Ihrem Datensatz.
    • ∑, was "Summation" bedeutet, fordert Sie auf, die folgenden Terme für jeden Wert von zu berechnen und sie dann zu addieren.
    • x̅ repräsentiert den Durchschnittswert der Probe.
    • n ist die Anzahl der in der Stichprobe vorhandenen Datenpunkte.

  3. Berechnen Sie den Stichprobenmittelwert. Das Symbol x̅ oder "x bar" bezieht sich auf das arithmetische Mittel einer Stichprobe. Berechnen Sie es wie einen anderen Durchschnittstyp: Fügen Sie alle vorhandenen Daten hinzu und dividieren Sie das Ergebnis durch die Anzahl.
    • Beispiel: Fügen Sie zunächst die Datenpunkte hinzu: 17 + 15 + 23 + 7 + 9 + 13 = 84.
      Teilen Sie als nächstes Ihre Antwort durch die Menge oder sechs in diesem Fall: 84 ÷ 6 = 14.
      Arithmetisches Mittel der Stichprobe = x̅ = 14.
    • Sie können sich das arithmetische Mittel so vorstellen, als ob es den "Mittelpunkt" des Datensatzes darstellt. Wenn sie um den Mittelwert gruppiert sind, bedeutet dies, dass die Varianz gering ist. Wenn sie gut verteilt und weit entfernt sind, ist die Varianz hoch.

  4. Subtrahieren Sie den Mittelwert von jeder der Daten. Jetzt ist die Zeit zu berechnen - x̅, wo es jede im Datensatz vorhandene Zahl darstellt. Jede Antwort gibt die Abweichung zwischen der Zahl und dem arithmetischen Mittel an, oder mit anderen Worten, wie groß der Abstand zwischen ihnen ist.
    • Beispiel:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Es ist einfach, die geleistete Arbeit zu überprüfen, da die kombinierten Antworten zu Null führen sollten. Dies geschieht aufgrund der Definition des arithmetischen Mittelwerts, da negative Antworten (Abstand zwischen dem Mittelwert und den kleinsten Zahlen) die positiven Antworten (Abstand zwischen dem Mittelwert und den größten Zahlen) genau aufheben.
  5. Quadrieren Sie jedes Ergebnis. Wie oben beschrieben, ergibt die aktuelle Liste der Abweichungen (- x̅) Null. Dies bedeutet, dass die "durchschnittliche Abweichung" auch immer Null ist, was nichts über die Datenstreuung aussagt. Um dieses Problem zu lösen, ermitteln Sie das Quadrat jeder Abweichung. Dadurch werden alle in positive Zahlen umgewandelt, sodass negative und positive Zahlen nicht mehr bei Null aufgehoben werden.
    • Beispiel:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Sie haben jetzt den Wert (- x̅) für jeden Datenpunkt in der Stichprobe.
  6. Finden Sie die Summe der quadrierten Werte. Nun berechnen wir den gesamten Zähler der Formel: ∑.Das Kapitalsigma ∑ führt dazu, dass wir den Wert des folgenden Terms für jeden Wert von addieren. Sie haben bereits (- x̅) für jeden aktuellen Wert in der Stichprobe berechnet und müssen nun nur noch die Ergebnisse hinzufügen.
    • Beispiel: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Teilen Sie durch n - 1, wobei n die Anzahl der Datenpunkte darstellt. Vor langer Zeit haben Statistiker bei der Berechnung der Varianz einer Stichprobe durch n geteilt. Dies gibt Ihnen den Mittelwert der quadratischen Abweichung, der perfekt zur Stichprobenvarianz passt. Denken Sie jedoch daran, dass eine Stichprobe nur eine Schätzung einer größeren Population darstellt. Wenn Sie eine andere Zufallsstichprobe nehmen und dieselben Berechnungen durchführen, erhalten Sie ein völlig anderes Ergebnis. Wenn Sie also durch n - 1 dividieren, anstatt nur n zu verwenden, erhalten Sie eine bessere Schätzung der Varianz einer größeren Population, was Sie herausfinden möchten. Diese Korrektur ist so häufig, dass sie zur am meisten akzeptierten Definition der Varianz einer Stichprobe geworden ist.
    • Beispiel: In diesem Beispiel gibt es sechs Datenpunkte, so dass n = 6 ist.
      Stichprobenvarianz = 33,2
  8. Verstehen Sie die Konzepte von Varianz und Standardabweichung. Beachten Sie, dass die Varianz in der quadratischen Einheit der Originaldaten gemessen wird, da die Formel einen Exponenten enthält. Dies kann ein lediglich intuitives Verständnis behindern. Anstelle dieses Ansatzes ist es oft nützlich, die Standardabweichung zu verwenden. Trotzdem haben Sie keine Mühe verschwendet, da dies als Quadratwurzel der Varianz definiert ist. Aus diesem Grund wird die Varianz einer Stichprobe als und die Standardabweichung der Stichprobe als geschrieben.
    • Beispielsweise beträgt die Standardabweichung der vorherigen Stichprobe s = √33,2 = 5,76.

Methode 2 von 2: Berechnung der Varianz einer Population

  1. Beginnen Sie mit einem Bevölkerungsdatensatz. Der Begriff "Bevölkerung" bezieht sich auf die Gesamtheit der relevanten Beobachtungen. Wenn Sie beispielsweise das Alter der Einwohner von São Paulo untersuchen, umfasst die Bevölkerung das Alter jedes in diesem Bundesstaat lebenden Bürgers. Für ein so großes Dataset sollten Sie normalerweise eine Tabelle erstellen. Hier ist jedoch ein kleineres Dataset als Beispiel:
    • Beispiel: Im städtischen Zoo befinden sich genau sechs Aquarien in einem Raum. Die sechs Aquarien enthalten folgende Fischmenge:





  2. Schreiben Sie die Formel für die Populationsvarianz. Da eine Population alle Daten enthält, die Sie benötigen, gibt Ihnen diese Formel die Varianz mit Genauigkeit. Um es von der Stichprobenvarianz (die nur eine Schätzung ist) zu unterscheiden, verwenden Statistiker verschiedene Variablen:
    • σ = /n
    • σ = Populationsvarianz. Hier haben wir ein winziges quadratisches Sigma, weil die Varianz in quadratischen Einheiten gemessen wird.
    • repräsentiert einen Begriff aus Ihrem Datensatz.
    • Die Terme innerhalb von ∑ werden jeweils berechnet und dann addiert.
    • μ repräsentiert den Bevölkerungsdurchschnitt.
    • n steht für die Anzahl der Datenpunkte in der Grundgesamtheit.
  3. Finden Sie das arithmetische Mittel der Bevölkerung. Bei der Analyse einer Population repräsentiert das Symbol μ ("mu") das arithmetische Mittel. Um es zu finden, addieren Sie alle Datenpunkte und dividieren Sie das Ergebnis durch seine Menge.
    • Sie können sich das arithmetische Mittel als Mittelpunkt vorstellen, aber denken Sie daran, dass es in der Mathematik viele Definitionen des Mittelwerts gibt.
    • Beispiel: Durchschnitt = μ = = 10,5
  4. Subtrahieren Sie den Durchschnitt von jedem Datenpunkt. Datenpunkte nahe dem Mittelwert führen zu einer Differenz nahe Null. Wiederholen Sie das Subtraktionsproblem mit jedem Datenpunkt, und Sie werden beginnen, die Probendispersion zu verstehen.
    • Beispiel:
      - μ = 5 - 10,5 = -5,5
      - μ = 5 - 10,5 = -5,5
      - μ = 8 - 10,5 = -2,5
      - μ = 12 - 10,5 = 1,5
      - μ = 15 - 10,5 = 4,5
      - μ = 18 - 10,5 = 7,5
  5. Quadrieren Sie jede Antwort. Nun sind einige der Zahlen aus dem letzten Schritt negativ und andere positiv. Wenn Sie die Daten auf einer numerischen Linie anzeigen, repräsentieren diese beiden Kategorien die Zahlen links und rechts vom Durchschnitt. Dies ist für die Berechnung der Varianz nicht hilfreich, da sich beide Gruppen gegenseitig aufheben. Quadrieren Sie jeden Wert, um alle positiv zu machen.
    • Beispiel:
      (- μ) für jeden Wert von ich von 1 bis 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Finden Sie das arithmetische Mittel der Ergebnisse. Sie haben jetzt einen Wert für jeden Datenpunkt, der (indirekt) mit dem Abstand zum arithmetischen Mittel zusammenhängt. Um diese Werte zu mitteln, addieren Sie sie und dividieren Sie sie durch ihre Menge.
    • Beispiel:
      Populationsvarianz = 24,25
  7. Verwenden Sie das Ergebnis in der Formel. Wenn Sie sich zu Beginn der Methode nicht sicher sind, wie es mit der Formel zusammenhängt, versuchen Sie, das Problem ausführlich zu schreiben:
    • Sobald Sie die Differenz zwischen dem Mittelwert und den Quadraten gefunden haben, haben Sie die Werte (- μ), (- μ) usw., bis Sie (- μ) erreichen, wobei, was den letzten Datenpunkt in der darstellt einstellen.
    • Um den Durchschnitt dieser Werte zu ermitteln, addieren Sie sie und dividieren Sie das Ergebnis durch n: (((- μ) + (- μ) + ... + (- μ)) / n
    • Nachdem Sie den Zähler in Sigma-Notation umgeschrieben haben, haben Sie /n, die Formel zur Berechnung der Varianz.

Tipps

  • Da es schwierig ist, die Varianz zu interpretieren, wird dieser Wert im Allgemeinen als Ausgangspunkt für die Berechnung der Standardabweichung verwendet.
  • Die Verwendung von "n - 1" anstelle von "n" im Nenner bei der Analyse von Proben stellt eine Technik dar, die als Bessel-Korrektur bezeichnet wird. Die Stichprobe stellt nur eine Schätzung der gesamten Population dar, und der Stichprobenmittelwert wird beeinflusst, um dieser Schätzung zu entsprechen. Diese Korrektur beseitigt wiederum diesen Einfluss. Dies hängt damit zusammen, dass durch Auflisten von n - 1 Datenpunkten der x-te Endpunkt bereits begrenzt wurde, da nur wenige Werte zu dem in der Varianzformel verwendeten Stichprobenmittelwert (x̅) führen.

Wie man schöne Haut hat

Alice Brown

Kann 2024

Jeder möchte auf einfache Wei e eine chöne, aubere und unmarkierte Haut haben. Aber e i t chwierig, einen Trick zu finden, der wirklich funktioniert. owohl Männer al auch Frauen kö...

Zieh deine chnür enkel au . Tauchen ie ie in eine chü el mit warmem Wa er und Wa chpulver oder werfen ie ie in die Wa chma chine. E i t einfacher, ie zu reinigen, wenn ie ie entfernen, w...

Seitenwahl