Die Statistik behandelt Verfahren zur Sammlung, Beschreibung, Analyse und Beurteilung von Daten (Informationen, die als Zahlen vorliegen).
-Kurz: Alles, was mit der Erhebung und Auswertung von Daten zu tun hat.
-Häufige Ziele:
- Rationale Entscheidungen aufgrund der Daten treffen (z.B.über Hypothesen)
- Vorhersagen
Zwei Teildisziplinen
Deskriptive (beschreibende) Statistik
•Übersichtliche, zusammenfassende Beschreibung und Analyse der Merkmale von Objekten (z.B. Personen). → z.B. Mittelwert
•Deskriptive Statistiken sagen ausschließlich etwas über diejenigen Objekte aus, die tatsächlich untersucht wurden.
Inferenzstatistik (schließende Statistik)
•Es liegen Daten aus einer Stichprobe vor, angestrebt ist aber eine Aussage über Population.
•(Induktiver) Schluss von Stichprobe auf Population
•Dieser Schluss ist mit Fehlerwahrscheinlichkeit behaftet (kein Beweis!)
•Zwei spezifische Verfahren
à wenn ich 20 Leute untersuche kann ich damit keine Aussage für die ganze Population treffen
à induktiver Schluss à 2 spezifische Verfahren (a und b)
a) Konfidenzintervall: Wie sicher kann ich sein, dass ein bestimmtes Intervall den
tatsächlichen Wert in der Population beinhaltet?
b) Signifikanztest: Wie wahrscheinlich ist das Stichprobenergebnis (z. B. ein bestimmter
Unterschied in der Intelligenz) unter der Annahme, dass in der
Population kein Effekt vorhanden ist (z. B. kein Unterschied in der Intelligenz)
Alltagspsychologie
•Alltagspsychologische Erklärungen sind keineswegs immer falsch aber oft!
•Warum?
•Erkenntnisgewinn setzt voraus, dass Informationen korrekt wahrgenommen, gespeichert, verarbeitet und integriert werden.
•Mit allen diesen Prozessen haben Menschen zuweilen Probleme.
•Denkfehler, Gedächnistäuschungen, …
Ein systematischer Fehler in alltagspsychologischen Erklärungen
•Fundamentaler Attributionsfehler:
–Das Verhalten anderer wird primär mit ihren Persönlich-keitseigenschaften erklärt. Aspekte der jeweiligen Situation werden als mögliche Gründe für ein Verhalten weniger beachtet.
•Ausnahme:
–Das eigene Verhalten wird eher mit situativen Merkmalen begründet.
•Konsequenz:
–Ein und dasselbe Verhalten wird vom Handelnden oftmals anders erklärt als von einem Beobachter
Alltagspsychologie vs. wissenschaftliche Psychologie
Wie wird überprüft, ob eine Theorie (Hypothese, Annahme) stimmt?
Alltagspsychologie
•Stärke der subjektiven Überzeugung
•Berufung auf “Autorität”
•Anführen eines oder mehrerer Beispiele
•konfirmatorische Prüfung
Wissenschaftliche Psychologie
•Kritische und systematische Prüfung mit Hilfe geeigneter Methoden
t-Test, einfachste Version: Gefundener Mittelwert vs. theoretischer Wert
t-Werte folgen einer t-Verteilung mit n-1 Freiheitsgraden (df=n-1)
Der Standardfehler des Mittels (= Standard-abweichung
der Stichprobenverteilung des Mittels) wird umso kleiner
• Download Link zum vollständigen und leserlichen Text • Dies ist eine Tauschbörse für Dokumente • Laden sie ein Dokument hinauf, und sie erhalten dieses kostenlos • Alternativ können Sie das Dokument auch kаufen
Dieser Textabschnitt ist in der Vorschau nicht sichtbar. Bitte Dokument downloaden.
•Zulässige Transformationen: Alle ein-eindeutigen
•Sinnvolle Kenngrößen: Absolute, prozentuale Häufigkeiten; Lagemaß: Modalwert; Korrelationsmaß: z.B. φ-Koeffizient; Signifikanztest: z.B. Binomialtest
•Beispiele: Single-Charts; Windstärke nach Beaufort; alle Rangreihen (z.B. Tabellenplätze); Schulnoten (?)
•Zulässige Transformationen: monoton steigende
•Sinnvolle Kenngrößen (zusätzlich): Kumulierte Häufigkeiten; Prozentränge; Lagemaß: Median; Streuungsmaß: Quartilsabstand; Korrelationsmaße: z.B. Kendalls τ; Signifikanztest: z.B. Wilcoxon-Test
Die Beaufort-Skala
km/h
<1
62-74
Intervallskala
•Mögliche Aussage (zusätzlich): Unterschiede zwischen Merkmalsausprägungen können nach Größe geordnet werden; Gleichheit von Differenzen - Nullpunkt und Maßeinheit sind willkürlich
•Beispiele: Temperaturskalen nach Celsius und Fahrenheit; IQ-Werte; Ratingskalen (?)
•Zulässige Transformationen: lineare (y = a ∙ x + b) z.B.: F = 1,8 ∙ C + 32
•Zusätzlich ist die Maßeinheit eindeutig festgelegt
•Beispiele: Häufigkeiten (der Beteiligung am Unterricht, des Blickkontakts zwischen Verliebten )
•Zulässige Transformationen: keine
•Sinnvolle Kenngrößen (zusätzlich): keine
Beispiele für Skalenniveaus
Ihre Kontonummer (Nominalskala à Zahl = keine Bedeutung)
Die Nummern, die Sie auf dem Einwohnermeldeamt ziehen (Ordinalskala)
Ihr Klausurergebnis in Statistik I als Maß für Ihre Methodenkenntnisse (Ordinalsk.)
Ihr Kopfumfang als Maß für Ihre Intelligenz (= sinnlos à Keine Skala)
Ihre Antwort auf die Aussage „Abtreibung sollte generell erlaubt werden“ (stark dagegen = 1, dagegen = 2, weiß nicht = 3, dafür = 4, stark dafür = 5) als Maß der Einstellung zum Thema Abtreibung
Skalenniveaus in den Sozialwissenschaften
•In der Sozialwissenschaften werden oftmals Konstrukte gemessen
à Konstrukt: Nicht direkt beobachtbare Variable (z.B. Intelligenz, Lernerfolg,
Konzentrationsfähigkeit)
•Die empirische Prüfung der mit einer Skalenart verbundenen Axiomatik… - ist oftmals schwierig oder unmöglich; - bleibt daher zumeist aus (Þper-fiat-Messung).
•Das bei einer Messung erreichte Skalenniveau kann daher umstritten sein.
•Oftmals wird Intervallskalenniveau angenommen. Þ erlaubt die Anwendung zusätzlicher und „komfortabler“ Auswertungsmethoden Þ kann u.U. durch erwartungskonforme / sinnvolle Ergebnisse nachträglich gerechtfertigt werden.
VL 3 - Der erste Schritt bei der Datenauswertung:
Die eindimensionale Häufigkeitsverteilung
•Die Daten einer Variable sollen beschrieben werden
•Erster Schritt bei der Auswertung: Verteilung ermitteln!
•Häufigkeitsverteilung: Menge aller Paare von Merkmalsausprägungen xi undBesetzungs-häufigkeiten - Wie häufig kommen welche Messwerte vor?
•Ab Ordinalskalenniveau kann kumuliert werden: - kumulierte absolute Häufigkeit: Ni = Anzahl aller Messwerte bis (einschließlich) zur Merkmalsausprägung xi
- kumulierte relative Häufigkeit: Fi = Relative Häufigkeit aller Messwerte bis (einschließlich) xi - kumulierte prozentuale Häufigkeit (auch: Prozentrang, PR)
Graphische Darstellung
•Nominalskalenniveau: - Kreisdiagramm
•Mindestens Nominalskalenniveau: Balkendiagramm (die Balken sind getrennt)
Dieser Textabschnitt ist in der Vorschau nicht sichtbar. Bitte Dokument downloaden.
Bsp.: Anzahlen richtiger Lösungen in einer Klausur für 3 Schülergruppen:
Gruppe A: Gruppe B:Gruppe C:
3, 3, 4 1, 3 3, 3, 4, 5, 5
Berechnung des Gesamtmittelwerts aus den Gruppenmittelwerten:
N: Anzahl aller Werte ni: Anzahl der Werte in Gruppe i
Eigenschaften des arithmetischen Mittelwerts
•Die Summe der Abweichungen aller Einzelwerte vom arithmetischen Mittel ist 0. Das arithmetische Mittel entspricht dem Schwerpunkt der Verteilung der xi –Werte.
•Werden die Einzelwerte linear transformiert (y = axi + b), so unterliegt der Mittelwert der gleichen Transformation.
•Der Mittelwert wird durch Ausreißer stark verzerrt.
Median:
= Halbiert die geordnete Merkmalsverteilung: Für die 50% kleinsten Werte gilt x ≤ xMd , für den Rest x ≥ xMd
Werte in eine Rangreihe bringen
Tiefe des Medians bestimmen TiefeMd = (N+1)/2 (N =Anzahl aller Werte)
In der Rangreihe der Werte bis zur Tiefe zählen - Ist die Tiefe keine ganze Zahl, so wird der Mittelwert der benachbarten Werte verwendet (per Konvention).
Eigenschaft: Die Summe der absoluten Abweichungen aller Einzelwerte wird durch den Median minimiert.
Beispiel: Reaktionszeiten (in msec)
Geordnet: 151, 160, 168, 169, 172, 175, 189, 279
TiefeMedian = (N+1)/2 = (8 +1)/2 = 4.5
Md = (169 + 172)/2 = 170,5
Modalwert:
Der Modalwert xMod ist die am häufigsten vorkommende Merkmalsausprägung.
-Fehlerwarnung: Nicht die größte Häufigkeit ist der Modalwert sondern der zugehörige Variablenwert!
-Es kann mehrere Modalwerte geben (z.B. bimodale Verteilung)
-Bei multimodalen Verteilungen ist die Angabe des Modalwerts unüblich.
-Bei künstlich kategorisierten (d.h. ursprünglich stetigen) Variablen gilt die Kategorienmitte der am häufigsten besetzten Kategorie als Modalwert.
- Manche Städte in England und im mittleren Westen der USA haben sehr ähnlich durchschnittliche Jahrestemperaturen.
- Aber: In England ändert sich die Temperatur im Jahresverlauf nur wenig, im mittleren Westen der USA gibt es dramatische Temperaturunterschiede zw.....
Dieser Textabschnitt ist in der Vorschau nicht sichtbar. Bitte Dokument downloaden.
Der Trend der Daten kann durch eine Der Trend der Daten kann nicht durch
Gerade durch die Punktwolke beschrieben eine Gerade durch die Punktwolke
werden. beschrieben werden.
à Die Berechnung von r ist sinnvoll. àDie Berechnung von r ist nicht sinnvoll
Die Richtung des Zusammenhangs
Positiver Zusammenhang Negativer Zusammenhang
Hohe Werte der einen Variable gehen mit Hohe Werte der einen Variable gehen mit
hohen Werten der anderen Variable einher. Niedrigen Werten der anderen Variable einher
* r > 0 * r < 0
Die Stärke des Zusammenhangs
•Der lineare Zusammenhang zwischen 2 Variablen ist umso stärker je näher die Datenpunkte an einer (gedachten) Gerade durch die Punktwolke liegen. Je größer der Zusammenhang zwischen 2 Variablen ist, desto besser können bei Kenntnis einer Variable die Werte der anderen Variable vorhergesagt werden.
Der Pearson Korrelationskoeffizient
Kreuzprodukt:
•Gleich gerichtete Abweichungen der x- und y-Werte vom Mittelwert führen zu positivem Kreuzprodukt (® Quadranten (a) und (c))
•Ungleich gerichtete Abweichungen der x- und y-Werte vom Mittelwert führen zu negativem Kreuzprodukt (® .....
Dieser Textabschnitt ist in der Vorschau nicht sichtbar. Bitte Dokument downloaden.
55105 Arbeitsvertragsrec­ht EA 1 I Anspruch gem. § 611 BGB i.V.m. dem Arbeitsvertrag A könnte einen Anspruch gegen die M-GmbH auf Rückzahlung des Gehalts gem. §611a Abs. 2 BGB haben. 1. Wirksamer Arbeitsvertrag Voraussetzung für diesen vertraglichen Schadensersatzansp­ruch ist zunächst…
...[weiter lesen]