Installiere die Dokumente-Online App

word image
Mitschrift (Lernskript)

Grundlag­en der Statisti­k: Anwendun­gsbereic­he und Methoden - Lernskri­pt

7.542 Wörter / ~23 Seiten sternsternsternsternstern_0.5 Autorin Jana . im Jul. 2010
<
>
Download
Dokumenttyp

Mitschrift
Psychologie

Universität, Schule

FernUniversität in Hagen

Autor / Copyright
Jana . ©
Metadaten
Preis 6.00
Format: pdf
Größe: 0.76 Mb
Ohne Kopierschutz
Bewertung
sternsternsternsternstern_0.5
ID# 1704







Überblick: Diese Mitschri­ft bietet eine umfassen­de Einführu­ng in die Statisti­k, ihre Einsatzm­öglichke­iten in verschie­denen Branchen und ihre Rolle als Servicef­unktion in den Wissensc­haften. Sie erklärt deskript­ive und induktiv­e Statisti­k, Schlüsse­lqualifi­kationen wie statisti­sche Methoden­kompeten­z und aktuelle Projekte zur Verbesse­rung dieser Kompeten­z. Die Textsort­e ist ein Lernskri­pt, ideal für Studiere­nde oder Fachleut­e, die ihr Verständni­s von statisti­schen Konzepte­n vertiefe­n möchten.
#Statistik#Datenanalyse#Qualitätsmanagement

Statistik

1.1.

Einsatzmöglichkeiten der Statistik:

-       Industrie: Fertigungsprozesse und Dienstleistungen

o  Fehlervermeidung und Kundenzufriedenheit

o  Lückenlose Dokumentation von Prozessdaten & Sicherung höchstmöglicher Qualität

-       Markt- und Werbeforschung

o  Auf Stichprobenbasis werden Marktanteile und Potentiale ermittelt

o  Sehbeteiligung öffentlicher Fernsehprogramme

-       Banken

o  Kreditentscheidungen

o  Kapitalmarktdaten

-       Lebensmittelkonzerne

o  Analyse von Scannerdaten um Trends zu erkennen

-       Gesundheitsämter

o  Überwachung von Infektionskrankheiten, um endemische Abweichungen zu erkennen

o  Um Wirksamkeit psychologischer Interventionen zu Evaluieren

Die Statistik erfüllt für viele Wissenschaften eine Servicefunktion. In Publikationen ist eine datengestützte Argumentation unentbehrlich geworden. Die Versuchsplanung z.B. ist ein wichtiges Feld der Experimentelen Psychologie als auch der Ingenieurswissenschaften. Statistische Instrumente des Qualitätsmanagements werden z.B. in Bildungspädagogik oder Gesundheitsökonomie eingesetzt, Statistik findet sich auch wieder in der Physik bei Beschreibungen von Zufallsprozessen, in der Versicherungsmathematik bei der Berechnung von Prämien, Zeitreihenmodelle bei Kapitalmarktforschung, Analyse von Querschnitts- und Paneldaten in der Wirtschaftswissenschaft oder die Modellierung von Wachstumsprozessen in der Biologie.

Statistik in der Politikplanung:

-       Verlässliche Bevölkerungszahlen als Basis für Entscheidungen

-       Altersstrukturen und Lebenserwartungen zum Fortschreiben der sozialen Sicherungssysteme

-       Bruttoinlandsprodukt als Verteilungsmittel für Strukturhilfen der EU

-       Überprüfung von Zielsetzungen, z-B. der UN Millennium Development Goals“

-       Aggregate aus Indikatoren zur Beschreibung komplexer Entwicklungen (z.B. Innovation)

1.2.

Aufgaben der Statistik:

-          Erhebung von Daten

-          Visualisierung und Beschreibung der Befunde

-          Identifikation von Auffälligkeiten

-          Ableitung von Schlüssen

Statistik ist somit eine Wissenschaft, die Methoden zur Gewinnung von und zum Lernen aus Daten bereitstellt.

Der Begriff Statistik ist mehrdeutig:

-          Wissenschaft als ganzes

-          Kenngrössen, die sich aus statistischen Daten ableiten (z.B. Mittelwert)

-          Funktionen von Zufallsvariablen

-          Allgemeiner Sprachgebrauch: ein Datensatz (z.B. Medaillenerteilung, Bruttoverdienste)

Statistik ist in zwei Felder unterteilbar, beschreibende und schließende Statistik:

-          Beschreibende oder deskriptive Statistik umfasst numerische und graphische Verfahren zur Charakterisierung und Präsentation von Daten. Typisch für beschreibende Statistik ist, dass sie keine Modelle braucht. Ziel ist die Gewinnung von Kenngrößen, durch Reduktion und Aggregation der in den statistischen Daten enthaltenen Informationen möglichst ohne größere Verluste an relevanten Informationen.

o   Explorative Datenanalyse (Data mining): Hierbei wird unter Einsatz rechenintensiver Verfahren nach auffälligen Strukturen und Mustern in Datenbeständen gesucht, ohne das unbedingt sofort eine Hypothese im Spiel ist.

-          Schließende oder induktive Statistik zieht Schlussfolgerungen aus Daten. Die Daten werden als Ausprägungen von Zufallsvariablen interpretiert und durch Wahrscheinlichkeitsmodelle beschrieben. Typische Aufgaben sind das schätzen von Modellparametern und das testen von Hypothesen. Die Wahrscheinlichkeitsrechnung ist von daher eng verknüpft.

1.3.

Schlüsselqualifikationen sind Fähigkeiten zur sachadäquaten Anwendung von Wissen und zur Erschließung neuen Wissens. Z.B.

-          Soziale Kompetenz (z.B. zwischenmenschliche Kommunikationsfähigkeit)

-          Medienkompetenz (effiziente Nutzung der Informationsfülle)

-          Methodenkompetenz (sachadäquate Nutzung von Werkzeugen, Arbeitstechniken, Theorien zur Problemlösung)

-          Beschäftigungsfähigkeit (internat. Standart. Lebenslange Weiterbildung)

Evidence Based Decision Making = Datengestü.....[Volltext lesen]

Download Grundlag­en der Statisti­k: Anwendun­gsbereic­he und Methoden - Lernskri­pt
• Download Link zum vollständigen und leserlichen Text
• Dies ist eine Tauschbörse für Dokumente
• Laden sie ein Dokument hinauf, und sie erhalten dieses kostenlos
• Alternativ können Sie das Dokument auch kаufen
Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

-          Ordinalskala / Rangskala: es gibt eine natürliche Rangordnung, Differenz-/Quotientenbildung nicht sinnvoll erklärt, z.b. Bonitätsprüfungen, Schulnoten, es gibt Rangordnung zwischen den Stufen, Abstände zwischen zwei Stufen sind aber nicht direkt vergleichbar. Z.B. Militärischer Rang, höchster erreichter Schulabschluss

-          Metrische Skala / Kardinalskala: Auch Abstände (Differenzen) zwischen Merkmalsausprägungen sind sinnvoll erklärt.

o   Verhältnis-/Ratioskala: Wenn es einen Nullpunkt gibt, z.B. Merkmal „Geschwindigkeit“, Aussagen wie „100km/h ist doppelt so schnell wie 50km/h“ sind zulässig, d.h. auch die Division ist erklärt. Weiteres Beispiel: Lebensalter

o   Intervallskala: Ohne natürlichen Nullpunkt, z.B. Temperatur, Bildung von Quotienten aus zwei Merkmalsausprägungen ist nicht sinnvoll. Weiteres Beispiel: Geburtsjahr

o   Absolutskala: Es gibt nicht nur einen Nullpunkt sondern auch eine natürliche Einheit, z.B. Anzahl der Fachsemester

Statistische Verfahren, welche für Daten eines bestimmten Skalenniveaus zulässig sind, sind auch stets für alle Daten höherer Skalenniveaus anwendbar. Man kann unter Informtionsverlust, z.B. Daten, die ordinalskaliert sind, auch auf einer Nominalskala messen, metrisch skalierte Merkmale auch stets auf Ordinal- oder Nominalskala.

Weitere Klassifikation der Merkmale sind Typ der Merkmalsausprägung, also Kategorie oder Zahl. Wenn die Ausprägungen Kategorien sind, spricht man von qualitativem Merkmal, sie können nominal- oder ordinalskaliert sein (z.B. Konfessionszugehörigkeit (nominal, weil ungeordnet) oder Güteklassen (ordinal, weil geordnet). Sind die Ausprägungen hingegen „echte“ Zahlen, so liegt ein quantitatives Merkmal vor, metrisch skalierte Merkmale sind stets quantitativ.

2.3.

Operationalisierung ist die Festlegung von Messanweisungen, mit dem sich das zu beobachtende Merkmal quantifizieren lässt. Es gibt immer mehr als eine Möglichkeit der Operationalisierung da die Variablen nicht direkt beobachtbar sind und den Charakter hypothetischer Konstrukte haben (latente Variablen), z.B. Intelligenztest, Leistungsmotivation, Aggression, Patriotismus.

Die Beurteilung erfolg anhand von drei Merkmalen:

-          Objektivität (intersubjektive Nachvollziehbarkeit)

-          Reliabilität (Messgenauigkeit) – bezeichnet die technische Ebene

-          Validität (Gültigkeit) – bezieht sich auf den inhaltlichen teil, wenn man wirklich das misst, was man messen will.

Ein nicht-reliables Messverfahren ist auch nicht valide, ein hoch-reliables Messverfahren kann aber durchaus auch wenig valide sein, z.B. wenn das Verfahren genau misst, aber inhaltlich was anderes erfasst, als eigentlich gemessen werden soll.

Selbst bei der Messung direkt beobachtbarer Merkmale (manifeste Variablen), z.B. Bruttoeinkommen, Erwerbslosenquote, kann es sehr wichtig sein, genau zu spezifizieren, was gemessen werden soll.

Damit das einem Datensatz der amtlichen Statistik zugrunde liegende Messverfahren nachvollziehbar ist, werden die Daten in der amtlichen Statistik durch Meta-Daten ergänzt. Welche den methodischen Hintergrund und eventuelle Besonderheiten offenlegen.

3.1.

Daten sind beobachtbare Werte eines oder mehrerer Merkmale. Deshalb bezeichnet man die Gewinnung von Daten auch als Datenerhebung, die Planung der Datengewinnung als Erhebungsdesign. Nach der Art der Datenquelle unterscheidet man zwischen Primär und Sekundärerhebung:

-          Primärerhebung: Die Daten werden eigens für die Untersuchung gewonnen, z.B. Daten des IFO Institutes zum .....

Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

·         Werden in einem Beobachtungsprotokoll dokumentiert

·         Dienen einem bestimmten Forschungszweck

è Beispiel hier: Beobachtung in der Arbeits- und Organisationspsychologie z.B. im Rahmen eines Vorstellungsgespräches.


-          Experiment: Dabei geht es um die empirische Überprüfung von Hypothesen über Kausale Zusammenhänge zwischen Merkmalen

o   Anwendung z.B.

§  Agrar- und Naturwissenschaften

§  Technik

§  Medizin

§  Psychologie

·         In den Wirtschafts- und Sozialwissenschaften bezieht sich die Beobachtung typischer Weise auf Feldbeobachtungen, weswegen das Experiment kaum zum tragen kommt. Bei den hierbei beobachtbaren Zusammenhängen zwischen zwei Merkmalen lässt sich nicht anders als im Experiment zwingend auf einen Kausalzusammenhang schließen, weil der Zusammenhang auch über eine dritte Variable Vermittelt sein kann.

o   Die Überprüfung erfolgt anhand einer geplanten Untersuchung, bei der

§  Die Untersuchungsanordnung durch einen Versuchsplan festgelegt ist

§  Bei der die Ausprägungen eines oder mehrerer Merkmale (unabhängige Variablen, Einflussfaktoren) unter Laborbedingungen systematisch variieren

§  Bei der der Effekt auf ein anderes Merkmal (abhängige Variable, Zielgröße) studiert wird

§  Bei der durch geeignete Organisation der Untersuchungsanordnung der Einfluss weiterer Variablen möglichst ausgeschaltet wird (Kontrolle von Störvariablen)

o   Zwischen den Experimenten in den einzelnen Anwendungsbereichen gibt es durch die Natur der Merkmale Unterschiede:

§  Technik: Merkmale .....

Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

-          Eine Zeitreihe erhält man, wenn man ein Merkmal an einer statistischen Einheit im Zeitverlauf beobachtet. Häufig wird ein Merkmal anhand mehrerer fester Merkmalsträger im Zeitverlauf beobachtet

-          Eine Längsschnittstudie/Panel entsteht nun durch eine Kombination von Querschnitts- und Zeitreihenanalysen.

Eine weitere Klassifikation für Erhebungen bezieht sich auf den Umfang der erhobenen Daten:

-          Bei einer Vollerhebung werden alle Elemente einer Grundgesamtheit in die Erhebung mit einbezogen, z.B. Volkszählung. Bei der Volkszählung 2011 wird wegen der breiteren Akzeptanz in der Bevölkerung und aus Kostengründen im wesentlichen auf Verwaltungsregister zurückgegriffen (registergestützter Zensus)

-          Bei einer Teilerhebung oder Stichprobenerhebung werden nur Daten für eine Teilmenge der Grundgesamtheit erhoben. Sie sind vor allen Dingen bei sehr großen Grundgesamtheiten geboten. Stichprobenerhebungen können unter Umständen zuverlässigere Ergebnisse bieten, weil hier für die einzelnen Merkmalsträger mehr Zeit investiert wird.

Bei der Überprüfung von Industrieprodukten, z.B. Glühbirnen, gibt es zur Stichprobe keine Alternative während bei der Prüfung sicherheitsrelevanter Produkte wie z.B. Airbags nur eine Vollerhebung in Frage kommt, da ein Restrisiko nicht vertretbar ist.

3.2.

Bei Teilerhebungen ist die Verfahrensweise bei der Auswahl von Stichprobenelementen sowie der Umfang der Stichprobe festzulegen. Ziel ist es, aus einer Teilmenge der Grundgesamtheit Aussagen abzuleiten, welche sich auf die Grundgesamtheit übertragen lassen. Deshalb ist der Stichprobenauswahl auch die eindeutige Festlegung der Grundgesamtheit vorgelagert.

Es kann passieren, dass Elemente in der Auswahlpopulation enthalten sind, die nicht zu der im Untersuchungsdesign festgelegten Grundgesamtheit gehören. In diesem Fall spricht man von Overcoverage. Sind nun einige Elemente der Grundgesamtheit bei der Stichprobenziehung gar nicht berücksichtigt sprich.....

Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

Aus den Schichten wird dann jeweils eine Zufallsstichprobe gezogen, dabei besteht die Vorabinformation aus Kenntnis des Merkmales (der Schichtungsvariablen), nachdem die schichten zerlegt wurden. Deshalb ist formal eine geschichtete Stichprobenauswahl ein zweistufiges Verfahren:

-          Zunächst wird die Grundgesamtheit mit N Elementen anhand der Schichtungsvariablen in L disjunkte (nicht überlappende) Teilgesamtheiten des Umfanges N1, N2, …, NL zerlegt (N=N1+N2+…+NL)

-          Aus denen in einem zweiten Schritt Zufallsstichproben n1, n2, …, nL gezogen werden (n= n1+n2+…+nL

Je nachdem ob ein Anteil (i=1, 2, …, L) der einer Schicht entnommenen Stichproben fest ist oder nicht, liegt eine proportional geschichtete resp. eine disproportional geschichtete Stichprobe vor.

Bei einer proportional geschichteten Stichprobe sind die Anteile innerhalb der Schichten gleich, z.B. immer 20%.

Bei einer disproportional geschichteten Stichprobe wäre die Auswahlwahrscheinlichkeit der Stichprobenelemente zwar innerhalb einer Schicht konstant, nicht jedoch von Schicht zu Schicht.

Wenn eine Grundgesamtheit auf „natürliche Weise“, also von vornherein, in disjunkte Teilgesamtheiten zerfällt, heißen diese „klumpen“, z.b. Grundgesamtheit Schüler, Klumpen= Klassenverbände. Bei der zweistufigen Klumpenstichprobe wird im ersten Schritt eine Zufallsstichprobe aus der Menge aller Klumpen gewählt und in einem zweiten Schritt werden dann alle Elemente der Ausgewählten Klumpen untersucht.

Quotenauswahl kommt zum Beispiel bei der Meinungsforschung zum tragen. Dabei werden die Stichproben auf der Basis einer Systematik ausgewählt durch die Vorgabe von Quoten bezüglich eines meist sozioökonomischen Merkmales, z.B. Geschlecht, Alter.

3.3.

In Deutschland sind die amtlichen Statistiken weitgehend losgelöst von den Ministerien. Sie ist weitgehend konzentriert im Statistischen Bundesamt, in den Statistischen Länderämtern und den kommunalen Statistikämtern. Nur wenige Statistiken, wie z.B. die Arbeitsmarktstatistik beim Bundesamt für Arbeit, werden direkt unter ministerieller .....

Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

UN Statistic Division, Statistikreferat der Vereinten Nationen, frei zugänglicher Datenbestand

4.1

Univariate Datenanalyse: Daten für ein Merkmal

Multivariate Datenanalyse: Daten für mehrere Merkmale, hierbei steht die Analyse von Zusammenhängen zwischen den Merkmalen im Vordergrund

Eine univariate Urliste1…n) liegt vor, wenn ein Merkmal X mit n Merkmalsträgern festgestellt wird. Werte können hierbei auch mehrfach auftreten, z.B. bei diskreten Merkmalen, wenn die Länge n der urliste die Anzahl k der möglichen Merkmalsausprägungen überschreitet, z-B. Münzwurfexperiment.

Gruppierte oder klassierte Daten sind Daten zu Gruppen oder Klassen zusammengefasst. Dabei wird der Gesamtbereich, in dem die Merkmalsausprägungen liegen, in eine überschaubare Anzahl von Teilintervallen zerlegt und die Daten den Teilintervallen zugeordnet.

Urlisten werden mit wachsender Länge n und sich wiederholenden Merkmalswerten schnell unübersichtlich, es bietet sich an, durch die Angabe von Häufigkeiten für die Merkmalsausprägungen die Daten zusammenzufassen. Für das diskrete Merkmal a1, … ak gilt die absolute Häufigkeit

h1 := h(ai) i = 1, 2, …, k := „entspricht“

Um die Abhängigkeit von der Länge der Urliste zu eleminieren, teilt man die absolute Häufigkeit durch den Umfang n der Beobachtungsreihe, Daraus resultier.....

Dieser Textabschnitt ist in der Vorschau nicht sichtbar.
Bitte Dokument downloaden.

Swop your Documents