Modul Mathematik

Campus: https://www.mu-campus.de/course/view.php?id=3383&section=1

Studienbrief Statistik
Syntax für phpMathpublisher
Statistik Formelsammlung und eigene Formelsammlung

Statistik

Wenn Sie dieses Kapitel bearbeitet haben, dann wissen Sie,
  * was man unter einem Zufallsexperiment versteht;
  * was man unter dem Begriff der Wahrscheinlichkeit versteht;
  * wann man von Laplace-Wahrscheinlichkeiten sprechen darf;
  * was unter dem Additionstheorem und dem Multiplikationstheorem zu verstehen ist;
  * wofür der Ausdruck Fakultät steht;
  * was unter einer Binomialverteilung zu verstehen ist;
  * wie die Zufallsratewahrscheinlichkeit bei Multiple-Choice-Aufgaben berechnet werden kann;
  * was unter einer Normalverteilung zu verstehen ist und
  * welche besonderen Kennzeichen die sogenannte Standardnormalverteilung besitzt.

Kapitel 2: Zufallsexperiment

Grundbegriffe

Zufallsexperiment → Ein Experiment das sich beliebig oft wiederholen lässt
Ergebnis → Ausgang eines Zufallsexperiment
Ergebnisraum (Ω) → Menge aller möglichen Ergebnisse. Beispiel Würfel: <m>Omega={1,2,3,4,5,6}</m>
Ereignis → Einzelne Elemente aus Ω. Beispiel: <m>A= {2,4,6}</m> → A ist die Ereignismenge aller geraden Elemente aus Ω
- Elementarereignis → Wenn <m>A=Omega</m>
- Kardinalität (|A|)→ Menge von Elementen in A oder in Ω (|Ω|)
- Komplementärereignis (notA) → alles aus Ω was nicht in A ist. Formel: <m>Omega=A union notA</m>
- Disjunktes Ereignis → Wenn die Schnittmenge zweier Ereignissen leer ist. Formel: <m>A inter B = varnothing</m>
Wahrscheinlichkeit (P(A)) → gibt an, wie wahrscheinlich es ist, dass das Ereignis A zwischen 0 und 1 auftritt.
- 0 = unmöglich
- 1 = Sicher
- Formel nach Lapalace: <m>P(A) = {Anzahl delim{|}{A}{|}} / {Anzahl delim{|}{Omega}{|}}</m>
  - Beispiel

Wenn A = {1,3,6}       -> |A| = 3 
     Ω = {1,2,3,4,5,6} -> |Ω| = 6 
Dann P(A) = 1 / 6 =  0,16666

Schätzung → <m>P(A) = {Anzahl der Fälle mit Ergebnis delim{|}{A}{|}} / {Anzahl aller Fälle}</m>
Additionstheorem → Addition zweier Ereignisse. Beispiel: <m>P(A union B)= P(A)+P(B) - P(A inter B)</m>
- Sind (A) und (B) disjunkt gilt: <m>P(A union B)= P(A)+P(B)</m>
- Sind (A) und (Ā) disjunkt (= Komplementär) gilt: <m>P(A)=1-P(notA)$ bzw. $P(notA)=1-P(A)</m>
Bedingte Wahrscheinlichkeit → Wie wahrscheinlich ist (A) wenn (B) eingetreten ist: <m>P(A|B) = (P(A inter B)) / (P(B))</m> falls <m>P(B)>0</m>
Multiplikationstheorem → <m>P(A inter B)=P(A|B)*P(B)=P(B|A)*P(A)</m>
- Multiplikationssatz für unabhängige Ereignisse: <m>P(A inter B)=P(A)*P(B)</m>

Tabelle möglicher Ereignisse bei der Betrachtunge eines 6-Seitigen Würfel

Verbale Beschreibung der Ereignisse	Mathematische Darstellung
A = „Werfen einer 1“	A = {1}
B = „Werfen einer 6“	B = {6}
C = „Werfen einer geraden Zahl“	C = {2, 4, 6}
D = „Werfen einer ungeraden Zahl“	D = {1, 3, 5}
E = „Werfen einer Zahl größer als 2“	E = {3, 4, 5, 6}
F = „Werfen einer Zahl von 1 bis 6“ (sicheres Ereignis)	F = {1, 2, 3, 4, 5, 6} = Ω
G = „Werfen keiner Zahl von 1 bis 6“ (unmögliches Ereignis)	G = { } = ∅ (leere Menge)

Beispiel

Unter erkrankte Personen P(T)=1000 Personen machen T=600 eine Therapie. Davon gesunden 350 Personen mit Therapie, (notT)=50 ohne.
Frage: Wie hoch ist die Wahrscheinlichkeit der Genesung mit Therapie?

Haben eine Therapie durchgeführt: <m>P(T)=T/P=600/1000=0,6</m> von 1
Genesen mit Therapie: <m>P(H inter T)=350/1000=0,35</m> von 1
Genesen ohne Therapie: <m>P(H inter notT)=50/1000=0.05</m> von 1
Genesen inklusive genesener Personen ohne Therapie gesund wurden: <m>P(H|T)=0,35/0,6=0,583</m>
Genesen mit und ohne Therapie (Allgemeine Heilung): <m>P(H)=0,35+0,05=0,4</m>

Binomialverteilung

Sind für ein Ereignis nur zwei Ausprägungen vorhanden (richtig oder falsch; Gewinn oder Niete oder ähnliches) und werden Wahrscheinlichkeiten dafür berechnet, wie oft z.B. Richtig auftaucht, wenn so und so oft per Zufall angekreuzt wird, dann handelt es sich immer um eine sogenannte Binomialverteilung.

Beispiel: Werfen einer Münze mit K=Kopf und Z=Zahl → Ergibt: <m>P(K)=0,5 und P(Z)=0,5</m>x
Werfe ich die Münze 2x hintereinander ergibt das Ergebnispärchen: <m>Omega=[(K,K),(K,Z),Z,K),(Z,Z)]</m>. Das laut der Laplace-Wahrscheinlichkeit eines der Ereignisse in <m>Omega</m> eintritt ist:
<m>P(K,K}=(Anzahl der günstigen Fälle)/(Anzahl der möglichen Fälle)=1/4=0,25</m>

Werfe ich die Münze 3x hintereinander ergibt das: <m>Omega={(KKK),(KKZ),(KZK),(KZZ),(ZZZ),(ZZK),(ZKZ),(ZKK)}</m>
Bei 8 Kombinationen ergibt die Frage nach der Warscheinlichkeit einer Kombination mit einmal K: <m>P(K)=0.125 + 0.125 + 0.125 = 0.375</m>

Werfe ich die Münze 10x kann ich eine Tabelle erstellen der Warscheinlichkeit pro Wurf: Daraus ergibt sich die Formel der Kombinationsmöglichkeiten: <m>({n}over{k})=(n!)/(k!*(n-k)!)</m> wobei:

!=Fakultät → <m>(2!)=1*2=2, (3!)=1*2*3=6, (4!)=1*2*3*4=24, …</m>
(0!)=1

Beispiel 10 Würfe:
Bei 10 Würfen einer Münze soll das Ergebnis sein: 2xKopf und 8XZahl: n=10, k=2

<m>({n}over{k})=(n!)/(k!*(n-k)!) doubleright ({10}over{2})=(10!)/(2!*(10-2)!)=(10*9)/(2*1)=45 Kombinationen</m>

Die Wahrscheinlichkeit genau eine Kombination zu werfen ergibt sich aus:

<m>P(2*K und 8*Z)=2*(P(K))*(8*P(Z)) doubleright 0,5^2*0,5^8=0,5^10=0,000976562</m>
<m>0,000976562*45=0.04395</m> Siehe Tabelle, 3. Zeile

Beispiel Multible Choice:
Jede der 10 Aufgaben des MC-Test hat 4 Möglichkeiten, davon eine richtig, 3 falsch: <m>n=10, P®=0,25, P(f)=0,75</m>
Jetzt können wir die Wahrscheinlichkeit berechnen durch Zufall genau 3 Antworten richtig anzukreuzen:

Anzahl der Möglichkeiten: <m>({k}over{n})=(10!)/(3!*7!)=3628800/(6*5040)=120</m>
Wahrscheinlichkeit einer dieser Kombinationen: <m>P(RRRFFFFFFF)=(0,25^3)*(0,75^7)=0.00209</m>
Ergebnis: <m>P(k=3)=120*0.00209 = 0.2508</m> Das entspricht 25,08%

Die sich aus diesen Rechneschritten ergebende Formel für die Binomialverteilung lautet:
<m>P(k)={n}over{k}*p^k*(1-p)^(n-k) bei K=0,1,2,…,n,</m> Manchmal wird 1-p ersetzt durch q

Normalverteilung

Eine Normalverteilung mit dem

Erwartungswert = 0
Standardabweichung = 1

bezeichnet man als Standardnormalverteilung. (Gauss) Siehe: https://de.wikipedia.org/wiki/Normalverteilung

Zentrales Grenzwerttheorem

Der zentrale Grenzwertsatz ist eine Regel (genauer Theorem), welche hilft, die Verteilungen der Mittelwerte unterschiedlicher Stichproben aus einer Grundgesamtheit zu berechnen. Der Satz besagt, dass sich die Verteilung der Stichprobenmittelwerte mehrerer Stichproben mit wachsendem Stichprobenumfang einer Normalverteilung annähert. Dabei spielt es keine Rolle, welche Verteilung die Messwerte in der Grundgesamtheit haben. Der zentrale Grenzwertsatz ermöglicht es, Aussagen über die Abweichungen des Mittelwerts einer Stichprobe zu treffen, ohne die Mittelwerte anderer Stichproben heranzuziehen.

Kapitel 3: Grundlagen

Wenn Sie dieses Kapitel durchgearbeitet haben, können Sie,
  * die unterschiedlichen Skalenniveaus erläutern und verschiedene Beispiele nennen;
  * erläutern, was man unter einer einfachen Zufallsstichprobe, einer geschichteten Stichprobe
  * und einer Klumpenstichprobe versteht;
  * den Unterschied zwischen abhängigen und unabhängigen Stichproben erläutern;
  * nachvollziehen, was es mit einseitigen und mit zweiseitigen Hypothesen auf sich hat;
  * erläutern, was man unter dem alpha- und beta-Fehler versteht und
  * erläutern, was Freiheitsgrade sind.

Skalenniveaus

Mittelwert berechnen: <m>(notx)=(alle Einzelwerte addieren)/(Anzahl einzelwerte)</m>
In der Statistik unterscheidet man vier verschiedene Skalenniveaus:

Name	Beschreibung	Zeichen	Beispiel
Nominalskalenniveau	Die Daten unterscheiden sich nach gleich und ungleich	=,≠	Geschlecht; Parteizugehörigkeit, Nationalität
Ordinalskalenniveau	Die Daten unterscheiden sich nach gleich/ungleich, größer und kleiner	=,≠,<,>	Windstärken; Schulabschluss, Schulnoten
Intervallskalenniveau	Die Daten unterscheiden sich nach gleich/ungleich, größer/kleiner, plus/minus	=,≠,<,>,+,-	Temperatur in Celsius, Intelligenzquotient → Kennzeichen: Kein natürlicher Nullpunkt
Verhältnisskalenniveau	Die Daten unterscheiden sich nach gleich/ungleich, größer/kleiner, plus/minus, mal und geteilt	=,≠,<,>,+,-,*,	Meter, Zeit, Umsatz → Kennzeichen: Natürlicher Nullpunkt vorhanden

Stichprobenarten

Zufallsstichproben:

Einfache Zufallsstichprobe ist eine Stichprobe aus einer Grundgesamtheit von Objekten, bei der jedes Objekt die gleiche Chance hat, in die Stichprobe zu gelangen
Geschichtete Stichprobe ist eine Stichprobe aus einer Grundgesamtheit von Objekten, bei der aus jeder speziellen Gruppierung (Schicht) der Grundgesamtheit eine einfache Zufallsstichprobe gezogen wird. Geschichtete Zufallsstichproben bieten sich bei recht heterogener Struktur der Grundgesamtheit an.
Klumpenstichprobe ist eine Stichprobe aus einer Grundgesamtheit, bei der die Grundgesamtheit in Gruppen (sog. Klumpen bzw. engl. Cluster) eingeteilt werden kann. Man wählt dann zufällig (mit einer einfachen Zufallsstichprobe) eine bestimmte Menge von Klumpen aus. Charakteristisch für die Klumpenstichprobe ist, dass in den ausgewählten Clustern dann eine Vollerhebung durchgeführt wird

Systematische Stichproben:

Quotenverfahren (nicht-probabilistische Stichprobenverfahren) wird bei start unterschiedlich verteilter Grundgesamtheit eingesetzt. Dazu teilt man die Gesamtheit in Gruppen (Quoten) auf, misst den Anteil jeder Gruppe und konstruiert die Stichprobe analog zu dieser Verteilung.
Systematische Auswahl Hierzu werden aus der Gesamtmenge bewusst Gruppen ausgesucht, die dann mit Gewichtung in die Stichprobe eingehen.
Unabhängige Stichproben Wenn die zu vergleichenden Stichproben aus unterschiedlichen Elementen bestehen.
Abhängige Stichprobe Wenn sie den gleichen Umfang haben und zu jedem Wert der einen Stichprobe genau ein Wert der anderen Stichprobe gehört

Hypothesen und Fehlerarten

Hypothesen sind Annahmen oder Vermutungen über die Realität

Hypothesenarten

Die Nullhypothese (H0): Die Hypothese, die die Sachverhalte beschreibt, die nicht unseren Erwartungen entspricht – die wir also wiederlegen (falsifizieren) wollen.
Die Alternativhypothese (H1): Die Hypothese, die die Sachverhalte beschreibt, die unseren Erwartungen entspricht – die wir aber nicht direkt verifizieren können.
Ungerichtete Hypothesen: Gefragt wird, ob sich die Werte von Gruppe A von den Werten der Gruppe B unterscheiden (=,≠) → die Werte können kleiner oder größer sein. Es gilt:
- H0: <m>mu A=mu B</m> H1: <m>mu A<>mu B</m>
Gerichtete Hypothesen: Gefragt wird, ob die Werte der Gruppe A besser/schlechter sind als die Werte der Gruppe B. Es wird nur in eine Richtung (nämlich nur nach größer oder nur nach kleiner) geprüft. Es gilt:
- H0: <m>mu A >= mu B<y/m> H1: <m> mu A <y mu B</m>
- H0: <m>mu A ⇐ mu B<y/m> H1: <m> mu A >y mu B</m>
- Aussage: Die Werte der Gruppe A sind besser/schlechter als die Werte der Gruppe B

Wenn die Wahrscheinlichkeit dafür, dass die Nullhypothese zutrifft, kleiner als 5% ist, entscheidet man sich für die Alternativhypothese.

Fehler

	H0 ist wahr	H1 ist wahr
H0 wird angenommen	Entscheidung ist richtig	Fehlentscheidung: Fehler 2. Art (Beta-Fehler)
H0 wird abgelehnt	Fehlentscheidung: Fehler 1. Art (Alpha-Fehler)	Entscheidung ist richtig

Hypothesentesten

Vorgehen:

Formulierung der Nullhypothese H0 und der Alternativhypothese H1 .
Festlegung des Signifikanzniveaus <m>alpha</m>.
Festlegung einer geeigneten Teststatistik.
Bestimmung des sogenannten kritischen Bereichs, der Grundlage für die Ablehnung der Nullhypothese ist.
Berechnung des Wertes der Teststatistik aus einer Stichprobe.
Entscheidung über die Ablehnung oder die Nicht-Ablehnung der Nullhypothese.

Freiheitsgrade

Wo sind wir

32