Statistik – die neusten Beiträge

Alternativtest Hypothesentest Alpha/Beta Fehler?

Hallo, ich lerne gerade, wie man den alpha und beta fehler berechnet bei einem Alternativtest.

z.B. haben wir n=20, 

Wenn man den Annahme bzw. Ablehnungsbereich von H_0 berechnen will, ergibt sich durch Ausprobieren des kritischen Werts "k", dass k=4 mit p_1=0,4 P=0,0509% ergibt, weil für k=5 schon P=0,1255 ist und die 10% Schwelle von p_0 übersteigen würde.

Wenn ich nun den Alpha fehler berechnen will, muss ich das ja über den Ablehnungsbereich machen. Das heißt, wir haben hier einen Ablehnungsbereich von [5;30] für H_0. Also rechnen wir P(x≥5) mit p_0=0,1 und erhalten 4,3%. Diesen Fehler möchten wir ja in Kauf nehmen aber den Beta Fehler unbedingt vermeiden.

Der beta fehler als Fehler 2. Art ergibt sich wenn wir das ja über den Annahmebereich berechnen also P(x ≤4) mit p_1=0,4 und erhalten 5,1%.

Aber was ist nun, wenn der Ablehnungsbereich von H_0 nicht rechts, sondern links ist? Weil der ist ja hier offensichtlich im rechten Bereich. Wie berechne ich dann Alpha/beta Fehler? Wie gesagt kann man den alpha Fehler ja berechnen, wenn man diesen über den Ablehnungsbereich berechnet. Gilt das dann hier für H_1, weil der Ablehnungsbereich von H_1 auf der rechten Seite ist? Also müssten wir P(x≥5) rechnen mit p_1=0,1

(wenn  )? Oder müssten wir in jeden Fall IMMER ÜBER DEN ABLEHNUNGSBEREICH VON H_0 den alpha fehler rechnen??

rechnen, Funktion, Ableitung, Formel, Gleichungen, höhere Mathematik, Mathematiker, Nullstellen, quadratische Funktion, Statistik, Stochastik, Wahrscheinlichkeit, Wahrscheinlichkeitstheorie, Bernoulli, Beweis, Binomialverteilung, Funktionsgleichung, hypothesentest, Analysis

Wie werte ich meine Umfrageergebnisse aus?

Moin,

ich habe für meine Bachelorarbeit eine Onlineumfrage in meinem Unternehmen durchgeführt. Hierbei habe ich speziell den Teilzeitkräften im Unternehmen einige Fragen gestellt. Mittlerweile habe ich die Umfrageergebnisse erhalten und die Auswertung lief bisher auch reibungslos.

Nur bei einer Fragengruppe stehe ich etwas auf dem Schlauch und komme in diesem Zusammenhang auch nicht weiter.

Die Fragengruppe bezog sich auf die Gründe, warum Teilzeitkräfte in Teilzeit arbeiten. Hierbei habe ich in Form von Matrixfragen gefragt, ob bestimmte Gründe für die Wahl einer Teilzeitbeschäftigung von großer, kleiner oder keiner Bedeutung waren. Dieser Fragebogen wurde von meinen Dozenten und der Personalentwicklungsabteilung abgesegnet und als gut befunden.

Bei der Auswertung fällt mir jetzt aber immer mehr auf, dass ich als Antwortmöglichkeit lieber eine numerische Skalenbewertung von 1 - "keine Bedeutung" bis 6 "große Bedeutung" hätte wählen sollen. Bei der Auswertung habe ich nun zwischen den Auswahlmöglichkeiten "große Bedeutung" und "kleine Bedeutung" differenziert und für die jeweiligen demografischen Gruppen im Unternehmen zum einen Statistiken gebildet, die nur den prozentualen Anteil der Angabe "Große Bedeutung" aller Antworten bei jedem Grund aufzeigen und zum anderen Statistiken erstellt, die nur die prozentualen Angaben mit der Bewertung "kleine Bedeutung" von allen Antworten aufzeigen. Die Antwortmöglichkeiten und die Auswertung als solche erscheint mir zum jetzigen irgendwie als unwissenschafltich und bei der Auswertung auch als ziemlich umständlich und unübersichtlich.

Die wichtigste Frage, die bei mir nun besteht ist die Frage, wie ich im methodischen Teil wissenschaftlich erklären kann, warum ich ich bei dieser Fragekategorie die Auswahlmöglichkeiten so genommen habe, wie ich Sie genommen haben. Je weiter ich mich mit dem Thema befasse, desto unsicherer werde ich nämlich bei dieser Frage. Leider kann ich die Befragung auch nicht rückgängig machen und ich muss jetzt mit den Daten so arbeiten, wie ich Sie jetzt haben.

Abgesehen davon Frage ich mich, in wieweit meine Auswertung nun valide ist. Gibt es eventuell andere bzw. wissenschaftlicherer und übersichtlichere Möglichkeiten, die Antworten auszuwerten oder habe ich bisher die beste Möglichkeit schon angewendet, indem ich zwischen den Antwortmöglichkeiten differenziert haben?

Leider hat sich herausgestellt, dass mein Dozent im Bereich Statistik keine wesentlichen Kenntnisse hat. Dementsprechend kann er mir bei diesem Problem nicht helfen. Vielleicht findet sich ja hier jemand, der mehr Ahnung hat und mit weiterhelfen kann.

Ich bedanke mich im Voraus für die Antwort!

Viele Grüße

Bild zum Beitrag
Microsoft Excel, Bachelorarbeit, Statistik, Umfragebogen

Abiturstochastik killt mich?

Frohe Ostern allesamt. Ich habe ein massives Problem. Hypothesentests und vor allem der Fehler Zweiter Art (Nullhypothese annehmen, obwohl falsch).

Sagen wir so, es hat mich schon viel zu lange gedauert, um den Fehler Erster Art zu verstehen (Zugegebenermaßen brauche ich immer noch einen Moment, um es Intuitiv zu verstehen). Doch spätestens der Fehler Zweiter Art bzw. β verursacht bei mir nen Kurzschluss; so sehr sogar, dass ich das Gefühl hab, der gesamte Matheleistungskurs lacht mich aus. Ich geb euch mal sinngemäß die Aufgabenstellung:

  • "Der Großhändler gibt an, dass mind. 95% seiner Teile funktionieren. In einer Stichprobe von 500 Teilen will eine Gruppe das Gegenteil beweisen."
  • Signifikanzniveau α = 0.1;
  • n = 500;
  • p0 ≥ 0.95;
  • p1 < 0.95;
  • X: #guteTeile;
  • X ist B(500 ; 0.95)-verteilt;

a) Formuliere eine Entscheidungsregel, wann H0 abgelehnt wird. Also mache ich P(X ≤ g) ≤ 0.1 und finde heraus per TR, dass ich bei weniger als 467 Teilen (hab die genaue Zahl nicht mehr im Kopf) sage, dass der Großhändler die Unwahrheit sagen muss.

b) Die genaue α bei g = 466 läge bei 9,4%.

c) Und ab hier verstehe ich nichts mehr...

In einer Stichprobe kam heraus, dass tatsächlich nur 92% der Teile funktionierten. Bestimme die Wahrscheinlichkeit, dass trotzalledessen fälschlicherweise die Nullhypothese angenommen wird.

  • → bleibt meine Nullhypothese: p0 ≥ 0.95?
  • → warum sagen die Lösungen im Buch, dass ich rechtsseitig Testen muss?
  • → Wie kommt das Buch auf die Grenze g = 468?
  • → was zum Teufel will diese Aufgabe von mir? Was soll ich herausfinden? Denn Annahmebereich für die/eine Nullhypothese? Die Wahrscheinlichkeit, dass ich im Annahmebereich derer Liege? Müsste die Nullhypothese dann nicht die p0 ≤ 92% sein?

Falls irgendjemand hier den Nerv hat, einem Zwölftklässler diese Problematik wie einem idiotischen siebenjährigen Kind zu erklären und mir dabei irgendwie helfen kann, wäre ich sehr sehr dankbar. Ich spreche von Grundliegenden Verständnisproblemen und einem riesigen Knoten in meinem Kopf.

Dankeschön!! Ich hoffe, ich habe nichts vergessen in der Aufgabenstellung.

Mathematiker, Statistik, Stochastik, Wahrscheinlichkeit, Wahrscheinlichkeitstheorie, Bernoulli, Binomialverteilung

Wahrscheinlichkeitsrechnung Single-Choice-Problem?

Guten Abend zusammen.

Und zwar beschäftigt mich folgendes Problem: Wir haben einen hypothetischen Klausurfragenteil, der aus 5 gleichwertigen Wahr/Falsch Fragen besteht. Es ist (Annahme) bekannt, dass die Verteilung der Fragen immer entweder 3W+2F oder 2W+3F ist. Ein Student, der sich nicht auf den Teil der Klausur vorbereitet hat, möchte jetzt eine probabilistisch clevere Entscheidung treffen und wählt demnach z.B alle Antworten als wahr oder alle falsch. Im Mittel müsste er dann ja auf 2,5 richtige Antworten kommen, egal, ob er alle W oder F ankreuzt.

Jetzt meine Frage: Angenommen, der Student ist sich bei einer Frage 100%-ig sicher, dass er die Antwort kennt. Sollte er für die restlichen Fragen das Gegenteil seiner entsprechenden Antwort auswählen (z.B er weiß von einer Frage, dass sie wahr ist und wählt alle anderen als falsch) oder spielt dies in diesem Fall keine Rolle? Intuitiv würde ich tippen, dass er immer das Gegenteil nehmen sollte, aber seitdem ich das Monty-Hall Problem kenne, weiß ich, dass man sich auch gewaltig irren kann. Darüberhinaus, wie würde sich das „optimale“ Vorgehen ändern, wenn nicht bekannt wäre, dass es immer 3W+2F oder 2W+3F ist. Leider kann ich keine Stochastik um die Rechnung selbst zu machen, daher hoffe ich auf eine qualifizierte Antwort.

LG

Logik, Mathematiker, Statistik, Stochastik, Wahrscheinlichkeit, Beweis

Wieso bedarf es immer Quellen?

Was ich damit meine: Zählen persönliche Erfahrungen nicht mehr? Wenn man keine Quelle/Studie vorweisen kann, dann ist das jeweilige Argument vollkommen nichtig. Ob man wiederholt die immer gleiche negative Erfahrung mit xyz macht, spielt keine Rolle. Wieso gibt es dann überhaupt diesen alten journalistischen Grundsatz: "Ich glaube, was ich sehe"?

Wir leben offenbar zu einer Zeit, in der man nur noch glauben darf, was man liest. Das aber ist doch mindestens genau so gefährlich.

Was denkt ihr darüber?
Nehmt ihr euer Gegenüber in seinen geschilderten Erfahrungen ernst oder verlangt ihr direkt nach einer augenscheinlich "seriösen" Quelle, um das Gespräch weiter zu führen?
Denkt ihr, dass es überhaupt zu allen gesellschaftlichen Missständen Quellen gibt?

Ich bin das alles mittlerweile so leid. Also Leute, die ständig nach einer Quelle schreien. Selbst WENN man ihnen eine Quelle dann unter die Nase hält, bedürfte es doch ebenfalls wieder gründlicher Recherche, um die Vertrauenswürdigkeit der Quelle zu überprüfen. Wenn man einmal im universitären Kontext Statistikseminare belegt, wird einem klar, wie wenig man Studien vertrauen kann. Es existieren so viele Möglichkeiten, die Ergebnisse vollkommen verzerren: Suggestivfragen, Falsche Auswahl von Variablen, Publikationsbias, Falsche Interpretation von Korrelationen, etc. pp.

Politik, Psychologie, Gesellschaft, Sozialwissenschaften, Statistik, Studie

Meistgelesene Beiträge zum Thema Statistik