Chi-Quadrat Unabhängigkeitstest

Neue Frage »

jorgens Auf diesen Beitrag antworten »
Chi-Quadrat Unabhängigkeitstest
Guten Abend zusammen!

Ich stehe vor einem Problem aus dem Bereich der Statistik und stehe irgendwie auf dem Schlauch, was den Ansatz betrifft:

Ich habe wasserlösliche und wasserunlösliche Proteine auf vorhandene Proteindomänen (Untereinheiten) geprüft.
Für alle gefundenen Domänen liegen nun Zählungen vor, in wie vielen löslichen und in wie vielen unlöslichen Proteinen sie vorhanden waren! Das ist der Ausgangsdatensatz.
Nun würde ich gern testen, ob die Verteilungen der Domänen der löslichen und der unlöslichen Proteine statistisch unabhängig sind.
Mein Ansatz war eine Kontingenztafel aufzustellen, mit den 1...m Domänen (Merkmalen) der löslichen Proteine in der Zeile und 1...n der unlöslichen in der Spalte. Somit könnte man die gemeinsamen Auftreten der Domänen in den Proteinen bestimmen und die Wahrscheinlichkeiten berechnen. Unter Unabhängigkeit würde man ja in etwa erwarten.
AAABER:
Leider ist es ja so, dass es evtl. gar keine Schnittmenge gibt. D.h. eine Domäne kommt zwar häufig in einem löslichen Protein vor, aber nie in Kombination mit einer Domäne eines unlöslichen Proteins. Was zur Folge hätte, dass die Zeilensumme ja auch nicht (nicht mal approximativ) ergibt.
Also ganz falscher Ansatz?
Ich hoffe es kann jemand helfen und ich hab das Problem verständlich beschrieben.

Grüße

tigerbine: latex
jorgens Auf diesen Beitrag antworten »
RE: Chi-Quadrat Unabhängigkeitstest
Vielleicht doch ins Studi Forum verschieben?
Zellerli Auf diesen Beitrag antworten »

Ja, das ist Hochschulmathe, ich schiebe mal.

Du hast halt ein Problem gegenüber "regulären" Chi-Quadrat Tests oder Unabhängigkeittests: Du kannst die Klassen nicht ausdehnen. Also sagen: Die Größen 1,20 und 1,30 kommen so selten vor, da mach ich doch eine Klasse für den gesamten Bereich 1,40 und weniger.
Eine gewisse Mindestgröße (musst mal nachlesen) ist Grundvoraussetzung für einen Chi-Quadrat-Test. Wenn du keine Klassen durch Zusammenfassen vergrößern kannst, musst du sie wohl raushauen.

Das Zusammenfassen geht in der Chemie eben nicht so einfach Augenzwinkern Ich stell mir schon "Methyl und Ethylreste sind so selten, die steck ich in die Propyl-Klasse" problematisch vor.
nogger Auf diesen Beitrag antworten »

Absoluter Unfug!
In diesem speziellen Fall ist ein Chi Quadrattest unmöglich! Die Daten lassen sich zwar ausdehnen, aber was dann? Da muss doch ein anderer Test her...
JPL Auf diesen Beitrag antworten »

Deswegen gibt es ja die "Grundregel", dass jede Zelle mit mindestens 5 besetzt sein soll.
Alternativen, die es nun für den 2xk Table gibt:
generelle Introduction: http://www.informaworld.com/smpp/3249039...tent=a713488647

special featrues:
wenn du die Daten in probabilities transformieren kannst, wäre logistische Regression eine Möglichkeit, wenn nicht evtl. Poisson-Regression.

Grüße,
JPL
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »