Biochemisches Problem

Neue Frage »

Jimmy89 Auf diesen Beitrag antworten »
Biochemisches Problem
Ein kleines Problem aus der Biochemie: DNA besteht aus Ketten von 4 verschiedenen Bausteinen: A,T,C und G.
Wie oft kommt die Abfolge A-T-G, statistisch gesehen in einer 2000 Bausteine langen Kette vor?
Ich habe leider von Statistik absolut keine Ahnung, wäre sehr dankbar wenn mir das jemand kurz erläutern könnte.
ObiWanKenobi Auf diesen Beitrag antworten »

Ich wage mal eine Antwort, obwohl ich in diesem Fall nicht ganz sicher bin, ob ich nichts übersehe.

P(A) =0,25
P(C) =0,25
P(T) = 0,25
P(G) = 0,25

Dann sollte P(ATG) = 0,25*0,25*0,25 = 0,015625 sein. (1/64)

Der Erwartungswert = Anzahl der Versuche mal P.

Jetzt kommt die Denksportaufgabe: Wieviele "Versuche" sind es bei einer Kette der Länge 2000? (Wenn Du jetzt spontan sagst 2000, dann liegst Du knapp daneben!)
 
 
BarneyG. Auf diesen Beitrag antworten »

Na, bei allem Respekt für deine Denksportaufgabe ... aber ich glaube hier liegst eher du selbst ein wenig daneben!

Deine 1998 Versuche sind nämlich nicht unabhängig voneinander! Wenn etwa der 17. Versuch ein Treffer ist, also die Abfolge A-T-G aufweist, dann sind der 18. und 19. Versuch mit der Wahrscheinlichkeit 1 KEINE Treffer. Und schon ist die Sache mit der Bernoulli-Kette futsch! unglücklich

So einfach geht das also nicht.... Big Laugh

Grüße
Zellerli Auf diesen Beitrag antworten »

Das ist ein Fall für Rekursions-Arthur!

Soviele Fallunterscheidungen aufgrund der von Barney G. genannten Abhängigkeit sind nämlich eine Monsterarbeit.

Ein Ansatz wäre: Wie ist der Erwartungswert von A, wie ist dann der E-Wert, dass nach dem A ein T folgt und dann der E-Wert, dass nach A-T ein G folgt.
Hierbei ist wieder zu beachten: Liegt eine Kette vor, wo z.B. ...AxAxxAx... drin vorkommt, kommen die ersten beiden A schonmal nicht in Frage.
Man könnte höchstens berechnen, wie groß der E-Wert für die Anzahl der A ist, denen auf den beiden folgenden Stellen kein A folgt.
Diese werden dann von (bedingte Wahrscheinlichkeit, es soll ja kein A vorliegen) T zu und dann G zu gefolgt.

Das ist aber Arbeit. Und ich kann in der kurzen Überlegungszeit Fehler nicht ausschließen.
wisili Auf diesen Beitrag antworten »

Zitat:
Original von BarneyG.
... Wenn etwa der 17. Versuch ein Treffer ist, also die Abfolge A-T-G aufweist, dann sind der 18. und 19. Versuch mit der Wahrscheinlichkeit 1 KEINE Treffer. Und schon ist die Sache mit der Bernoulli-Kette futsch! So einfach geht das also nicht ...


Doch, es geht so einfach! ObiWanKenobi behauptet das mit der Bernoullikette nirgends.
Duedi Auf diesen Beitrag antworten »

Zitat:
Original von wisili
Zitat:
Original von BarneyG.
... Wenn etwa der 17. Versuch ein Treffer ist, also die Abfolge A-T-G aufweist, dann sind der 18. und 19. Versuch mit der Wahrscheinlichkeit 1 KEINE Treffer. Und schon ist die Sache mit der Bernoulli-Kette futsch! So einfach geht das also nicht ...


Doch, es geht so einfach! ObiWanKenobi behauptet das mit der Bernoullikette nirgends.


Doch, das tut er indirekt, indem er die Formel benutzt.
wisili Auf diesen Beitrag antworten »

Man kann so überlegen:
Es gibt genau 4^2000 verschiedene Sequenzen der Länge 2000.
An der k.ten Stelle (2<k<2001) endet jeweils ein Tripel. Alle 64 möglichen Tripel sind gleichhäufig. ATG kommt mit der relativen Häufigkeit 1/64 vor. Der Erwartungswert ist somit 1998/64.
(Der Erwartungswert ist auch für abhängige Zufallsgrössen additiv!)
wisili Auf diesen Beitrag antworten »

Formaler:

sei die Indikator-Zufallsgrösse für das Ereignis, dass an der k.ten Stelle das Tripel ATG endet. Dann ist ihr Erwartungswert und folglich . Dass die selbstverständlich ABHÄNGIG sind, tut nichts zur Sache.
ObiWanKenobi Auf diesen Beitrag antworten »

Dann hatte ich ja doch recht! (obwohl ich ja in aller Vorsicht einen Irrtum nicht ausgeschlossen hatte!)

Big Laugh Freude
AD Auf diesen Beitrag antworten »

"Rekursions-Arthur" bleibt lediglich noch, die Sache zu bestätigen. Freude

Eine Herausforderung wäre allenfalls noch, auch die Varianz dieser Anzahl zu berechnen: In dem Fall müsste man die Abhängigkeit "nahe" beieinander liegender natürlich in Rechnung stellen - aber auch das ist noch relativ gut möglich.
Neue Frage »
Antworten »



Verwandte Themen