Genom (Stochastik)

Neue Frage »

Gast11022013 Auf diesen Beitrag antworten »
Genom (Stochastik)
Meine Frage:
Hallo, ich komme mal wieder mit einer etwas länglicheren Stochastik-Aufgabe daher, bei der ich Hilfe sehr gut gebrauchen könnte.
-----

Das Genom der Taufliege Drosophila melanogaster gliedert sich in etwa Abschnitte, die anhand des Färbungsmusters der in den Speicheldrüsen befindlichen Riesenchromosomen erkennbar sind. Zur Vereinfachung sei angenommen, daß sich in jedem Abschnitt gleich viele, nämlich Basenpaare befinden. Das Genom umfasst also Basenpaare. Durch hochenergetische Bestrahlung werden (rein zufällig verteilte) Basenpaare zerstört.

Finden Sie ein stochastisches Modell für die Anzahl der zerstörten Basenpaare in allen Genomabschnitten. Berechnen Sie für jedes die Verteilung der Anzahl der zerstörten Basenpaare im Abschnitt und begründen Sie, daß approximativ Poisson-verteilt ist.
---

Leider fehlt mir eine Idee für einen Ansatz.

Meine Ideen:

Edit 1 & 2 & 3:
"Finden Sie ein stochastisches Modell für die Anzahl der zerstörten Basenpaare in allen Genomabschnitten."

Ich weiß nicht genau, was mit "Modell" gemeint ist, aber in einem Abschnitt können von den 23000 vorhandenen Basenpaaren kein Basenpaar, ein Basenpaar, zwei Basenpaare,...,1000 Basenpaare zerstört worden sein.

Und das erinnert mich irgendwie an die Binomialverteilung: zerstört oder nicht zerstört.

Vielleicht gilt also für einen Abschnitt:

, wobei

Das wäre so meine Idee, was evtl. mit "Modell" gemeint sein könnte.

Vielleicht soll man hier auch einfach nur sagen: Ein geeignetes Modell ist die Binomialverteilung.

Edit 4:

Mit der Verteilung von könnte dann gemeint sein:

.

Edit 5:

Was die approximative Poisson-Verteilung angeht, würde ich meinen, daß

.

Ist das bereits die Begründung dafür, daß approximativ Poisson-verteilt ist?!

Eine richtige Begründung ist das ja eigentlich nicht, mir fällt da aber nichts ein.
Lolli267 Auf diesen Beitrag antworten »

Ich weiß nicht.
Gast11022013 Auf diesen Beitrag antworten »

Was soll so ein Beitrag, Lolli267?

Damit sorgst Du nur dafür, dass jemand Kompetentes denkt, die Frage wäre schon beantwortet!

böse
René Gruber Auf diesen Beitrag antworten »

Es werden aus Basenpaare zum "Zerstören" ausgewählt (ohne Zurücklegen!).

Du interessierst dich nun dafür, wieviele davon aus einer Teilmenge bestehend aus Basenpaaren (von den insgesamt ) stammen, eben einer Familie.

Das ist ganz klar das hypergeometrische Modell.
Gast11022013 Auf diesen Beitrag antworten »

Das Modell ist also: hypergeometrische Verteilung.

Die gesuchte Verteilung für den Abschnitt i müsste dann sein:

, wobei .


Stimmt das?
René Gruber Auf diesen Beitrag antworten »

Zumindest für stimmt das. Für größere ist natürlich .
 
 
Gast11022013 Auf diesen Beitrag antworten »

Dann fehlt noch der dritte Teil der Aufgabe, nämlich zu begründen, daß approximativ Poisson-verteilt ist.

Wie macht man das?
Gast11022013 Auf diesen Beitrag antworten »

Nochmal ein paar Gedanken meinerseits:

Bei der ersten Teilaufgabe soll man für jeden belieben Abschnitt eine Beschreibung der Wahrscheinlichkeit dafür, dass so und so viel zerstörte Basenpaare in diesem Abschnitt sind, finden. Dies geschieht also nun, wie ich gelernt habe, mittels der hypergeometrischen Verteilung.

Bei der zweiten Teilaufgabe geht es nun wohl darum, daß sich in einem bestimmten Abschnitt so und so viel zerstörte Basenpaare befinden und dafür soll man die Wahrscheinlichkeit bestimmen. Das ist wohl eine Binomialverteilung:



Bei der dritten Teilaufgabe soll man nun zeigen, dass dies approximativ Poissonverteilt ist. Da weiß ich allerdings nicht, was man dazu zu zeigen hat.


(Habe ich den Unterschied zwischen der ersten und der zweiten Teilaufgabe richtig verstanden?)
René Gruber Auf diesen Beitrag antworten »

Zitat:
Original von Dennis2010
Bei der dritten Teilaufgabe soll man nun zeigen, dass dies approximativ Poissonverteilt ist. Da weiß ich allerdings nicht, was man dazu zu zeigen hat.

Für die geforderte Approximation sind vor allem zwei Eigenschaften relevant:

1) Gilt für , so geht in dem gleichen Grenzübergang die Hypergeometrische Verteilung in die Binomialverteilung über.

2) Gilt für , so geht in dem gleichen Grenzübergang die Binomialverteilung in die Poissonverteilung über.
Gast11022013 Auf diesen Beitrag antworten »

2.) Hier ist doch ?

1.) Geht das nicht immer gegen 0?
René Gruber Auf diesen Beitrag antworten »

Zitat:
Original von Dennis2010
2.) Hier ist doch ?

Ja.

Zitat:
Original von Dennis2010
1.) Geht das nicht immer gegen 0?

Was genau geht gegen 0?
Gast11022013 Auf diesen Beitrag antworten »

2.) Dann gilt hier für

Ist hier dann ?


1.) Ich meinte: M=23000 und dann ist doch .


Aber was sagt mir das nun alles?
René Gruber Auf diesen Beitrag antworten »
Immer musst bzw. willst du alles verkompliziert verstehen...
In deiner Aufgabe werden doch gar nicht solche Grenzwerte betrachtet. Ich hab das nur angeführt, weil bereits für große (in (1) mit ) bzw. große (in (2) mit ) diese Grenzwertverteilungen approximativ gelten.
Gast11022013 Auf diesen Beitrag antworten »

Was muss ich also zeigen?

Gar nichts? Nur sagen, daß die Werte groß genug sind?



Sorry, ich blick's gerade nicht. unglücklich
René Gruber Auf diesen Beitrag antworten »

Meine Güte, ich weiß doch auch nicht mehr als das, was in deiner Aufgabenstellung steht! Und die halte ich für unvollständig formuliert, was diesen "approximativ poissonverteilt"-Teil betrifft: Da hätte noch stehen sollen, dass man das für einen passenden Grenzübergang betrachten soll. Aber das sauge ich mir jetzt nicht auch noch aus den Fingern - frag den Aufgabensteller nach einer Präzisierung.
Gast11022013 Auf diesen Beitrag antworten »

Könntest Du (oder jemand anders) nochmal versuchen den Unterschied zwischen der ersten und zweiten Teilaufgabe zu erklären?


Noch habe ich nicht den Unterschied verstanden, glaube aber, daß es nicht unwichtig ist, das zu verstehen.



Vielen Dank!
René Gruber Auf diesen Beitrag antworten »

Zitat:
Original von Dennis2010
Bei der zweiten Teilaufgabe geht es nun wohl darum, daß sich in einem bestimmten Abschnitt so und so viel zerstörte Basenpaare befinden und dafür soll man die Wahrscheinlichkeit bestimmen. Das ist wohl eine Binomialverteilung:


Wieso die Binomialverteilung? Doch nur in der Näherung, primär ist es wieder die Hypergeometrische Veteilung. Gründe, statt dieser genauen Rechnung nur diese Binomialverteilungsapproximation (!) zu nehmen sehe ich eigentlich nur, wenn nicht bekannt ist, d.h. nur "unbestimmt groß".


EDIT: Ach jetzt sehe ich erst, die Werte sind sowieso falsch. Die Approximation gemäß obigen Punkt (1) wäre ja

.
Gast11022013 Auf diesen Beitrag antworten »

D.h. bei der ersten und zweiten Teilaufgabe nimmt man die hypergeometrische Verteilung?

Dann sind es gar nicht zwei verschiedene Aufgaben?
Ich habe wieder mal ein Maximum an Verwirrung erreicht. unglücklich
René Gruber Auf diesen Beitrag antworten »

Na es geht doch um dieselbe Größe, die zufällige Anzahl der zerstörten Basispaare in einer Familie. Da muss doch auch dieselbe Verteilung wirken, es gibt doch keinen Grund, dass die von Teilaufgabe zu Teilaufgabe sich verändert, nicht wahr? Augenzwinkern
Gast11022013 Auf diesen Beitrag antworten »

Ja, das macht Sinn.

Ich finde die Frage (bzw. das, was man eigentlich tun soll) so verwirrend funktioniert.

Da ich ein Steh-Auf-Männchen bin, versuche ich es nochmal. Augenzwinkern

Erst soll man ein Modell angeben für die Anzahl an zerstörten Basenpaaren in allen Abschnitten.
Antwort: Hypergeometrische Verteilung

Dann soll man die Verteilung für die Anzahl an zerstörten Basenpaaren im Abschnitt i angeben.


Da schreibt man dann nochmal das Gleiche hin?!


Ach, tut mir leid, ich wünschte, ich würd über solche vermutlichen Selbstverständlichkeiten nicht immer und immer wieder stolpern. böse
Gast11022013 Auf diesen Beitrag antworten »

Jetzt hat er die Lust verloren, was nicht verwunderlich ist. Big Laugh
René Gruber Auf diesen Beitrag antworten »

Zitat:
Original von Dennis2010
Erst soll man ein Modell angeben für die Anzahl an zerstörten Basenpaaren in allen Abschnitten.
Antwort: Hypergeometrische Verteilung

In allen Abschnitten, in bestimmten Abschnitten - wo ist da der Unterschied, solange es nur um die Verteilung in einem einzigen Abschnitt geht?

Was anderes wäre es, wenn man nach der gemeinsamen Verteilung in zwei oder mehreren Abschnitten fragen würde, also o.ä. Aber so habe ich das hier nun wirklich nicht aufgefasst, und eine derartige Formel wäre wegen der gegenseitigen Abhängigkeiten der ein wahres Monsterungetüm.

Also rede DU jetzt mal Klartext, statt immer nur rumzunerven: Wo siehst du denn jetzt verdammt nochmal einen Unterschied??? böse
Gast11022013 Auf diesen Beitrag antworten »
RE: Genom (Stochastik)
Ich habe dann die Aufgabe falsch verstanden.

Ich hatte sie so verstanden, als gäbe es da einen Unterschied.


Wie gesagt: Ich habe da drei Teilaufgaben herausgelesen.
René Gruber Auf diesen Beitrag antworten »

Nochmal: Wo siehst du den Unterschied? Konstruktive Gedanken bitte, statt nebulöser Bedenken - von denen ist das Maß bereits übervoll.
Gast11022013 Auf diesen Beitrag antworten »

Ich hatte es so verstanden, daß man zunächst eine Verteilung für alle Abschnitte und dann eine Verteilung für einzelne Abschnitte sucht.


Ich kam darauf, weil einmal von "Anzahl der zerstörten Basenpaare in allen Genomabschnitten" und einmal von Anzahl von zerstörten Basenpaaren im Abschnitt i (also ) die Rede ist.
René Gruber Auf diesen Beitrag antworten »

Zitat:
Original von Dennis2010
Ich hatte es so verstanden, daß man zunächst eine Verteilung für alle Abschnitte und dann eine Verteilung für einzelne Abschnitte sucht.

Also die gemeinsame Verteilung, oder was? Na dann viel Spaß.
Gast11022013 Auf diesen Beitrag antworten »

Ich sage ja nur, wie ich es verstanden hatte.

Und noch ein Missverständnis, das ich wohl hatte.

In der Aufgabenstellung bezieht sich das, was man berechnen soll auf den vorherigen Satz mit dem Modell und ich habe das so verstanden, als wären das zwei verschiedene Aufgaben.

Man soll aber wohl zuerst nur das Modell kurz nennen (hypergeometrische Verteilung) und dann konkret die Formel angeben, korrekt?
René Gruber Auf diesen Beitrag antworten »

Ich beantworte von nun an diese besch...en Fragen zur Interpretation deiner Aufgabenstellung nicht mehr. Da kann ich nur verlieren, ich kenne das Umfeld nicht, da bist du im Vorteil. Du musst dich mehr anstrengen, zumindest diesen Part zu übernehmen, du kannst nicht immer auch diesen Teil auf andere abwälzen.
Gast11022013 Auf diesen Beitrag antworten »

Ist okay.

Aber ich habe einfach die Frage aus dem Buch Georgii, "Stochastik"zitiert und ich habe da auch keine anderen Voraussetzungen.

Ich verstehe aber die Reaktion.
Gast11022013 Auf diesen Beitrag antworten »

Einer Sache kann ich jedefalls gewiss sein:

Ich schaffe es immer wieder, Dich aus der Fassung zu bringen.

unglücklich



Wie schon oft gesagt: Ich beabsichtige das nicht.

Aber hier ist die Fragestellung (jedenfalls meines Ermessens) komisch.
René Gruber Auf diesen Beitrag antworten »

Na vielleicht sollte ich mich in Zukunft dann mehr beherrschen, und deine Threads ignorieren. Zumindest derlei Fragen darin.
Gast11022013 Auf diesen Beitrag antworten »

Okay.

Aber Du musst doch zugeben, daß die Aufgabe mit ihren Formulierungen (alle Abschnitte, Abschnitt i,...) viel Stoff für Missverständnisse geben kann.

Naja, wie auch immer.

Wink
Neue Frage »
Antworten »



Verwandte Themen

Die Beliebtesten »
Die Größten »
Die Neuesten »