Überlappen von Basen berechnen?
Kann mir jemand helfen wie man mit so einer Aufgabe beginnt ? Ich habe irgendwie drei komplett verschiedene Lösungen raus : (
Berechnen Sie, um wie viele Basen die sequenzierten Fragmente mindestens überlappen müssen, damit die überlappende Sequenz in einem humanen Genom von 3,1 Gigabasen Größe statistisch gesehen nur ein einziges Mal vorkommt
1 Antwort
Das Problem ist eher ein mathematisches als ein biologisches. Wie du sicher weißt, gibt es nur vier verschiedene Nukleobasen in der DNA: Adenin (A), Thymin (T), Guanin (G) und Cytosin (C).
Bei einem Fragment mit einer Länge von einem einzigen Basenpaar (bp) gibt es nur vier verschiedene Kombinationsmöglichkeiten (4¹), eben A, T, G oder C. Bei einer Länge von 2 bp sind es schon 4²=16 verschiedene Kombinationsmöglichkeiten. Bei 3 bp sind es 4³=64 mögliche Kombinationen. Das ist auch der Grund dafür, dass der genetische Code aus Tripletts besteht, weil erst mit einer Abfolge von drei Basen genügend Kombinationsmöglichkeiten zur Verschlüsselung der 20 kanonischen Aminosäuren bestehen.
Du möchtest wissen, wie lang eine DNA-Sequenz mindestens sein muss, damit sie im gesamten Genom statistisch nur ein einziges Mal auftritt. Dafür musst du erst einmal die Genomgröße von 3.1 Gbp in bp umrechnen. Anschließend musst du bestimmen, bei welchem Exponenten x die Ungleichung 4^x ≥ 3.1 Gbp erfüllt wird.
Das wars? Die Antwort wäre also die DNA-Sequenz muss mindestens 16 bp lang sein, damit sie im gesamten Genom statistisch nur ein einziges Mal auftritt @Darwinist ?
Sind bei den Gigabasen nur die einzelnen Basen gemeint oder jeweils Basenpaare? Dass heißt z.B. Bei 10 Gigabasen 5 Milliarden Basenpaare.
Liebe Grüße
Die DNA ist ja ein Doppelstrang. Deshalb wird ihre Länge in Basenpaaren und nicht in Basen angegeben. Die Angabe in Basen macht nur bei Einzelsträngen Sinn, etwa bei der RNA.
Die Ungleichung 4^x ≥ 3.1 Gbp erfüllt, wenn x größer oder gleich 15.764 ist. Kann das stimmen ??
Ich habe es jetzt nicht exakt berechnet, aber es müsste hinkommen. 15 bp sind noch zu wenig (etwas über 1 Mrd. Möglichkeiten), bei 16 bp funktioniert's (über 4 Bio. Möglichkeiten). Bei 15.764 müsste man irgendwo in der Größenordnung von 3 Mrd. Möglichkeiten rauskommen. Aber es kann ja 0.764 bp nicht geben, du musst deshalb auf 16 bp aufrunden.
Hallo, wie würde denn die Aufgabe weitergehen?