Überlappen von Basen berechnen?

1 Antwort

Vom Beitragsersteller als hilfreich ausgezeichnet

Das Problem ist eher ein mathematisches als ein biologisches. Wie du sicher weißt, gibt es nur vier verschiedene Nukleobasen in der DNA: Adenin (A), Thymin (T), Guanin (G) und Cytosin (C).

Bei einem Fragment mit einer Länge von einem einzigen Basenpaar (bp) gibt es nur vier verschiedene Kombinationsmöglichkeiten (4¹), eben A, T, G oder C. Bei einer Länge von 2 bp sind es schon 4²=16 verschiedene Kombinationsmöglichkeiten. Bei 3 bp sind es 4³=64 mögliche Kombinationen. Das ist auch der Grund dafür, dass der genetische Code aus Tripletts besteht, weil erst mit einer Abfolge von drei Basen genügend Kombinationsmöglichkeiten zur Verschlüsselung der 20 kanonischen Aminosäuren bestehen.

Du möchtest wissen, wie lang eine DNA-Sequenz mindestens sein muss, damit sie im gesamten Genom statistisch nur ein einziges Mal auftritt. Dafür musst du erst einmal die Genomgröße von 3.1 Gbp in bp umrechnen. Anschließend musst du bestimmen, bei welchem Exponenten x die Ungleichung 4^x ≥ 3.1 Gbp erfüllt wird.

Woher ich das weiß:Studium / Ausbildung – Biologiestudium, Universität Leipzig

nikkiasc 
Beitragsersteller
 04.07.2023, 13:01

Vielen Dank ! Das hilft wirklich weiter !!!

0
nikkiasc 
Beitragsersteller
 04.07.2023, 13:04

Die Ungleichung 4^x ≥ 3.1 Gbp erfüllt, wenn x größer oder gleich 15.764 ist. Kann das stimmen ??

0
Darwinist  04.07.2023, 13:43
@nikkiasc

Ich habe es jetzt nicht exakt berechnet, aber es müsste hinkommen. 15 bp sind noch zu wenig (etwas über 1 Mrd. Möglichkeiten), bei 16 bp funktioniert's (über 4 Bio. Möglichkeiten). Bei 15.764 müsste man irgendwo in der Größenordnung von 3 Mrd. Möglichkeiten rauskommen. Aber es kann ja 0.764 bp nicht geben, du musst deshalb auf 16 bp aufrunden.

1
Nutzer515  14.08.2023, 14:36

Sind bei den Gigabasen nur die einzelnen Basen gemeint oder jeweils Basenpaare? Dass heißt z.B. Bei 10 Gigabasen 5 Milliarden Basenpaare.

Liebe Grüße

0
Darwinist  14.08.2023, 15:21
@Nutzer515

Die DNA ist ja ein Doppelstrang. Deshalb wird ihre Länge in Basenpaaren und nicht in Basen angegeben. Die Angabe in Basen macht nur bei Einzelsträngen Sinn, etwa bei der RNA.

1
Christoph630  25.09.2023, 17:56

Hallo, wie würde denn die Aufgabe weitergehen?

0
Christoph630  25.09.2023, 23:57
@Darwinist

Das wars? Die Antwort wäre also die DNA-Sequenz muss mindestens 16 bp lang sein, damit sie im gesamten Genom statistisch nur ein einziges Mal auftritt @Darwinist ?

0