Überlappung von Basen berechnen?
Hallo Zusammen, mir liegt folgende Fragestellung vor:
Berechnen Sie, um wie viele Basen die sequenzierten Fragmente mindestens überlappen müssen, damit die überlappende Sequenz in einem humanen Genom von 3,1 Gigabasen Größe statistisch gesehen nur ein einziges Mal vorkommt.
Die Frage wurde vor 2 Monaten schonmal gestellt, auf die der USer Darwinist einen hilfreichen Tipp gegeben hat, dass man die Ungleichung 4^x ≤ 3.1 * 10^9 bp nach x auflösen kann und dann aufrunden kann bzw. das Ergebnis mit 1 addieren und dann die Gausklammer davon nehmen, wobei x = 16 herauskommt. Leider ist die Aufgabe damit noch nicht beantwortet und ich komme leider nicht mehr weiter. Kann mir bitte jemand helfen? LG
Kann es sein, dass ich mit der berechneten Länge x die FormelC = L * N / G verwenden kann um auf C = Coverage bzw. Redundanz zu schließen?L = ReadlängeN = Anzahl ReadsG = GenomlängeDas wäre super wenn mir da kurz jemand helfen könnte.
1 Antwort
Wieso ist die Frage damit noch nicht beantwortet?
Die Frage lautet:
Berechnen Sie, um wie viele Basen die sequenzierten Fragmente mindestens überlappen müssen, damit die überlappende Sequenz in einem humanen Genom von 3,1 Gigabasen Größe statistisch gesehen nur ein einziges Mal vorkommt.
Das Ergebnis der Ungleichung ist die Länge, die ein DNA-Fragment mindestens haben muss, damit es im menschlichen Genom garantiert kein zweites Mal auftritt. Da es halbe Basenpaare nicht geben kann, musst du das Ergebnis auf ganze Basenpaare aufrunden.
Du kannst das Ganze auch intuitiv ausrechnen, ohne Lösen einer Ungleichung, indem du mühsam alle Exponenten so lange durchgehst, bis du eine Zahl erhältst, bei der es mehr Kombinationsmöglichkeiten als Basenpaare im Genom gibt, also 4¹, 4², 4³, 4⁴ usw.
Wundervoll, du rettest mir den Tag. Vielen lieben Dank :) <3