Aufgabe:
um einen großen Pool kurzer DNA-Fragmente in Klassen zu gruppieren, die gemeinsame Teilsequenzmuster aufweisen, und die Konsenssequenz jeder Klasse zu finden.
- Pool: ca. 300 Sequenzfragmente
- 8 - 20 Buchstaben pro Fragment
- 4 mögliche Buchstaben: a,g,t,c
- Jedes Fragment ist in drei Regionen unterteilt:
- 5 generische Buchstaben
- 8 oder mehr Positionen von g's und c's
- 5 generische Buchstaben
(Als Regex wäre das[gcta]{5}[gc]{8,}[gcta]{5}
)
Plan:
um ein multiples Alignment (z. B. mitClustalW2) durchzuführen, um Klassen zu finden, die gemeinsame Sequenzen in Region 2 und ihre Konsenssequenzen haben.
Fragen:
- Sind meine Fragmente zu kurz, und würde es helfen, sie zu vergrößern?
- Ist die Region 2 mit nur zwei zulässigen Buchstabentypen zu homogen, um Muster in ihrer Abfolge zu zeigen?
- Welche alternativen Methoden oder Instrumente können Sie für diese Aufgabe vorschlagen?
Mit freundlichen Grüßen,
Simon