Oppgaven er ikke lenger tilgjengelig

Rask sammenligning av DNA-sekvenser ved parallellisering

Student: Bjørnar Ruud (bjoraru)

Parallellisering av algoritmer er nødvendig for å kunne utnytte moderne mikroprosessorer til å øke hastigheten. Ettersom klokkehastigheten har stoppet opp rundt ca 3 GHz har mange prosessorer i stedet fått flere kjerner på samme brikke. Intel har lansert åttekjerners prosessorer. Cell-prosessoren har 9 kjerner. Grafikkprosessorer (GPUer) har hundrevis av enkle kjerner. Dessuten har SIMD-teknologi (Single Instruction Multiple Data) dukket opp i mange prosessorer. Utvikling av kraftig maskinvare for bedre grafikk og lyd i spill har vært en viktig faktor og Cell-prosessoren brukes bl.a. i Sony Playstation 3. I fremtiden forventes en utvikling med enda flere kjerner og enda bredere registre for SIMD.

Det er også en rivende utvikling innen teknologi for DNA-sekvensering. Såkalt dypsekvensering (NGS eller HTS) har revolusjonert hastigheten og kostnadene ved DNA-sekvensering. Med de nyeste maskinene kan man bestemme rekkefølgen til nukleotidene som er byggesteinene i DNA med en ekstrem hastighet i forhold til hva man kunne for få år siden. I løpet av 8 dager kan man på en maskin sekvensere nesten 200 milliarder nukleotider, fordelt på 2 milliarder korte sekvenser a 100bp. En meget aktuell problemstilling i denne sammenheng er å finne ut akkurat hvor på et kjent genom alle disse korte sekvensene hører hjemme. Ofte vil sekvensen passe perfekt, men pga mulige sekvenseringsfeil og naturlig variasjon i genomet må man regne med at det kan forekomme noen få nukleotider som ikke er identiske. Det er allerede utviklet en rekke programmer for å løse disse problemene. Målet med oppgaven er å undersøke om det er mulig å utnytte parallellisering for å øke hastigheten på denne prosessen.
 

Studieprogram

Biomedical Research Group

Publisert 14. mars 2011 14:04 - Sist endret 15. des. 2023 23:44

Veileder(e)

Omfang (studiepoeng)

60