Deoksyribonukleinsyre eller deoksyribonukleinsyre (i akronym DNA , fra engelsk DeoxyriboNucleic Acid ; mindre vanlig, på italiensk, også ADN [1] [2] [3] ) er en nukleinsyre som inneholder den genetiske informasjonen som er nødvendig for biosyntesen av RNA og proteiner , molekyler som er avgjørende for utviklingen og funksjonen til de fleste levende organismer . [4]
Kjemisk er DNA en dobbelttrådet organisk polymer hvis monomerer kalles nukleotider (deoksyribonukleotider). Nukleotider består av tre grunnleggende komponenter: en fosfatgruppe , et pentosesukker ( deoksyribose, også kalt deoksyribose ) og en nitrogenholdig base som binder seg til deoksyribose med en N-glykosidbinding . Det er fire nitrogenholdige baser som går inn i dannelsen av nukleotider: adenin , tymin , cytosin og guanin ( uracil er tilstede i RNA i stedet for tymin ). DNA kan globalt defineres som en polynukleotiddobbelkjede (A, T, C, G), antiparallell, orientert, komplementær, spiralisert, informativ.
Rekkefølgen i det sekvensielle arrangementet av nukleotidene utgjør den genetiske informasjonen, som via den genetiske koden oversettes til de tilsvarende aminosyrene . Aminosyresekvensen som produseres, kalt polypeptid , danner proteiner . Prosessen med genetisk translasjon (ofte kalt proteinsyntese ) er bare mulig i nærvær av et mellomliggende RNA - molekyl , som genereres ved komplementaritet med de fire nukleotidbasene til DNA i en prosess kjent som transkripsjon . Denne prosessen genererer ikke bare RNA-tråder bestemt for translasjon, men også fragmenter som allerede er i stand til å utføre forskjellige biologiske funksjoner (for eksempel inne i ribosomer , hvor RNA har en strukturell funksjon). Genetisk informasjon dupliseres før celledeling gjennom DNA-replikasjon , som den overføres integrert med i passasjen mellom forskjellige cellegenerasjoner.
I eukaryoter komplekserer DNA i kjernen til strukturer som kalles kromosomer . I andre organismer, uten en kjerne, kan den organiseres i kromosomer eller ikke (i bakterier er det et enkelt sirkulært dobbelttrådet DNA-molekyl, mens virus kan ha DNA- eller RNA - genom ). Innenfor kromosomer organiserer kromatinproteiner som histoner , cohins og kondensiner DNA og pakker det inn i ordnede strukturer. Disse strukturene driver samspillet mellom den genetiske koden og proteinene som er ansvarlige for transkripsjon, og hjelper til med å kontrollere gentranskripsjon.
DNA-et ble opprinnelig isolert av den sveitsiske biokjemikeren Friedrich Miescher , som i 1869 identifiserte et mikroskopisk stoff inneholdt i puss til de kirurgiske bandasjene som ble brukt. Siden dette molekylet hadde sin lokalisering i kjernen , kalte han det nuklein . [5] I 1919 identifiserte Phoebus Levene nukleotidstrukturen, sammensatt av nitrogenbase, sukker og fosfat. [6] Levene foreslo at DNA besto av en tråd av nukleotider koblet sammen gjennom fosfater. Han var imidlertid overbevist om at denne filamentet var kort og at basene var ordnet i en presis gjentatt rekkefølge. I 1937 presenterte William Astbury de første resultatene av noen røntgendiffraksjonsstudier , som viste at DNA har en ekstremt regelmessig struktur [7] . I 1944 hevdet Erwin Schrödinger at siden i henhold til kvantefysikksystemer av noen få atomer har en forstyrret oppførsel, må det genetiske materialet bestå av et stort ikke-repetitivt molekyl, stabilt nok til å opprettholde den genetiske informasjonen, kalt "aperiodisk krystall". [8]
I 1928 oppdaget Frederick Griffith at trekkene i glatt form av Pneumococcus kunne overføres til den grove formen ved å blande restene av døde glatte bakterier med levende grove bakterier . [9] Selv om dette systemet ikke ga bevis for hvilket stoff som forårsaket endringen, viste det at noe kunne bære genetisk informasjon fra restene av døde til levende bakterier. Det var derfor snakk om et transformasjonsprinsipp som er i stand til å modifisere levende bakterier. I 1943 demonstrerte Oswald Theodore Avery , i et kjent eksperiment sammen med Colin MacLeod og Maclyn McCarty , at DNA er transformasjonsprinsippet bak dette fenomenet. [10] Rollen til DNA i arv ble endelig bevist i 1953 av Alfred Hershey og Martha Chase gjennom et annet klassisk eksperiment , som viste at det genetiske materialet til fag T2 faktisk er DNA. [11]
1953 er også året hvor, gjennom ytterligere røntgendiffraksjonsbilder [12] laget av Rosalind Franklin , engelsk kjemiker-fysiker, James Watson og Francis Crick presenterte [12] , i tidsskriftet Nature , det som nå er etablert som det første nøyaktig modell av DNA-struktur, [13] eller dobbelhelix -modellen . Skissen ble designet av Odile Speed , Cricks kone og maler. De eksperimentelle bevisene som støtter Watson og Crick-modellen ble rapportert i en serie på fem artikler publisert i samme utgave av Nature. [14] Blant disse var artikkelen av Franklin og Raymond Gosling , som inneholdt røntgendiffraksjonsdata, avgjørende for å støtte modellen. [15] [16] Den utgaven inneholdt også en artikkel om strukturen til DNA skrevet av Maurice Wilkins . [17] I 1962 , etter Rosalind Franklins død (på grunn av en svulst sannsynligvis forårsaket av de høye dosene røntgenstråler hun ble utsatt for i løpet av sine eksperimenter), mottok Watson, Crick og Wilkins i fellesskap Nobelprisen i medisin . [18] Siden oppdagelsen av modellen i hovedsak var basert på Rosalind Franklins data, er det fortsatt i dag svært blandede meninger i det vitenskapelige miljøet om hvem som skulle ha mottatt denne prisen.
I en stor presentasjon i 1957 foreslo Crick det sentrale dogmet innen molekylærbiologi , som fikser forholdet mellom DNA, RNA og proteiner. [19] Den endelige bekreftelsen av replikasjonsmekanismen basert på den doble helixstrukturen ble gitt i 1958 av Meselson-Stahl-eksperimentet . [20] Senere arbeid av Crick viste at den genetiske koden var basert på ikke-overlappende basetripletter, slik at Har Gobind Khorana , Robert Holley og Marshall Warren Nirenberg kunne dechiffrere den. [21] Disse funnene danner grunnlaget for moderne molekylærbiologi .
I 1961 oppdaget Marshall Nirenberg og Severo Ochoa at hver triplett av nukleotider koder for en spesifikk aminosyre.
DNA er en lang polymer som består av repeterende enheter av nukleotider . [22] [23] DNA-kjeden er mellom 22 og 26 Ångström (2,2 til 2,6 nanometer ) bred og hver nukleotidenhet er 3,3 Ångström (0,33 nanometer) lang. [24] Selv om hver enhet tar svært liten plass, kan lengden på DNA-polymerer være overraskende høy, siden hver tråd kan inneholde flere millioner nukleotider. For eksempel inneholder det største menneskelige kromosomet ( kromosom 1 ) nesten 250 millioner basepar . [25]
I levende organismer er DNA nesten aldri til stede i form av en enkelt tråd, men som et par nært tilknyttede tråder. [13] [26] De fletter seg inn i hverandre for å danne en struktur som kalles en dobbel helix . Hvert nukleotid består av et lateralt skjelett , som gjør at det kan binde seg kovalent til de tilstøtende nukleotidene, og en nitrogenholdig base, som etablerer hydrogenbindinger med den tilsvarende nitrogenholdige basen tilstede på motsatt filament. Forbindelsen dannet av en nitrogenholdig base knyttet til sukker kalles nukleosid ; et nukleotid er i stedet et nukleosid som en eller flere fosfatgrupper er bundet til. [27]
Den laterale strukturen til DNA er sammensatt av gjentatte og alternerende enheter av fosfatgrupper og 2-deoksyribose, [28] et pentosesukker ( med fem karbonatomer ) som binder seg til tilstøtende fosfater gjennom fosfodiesterbindinger ved det tredje og femte karbonet ; i praksis danner hvert fosfatmolekyl en molekylær bro som forbinder, gjennom fosfodiesteriske bindinger, karbonet i 3′-posisjonen til et deoksyribosemolekyl med karbonet i 5′-posisjonen til neste sukker. Konsekvensen av disse asymmetriske bindingene er at hver DNA-streng har en følelse, bestemt av retningen til fosfodiesterbindingene. De nitrogenholdige basene, på den annen side, slutter seg til 1'-posisjonen til deoksyribosesukkeret med N-glykosidbindinger. I en dobbel helix er retningen til en tråd motsatt av retningen til den komplementære tråden. Av denne grunn kalles de to filamentene som utgjør en dobbel helix antiparallelle. De asymmetriske endene av en DNA-tråd kalles 5' - ender ( fem primtall ) og 3'- ender ( tre primtall ). Hovedforskjellen mellom DNA og RNA er pentosesukkeret som brukes: RNA bruker faktisk ribose . [26]
DNA-dobbelthelixen stabiliseres av hydrogenbindingene som er etablert mellom de nitrogenholdige basene på de to trådene. [29] De fire basene som finnes i DNA er adenin (forkortet med bokstaven A), cytosin (C), guanin (G) og tymin (T). Alle fire baser har heterosyklisk struktur , men adenin og guanin er, fra et strukturelt synspunkt, derivater av purin , og derfor kalt purinbaser , mens cytosin og tymin er relatert til pyrimidin og kalles pyrimidinbaser . [26] Det er en femte base, av typen pyrimidin, kalt uracil (U), men den er normalt ikke tilstede i DNA-kjeder. Uracil er også tilstede i RNA-trådene i stedet for tymin, som det skiller seg fra på grunn av mangelen på en metylgruppe . Uracil er kun tilstede i DNA som et produkt av cytosinnedbrytning. Bare i bakteriofagen PBS1 kan denne basen brukes i DNA. [30] Tvert imot er det mye mer vanlig å oppdage tymin i RNA-molekyler, på grunn av den enzymatiske metyleringen av flere uraciler. Denne hendelsen forekommer vanligvis i RNA med strukturell eller enzymatisk funksjon ( rRNA og tRNA ). [31]
Den doble helixen er en høyrehendt spiral. Når de to filamentene skrus på seg selv, forblir rillene mellom de forskjellige fosfatgruppene blottlagte. Den store rillen er 22 Å bred, mens den mindre rillen er 12 Å bred. [32] Den forskjellige bredden på de to sporene oversetter konkret til en annen tilgjengelighet for basene, avhengig av om de er plassert i det større eller mindre sporet. DNA-bindende proteiner, slik som transkripsjonsfaktorer, kommer derfor vanligvis i kontakt med basene som er tilstede i hovedsulcus. [33] [34]
Hver type base som er tilstede på en tråd danner en binding med basen plassert på den motsatte tråden. Denne hendelsen er kjent som komplementær sammenkobling . Purinbaser danner hydrogenbindinger med pyrimidinbaser: A kan bare binde T og G kan bare binde C. Assosiasjonen av to baser kalles vanligvis basepar og er den mest brukte måleenheten for å definere lengden på et DNA-molekyl. Siden hydrogenbindinger ikke er kovalente , kan de brytes og gjenforenes relativt enkelt, da disse er høyenergibindinger. De to strengene kan skilles fra hverandre, som skjer for et hengsel , både ved høye temperaturer og ved mekanisk handling (som skjer under DNA-replikasjon ). [35] Konsekvensen av denne komplementariteten er at all informasjonen i den doble helixen kan dupliseres fra begge trådene, en grunnleggende hendelse for korrekt DNA-replikasjon. [22]
De to typene basepar danner ulikt antall hydrogenbindinger: A og T danner to, G og C tre. Av denne grunn er stabiliteten til GC-bindingen mye større enn AT-bindingen. Følgelig er den generelle stabiliteten til et DNA-molekyl direkte relatert til frekvensen av GC som er tilstede i selve molekylet, så vel som til lengden på helixen: et DNA-molekyl er derfor desto mer stabilt jo mer det inneholder GC og er langt. . [36] En annen konsekvens av denne hendelsen er det faktum at DNA-regionene som lett må separeres inneholder en høy konsentrasjon av A og T, slik det for eksempel skjer for Pribnow-boksen med bakterielle promotorer [37]
I laboratoriet måles stabiliteten av interaksjonen mellom filamenter gjennom temperaturen som er nødvendig for å bryte alle hydrogenbindinger, kalt smeltetemperaturen (eller T m ). Når alle hydrogenbindinger brytes, skilles de enkelte filamentene og kan få svært varierte strukturer. [38]
Stabiliseringen av dobbelthelixen skyldes i alle fall ikke bare hydrogenbindinger, men også hydrofobe og pi-stablingsinteraksjoner . [39]
En DNA-sekvens kalles sense hvis sekvensen er den samme som dens mRNA . Sekvensen plassert på motsatt filament kalles i stedet antisense . Siden RNA-polymeraser virker ved å produsere en komplementær kopi, er strengen som kreves for transkripsjon antisense. Tallrike antisense RNA - molekyler produseres i både prokaryoter og eukaryoter fra sense -sekvenser . Funksjonen til disse ikke-kodende RNA-ene er ennå ikke fullstendig belyst. [40] Det antas at antisense RNA kan spille en rolle i reguleringen av genuttrykk . [41]
Det er noen DNA-sekvenser, både i prokaryoter og i eukaryoter (men spesielt i plasmider og virus ) der forskjellen mellom sense- og antisense-sekvenser er mindre tydelig, siden sekvensene til noen gener overlapper hverandre. [42] I disse tilfellene utfører derfor noen sekvenser en dobbel oppgave: å kode for et protein hvis det leses i 5 ' → 3'-retningen på et filament; kode en annen hvis den leses på den andre (alltid i 5 ' → 3' retningen). Hos bakterier er denne genoverlappingen ofte involvert i reguleringen av transkripsjon, [43] mens i virus skyldes fenomenet behovet for å inneholde en stor mengde informasjon i et lite genom . [44] En annen måte å redusere genomisk størrelse på er den som oppdages av andre virus, som inneholder enkelttrådede lineære eller sirkulære DNA-molekyler. [45] [46]
DNA kan forvrenges som en streng gjennom en prosess som kalles supercoiling . Når DNA er i en avslappet tilstand , reiser en tråd en hel omdreining rundt aksen hvert 10,4 basepar. På den annen side, hvis DNA er forvrengt, kan antall baser øke eller reduseres. [47] Supercoil-tilstanden som et DNA-molekyl finnes i kalles topologi . Hvis DNA snirkler seg i retning av helixen, kalles det en positiv supercoiling , med basene strammet mer markert sammen. Ellers blir det referert til som negativ supercoiling . I naturen viser de fleste DNA-molekyler en mild negativ supercoiling, introdusert av enzymer kalt topoisomeraser . [48] Disse enzymene er også nødvendige i prosesser som transkripsjon og DNA-replikasjon, siden de er i stand til å løse de topologiske påkjenningene indusert av selve prosessene. [49]
DNA finnes i forskjellige typer konformasjoner . De heter A-DNA, B-DNA, C-DNA, D-DNA, [50] E-DNA, [51] H-DNA, [52] L-DNA, [50] P-DNA [53] og Z-DNA. [28] [54] Det er imidlertid bare A-DNA-, B-DNA- og Z-DNA-konformasjoner som er observert i naturlige biologiske systemer. Konformasjonen av DNA kan avhenge av sekvensen, av supercoilingen, av tilstedeværelsen av kjemiske modifikasjoner av basene eller av forholdene til løsningsmidlet, for eksempel konsentrasjonen av metallioner . [55] Av disse konformasjonene er konformasjon B den hyppigste under standard celleforhold. [56] De to alternative konformasjonene er forskjellige med tanke på geometri og dimensjoner.
Form A er en bred høyrehendt spiral (minor sulcus er bred, men grunn, den store er smalere og dypere), med en stigning på 2,9 nm (ca. 11 bp) og en diameter på 2,5 nm. Denne konformasjonen er tilstede under ikke-fysiologiske forhold, når DNA er dehydrert. Under fysiologiske forhold karakteriserer denne konformasjonen DNA- og RNA - heteroduplekser og kompleksene dannet av DNA-proteinassosiasjoner. [57] [58]
Z - konformasjonen er typisk i stedet for sekvensene som viser kjemiske modifikasjoner som metylering , og av DNA-strekningene rike på C- og G-baser. Den antar en venstrehendt trend, motsatt av B-konformasjonen. [59] Den har en trinn på 4,6 nm og en diameter på 1,8 nm, den store sulcus mer overfladisk og den mindre smalere; skylder navnet sitt til sikk-sakk-mønsteret som kjennetegner den. Disse uvanlige strukturene kan gjenkjennes av spesifikke Z -DNA-bindende proteiner , med bemerkelsesverdige konsekvenser i reguleringen av transkripsjon, selv om ingen eksempler er funnet i naturen. [60]
De terminale områdene til lineære kromosomer er gjentatte sekvenser kalt telomerer . Hovedfunksjonen til disse regionene er å la cellen replikere endene av kromosomene uten tap av geninformasjon, siden DNA-polymerasene involvert i DNA-replikasjon ikke er i stand til å replikere de 3 'endene av kromosomene. [62] Hvis et kromosom ikke hadde telomerer, ville det faktisk blitt litt kortere for hver replikasjon, med fare for å miste kodesekvenser. Gjennom en bestemt type DNA-polymerase (kalt telomerase ) opprettholder imidlertid telomerer hele tiden lengden, og beskytter dermed den indre delen av kromosomet. I menneskelige celler er telomerer sammensatt av flere tusen repetisjoner av en enkel sekvens som består av TTAGGG. [63]
Denne guaninrike sekvensen kan stabilisere endene av kromosomene ved å danne uvanlige strukturer, sammensatt av enheter av fire nitrogenholdige baser i stedet for de to kanoniske. Dette skyldes samspillet mellom fire guaniner, som danner en plan struktur som er stablet oppå andre strukturer av samme type, for å oppnå en stabil filament kalt G-quadruplex- struktur. [64] Disse strukturene stabiliseres ved dannelsen av hydrogenbindinger som etableres mellom toppene av basene og ved chelering med et metallion, plassert i midten av hver enhet på fire baser. [65]
I tillegg til disse genererer telomerer også sirkulære strukturer, kalt telomere-løkker eller T-løkker . I dette tilfellet folder DNA-strengen seg for å danne store sirkler, stabilisert av spesifikke proteiner som binder telomerer. [66] Ved enden av T-løkken kommer den enkle DNA-tråden i kontakt med en dobbeltråd, som åpner seg og danner en trippelhelixstruktur . Denne strukturen kalles forskyvningsløkke eller D-løkke . [64]
Genuttrykket til et gitt locus påvirkes av strukturen som kromatinet antar på selve locuset. Heterokromatinregioner (karakterisert av lite eller ingen uttrykk ) er omfattende metylert på cytosinene . Metylering av cytosin, for eksempel, er kritisk for inaktivering av X-kromosomet . [67] Det gjennomsnittlige nivået av metylering varierer mye mellom ulike organismer: Caenorhabditis elegans viser ikke cytosin-metylering, mens virveldyr viser høyere nivåer, med omtrent 1 % av genomet som inneholder 5-metylcytosin. [68] 5-metylcytosin, som er mottakelig for spontan deaminering, er en base hvor forekomsten av mutasjoner er svært høy. [69]
Ytterligere basemodifikasjoner er metylering av adenin (tilstede i bakterier) og glykosylering av uracil som produserer de såkalte J-basene i kinetoplastider . [70] [71]
DNA kan endres ved virkningen av en rekke midler, generisk definert som mutagener ; det er imidlertid viktig å merke seg hvordan en mutasjon - det vil si en sjelden, tilfeldig endring, som endrer sekvensen av nitrogenholdige baser - ikke nødvendigvis er en skadelig hendelse, men snarere er grunnlaget for evolusjon: den nevnte mutasjonen vil imidlertid , må finne vei inn i det tette cellulære kybernetiske nettverket så vel som i miljøet der den aktuelle levende organismen lever og opererer; hvis disse restriksjonspunktene overskrides (svært selektiv gitt deres iboende kompleksitet, de aller fleste mutasjoner viser seg faktisk ikke å være fordelaktige eller til og med nøytrale), vil en organisme som er beriket med mutasjonen, oppnås. Forandrende midler inkluderer for eksempel oksidasjonsmidler , alkyleringsmidler og også høyenergistråling , som røntgen- og UV - stråler .
Typen skade forårsaket av DNA avhenger av typen middel: UV-er skader for eksempel DNA ved å generere dannelsen av tymin-dimerer , bestående av avvikende broer som etableres mellom tilstøtende pyrimidinbaser. [73] Oksidasjonsmidler som frie radikaler eller hydrogenperoksid produserer derimot skader av en mer heterogen type, slik som basemodifikasjoner (spesielt guanin) eller dobbelttrådet DNA-brudd. [74] I følge flere studier er minst 500 baser per dag i hver menneskelig celle utsatt for oksidativ skade. [75] [76] Av disse skadene er de farligste dobbelttrådete brudd, siden slike skader er den vanskeligste å reparere og er den primære kilden til punkt- og rammeskiftmutasjoner som akkumuleres på genomiske sekvenser, så vel som til kromosomale translokasjoner . [77]
Mange midler skylder sin mutagene kraft til evnen til å interkalere mellom to påfølgende nitrogenholdige baser. Interkalanter er vanligvis plane og aromatiske molekyler , slik som etidium , daunomycin , doksorubicin eller thalidomid . For at et interkalerende element skal finne et sted mellom de to basene, må den doble helixen åpne og miste sin standardkonformasjon. Disse strukturelle endringene hemmer både transkripsjon og DNA-replikasjon og øker muligheten for at mutasjoner oppstår. Av denne grunn regnes interkalatorer som kreftfremkallende molekyler , som demonstrert av en rekke studier på molekyler som benzopyren , akridin , aflatoksin og etidiumbromid . [78] [79] [80] I alle fall, takket være deres evne til å hemme transkripsjon og replikasjon, brukes disse molekylene også i kjemoterapi for å hemme den raske veksten av neoplastiske celler. [81]
I eukaryoter er DNA vanligvis til stede i lineære kromosomer (sirkulært i prokaryoter ). Summen av alle kromosomene til en celle utgjør dens genom ; det menneskelige genomet har omtrent 3 milliarder basepar inneholdt i 46 kromosomer. [82]
Det endelige kromosomarrangementet følger nøyaktige hierarkiske emballasjeregler . Faktisk, i celler kan den doble DNA-strengen ikke ordnes tilfeldig , men må følge nøyaktige ordensregler. Disse tiltakene er nødvendige fordi lengden på DNA-trådene vanligvis er svært høye og vil skape alvorlige problemer for vertscellen. For eksempel måler kromosomet til Escherichia coli , den mest studerte prokaryoten i biomedisinens historie, omtrent 1 mm. I en celle som bare er 2 µm lang, slik som den til E. coli, kan det tilfeldige arrangementet av et slikt kromosom skape problemer. Hvis et molekyl av denne lengden var tilfeldig ordnet, ville det faktisk trenges en celle som er minst 1000 ganger så stor. Pakkemetoder er forskjellige mellom prokaryote og eukaryote organismer .
I de fleste bakterieceller er DNA ordnet på et enkelt sirkulært kromosom (og har, som mange andre bakterier, et enkelt replikasjonsopphav ), som forutsagt av en rekke koblingseksperimenter og til slutt påvist i celler dyrket med tritium -merket tymin . .
Mekanismene som settes inn av den prokaryote cellen for å redusere nødvendig plass består fremfor alt i maskering av de negative ladningene som finnes på DNAet gjennom dets assosiasjon med positivt ladede polyaminer , som spermin og spermidin . I tillegg til disse kommer prokaryot DNA også i kontakt med en rekke små proteiner, som komprimerer den generelle strukturen til DNA. Blant dem er H-NS , en dimer med funksjoner som ligner veldig på eukaryote histoner. I hver celle av E. coli er det i gjennomsnitt 20 000 molekyler av H-NS, som er arrangert langs DNA i en avstand på ca. 400 bp.
Coli DNA er også veldig supercoiled . Dette fenomenet bidrar ytterligere til komprimering av DNA, slik at det kan ordne seg komfortabelt inne i cellen.
Hos eukaryoter oppnås emballasje gjennom ulike tiltak. DNA er assosiert med et stort antall proteiner: den generelle DNA-proteinassosiasjonen kalles kromatin , hvis struktur i stor grad er bevart blant alle eukaryote organismer.
De mest tallrike kromatinproteinene er histoner , en familie av grunnleggende polypeptider som er tilstede i kjernen. De viktigste histonproteinene er H1 , H2A , H2B , H3 og H4. Det grunnleggende til histoner skyldes den store mengden positivt ladede aminosyrer ( lysin og arginin ), som er i stand til å etablere elektrostatiske interaksjoner med fosfatgruppene i DNA. Histonproteiner er også sterkt modifisert, nettopp på de ladede restene, ved post-translasjonelle modifikasjoner , inkludert tilsetning av acetyler , fosfater og metyler , som nøytraliserer den positive ladningen eller gjør den negativ.
Aminosyresekvensene til fire av de fem histonene (H2A, H2B, H3 og H4) er svært bevarte, selv blant svært forskjellige arter. Sekvensen til H1, derimot, presenterer større variasjoner langs evolusjonen: i noen organismer er H1 ikke engang tilstede i alle vev (for eksempel i erytrocyttene til fugler er H1 erstattet av en sjette histon, kalt H5). Tilstedeværelsen av forskjellig H1 endrer i alle fall ikke vesentlig den generelle strukturen til histonapparatet (kalt nukleosom ), som forblir stort sett bevart i arkitekturen i nesten alle eukaryoter.
I genomet lagres informasjon i DNA-sekvenser kalt gener . Overføringen av informasjonen i genene er garantert av tilstedeværelsen av komplementære nitrogenholdige basesekvenser. Faktisk, under transkripsjonen , kan informasjonen enkelt kopieres til en komplementær RNA-streng. Vanligvis brukes denne kopien av RNA til å syntetisere et protein, gjennom en prosess som kalles translasjon (eller proteinsyntese). Alternativt kan en celle ganske enkelt duplisere genetisk informasjon gjennom en prosess som kalles DNA-replikasjon .
I eukaryote organismer er genomisk DNA lokalisert i cellekjernen, så vel som i små mengder i mitokondrier og kloroplaster . I prokaryoter er DNA i stedet innelukket i en uregelmessig organell, uten en membran, inneholdt i cytoplasmaet, kalt nukleoiden . [83] Informasjonen finnes i gener, arvelige enheter som er i stand til å påvirke fenotypen til organismen. Hvert gen inneholder en åpen leseramme (region som kan transkriberes til RNA) og en regulatorisk region, bestående av både en promoter og forsterkere .
Hos mange arter kan bare en liten del av den totale sekvensen til et genom transkriberes og oversettes. For eksempel består bare 1,5 % av det menneskelige genomet av eksoner som koder for et protein, mens mer enn 50 % består av gjentatte sekvenser av ikke-kodende DNA . [84] Grunnen til at det er en så stor mengde ikke-kodende DNA er fortsatt ikke helt klar og har blitt definert som C-verdi-gåten . [85] I alle fall kan DNA-sekvenser som ikke koder for et protein transkriberes til ikke-kodende RNA , som er involvert i reguleringen av genuttrykk . [86]
Noen ikke-kodende sekvenser spiller en strukturell rolle for kromosomer. Telomere og sentromere områder inneholder vanligvis svært få gener, men de er nødvendige for kromosomfunksjon og stabilitet. [88] Hos mennesker finnes store mengder ikke-kodende DNA i pseudogener , kopier av gener som er gjort inaktive ved tilstedeværelsen av en mutasjon. [89] Disse sekvensene anses å være molekylære fossiler , selv om det er bevis for at det kan antas at de er et slags råmateriale som er nødvendig for å skape nye gener gjennom prosessene med genduplisering og divergerende evolusjon . [90]
Et gen er en DNA-sekvens som inneholder informasjon som er i stand til å påvirke egenskapene til organismens fenotype . Innenfor et gen brukes DNA-basesekvensen som en mal for syntesen av et RNA-molekyl som i de fleste tilfeller blir oversatt til et peptidmolekyl.
Mekanismen hvorved nukleotidsekvensen til et gen kopieres inn i en RNA-streng kalles transkripsjon og skjer ved hjelp av enzymet RNA-polymerase . RNA-strengen kan møte forskjellige skjebner: noen RNA-molekyler har strukturelle funksjoner (som de som finnes inne i ribosomet ) eller katalytiske (molekyler kjent som ribozymer ); Den mest kjente funksjonen er imidlertid translasjon til proteiner gjennom mRNA- produksjon . Translasjonsprosessen foregår i cytoplasmaet, der mRNA-er assosieres med ribosomer, og formidles av den genetiske koden . Ribosomet tillater sekvensiell lesing av kodonene til mRNA, og favoriserer deres gjenkjennelse og interaksjon med spesifikke tRNAer , molekyler som bærer aminosyrene som tilsvarer hvert enkelt kodon.
Den genetiske kodenDen genetiske koden består av trebokstavsord kalt kodoner , bestående av sekvensen av tre nukleotider (for eksempel ACU, CAG, UUU), som er tilstede på mRNA , som hver er assosiert med en bestemt aminosyre. For eksempel tymin gjentatt i en serie på tre (UUU) koder for fenylalanin . Ved å bruke grupper på tre bokstaver er det mulig å ha opptil 64 forskjellige kombinasjoner ( ), i stand til å kode de tjue forskjellige aminosyrene som eksisterer. Siden det er 64 mulige tripletter og bare 20 aminosyrer, kalles den genetiske koden redundant (eller degenerert ): noen aminosyrer kan faktisk kodes av flere forskjellige tripletter. Det motsatte er imidlertid ikke sant: hver triplett vil kun tilsvare én aminosyre (uten mulighet for tvetydighet). Til slutt er det tre tripletter som ikke koder for noen aminosyre, men som representerer stoppkodoner (eller tullkodoner ), dvs. de indikerer punktet der, innenfor genet, sekvensen som koder for det tilsvarende proteinet slutter: disse er kodonene UAA, UGA og UAG.
Celledeling, nødvendig for at en organisme skal vokse og leve, krever en duplisering av cellulært DNA, slik at dattercellene kan ha samme genetiske informasjon som modercellen. Den doble helixstrukturen til DNA muliggjør en ekstremt enkel mekanisme for DNA-replikasjon. De to trådene er faktisk separert og en komplementær tråd er laget av hver, av et enzym kalt DNA-polymerase . Med denne mekanismen bestemmes basene som er tilstede på barnefilamentet av de som er tilstede på foreldrefilamentet: det er nettopp gjennom denne mekanismen at dattercellene presenterer genom identisk med modercellen (bortsett fra feil som oppstod under prosessen, som fører til til utseendet til mutasjoner). Denne typen replikering, som fører til doble spiraler som består av en eksisterende filament og en nydannet filament, kalles semikonservativ .
For å starte replikering må replikasjonsgaffelen først åpnes , gjennom den delvise denatureringen av dobbelttrådet DNA, utført av helikasene og enkelttrådbindende proteiner (SSBP): helikasene er enzymer som aktivt skiller de to filamentene ved hjelp av energien til ATP ; SSBP-er er i stand til å opprettholde DNA-denaturering ved å binde seg utelukkende til enkelttrådede deler og stabilisere dem. I de sirkulære DNA-molekylene til prokaryoter er det bare én opprinnelsesregion for replikasjonen som to replikasjonsgafler starter fra (strukturen kalles en replikasjonsboble ). Når de to gaflene møtes på motsatt side, er replikeringen fullført. Hos eukaryoter begynner replikasjonen av hvert kromosom flere steder.
DNA -polymeraser , enzymer som er i stand til å bygge en ny kjede bare i 5'-3'-retningen, ble først identifisert av Arthur Kornberg , som takket være sitt berømte eksperiment [91] identifiserte DNA-polymerase I i Escherichia coli . Reaksjonen til DNA-polymerasen styres av malen , fordi den produserer en ny DNA-streng som er nøyaktig komplementær til en allerede eksisterende som faktisk fungerer som en mal. DNA-polymerase er ikke i stand til å sette i gang syntesen av en tråd fra bunnen av , mens den kan strekke en allerede eksisterende polynukleotidtråd. I en replikerende celle er derfor tilstedeværelsen av et eksisterende filament (kalt primer ) essensielt, som vanligvis består av et kort segment av RNA som er komplementært til malen, syntetisert av spesifikke enzymer kalt primaser .
Siden DNA-polymeraser bare er i stand til å utføre sin aktivitet i 5'-3'-retningen, har de utviklet forskjellige mekanismer for å kopiere de to trådene i dobbelthelixen. [92] Den ene tråden (kalt ledetråden ) kan replikeres nesten kontinuerlig, ettersom den blir eksponert, den andre ( langsom tråd ) er i stedet spredt med korte tråder av nylig syntetisert DNA ( Okazaki-fragmentene ), som hver av dem har en initial RNA-primer. De nye filamentene må deretter fullføres ved å fjerne primerne med endonuklease og fylle de gjenværende mellomrommene med reparasjonspolymerase . Deretter er alle disse nylig syntetiserte langsomme DNA-fragmentene bundet av DNA-ligaser .
Alle funksjoner til DNA avhenger av dets interaksjoner med spesifikke proteiner. Slike interaksjoner kan enten være uspesifikke eller involvere svært spesifikk binding av proteinet til en enkelt DNA-sekvens. Det er også mange enzymer som kan binde DNA, og blant disse er polymerasene som kopierer sekvenser i DNA-transkripsjon og replikasjon spesielt viktige.
De strukturelle proteinene som binder DNA er eksempler på ikke-spesifikke interaksjoner mellom DNA og proteiner. Inne i kromosomene er DNA assosiert med proteinkomplekser, som organiserer seg for å danne en kompakt struktur kalt kromatin . Hos eukaryoter forutsetter denne strukturen binding av DNA til små grunnleggende proteinkomplekser kalt histoner ; i prokaryoter er det derimot flere typer ulike proteiner involvert. [93] [94] Histoner danner et skiveformet kompleks kalt nukleosomet , som etablerer ione-lignende interaksjoner (mellom de grunnleggende histonrestene og den sure fosforiske ryggraden i DNA) med omtrent to hundre basepar av DNA, som de vikler rundt platen danner to hele svinger, uavhengig av rekkefølgen som kjennetegner dem. [95] Disse grunnleggende restene kan gjennomgå metyleringer , fosforyleringer og acetyleringer : [96] disse kjemiske modifikasjonene endrer interaksjonen mellom histoner og DNA, og gjør den mer eller mindre tilgjengelig for transkripsjonsfaktorer og modulerer selve transkripsjonshastigheten. [97]
Andre ikke -spesifikke DNA-bindende proteiner (DNAbp), også tilstede i kromatin , er høymobilitetsgruppeproteiner , som fortrinnsvis binder foldet eller forvrengt DNA. [98] Disse proteinene spiller en grunnleggende rolle i foldingen av rader med nukleosomer og deres pakking innenfor mer komplekse kromatinstrukturer. [99]
En ytterligere gruppe DNAbps er enkeltstrengsbindende proteiner (SSBP), som utelukkende binder til et enkeltstrenget DNA-molekyl. Hos mennesker er replikasjonsprotein A (RPA ) det best karakteriserte medlemmet av denne familien og er essensielt for de fleste prosesser som krever dobbel helixseparasjon, inkludert DNA-replikasjon, rekombinasjon og reparasjon . [100] Disse DNAbps er i stand til å stabilisere den enkelttrådede formen, og hindrer molekylet i å folde seg inn i stammeløkker eller brytes ned av virkningen av nukleaser .
I motsetning til de som er presentert så langt, er det også mange proteiner som spesifikt binder visse DNA-sekvenser. De mest studerte er transkripsjonsfaktorer (TF), proteiner som er i stand til å regulere transkripsjon. Hver av dem binder seg til en eller flere spesifikke sekvenser, vanligvis plassert nær promotoren til et gen, og aktiverer eller hemmer transkripsjonen av selve genet. Denne prosessen utføres gjennom to typer mekanismer: For det første er TF-er i stand til å binde, direkte eller gjennom adapterproteiner, RNA-polymerasen som er ansvarlig for transkripsjon, lokalisere den ved transkripsjonsstartstedet og dermed favorisere dens initiering; [102] en annen modalitet består i bindingen mellom TF-er og enzymer som er i stand til å modulere metyleringer og acetyleringer av histonene som er tilstede ved promoteren, og dermed modifisere tilgjengeligheten til den regionen til polymerasen. [103]
Siden en TF kan ha mange målsekvenser, kan endringer i en TFs aktivitet påvirke uttrykket av tusenvis av gener. [104] Følgelig er disse proteinene ofte de endelige målene for signaltransduksjonskaskader , som medierer cellulære responser på stimuli i og utenfor cellen. Spesifisiteten til TF-er for DNA er knyttet til de multiple kontaktene som etableres mellom proteinet og hovedsulcusen, der nitrogenbasene er mer tilgjengelige. [33]
Nukleaser er enzymer som er i stand til å kutte DNA-tråder, siden de katalyserer hydrolysen av fosfodiesterbindingen . Nukleaser som hydrolyserer DNA fra nukleotidene i endene av trådene kalles eksonukleaser . Endonukleaser , derimot, er de som skjærer direkte inne i filamentet. De mest brukte nukleasene i molekylærbiologi , kalt restriksjonsenzymer , kutter DNA i spesifikke sekvenser. EcoRV -enzymet gjenkjenner for eksempel 5′-GAT | ATC-3′ seksbasesekvensen og kutter ved den vertikale linjen. I naturen beskytter dette enzymet bakterier mot faginfeksjoner ved å fordøye fagens DNA når det kommer inn i bakteriecellen. [106] Generelt gjenkjenner restriksjonsnukleaser spesielle palindromiske nukleotidsekvenser , kjent som restriksjonsseter , der den samme sekvensen gjentar seg i motsatte retninger på de to komplementære heliksene, og dermed produserer kutt på begge trådene. Disse enzymene er mye brukt i teknikker som involverer subkloning av DNA i vektorer . Det antas at palindromiske sekvenser, i tillegg til restriksjonssti, også kan være gjenkjennelsessignaler for noen regulatoriske proteiner eller signalisere startstedet for DNA-replikasjon.
DNA- ligaser er enzymer som er i stand til å bringe sammen tidligere kuttede eller ødelagte DNA-tråder ved å bruke kjemisk energi fra ATP eller NAD . [107] Ligaser er spesielt viktige i sakte-tråd- replikasjon , siden de kombinerer Okazaki-fragmentene til en enkelt tråd. De spiller også en viktig rolle i DNA-reparasjon og genetisk rekombinasjon . [107]
Topoisomerase og helikaseTopoisomeraser er enzymer som viser både nuklease- og ligaseaktivitet . Disse proteinene er i stand til å modifisere de topologiske egenskapene til DNA. Noen av dem utfører denne funksjonen ved å kutte DNA-helixen og la den rotere, redusere graden av supercoiling og deretter fortsette til ligeringen av de to endene. [48] Andre topoisomeraser, på den annen side, er i stand til å kutte spiralen og føre en andre spiral gjennom rupturstedet, før de ligerer den ødelagte strengen. [108] Topoisomeraser er nødvendige for mange prosesser som involverer DNA, som DNA-replikasjon og transkripsjon. [49]
Helikaser er proteiner som er i stand til å bruke den kjemiske energien som er tilstede i trifosfatnukleosider , spesielt ATP , for å bryte hydrogenbindingene som er etablert mellom nitrogenbasene, og tillater åpning av DNA-dobbelspiralen i enkelttråder. [109] Disse enzymene er essensielle for de fleste biologiske prosesser som involverer enzymer som krever direkte kontakt med DNA-basene.
PolymerasePolymeraser er enzymer som syntetiserer polynukleotidkjeder fra nukleosidtrifosfatet . De fungerer ved å legge til nukleotider til 3′ - OH til det forrige nukleotidet som er tilstede på strengen. Som en konsekvens av dette virker alle polymeraser i 5' - 3' - retningen . [110] I det aktive setet til disse enzymene, pares trifosfatnukleosidet med et nukleotid som er tilstede på et filament som brukes som en mal: dette lar polymerasene nøyaktig syntetisere filamenter som er trofast komplementære til malene. Polymeraser er klassifisert basert på typen mugg de bruker.
DNA - replikasjon krever en DNA-avhengig DNA-polymerase , som er i stand til å lage en perfekt kopi av en DNA-sekvens. Nøyaktighet er nøkkelen i denne prosessen, og det er grunnen til at mange av disse polymerasene også har korrekturlesingsaktivitet . De er faktisk i stand til å oppdage et misforhold mellom nitrogenholdige baser og aktivere en 3 'eller 5' eksonuklease-handling for å fjerne den ukorrekte basen. [111] I de fleste organismer fungerer DNA-polymeraser i et større proteinkompleks kalt replisomet , som også består av en rekke tilleggsunderenheter som helikaser . [112]
RNA-avhengige DNA-polymeraser er en klasse polymeraser som spesialiserer seg på syntese av en DNA-kopi, ved å bruke et RNA-fragment som mal. Disse inkluderer revers transkriptase , et viralt enzym involvert i retrovirusinfeksjon , og telomerase , som er nødvendig for telomerreplikasjon . [62] [113] Telomerase er en uvanlig polymerase, siden den inneholder en malsekvens av RNA i strukturen.
Transkripsjon utføres i stedet av DNA-avhengige RNA-polymeraser , som binder DNA ved promotoren til et gen og skiller de to strengene. Deretter genererer enzymet et mRNA -molekyl til det når terminatoren , hvor transkripsjonen stopper og enzymet løsner fra DNA. Som med DNA-avhengige DNA-polymeraser, opererer disse polymerasene også innenfor et stort proteinkompleks, sammensatt av hjelpe- og regulatoriske molekyler. [114]
En DNA-streng samhandler vanligvis ikke med andre DNA-segmenter, og i menneskelige celler okkuperer de forskjellige kromosomene til og med separate områder av kjernen ( kromosomale territorier ). [116] Denne fysiske separasjonen er avgjørende for å tillate DNA å være et stabilt og sikkert oppbevaringssted for genetisk informasjon. Samspillet mellom forskjellige DNA-segmenter er i stedet mulig og hyppig gjennom kryssing- fenomenet , som tillater genetisk rekombinasjon gjennom brudd av to helikser, utveksling av segmenter mellom dem og den endelige gjenforeningen.
Rekombinasjon gjør det mulig for kromosomer å utveksle genetisk informasjon og produsere nye kombinasjoner av gener, med resultatet av å øke effektiviteten av naturlig utvalg og tilrettelegge for utviklingen av nye proteiner. [117] Genetisk rekombinasjon kan også være involvert i DNA-reparasjon, spesielt som en cellulær respons etter dobbelttrådete brudd. [118]
Hovedformen for kromosomkryssing er homolog rekombinasjon , der de to involverte kromosomene deler veldig like sekvenser. Ikke-homologe rekombinasjoner kan derimot være skadelige for cellen, fordi de kan produsere kromosomale translokasjoner og genetiske abnormiteter. Rekombinasjonsreaksjonen katalyseres av enzymer kjent som rekombinaser . [119] Det første trinnet i rekombinasjonsprosessen er enkelttrådsbrudd forårsaket av en endonuklease- eller DNA-skade. [120] En rekke påfølgende trinn, delvis katalysert av rekombinase, fører til foreningen mellom to helikser gjennom dannelsen av et Holliday-kryss , der et enkelt-trådet segment av hver helix er paret med den komplementære tråden som er tilstede på annen propell. Rekombinasjonsreaksjonen blir deretter avbrutt ved brudd av forbindelsen og ved re-ligering av DNAet som er oppnådd på denne måten. [121] Eksistensen av Holliday-krysset har blitt demonstrert ved elektronmikroskopfotografier av rekombinante DNA-molekyler.
DNA inneholder den genetiske informasjonen som gjør at alle levende organismer (unntatt virus, hvis tillatlighet blant levende vesener imidlertid er mye diskutert) kan fungere, vokse og reprodusere. Uansett er det ennå ikke avklart på hvilket tidspunkt i livshistorien DNA inntok denne grunnleggende rollen. Det er generelt akseptert av det vitenskapelige samfunnet, faktisk, hypotesen om at DNA ikke var den første nukleinsyren som ble brukt av levende vesener: faktisk tilhører denne rollen RNA. [122] [123] RNA kan ha spilt en sentral rolle i forfedres cellulær metabolisme, siden det kan ha både en katalytisk (f.eks. gjennom ribozymer ) og strukturell (inne i ribosomene ). [124] RNA -verdenen , basert på en enkelt type molekyl med genetiske, katalytiske og strukturelle funksjoner, kunne ha hatt innflytelse på utviklingen av den nåværende genetiske koden, basert på fire nukleotider. Dette tallet kan være et kompromiss mellom behovet på den ene siden for å redusere mengden av mulige baser, for å forbedre replikasjonsnøyaktigheten, og på den andre siden for å øke den, for å øke den katalytiske effekten av ribozymer. [125]
Det er ingen kjente DNA-fossiler som dateres tilbake til livets opprinnelse (etter RNA-verdenen) for å kunne studere dens molekylære evolusjon, siden det er umulig å gjenvinne DNA fra fossiler. Dette skyldes det faktum at DNA kan overleve i miljøet i mindre enn en million år og, når det er i løsning, raskt brytes ned til små fragmenter. [126] Selv om det har vært flere kunngjøringer om svært eldgamle DNA-funn, inkludert den som er knyttet til isolering av en levende bakterie fra en saltkrystall som dateres tilbake 250 millioner år, [127] er disse påstandene kontroversielle. [128] [129]
Moderne biologi og biokjemi gjør intensiv bruk av DNA. Begrepet rekombinant DNA refererer til kunstig laget og satt sammen DNA-segmenter. De kan settes inn i levende organismer i form av plasmider eller av andre typer vektorer . [130] Organismene som produseres på denne måten kalles genmodifiserte og kan brukes til produksjon av rekombinante proteiner, nødvendig for biomedisinsk forskning, [131] eller til landbruksvekster . [132] [133]
Rettsmedisin bruker DNA, vanligvis isolert fra blod , hud , spytt , hår og andre biologiske vev og væsker, for å identifisere de ansvarlige for kriminelle handlinger, for eksempel kriminalitet eller vold. Prosessen som brukes er genetisk fingeravtrykk : denne teknikken består i å sammenligne lengden på de variable delene av det repeterende DNAet , for eksempel korte tandem-repetisjoner og minisatellitter , som kan være svært forskjellige fra individ til individ. Sammenligningen mellom to DNA-prøver som undersøkes er derfor ikke basert på analysen av hele deoksyribonukleotidsekvensen, men kun på disse snittene. Faktisk har to individer som ikke er i slektskap 99,9 % av DNA-sekvensen til felles. Denne metoden er vanligvis svært pålitelig, [134] selv om identifiseringen av kriminelle til tider kan være komplisert hvis åstedet er kontaminert med DNA fra flere personer. [135] Denne metoden, utviklet i 1984 av den britiske genetikeren Sir Alec Jeffreys , [136] ble først brukt i 1988 for å tiltale Colin Pitchfork. I dagens praksis blir mistenkte ofte bedt om å gi en DNA-prøve for sammenligning med eventuelle biologiske funn på åstedet. Genetisk fingeravtrykk kan også brukes til å identifisere ofre for masseulykker.
DNA-erverv uten samtykke omtales som gentyveri .
Bioinformatikk er en gren av biologi som inkluderer manipulering, forskning og datautvinning av data relatert til DNA-sekvenser. Utviklingen av teknikker som er nyttige for lagring og søk etter DNA-sekvenser, har faktisk ført til omfattende utviklinger innen informatikk brukt på molekylærbiologi, spesielt når det gjelder strengsøkealgoritmer og maskinlæring . [137] Algoritmer for strengsøk (eller sammenkobling), som er i stand til å oppdage tilstedeværelsen av en sekvens av bokstaver innenfor mye større sekvenser, ble opprinnelig utviklet for å søke etter spesifikke nukleotidsekvenser. [138]
Det er klart at enkle algoritmer har eksistert i lang tid for å takle disse problemene (de som finnes for eksempel i tekstredigerere ), men DNA-analyse, som ser ut til å være sammensatt av bare fire bokstaver, krever mer forseggjorte programmer. Det umiddelbart relaterte problemet med sekvensjustering er rettet mot å identifisere homologe sekvenser og identifisere de spesifikke mutasjonene som gjør dem forskjellige. Disse teknikkene, spesielt justeringen av flere sekvenser , brukes til å studere de fylogenetiske forholdene og funksjonen til proteiner. [139] Det finnes også genetiske forskningsalgoritmer.
Den store mengden data innhentet fra prosjekter som det menneskelige genom-prosjektet er faktisk vanskelig å bruke uten en første analyse som gjør det mulig å lokalisere genene og de regulatoriske områdene på kromosomene. Slike algoritmer er derfor i stand til å gjenkjenne antatte områder av tilstedeværelsen av gener som koder for RNA eller proteiner. [140]
DNA ble brukt i informatikk for første gang for å løse et enkelt Hamiltonsk baneproblem , et NP-komplett problem . [142] Beregning gjennom DNA er mer fordelaktig enn den klassiske med elektroniske midler både med tanke på energien som forbrukes og fra plassen som brukes: strukturer av denne typen er faktisk i stand til å utføre beregninger i parallelle modaliteter som de tillate å enkelt løse mange andre problemer som simulering av abstrakte maskiner , det boolske tilfredshetsproblemet og den begrensede versjonen av det reisende selgerproblemet . [143] Takket være sin kompakthet har DNA også en (i det minste teoretisk) rolle innen kryptografi , der det spesielt vil tillate konstitusjon og effektiv bruk av sikre Vernam-chiffer . [144]
DNA brukes også innen nanoteknologi , da det har molekylære gjenkjennelsesegenskaper som gjør det i stand til selv å sette sammen til komplekse todimensjonale eller polyedriske strukturer . Disse sammenstillingene brukes i hovedsak med strukturelle funksjoner og ikke som vektorer for biologisk informasjon. [145]
Siden DNA gjennomgår arvelige mutasjoner over tid, inneholder det verdifull informasjon som kan brukes av genetikere til å studere utviklingen av organismer og deres fylogeni . [147] Genetikere er i stand til å rekonstruere fylogenetiske trær som er i stand til å beskrive utviklingen av forskjellige arter på grunnlag av de forskjellige mutasjonene som er tilstede i gener som er ekstremt konserverte blant organismer (eller, gjennom mer avanserte bioinformatiske komparative algoritmer, direkte sammenligning av hele genomer) også svært forskjellige fra hverandre. [148] [149] Ved å studere mutasjonene akkumulert over tid, er det også mulig å rekonstruere trær som beskriver utviklingen innenfor familier av proteiner.
Videre, ved å sammenligne DNA-sekvensene innen samme art, er det mulig å studere den genetiske historien til bestemte populasjoner . Dette er av betydelig betydning både for økologiske analyser og for antropologiske studier : DNA har for eksempel blitt brukt til å rekonstruere historien om de ti tapte stammene i Israel . [150]