Organizácia ľudského genómu Ľudský genóm je súhrn genetickej informácie, obsiahnutý v bunke. Má 2 zložky: Jadrový genóm Mitochondriálny genóm
I. Jadrový genóm celková dĺžka: 3200 Mb distribúcia: 24 rôznych lineárnych molekúl (22 typov autozómov a chromozómy X a Y) 3000 Mb euchromatínu a 200 Mb konštitutívneho heterochromatínu (heterochromatín – permanentne kondenzované a transkripčne inaktívne oblasti) veľká variabilita v distribúcii obsahu DNA v jednotlivých chromozómoch typy sekvencií Jednotkové sekvencie (~55%) Repetitívne sekvencie (~45%)
Obsah DNA v jednotlivých chromozómoch
Gény a súvisiace sekvencie počet: 25 – 30 tisíc 90 – 95 % kódujúcich polypeptid 5 – 10 % kódujúcich netranslatované RNA molekuly bezstavovce 14 – 20 tisíc, stavovce 25 – 30 tisíc kódujúca časť predstavuje 1,5 % ľudského genómu distribúcia génov: nerovnomerná heterochromatín neobsahuje gény rozdiely aj vrámci euchromatickej časti genómu a medzi jednotlivými chromozómami vysoká hustota v subtelomerických obl. chr. 19 a 22 bohaté na gény chr. 18, X a Y chudobné na gény
Variabilná hustota génov: HLA oblasť a DMD 1Mb - ~ 70 génov 2,4Mb – 1 gén (dystrofín)
Charakteristika génov kódujúcich polypeptid výrazná variabilita vo veľkosti: priemer 27 kb inzulín 1,4 kb vs. dystrofín 2,4 Mb výrazná variabilita v počte exónov: priemer 9 0 (interferón) vs. 363 (titín) dĺžka exónov: priemer 170 bp 7,6 kb exón 26 génu ApoB dĺžka intrónov: enormná variabilta (dlhé gény majú dlhé intróny) 0,5 kb (β-globín) vs. 800 kb (gén WWOX) dĺžka polypetidu: priemer 500 – 550 a. k. najdĺhší: 38 138 (titín) gény v génoch (3 gény v intr. 26 génu pre NF1) prekývajúce sa gény
Dĺžka ľudských génov krátke stredne dlhé dlhé E1 I 1 E2 I 2 E3 1 – 10 kb stredne dlhé 10 – 100 kb dlhé > 100 kb
Variabilita v dĺžke génov a v obsahu exónov 10-100 kb pod 10 kb nad 100 kb
Gény v rámci génu: gén pre NF typu 1 a 3 „vnútorné“ gény v intróne 26
Charakteristika génov kódujúcich polypeptid – pokr. unikátne gény (single copy) génové rodiny vznikli duplikáciou unikátnych génov často majú rovnakú alebo podobnú funkciu môžu vytvárať zhluky al. roztrúsené po celom genóme veľká časť genómu je tvorená génovými rodinami Typy génových rodín: klasické génové rodiny vykazujú vysokú sekvenčnú homológiu evolučná aj funkčná príbuznosť
Charakteristika génov kódujúcich polypeptid – pkr. génové rodiny s dlhými konzerovanými doménami gény s dôležitou funkciou vo vývine (PAX-, homeobox-gény) génové rodiny s krátkymi konzerovanými motívami aminokyselín nemusia byť homologické na úrovni DNA, ale majú spoločnú všeobecnú funkciu – RNA helikázy, DEAD box a pod. génové super rodiny malá sekvenčná homológia spoločné štrukturálne charakteristiky – HLA gény
Príklady tandemových génových rodín α-globín: 16p13.3 β-globín: 11p15.5 rastový hormón: 17q23 albumín: 4q12
Histónová génová rodina
Ľudské RNA gény ~3000 RNA génov = 10% genómu Hlavné triedy RNA rRNA 18S, 5S a 5,8Sr RNA: súčasť cytopl. ribozómov tRNA: 22 typov mt tRNA; 49 typov cytoplazm. tRNA (497 génov; väčšina z nich na chromozómoch 1 a 6 v génových rodinách) snRNA: U1, U2, U4 a i.: súčasti spliceosomov 16SrRNA, 23SrRNA: súčasť mt ribozómov snoRNA: asi 100 rôznych typov; účasť na rRNA processingu Iné RNA triedy Telomerázové RNA: súčasť telomerázy, Antisense RNA: mnoho typov, asociované s imprintingom MicroRNA: krátke (22nt), regulácia translácie, ~200 génov
Pseudogény v ľudskom genóme nefunkčné kópie génov (neexprimujú sa): „mŕtve konce“ evolúcie génov – ale aj zdroj evolučných inovácií celkový počet cca 20 000 Typy: bežné (konvenčné, neupravené) Ψgény: väčšinou v tandeme s génom obsahujú exóny aj intróny vznik: nehomologický c-o upravené Ψgény: disperzne v genóme obsahujú len sekvencie exónov vznik: reverzná transkripcia
Pseudogény v ľudskom genóme – pokr. exprimované neupravené prechodné štádium, gén už nie je funkčný ale exprimuje sa, napr. θ-globin exprimované upravené pseudogén sa včlení do blízkosti promótora pseudogén vzniknutý z génu s vnútorným promótorom skrátené gény, génové fragmenty pravdepodobný vznik nehomologický crossing-over al. nehomologická výmena sesterských chromatíd
Vznik upraveného pseudogénu reverznou transkripciou z mRNA transkriptu
Repetitívne sekvencie databáza: www.girinst.org tvoria 45 % ľudského jadrového genómu Triedy: nízko repetitívne: do 100 repetícií stredne repetitívne: 100 – 10 000 vysoko repetitívne: nad 10 000 Typy: tandemovo usporiadané rozptýlené
Repetitívne sekvencie – pokr. Tandemové repetitívne sekvencie satelitná DNA minisatelitná DNA mikrosatelitná DNA Satelitná DNA (nie je totožná so satelitmi chromozómov) skladá sa z dlhých blokov tandemových opakovaní (100 kb až niekoľko Mb) tvorí väčšiu časť heterochromatínu v oblasti centromér hlavné triedy α-satelitná (alfoidná) DNA dĺžka opakovania: 171 bp centromerická oblasť všetkých chromozómov tvorí 3 – 5 % DNA obsahu chromozómu má významnú úlohu vo funkcii centroméry
Repetitívne sekvencie – pokr. β-satelitná DNA dĺžka opakovania: 68 bp centromerická oblasť chromozómov 1, 9, 13, 14, 15, 21, 22 a Y satelitná DNA 1 dĺžka opakovania: 25 – 48 bp bohatá na AT centromerická oblasť chromozómov a iných heterochrom. oblastí satelitná DNA 2 a 3 dĺžka opakovania: 5 bp výskyt pravdepodobne na všetkých chromozómoch
Repetitívne sekvencie – pokr. Minisatelitná DNA stredne dlhé (0,1 – 20 kb) dlhé bloky tandemových opakovaní roztrúsené po veľkej časti nukleárneho genómu známe 2 triedy: hypervariabilná minisatelitná DNA (VNTR) dĺžka opakovania: 9 – 24 bp môžu mať spoločnú základnú („core“) sekvenciu lokalizácia predovšetkým v blízkosti telomér telomerická minisatelitná DNA 3 – 20 kb tandemových opakovaní dĺžka opakovania 6 bp (TTAGGG) lokalizácia v teloméroch všetkých chromozómov priama zodpovednosť za telomerickú funkciu
Repetitívne sekvencie – pokr. Mikrosatelitná DNA (Short Tandem Repeats – STR) alebo aj (Simple Sequence Repeats – SSR) krátke (do 0,1 kb) bloky tandemových opakovaní roztrúsené po celom genóme (tvoria asi 2 % genómu) dĺžka opakovania: menej ako 10 bp najčastejšie sú dinukleotidové opkovania CA/TG (CG/GC sú zriedkavé) tri- a tetranukleotidové sú zriedkavejšie ale zato veľmi polymorfné (mapovanie génov, kriminalistika, nepriama dg. a pod.) vznik: prekĺznutie vlákien pri replikácii význam: zatiaľ neznámy
Repetitívne sekvencie – pokr. Roztrúsené opakovania – tvoria cca 43 % ľ. g. takmer všetky r. o. sú odvodené od transpozónov Podľa dĺžky opakovania sa delia SINE – Short Interspersed Nuclear Elements (100 – 400 bp) Alu rodina dĺžka opakovania: 280 bp je špecifická pre primátov (identifikácia úsekov DNA ľudského pôvodu) počet kópií 1,2 mil. (1 kópia na 3 kb) 10,7 % ľudského genómu ešte známe MIR (450 000 kópií) a MIR3 (85 000 kópií)
Repetitívne sekvencie – pokr. LINE – Long Interspersed Nuclear Elements (20 % genómu) LINE1 (L1) – 6,1 kb (600 000 kópií) kóduje 2 proteíny 60 – 100 L1 je schopných aktívnej transpozície (a môžu zapríčiniť dedičné ochorenie, napr. HA) tvorí 17 % ľudského genómu ešte sú známe LINE2 (370 000 kópií) a LINE3 (44 000) LTR transpozóny (Long Terminal Repeats) – 8,5 % ľ. g. ERV (Endogenous Retrivral Sequences) DNA transpozóny - 3 % ľudského genómu nie sú aktívne u človeka (transpozónové fosílie)
Chrom. lokalizácia hlavných tried repetitívnych sekvencií
Štruktúra Alu-sekvencie a úplnej L1 sekvencie
Ľudský mitochondriálny genóm počet kópií v bunke: 100 – 100 000 term. diferencované kožné bunky – bez mtDNA oocyty – 100 000 (spermie – niekoľko 100) jedna cirkulára dvojvláknová molekula dĺžka: 16 569 bp (známa kompletná sekvencia – 1981) ťažký reťazec (H) – bohatý na G ľahký reťazec (L) – bohatý na C D slučka – krátka trojvláknová oblať (7S DNA) segregácia pri bunkovom delení – náhodná dedičnosť – matroklinná (matrilineárna) replikácia: separátna na H a L reťazci najprv H reťazec (začiatok v D-slučke) L reťazec – až po replikácii 2/3 H reťazca
Ľudský mitochondriálny genóm – pokr. transkripcia: promotor pre obidve vlákna v D slučke prebieha súčasne na obidvoch vláknach v opačnom smere ako replikácia je kontinuálna, t.j. vzniká veľký multigénový transkript mitochondriálny genetický kód: mierne sa líši od nukleárneho je 60 kodónov (v nukleárnom genóme 61) 4 stop kodóny - 2 totožné s nukl. g. UAA, UAG a 2 odlišné AGA a AGG (kódujú arginín v nukl. g.) UGA kóduje triptofan v mt. – v nukl. g. je to stop k. mt gény: celkový počet 37 28 na H vlákne, 9 na L vlákne 13 kóduje polypeptid, 22 tRNA a 2 rRNA
Ľudský mitochondriálny genóm – pokr. väčšina mt polypeptidov je kódovaných nukleárnym g. mt genóm je extrémne kompaktný (93 % kódujúce sekv.) len D slučka neobsahuje kódujúce sekv. gény neobsahujú intróny vyskytujú sa prekrývajúce sa gény susediace gény separované väčšinou len 1 – 2 bázami niektorým génom chýba terminačný kodón
Ľudská mtDNA ND – NADH dehydrogenáza (7) ATP – ATPáza (2, čiast. prekryv) CO – cytochróm c oxidáza (3) CYB – cytochróm B (1) bohatý na G bohatý na C
Čiastočný prekryv dvoch mt génov: ATPáza 6 a ATPáza 8
Porovnanie jadrového a mt genómu mitochondriálny veľkosť 3200 Mb 16,6 kb počet rôznych molekúl 23 (XX) /24 (XY) jedna molekúl v bunke 46 (v diploidnej b.) 100 až 100 000 počet génov ~30 - 35 000 37 hustota génov ~1/100 kb 1/0,45 kb repetitívna DNA >50% 0% transkripcia monocistronická polycistronická intróny vo väčšine génov chýbajú % kódujúcej DNA rekombinácia dedičnosť <1,5% min. 1 c-o / chrom. / meióza mendelistická ~93% chýba maternálna
Všeobecný prehľad genómu 1,5% 3% Jadrový genóm repetitívne sekv. – transpoz. heterochromatín iné nekonzervované vysoko konzervované nekód. kódujúce 45% 44% 6,6% 5% 2% mtDNA 93%
Organizácia ľudského genómu 25-30000 génov