Issuu on Google+

6- Structure et organisation des génomes 6-1 Génomes eucaryotes

Dans chaque cellule: -génome nucléaire -génome mitochondrial (-génome chloroplastique)


6-1-1 Génomes nucléaires 6-1-1-1 Nombre d’exemplaires du génome par cellule

Organismes . haploïdes : 1 exemplaire du génome par cellule. Courant chez les unicellulaires . diploïdes : 2 exemplaires du génome par cellule, un hérité du père, un hérité de la mère. Les 2 exemplaires sont très similaires, mais pas strictement identiques. Très courant (cas de l’homme) . tétraploïdes: 4 exemplaires du génome. Rare chez les animaux, plus fréquent chez les plantes Certains organismes (ex: les levures) peuvent exister alternativement sous forme haploïde ou diploïde En fonction du moment de sa vie (avant ou après division), la cellule aura ou pas dupliqué son génome, pour ensuite transmettre une copie complète aux deux cellules filles. Donc, on peut trouver dans une cellule diploïde 4 exemplaires du génome.


6-1-1-2 Structure des chromosomes Le génome est réparti sur plusieurs molécules d’ADN linéaire. Chaque molécule s’appelle un chromosome. Les chromosomes similaires issus du père et de la mère s’appelle des chromosomes homologues

Pour être fonctionnel, un chromosome doit au moins contenir -Une origine de réplication: L’origine de réplication permet l’initiation de la réplication. En fait, chaque chromosome en contient plusieurs. Les deux séquences d’ADN identiques issues de la réplication s’appelle des chromatides. Selon que l’on se place avant la réplication ou après la réplication, un chromosome contient une chromatide ou deux chromatides. -Des télomères : La réplication ne peut jamais aller jusqu’aux bouts des chromosomes. Les télomères sont des séquences répétées à l’extrémité des chromosomes, qui évitent une perte d’information génétique à chaque réplication. -Un centromère: c’est une séquence plus ou moins centrale qui permet de maintenir associées les deux chromatides d’un même chromosome et qui permet au chromosome de s’attacher au fuseau de division lors de la mitose, de façon à ce que chaque chromatide soit transmise à une cellule fille.


- Les chromosomes peuvent être déployés dans la cellule et donc emmêlés. On parle de chromatine -Lors de la division, les chromosomes se condensent en petites structures en bâtonnet, les chromosomes proprement dit. -L’ADN n’est pas nu dans le noyau mais associé à des protéines (dont les histones), que ce soit pour former la chromatine ou les chromosomes

Empaquetage de l’ADN. Représentation schématique des différents niveaux d’empaquetage de l’ADN pour former la chromatine ou les chromosomes. Le premier niveau d’empaquetage est assuré par une famille de protéines, les histones (en jaune).


6-1-1-3 Taille des génomes

! " !

"

# $% &

"

#

# '

(( ( &

$ % ' #

) ))

&

& )

( ) * + ,

%& ( ## +

" *

La taille des génomes varie d’une espèce à l’autre. -Il n’y a pas de stricte proportionnalité entre taille du génome et degré d’évolution -Il n’y a pas de stricte proportionnalité entre taille du génome et nombre de gènes. Les espèces à très grand génome possèdent de très nombreuses séquences non codantes répétées.


6-1-1-4 Contenu des génomes

- Le génome contient des gènes et des séquences intergéniques -Les gènes peuvent contenir des séquences non codantes -La distribution des gènes sur un chromosome ou entre chromosomes semble être aléatoire. Cependant . des gènes peuvent être regroupés pour une régulation d’expression coordonnée . des régions chromosomiques sont plus pauvres en gènes que d’autres (ex: centromères) -A, T, G et C ne sont pas équireprésentés: 59,7% de AT . Les gènes sont plutôt riches en AT . Les régions promotrices sont plutôt riches en GC


Comparaison d’un segment quelconque de 50 kb des génomes humain, de levure, de drosophile, de maïs et de la bactérie Escherichia coli. Plus les organismes sont simples, plus leur génome est « économe »: - avec une plus grande densité de gènes et une moins grande densité de séquences répétées - avec des gènes « simples » c’est-à-dire possédant peu ou pas d’introns.


Levure

Drosophile

Homme

Densité de gènes (nombre moyen par Mb)

479

76

11

Introns par gène (moyenne)

0.04

3

9

% du génome occupé par des répétitions

3.4%

12%

44%

Compaction des génomes de levure, de drosophile et d’homme


6-1-1-5 Gènes, familles de gènes Gène

Gène

Gène

Séquence transcrite + promoteur/enhancers?

ADN

Transcription ARN pol II

ARNm

ARNr

traduction

protéine

Transcription ARN pol I

Transcription ARN pol III

ARNt


5’

Gène

Gène

3’

ADN 5’

3’

5’

Gène

Gène

3’

ADN 3’

5’


-La très grande majorité des gènes sont présents en une copie par génome haploïde Dans les génomes diploïdes, chaque gène est donc présent en 2 copies. Chaque copie s’appelle un allèle. Un allèle vient du père, un allèle vient de la mère. Généralement les deux allèles sont un peu différents: hétérozygote Si les deux allèles sont strictement identiques: homozygote (reproduction consanguine) -Il y a quelques gènes répétés. Ex: . rRNA: 2000 copies par génome haploïde . Histones Ce sont des gènes dont les produits sont nécessaires en grande quantité


Gènes homologues: un certain pourcentage d’identité de séquence

Deux séquences d’ADN présentant 80% d’identité Les nucléotides identiques dans les deux séquences sont repérés par un astérisque

Une identité en nucléotides ne se traduit pas nécessairement en une identité en acides aminés. Les nucléotides identiques dans les deux séquences sont repérés par un astérisque. Les deux séquences nucléotidiques sont identiques à 76%. Cependant, quand les séquences sont traduites en acides aminés, l’identité décroit à 28%. Ces gènes, que l’on aurait pu penser être homologues, ne le sont donc pas.


Deux catégories de gènes homologues: -orthologues: de deux espèces différentes . Leur identité de séquence suggère qu’il s’agit de deux versions d’un même gène, ayant la même fonction dans deux espèces différentes . Le minimum d’identité pour être orthologue dépend du degré d’éloignement des espèces comparées -paralogues: au sein d’une même espèce .L’ensemble de ces gènes constitue une famille de gènes .Les identités sont souvent concentrées dans des régions que l’on appelle des boites d’homologies. Les boites d’homologie codent souvent pour des domaines fonctionnels .Des gènes paralogues peuvent avoir une même fonction (redondants) ou des fonctions partiellement différentes

Liens phylogénétiques entre gènes orthologues et paralogues de trois espèces descendants d’un ancêtre commun.


Protéines totales

Ser/Thr/Tyr kinase

Ser/Thr/Tyr phosphatase

BRCT

SH3

VWA

WD40

C. elegans

19,100

435

112

26

58

65

127

S. cerevisiae

6,500

116

14

10

24

3

110

E. coli

4,289

3

1

1

1

4

0

B. subtilis

4,100

4

0

1

6

5

0

M. tuberculosis

3,918

13

1

1

0

4

4

Synechocysti s

3,169

12

0

1

3

4

2

A. fulgidus

2,420

4

0

0

0

2

0

M. thermoautotro phicum

1,869

4

0

0

0

2

0

M. jannaschii

1,715

4

2

0

0

3

0

A. aeolicus

1,522

2

0

1

0

1

0

Espèce

Expansion of de domaines rencontrés dans les kinases et les phosphatases depuis les organismes les plus évolués jusqu’au moins évolués. Set/Thr/tyr kinases et phosphatases sont des enzymes impliquées dans la transduction des signaux de l’environnement que reçoit une cellule. Ces enzymes sont constituées par la combinatoire de 4 domaines, BRCT, SH3, VWa, WD40. Ces domaines représentent eux aussi des familles dont le nombre de paralogues est indiqué. Ces enzymes sont donc présentes dans différentes espèces sous forme de familles composés d’un nombre de paralogues variable selon l’espèce. L’évolution semble passer principalement par une diversification au sein de grandes familles de protéines plutôt que par l’acquisition de nouvelles familles


6-1-1-6 Pseudogènes et autres reliques de gènes Pseudogène: copie non fonctionnelle d’un gène Gènes tronqués Fragments de gènes Deux types de pseudogènes: -Pseudogène conventionnel: devenu non fonctionnel à cause de mutations -Pseusogène processé

Origine des pseudogènes processés. On pense que les pseudogènes processés proviennent de la réintégration dans le génome d’un cDNA issu de la rétrotranscription d’un ARN issu de la transcription d’un gène normal. La réverse transcriptase nécessaire est apportée lors d’un infection par un rétrovirus. L’intégration du pseudogène se fait au hasard. Le pseudogène est donc dépourvu d’introns et surtout dépourvu de promoteur, ce qui le rend non fonctionnel.


6-1-1-7 Séquences répétées (non géniques) Séquences non codantes, retrouvées à de nombreux endroits du génome. 4 types: LINE (Long Interspersed Nuclear Element) SINE (Short Interspersed Nuclear Element) LTR (Long Terminal Repeat) Transposons Ce seraient des reliques de séquences virales installées dans les génomes eucaryotes, qui auraient tellement muté qu’elles ne seraient plus capables de produire des particules virales, mais seraient encore capables de se recopier et de se transposer ailleurs dans le génome. ,#

#+

-.

3 -.

(

(

#+

1(

#

3 -. 4 ( #+

5

3 -. 4 ( 371

&/ )$

2 ###

8.1'

2

9&

2

( '

#

&

' =

/

& * $6 / "$ /

;

#+

/

/ )$

2

:-2 9&

###

-

< $

/

$

/! 0 / !0 /

0

/ 0

/ )$

/

/ )0

/

/

/))0

/

/ *0

/*

/ "0

$

( $

(

/!

&

&

(


6-1-1-8 L’ADN satellite Motifs de séquence répétés en tandem Ex: GAGAGAGAGA…. TATTTATTTATTTATTTATT… Seraient dus à un mauvais fonctionnement de la réplication: la polymérase patine.

' & > > ($

# $ (

#'

#

# α# β#

# $ ( ( # &

!

$%&' +

& )" *' #&./ '

.

& " *

' &

* *

# $ (

$ )" * )" * -

"

(

"

"

)

(

"

"

) ,, , , , ,

(

"

"

)"

1 -

"

##+

" ' % &

> &

$

! $

#

# $ (

+ + #

,

0 * ,

2

#

#

& &

" "

" ,)

: >& 8 &#+ #+

"

" "

" ( ## &

& ## & & ? >

"

" $

"

-


6-1-1-9 Séquences non répétées non codantes

-promoteurs, enhancers… -autres séquences


6-1-2 Organisation générale des génomes mitochondriaux et chloroplastiques Génomes de type bactérien: -Le plus souvent circulaires -Plusieurs molécules identiques par organite, nombre variable -Pas d’introns dans les gènes -Taille très variable selon la cellule hôte -Nombre de gènes très variable selon la cellule hôte. Mais, le nombre de gènes est toujours très inférieur au nombre de protéines constituant l’organite. Beaucoup de gènes ont été transférés au génome nucléaire au cours de l’évolution (100% pour les peroxysomes qui ont totalement perdu leur matériel génétique).


Taille et contenu en gènes de génomes mitochondriaux de différentes espèces comparé au génome d’une eubactérie actuelle, Rickettsia, l’agent du typhus. (A) Les cercles et les traits représentent les génomes mitochondriaux circulaires et linéaires de différentes espèces. Pour les génomes >60 kbp, l’ADN codant pour des gènes de fonction connue est indiqué en rouge, celui contenant des ORF non identifiées et des séquences intergéniques non codantes est représenté en bleu. Des comparaisons de séquences entre génomes mitochondriaux et génomes bactériens actuels indiquent une parenté des mitochondries avec les Rickettsies, des bactéries parasites intracellulaires obligatoires. Ceci suggère que l’ancêtre des rickettsies pourraient être à l’origine des mitochondries. Les homologies entre génomes mitochondriaux de différentes espèces suggère que toutes les mitochondries, même d’espèces très différentes, descendent d’un unique ancêtre. La colonisation symbiotique de la cellule eucaryote ancestrale par la bactérie à l’origine des mitochondries aurait donc été un évènement unique, ayant eu lieu très précocement avant la divergence des différents règnes. (B) Analyse des contenus en gènes de quelques génomes mitochondriaux. Chaque ovale contient le contenu en gènes d’un génome mitochondrial d’une espèce donnée. Le génome mitochondrial de Reclinomonas (un protiste) est le plus grand et contient tous les gènes que l’on retrouve dans des génomes mitochondriaux plus petits. Ce génome serait donc le plus proche du génome ancestral, les autres ayant évolué principalement en transférant des gènes au génome nucléaire.


6-2 Génomes procaryotes 6-2-1 eubactéries prototypiques, type E. Coli -1 seul chromosome circulaire . Contient presque exclusivement des gènes . Nombreux gènes organisés en opéron . Pas d’introns dans les gènes . Moins de gènes que chez les eucaryotes . Condensation pour former le nucléoïde par . Supercoiling . association avec des protéines HU, fonctionnellement similaires aux histones mais non homologues en séquence. 1/5 seulement du chromosome est associé aux HU - 1 ou plusieurs plasmides contenant des gènes de résistance aux antibiotiques


6-2 Génomes procaryotes 6-2-2 eubactéries non prototypiques

Quelques espèces ont -un grand chromosome linéaire -Plusieurs dizaines de petits chromosomes supplémentaires, linéaires ou circulaires


6-2 Génomes procaryotes 6-2-3 archebactéries

Organisation type E. coli ou -un grand chromosome linéaire -plusieurs dizaines de petits chromosomes supplémentaires, linéaires ou circulaires Possibilité d’introns dans les gènes Protéines homologues aux histones


6-2 Génomes procaryotes 6-2-4 Evolution des génomes procaryotes

Les génomes procaryotes évoluent plus rapidement que les génomes eucaryotes car - Taux de mutation plus élevés - Transferts horizontaux de gènes entre individus et même entre espèces (la notion d’espèce chez les procaryotes est très floue)


génome