Séquençage
Sommaire |
Le séquençage d'un génome : deux stratégies
Première méthode : clone par clone
Cette stratégie « clone par clone » est celle qui a été adoptée par le consortium international pour le séquençage du génome humain (HGP : Projet Génome Humain). Il s'agit d'une démarche en trois étapes :
D’abord on extrait l’ADN d’un humain
1ère étape : banque de grands clones.
-on coupe l’ADN extrait en fragments de grande taille (150000 bases)
-puis on insère chacun de ces « morceaux » dans des chromosomes artificiels bactériens
-enfin on intègre le couple (fragment + chromosome artificiel) dans une cellule bactérienne
=>Ces bactéries, mises en culture, vont se multiplier et formeront alors une collection de clones cellulaires. Cette collection est nommée "banque d'ADN génomique", puisque ces clones constituent une représentation de l'ADN génomique de l'organisme à séquencer.
2ème étape : carte physique
-on recherche des « marqueurs » dans les grands clones pour les ordonner, c'est-à-dire des zones où les séquences sont homologues entre les clones mais aussi au chromosome génomique. On peut alors les positionner les uns par rapport aux autres, et le long des chromosomes humains.
=> On obtient ainsi une carte physique des chromosomes (et donc du génome dans son entier), c'est-à-dire une carte présentant l’emplacement des grands clones le long du génome.
3ème étape : le séquençage final
-on fractionne chaque grand clone en petits clones* (1000 bases).
-on séquence alors chaque petit clone individuellement et on recherche les séquences communes : on peut alors reconstituer la séquence complète du grand clone.
- la technologie d’aujourd’hui ne permet pas de lire, ni de séquencer des séquences trop grandes, il est donc indispensable de fractionner chaque grand clone en petits clones.
Deuxième méthode : aléatoire globale
Cette stratégie de séquençage "aléatoire" appliquée à l’ensemble du génome a été utilisée dès les débuts du séquençage, en 1982, pour venir à bout du génome du Bactériophage lambda. C’est la stratégie retenue aujourd’hui pour tous les génomes bactériens. On l’associe plus volontiers aux sociétés privées, telles que Celera Genomics, parce qu’elle est rapide et économique.
Cette technique repose sur un principe simple : découper un génome en un grand nombre de fragments de trés petite taille de manière totalement aléatoire. Les extrémités d'une partie de ces fragments sont ensuite séquencées, puis ces séquences sont assemblées sur la base de leurs chevauchements grâce à des systèmes informatiques très puissants pour essayer de produire une séquence complète. Les difficultés d'une telle technique sont à deux niveaux : (1) avoir assez de fragments pour couvrir le génome dans son entier, et (2) réussir l'assemblage.
Toutefois, il faut remarquer que, pour de grands génomes comme celui de l'Homme, il est très difficile d’utiliser cette méthode car justement trop aléatoire et « brouillonne ». En effet avec cette technique de séquençage, on se retrouve toujours avec de nombreux « blancs », c'est-a-dire des trous physiques dans la séquence, il est alors nécessaire de séquencer bien plus d’ADN que le génome n’en contient, et cela afin de limiter les vides : pour cela on a besoin d'outils informatiques dotés d'une grande puissance de calcul.
Le séquençage final des fragments d'ADN
Quelle que soit la stratégie utilisée pour le séquençage complet d'un génome, il faudra de toute façon effectuer le séquençage final des fragments obtenus (qui sont plus ou moins grands selon la stratégie utilisée).
Pour cela on utilise des enzymes particulières : les ADN polymérases. Ces enzymes sont capables de synthétiser un brin complémentaire d'ADN, à partir d'un brin matrice :
En temps normal, dans notre organisme, ces réactions se font par ajout de désoxyribonucléotides (dNTP : désoxyNucléotide TriPhosphate), molécules chimiques constituant les nucléotides de notre ADN, et donc indispensables pour la synthèse de l'ADN. Pour le séquençage, on utilise des molécules, synthétisant les nucléotides, légèrement différentes : les didésoxyribonucléotides (ddNTP). Les ddNTP sont diffèrents des dNTP par l'absence d'un groupement OH (oxygène-hydrogène) bien précis. En effet, ces groupements OH ont pour rôle d'effectuer la liaison entre les molécules, c'est ce qui permet la polymérisation des bases azotées dans notre ADN :
Quand l'ADN polymérase utilise un ddNTP au lieu d'un dNTP, elle n'est plus capable de rajouter le moindre nucléotide à sa suite : la synthèse du brin d'ADN s'arrête...
Avec ces connaissances et grâce à un protocole simple, on va pouvoir connaître les nucléotides qui composent notre ADN à séquencer, voilà comment on procède :
1/Dans un milieu de réaction on place notre ADN à séquencer , L'ADN polymérase , des dNTP en grand nombre, et un peu de ddNTP.
2/L'ADN polymérase va alors synthétiser le brin complémentaire de l'ADN à séquencer (comme ci-dessus)
3/A un moment totalement aléatoire, un ddNTP sera ajouté à la chaîne en cours de la synthèse par l'ADN polymérase. Cette synthèse s'arrêtera donc à cet endroit.(voir propriété des ddNTP si dessus)
Par exemple, dans la réaction où on a ajouté du ddGTP, la synthèse s'arrête au niveau des G (ce qui correpond, du fait de la complémentarité des bases, à la présence d'une Cytosine dans le brin d'ADN séquencé).On obtient alors une multitude de fragments de taille variée, à la suite de plusieurs synthèses, qui se terminent tous au niveau d'un des G dans la séquence complémentaire et au niveux des C dans la séquence initiale.
Ces fragments sont ensuite séparés par des techniques permettant la séparation des constituants d'un mélange , ce qui nous conduit ainsi à repérer la position des G dans la séquence.
On répète la même opération avec un milieu contenant du ddATP, un milieu contenant du ddCTP, et un milieu contenant du ddTTP : on réussit de cette façon à connaître la position de chaque base azotée !
Lecture des résultats par Électrophorèse
L'électrophorèse est une technique de biologie et de biologie moléculaire utilisée très fréquemment et dont le protocole est simple à réaliser. Elle consiste à séparer, comparer, voire identifier des constituants chimiques porteurs de charges électriques (protéines, acides aminés, acides nucléiques, etc.).
Le principe est simple, il s'agit de placer dans un champ électrique doté d'une anode et d'une cathode, séparées par une solution conductrice, des molécules chargées qui migreront vers l'une des électrodes, selon leur charge.
La migration est d'autant plus importante que leur masse moléculaire est faible. Lorsqu'elles sont chargées électriquement, les molécules d'un mélange pourront donc être séparées.
L'automatisation du séquençage
Présentation
Lorsque l’on entreprend des projets aussi gigantesques que le séquençage complet d’un génome, il est indispensable de posséder des appareils capables d’augmenter la productivité et le rendement, sans quoi il faudrait dix fois plus de temps : ces appareils sont appelés séquenceurs ADN.
ATTENTION : Il ne faut pas confondre automatisation du séquençage et utilisation de l’informatique pour le séquençage ! L’automatisation c’est le fait d’utiliser un système piloté par ordinateur (séquenceur) pour accélérer le processus. Quand on dit que l’on utilise l’informatique pour le séquençage, c’est que la méthode employée pour séquencer nécessite une grande puissance de calcul (par exemple la méthode aléatoire globale).
Toutes les initiatives de séquençage utilisent aujourd’hui des séquenceurs automatiques mais toutes n’ont pas besoin de puissance de calcul énorme afin de reconstituer la séquence complète du génome ! ( tout dépend de la méthode utilisée : voir ci-dessus)
Lecture des résultats (chromatographie)
Non seulement ces appareils sont capables de séquencer l'ADN bien plus rapidement, mais en plus ils peuvent lire directement ces séquences et représenter les résultats : pour cela ils utilisent non pas l'électrophorèse mais la chromatographie. La chromatographie est une technique analytique qui permet la séparation des constituants d'un mélange selon leurs caractéristiques.
Grâce à l'utlisation de capteurs fluorescents incorporés aux fragments d'ADN, le séquenceur automatique peut interpréter les résultats en termes de nucléotides :
Les quatre courbes correspondent à la détection de la fluorescence des fragments d'ADN obtenus. Un "pic" correspond donc à la détection d'un nucléotide donné dans la séquence : l'interprétation est donnée sous les courbes.
En bleu : Cytosine. En vert : Adénine. En noir : Guanine. En rouge : Thymine.
Par rapport au séquençage "à la main" , les séquenceurs automatiques présentent plusieurs avantages : d'abord un gain de temps, mais ce qui est nouveau c'est la qualité de représentation des résultats . En effet, en utilisant l'electrophorèse on ne peut guère espérer plus de 300 bases sur un même film ,alors qu'avec les séquenceurs, et donc avec la chromatographie, on peut facilement lire des milliers de bases.
Plan
Problématique
Annexe : le séquençage
- Introduction
- Présentation du séquençage
- Chimie des molécules du vivant et technologie de l'ADN
- Historique du séquençage
- Comment se fait le séquençage ?
- Intérêt et buts du séquençage
- Les acteurs de la recherche
- La guerre privé-public
- Bibliographie





