Les méthodes expérimentales

De Bioinformatique.eu.

Sommaire

Les méthodes expérimentales


Afin d’identifier la fonction des gènes de façon expérimentale, les scientifiques utilisent des outils différents selon la nature des fonctions étudiées : l’étude du métabolisme pour les fonctions enzymatiques, et l’étude des interactions protéines-protéines ou protéines-acides nucléiques, pour d’autres fonctions comme les toxines.

Étude du métabolisme

Afin d’étudier le métabolisme d’une bactérie, il est possible de supprimer la fonction d’un gène par mutagénèse, afin d’étudier le comportement de la bactérie sans ce gène.

Définition[1]
Le métabolisme est l'ensemble des transformations moléculaires et des transferts d'énergie qui se déroulent de manière ininterrompue dans la cellule ou l'organisme vivant. C'est un processus ordonné, qui fait intervenir des processus de dégradation (catabolisme) et de synthèse organique (anabolisme).

La mutagénèse dirigée[2]


Définition[3]
La mutagénèse consiste à produire des individus dont un gène a été muté, ce qui permet d’étudier la fonction de la protéine codée.

Il existe deux grandes familles de mutagénèse, la mutagénèse dirigée, et la mutagénèse aléatoire (mutations introduites au hasard dans le génome). Ici, nous allons décrire le fonctionnement de la mutagénèse dirigée, méthode utilisée par le Génoscope dans l’étude de la fonction des gènes d'Acinetobacter baylyi (pour ce projet, l’équipe du Génoscope ne cherchent qu’à connaître les fonctions enzymatiques (environ 40% des gènes), c'est-à-dire ce qui concerne le métabolisme.
Il est à noter que le choix de cette bactérie par le Génoscope n’a pas été fait au hasard. Cette bactérie qui a plus de 46% de ses gènes en commun avec Escherichia coli (qui est la bactérie la plus connue et étudiée) et possède l’avantage d’avoir un génome plus facilement manipulable que cette dernière : en effet, il est très facile de changer l’un de ses gènes, car elle est dotée de la capacité de transformation par de l'ADN exogène la plus élevée : compétence naturelle (compétence = capacité d'une bactérie à incorporer de l'ADN étranger) contrairement à de nombreuses autres bactéries, auxquelles il faut un choc électrique. Cette propriété est associée à sa capacité à faire de la recombinaison homologue (processus d'échange entre deux régions d'ADN identiques).[4]
Mais la mutagénèse dirigée, bien que très efficace n’est pas toujours utilisable, car elle nécessite la connaissance du génome de la bactérie que l’on veut étudier, de plus elle est longue et nécessite des moyens (financiers et matériels) importants.

Mutagénèse dirigée d’Acinetobacter baylyi

L’emploi de la mutagénèse dirigée nécessitant la connaissance du génome de cette bactérie, une équipe du Génoscope l’avait donc préalablement séquencée.
Le but de la mutagénèse est de créer un stock de mutants ayant chacun un gène muté, pour les étudier (cf. Étude du métabolisme).
Afin d’avoir un débit important de mutants, l’équipe du Génoscope a mis au point une méthode permettant d’obtenir environ 400 mutants toutes les deux semaines ; voici leur méthode (version simplifiée de l’originale) :

NB : pour comprendre cette méthode, il est important de savoir ce qu’est une PCR (Polymerase Chain Reaction) ou réaction de polymérisation en chaîne. Cliquez ici pour comprendre ce que c’est.

Les mutants que l’on va créer auront une "cassette" contenant le gène de résistance à la kanamycine avec un promoteur fort (promoteur du phage T5) permettant l’expression de ce gène chez tous les mutants. Cela sert à éliminer toutes les bactéries qui n’ont pas incorporé le gène dans le génome, lorsqu’on les met en présence de kanamycine.

La première étape consiste à repérer chacun des gènes que l’on veut modifier, une fois cela fait, on va regarder les séquences de nucléotides qui sont avant et après le gène qui nous intéresse, afin de permettre à notre "nouveau" gène de remplacer exactement le gène que l’on veut. Car, comme nous l’avons vu, l'Acinetobacter baylyi est capable d’intégrer un gène qui n’appartient pas à son génome. On choisit donc une séquence de plusieurs centaines de paires de bases, situées avant le codon ATG (séquence de "démarrage" du gène) et juste après un codon STOP (codon indiquant la fin d’un gène).
L’étape suivante consiste, grâce à la PCR, à récupérer deux séquences de plusieurs centaines de nucléotides (plusieurs centaines de fois) : une séquence commençant quelques centaines de bases avant ATG + un bout du début de la cassette (promoteur + gène de résistance à la kanamycine) et une autre séquence commençant par la fin de la cassette + plusieurs centaines de nucléotides juste après le codon STOP.

Figure 1 : Première PCR
Puis par une autre PCR, on va obtenir une séquence complète. :
Figure 2 : Seconde PCR


Ensuite, cette séquence est mise en présence de la souche sauvage de l'Acinetobacter baylyi, et, grâce à la particularité de cette bactérie, le gène s’intègre dans de nombreuses bactéries.
On étale ensuite les cultures obtenues sur une gélose contenant de la kanamycine, et toutes les bactéries qui n’ont pas intégré le gène de résistance vont mourir, ce qui ne permet que le développement des colonies mutantes. Vient ensuite la phase de vérifications qui est faite ici par deux méthodes : la première par PCR et la seconde par séquençage, afin d’être certain que le gène ciblé a bien été remplacé.
Il ne reste plus maintenant qu’à répéter cette opération autant de fois qu’il y a de gènes. Mais dans certains cas, la bactérie meurt une fois le gène "retiré", dans ce cas, on considère alors le gène comme étant létale. C’est ainsi que sur 3205 séquences codantes, "seul" 2528 mutants ont pu être obtenus.
NB : sur ces 3205 gènes, 36% ont une fonction connue (cf. les méthodes informatiques), 28% on une fonction probable (cf. les méthodes informatiques) et 36% ont une fonction encore inconnue.

Étude du métabolisme

(toujours depuis l’exemple d’Acinetobacter baylyi)
Une fois que l’on a fait les mutants, on les regroupe pour les étudier dans différentes conditions de culture : sur un milieu plus ou moins riche, à différentes températures, en présence de tel ou tel inhibiteur. On va ainsi pouvoir évaluer les capacités de croissance de chaque souche.

Par exemple, les chercheurs ont analysé la croissance des mutants sur une source de glucose. Puis ils les ont laissé se développer, et identifient les mutants qui ne se sont pas développé (absence de colonie bactérienne). On montre ainsi que le gène muté était nécessaire dans la chaine d’assimilation du glucose par la bactérie. Pour savoir quelle est la fonction de la protéine produite par le gène dans la chaîne d’assimilation, il est nécessaire d’étudier les métabolites produits par ce mutant et en observant l’absence de certains métabolites de la chaîne d’assimilation du glucose, on peut en déduire la fonction enzymatique de cette protéine (cf. Figures 3)

Figure 3 : Voie d’Embden-Meyerhof ou glycolyse[5]


Si au cours des mutations, l’un des gènes transformés est celui permettant de passer du fructose 6-phosphate au fructose 1,6-bisphosphate (qui est le gène codant pour l’enzyme phosphofructokinase) est remplacé, alors la glycolyse s’arrêtera à ce point-là ; ce qui nous donnera ce schéma :

Figure 4 : Blocage de la glycolyse


Une alternative à cette méthode ponctuelle (pour une seule source d’énergie) a aussi été utilisée dans le cadre du projet Thésaurus métabolique d’A. baylyi, il s’agit d’analyser des profils métaboliques (intra ou extra cellulaires) globales, par spectrométrie de masse. Cela permet d’identifier et de quantifier les molécules qui sont présentes (ou absentes) dans le milieu. On peut ainsi, grâce à la spectrométrie de masse, comparer ce que produisent deux souches : une sauvage et une mutée. De plus, cette méthode permet de valider les hypothèses qu’ils ont faites, grâce à l’informatique (cf. II) Les voies métaboliques).

Figure 5 : Analyse par spectrométrie de masse de la souche sauvage
Figure 6 : Analyse par spectrométrie de masse de la souche mutante

En ordonnées : intensité du signal détecté par spectromètre de masse.
En abscisses : hydrophobicité des métabolites séparés en HPLC en phase inverse.
Les nombres au-dessus des pics sont les mêmes qu’en abscisse.[6]

On voit bien sur les graphiques les variations des métabolites représentées par les pics A, B, C et D. Le mutant a en fait remplacé son gène codant pour une enzyme permettant de passer de C à D, ce qui provoque une accumulation de métabolites A, B et C, et aucune création de D. Cette constatation permet aussi de savoir qu’il n’y a pas de voie alterne permettant d’obtenir des métabolites D.

Expression d’un gène

Ces techniques sont généralement utilisées lorsque la fonction d’un gène n’est pas connu. Elles permettent l’étude notamment des structures et des interactions protéiques que nous allons présenter.

Tout d’abord, l’expression d’un gène se fait par l’utilisation d’un "vecteur" qui va introduire le gène à étudier dans le système choisi. Pour l’étude des gènes bactériens, les vecteurs les plus souvent utilisés sont des plasmides dans lesquels on introduit le gène après un promoteur fort. Un plasmide est une molécule d'ADN circulaire séparée de l'ADN chromosomique, et capable de réplication autonome. Les plasmides se trouvent chez les bactéries. L’expression du gène peut aussi être faite dans un système levure avec l’utilisation d’un chromosome artificiel comme vecteur (Vecteur YAC : Yeast Artificial Chromosome) qui permet des études plus complexes. Nous allons présenter les techniques de caractérisation de la structure des protéines puis la technique du double hybride permettant d’étudier les interactions protéiques.

Étude de la structure des protéines


Il est nécessaire de définir au préalable les structures primaires, secondaires, tertiaires et quaternaires des protéines.

Les différentes structures des protéines


  • Structure primaire

La structure primaire d’une protéine est la succession linéaire des acides aminés avec les modifications post-traductionnelles (glycosylation, …) ainsi que la création de certains ponts disulfure qui sont liés à de simples boucles de la chaîne polypeptidique, les autres ponts disulfure étant obtenus après repliements et font donc partie de la structure tertiaire ou quaternaire de la molécule (par exemple certains ponts disulfure entre les chaîne des immunoglobulines).

Figure 7 : Structure primaire[7]


  • Structure secondaire

La structure secondaire est le repliement de la protéine en hélices ou en feuillets.

  • Structure tertiaire

La structure tertiaire est la conformation en trois dimensions qu’a la protéine.

Figure 8 : Structure tertiaire de la myoglobine (avec une structure secondaire composée d’hélices alpha)[8]


  • Structure quaternaire

La structure quaternaire est l’association de plusieurs chaînes d’acides aminés.

Cristallographie par rayon X


Cette méthode nécessite d'obtenir une protéine très pure que l’on cristallise. Les cristaux sont ensuite traversés par des rayons X dont une partie est diffractée dans différentes directions. L’analyse des diffractions permet de reconstituer la structure des cristaux traversés. Une analyse itérative permet d’affiner la structure (cf. Figure 9).

Figure 9 : Analyse cristallographique de la myoglobine première protéine à avoir été analysée par cette technique en 1965 par Max Perutz et Sir John Cowdery Kendrew (Prix Nobel de Chimie)[9]


Spectroscopie par résonance magnétique nucléaire (RMN)


Comme la précédente méthode, celle-ci nécessite aussi d'obtenir une protéine très pure, mais la cristallisation n’est pas nécessaire et la protéine est laissée en solution. L’échantillon maintenu dans un champ magnétique constant est traversé par des ondes de diverses fréquences et les résonnances sont alors observées et analysées ce qui permet de déduire la structure de la molécule analysée.

Étude de la fonction d’un gène par la technique du double hybride[10]


Les interactions entre deux protéines peuvent être étudiées en utilisant des techniques biochimiques, comme la co-immunoprécipitation et le fractionnement par chromatographie. Nous présentons ici une technique qui peut être automatisée et permet d’étudier rapidement les interactions d’une protéine connue (appelée protéine appât) avec l’ensemble des autres protéines produites dans la cellule (appelées protéines proies). On utilise pour cela le gène GAL4 de la levure Saccharomyces cerevisia qui active la transcription des gènes GAL1 et GAL10 nécessaires à l'utilisation du galactose par la levure. La protéine GAL4 est composée de deux domaines :

  • un domaine N-terminal qui lie spécifiquement une séquence d'ADN (UASG pour upstream activated sequence for the yeast Gal genes).
  • un domaine C-terminal qui est nécessaire à l'activation transcriptionnelle.

Ces deux domaines doivent être liés pour qu’il y ait activation du gène mais cette liaison peut se faire par l’intermédiaire de deux protéines intercalées entre ces deux domaines. Le principe est le suivant :

Figure 10


Les plasmides codant pour deux protéines hybrides, une représentant le domaine de GAL4 liant l'ADN fusionné à la protéine X et l'autre représentant le domaine de GAL4 activateur de la transcription, fusionné à la protéine Y, sont construits et introduits à l'intérieur de la levure.
L'interaction entre les deux protéines X et Y conduisent à la reconstitution d'une protéine GAL4 fonctionnelle et donc à l'activation de la transcription du gène reporteur contenant un site de liaison à GAL4.
La protéine associée au domaine de liaison à l'ADN est appelée "appât"(ici c’est la protéine X).
La protéine associée au domaine activateur de la transcription est appelée "proie" (protéine Y).
Des Plateformes de criblage d’interactions protéine-protéine existent qui automatisent le processus et qui permettent d’étudier rapidement les relations entre une protéine donnée et l’ensemble des autres protéines cellulaire obtenus par une banque d’ADN complémentaires (correspondant à tous les différents ARN messagers présents dans la cellule). Exemple de la la plateforme du Centre de Recherche en Cancérologie de Marseille

















Références

  1. Wikipédia : le métabolisme
  2. Projet Thesaurus métabolique du Génoscope
  3. Alain Bernot (2001) - Analyse de Génomes, Transcriptomes et Protéomes. 3e édition, 222 pages, Dunod Paris
  4. David Metzgar, Jamie M. Bacher, Valérie Pezo, John Reader, Volker Döring, Paul Schimmel, Philippe Marlière, Valérie de Crécy-Lagard - Acinetobacter sp. ADP1: an ideal model organism for genetic analysis and genome engineering. Nucleic Acids Research, 2004, 32, 5780-5790
  5. Base de donnée contenant les voie métabolique connue : BioCyc
  6. Document du Génoscope
  7. Image provenant de Wikipédia
  8. Image provenant de Wikipédia
  9. Image provenant de Wikipédia
  10. Cours de l'Université Montpellier 2

Plan

Problématique

Annexe : le séquençage

Annexe : autre