Un peu de physique...

Gènes et codons

La notion de gène a été mise en évidence bien avant que l’on soit parvenu à séquencer l’ADN. Ce n’est qu’au cours des dernières décennies que l’on a pu faire le lien entre cette notion de gènes et certaines séquences d'ADN. On a aujourd’hui une vision bien plus claire de ce qu’est un gène :

  • Un gène est tout d’abord associé à une position particulière sur un chromosome, un locus. Un locus est une position fixe sur un chromosome. La répartition des gènes sur les loci est caractéristique d’une espèce. Le séquençage de l'ADN a permis de répertorier ces différentes positions et nous en avons une nomenclature qui s’exprime sous la forme de trois chiffres et d’un lettre. Par exemple, l’étiquette 3q5.2 caractérise un locus situé sur le 3ème chromosome, sur le bras dit « long » de celui-ci, dans la bande numéro 5 et la sous-bande numéro 2.
  • Les gènes n’ont pas tous la même longueur mais ils commencent tous par une séquence de bases nucléiques type appelée séquence promoteur (aussi appelée séquence régulatrice) et une séquence appelée séquence terminateur.
  • Entre ces séquences les gènes sont constitués d’une succession de codons. Un codon est un groupe de trois nucléotides. Comme il y a quatre types de nucléotide (A, C, T, G) il y a 64 combinaisons possibles. Chaque combinaison correspond à un acide aminé. Comme il n’y a que 22 acides aminés intervenant dans la chimie du vivant (acides aminés protéinogènes), il y a une certaine redondance. La glycine H2N-CH2-COOH, par exemple, est codée par les séquences GGU, GGC, GGA et GGG.
  • La correspondance entre codons et acides aminés est la même pour tous les organismes vivants, qu'il s'agisse de bactéries, d'archées, de cellules végétales ou animales. Le codon GCA, par exemple, fait toujours référence à l'alanine, qu'il apparaisse dans l'ADN d'une bactérie, d'une levure, d'une mouche, d'une fleur ou d'un hippopotame !
  • La fonction d’un gène est de synthétiser une protéine à partir de la liste d’acides aminés constituée par les codons.

Nota : cette universalité du code protéique ne s'applique pas aux mitochondries, des organites internes aux cellules qui ont leur propre code génétique.

La synthèse d’une protéine par un gène est une opération complexe (voir le post à ce sujet). La séquence de codons est tout d’abord recopiée sous la forme d’une molécule d’ARN par des enzymes appelés ARN polymérases. Cette molécule d’ARN est ensuite expurgée de certaines séquences. Il y a en effet dans la nomenclature codée par le gène des codons correspondant à des acides aminés qui ne font pas partie de la protéine cible (en tout cas pas à la place indiquée par la position dans la séquence totale). Ces séquences « expurgeables » sont des introns et le processus qui les élimine est appelé processus d’excision. Les séquences qui subsistent sont appelées exons. L’ARN débarrassé des introns est appelé ARN messager. C’est cet ARN qui sort du noyau et qui est pris en charge par une structure appelée ribosome au sein de laquelle est synthétisée la protéine dont la formule est donnée par la liste de codons de l’ARN messager. Cette synthèse utilise une autre famille d’ARN, les ARN de transfert. Les protéines sont les vecteurs chimiques qui permettent d’activer les fonctions spécifiques au gène considéré, ce que l’on appelle le phénotype.

Nota : Le corps humain n’a besoin que de 21 acides aminés protéinogènes parmi les 22 répertoriés. Il n’est capable d’en synthétiser en quantité suffisante que 12. Neuf d'entre eux, dits acides aminés essentiels, doivent lui être apportés par l'alimentation.

Allèles et reproduction des cellules

La structure de chaque chromosome (ses loci) est caractéristique de l’espèce. Cela ne signifie pas que les gènes qui les composent sont identiques d’un individu à l’autre. Le groupe sanguin d’un être humain par exemple est déterminé par le gène présent en 9q34.1 et 9q34.2 (gène ABO). Or ce gène peut prendre différentes valeurs. L’une correspond au groupe sanguin A, une autre au groupe sanguin B et la troisième au groupe sanguin O. Les différentes formes que peut prendre un gène s’appellent des allèles. C’est cette variabilité des gènes qui explique que nous sommes tous uniques !

Nous avons vu dans un post précédent que le patrimoine génétique d’une cellule eucaryote était réparti entre n paires de chromosomes, dont n-1 sont dites homologues (même structuration en loci et mêmes gènes pour chaque locus) dans le cas d’organismes sexués. Lorsque les gènes correspondant à la même position d’un même locus des deux chromosomes de la même paire portent le même allèle, on dit qu’ils sont homozygotes. Dans le cas contraire, ils sont dits hétérozygotes.

La reproduction sexuée fait appel à un processus complexe qui garantit la diversité génétique à chaque génération. Ce processus est appelé méiose. La méiose comporte différentes phases. Lors de l’une d’elle, les paires de chromosomes des parents se dissocient et se combinent. A partir d’une paire de chromosomes, il se forme deux chromosomes dont la structure (locus, position des gènes) est identique à celle de la paire initiale mais qui emprunte ses allèles aux deux chromosomes de la paire. Supposons par exemple que la structure de la paire soit composée de deux loci comportant l’un 3 allèles et l’autre 2 allèles. Supposons que le premier chromosome de la paire soit A1B1C1-D1E1 et le second A2B2C2-D2E2. Les deux chromosomes issus de cette phase de la méiose pourront être A1B2C2-D2E1 pour l’un et A2B1C1-D1E2 pour l’autre ! Chacun de ces chromosomes sera encapsulé dans une cellule haploïde appelée gamète, ovule ou spermatozoïde selon le sexe du parent concerné.

La fécondation de l'ovule maternel par le spermatozoïde paternel conduira à une cellule diploïde dont chaque paire comporte un chromosome issu de l'ovule et l’autre un chromosome issu du spermatozoïde. On va donc retrouver dans le patrimoine génétique de la cellule-fille un panachage d’allèles transmis par… les grands parents. Pour chaque locus, on trouvera sur l’un des chromosomes un allèle transmis par le père mais qui peut provenir du patrimoine génétique de sa propre mère ou de celui de son père ! Idem pour le chromosome transmis par la mère. et provenant de sa propre et sur l’autre un allèle transmis par la mère.

Remarque 1 : lors de la reproduction sexuée, seul l'ADN du noyau porte des chromosomes paternels et maternels. Comme le noyau nouvellement formé est hébergé dans une cellule maternelle, l'ADN mitochondrial est exclusivement maternel.

Remarque 2 : le cycle de reproduction sexuée n’a rien à voir avec celui de la division cellulaire qui conduit à la création de deux cellules fille identiques à la cellule mère. Le processus de division cellulaire s’appelle la mitose.

Deux allèles différents pour un même gène … Quel effet cela a-t-il sur l’expression du gène (son phénotype) ? Dans certains cas, les allèles peuvent s’exprimer simultanément et produire un effet combiné. C’est le cas pour le gène qui détermine la couleur de peau par exemple. Dans d’autres un allèle ne peut s’exprimer que lorsque l’autre allèle produit un effet similaire. On dit alors qu’il est récessif. L’allèle qui code la couleur bleue des yeux est récessif. La méiose permet cependant à ce caractère de se transmettre et de ressurgir dans une génération ultérieure. Prenons un couple dont le père a des yeux bleus et la mère des yeux marrons. Leur enfant peut très bien avoir des yeux bleus si la mère a un ascendant qui avait les yeux bleus. Celui-ci lui a transmis un allèle « yeux bleus » qui est inhibé par un allèle « yeux marrons » chez elle mais qu’elle peut très bien transmettre à son enfant. C’est cette combinatoire qui est à la base des lois de la génétique Mendelienne.

Remarque : l’exemple du gène de la couleur des yeux tout comme celui du gène ABO sont très « parlants » mais ils donnent peut-être une vision un peu trop simpliste de l’influence des gènes. Il n’y a pas une correspondance biunivoque entre un gène et un phénotype ou une fonction biologique donnée. Le plus souvent, un phénotype ou une fonction biologique (ou une maladie d'origine génétique) résultent de la combinaison d’un ensemble de gènes et l'expression d'un même gène peut impacter plusieurs fonctions biologiques différentes.

Expression des gènes, modulation et différenciation

Toutes les cellules du corps humain partagent le même génome. Elles sont pourtant loin d'avoir la même forme et la même fonction. Comment imaginer qu'un neurone, une cellule de l'épiderme, une cellule musculaire ou un globule rouge, privé de noyau et de mitochondries, portent tous en eux le même mode d'emploi ?

L'expression des gènes, leur transcription en protéines dépend de leur accessibilité dans le noyau. A l’intérieur du noyau, l’ADN est empaqueté dans une structure plus globale, la chromatine, qui comprend également des molécules d’ARN et deux types de protéines, les histones et les non-histones (PNH). L’ADN s’enroule autour des histones pour former une succession de nucléosomes (de petites bobines d’ADN). L’empaquetage de l’ADN est plus ou moins condensé. Ce degré de condensation ainsi que les parties de l'ADN qui le sont joue un rôle sur l’accessibilité des gènes.

La conformation de la chromatine n'est pas le seul facteur qui joue sur l'expression des gènes. Elle peut aussi être modifiée chimiquement, à demeure ou au cours de la vie de la cellule. L’acétylation de certaines histones peut inhiber la transcription des gènes dans leur voisinage. Il en va de même pour la méthylation de certains nucléotides. On a par ailleurs déouvert l'existence de structures regroupant plusieurs gènes et les soumettant au contrôle d'un promoteur auquel peut se lier une molécule régulatrice capable d'activer ou de réprimer l'expression de ces gènes. On a donné à ces structures le nom d'opéron.

L'ADN n'est donc pas, comme on le lit souvent, un programme déterminant le fonctionnement de la cellule. Ce serait plutôt un livre de recettes lui permettant de mitonner un cocktail de protéines et de molécules d'ARN en fonction de contraintes environnementales et chimiques agissant sur la cellule.

Certaines de ces contraintes sont contingentes, d'autres structurelles. Ellles relèvent d'un processus de différenciation qui intervient dès les premières phases de l'embryogénèse. Une même cellule germinale humaine donne en effet naissance, au fil des division cellulaire (les mitoses) à plus de 200 familles de cellules différentes. La différenciation de ces cellules est entièrement dictée par l'environnement desdites cellules, environnement qui se modifie au fur et à mesure que l'oeuf se développe : différence entre intérieur et extérieur, différences de polarisation électrique, différence dans l'accès aux nutriments dans l'utérus, différences de signaux chimiques reçus et transmis...

Remarque : la physique donne un coup de main à la biologie pour architecturer l'embryon en développement. Voir le post à ce sujet.

 

L'expression des gènes est le fruit d'un jeu d'interactions complexe. Un gène actif peut agir sur l'expression d'un autre de différentes manières : en produisant des histones, des protéines intervenant comme promoteur ou comme inhibiteur, ou encore des protéines transmembranaires ouvrant une nouvelle chaîne de réception avec l'extérieur de la cellule...

Des microbiologistes ont cherché à décrypter la logique de ces interactions au moment de l'embryogénèse pour différents types d'organes. Ils ont ainsi pu établir des réseaux logiques qu'on affublés de l'acronyme GRN (gene regulatory network), réseaux qui ont amené à une série de constatations. L'existence par exemple d'une hiérarchie entre gènes : hierarchie entre ceux impliqués tres tôt dans l'architecture générale des organismes multicellulaires et d'autres qui interviennent plus tardivement dans la morphogénèse. D'étonnantes similitudes apparaissent, comme celle entre le réseau des gènes intervenant lors de la formation des cellules de la rétine des mouches drosophiles et celui intervenant dans celle du mésoderme de l'oursin !

Une parfaite illustration du bricolage auquel à donné lieu la sélection naturelle (expression formulée par François Jacob, prix Nobel de médecine en 1966 avec Jacques Monod et André Lwoff pour leurs travaux sur les opérons), de subtiles variations à partir d'un même schéma de base (l'altération d'un gène, la transposition d'un autre...) pouvant conduire à une structuration entièrement différente de la cellule ou à l'apparition de fonctionnalités radicalement nouvelles.

 

Epigénétique

L'ADN humain comporte 3,3 milliards de paires de base. On pourrait en déduire qu’il est composé d’un milliard de codons. Ce n’est pas si simple. En fait, on n’a identifié aujourd’hui que 21000 gènes propres à l’espèce humaine et ces gènes n’utilisent que 2% du potentiel de codage de l'ADN. C’est un peu comme si, dans un livre de 200 pages, il n’y avait que quelques paragraphes lisibles situés à des pages bien précises et que tout le reste était du dhrlfibdpflae… On a longtemps pensé qu’il s’agissait d’ADN poubelle. Ou, au mieux, de gènes fossiles inactivés au cours de l’évolution. On sait aujourd’hui qu’une partie de cet ADN non codant intervient dans l’expression des gènes en jouant un rôle de régulation ou d’inhibition (voir ci-dessus le rôle de la méthylation des nucléotides ou de l’acétylation des histones ainsi que celui des opérons).

Remarque 1 : certaines de ces modifications peuvent être transmises d’une génération à l’autre sans pour autant affecter l’ADN. Elles sont héritables mais pas héréditaires.

Remarque 2 : l'ADN codant ne se limite pas aux gènes. L'ADN code également l'ARN ribonucléoprotéique et toutes les molécules d'ARN autres que celles d'ARN messager (ARNt, micro-ARN).

L’épigénétique est une branche de la biologie en plein développement qui s’intéresse aux modifications temporaires ou permanentes de l'expression des gènes sous l'effet de contraintes extérieures.

Transposons

Les transposons font partie de cet ADN autrefois qualifié de poubelle. Ce sont des séquences d’ADN capables de se répliquer ou de se déplacer dans l’ADN… voire même de se transporter d’une espèce à l’autre par l'intermédiaire d'un virus ou d'un plasmide. Ce mécanisme est appelé transposition et il est réalisé par une enzyme, la transposase. Cette transposase est codée par le transposon lui-même. Ce mécanisme de transposition est loin d’être anecdotique : il semble que 45% du génome humain soit constitué de transposons ou de transposons fossiles. L’effet de ces transposons peut se comprendre lorsqu’il agit sur les séquences régulatrices de l’expression des gènes. Ailleurs, son rôle reste mystérieux. Certains chercheurs avancent qu’il peut jouer un rôle dans le maintien de la diversité ou dans la capacité d’adaptation à des changements de l’environnement.

 

Index