Un peu de physique...

Nomenclature UICPA

L’UICPA est l’union internationale de chimie pure et appliquée (en anglais IUPAC : International Union of Pure and Applied Chemistry). Parmi les activités de cette organisation non gouvernementale, il y a la définition de règles permettant d’établir une nomenclature internationale des molécules organiques.

La nomenclature UICPA est basée sur la décomposition de la molécule en chaînes carbonées élémentaires porteuses de groupes fonctionnels et/ou de chaînes secondaires (principe de substitution : on part toujours d’un hydrocarbure, les groupes fonctionnels et chaînes secondaires se substituant à un atome d’hydrogène de cet hydrocarbure). Le nom de la molécule composée est ensuite construit par concaténation des noms, suffixes, préfixes caractérisant les chaînes élémentaires dont les positions sont les unes par rapport aux autres sont repérées par des indices. La forme générale est la suivante :

(num2-second) - nump-préfixe-princ-nums-suffixe

La chaîne secondaire peut elle-même être une chaîne composée, auquel cas son nom est construit de la même façon. S’il y a plusieurs fonctions ou chaînes secondaires, elles sont citées l’une après l’autre dans un ordre précisé par les règles de l’UICPA.

Quelques exemples simples

La glycine C2H5NO2 est un acide aminé. La dénomination UICPA de la glycine ou acide 2-aminoéthanoïque. La chaîne principale est une chaîne d’éthane CH3-CH3. Le suffixe -oïque nous indique que l’on s’intéresse ici à l’acide carboxylique dérivé de l'éthane, qui est l’acide éthanoïque CH3-COOH. Le groupe amine caractérisant la glycine est porté par le carbone 2. Même logique de construction pour l’alanine C3H7NO2, un autre acide aminé, dont la dénomination UICPA est acide 2-aminopopanoïque. L’alanine est un dérivé aminé de l’acide propanoïque dont la formule détaillée est CH3-CH(NH2)-COOH.

Passons à un exemple un peu plus compliqué. La dénomination UICPA du phénylalanine C9H11NO2 (encore un acide aminé) est acide 2-amino-3-phénylpropanoïque. La chaîne principale est à nouveau un acide propanoïque mais la dénomination UICPA comporte cette fois deux préfixes (2-amino-3-phényl). Ceci signifie que l’acide propanoïque est porteur d’un groupe phényl C6H5- sur son extrémité 3 et d’un groupe amine en position 2.

Même principe pour la glutamine C5H10N2O3 dont la dénomination UICPA est acide 2,5-diamino-5-oxopentanoïque. L’acide pentanoïque C4H9COOH qui constitue sa chaîne principale porte un groupe oxo (=O) à son extrémité 5 et deux groupes amines, l’un en position 2 et l’autre en position 5.

Simplification

Ce principe de dénomination peut conduire à des noms interminables. L’UICPA a codifié le nom de molécules courantes que l’on peut utiliser en lieu et place du nom composé complet. Prenons le cas de la pyrimidine. C’est un 1,3-diazabenzène (noyau benzénique dont les carbones 1 et 3 sont remplacés par des atomes d’azote, d’où le préfixe 1,3-diaza). Le nom générique pyrimidine peut être utilisé en lieu et place du nom complet pour construire celui de ses dérivés. Le nom UICPA de la cytosine, par exemple, est 1H-4-amino-2-oxopyrimidine. Le cycle pyrimidine constituant la chaîne principale est porteur d’un groupe oxo (=O) en 2, un groupe amine en 4 et un atome d’hydrogène connecté à l’atome d’azote occupant la position 1.

Isomères

La nomenclature UICPA permet de différencier les isomères. Prenons le cas du glucose C6H12O6. Il en existe plusieurs formes isomères dont l’une est linéaire et un autre cyclique. La forme linéaire est le 2,3,4,5,6-pentahydroxyhexanal. Une chaîne principale de type hexane (C6H14) porteuse d’un groupe fonctionnel aldéhyde (suffixe -al), ce qui en fait un hexanal C5H11-CH(=O). Quatre groupes hydroxyles -OH en 2, 3, 4, 5 et 6. La forme cyclique est le 6-(hydroxyméthyl)oxane-2,3,4,5-tétrol. La dénomination oxane fait référence à un hétérocycle de 6 atomes dont un d’oxygène (formule C5H10O, il ne s’agit pas d’un cycle aromatique et toutes les liaisons carbone-carbone sont simples). Les carbones 2, 3, 4 et 5 du cycle (l’oxygène occupant la position 1) sont porteurs d’un groupe alcool -OH, ce qui est exprimé par le suffixe -2,3,4,5-tétrol. Le carbone en 6 porte quant à lui une chaîne secondaire hydroxyméthyle -CH2OH. L’hydrocarbure de base de cette chaîne secondaire est le méthane (CH4). Le suffixe -yl indique qu’il est privé d’un atome d’hydrogène pour permettre une liaison avec la chaîne principale. Le préfixe hydroxy précise qu’il est porteur d’un groupe fonctionnel -OH.

Chaînes secondaires

Le sujet a été défloré dans le paragraphe précédent. Nous allons le compléter par trois exemples. Prenons tout d’abord le cas de la méthionine C5H11NO2S, encore un acide aminé. Sa dénomination UICPA est acide 2-amino-4-(méthylsulfanyl)butanoïque. On identifie sans peine la chaîne principale, l’acide butanoïque CH3CH2CH2COOH. Il porte à son extrémité 4 une chaîne secondaire méthylsulfanyl et un groupe amine en position 2. Un groupe sulfanyle est un groupe R-S-, R- étant une chaîne organique quelconque. Dans le cas qui nous intéresse, R- est un groupe méthyle H3C-. La chaîne secondaire est donc une chaîne H3C-S-.

Intéressons nous maintenant à la caféine, formule C8H10N4O2 et dénomination UICPA 1,3,7-triméthyl-1H-purine-2,6-dione. C’est une molécule dont la chaîne principale est une purine (C5H4N4), c’est-à-dire une imidazo[4,5]pyrimidine. Encore un exemple de notation générique simplifiée. Une purine est le résultat de la concaténation d’un cycle imidazole (hétérocycle à 5 atomes dont deux d’azote) avec une pyrimidine. Ces deux cycles partagent le segment [4,5] (la numérotation démarre à partir de l’atome d’azote repéré sur la figure ci-dessous, elle se fait dans le sens horaire sur le cycle pyrimidine puis antihoraire en partant du bas sur le cycle imidazole). Cette purine porte deux fonctions cétones (en position 2 et 6) et trois groupes secondaires méthyles (position 1, 3 et 7).

Pour conclure, nous allons nous intéresser à la thiamine C12H17N4OS, également appelée vitamine B1. Sa dénomination UICPA est 3-[3-[(4-amino- 2-methyl- pyrimidin-5-yl) methyl]- 4-methyl- thiazol-5-yl] éthanol. Prenons notre courage à deux mains. La chaîne principale est une chaîne éthanol CH3CH2OH. Elle est porteuse d’une chaîne composée que nous allons démonter.

La racine de cette chaine est un thiazole (thiazol-5-yl). Un azole est un hétérocycle à 5 atomes dont l’un est un atome d’azote. Un thiazole est un azole dont un atome de carbone a été remplacé par un atome de soufre (préfixe thi-). La formule du thiazole est C3H3NS. Il est ici privé de l’atome d’hydrogène sur son carbone 5 (thiazol-5-yl).

Ce thiazole est porteur de deux chaînes tertiaires. Un groupe méthyle en 4 et une nouvelle chaîne composée en 3 : une chaîne [3-[(4-amino- 2-methyl- pyrimidin-5-yl) methyl]. Nouvelle opération de décryptage. La racine est un groupe méthyle. Il est porteur d’une chaîne de rang 4, la chaîne 4-amino-2-methyl- pyrimidin-5-yl. C’est une chaîne construite à partir d’un cycle pyrimidine privé de l’atome d’hydrogène relié à son carbone 5 (pyrimidin-5-yl). Ce cycle porte un groupe méthyle en 2 et un groupe amine en 4. Elémentaire mon cher Watson !

Un dernier pour la route... L’un des vaccins proposé pour lutter contre la Covid 19 est contenu dans une enveloppe lipidique dont l’une des molécules est appelée ALC-0315. La dénomination UIPCA de cette molécule est bis(2-hexyldécanoate) de ((4-hydroxybutyl)azanediyl)bis(hexane-6,1-diyle).

Que peut on tirer de ce charabia ? Tout d’abord, qu’il s’agit d’un ester. L’acide à partir duquel est formé l’ester est un acide 2-hexyldécanoïque. L’acide décanoïque est l’acide carboxylique formé à partir du décane, un alcane à 10 atomes de carbne. Ce décane est porteur d’un radical hexyl (6 atomes de carbone) sur son carbone 2. Quant à l’alcool, c’est un hexane-6,1-diol, constitué d’une chaîne hexane porteuse d’une fonction alcool à chacune de ses extrémités. Ce que nous tirons également de ce nom, c’est que cette molécule d’ALC 0315 comporte deux esters de ce type, d’où les deux préfixes bis : bis(2-hexyldécanoate) et bis(hexane-6,1-diyle).

Mais ce n’est pas tout. On remarque en effet la présence du suffixe -diyle (hexane-6,1-diyle). Cela signifie que chacune de ces deux chaînes porte un autre groupe à son extrémité non occupée par la liaison ester. Quel est ce groupe ? Un (4-hydroxybutyl)azanediyl. Un azane est un dérivé de l’ammoniac, autrement dit un atome d’azote porteur de chaînes organiques. L’une d’entre-elles est un hydroxybutyl, c’est-à-dire un butane porteur d’un groupe hydroxyle sur son carbone 4. Les deux autres font référence aux liaisons avec les esters mentionnés ci-dessus. Elémentaire, mon cher Watson...

 

Index