Recherche:Corrélation entre les gènes de tRNAs des 3 domaines
- Article en préparation. Transfert du chapitre tRNAs 3.3.1.1.9
Introduction
modifier L'objectif de cette étude des tRNAs est de montrer qu'avec ces derniers, l'unicité de chaque codon, que j'ai étudiée précédemment avec les diagrammes et les corrélations des 111 bactéries, se confirme alors même que la théorie du RNA world essaye d'expliquer les comportements très variés des tRNAs sans faire intervenir les propriétés physiques de l'ADN. L'unicité de chaque codon apparaît clairement avec des études globales incluant les 3 domaines du vivant et des comportements d'ensemble qui ne tiennent pas compte des comportements individuels de chaque génome. Il serait simple de dire directement que cette unicité est le résultat de la sélection naturelle. Celle-ci doit de toute façon intervenir mais il serait aussi illogique d'ignorer complètement les propriétés physiques de l'ADN à qui j'attribue cette unicité dans le cadre de l'hypothèse de la résonance de l'ADN que j'ai émise dans l'article sur les répétition des bases dans l'ADN des procaryotes.
Je vais commenter les différents tableaux qui suivent et qui traitent du 'codon usage' (moyenne du codon), de son biais, de la corrélation entre les codons, du nombre de gènes de tRNAs et de leurs modifications. Pour finalement montrer l'unicité des codons et que beaucoup de faits qui apparaissent dans ces études ne peuvent être expliqués que par les propriétés physiques de l'ADN.
Les tableaux des nombres
modifierJ'ai reporté dans les 3 tableaux I100, II100 et III100, le nombre de gènes tRNA pour chaque codon, rapporté à un total de 100 000 tRNAs par domaine, respectivement pour les bactéries, les archées et les eucaryotes. Les 3 tableaux I1, II1 et III1 donnent l'indice de multiplicité ou nombre de gènes tRNAs par génome. Voir les tableaux.
- - Dans un 1er temps j'ai coloré en jaune les codons se terminant par t chez les bactéries. Chez les procaryotes ces gènes de tRNA sont presque inexistants (si on ramène les exceptions ctt, act et cgc chez les bactéries à 10 tRNas chacune (valeur la plus élevée des 13 autres codons) on obtient une fréquence de 3 pour 10 000. Chez les archées on obtient 6 pour 10 000.).
- - Puis j'ai constaté, chez les bactéries, que les codons se terminant par g viennent en second sauf pour les carrés ta tg ct cg at. J'ai coloré en cyan les nombres qui viennent en second chez les bactéries.
- - Enfin, en prenant pour référence les bactéries, j'ai gardé les mêmes couleurs chez les archées et les eucaryotes quand l'ordre du codon ne change pas et j'ai coloré en orange les nouveaux codons à faible effectif et en bleu les nouveaux codons dont l'effectif vient en second.
Les eucaryotes
modifierCette présentation en couleur montre clairement que les eucaryotes agissent sur les codons différemment des procaryotes. Bactéries et archées présentant à peine 3 changements de codon entre eux sur 62. C'est ainsi que
- - 7 codons se terminant par t deviennent majeurs et sont remplacés dans le même carré par des codons c (orange) à valeur la plus faible. Avec le carré cg qui n'a pas changé pour le codon t, nous nous retrouvons avec 8 carrés à codon c à faible valeur chez les eucaryotes.
- - Les 16 codons c (orange) ou t (jaune) à faibles valeurs des eucaryotes ont tous une fréquence équivalente aux 3 exceptions des bactéries, ctt cgc act. Leur fréquence globale (1943/115 111) de 169 pour 10 000, est 50 fois supérieure à celle des valeurs les plus faibles des bactéries, 3 pour 10 000.
- - 6 codons se terminant par g deviennent majeurs et sont remplacés par d'autres codons (bleu) à valeur seconde du même carré. Ce qui fait que les codons se terminant par g et à valeur seconde deviennent minoritaires (6 sur 15, 5 cyan et 1 bleu) alors que chez les bactéries ils étaient majoritaires (11 sur 15, cyan). Voir ordre des codons.
Les archées
modifierLa présentation en couleur différencie très peu bactéries et archées. Cependant les 3 changements observés sont de la même importance que ceux des eucaryotes mais dans le sens inverse; Puisque l'unique codon se terminant par t (cgt) majeur chez les bactéries devient mineur chez les archées et est remplacé par un codon c à l'inverse des mêmes changements chez les eucaryotes (les 7 codons se terminant par t qui deviennent majeurs) ; Et puisque aussi 2 codons, ctc et cga, sur 4 non g à valeur mineure deviennent majeurs et leurs codons associés, ctg et cgg, à valeur miajeure deviennent mineurs à l'inverse des mêmes changements chez les eucaryotes (les 6 codons se terminant par g qui deviennent majeurs). Ce qui fait que chez les archées, à part at ta tg tous les 13 carrés restant ont des codons g en valeur seconde et tous les codons t à valeur la plus faible. D'où une certaine uniformité. Les changements qu'on vient de décrire restent des exceptions du même ordre que celles des bactéries. Cependant une différence majeure apparaît entre bactéries et archées quand on considère l'ordre des codons dans un carré et leur variance, c’est l'uniformité qui caractérise les archées.
- - Variances des codons se terminant par la même 3ème base, voir tableau. La variance est très faible chez les archées ( elle est, en pourcentage % par rapport à la moyenne du codon, de 15-11-7 pour respectivement les codons se terminant par c a g), intermédiaire chez les bactéries (38-47-42) et très élevée chez les eucaryotes (99-88-80). Pour les codons se terminant par t la variance ne devient significative que chez les eucaryotes avec 97% par rapport à la moyenne, équivalant celles de c a g. Chez les eucaryotes le changement des codons se terminant par c en codons se terminant en t conduit à 2 groupes de 16 codons chacun, le groupe t1+c1 à faible valeurs constitué de 8 t et 8 c, et le groupe t2+c2 à fortes valeurs de même avec 8 t et 8 c. Le groupe t2+c2 est homogène avec une faible variance d’environ 27% par rapport à la moyenne, ce qui le rapproche des archées mais avec une multiplicité des codons a et g des eucaryotes, environ 15 contre 17. Alors que le groupe t1+c1 est aussi hétérogène que les codons a et g des eucaryotes (variance de 76% contre 88 et 80 respectivement pour a et g) avec une multiplicité de 0,8 proche de l’unité comme chez les archées.
- - Les changements d'ordre dans les carrés, voir tableau: 4 changements sur 12 dont 2 carrés correspondant aux changements majeurs qu'on a décrit précédemment entre bactéries et archées. Si on écrit dans l’ordre les 3 1ers codons, du même carré, suivant leurs valeurs seuls 2 nouveaux changements francs surviennent chez les archées par rapport aux bactéries, carrés aa et gt. Deux carrés, ct et cg correspondent aux 3 changements majeurs des codons que j’ai notés auparavant. Huit carrés restent inchangés sur 15 carrés considérés (sauf ta). Trois autres carrés, tc ag tg changent faiblement.
Les bactéries
modifierElles ont un comportement intermédiaire entre celui des archées et celui des eucaryotes. «Rappeler les mêmes constatations de l'article "répétition des bases».
- - Nous avons vu précédemment que les variances des codons se terminant par c a g, chez les bactéries, sont intermédiaires entre archées et eucaryotes.
- - Les bactéries ont 3 carrés, ct ac cg, qui présentent des nombres significativement grands de codons se terminant par t comme ceux des colonnes 1 et 2 des eucaryotes. Cependant seul le carré cg a un codon t très grand avec un indice de multiplicité de 1,85 juste en dessous des 9 valeurs supérieures à 2,17 sur 62 codons (voir les tableaux I1, II1 et III1). Le carré ct, bien que ne présentant pas les mêmes performances que cg, il se comporte comme lui notamment pour le codon se terminant par c, 2ème valeur après t, et qui prend la 1ère place dans ce carré chez les archées. Le carré ac est moins explicite mais il acquiert les codons t en grand nombre avec les eucaryotes, 1912, 3ème rang après gct avec 2573 et att avec 2109.
- - Les bactéries se distinguent par 5 autres carrés qui apparaissent difficilement chez les archées mais nettement chez les eucaryotes: les 4 carrés gx et le carré aa. Chez les bactéries, parmi les 10 codons a c de ces 5 carrés, 7 ont des nombres supérieurs à 3000, les plus grands des bactéries, et 7 indices de multiplicité les plus élevés des bactéries sur 9. En plus les 5 carrés ont des codons g parmi les 7 les plus faibles des bactéries ( nombres inférieurs à 1033, celui de aag).
- Chez les eucaryotes on retrouve les mêmes superlatifs, de ces 5 carrés, mais relatifs aux eucaryotes (nombres et indices) avec la caractéristique que tous les g deviennent majeurs avec les mêmes superlatifs. La conséquence c’est que 4 c et 2 a deviennent mineurs, 3 a et 1 c restent majeurs.
- - Comme chez les archées, chez les bactéries, les codons à valeur seconde, essentiellement, se terminent par g: 11 contre 13 chez les archées pour 15 carrés. Dans le tableau des variances qui montre l’uniformité des archées, la moyenne des codons se terminant par g des bactéries est la moitié de celles des codons a c qui sont égales entre elles. De même pour l’indice de multiplicité. Chez les archées, à cause de leur uniformité, la différence est nette mais beaucoup plus faible. Chez les eucaryotes ce sont les codons t c (même pour le groupe des valeurs les plus élevées) qui deviennent nettement plus faibles (moyenne et multiplicité) que les codons a g qui sont à égalité. Les bactéries ne se distinguent des archées que par l’uniformité de ces derniers, alors que les eucaryotes se détachent d’eux par leurs grandes variances et notamment celle des codons g.
- Les gènes des tRNAs (comparaison gènes protéiques et gènes de tRNAs dans Blogooolife[1]):
Similitude des comportements des codons dans les 3 domaines
modifier- Voir les tableaux des corrélations et leur légende. Les diagrammes des corrélations: Ba42 Ba62 Eb33 Eb52 Ea33 Ea53 .
- Corrélations entre nombre de tRNAs des 3 domaines A B E
- Liens: ordre des codons moyenne des codons E/B Totaux 1ère et 2ème valeur diagramme global.
Problématique
modifier- La similitude des comportements des codons dans 4 processus différents est le résultat de leurs comportements physiques dans l'ADN.
- − Si l'hypothèse de la résonance dans l'ADN était vraie on devrait dégager une similitude de comportement des codons indépendamment des processus qui agissent sur eux. J'ai démontré, dans l'étude des diagrammes étendus, que le comportement des codons n'était pas assujetti aux radicaux de leurs aas et que tout codon avait un comportement propre à lui. Avec l'étude du nombre des gènes des tRNAs dans les 3 domaines le comportement des codons n'est soumis qu'aux processus qui affectent l'ADN pour leurs duplications, sans considération des aas qu'ils codent. Ces processus sont différents dans les 3 domaines Bactéries Archées Eucaryotes comme nous l'avons vu en introduction. Du point de vue théorique ces 4 processus peuvent être différenciés comme suite:
- Les gènes de protéines sont soumis à la résonance de l'ADN entre le codon d'initiation et le codon stop, c'est ce que j'ai appelé la conformation du gène.
- Les gènes des tRNAs des eucaryotes, grâce à la membrane nucléique qui protège les RNAs, peuvent incorporer un intron entre les bases 36 et 37 ce qui change leur résonance dans l'ADN, les rend plus sensibles aux processus de duplication et permet la synthèse des tRNAs de codons se terminant par t une fois l'intron excisé.
- Les gènes des tRNAs des archées doivent être très robustes et nécessiter peu de transformations. Cette robustesse se traduirait par un gène tRNA par codon et pour tous les codons xyc,a, g. D'où l'uniformité constatée des tRNAs des archées (voir l'introduction aux tRNas, paragraphe archées) et seraient très peu sensibles au processus de duplication. Cette uniformité est due à l’architecture particulière de la membrane des archées.
- Les gènes des tRNAs des bactéries n'ont pas la protection de la membrane nucléique pour utiliser les introns à grand échelle ni la membrane des archées qui leur permet de survivre aux contraintes physiques extrêmes. Ils sont alors plus sensibles à la duplication et peuvent utiliser toute la gamme de résonance permise sans les introns. Cette résonance sans les introns permet la synthèse de gènes de tRNAs de codons se terminant par t mais leurs comportements ( ctt cgt) sont totalement différents de ceux des eucaryotes comme on le verra.
Méthode d'analyse
modifier- Les comportements des tRNAs des bactéries et des archées se ressemblent beaucoup. J'ai montré dans le tableau des ordres des codons qu'il n'y a que 4 carrés à changements nets dans les ordres des valeurs dont 2 carrés anormaux, 3 carrés à changements très faibles et huit sans changement du tout. C'est ce qui m'a poussé à faire les moyennes des codons par ligne. Il s'est avéré que, dans les 2 domaines, les codons se terminant par g sont nettement inférieurs aux c a qui se différencient très peu par leur moyenne. Ensuite j'ai estimé la variation (voir 1ère et 2ème valeur) entre les codons se terminant par c a. Bien que la différence entre a c chez les archées soit très faible ( différence et taux de variation) elle reste conséquente (moyenne des variations de 48% pour les bactéries et 18% pour les archées). Enfin le diagramme global des 3 domaines (sans les codons se terminant par t à très faibles valeurs, soit 44 codons restant) montre clairement qu'il y a une très bonne corrélation entre archées et bactéries.
- Permutations chez les eucaryotes: Il est difficile de trouver une similitude de comportement des eucaryotes avec les bactéries et les archées. On ne peut pas trouver de corrélation entre les nombres des tRNAs tant les changements des codons se terminant par c en t sont brutaux, nombreux et quasiment symétriques, et que les codons de la 4ème ligne gxy sont excessivement dupliqués.
- Les changements quasiment symétriques des c en t suggèrent cependant qu'on puisse permuter leurs valeurs pour chercher une corrélation entre codons des eucaryotes et les 2 autres domaines. En effet dans le tableau des moyennes des codons, les codons t qui sont devenus majoritaires ont un taux de variance faible, par rapport à leur moyenne 25%, proche de celle des archées et égal à celui des codons c qui n'ont pas changés. Leurs moyennes ne diffèrent que de 25% (1713 contre 2123). Voir les lignes t2 et c2 du tableau. De même pour les valeurs mineurs respectivement de ces codons, les moyennes ne diffèrent que de 8% et leurs taux de variance conformes à leurs faibles effectifs mais tous les 2 très élevés. Voir les lignes t1 et c1 du tableau.
- Retrait des changements élevés: En ce qui concerne les duplications excessives je les ai retirées de la corrélation. Elles sont au nombre de 12 entre eucaryotes et bactéries et de 10 seulement entre eucaryotes et archées car chez ces derniers la valeur excessive de cga chez les eucaryotes s'est uniformisée chez les archées et tgc n'est pas retiré selon un rapport E/A que je n'ai pas réalisé. Voir le tableau E/B pour les valeurs excessives. Le rapport E/B du codon cct (ou ccc pour les diagrammes) est de 16, celui de cag de 20 mais ces codons n'ont pas été retirés parce qu'ils influent très peu sur les coefficients de corrélation et de détermination comme on le constate sur les diagrammes Eb33 et Ea33 .
- Diagrammes après permutations et retraits: En fin de compte il reste 62 codons à corréler entre bactéries et archées, 50 entre eucaryotes et bactéries et 52 entre eucaryotes et archées, ensembles tout à fait comparables.
- Diagrammes après retrait des valeurs faibles: Pour pousser plus loin la comparaison j'ai réduit, dans un 2ème temps, les effectifs des codons à comparer en éliminant les faibles valeurs de nombres de tRNAs, car ces valeurs constituent un groupe très différent des valeurs élevées qui ont une grande signification statistique. En outre les 4 codons tga ata atg et tgc influent beaucoup sur les coefficients des 3 comparaisons (diagrammes Eb52 Ea53 Ba62 ) et ont donc été éliminés des groupes réduits. Le nombre de codons à corréler se réduit alors respectivement à 42, 31 et 32 pour les corrélations ci-dessus (voir respectivement les diagrammes Ba42 Eb33 Ea33 ). C'est moins que précédemment mais les comparaisons restent statistiquement valables.
Résultats
modifier- Voici ci-dessous tableau1 un condensé des corrélations des 3 combinaisons EB EA BA.
- Il y a bien corrélation forte pour 42 31 32 codons comparés respectivement des combinaisons BA EB EA, aux quels il faut ajouter gxa (3), gxb(4) et aag qui évoluent dans le même sens entre B A et E avec les exagérations qui les ont exclus. Il faut ajouter atg tga qui évoluent sans basculement dans leur carrés pour les 3 combinaisons. Ce qui fait finalement, en excluant les permutations, 43 28 28 codons qui évoluent dans le même sens. En excluant les permutations et atg tga ata tgc on n'a fait corréler respectivement que 42 18 18 codons pour BA EB EA.
- Pour les explications théoriques les processus se différencient encore plus par le comportement de ata, cga et tgc. Seul E active ata. La duplication de tgc est décuplée entre A et B et multiplié par 16 entre B et E. Pour cga, A le normalise par rapport à B, ce qui est conforme au processus de A. Mais pour B le couple cga/cgg se comporte comme le doublet cgt/cgc, il y a permutation. La permutation se fait dans le même domaine. Ainsi il y a permutation entre cgg et cga, dans B, car chacun se comporte à l'inverse de ses codons semblables (se terminant par la même base): cgg devrait avoir une valeur seconde comme les 9 autres xyg sur 11 si on exclut les exceptions tag, tgg et atg, ctg/cta ne permutant pas car ils sont à égalité (ce qu'on peut considérer comme une permutation neutre); cga devrait avoir une valeur élevée par rapport aux codons xyg comme les 12 autres xya. On peut faire le même parallèle pour cgt/cgt dans B et dans E, ce qui fait qu'il y a 8 permutations dans E et une dans B. Je définis la bascule comme l'inversion d'un rapport de 2 codons entre 2 domaines. La permutation est propre à un processus alors que la bascule définit la relation entre 2 processus.
- Tout ceci est clairement mis en évidence dans le tableau2 ci-dessous quand on compare les rapports g/a de B et E. Ainsi cgg/cga permute dans B avec un rapport de 3.78 et bascule entre B et E avec un rapport de 0.22 dans E. Ce rapport dans E est le plus petit devant ccg/cca avec 0.45. Le processus de E traite cga comme si c'était un xyg et l'augmente comme les gxg et aag, alors que les autres diminuent. Le processus E traite aussi cgg comme si c'était un xya et le diminue comme les xta et les xca. Par contre cgt/cgc ne bascule pas avec un rapport de 22.5 dans B et 27.8 dans E. Deux bascules de même importance que cgg/cga sont aag/aaa et gtg/gta qui se font dans le même sens que les bascules t/c. Mais les rapports dans E sont trop faibles pour une permutation. Les rapports du tableau2 sont faits à partir des tableaux I1 et III1 des nombres de tRNAs par génome.
Critiques
modifier- − Avec les codons de gènes de protéines j'avais démontré l'unicité de chaque codon. Ici avec les corrélations seuls 28 codons répondent au test de l'unicité des 3 processus de l'ADN. Par ailleurs je n'arrive pas à comprendre que le tRNA ata n'existe quasiment pas chez les A et B alors qu'en principe le codon ata devrait être traduit par le tRNA atg comme pour les aas à 2 codons. Le nombre élevé des tRNAs atg laisse penser que c'est le cas, mais il faut alors une modification drastique pour l'habiller en Ile. C'est ce qui se passe chez E.Coli comme on le verra dans les modifications(ref.). Par ailleurs, nous le verrons dans les tRNAs super wobbles (Nombres de tRNAs des_4032_bactéries tableau II), 2 % des bactéries utilisent le seul gène tRNA atg pour traduire les 4 codons du carré at.
Hypothèses
modifier- − Ces remarques sur les 3 processus, les nombreux cas particuliers et le codon ata m'a amené à remettre sur le tapis la résonance dans l'ADN. En tenant compte que mêmes les toutes petites différences des nombres chez les A jouent un rôle dans les corrélations précédentes, il est évident qu'un 5 ème processus est en jeu dans les faibles codons. Ce processus serait très peu sensible à la création des gènes tRNAs mais il serait valorisé par les processus de duplication chez les eucaryotes qui augmentent notablement les codons faibles. Avec l'hypothèse de la résonance je stipule que tout gène tRNA a une résonance et en particulier son codon aussi. Il suffit que le processus de duplication soit assez robuste pour le révéler. Je conçois alors le codon dans le tRNA comme un codon d'un polypeptide réduit à 1 seul aa. Aussi les 64 codons peuvent être étudiés, non seulement par rapport à leur 3ème base, mais par rapport aux 3 bases. Ce qui m'a ramené à étudier les triplets (et non le code génétique défini pour la traduction) suivant la 1ère base (ligne) et la 2ème base (colonne). L'entité de base sera alors le carré à 4 codons. Si l'hypothèse de la résonanse est vraie alors le tableau des triplets, dans l'ADN et non en relation avec la traduction, sera structuré en lignes et colonnes de forces différentes comme je l'ai décrit dans répétitions des bases (ref.). C'est cette structuration que je décris dans l'analyse des tableaux des nombres et des totaux. Je comparerai, ensuite, en détail les codons dans toutes les combinaisons 2 à 2 pour montrer que chaque codon est unique. La comparaison du processus qui détermine les codons dans les protéines (codon usage) avec les processus dans l'ADN que nous venons de voir sera abordé avec l'étude spécifique des 111 bactéries des diagrammes étendus et les gènes des tRNAs du domaine bactérien.
g/a | B | E | B | E | B | E | B | E | |||
---|---|---|---|---|---|---|---|---|---|---|---|
tt | 0.84 | 1.40 | tc | 0.49 | 0.72 | ta | − | − | tg | 3.32 | 7.10 |
ct | 1.05 | 1.49 | cc | 0.40 | 0.45 | ca | 0.37 | 0.81 | cg | 3.78 | 0.22 |
at | 328 | 4.54 | ac | 0.47 | 0.56 | aa | 0.27 | 2.30 | ag | 0.72 | 0.73 |
gt | 0.15 | 2.87 | gc | 0.12 | 0.62 | ga | 0.14 | 0.53 | gg | 0.41 | 1.27 |
Diagramme | Eb52 | Eb33 | Ea53 | Ea33 | Ba62 | Ba42 |
---|---|---|---|---|---|---|
R2 | 81.7 | 56.8 | 76.3 | 58.0 | 75.0 | 60.3 |
corrélation | 90.4 | 75.4 | 87.4 | 76.2 | 86.6 | 77.7 |
codons | 50 | 31 | 52 | 32 | 62 | 42 |
Lien avec l'article des codons de protéines
modifier- Lien: Corrélation entre les codons dans les gènes de protéines. Ce lien est fait le 6.4.19 Tanger
Nombre de tRNAs et solitaires
modifier- Le tableau
Calcul de la multiplicité des tRNAs
modifier- Le tableau
Comparaison des codons par les 2 1ères bases
modifier- Le tableau
Au niveau de l'ADN le code génétique est structuré par doublets.
modifier- Lien au tableau analysé: Effectifs des gènes de tRNAs.
- La genèse des gènes de tRNAs et leur duplication
Problématique
modifier- − Nous avons vu dans le tableau des corrélations (3.Résultats/1.−) entre gènes de tRNAs qu'il y a une très forte corrélation entre 18 codons pour les 3 combinaisons des 3 domaines BAE. Malgré les fortes corrélations obtenues entre un plus grand nombre de codons pour certaines combinaisons, il reste un très grand nombre d'exceptions, jusqu'à 44 pour les combinaisons EB et EA. Cependant les 18 codons précédents laissent penser que le comportement d'un gène de tRNA dans le code est déterminé dans l'ADN avant même son intervention dans la machinerie traductionnelle. Pourtant, même dans l'hypothèse de la résonance dans l'ADN, celle d'un codon dans les gènes de protéines, fraction de la résonance du gène protéique, ne peut être comparée à celle de l'unique codon porté par son gène tRNA. La question qui se pose alors est: est-ce qu'on va retrouver la même structuration du code génétique par les gènes des tRNAs que par les codons dans les gènes protéiques? Si c'est oui, alors l'hypothèse de la résonance des gènes protéiques se trouve renforcée parce qu'il n'y a pas de lien direct, si ce n'est la sélection, entre le gène du tRNA dans l'ADN et son codon dans le gène protéique.
- − Les différences entre les processus qui interviennent dans la création et la duplication des gènes de tRNAs entre les 3 domaines permettent de mettre à l'épreuve la structuration du code génétique par ces processus. Un aperçu des processus théoriques est signalé dans la problématique du tableau des corrélations. L'analyse des tableaux des nombres des gènes des tRNAs en introduction montre bien qu'il y a de grandes différences entre les processus des 3 domaines.
Méthode d'analyse
modifier- − Comme pour les corrélations entre nombres de gènes de tRNAs il s'agit de retrouver une indépendance de la structuration du code par les doublets, par rapport aux 3 processus différents des 3 domaines, pour qu'on puisse attribuer cette structure aux propriétés physiques de chaque doublet. La méthode d'analyse consiste à dégager des propriétés communes à 4, 3 ou 2 doublets d'une ligne ou d'une colonne. Comme pour les répétitions des bases la force d'interprétation est attribuée aux lignes ou colonnes ayant le plus de doublets communs.
- − En introduction j'ai détaillé la méthode de lecture des 3 tableaux I, II et III indicés par 100 pour les nombres de tRNAs rapportés à 100 000 par domaine. J'utiliserai les 3 tableaux I, II et III indicés par le chiffre 1 pour le nombre de gènes de tRNAs par génome ou indice de multiplicité et les tableaux des rapports E/B . Au fur et à mesure j'illustrerai les discussions par des tableaux simples de rapports entre codons. Pour simplifier l'écriture je parle souvent de codon pour les gènes de tRNA. Je préciserai qu'il s'agit de la traduction le cas échéant.
- − Dans un 1er temps je décrirai la structuration de chaque code de chaque domaine en commençant par les structures les plus nettes et les comparerai au code génétique de la traduction. Je n'attribue un aa à un codon que pour le code de la traduction. Aussi la comparaison avec ce dernier ne se fera que par doublet ( ou carré à 4 codons).
- − Dans un 2ème temps je procéderai aux comparaisons entre codes pour dégager une structuration commune.
Résultats
modifier
Code du domaine E, les eucaryotes.
modifier1.a − les bascules des codons c en t chez E
modifier- Le processus qui donne naissance aux gènes de tRNAs chez les eucaryotes est sensible aux codons se terminant par t des doublets ct at gt xc cg; il est sensible aux codons se terminant par c des doublets tt xa tg ag gg. Ce qui donne 8 gènes à codons xyt et 8 gènes à codons xyc sensibles. Visuellement le code est structuré en colonnes, la 1 avec 3 doublets et la 2 avec 4 doublets sensibles aux codons se terminant par t, et la colonne 3 avec 4 doublets et la 4 avec 3 doublets sensibles aux codons se terminant par c. Il est aussi structuré en lignes, la 1 et la 2 avec 3 doublets chacune sensibles aux codons se terminant par t ou c, et la 3 et la 4 chacune sensible à 2 doublets de codons se terminant par t et à 2 doublets de codons se terminant par c
- Si l'on compare au code génétique de l'amino-acylation, il y a une très grande similitude entre les 2 processus. Les enzymes qui fixent l'aa au tRNA après les modifications ne distinguent pas les tRNAs d'un doublet ct gt xc cg gg quand ce doublet en a plusieurs. Après traduction les 4 codons d'un même doublet de ce groupe donnent donc le même aa. Les enzymes qui fixent l'aa au tRNA des doublets tt at xa tg ag distinguent, pour le même doublet, entre les tRNAs d'un demi doublet portant les codons se terminant par t c, des tRNAs de l'autre demi doublet portant les codons se terminant par a g. Chaque demi doublet pouvant produire 1 à 2 tRNAs portant le même aa. Après traduction un doublet de ce groupe donne 2 aas sauf pour le doublet ta.
- La similitude entre les 2 processus n'est pas totale puisque le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). Inversement le doublet at appartient au 1er groupe de genèse (sensible à att) et au 2ème groupe de fixation (fixant 1 aa par demi-doublet at). C'est seulement avec les eucaryotes que le doublet gg apparaît nettement comme une exception. Avec seulement les nombres de tRNAs, ce doublet n’apparaît pas comme une exception dans les tableaux I et II. Apparaissent par contre comme exception, dans les 9 tableaux des nombres, les 3 mêmes doublets at ta tg. Ainsi le doublet gg fait exception pour le basculement c/t, le doublet tg fait exception pour le nombre de tRNAs de son codon tga, le doublet ta pour ses 2 codons stop et le doublet at 3 fois exceptionnel par le nombre de tRNAs de son codon atg dans les 3 tableaux, par le nombre de tRNAs de son codon ata dans les tableaux I et II seulement, et par la bascule c/t dans le tableau III.
- Le code de la genèse des tRNAs chez les eucaryotes est structuré aussi en demi-doublets: La structuration en demi-doublet dans le processus de fixation est matérialisée par la traduction d'un doublet en 2 aas différents, un aa pour les codons se terminant par c t et un aa pour les codons se terminant par a g. Cette structuration n'est valable que pour les doublets tt at xa tg ag. Avec la bascule c/t chez les eucaryotes tous les doublets sont structurés en demi-doublet c t et en demi-doublet a g. Par contre cette structuration n'est pas matérialisée pour les 2 processus de genèse et de fixation. Le processus de fixation n'a à sa disposition souvent qu'un à deux tRNAs par doublet et nécessite un processus supplémentaire pendant la traduction sur le RNAm pour le codon tga , et un processus spéciale de modification, avant celui de la fixation, pour différencier 2 tRNAs identiques du codon atg qui fixeront l'un Met lisant le codon atg et l'autre Ile lisant le codon ata. Ainsi la structuration en demi-doublet est potentielle pour le processus de fixation et se réalise avec la traduction. La structuration en demi-doublets du processus de genèse est la manifestation directe de la bascule c/t pour les 8 doublets concernés, du fait que les demi-doublets a g ne basculent pas. La structuration des autres 8 doublets ne basculant pas, se déduit du comportement semblable des demi-doublets c t des 2 groupes avec une grande différence entre le nombre des tRNAs du codons c et celui du codon t mais de sens inverse dans les 2 groupes. Les différences entre les nombres des codons a g sont beaucoup plus faibles, semblables et des 2 signes dans les 2 groupes. Voir le tableau des rapports des Demi-doublets à la suite du texte, où les rapports colorés sont des rapports inversés. Les exceptions des doublets at ta tg qu'on a révélé au paragraphe précédent met en jeu les 2 codons des 3 demi-doublets a g et aucun des 3 demi-doublets c t.
1.b − les codons a et g de E
modifier- Les rapports g/a: Avec la bascule t/c nous avons défini les demi-doublets dans chaque doublet et partagé le code des gènes de tRNAs en 2 groupes dont les rapports t/c sont inversés l'un par rapport à l'autre. En utilisant les rapports g/a nous obtenons alors 4 groupes qui se différencient par des rapports t/c pour moitié inverse l'une de l'autre et de même pour le rapport g/a. Les 4 groupes de doublets se répartissent comme suite: voir le tableau.
- 4 dont les rapports t/c et g/a sont directs ( blanc, blanc).
- 3 dont le rapport t/c est direct et le rapport g/a inversé (blanc, cyan).
- 3 dont le rapport t/c est inversé et le rapport g/a direct (orange, blanc).
- 5 dont le rapport t/c est inversé et le rapport g/a inversé (orange, cyan).
- Plus le doublet ta avec ses 2 codons stop (blanc).
- Lignes et colonnes: Avant de détailler les caractéristiques de chaque doublet au paragraphe suivant on peut apprécier le poids de la 1ère et la 2ème base du doublet, du point de vue quantitatif, en étudiant les statistiques des lignes et des colonnes du tableau. Il est évident que le doublet ne peut être caractérisé que du point de vue qualitatif, c'est-à-dire avec des nombres et des rapports très différents. Le tableau des moyennes des codons pour une 3ème base, pour une ligne et pour une colonne, et les totaux par doublet, différencie nettement la ligne 4 par rapport aux 3 autres avec tous les codons ayant des effectifs les plus élevés de leur colonne dans le tableau des nombres III. C'est le reflet de la base G en 1ère position. Ce tableau différencie aussi nettement la colonne 3 avec les mêmes critères sauf pour le doublet ta avec ses 2 codons stops. Les lignes 1 et 2 avec des moyennes de codon (mcod) très faibles se ressemblent beaucoup et de même pour les colonnes 1 et 2 avec des moyennes faibles. Les rapports des moyennes de codon pour les 3ème bases a et g, g/a , sont inverses entre les 2 lignes d'une part et les 2 colonnes d'autre part. La ligne 3 et la colonne 4 ont des moyennes de codon élevées avec des différences faibles entre les moyennes de codon pour les 3ème bases a et g.
- Caractérisation des codons: quand les rapports g/a sont semblables entre 2 doublets, je comparerai leurs effectifs.
- − Les 4 doublets ( blanc, blanc):
- tt : son g/a (1.4) est très différent de ceux de tg(7.1) et aa (2.3) mais proche de gg (1.3); tt (1085/773) et gg (6126/4811) sont très différents par leurs effectifs.
- tg : son g/a (7.1) est le plus élevé du tableau à cause de la particularité du codon tga à faible effectif. Son t/c (12) le plus faible du tableau.
- aa : son g/a (2.3) est élevé, 5ème sur 15. aa se distingue par rapport à gg par son codon aaa très faible (5268/2293).
- gg : il se distingue des 3 autres par ses effectifs élevés (6126/4811) qui le différencient du rapport g/a de tt (1085/773) et de celui de ca (1606/1989) trop proche de l'unité (1.2) qui ne justifierai pas son inversion.
- − Les 3 doublets ( blanc, cyan):
- ca: a le rapport g/a (1.2) le plus faible du tableau et se distingue de ag (1.4) par ses effectifs nettement plus élevés (1606/1989) contre (1531/1116).
- ag: il se distingue de ca comme ci-dessus et de ga par son rapport g/a 1.4 contre 1.9, le 6ème sur 15, et par ses effectifs 1531/1116 contre 6150/3261.
- ga: il se distingue des 2 autres par ses effectifs , 6150/3261, et son rapport g/a (1.9).
- − Les 3 doublets (orange, blanc): ct at gt. Ils se différencient par leur effectif du codon g respectivement 1126 3355 2713 et un codon a presque constant, respectivement 758 739 945. C'est la différenciation des colonnes 1 et 2 par le rapport g/a.
- − Les 5 doublets (orange, cyan):
- gc cg se distinguent des 3 autres par le rapport t/c (7.3) le plus bas du tableau pour gc et le rapport g/a inverse (4.5) le plus élevé du tableau pour cg.
- tc cc ac: La distinction par le rapport g/a est nette, respectivement 1.4, 2.2, 1.8. Ils appartiennent à la colonne 2 inverse pour le rapport g/a de la colonne 1. Et de même le codon g est constant comme le codon a de la colonne 1. Mais en plus le doublet tc se distingue par un codon a le plus faible de la colonne 2 et proche de ceux de la colonne 1; le doublet cc a la particularité, dans tout le tableau, d'avoir les codons cct et cca égaux (3/1426); la différence entre 2 codons qui vient après est celle entre cac et cag (26/1606).
- − Les 4 doublets ( blanc, blanc):
1.c − les exceptions des eucaryotes
modifier- L'exception du doublet cg: La caractérisation des codons en demi-doublets dans E est structurelle. C'est-à-dire que les comparaisons entre 2 codons t-c (xyt et xyc) et 2 codons a-g (xya et xyg) ont un sens alors que celles entre les paires t-a, t-g, c-a et c-g n'en ont pas. Ce sens est celui de la bascule, " c/t bascule et a/g ne bascule pas". Une seule exception qui confirme la règle est celle du doublet cg où a/g bascule alors que c/t a déjà fait sa bascule dans B. Nous verrons ce cas en comparant les codes de B et A à celui de E, car c'est un cas isolé difficile à révéler avec les eucaryotes seuls. L'exception du doublet cg apparaît dans le code de B avec la bascule c/t et l’exception disparaît dans E et A. Cette disparition de A fait partie aussi de son exceptionnalité. L'exception de cg dans le code de E c'est sa bascule a/g entre le code B et E alors que sa bascule c/t est une exception dans B et ne l'est plus dans E. La bascule a/g de ce doublet de 4.5 est faible par rapport aux bascules c/t, et au début je la considérait comme une non bascule dans E. Mais c'est la 2ème valeur de ce rapport avec celle du doublet at (4.5), derrière celle du doublet tg (7.1) et devant celle du doublet gt (2.9). Elle est comparable à la bascule c/t la plus faible du doublet gc (7.3). Les rapports g/a du doublet tg et du doublet at ne peuvent pas être considérés comme des bascules parce qu'ils ne s'inversent pas dans aucun code. En conclusion le doublet cg est 3 fois exceptionnel, par sa bascule c/t dans B, la disparition de celle-ci dans A et par sa bascule a/g dans E.
- L'exception du doublet ta: ce sont les 2 codons stop qu'on connaît dans la traduction et présents dans les 3 code BAE. Absence totale de gène tRNA sinon par mutation d'un autre gène en suppresseur de codon stop.
- L'exception du doublet tg: le gène de tRNA de son codon tga est souvent absent et le codon devient un codon stop dont son comportement vis à vis du processus GC est lui-même une exception. Quand il est présent il code un tRNA de l'aa Sec. Ce qui explique le rapport de 7.1 de son a/g à peu près constant dans les 3 codes car le gène tRNA du codon tgg du Trp est toujours présent. Dans la traduction le tRNA-Sec nécessite une séquence spécifique dans le RNA messager pour pouvoir lier son aa au polypeptide, ce qui le différencie d'un codon stop. D'où 3 comportements exceptionnels du doublet tg.
- L'exception du doublet at: Il subit la bascule c/t dans E, donc il est sensible au codon att pour le processus de genèse des tRNAs et appartient au 2ème groupe de fixation des aas (fixant 1 aa par demi-doublet at). Il ne subit pas la bascule a/g mais son codon ata a un indice de multiplicité normal pour le code E de 5.5 alors qu'il est inexistant dans B et A comme leurs codons xyt. Nous pouvons dire qu'il est sensible au processus de la genèse des tRNAs sans basculer. Le rapport g/a du doublet at est de 4.5, égal à celui du doublet cg. Je suppose que les tRNAs ata fixent l'aa Ile chez les eucaryotes. A vérifier. Une 3ème exception du doublet at est le nombre élevé des gènes de tRNA du codon atg même chez les eucaryotes. Chez les procaryotes ces tRNAs fixent la Met et la formyl-Met nécessaire à l'initiation de la traduction et fixent après une modification spéciale Ile et lit le codon ata. D'où un nombre double de celui des eucaryotes. Chez ces derniers l'aa d'initiation est Met mais le nombre de gènes de tRNAs du codon reste élevé. Il est le plus élevé de la 1ère colonne et le 2ème de sa ligne ( 3355 pour atg contre 5268 pour aag, voir tableau des effectifs). C'est comme si, les tRNAs de ata étant présents, les tRNAs de atg étaient modifiés différemment, une moitié servirait à lire le codon atg dans le gène de protéine et l'autre ne servirait qu'à l’initiation. Nous avons, encore là, 3 exceptions pour le doublet at, la bascule c/t, la pseudo-bascule g/a de at et son comportement, et enfin le nombre élevé des tRNAs du codon atg.
- L'exception du doublet gg: Nous avons décrit cette exception comme propre aux eucaryotes dans l'étude de la bascule c/t. Le doublet gg appartient au 2ème groupe du processus de genèse (sensible à ggc) et au 1er groupe du processus de fixation (fixant le même aa sur tous les tRNAs du doublet). J'ai étudié en détail la fréquence des répétitions de la base G et celle de la base C qui incluent essentiellement les codons ggg et ccc, dans l'article répétition des bases. Développer.
- L'exception du doublet cc: Il faudrait reprendre les comportements du codon ccc de l'article répétitions des bases en relation de ceux du codon ggg. Mais dans E l'égalité des nombres de tRNA du codon cct et du codon cca est troublante.
2.− Code du domaine B, des bactéries
modifier2.a − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en demi-doublets
modifier- Ce n'est pas aussi spectaculaire que chez les eucaryotes et l'on n'arrivera pas à distinguer le doublet gg comme une exception. Cependant la démonstration est plus aisée qu'avec les archées, très homogènes, où la distinction d'un doublet en 2 moitiés n'est possible qu'en s'appuyant sur le comportement des enzymes qui fixent l'aa sur le tRNA pour 8 doublets. Pour les bactéries je vais utiliser l'indice de multiplicité du tableau I1 , ainsi que la bascule c/t du doublet cg pour montrer cette partition.
- Des indices de multiplicité très faibles, inférieurs à 0.34, conjugués à l’absence des gènes de tRNA des codons se terminant par t (et se terminant par c pour le doublet cg) laissent 3 doublets à 2 aas ( tg at ga ) et 3 doublets à 1 aa ( cg gc gt ) avec 2 codons seulement dont l'indice dépasse largement l'unité ( sauf pour le codon cgg avec 0.83). Quatre autres doublets ont un indice du codon se terminant par g inférieur 0.60, soit seulement un plus que la moitié des indices des codons a et des codons c . Ce sont 2 doublets à 2 aas ( ca aa ) et 2 doublets à 1 acide aminé ( cc gg ). C'est comme si on avait 2 demi-doublets distincts, l'un sans gène de tRNA du codon t et l'autre avec un gène de tRNA du codon g très peu sensible à la duplication. Le doublet cc présente la caractéristique unique des doublets à 1 acide aminé d'avoir 1 seul codon dont l'indice est supérieur à l'unité (avec 0.68 pour le codon ccc) ce qui laisse penser qu'un seul tRNA puisse lire les 4 codons du doublets et serait donc à l'encontre de l'hypothèse du demi-doublet. Mais c'est l'exception qui confirme la règle:
- − Le doublet ta, avec un seul tRNA pour un demi-doublet ne code qu'un seul acide aminé.
- − Pour le doublet at et le doublet tg, le codon minoritaire est le codon a et il est remplacé par le codon g et non par le codon t. Donc le processus de genèse des tRNAs différencie bien entre les 2 demi-doublets.
- − Le doublet cg subit une bascule c/t très nette avec un rapport t/c égal à 22 (voir tableau des demi-doublets) et simultanément subit une bascule g/a franche avec un rapport g/a égal à 3.8 aussi élevé que celui de la même bascule du doublet tg (3.3). C'est comme si le demi-doublet t/c et le demi-doublet a/g étaient bien distincts. N'oublions pas que nous parlons de gènes et non de tRNAs portant un acide aminé.
- − Le tRNA du codon peut très bien être absent et celui-ci lu par un autre tRNA. Cela n'empêche pas que le processus de genèse des tRNAs soit plus ou moins sensible au codon ccc.
- − Par contre quand les codons du même demi-doublet ont des indices proches ou supérieurs à l'unité, cela veut dire que c'est une contrainte forte qui nécessite les 2 tRNAs en même temps. C'est ce qu'on observe chez les archées (13 doublets avec 3 indices proche de l'unité) et les eucaryotes (avec 5 doublets à 4 indices et 10 doublets à 3 indices proches de l'unité). Dans le cas des bactéries on a 3 doublets qui font exception et imposent 3 tRNAs, ce sont le doublet tt (indices 1.51 1.18 0.99) et le doublet ag (indices 1.10 1.19 0.86) pour 2 aas et le doublet ct (indices 0.95 1.23 1.29) pour 1 seul acide aminé.
- Des indices de multiplicité très faibles, inférieurs à 0.34, conjugués à l’absence des gènes de tRNA des codons se terminant par t (et se terminant par c pour le doublet cg) laissent 3 doublets à 2 aas ( tg at ga ) et 3 doublets à 1 aa ( cg gc gt ) avec 2 codons seulement dont l'indice dépasse largement l'unité ( sauf pour le codon cgg avec 0.83). Quatre autres doublets ont un indice du codon se terminant par g inférieur 0.60, soit seulement un plus que la moitié des indices des codons a et des codons c . Ce sont 2 doublets à 2 aas ( ca aa ) et 2 doublets à 1 acide aminé ( cc gg ). C'est comme si on avait 2 demi-doublets distincts, l'un sans gène de tRNA du codon t et l'autre avec un gène de tRNA du codon g très peu sensible à la duplication. Le doublet cc présente la caractéristique unique des doublets à 1 acide aminé d'avoir 1 seul codon dont l'indice est supérieur à l'unité (avec 0.68 pour le codon ccc) ce qui laisse penser qu'un seul tRNA puisse lire les 4 codons du doublets et serait donc à l'encontre de l'hypothèse du demi-doublet. Mais c'est l'exception qui confirme la règle:
2.b − Le code de la genèse des tRNAs chez les bactéries est structuré aussi en lignes et colonnes
modifier- − Codons xyg: Voir tableau des nombres de gènes de tRNA. Avec les bactéries la majorité des codons xyg (11 sur 15) sont minoritaires dans leur doublet. Comme les codons xyt sont presque inexistants il ne nous reste plus que 3 codons par doublet à comparer. Par leur faiblesse les codons xyg deviennent homogènes et nous permettent alors de différencier les colonnes 2 par 2 et la ligne 4 par rapport aux 3 autres lignes. C'est ainsi que les colonnes 1 et 4 ont chacune 3 codons xyg à effectif élevé ( 1702 2207 7670, 1858 1427 1469 ) alors que les colonnes 2 et 3 ont 7 codons g à effectif faible ( 521 - 1174 ) et la ligne 4 a 4 codons à effectif faible ( 964 - 521 ).
- − Codons xya et xyc: J'ai conçu 2 tableaux spécialement pour ces codons, lignes colonnes c − a des bactéries, pour les faire ressortir. Les 16 codons xyt (cgc permuté avec cgt) forment un groupe homogène à très faibles effectifs; les 14 codons xyg (sans atg) forment un groupe homogène aux effectifs faibles dont seulement ttg tgg ctg dépassent 1638 (effectif du codon cta) et se structurent en ligne colonne comme on l'a vu précédemment ci-dessus. Par contre je n'arrive pas à séparer les codons xyc des xya. Les codons xyc se divisent en 2 groupes, un de 8 codons à effectifs élevés de 1638 (cta) à 2006 (cac) et un de 7 codons à effectifs très élevés de 2598 (ttc) à 3946 (ggc). De même pour les codons xya on a, respectivement, un groupe de 6 codons de 2021 (tta) à 2347 (gga) et un groupe de 6 codons de 2501 (aca) à 4334 (gca). Le seul codon qui empiète sur la gamme des effectifs des codons xyg est ccc avec 1167. L'exclusion du codon cga vient du fait qu'il est très faible chez les bactéries et qu'il bascule avec le codon cgg quand on passe des bactéries aux eucaryotes.
- Les codons à effectifs très élevés, homogènes et communs aux codons xyc et xya font qu'on ne peut pas séparer ces derniers en 2 groupes homogènes. Aussi ils sont analysés ensemble. Le résultat intéressant qui ressort de cette analyse, c'est la distinction nette entre les colonnes 2 et 3 d'une part et l'équivalence des colonnes 1 et 4, ce que la structuration en lignes et colonnes 121 eucaryotes, englobant tous les codons, ne montre pas. Par contre les lignes des xya et xyc confirment l'équivalence des lignes 1 et 2 d'une part et 3 et 4 d'autre part.
- Les 8 codons à effectifs très élevés, entre 3729 et 4334 (à part atg), seraient la manifestation de la résonance dans l'ADN chez les bactéries comme cela est supposé dans le cadre de cette hypothèse (ref.) par le grand saut entre tac (2732) et aac (3729). Le cas de cgt (3129), intermédiaire, serait du à la permutation cgt/cgc, processus unique chez les bactéries.
2.c − Les exceptions dans le domaine B des bactéries
modifier- − En construisant le tableau des ligne et colonne, j'avais tenu compte, dans un 1er temps, des exceptions que j'avais décrites dans le chapitre des eucaryotes (ref.). En ajoutant les exceptions propres au domaine B il m'est apparu, qu'en fait, tout doublet est caractérisé par sa ligne et sa colonne avec les 2 processus de genèse des tRNAs des domaines E et B. Aussi, je n'ai retiré, dans le tableau que 4 codons: taa tag pour les 3 domaines et ata atg pour les 2 domaines B et A seulement parce que les 2 1ers sont des codons stop, que le codon ata ressemble par sa faiblesse (comme les codons xyt des domaines A et B) à un codon stop et qu'enfin le codon atg, associé au même demi-doublet que ata et avec des effectifs élevés dans A et B, pouvait être retiré de ces 2 domaines comme le codon ata. J'ai gardé le codon ata et le codon atg dans le domaine E parce qu'ils ont des effectifs analogues aux autres codons de E.
- − Nouveaux comportements des exceptions déjà décrites dans le domaine E:
- ta: rien de nouveau.
- tg: le codon tgg augmente légèrement son effectif par rapport à celui du domaine E et apparaît comme un codon xyg majeur dans B (effectif dans B, 1.858).
- gg: il n'est plus une exception dans B, car il n'a pas de sensibilité au codon ggt (gène tRNA) et code 1 seul aa (amino-acylation).
- cc: il n'y a plus égalité entre cct et cca, mais il y a faiblesse et presque égalité entre ccc et ccg. J'ai utilisé ce changement pour montrer la partition en demi-doublet dans le domaine B.
- cg: La bascule c/t apparaît dans le domaine B et est maintenue dans le domaine E. Le rapport g/a s'inverse dans B par rapport à E et cgg devient majeur (effectif dans B, 1.427) parmi les codons xyg de B. Le codon cgg lui même devient une nouvelle exception dans B. Son effectif est réduit de 69% et celui du codon cga associé à son demi-doublet est multiplié par 5 dans E. C'est l’effet de la bascule g/a.
- at: redevient normal pour la sensibilité au codon att du fait qu'il perd cette sensibilité (gène tRNA), comme le doublet gg et qu'il code 2 aas (amino-acylation). Par contre le codon ata devient inexistant, équivalent à un codon xyt, le codon atc et le codon atg voient leurs effectifs doublés par rapport au domaine E. Les tRNAs du codon atg semblent subir 3 types de modifications, une pour fixer Met, une pour fixer formyl-Met comme tRNA d'initiation de la traduction chez les procaryotes et une pour fixer Ile. D'où le doublement de son effectif dans B et apparaît comme un codon xyg majeur dans B (effectif dans B, 7.670).
- − Nouvelles exceptions dans le domaine B:
- ct: il apporte 2 nouvelles exceptions. L'effectif du codon ctt devient aussi significatif que le codon cgc dans B, mais il n'y a pas bascule. Et le codon ctg devient majeur (effectif dans B, 2.207) parmi les codons xyg de B. L'effectif du codon ctg est réduit de 50% et celui du codon cta associé à son demi-doublet est réduit de 65% dans E.
- tt: son codon ttg est un codon xyg majeur dans B (effectif dans B, 1.702). Son effectif est réduit de 37% et celui du codon tta associé à son demi-doublet est réduit de 62% dans E.
- ag: il arbore le même comportement que le doublet tt. Son codon agg est un codon xyg majeur dans B (effectif dans B, 1.469). Son effectif est réduit de 25% et celui du codon aga associé à son demi-doublet est réduit de 27% dans E.
- tc: L'exception n'apparaît qu'en comparant B avec E. Son codon tca paraît banal dans B et dans E parmi les autres codons xya. Mais son effectif est réduit de 61% dans E par rapport à B. L'effectif de son codon tcg associé au demi-doublet est lui réduit de 43%.
- − Les aas à 6 codons: Avec le processus de genèse des tRNAs dans E j'avais trouvé que la sensibilité à la bascule c/t était associée aux doublets à 1 acide aminé sauf pour le doublet gg. Dans B le processus de genèse différencie entre codons xyg majeurs (6) et mineurs (9). Et 4 codons xyg majeurs se trouvent associés aux aas à 6 codons, 2 pour la Leu (ttg ctg) et 2 pour l'Arg (cgg agg). La Ser avec 6 codons ne suit pas. Elle se distingue par le fait qu'elle n'a pas 2 codons xyg et son codon tca qui est réduit fortement.
- − Les comportements différents des demi-doublets a g et des demi-doublets t c:
- Les demi-doublets t c réagissent fortement, par la bascule c/t, au processus de genèse des tRNAs des eucaryotes (7 cas) et peu à celui des bactéries (1 cas).
- Par contre les demi-doublets a g réagissent aux 2 processus par des bascules a/g plus modérées que les bascules c/t, par des exceptions communes aux 2 domaines (tg où tga est faible, at où ata est quasiment inexistant dans B et ta avec les 2 codons stop) et par des réductions et des augmentations de forces variées des codons xyg et/ou xya. C'est ainsi que les exceptions apparaissent toujours avec les demi-doublets a g sauf pour le doublet cc où les 2 codons sujets de l'exception (égalité entre eux) changent de c/g dans B à t/a dans E, et le doublet gg qui doit son exception à son insensibilité aux 2 processus. A la différence de la bascule c/t qui ne change pas entre B et E, la bascule g/a du doublet cg est inversée entre B et E.
- En résumé, les 2 processus de genèses et de duplication des tRNAs dans E et B sont complètement différents.
3.− Code du domaine A, les archées
modifier3.a − Le processus de genèse et de duplication des tRNAs est très différent de ceux de E et B
modifier- liens: Introduction aux tRNAs, paragraphe archées pour l'uniformité des archées. Aperçu théorique du processus chez les archées dans les corrélations, chapitre "1.− Problématique". Demi-doublets Lignes et colonnes. effectifs tRNAs moyennes et variances. ordre des codons. 1ère 2ème valeur. ordre dans les carrés. groupes de codons. comparaison par tri. diagramme global.
- Malgré la disparition des sensibilités détectées avec les bactéries et les eucaryotes avec leurs exceptions, je retrouve, par comparaison, la structuration en ligne et colonne. La structuration par demi-doublet reste faisable pour les aas à 2 codons mais devient difficile pour les aas à 4 codons. Avec les archées, à cause de l'uniformisation ou autrement dit, du manque de sensibilité du processus, apparaît la structuration par codon, comme si elle était masqué par les processus puissants des E et B.
- − Structuration par codons: Elle devrait se traduire, pour un doublet donné et quelque soit ce doublet, par les 4 codons tous différents entre eux. Étant donné la faiblesse des différences entre codons on aurait du avoir, statistiquement, quelques égalités strictes entre codons du même doublet sur 15 doublets avec 3 codons non nuls chacun.
- Si maintenant on admet que le processus agit spécifiquement sur les codons se terminant par g puisque 13 d'entre eux ont des effectifs strictement inférieurs (gtg 1943) à ceux des codons se terminant par a c (ccc 1955) en omettant, de façon évidente, les 2 exceptions des doublets tg et at , il reste alors 13 couples a c à comparer (effectifs tRNAs). Chez les archées seuls deux couples a c diffèrent d'une unité (aga c) sur 187 et de 2 (cga c) sur 187. Chez les eucaryotes 1 seul couple (cct a) diffère de 3 sur 1641. Sinon dans les 3 domaines les différences sont largement supérieures (1ère 2ème valeur). Voici le tableau des 1ères valeurs les plus faibles.
- Si on compare (multiplicité tRNAs) codon par codon, entre les 2 domaines B et A, il y a des ressemblances évidentes qui font penser aux corrélations déjà étudiées (corrélations). C'est ainsi pour les couples gca c (1.03 - 2.53 / 1.00 - 1.39), gaa c (2.24 - 2.40 / 1.18 - 1.25), gga c (2.30 - 1.37 / 1.32 - 1.03), cca c (0.68 - 1.35 / 0.93 - 1.00), respectivement pour B / A, xya - xyc.
- Dans l'hypothèse de la résonance de l'ADN tous les codons devraient être différents entre eux. Par contre pour les archées seuls, avec leurs faibles effectifs j'ai trouvé plusieurs codons de même effectif: (diagramme global) 8 paires, 1 quadruple et un triple sur les 44 codons du diagramme. Le contraste entre l'ensemble des codons et les codons d'un même carré chez les archées est nette. Les codons d'un carré ne diffèrent entre eux que par une base à la 3ème position, ils sont donc comparables car les tRNAs avec leur résonance propre, ont une direction qui est nécessairement sensible aux processus de genèse des tRNAs des archées qui ne font pas beaucoup de duplication. La différence de résonance entre 2 codons d'un même carré est donc celle des résonances des 2 3ème bases qui, en principe, sont différentes par leurs architectures moléculaires. Et c'est pour cela qu'il y a structuration par codon. La différence de résonance entre 2 codons de 2 carrés différents peut être plus faible qu'entre 2 codons du même carré. Car la résonance d'un codon est la combinaison des états vibratoires de ses 3 bases, qui peuvent s'affaiblir ou au contraire se renforcer d'après la théorie ondulatoire.
- Les codons identiques dans les carrés triés sur la 1ère et la 2ème base: Avec l'uniformité des archées le regroupement des codons suivant la 1ère et la 2ème base au lieu de la 3ème comme précédemment donne à peu près le même résultat, cependant avec une légère diminution de la 1ère à la 3ème base comme si effectivement cette dernière était sensible à la résonance des tRNAs pendant leur création. Les résultats pour la 1ère et la 2ème base sont consignés dans le tableau des codons identiques dans les 3 domaines. Les résultats pour la 3ème base sont ceux déjà étudiés précédemment avec la comparaison des 1ères 2èmes valeurs. La diminution des codons identiques se décile comme suite:
- + Par rapport à la 1ère base nous avons chez les archées (voir tableaux des effectifs et non en 100000 tRNAs) 3 couples identiques (jaunes) et 7 couples se différenciant par 1 seul tRNA (orange); chez les bactéries 1 couple presque identique (jaune) avec une différence seulement de 3 pour 2000, vient ensuite 1 couple (cyan) avec une différence de 17 pour 1000; chez les eucaryotes les différences sont toujours supérieurs à 2%.
- + Par rapport à la 2ème base, chez les archées 2 couples identiques (jaune), 4 couples différant par 2 tRNAs (orange) et 3 couples par 2 tRNAs (cyan), en comptage direct; chez les bactéries 1 seul couple avec une différence de 1% de même pour les archées (cyan).
- + Par rapport à la 3ème base, chez les archées 1 couple différant par un tRNA et un autre par 2, les autres par plus de 6; chez les bactéries tous les couples ont une différence supérieure à 2%; chez les eucaryotes 1 seul couple presque identique (cct cca que nous avions repéré comme une exception) avec une différence de 3 pour 1638 (comptage direct) tous les autres dépassent les 7%.
- J'ai cherché ensuite à comparer tous les codons, quelque soit leur doublet, 2 à 2 pour rechercher ceux qui se comportent de la même façon dans les 3 domaines.
- + Dans un 1er essai j'ai comparé 2 codons par leurs effectifs dans les 3 domaines B A E, après les avoir ordonnés. Je n'ai trouvé que 4 paires aux codons presque identiques (voir le tableau des comparaisons (groupes de codons)).
- + Dans un 2ème essai j'ai aligné les 3 colonnes des effectifs des codons des 3 domaines et je les ai triés dans l'ordre croissant des eucaryotes (comparaison par tri). J'ai ajouté une colonne pour le taux de différence entre 2 codons successifs d'eucaryotes et une autre colonne pour le taux des mêmes codons pour les bactéries. Comme les effectifs des eucaryotes sont triés leurs différences sont très faibles, par contre celles des bactéries et des archées peuvent être élevées. Après avoir souligné les taux inférieurs à 16% des bactéries il ne me reste qu'à estimer la différence entre les 2 codons des archées puis comparer les 3 effectifs. Les faibles effectifs des codons se terminant par t ne sont pas contenus dans ces listes (pour éviter la division par zéro). En plus des 2 couples à forts effectifs du test précédent (tac.caa et cta.tta) j'ai trouvé le couple cac.agc dont les codons sont très semblables.
- Conclusion pour la structuration par codons: En conclusion je peux dire que
- + chaque codon a un comportement spécifique quand on le teste dans les 3 domaines pour la genèse et la duplication des gènes de tRNAs;
- + pour les processus de genèse et de duplication des 3 domaines, les 4 codons d'un doublet traductionnel (xy.) se comportent différemment l'un de l'autre, c'est la structuration par codon;
- + pour les archées on aperçoit surtout la structuration par le processus de genèse même pour les codons se terminant par g car tous les codons c a g doivent exister car la duplication est faible.
- + pour les bactéries la structuration est le fait des 2 processus car la genèse est très affaiblie pour les 2/3 des codons se terminant par g (indice de multiplicité inférieur à 0.7) et la duplication est plus élevée que chez lez archées (indice jusqu'à 2.53 pour les bactéries contre 1.39 pour les archées).
- + pour les eucaryotes la genèse existe pour tous les codons et la duplication explose. Ce qui fait que la structuration par codon n'est pas homogène. Il suffit d'un génome pour changer les exceptions chez les eucaryotes, cas de la chimère (Callorhinchus milii) où même la structuration par ligne et colonne se trouve faussée. ( faire les tableaux et commentaires).
3.b − Le code de la genèse des tRNAs chez les archées est structuré en lignes,colonnes et demi-doublets
modifier- − Structuration par ligne et colonne chez les archées: Lignes et colonnes
- Alors qu'avec les bactéries la structuration est très différenciée grâce à une faible duplication et une genèse très affaiblie des codons se terminant par g, et que celle des eucaryotes est cahotique à cause des duplications extrêmes, les archées vont avoir une structuration claire et nette en ligne et colonne mais peu différenciée pour pouvoir comparer des carrés comme avec les bactéries et ceci, respectivement, grâce et à cause de leur uniformité.
- Moyennes des lignes et colonnes par rapport à la 3ème base (moyenne 3ème base, dans le tableau):
- − Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1905. Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 2 134, valeur de la 4ème colonne a quand on ne tient pas en compte l'exception tga (effectif de 206 pour 100 000 tRNAs). La valeur de la 1ère ligne a est alors de 2143.
- − 3 couples de lignes, cxc-a (2150) axc-a (2250) gxc-a (2450), et un couple de colonne, xac-a (2335) ont leurs partenaires presque identiques entre eux. Pour les 4 autres couples les partenaires diffèrent entre eux de plus de 300, txc-a (+400) xtc-a (+300) xcc-a (-250) xgc-a (+500). Sur les 8 carrés seule la colonne se terminant par c (xcc 2097) est inférieure de 10% par rapport à son partenaire a xca. Le codon ccc a été déjà signalé comme une exception. Toutes les autres moyennes se terminant par c sont supérieures (3) ou égales (4) à leur partenaire se terminant par a.
- − Avec la même lecture les bactéries donne des couples différents après permuatation de cgc en cgt (cxc 1998) et correction du codon tga (560): ligne txa avec 2138 à la place de 1612, et colonne xga avec 1589 au lieu de 1337.
- Les moyennes des lignes et colonnes g (3ème base) sont les plus faibles et inférieures à 1558 (txg). Les moyennes des lignes et colonnes c et a (3ème base) sont toutes supérieures à 1589 (xga).
- 3 couples de lignes, txc-a (2200) axc-a (2830) cxc-a (1940), et un couple de colonnes, xtc-a (2560) ont leurs partenaires presque identiques entre eux. Dans les 4 autres couples les partenaires diffèrent entre eux de plus de 500, gxc-a (-800) xac-a (-500) xcc-a (-1100) xgc-a (+1100). L'exception de la moyenne de colonne se terminant par c (xcc 1696) se maintient, elle est inférieure de 68% par rapport à son partenaire xca.
- Si l'on tient compte de l'uniformité des archées par rapport aux bactéries, la comparaison entre 2 lignes ou 2 colonnes de même terminaison des 2 domaines ne peut se faire que par rapport à la différence relative entre les 2 partenaires d'un couple du même domaine se terminant par c et a. C'est ainsi qu'on observe que les 2 domaines se comportent de la même façon: sur 8 comparaisons de couples les 2 lignes c et a sont semblables par l'égalté entre les 2 partenaires (= / =), les 2 colonnes c et a par une différence négative ( nette pour c (< / <) et relative pour a (< / =<)), la ligne t et la colonne g par une différence positive (relative pour t (=> / > ) et nette pour g (> / >)). Soit au total les 3/4 des comparaisons. Il reste la ligne g où la différence est nette entre les 2 partenaires bactériens alors que les archées présentent une égalité quasi stricte ( < / ==); puis il y a la colonne t où les bactéries ont une différence négative relative et les archées une différence positive nette (=< / >). Voir le tableau en bas du texte.
- − Avec la même lecture les eucaryotes ne présentent que les moyennes de la ligne cx et celles de la colonne xc qui soient comparables aux 2 autres domaines, car cxg et xcg sont inférieures à cxc-a et xcc-a dans les 3 domaines. Les 3 lignes ont le même comportement entre elles de même que les 3 colonnes entre elles. On retrouve encore l'exception du codon ccc avec des rapports c/a des moyennes de 3ème base de colonne respectivement de 1882/2566, 1696/2852, 2097/2349 pour E B A. Il faut noter que 8 codons forts xyt eucaryotes et 1 un bactériens ont été permutés avec les codons faibles xyc pour avoir des moyennes de 3ème base comparables entre xyc et xya. Ainsi l'exception du codon ccc chez les bactéries et les archées réapparaît avec le codon cct chez les eucaryotes avec la moyenne de la 3ème base de la colonne xcc.
- Moyennes des lignes et colonnes avec les 4 3ème bases (moyennes lignes et colonnes, dans le tableau): Ces moyennes représentent bien l'influence totale de la 1ère base (ligne) et de la 2ème base (colonne). A ce niveau élevé de totalisation la ressemblance entre les 3 domaines devrait être plus élevée que précédemment.
- − L'ordre des moyennes des lignes des bactéries est le même que celui des lignes des archées en les notant de gauche à droite: 3-4-2-1. C'est le même constat pour les moyennes des colonnes des bactéries et des archées, l'ordre est le même mais différents de celui des lignes: 2-3-1-3 pour les bactéries et 2-3-1-4 pour les archées. Il faut noter la netteté avec les archées alors qu'ils sont très uniformes. Dans le cas des bactéries aux codons très différenciés et avec un total des tRNAs de 235 027 ( contre 8749 pour les archées) l'égalité des ordres des colonnes 2 et 4 est tout à fait acceptable avec une différence de 2 unités sur 1830, alors que cette égalté serait douteuse avec les archées à cause de leur uniformité.
- − L'ordre des moyennes des lignes des eucaryotes est quasiment le même que celui des 2 autres domaines. Avec la notation de gauche à droite nous avons 3-3-2-1 contre le 3-4-2-1 des 2 autres domaines. La différence entre la ligne 1 et 2 est de 20/1300 ce qui est très faible pour la différenciation extrême des eucaryotes et un total des tRNAs de 115 111 contre 237 027 pour les bactéries.
- Moyennes des carrés: elles représentent le comportement de chaque doublet.
- − Malgré la grande différenciation chez les eucaryotes et les bactéries, la grande uniformité chez les archées et en excluant les 2 exceptions des doublets ta et at, les 4 doublets aa gc ga gg ont les valeurs les plus élevées parmi les 12 doublets restants. L'ordre de ces 4 doublets, suivant leur valeur, change cependant entre les 3 domaines: il est 4-2-3-1 pour les eucaryotes, respectivement suivant la notation précédente aa gc ga gg; il est 1-4-2-3 chez les bactéries; et 4-2-1-3 chez les archées.
- − Grâce aux 4 doublets aa gc ga gg la ligne 4 et la colonne 3 se distinguent nettement dans les 3 domaines alors que la colonne 1 n'est commune qu'aux bactéries et archées. Les autres lignes et colonnes varient beaucoup entre les 3 domaines.
- Moyennes des lignes et colonnes par rapport à la 3ème base (moyenne 3ème base, dans le tableau):
- − Structuration du code en demi-doublets chez les archées: Jusqu'ici j'hésitais à utiliser les codons se terminant par g comme critère de différenciation du code des archées en demi-doublet à cause de la grande uniformité. Cependant la netteté des comparaisons relevée au paragraphe précédent sur les lignes et colonnes, et surtout la distinction de couples de lignes ou de colonnes des moyennes de 3ème base pour analyser les archées m'autorisent à utliser les codons se terminant par g comme critère de différenciation. L'argumentation pour différencier le code chez les archées en demi-doublets se fait alors de la même façon que chez les bactéries (ref.).
- − Les exceptions dans le code des archées: 3 nouveautés sur les 5 exceptions qui restent chez les archées.
- Les doublets ta et cc ne changent pas en exception et l'exception du codon ccc quoique difficile à faire a été détectée dans les comparaisons ligne et colonne précedentes.
- Le doublet tg ajoute une nouvelle exception au codon tga, avec le codon tgc dont l'indice de multiplicité est le plus élevé 1.69 chez les archées après l'exception atg 3.20 et avant gca 1.39, alors qu'il n'est que de 1.11 chez les bactéries. Ce n'est pas du à un génome particulier.
- Le doublet at maintient l'exception du codon atg mais aggrave celle du codon ata, car la grande uniformité des codons des archées est due à sa robustesse: Dans les conditions extrêmes il est plus avantageux d'utiliser des anti-codons différents que de contrôler des voies de synthèse de plusieurs enzymes pour modifier les tRNAs. Or apparemment les archées soit ils ont choisi l'option de la modification comme chez E.Coli soit les tRNAs à codon atg sont différenciés ou bien il existe un processus spéciale au niveau de l'ARNm comme pour le codon tga.
- Le doublet cg est peut-être le plus spectaculaire par son exception spécifique chez les archées qui le différencie de celle des bactéries (bascule c/t et bascule a/g) et de celle des eucaryotes (annulation de la bascule a/g et non celle de c/t). Les archées annulent les 2 bascules à la fois et l'exception du doublet cg vient de sa normalité chez les archées.
Critiques
modifier- − Au paragraphe 3b, sur les archées, la comparaison entre ligne et colonne est aisée entre bactéries et archées mais pas du tout avec les eucaryotes. De même j'ai noté en conclusion du paragraphe 3a pour la structuration en codons que des effectifs élevés en tRNAs des eucaryotes ne permettaient pas de dégager des analogies de structuration entre les 3 domaines, ce qui est mon objectif principal de l'étude des tRNAs en vue de l'hypothèse de la résonance. Pourtant la comparaison entre eucaryotes et bactéries a révélé des caractéristiques nettes et précises des codons qui les différencient à l'intérieur de chaque domaine. Elle nous a permis aussi de dégager des comportements de groupes de codons analogues ce qui a permis de les caractériser en doublet et demi doublet. Malgré l'uniformité et les faibles effectifs des archées j'ai pu montrer ces caractéristiques entre eux et les bactéries.
Hypothèses
modifier- − C'est la comparaison inachevée entre eucaryotes et archées qui m'a laissé penser qu'il existait un 4ème processus de duplication propre aux eucaryotes différent de ceux déjà étudiés dans les 3 domaines. Ce processus, par ses duplications explosives, est analogue au processus qui provoque les changements brutaux des fréquences des codons ggg et ccc dans les génomes des procaryotes, comportement que j'ai utilisé pour établir l'hypothèse de la résonance dans l'ADN dans l'article "répétitions des bases". Pour étudier ce nouveau processus, il faut détailler le code génétique pour chaque génome. L'idée c'est de le séparer des autres processus pour rendre les tableaux de code des trois domaines plus lisibles et de dégager l'analogie recherchée entre ces 3 domaines. Je devrais faire la même étude pour les 3 domaines pour que la comparaison soit valable.
- − Fortes duplications chez les bactéries et les archées: Pour les archées l'uniformité et la multiplicité proche de l'unité ne laissent pas de place à une duplication explosive. J'ai détaillé le cas de la Cys qui a un indice de 1.6, voir ci-dessous. Pour les bactéries j'ai compté le nombre de génomes n'ayant qu'un seul exemplaire de tRNA par demi doublet sous la forme 1a1g ou 1c1t (tRNA se terminant par a g c t, tableau IV). Avec ces décomptes et les indices de multiplicité très faibles des bactéries il ne reste pas beaucoup de place aussi pour les fortes duplications. Un échantillon du spectre des tRNAs des 111 bactéries des diagrammes étendus montre que les duplications chez les bactéries dépassent rarement 5.
- − L'effectif de 155 eucaryotes, assez élevé pour des décomptes détaillés, m'a encouragé à étudier les fortes duplications dans ce domaine.
Tableaux de bas de page
modifier- 1ères valeurs Voir le paragraphe d'appel.
couple différence effectif taux % B cta g 246 5186 5 aaa c 341 9105 4 A aga c 1 187 1 cga c 2 187 1 tca c 6 190 3 E cct a 3 1641 0 aga c 133 1895 7
- 4 paires presque identiques. Voir le paragraphe d'appel.
B A E tac 2732 2172 1925 caa 2718 2240 1989 cta 2102 2115 758 tta 2021 2183 773 cat 4 0 47 agt 1 0 53 aat 5 0 149 tat 4 0 155
- couple ac.ag. Voir le paragraphe d'appel.
B A E cac 2006 2115 1632 agc 1881 2137 1646
- Comparaison ligne colonne entre bactéries et archées. voir le paragraphe d'appel.
Ligne colonne base3 B A B A t =>7% >0 =<5% >0 c = = <0 <0 a = = <0 =<%3 g <0 == >0 >0
- Spectre des tRNAs Cys chez les archées. voir le paragraphe d'appel.
tRNAs par génome 1 2 3 4 5 6 7 8 tottal nombre de génomes 137 11 16 10 5 2 1 1 183 nombre de tRNAs 137 22 48 40 25 12 7 8 299
Linéarité du code des gènes de tRNA chez les eucaryotes
modifier- Liens: base de données gtRNAdb [1] Lignes et colonnes des 121 tableaux synthétiques Tableau des effectifs 121 Processus E et résonance des 121 eucaryotes IV1.265 sensibilité relative
- Voir le tableau analysé,
Problématique
modifiervoir la problématique dans 3 domaines paragraphe "3.résultats/3.code des archées/3a/-structuration par codons, conclusion".
- - Chez les procaryotes la multiplicité est très faible par rapport à celle des eucaryotes. Elle est aussi très variable d'un codon à un autre chez ces derniers. L'effectif de 155 eucaryotes de la base de donné gtRNAdb est faible et la multiplicité dépassant le millier pour certains codons seulement ne permettent pas de dégager une tendance des codons comme chez les procaryotes où pour les bactéries l'effectif est très élevé (autour de 4000 bactéries) et où pour les archées leur uniformité et leurs multiplicités proches de l'unité suffisent à caractériser chaque codon comme on l' a vu dans les 3 domaines. Donc pour les procaryotes les totaux des codons relevés dans la base de données suffisent à les caractériser, mais pour les eucaryotes il suffit d'un seul nouveau génome avec un codon à très grande multiplicité pour changer significativement sa moyenne.
- - Dans un 1er temps j’ai éliminé des effectifs les 6 eucaryotes dont au moins 1 codon a une multiplicité supérieure à 1000. Les tendances analogues à celles des procaryotes se précisent alors clairement. Mais beaucoup d'autres codons dont la multiplicité dépasse la centaine rend arbitraire la limite de 1000 choisie auparavant. Aussi j'ai décidé de porter les nombres de tRNA d'un codon en fonction des moyennes de chaque eucaryote sélectionné. C'est ainsi que le codon n’est plus caractérisé par un nombre mais par sa courbe de tendance.
Méthode d'analyse
modifier- - Pour représenter la courbe de tendance par un seul paramètre j'ai choisi une droite passant par l'origine. Le passage par l'origine est justifié parce qu'un codon peut n’avoir aucun gène tRNA. Et la droite est la courbe la plus simple permettant d'avoir un seul paramètre. Enfin, comme la base de données du 29.10.17 présente moins de 10% des eucaryotes ayant des codons à grande multiplicité, j'ai éliminé pour la droite d'un codon étudié ceux qui diminuent fortement son coefficient de détermination. C'est ainsi que je n'ai éliminé que 74 codons sur un total de 5445 (121*45) étudiés avec 121 eucaryotes sélectionnés restant et 45 codons, en laissant de côté les codons xyc/t faibles, le codon tga et les 2 codons stop.
- - Par ailleurs la base de données contient des doublons ou autrement des génomes qui ont été analysés plusieurs fois avec des individus différents. Je n'ai choisi aussi que les variants d'une même espèces qui ont un écart de leur total supérieur à 10%. C'est ainsi que j'ai éliminé de l'étude 30 eucaryotes. Sur 155 eucaryotes affichés par les statistiques de la base je n'en ai décompté que 154 dont 2 sont anormaux (Oryzias latipes (Medaka), Eremothecium cymbalariae). Par ailleurs j'ai étudié en parallèle Danio rerio (zebra fish) car tous ses codons ont une multiplicité élevé et le total de 12258 tRNAs permet sa comparaison avec les 3 domaines. Il reste donc 121 eucaryotes.
- - Pour pouvoir comparer avec les nombres de tRNAs des codons des procaryotes j'ai remplacé l'effectif supprimé par son effectif calculé: la pente du codon concerné (pente du diagramme de sa colonne) est multipliée par la moyenne des codons de l'eucaryote concerné (moyenne calculée de sa ligne, sans ce codon à effectif excessif). Le nombre total des tRNAs d'un codon, des 121 eucaryotes, est alors la somme des décomptes directs des codons non supprimés et de ceux recalculés ( ligne "totaux + sommes calculées"). Cette méthode, par rapport à l'omission de tout un génome, a l'avantage d'étudier tous les génomes et les codons sont traités de façon homogène.
Résultats
modifier- − Du tableau des calculs ci-dessous sont extraits
- + le tableau IV. Nombres des 121 eucaryotes 55 830 des effectifs calculés des gènes de tRNA des 121 eucaryotes et
- + le tableau III. Nombres des 121 eucaryotes 92 580 des effectifs non réduits des gènes de tRNA des 121 eucaryotes.
- Ils sont accompagnés de leurs tableaux respectifs des effectifs rapportés à 100 000 tRNAs
- + le tableau IV100. Nombres des 121 eucaryotes 55 830,
- + le tableau III100. Nombres des 121 eucaryotes 92 580,
- et de leurs tableaux respectifs des indices de multiplicité
- + le tableau IV1. Nombres des 121 eucaryotes 55 830,
- + le tableau III1. Nombres des 121 eucaryotes 92 580.
- − Le tableau synthétique des tableaux, pour les comparaisons in visu, contient:
- + les 3 tableaux des effectifs calculés des 121 eucaryotes, IV. IV100. IV1. Nombres des 121 eucaryotes 55 830,
- + les 2 tableaux des pentes et des coefficients de détermination des calculs sur les 121 eucaryotes, IVp. Pentes IVr. R2 des 121 eucaryotes 55 830.
- Pour refaire les calculs des pentes dans un tableur utiliser le tableau non formaté correspondant au tableau analysé ci-dessous.
- + le tableau de multiplicité des effectifs non réduits des 121 eucaryotes, III1. Nombres des 121 eucaryotes 92 580,
- + le tableau des effectifs rapportés à 100 000 tRNAs des bactéries I100. Nombres des 4032 bactéries 235 027, et
- + les 2 tableaux de zebrafish des effectifs et des effectifs rapportés à 100 000 tRNAs, V. V100. Nombres des tRNAs Zebrafish 12 258.
- − L'étude des lignes et colonnes pour les doublets des 121 eucaryotes et du zebrafish est reportée ici.
- − Le processus E de duplication et la résonance, R, des 121 eucaryotes: Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus de duplication linéaire, analogue à celui des procaryotes, que j'appelle processus E, E pour eucaryote, c'est-à-dire un processus à progression linéaire une fois les nombres triés dans l'ordre croissant; et la somme, pour certains codons seulement, des duplications explosives de plus de 100 tRNAs par codon et que j'appelle processus R pour résonance des eucaryotes par analogie aux sauts de fréquence des répétitions de plus de 4 bases identiques dans l'ADN des procaryotes de l'article "répétitions des bases chez les procaryotes" (ref.) à l'origine de mon hypothèse de la résonance de l'ADN. Pour apprécier ces 2 phénomènes j'ai procédé aux calculs des différences, reportés au chapitre Processus E et résonance des 121 eucaryotes, entre les tableaux nommés ci-dessus:
- + Différence entre "IV1. Nombres des 121 eucaryotes 55 830" et "I1. Nombres des 4032 bactéries 235 027", pour la différence entre le processus E et le processus B des bactéries;
- + Différence entre "III1. Nombres des 121 eucaryotes 92 580" et "IV1. Nombres des 121 eucaryotes 55 830", pour la résonance seule.
Le comportement des codons avec les 121 eucaryotes
modifier- Liens: Tableau synthétique, Analyse des 155 eucaryotes, LC des 121 eucaryotes, demi-doublets des 121 eucaryotes.
- Avant d'aller plus loin le tableau IVp montre bien que l'objectif de calculer les effectifs des codons, après avoir retirer les duplications excessives, au moyen des pentes des droites de tendance des diagrammes "effectifs d'un codon en fonction des moyennes des codons de chaque génome" est bien atteint: L'ordre des effectifs et des pentes des codons est le même dans les tableaux IV et IVp. Le tableau IVr ne respecte pas cet ordre et donc représente bien la spécifité de chaque codon. Par ailleurs on devrait trouver les mêmes comportements des codons non touchés par les duplications excessives que pour l'étude de l'ensemble des 155 eucaryotes, tant le nombre de codons retirés pour l'ajustement des coefficients de détermination est faible, 13 pour un total de 5445 considérés.
- Pour analyser les résultats nous allons reprendre la même grille de lecture que pour les 155 eucaryotes mais avec les 121 eucaryotes sélectionnés, sans doublons et sans calcul, avec les tableaux "121 eucaryotes 92530", comme référence. Entre "155 eucaryotes" et ces tableaux les différences sont minimes.
1.a − Les codons impactés par les calculs: Tableaux IV1 et III1
modifier- Tous les indices de IV1 sont inférieurs ou égaux à ceux de III1. Voir le tableau des différences en % .
- Les codons c/t forts: ne sont pas impactés, seuls tgc et gct dépassent les 10% en différences, avec respectivement 17% et 13%.
- Les codons c/t faibles: Ce sont toujours les plus faibles du tableau puisque l'indice le plus bas de tous les autres codons est celui de tga avec 2.06. Par contre ils se sont harmonisés avec une gamme de 0.14 − 0.44 (respectivement ccc gtc) au lieu de 0.18 − 1.98 (respectivement ctc gcc) du tableau III1. Les duplications les plus excessives dans III1 sont celles de gcc ggt tgt (respectivement 1.98 1.14 1.73). Elles diminuent fortement dans IV1 avec respectivement 586 411 553 % de baisse.
- Les codons a/g : sur les 30 codons a/g du tableau, 19 ont une différence inférieure à 23% dont 12 inférieure à 10%. Les colonnes 3 et 4 sont impactées chacune par 4 codons excessifs avec une différence supérieure à 52%, respectivement caa-64, aag-112, gaa-354, gag-75 et tgg-52, cga-188, gga-312, ggg-914. La ligne 4 est impactée par 7 codons dont 4 en commun avec les colonnes 3 et 4. Les 3 codons restants sont gtg-149, gcg-545, gca-459.
1.b − En ce qui concerne l'agencement des couleurs,
modifierc.a.d l'ordre des 1ères valeurs (codons c/t faibles) et des 2èmes valeurs (supérieures aux 1ères), nous retrouvons:
- l'agencement des colonnes 2 et 4 des bactéries, avec la seule exception cgg qui, nous l'avons vu dans les corrélations entre gènes de tRNAs au paragraphe 3.2, se comporte comme un codon xya et prend la place de cga et vis versa.
- l'agencement des colonnes 1 et 3 qui s'harmonisent en cédant la 2ème valeur aux codons xya au lieu de xyg. Elles se comportent de la même manière à l'exception de aac qui prend la 2ème valeur à aaa, mais les 2 valeurs sont presque identiques (dans IV100 on a respectivement 3328 contre 3367). Nous le verrons avec les moyennes des lignes et colonnes, les valeurs de la colonne 3 sont les plus élevées de tout le tableau et elle se différencie ainsi de la colonne 1.
- La ligne 4 (codons gxy) a les valeurs les plus élevées comme la colonne 3. Avec les 121 eucaryotes elle est différenciée contrairement aux "121 eucaryotes 92 530" (tableau III1) et aux bactéries surtout pour les codons gxg qui y sont respectivement tous trop forts et trop faibles.
1.c − Lignes et colonnes des 121 eucaryotes
modifierLignes et colonnes des 121 Lignes et colonnes des 155 eucaryotes
- Je compare ici le tableau des lignes et colonnes pour les 155 eucaryotes (III100) et pour les "121 eucaryotes 55 830" (IV100). Le tableau des "121 eucaryotes 92530" (III100) n'a pas été fait, celui des 155 diffèrant peu tant qu'il s'agit de moyennes ou de totaux relatifs. Voir les liens en tête de paragraphe. les tableaux LC des "121 eucaryotes 55 830" (IV100) sont comparés aussi aux bactéries et à zebrafish.
- En comparant bactéries et 155 eucaryotes on voit que la symétrie qui existe chez les bactéries est rompue chez les eucaryotes: Chez les bactéries on a à peu près L1=L2 (1800) et L3=L4 (2350), chez les eucaryotes L1=L2 (1300) donc très affaiblies et L4>>L3 (3700 2100). De même du côté des colonnes, chez les bactéries C1~C3 (2450) et C2=C4 (1830), chez les eucaryotes C1<<C3 (1500 2900) et C2~C4 (2100). En comparant bactéries et 121 eucaryotes on voit que la symétrie n'est pas rétablie mais néanmoins la dissymétrie est atténuée pour les lignes: L1~L2 (1700) donc plus vigoureuse, L4=L3 (2500) donc égalité et C1<<C3 (1960 2970), C2~C4 (1900) donc même dissymétrie que les 155 eucaryotes.
- La comparaison de zebrafish aux 121 eucaryotes et aux bactéries montre une quasi distorsion de zebrafish avec les 2 autres tableaux: les 4 lignes sont toutes différentes entre elles et la ligne 3 est très grande par rapport aux 2 autres lignes 3 des 2 autres tableaux, respectivement aux B E Z, on a 2354 2521 3313. Pour les colonnes on en a 2 presque égales, C1<<<C3 (1950 3375) et C2~C4 (1740). Encore là la colonne 3 est disproportionnée, respectivement aux B E Z, 2566 2973 3375. En conclusion zebrafish ne peut être comparé ni aux 121 eucaryotes ni aux bactéries même si on ignore ses effectifs élevés, car il y a absence totale de symétrie entre les ligne et entre les colonnes.
- Les carrés: Avec le tableau des lignes et colonnes j'ai donné aussi les totaux des carrés, c.a.d la somme des 4 codons d'un doublet constitué par les mêmes 1ère et 2ème base. Entre les bactéries et les 155 eucaryotes la différence est flagrante. Si les 4 doublets majoritaires sont les mêmes dans les 2 domaines, aa ga gg gc, leurs effectifs sont beaucoup plus élevés chez les eucaryotes que chez les bactéries (leur somme est de 50 000 contre 31 000 pour les bactéries). Du coup, comme on travaille sur des pourcentages, les autres doublets diminuent pour autant. Mais la diminution n'est pas égale pour tous les doublets. Ainsi les 4 doublets tt tc ct cc diminuent tous drastiquement, leur somme passant de 22 000 chez les bactéries à 12 000 chez les eucaryotes. Les 6 autres doublets ordinaires, autres que ta et at, ont des sommes qui varient peu, 32 000 pour les bactéries contre 28 000 pour les eucaryotes. Quand on passe aux 121 eucaryotes on a respectivement pour les 4 majoritaires, les 4 minoritaires et les 6 intermédiaires 35 000, 19 000 et 31 000. Les intermédiaires sont quasiment égaux à ceux des bactéries alors que les minoritaires ne sont plus qu'à 15% et les majoritaires à 30% contre 12, 40 et 40% chez les 155 eucaryotes. Le comportement de zebrafish est analogue à sa distorsion qu'on a relevée pour les lignes et les colonnes: les majoritaires et les minoritaires ne sont plus à leurs places; le maximum atteint fait le double de celui des eucaryotes (doublet aa avec 21 000 contre 10 000) et le minimum atteint fait le tiers de celui des 2 autres tableaux (doublet tg avec 1660 contre 4020 pour le doublet cg des eucaryotes).
1.d − structuration en doublet et demi-doublet
modifier- Cette structuration mise en évidence avec les 155 eucaryotes au chapitre 3/1.a et basée sur la bascule c/t reste toujours valable puisque cette dernière n'est pas impactée par les duplications excessives (voir ci-dessus le paragraphe 1.a).
- Quand on regarde le tableau des demi-doublets des 121 eucaryotes, l’harmonisation constatée avec l'agencement des couleurs (voir paragraphe 1.a ci-dessus) est accentuée avec les rapports g/a. La structuration en demi-doublets est toujours là avec un renforcement de la bascule c/t, par rapport aux demi-doublets des 155 eucaryotes, notamment pour tgt gcc ggt qui contiennent les duplications les plus excessives (voir demi-doublets des 121 où les nombres soulignés représentent les codons impactés par les duplications excessives).
- La structuration des doublets en ligne et colonne est plus nette notamment pour la colonne 3 où les rapports deviennent tous directs et quasiment égaux. Les rapports de la colonne 1 s’harmonisent aussi puisque le doublet gt passe de 3.4 à 1.6, les autres ne changeant presque pas. La colonne 2 est bien harmonisée d'origine et ses rapports ne changent quasiment pas.
- Sur les 4 codons de la colonne 4 impactés par les duplications excessives seule la bascule g/a change son rapport, puisqu'il passe de 4.5 (inverse) à 1.6 (inverse) et ne change pas la nature de cette bascule. L'exception gg révélée par la bascule c/t se confirme avec un rapport g/a direct élevé de 2.1. La colonne 4 se distingue nettement des autres colonnes puisque les 3 doublets non impactés par les bascules c/t et g/a, du doublet cg, ont 8 codons sur 9 qui sont quasiment égaux (en pourcentage) à ceux des bactéries.
- La caractérisation des codons par les rapports g/a, utilisée pour les 155 eucaryotes, très complexe n'a plus lieu d'être puisqu'elle est remplacée par l'harmonisation des colonnes. Elle reste cependant nécessaire pour les 155 eucaryotes qui incluent les duplications excessives.
1.e − les exceptions des eucaryotes
modifier- L'analyse faite au chapitre 3/1.c avec les 155 eucaryotes est toujours valable à part 2 changements minimes mais importants puisqu'ils renforcent l'exceptionnalité.
- Doublet gg: nous venons de le voir ci-dessus, il est renforcé chez les 121 eucaryotes par son rapport g/a élevé par rapport à ceux de la colonne aux doublets sans bascule c/t. Mais en plus, le fait que ses codons restent égaux en pourcentage à ceux du même doublet bactérien, que le codon ggg bactérien a un pourcentage bactérien des codons xag de la colonne 3, ces caractéristiques le rendent exceptionnel chez les bactéries aussi. En plus le doublet bactérien gg a un rapport c/a inverse de ceux des 3 autres doublets bactériens gxy, encore une autre exception.
- Doublet cc: l'égalité entre le codon cct et cca en nombre ou en indice reste préoccupante même si une différence de 10% apparaît chez les 121 eucaryotes. En indices on a 10.6 et 10.6 chez les 155 eucaryotes et respectivement 9.28 et 10.28 chez les 121 eucaryotes.
- Par contre j'avais évoqué l'éventualité d'une bascule de type g/a des doublets gt et aa dans les corrélations entre gènes de tRNAs au paragraphe 3.2. Avec les nouveaux nombres on a respectivement pour les bactéries, les 121 eucaryotes(92530) et les 121 eucaryotes (55830):
- Pour aa 0.27 2.48 1.17
- Pour gt 0.15 3.41 1.63
- Pour cg 3.78 0.21 0.61
- Ces rapports montrent qu'il n'en est rien pour aa et gt, par contre cg a bien une bascule g/a.
Comparaison entre les bactéries et les 121 eucaryotes
modifier- avec processus E et processus résonance
- ""Séparation processus E et résonance: Processus E et Résonance
- Comparaison processus E et processus Bactéries: Analyse des 155 eucaryotes, Processus E et Résonance, LC des 121 eucaryotes""
- Jusque là j'ai toujours comparé bactéries et eucaryotes avec les 155 eucaryotes et en pourcentage, que ça soit en introduction des tRNAs dans le corps de l'article ou ,ici, dans les textes des tableaux numériques où j'ai étudié les corrélations et les comparaisons entre les domaines.
- Dans ce texte de l'étude des 121 eucaryotes j'ai comparé ces derniers avec les bactéries pour la structuration en ligne et colonne et pour les exceptions, respectivement aux chapitres 3/1.c et 3/1.e. J'aborde dans ce chapitre la comparaison entre les bactéries et les 121 eucaryotes pour les groupes de codons, pour la quantification des processus de genèse, de duplication et de résonance et pour la corrélation entre les nombres de gènes de tRNAs des codons.
2.a − Rappel des chapitres précédents
modifier- Statistiques et exceptions: La comparaison entre ligne/colonne des bactéries et ligne/colonne des 121 eucaryotes est de nature statistique, et celle avec les exceptions est une caractérisation de codons individuels. Les 2 approches montrent une forte analogie entre les 2 domaines malgré la grande différence due aux bascules xyc/t et cga/cgg et l'exception du doublet gg qui en découle.
- Les corrélations: L'étude des corrélations entre les nombres de gènes de tRNAs des codons des 3 domaines, avec 155 eucaryotes, montrait une forte corrélation entre bactéries et eucaryotes pour 31 codons, donc en excluant certains codons excessivement représentés. C'est ce qui m'a conduit à constituer un groupe de 121 eucaryotes, sans doublons, et à séparer dans ce groupe le processus de duplication ou processus E, du processus de résonance pour les duplications excessives. Dans le paragraphe 2.e ci-dessous j'ai repris ces corrélations avec les 121 eucaroyotes et elles montrent maintenant une forte corrélation entre 40 codons sur 46 considérés.
- Les groupes de codons: J'avais utilisé déjà le groupage des codons dans l'étude étendue des protéines de 111 bactéries (introduction). J'ai procédé au groupage de ceux des gènes de tRNAs des bactéries au chapitre 3/2.b dans l'étude des 3 domaines mais ce groupage semblait fastidieux pour les 155 eucaryotes à cause de la disparité des duplications excessives (chapitre 3/1.b) jusqu'à conclure, au chapitre 3/2.c, que les processus des 2 domaines étaient totalement différents. Avec l'harmonisation du code des 121 eucaryotes, relevée précédemment, j'ai refait le regroupage des codons sous la même forme que ceux des bactéries, mais avec les indices de multiplicité, au chapitre suivant.
- Les quantifications: J'ai commencé à mettre en parallèle les réductions des pourcentages, entre 2 codons, chez les bactéries et les 155 eucaryotes, au chapitre 3/2.c de l'étude des 3 domaines, pour repérer de nouvelles exceptions. C'est un début de quantification. La séparation du processus E de dupication et de la résonance, et l'harmonisation constatée des 121 eucaryotes, m'ont poussé à quantifier rigoureusement ces 2 processus par rapport à celui des bactéries que j'appelle processus de genèse des gènes de tRNA parce que ces derniers dupliquent faiblement et qu'ils sont en corrélation avec ceux des eucaryotes. La quantification, au chapitre 3/2.c ci-dessous, ne sera plus faite sur les pourcentages mais sur les indices de multiplicité.
2.b − Les groupes de codons
modifier- : le code génétique adénélique, les groupes xyg, xyc/t et xya. Rappel de ces groupes pour les codons des protéines: ttg agg cgt cga . . . Voir les moyennes des doublets du processus E.
- L'ordre adénélique du code génétique:
- Dans le code traductionnel les codons sont ordonnés par rapport aux aas qu'ils colportent, ce qui fait que la 1ère base se trouve sur une ligne du tableau et la 2ème sur une colonne. La 3ème base est reléguée dans un carré correspondant à 2 ou 4 aas. Ce groupage des codons est basé sur des nombres entiers et le code génétique est insensible (doublets à 4 aas) ou peu sensible ( doublets à 2 aas) à la 3ème base.
- Les tableaux des gènes de tRNAs ont, certes, aussi des nombres entiers, mais ils sont très élevés. Ce qui fait qu'on n'a pas de groupes distincts mais des groupes plus ou moins homogènes. En classant les nombres de gènes de tRNA des codons en valeurs faibles , intermédiaires et fortes, comme je l'ai fait pour les bactéries, les archées et les eucaryotes, il apparaît clairement qu'il faut regrouper les codons suivant la 2ème et la 3ème base, et non suivant la 1ère et la 2ème comme pour le code traductionnel, pour obtenir des doublets homogènes (cet ordre apparaît avec la comparaison entre le processus des bactéries et des eucaryotes où les couleurs alternées des codons montrent des comportements analogues, comme dans le tableau IV1 débarrassé des résonances des duplications. ref.). Ce faisant, si le doublet est homogène, les 4 codons auront le même nombre de gènes de tRNA, à peu près, et du coup le processus à la base de cette genèse est insensible à la 1ère base, alors que le processus qui fixe l'aa sur le tRNA est insensible, lui, à la 3ème base. Comme le tRNA a un sens et qu'il prend naissance par appariement à l'ADN, sa 3ème base correspond à la 1ère base de son gène et donc celui-ci a aussi un sens, le sens opposé du tRNA. J'appelle ce code, trié sur la 2ème et 3ème base, le code génique ou adénélique puisqu'il impacte les gènes des tRNAs. Il est l'opposé du code génétique qui impacte le tRNA lui-même.
- −− Note du 18.2.19. Voir le schéma des gènes et des transcrits. Le brin ADN transcrit en tRNA est en minuscules et il est le même et dans le même sens que l'ARNm. Le codon de la Ser tcg a la 3ème base variable, ce qui donne les 4 codons de la Ser. Ce codon est le même que le brin transcrit du tRNA. Le sens de ce gène va de c à t et commence par g. On peut dire alors que les 4 codons de Ser ont leur gène tRNA qui est construit dans le même sens et a les propriétés des 2 1ères bases, gc, comme le codon tcg a ses propriétés soutenues par tc. Donc on s'attend a ce que les gènes tRNAs xcg aient des propriétés semblables du fait que la genèse des gènes de tRNA se fait dans un sens et s'appuie sur les 2 1ères bases. Il faut noté que le complément du tRNAg (brin en majiscules) ne peut être transcrit en tRNA car les tRNAs sont assymétriques à cause de la région variable de tout tRNA. Ceci renforce la similitude entre les gènes de tRNA ayant leurs 2 1ères bases identiques. Ce schéma et cette note explicitent mieux que précédemment l'ordre adénélique.−− Note du 18.2.19, fin.
- J'ai montré dans l'article sur la répétition des bases dans l'ADN des procaryotes qu'au niveau de l'ADN le code génétique est géré par les 2 forces d’appariement et de résonance. C'est le code adénélique que je viens de décrire. Le code génétique ne fait pas apparaître l’appariement. N'intervient dans le tRNA que sa résonance. Cette résonance est différente de celle de son gène puisque celle-ci se fait dans un double brin au lieu du simple du tRNA. C'est la résonance du tRNA qui interagit avec les protéines qui le modifient et définit donc l'aa à accrocher au tRNA. La résonance adénélique du codon apparaît dans les différences entre les 4 codons d'un doublet (2ème et 3ème base). Un codon qui a 2 ou 3 bases identiques, répétition caractéristique de la résonance, se remarque systématiquement par rapport aux 3 autres codons du doublet adénélique. Et de toute façon chaque codon a sa résonance propre comme je l'ai montré avec les archées (ref.).
- Il faut distinguer entre le processus de création du gène de tRNA de sa duplication et de sa duplication excessive. Le processus de création ou genèse des gènes de tRNA est différent dans les 3 domaines puisque celui des archées ne crée pas les codons xyt, cgt compris, ni ata; il crée plus difficilement (indice de multiplicité inférieur à l'unité) pour les xyg alors que les codons xya et xyc ont une multiplicité supérieure à l'unité mais inférieure à celle des mêmes codons bactériens. La genèse des bactéries se différencie de celle des archées par une multiplicité beaucoup plus faible pour les xyg et un peu plus élevée pour les xyc et xya. Elle ne donne pas naissance au codon ata, par contre elle crée cgt et un peu des codons ctt et act. La genèse des eucaryotes est masquée en partie par les duplications et les duplications excessives. En effet elle se distingue des 2 autres domaines par la création de 7 codons xyt, du codon ata et de la bascule cga/cgg. C'est la forte corrélation entre les codons bactériens et eucaryotes qui laissent penser que le processus de duplication s'ajoute à un processus de genèse eucaryote analogue à celui des bactéries.
- Les 3 types de doublets:
- Les colonnes et lignes de force décrites dans l'article répétition concernent l'état vibratoire des tRNAs et non de leurs gènes. État vibratoire, image miroir de celui du brin d'ADN transcrit. Cela reste dans le domaine de la résonance de l'ADN et non du domaine du codon usage ou autrement dit de la sélection. Les forces étaient nettes pour la colonne 2 et 3 puisque les protéines qui fixent l'aa sur le tRNA le font à 100% et le nombre de gènes de tRNA ne rentre pas en jeu.
- Dans le tableau des nombres de gènes de tRNA les valeurs ne sont plus discrètes mais continues et représentent des moyennes, des valeurs qui dénotent le comportement global du codon. On peut encore estimer une force d'une ligne ou d'une colonne, mais les forces entre codons varient de façon continue. L'appréciation de ces forces ne peut se faire que par comparaison entre codons en constituant des groupes homogènes de valeurs proches. Le groupe doit refléter alors une similitude dans sa composition en bases. Ainsi on peut considérer les codons ayant la même base à la même position, ce qu'on analyse en ligne et colonne du tableau, ou bien 2 bases communes à la même position, c'est le classement en doublets. Le groupe d'un doublet adénélique homogène est constitué de 4 codons alors que pour la fixation des aas la colonne 2, homogène, contient 4 doublets traductionnels, soit 16 codons.
- Il y a 3 types de doublets et à chaque type est associé un type de ligne. Les 3 types sont notés 12 23 13 où un chiffre représente la position d'une base du codon. Les 3 types de lignes sont représentées alors par la position de la base manquante, soit respectivement pour les 3 types de doublets 12 23 13, les 3 types de lignes 12x x23 1x3 et avec une autre notation, 12. .23 1.3. Les moyennes des lignes nous renseignent sur la force d'une base à une position donnée dans le codon, mais de par leurs valeurs continues et non discrètes, elles ne permettent pas de les distinguer nettement entre elles. Par contre l'analyse minutieuse des groupes de codons et leur représentation en couleurs vont nous permettre de retrouver les résultats des fixations des aas (les lignes de force de l'article répétitions des bases), et d'appréhender l'agencement des forces de tous les codons et notamment l’imbrication de celles de chaque type de doublet. De cette façon on aura pour la première fois une image de la résonance dans l'ADN. Pour cela, ne pouvant pas représenter cette image en 3 dimensions, nous allons la décomposer en 3 tableaux chacun pour un type de doublet.
- La force d'un doublet est d'autant plus grande, c.a.d qu'il impose son empreinte, que le nombre de ses codons homogènes est plus grand. Pour les fixations des aas on a 2 colonnes entièrement homogènes chacune et différentes entre elles, les 4 lignes sont alors affaiblies, ce qui affaiblit ensuite les 2 colonnes restantes. La situation n'est plus la même pour les doublets, car ses 4 codons contiennent un représentant de chaque type de doublet. Ce qui fait qu'on identifie un doublet par un codon et les 3 autres représentent les 3 types de doublets. Le doublet contient donc nécessairement 2 codons homogènes, les 2 autres pouvant être homogènes ou non. A cela il faut ajouter les codons exceptionnels qui ne participent pas à cette force parce qu'ils sont absents, les 2 codons stops et/ou le codon ata, ou bien ils ont un comportement spécial, atg surexprimé. Le codon tga devrait entrer dans la résonance mais il est toujours sous exprimé. On ne tiendra pas compte donc de 4 codons exceptionnels pour les eucaryotes (taa tag tga atg) et de de 5 pour les procaryotes avec le codon ata en plus.
- Les permutations c/t concernent 2 doublets .xt et .xc pour les types 23, x.t et x.c pour les types 13. Dans les types 12, la permutation se fait dans le doublet. Voir les tableaux des moyennes des doublets. Quand on considère, dans le type 12 la force d'un doublet, la faiblesse de la valeur d'un codon c ou t (se terminant par) se détache nettement des 3 autres codons du doublet alors que pour les codons a ou g la différence est beaucoup plus atténuée.
- Les doublets:
- Voir les tableaux des doublets 12 23 13 et leurs moyennes pour l'analyse qui suit.
- Les doublets 12: Chez les procaryotes la faiblesse des codons xyt et xyg font qu'aucun doublet n'est fort. C'est avec le processus E des eucaryotes qui augmente les valeurs des codons xyg qui fait que la colonne 3 du tableau IV1.12 contient 3 doublets forts homogènes, ca. aa. ga., avec des taux de variance, calculés sur 3 codons, respectivement de 2 9 et 19 %. J'appelle les doublets 12, des doublets traductionnels, parce qu'ils correspondent au code génétique de la traduction et ne reflètent pas les propriétés des gènes.
- Les doublets 23:
- − Chez les archées tous les doublets sont homogènes sauf 3, .ac .gc .aa en ne tablant que sur 3 codons homogènes par doublet (voir les tableaux des doublets 12 23 13). Le tableau II1.23 des moyennes des doublets donne des moyennes sur 4 codons par doublet.
- − Chez les bactéries seuls 6 doublets n'ont pas 3 codons homogènes, .tc .gc .ta .ga .tg .ag. Soit 10 doublets homogènes sur 16. Pour les doublets 23 des eucaryotes et bactéries j'ai fait les moyennes des 3 codons homogènes, sans les permutations c/t, au lieu des 4 codons du tableau des moyennes 12 23 13. Le doublet .ag avec 28% de taux de variance pourrait être considéré comme homogène.
- − Chez les eucaryotes à 31% maximum de taux de variance tous les doublets sont homogènes à 3 codons. Il ne reste plus que 3 doublets, .ag .ga .gg, si on met le maximum de taux de variance à 25%. Le doublet .gg devient homogène si on tient compte de la bascule cga/cgg et le doublet .ga devient plus hétérogène, respectivement pour m e % on a 6.28 1.35 21, contre 8.02 3.97 50 pour .ga. Remarquons que le doublet .ag se positionne comme celui des bactéries avec 27% contre 28% de taux de variance pour les bactéries. La similitude des 2 tableaux pour les moyennes est frappante, avec 2 doublets seulement changeant radicalement quand on passe ds bactéries aux eucaryotes, .ta en diminution et .ag en augmentation. On remarquera dans les 2 domaines la force de la colonne .a. (sauf .ag pour les bactéries) et de la ligne ..c (avec les permutations c/t pour les eucaryotes).
- − Remarque pour les "codon usage": Nous avons vu dans l'étude des protéines des 111 bactéries (ref.) que les doublets .tg et .gg des codons protéiques se comportaient de façon particulière. Dans l'étude des 155 eucaryotes (§3.2.b) j'avais relevé que les codons ttg ctg atg et tgg cgg agg des bactéries avaient des effectifs élevés par par rapport aux codons des doublets .cg .ag et que cette situation se maintenait pour les mêmes codons et le doublet .cg. Ici nous voyons, qu'en plus, dans les 2 domaines le doublet .gg est homogène pour 3 codons et que le codon ggg se comporterait comme les 3 autres du doublets. De même le codon gtg est très élevés par rapport aux doublets .cg et .ag chez les eucaryotes après suppression des duplications excessives.
- Les doublets 13:
- − Chez les archées les moyennes 12 23 13 sur 4 codons laisseraient penser que tous les doublets sont homogènes. Et effectivement c'est le cas étant donné les faibles différences entre les effectifs. Mais comme j'ai déjà montré que même avec ces faibles effectifs on peut structurer les codons comme pour les bactéries (ref.), ce sont les couleurs qui permettent de repérer les doublets vraiment homogènes. Ainsi je n'ai pu distinguer que 5 doublets hétérogènes: t.c, a.c, g.c, t.a, g.a. Il reste donc 11 doublets homogènes à 3 codons. Je ne peux pas utiliser les faibles effectifs de la ligne ..t pour différencier ses 4 doublets.
- − Pour les bactéries le tableau des moyennes à 3 codons montre qu'il y a 8 doublets à taux de variance inférieurs à 26% auxquels il faut ajouter 3 doublets de la ligne ..t où le doublet c.t contient 2 codons à valeurs très élevées, ctt et cgt. Il reste donc 11 doublets homogènes à 3 codons.
- − Pour les eucaryotes la résonance du processus E fait apparaître des différences entre les codons des doublets de la ligne ..g. Les bascules c/t des lignes ..t et ..c dues encore à la résonance du processus E rend hétérogène 4 doublets sur 8. Il reste seulement 6 doublets homogènes à 3 codons: t.t, t.c, c.t, c.c, c.a, g.a. J'avais attribué aux doublets 12 le qualificatif de traductionnel puisque il n'y a que 3 doublets homogènes à 3 codons pour les 3 domaines. J'attribue ici le qualificatif résonnant pour les doublets 13 parce qu'ils font intervenir la résonance du processus E et se présentent comme une onde avec les nœuds 1 et 3, alors que le ventre est la 2ème base. De même j'attribue le qualificatif d’appariement aux doublets 23 car ils rendent homogènes quasiment tous les doublets des 3 domaines.
2.c Quantification des processus de genèse, de duplication et de résonance
modifier- Voir les tableaux Processus E et résonance des 121 eucaryotes pour cette analyse.
- Comparaison eucaryotes/bactéries par les valeurs relatives des codons en couleurs. J'analyse ici les tableaux IV1 et I1 des indices respectivement des eucaryotes et des bactéries.
- Après avoir trié les indices des codons par ordre croissant j'ai défini 4 gammes de valeurs. Une rupture forte entre 2 valeurs successives sert de frontière entre 2 gammes successives.
- - Pour les bactéries la gamme des valeurs supérieures à 1.85, la valeur 1.85 comprise, contient 10 codons, celle de 1.59 à 1.17 12 codons, celle de 1.12 à 0.83 11 codons et enfin celle de 0.68 à 0.22 12 codons. Soit 45 codons.
- - Pour les eucaryotes la gamme des valeurs supérieures à 13.38, la valeur 13.38 comprise, contient 11 codons, celle de 12.07 à 8.95 17 codons, celle de 8.29 à 6.56 5 codons et enfin celle de 5.91 à 2.06 13 codons. Soit 46 codons, ata compris.
- + La coloration des codons:
- − J'ai coloré chez les bactéries les noms des codons d'une couleur d'une même gamme puis j'ai reporté ces couleurs sur les noms des mêmes codons des eucaryotes. En colorant les indices des eucaryotes d'une même gamme avec sa propre couleur, je peux visualiser, directement sur le tableau IV1, la différence relative entre l'indice bactérien et l'indice eucaryote du même codon. Voir la légende des tableaux pour les couleurs des gammes de valeurs. La même couleur est utilisée pour les 2 gammes de même ordre de valeurs relatives des bactéries et des eucaryotes. Comme pour l'homogénéité des doublets au paragraphe précédent, à cause de l'imbrication des forces des doublets entre eux, je considère ici qu'un doublet bactérien se comporte de la même façon que le même doublet eucaryote si 3 codons ont la même couleur pour le nom et l'indice. Cependant, l’imprécision de la frontière des bactéries s'ajoutant à celle des eucaryotes, les 4 codons peuvent être tous différents entre eux ou tous les 4 identiques (en couleur), alors que pour l'homogénéité d'un doublet commence par l'identification de 2 codons de valeurs proches ( voir 2.b, 3 doublets).
- − En ce qui concerne les permutations c/t seul le doublet .tt eucaryote contient le codon ttc permuté: le doublet .tt eucaryote est comparé au doublet .tc bactérien, le .ct eucaryote au .cc bactérien, les 2 .ac entre eux et les 2 .gc entre eux. Il faut remarquer que la permutation cgt est faite dans les 2 doublets, le bactérien et l'eucaryote.
- − La bascule cgg/cga chez les eucaryotes: je n'ai pas permuté les 2 codons , par contre j'ai mis en évidence l'indice du codon cgg dans le tableau IV1.
- + Les changements des codons faibles c/t: Tous ces codons sont homogènes et du coup les 4 doublets le sont aussi chez les eucaryotes. Chez les bactéries les 4 doublets sont homogènes et seulement 3 codons ctt act cgc ont des indices élevés de l'ordre de ceux des codons c/t faibles des eucaryotes. Sinon la différence fondamentale entre bactéries et eucaryotes est la bascule c/t de 7 nouveaux codons suivie d'une multiplication par 100 de tous les indices c et t des codons faibles des eucaryotes.
- + Les doublets forts semblables ou identiques: .cg .ga .ac .tt .aa. Le doublet .cg a ses 4 codons identiques et dans la même gamme dans les 2 domaines. Le doublet .ga a 4 codons identiques mais dans 2 gammes différentes d'indices, et il contient en plus le codon tga à comportement global particulier (exclusion des moyennes des doublets). Deux doublets .tt et .ac ont seulement 3 codons identiques, suffisamment pour les considérer comme ayant un même comportement, notamment .ac. Le doublet .aa a le codon stop taa comme codon identique et le codon gaa eucaryote a un indice à la frontière de la 1ère gamme d'indices ( 12.02 contre 13.38 de la 1ère gamme, le bleu), enfin par ses indices élevés il rend la colonne 3 très forte et homogène par ses 3 doublets chez les eucaryotes.
- + Les doublets forts qui se différencient par 3 ou 4 codons: Il n'y a que de 2 doublets à 2 codons identiques, .gg .tg. Les 5 doublets forts restant ont 3 ou 4 codons différents, .ta .ct .ag .ca .gc.
- − Le doublet .ta: Relativement les indices eucaryotes sont ont été drastiquement réduits par rapport à ceux des bactéries. Puisque les codons tta et cta bactériens passent de la gamme 2 à la gamme 4 chez les eucaryotes et gta de 1 à 4. En plus ata, inexistant chez les bactéries, est créé et dupliqué chez les eucaryotes. Le plus frappant encore c'est que les 4 indices eucaryotes sont quasiment identiques.
- − Le doublet .ag: C'est l'image inverse du doublet .ta. Les codons bactériens sont homogènes et appartiennent à la gamme 4, les codons eucaryotes sont dans les gammes 2 et 1. Et là le plus frappant ce n'est pas tant l'homogénéité cassé par le codon stop, mais la forte ressemblance avec les 2 doublets eucaryotes .ac et .aa; les codons sont dans les mêmes gammes, les codons cac caa cag sont quasiment identiques et les codons aag et gag ont des indices aussi élevés de ceux des 2 autres doublets. Le processus E parait donc adopter le comportement des doublets de la colonne 3, comportement qu'on trouve aussi chez le processus B pour les doublets .ac et .aa, mais pas .ag. C'est comme si le processus E a révélé un comportement qui était caché par le processus B.
- − Analogie avec le microscope: C'est une analogie avec la microscopie en contraste de phase et en polarisation. En contraste de phase on peut différencier les éléments par la couleur, comme avec les bactéries où existe un peu de duplication représentant la couleur. Avec les archées, sans les duplications on a alors du gris. On a du gris plus foncé avec les codons des bactéries à faible indice de multiplicité. En polarisation on se retrouve dans le domaine des eucaryotes où l'état vibratoire du codon est révélé par le processus de duplication des eucaryotes alors que cet état est le même chez les bactéries mais n'est pas révélé par leur processus. Les processus bactériens et eucaryotes sont les équivalents des filtres polarisant. On le voit clairement avec les codons ata gtg gcg et cct. Le facteur multiplicateur n'augmente pas leur duplication au-delà de celle de leurs semblables, tta cta gta pour ata, tcg ccg acg pour gcg, ttg ctg atg pour gtg bien que atg ait acquis ses duplications chez les bactéries alors que son facteur multiplicateur est le même que celui de son carré, et enfin tct act gct pour cct.
- − Parallèle entre les doublets .ta et .ag: Nous venons de voir que les 4 indices du doublet .ta sont presque identiques et que le doublet .ag est son image inverse. Avec l'analogie du microscope on s'attendrait que le processus E révèle taa comme il a révélé ata. Ce n'est pas le cas car le processus E n'a permuté aucun codon xyt avec xyc de la colonne 3. Par contre il l'a fait entre att et atc qui accompagnent le doublet traductionnel at., c'est pour cela que ata est à considérer comme un codon bactérien faible plutôt que comme un codon stop. Par ailleurs l'analogie avec le microscope polarisant est toujours séduisante puisque suivant le filtre polarisant 2 plages peuvent avoir la même couleur ou non. Le filtre du processus B donne la même couleur pour les 3 codons de .ag et est insensible au codon taa alors que le filtre du processus E donne la même couleur pour les 4 codons de .ta et est sensible au codon ata.
- − Les doublets forts à 3 codons différents, .ct .ca .gc: ces 3 doublets présentent 1 ou 2 codons très différents. Mais on n'atteint pas l'originalité des doublets .ta et .ag. Les codons tgc cct gct et tca ont une différence de gammes entre les 2 processus égale 2. L'analogie avec le microscope est moins frappante mais le codon cct partage son indice eucaryote avec 2 autres codons, tct et act, situation intermédiaire entre le doublet .ta et .ag.
- + Les doublets forts à 2 codons identiques: .tg et .gg: les indices des 4 codons du doublet .tg des eucaryotes sont plus grands que le plus grand indice des 4 codons du doublet .cg. De même pour les 2 codons tgg et agg du doublet .gg des eucaryotes. Du côté des bactéries les 6 codons de .tg et .gg, sans gtg et ggg, sont plus grands que le plus grand indice des 8 codons de .cg et .ag; en plus ggg a un indice presque double des 3 autres codons de la même ligne g.g. Comme je l'ai noté au chapitre des 3 doublets ces codons à indices élevés ont un comportement particulier dans l'étude des codons des protéines des 111 bactéries, ou codon-usage (ref.).
- − Pour la comparaison bactéries eucaryotes, le doublet .tg a 2 codons identiques. Il se comporte, pour les 3 codons ttg ctg gtg, comme le doublet .ta: ils ont le même indice chez les eucaryotes alors qu'ils sont différents chez les bactéries. Cependant le comportement est plus atténué, l'indice, 8.95 du codon gtg eucaryote est la limite inférieure de la gamme 2 alors que la limite supérieure de la gamme 3 est de 8.29, et donc la différence des gammes entre les 2 domaines n'est que d'une unité alors que pour le doublet .ta elle est de deux.
- − Le doublet .gg a aussi 2 codons identiques et son comportement est analogue au doublet .ag avec 3 codons bactériens de gamme 3, identiques. De même la situation entre .gg et .ag est atténuée qu'entre les doublets .ta et .tg.
- Après avoir trié les indices des codons par ordre croissant j'ai défini 4 gammes de valeurs. Une rupture forte entre 2 valeurs successives sert de frontière entre 2 gammes successives.
- Comparaison eucaryotes/bactéries après décomposition du processus E en duplication et sensibilité.
- + La sensibilité: On peut considérer le processus B des bactéries comme exempte de duplications du type de celles des eucaryotes (en dehors des duplications excessives ou de résonance), avec un facteur multiplicateur égal à l'unité. L'indice de multiplicité d'un codon bactérien est alors la sensibilité de ce codon au processus B. Le processus E peut être considéré alors de la même façon, produit d'un facteur de sensibilité au processus E et d'un facteur multiplicateur unique, propre aux eucaryotes, ou facteur de duplication. Ce facteur de duplication est la moyenne de toutes les duplications des 121 eucaryotes étudiés. Ce facteur changera alors avec le lot d'eucaryotes sélectionnés débarrassés des duplications excessives. Par contre la sensibilté des codons au processus E devrait rester la même d'un lot à un autre (sans doublons ni répétitions de génome). On peut alors comparer sensibilité bactérienne et eucaryote. En quelque sorte le facteur multiplicateur supprime la relativité qu'on a utilisée au paragraphe précédent.
- + Calcul de la sensibilité relative: J'ai divisé tous les indices (codons forts et faibles) du tableau IV1.23 par 8 pour obtenir le tableau IV1.79 puis j'ai fait la différence, en pourcentage, entre le nouvel indice eucaryote et l'indice des bactéries du tableau I1.23 pour obtenir le tableau IV1.265. Ce dernier représente la sensibilité relative des eucaryotes par rapport aux bactéries. Les nouveaux indices du tableau IV1.79 se rapprochent beaucoup, pour un grand nombre d'entre eux, à ceux des bactéries. Aussi j'ai cherché à obtenir le maximum de nouveaux indices les plus proches de ceux des bactéries. Ainsi j'ai remplacé les rapports du tableau IV1.79 par la fonction rapport du tableur et la différence du tableau IV1.265 par la fonction valeur absolue de la différence, puis dans une cellule du tableur en dehors des tableaux j'ai fait la somme des valeurs absolues des indices relatifs les plus proches de zéro. En faisant varier le diviseur du tableau IV1.79 très vite sont apparus 23 codons qui se détachent des 22 autres (les codons faibles, les 2 codons stop et ata n'entrent pas dans cette étude). Ils sont colorés en jaune dans le tableau IV1.265. La différence entre la valeur absolue de la sensibilté relative la plus élevée du 1er groupe (valeurs proches de zéro) est de 22 environ et celle la plus petite du 2èmme groupe est de 34 environ. Cette différence est très élevée ce qui m'a amené à chercher le minimum de la somme des valeurs absolues des sensibilités relatives du 1er groupe. Le minimum de 265 est atteint pour le diviseur 7.90 du tableau IV1.79. En éliminant, dans le tableau IV1.265, la fonction ABS du tableau, je retrouve de vraies valeurs relatives avec des signes + et −.
- + Quantification de la sensibilité des codons au processus E: Alors qu'au chapitre précédent je comparais codons bactériens et eucaryotes avec des gammes de couleurs, tableau IV1.23, et avec les moyennes à 3 codons ou à 4 codons des doublets, ici la différence entre 2 codons est quantifiée ce qui permet de repérer le codon intrus dans 1 doublet (par rapport aux moyennes homogènes à 3 codons) et d'éviter les frontières entre les gammes. La méthode des gammes a permis de voir rapidement que certains doublets 23 ne changent pas de comportement alors que d'autres le font franchement, ce qui m'a suggéré l'analogie avec le microscope à contraste de phase et le microscope polarisant. La quantification avec les sensibilités relatives va nous permettre d'élargir ces 2 groupes et d'en définir d'autres. Cependant je vais présenter colonne par colonne, car chacune a une dominante propre pour les comportements de ses 4 doublets, en admettant qu'un doublet de 3 à 4 codons faibles est un doublet homogène et que tous les doublets faibles des bactériens sont au moins 50 fois plus faibles que ceux des eucaryotes. Pour apprécier l'homogénéité des doublets j’ai construit les tableaux IV1.79p et IV1.265p sans la permutation des codons c/t. Dans ce qui suit chaque doublet est décrit par le taux variance/moyenne (e/m en %) d'après les tableaux "moyenne 3 codons"/"moyenne 4 codons", eucaryote-bactérie, suivi du codon intrus du tableau des moyennes à 3 codons des eucaryotes et des codons semblables du tableau IV1.265 des sensibilités relatives. La caractéristique de chaque colonne est déduite de tous ces tableaux plus le tableau IV1.23 aux couleurs des bactéries et des eucaryotes.
- Colonne 1: La colonne 1 se distingue par l'hétérogéneité des doublets bactériens et l'homogénéité des doublets eucaryotes. Un seul doublet, .tt, sur 4 est homogène chez les bactéries et hétérogène chez les eucaryotes.
- + .tg, 18-57/18-57, atg, 1 seul codon semblable ttg (-16);
- + .ta, 3-38/8-38, cta, aucun codon semblable;
- + .tc, faible-24/faible-41, atc, 1 seul codon semblable, ttc (1);
- + .tt, 25-tfaible/21-tfaible, ttt, aucun codon semblable.
- Colonne 2: La colonne 2 se distingue par l'homogéneité des doublets bactériens et eucaryotes. Un seul doublet, .ca, sur 4 est homogène chez les bactéries et hétérogène chez les eucaryotes.
- + .cg, 8-12/17-32, gcg, 1 seul codon différent, gcg (143);
- + .ca, 23-5/27-35, tca, 1 seul codon semblable cca (-4);
- + .cc, faible-5/faible-21, pas d'intrus, aucun codon semblable;
- + .ct, 12-tfaible/33-tfaible, gct, aucun codon semblable.
- Colonne 3: La colonne 3 se distingue par des indices les plus élevés que çà soit du côté bactérien ou eucaryote. Seul le doublet .at est homogène dans les 2 domaines et le doublet .ac est homogène chez les eucaryotes seuls. Pour les autres doublets bactériens et eucaryotes, l'hétérogénéité est faible, elle se dispute entre 2 gammes d'indices, même pour le doublet .ag chez les bactéries.
- + .ag, 27-28/27-28, tag, aucun codon semblable;
- + .aa, 23-21/23-21, taa, 1 seul codon différent, gaa (-37);
- + .ac, 14-18/22-28, cac, aucun codon différent;
- + .at, faible-tfaible/faible-tfaible, pas d'intrus, aucun codon semblable.
- Colonne 4: La colonne se distingue par le grand nombre de doublets hétérogènes, 3 pour les eucaryotes et 2 pour les bactéries. C'est aussi la colonne des exceptions: tga, bascule cgg/cga chez les eucaryotes et bascule c/t chez les bactéries. Le doublet .gt constitué de 3 codons faibles est homogène dans les 2 domaines. Seul le .gg bactérien est homogène. Cependant, à cause de la bascule cgg/cga, la moyenne sur les mêmes codons tant bactériens que eucaryotes rend ce doublet bactérien aussi hétérogène que celui des eucaryotes. Pour les 3 codons tgg agg ggg on a respectivement pour m e %: 7.50 2.12 28 pour les eucaryotes contre 0.83 0.26 31 pour les bactéries.
- + .gg, 28-15/40-26, cgg, 1 seul codon différent, cgg (-46);
- + .ga, 31-67/31-67, tga, 1 seul codon différent, cga (233);
- + .gc, 25-46/30-37, cgc, 2 codons semblables agc (20.7) et ggc (-8);
- + .gt, faible-tfaible/faible-tfaible, cgt, aucun codon semblable.
- Colonne 1: La colonne 1 se distingue par l'hétérogéneité des doublets bactériens et l'homogénéité des doublets eucaryotes. Un seul doublet, .tt, sur 4 est homogène chez les bactéries et hétérogène chez les eucaryotes.
- + Quantification de la sensibilité des codons c/t forts au processus E après permutation: Dans le tableau IV1.265 j'ai comparé les codons ttc att ctt gtt eucaryotes aux codons codons .tc bactériens et de même respectivement pour .ct et .cc. J'ai déjà étudié longuement cette comparaison, sans la quantifiée en supposant, étant donné les effectifs élevés des codons et la netteté de la bascule c/t, que les codons sont comparables. Dans le cadre de cette hypothèse la quantification par sensibilité relative montre que sur 8 codons permutés 3 sont semblables, suivant les critères adoptés pour tous les codons (couleur jaune), et ce sont (respectivement codon eucaryote-codon bactérien) att-atc, ctt-ctc et tct-tcc; 3 codons permutés sont quasiment semblables (avec des valeurs absolues à la limite inférieure des critères de similitude du groupe à valeurs élevées, 34%), ce sont gtt-gtc act-acc et cgt-cgc; et 2 codons permutés à valeur absolue élevée, gct-gcc et cct-ccc. En permutant les codons ttc et ttt des eucaryotes la comparaison des doublets .tt-.tc est analogue à celle des doublets .gg-.gg avec 3 codons semblables et un codn quasi semblable. De même la comparaison .ct-.cc est analogue à celle de .tg-.tg avec 1 sembable, 2 intermédiaires et un avec une valeur absolue élevée.
- + La 2ème base du codon dans le processus E:
- J'ai ordonné, dans le chapitre précédent, la description des doublets colonne par colonne parce qu'elles présentent chacune une dominante propre pour les comportements de ses 4 doublets, en admettant qu'un doublet de 3 à 4 codons faibles est un doublet homogène et que tous les doublets faibles des bactéries sont au moins 50 fois plus faibles que ceux des eucaryotes. Je vais détailler ici ces comportements qui sont dus à la 2ème base du codon.
- Remarquons d'abord que l'homogénéité des 15 doublets adénéliques sur 16, comme analysée dans le chapitre précédent, montre que le processus E ne présente pas une seule ligne avec 3 doublets semblables, ce qui aurait défini son homogénéité (avec la règle de 3 sur 4). Deux lignes seulement, la 1 et la 2 du tableau IV1.79p, présentent chacune 2 fois 2 doublets semblables que sont les doublets c/t faibles d'une part et les doublets c/t forts d'autre part. Dans le tableau des sensibilités relatives IV2.265p cette cractéristique est généralisée à toutes les lignes et on a 2 fois 2 doublets semblables par ligne. Ceci m'a ramené à mieux analyser les colonnes, donc la 2ème base du codon.
- C'est ainsi que les 2 colonnes 1 et 2 supportent les 2 caractéristiques du processus E autre que sa duplication, que sont la bascule c/t et les sensibilités relatives négatives. Par contre les colonnes 3 et 4 ne subissent pratiquement ni bascule ni sensibilités négatives. Les sensibilités relatives positives et élevées sont réparties équitablement entre les 2 moitiés, colonne 1 et 2 d'une part et colonne 3 et 4 d'autre part. Ce lien étroit entre sensibilité et bascule se retrouve dans les codons qui ont basculé seuls sans leur doublet 23, à savoir cgt/cgc chez les procaryotes déjà, et cgg/cga chez les eucaryotes, ou bien qui n'ont pas basculé avec leur doublet comme c'est le cas pour ttt/ttc.
- Dénombrons alors ces caractéristiques en ajoutant ttt et ttc aux colonnes 3 et 4 (codons sans bascule), et le doublet traductionnel cg. aux colonnes 1 et 2 (codons avec bascule). Les colonnes 1 et 2 comptent alors un total de 34 codons alors que la 1 et 2 un total de 30.
- Les colonnes 1 et 2 comportent 15 codons non comparables aux bactéries, en gris, et qui constituent la bascule c/t des eucaryotes; elles comportent 19 codons comparables aux bactéries, en couleurs, dont les 3 codons basculés du doublet cg. traductionnel. Sur ces 19 codons, 10 ont une sensibilité négative élevée, 5 une sensibilité négative très faible et enfin 4 ont une sensibilité positive très élevée.
- Les colonnes 3 et 4 comportent 8 codons xyt, en gris, qui n'ont pas basculés et restent comparables à ceux des bactéries. Les codons xyc/t faibles sont comparables à ceux des bactéries mais avec des sensibilités très élevées par rapport à celles des codons forts si on leur applique le même diviseur que ces derniers. Le processus de duplication de ces codons faibles est apparemment différent de celui des codons forts. Comme il n'y a pas bascule pour les codons xyt des colonnes 3 et 4, on peut considérer que leurs sensibilités relatives propres à leur processus de duplication sont analogues à celles des codons forts de ces colonnes. Si on devait leur mettre une couleur pour les caractériser comme les codons forts, elle serait jaune.
- Sur les 22 codons restant des colonnes 3 et 4, 17 ont une sensibilité proche de zéro dont 10 sont positives, 4 ont une sensibilité positive très élevée et seulement 1 codon, gaa, a une sensibilité franchement négative (-37). Les codons stops taa et tag sont considérés comme neutre et rentrent dans ces décomptes. Même si on inclut les sensibilités moyennement faibles négatives, caa (-21) et tga (-20), on ne totalise que 3, loin des 10 sensibilités négatives des colonnes 1 et 2.
- Les zéros des bactéries et des eucaryotes, Genèse des gènes de tRNAs.
- + Sans parler des duplications excessives, le processus E des eucaryotes présente un fort taux de duplication de tous les codons autres que les 16 codons faibles c/t. Tous les indices de multiplicité des codons forts, xyc/t xya xyg, du tableau IV1, sont largement supérieurs à l'unité. Mais un indice supérieur à l'unité ne veut pas dire que tous les génomes de l'échantillon étudié pour un codon donné possèdent ce codon. La non existence de tRNA dans un génome peut être compensée par une forte duplication du même codon chez un autre génome. C'est cette non existence que j'applle "zéros tRNAs", c'est le nombre de génomes, pour le décompte d'un tRNA donné, qui n'ont pas ce tRNA. La question qui se pose alors est celle du taux des "zéros tRNA" dans le processus E. J'ai appelé taux de genèse de gènes de tRNA, le taux des génomes ayant au moins un tRNA pour le codon étudié. Ce taux est inférieur ou égal à l'unité. Comme il est plus facile de compter les "zéros tRNA", dans la base de données gtRNAdb, le taux de genèse est alors l'unité moins le taux des "zéros tRNA".
- + J'ai calculé le taux de genèse d'un codon chez les bactéries et les eucaryotes en dénombrant les génomes qui n'ont pas ce codon dans la base de données gtRNAdb. La méthode de calcul est détaillée dans les tableaux de Genèse des gènes de tRNAs.
- + Taux des codons faibles c/t: Chez les eucaryotes ils sont quasiment égaux aux indices de multiplicité du tableau IV1 qui ne contient pas les duplications excessives. Ce qu veut dire qu'il y a très peu de duplication dans le processus E. Chez les bactéries le taux de ces codons sont au moins 50 fois plus faibles que chez les eucaryotes. Chez ces derniers les taux de genèse des codons c/t faibles sont du même ordre que les codons les plus faibles des bactéries à part le codon ata: codons gtg gcg gag tga cga (tableaux I1.g et IV1.g). Quand on compare au tableau IV1 du processus E, on remarque que les codons faibles c/t des eucaryotes ont un très faible taux de duplication puisque indices de multiplicité et taux de genèse sont pratiquement égaux et tous inférieurs à l'unité. Pour les codons faibles des eucaryotes, la genèse est faible et ne dépasse pas 0.3. Par rapport aux bactéries la genèse des codons faibles est multipliée par, à peu près, un facteur de 50. Il n'y a pas duplication mais multiplication des possibilités de créer ces codons.
- + Taux des codons forts: Cette multiplication des possibilités de création, on la constate chez les codons forts aussi à faible taux de genèse. Cependant le faible effectif de 121 eucaryotes ne nous permet pas de certifier la genèse totale de certains de ces codons. Sur 20 codons à genèse faible sur 46 chez les bactéries seulement 10 présentent une faiblesse notable de la genèse chez les eucaryotes (effectifs des "zéros tRNA" supérieurs à 5) et un nouveau cas apparait avec cta (9 zéros tRNA). Les 10 autres codons restants laissent penser, à cause des faibles effectifs, que la genèse n'est pas totale: 5 ont un effectif de "zéros tRNA" de 2, tta (0.95) et 4 dont la genèse est très faible chez les bactéries acg aag agg ata (taux inférieurs à 0.80); 2 ont un effectif de "zéros tRNA" de 1, gtg (0.31) cgt (0.92); et 3 codons n'ont pas de "zéros tRNA" chez les eucaryotes alors que les bactéries ont un taux inférieur à 0.62, tcg (0.62) cag (0.46) et gag (0.29).
- + Les taux de ces 20 codons, chez les eucaryotes, montrent que la genèse n'est ni homogène ni proportionnelle à celle des bactéries, avec le codon cta dont la genèse diminue même par rapport aux bactéries. Au chapitre des sensibilités les taux des duplications présentent aussi une grande hétérogénéité et c'est pour cela que j'ai attribué le qualificatif de sensibilité qui réunit duplication et genèse pour chaque codon. Ce qui est intéressant de noter c'est que la sensibilité à la genèse est très prononcée pour 9 mêmes codons, bactériens et eucaryotes. Nous retrouvons les caractéristiques d'unicité et de similitude nécessaires à la démonstration de l'hypothèse de la résonance dans l'ADN.
- + La genèse des tRNAs étendue aux 3 domaines pour l'hypothèse de la résonance: en admettant que les tRNAs xxg dans A et E se comportent de la même façon, c'est-à-dire qu'ils ont une genèse asymptotique inférieure à l'unité (c'est notamment le cas de acg aag agg) et que les indices de multiplicité des A sont les mêmes que leurs indices de genèse, alors il reste seulement 6 indices de genèse, sur 32, des tRNAs xxc et xxa qui varient entre les 3 domaines. Ces 6 tRNAs sont ctt/c cta ata cgt/c tta cga. Le caractère exceptionnel d'unicité, outre l'indice de genèse, s'applique à ata cgt/c et cga: ata n'est activé totalement que dans E, la bascule cgt/c apparaît dans B, se maintient dans E et disparaît dans A et la bascule cga/g n'apparaît que dans E. Les 3 autres tRNAs ctt/c cta tta ne manifestent leur unicité que par la genèse entre E et B: ctt/c apparaît dans les 2 domaines, cta dans E et tta dans B. Par ailleurs la similitude de tous les autres tRNAs et notamment cct/c et tga dont les indices de genèse sont nettement inférieurs à l'unité, renforce l'hypothèse de la résonance (dans l'ADN et non de duplication) comme je l'ai souligné précédemment entre E et B.
- Le processus E. IV1, I1, IV1-I1, "Processus E et résonance des 121 eucaryotes". duplications entières du processus E.
- + C'est la sensibilité à la genèse très prononcée pour les 9 mêmes codons, bactériens et eucaryotes, qui ne me permet pas de séparer duplication et genèse pour calculer la différence quantitative entre processus E et B. D'autant plus qu'il est difficile de distinguer, dans mes décomptes, entre la vraie duplication (2 gènes identiques), et 2 tRNAs à séquences différentes ayant le même codon.
- + Le processus E, comme je l'ai défini et construit avec les courbes de tendance des codons, est représenté par le tableau IV1. De même le processus B sera représenté par le tableau I1.
- + La différence quantitative entre les 2 processus E et B:
- Si l'on admet que la résonance dans l'ADN ne change pas fondamentalement entre procaryotes et eucaryotes, parce qu'elle se produit dans l'ADN double brin, la différence de comportement des gènes de tRNA entre les 3 domaines ne peut s'expliquer en 1er lieu qu'avec les différences fondamentales de leurs architectures: différence chimique entre la membrane des archées et celle commune aux bactéries et aux eucaryotes; différence structurelle et fonctionnelle entre la membrane nucléaire, propre aux eucaryotes, et la membrane externe commune à ces derniers et aux bactéries; différence entre un chromosome unique petit et circulaire chez la plupart des bactéries et un grand nombre ( entre 3 et 80) de chromosomes très grands et linéaires chez les eucaryotes.
- La bascule c/t peut être expliquée par l'intervention de la membrane nucléaire lors des réparations de l'ADN qui changerait le codon xyc en xyt mais n'interviendrait pas dans la résonance du gène de tRNA lui-même. Ce qui légitimerait la permutation de ces codons et la comparaison (et la différence) entre codons faibles xyct entre eux d'une part les codons forts xyc/t entre eux d'autre part. Pour cette bascule, j'ai émis très tôt l'hypothèse des introns des gènes de tRNA qui changeraient la résonance du gène et donc la base c en t du codon. La membrane nucléaire serait alors la protectrice de ces tRNAs avec leur intron. Je reviendrai sur ces hypothèses lors de l'étude détaillée des introns des 121 eucaryotes.
- Les taux de genèse et de duplication peuvent être expliqués par le grand nombre de chromosomes, leurs tailles et leurs géométries.
- La signification biologique de la différence entre les 2 processus refléterait la différence de résonance des gènes de tRNA avec ou sans leur intron dans les chromosomes eucaryotes, et la résonance de ces gènes, sans introns, dans le chromosome unique et circulaire bactérien. Il faudrait, en fait, considérer pour les eucaryotes l'indice de multiplicité moyen par chromosome et non la multiplicité totale. Les résultats obtenu avec le tableau IV1-I1 concernent la multiplicité totale. Si on divise par le nombre moyen de chromosomes des 121 eucaryotes on aura alors l'équivalent du tableau IV1.265 des sensibilités relatives puisque le nombre moyen de chromosomes des 121 eucaryotes est à peu près le double du diviseur du tableau des sensibilités ( 17.0 contre 7.9). Dans le tableau IV1-I1 ce sont les différences de multiplicité entre codons qui révèlent leur comportement dans le processus E.
- Voir NB: voir la discussion pour comprendre le changement de mon analyse par rapport à ce qui suit, les duplications à l'identique du processus E.
- Les duplications à l'identique du processus E: Voir la note NB ci-dessus.
- − Corrélation entre les tRNAs des bactéries et des eucaryotes: C'est la corrélation des 40 tRNAs des 121 eucaryotes (Diagrammes Eb45 et Eb40 où les codons aag gag tgc gcc gta de Eb45 font exception). En tenant compte de ces corrélations ma réflexion ci-dessus donne alors un sens concret à la différence E−B. C'est comme si chez les bactéries il n'y a qu'un processus de genèse des tRNAs, avec des duplications non à l'identique et que chez les eucaryotes, à ce processus s'ajouterait un processus de duplication à l'identique proportionnel au processus de genèse. Le processus de duplication à l'identique amplifiant le comportement de chaque base. Le processus E des eucaryotes serait alors la somme de ces 2 processus auquel s'ajouterait le processus R de duplication résonnante qui ne peut être qu'à l'identique étant donné le grand nombre de tRNAs par codons et par génome. Si on veut étudier alors le comportement de duplication à l'identique des codons du processus E, il faudrait soustraire du total des 121 eucaryotes les duplications non à l’identique. Or celles-ci sont indiscernables des autres. Cependant la genèse des codons faibles xyc/t laisse penser que les duplications non à l'identique des codons forts ne dépasseraient que de quelques dixièmes d'indices de multiplicité celle des bactéries. Donc la différence des indices de multiplicité entre bactéries et eucaryotes ne représente pas les duplications à l'identique mais s'en rapproche beaucoup. Pour avoir les valeurs exactes de cette duplication il faudrait enlever l’excès de genèse des eucaryotes par rapport aux bactéries. Ceci est faisable pour les genèses des eucaryotes inférieures à l'unité mais pas pour les codons ayant déjà une genèse supérieure à l'unité chez les bactéries.
- − Comportement des codons eucaryotes dans le processus de duplication du processus E: les différences de multiplicité entre codons du tableau IV1-I1 avec le tableau des duplications entières Moyennes des doublets 23 de la différence E−B IV1, I1, IV1-I1 Différences successives et Groupes de codons dans le texte "Les 3 domaines" au chapitre 3/3.a/−structuration par doublets/point 5.
- Les processus E et R
- + Le comportement de chaque codon: pour la bascule c/t, la genèse, la résonance, la sensibilité relative. B G R S. Les 3 comportements B G S font partie du processus E, s'y ajoute le comportement du processus R que je suppose de type essentiellement duplication ( copie multiple de la même séquence ). J'ai dressé si après la liste des groupes de codon ayant le même comportement B G R S. Sur 62 codons considérés un groupe de 13 codons (N) ne présentent qu'une sensibilité relative neutre (ref.), 25 présentent un seul type de comportement et 24 présentent au moins 2 types de comportement. La sensibilité relative est en gras quand elle est forte (supérieure à 73%). Les codons faibles c/t sont soulignés. "J'ai surchargé ce tableau avec les sensibilités relatives, les résonance de duplication et les genèses de gènes de tRNA." phrase à remanier.
- N 13: ttc cca tcg acg tac cac aac gac aaa agc aga agg ggc
- B 4: att gtt tct act
- G 10: ttg ccg tga +cgc tat aat cat gat ttt agt
- R 3: tgg gga caa
- S 8: tta gta tca aca +cgt tgc ata cag
- BG 7: ctt atc ctc gtc tcc acc ccc
- BS 1: gct
- BGR 1: gcc
- BGS 1: cct
- GRS 2: cga gcg
- GR 1: ggg
- GS 3: cta ctg cgg
- GR 2: tgt ggt
- RS 6: gca gaa atg gtg aag gag
- - Analyse des comportements du tableau IV1-I1:
- + Les duplications entières
- + Le comportement de chaque codon: pour la bascule c/t, la genèse, la résonance, la sensibilité relative. B G R S. Les 3 comportements B G S font partie du processus E, s'y ajoute le comportement du processus R que je suppose de type essentiellement duplication ( copie multiple de la même séquence ). J'ai dressé si après la liste des groupes de codon ayant le même comportement B G R S. Sur 62 codons considérés un groupe de 13 codons (N) ne présentent qu'une sensibilité relative neutre (ref.), 25 présentent un seul type de comportement et 24 présentent au moins 2 types de comportement. La sensibilité relative est en gras quand elle est forte (supérieure à 73%). Les codons faibles c/t sont soulignés. "J'ai surchargé ce tableau avec les sensibilités relatives, les résonance de duplication et les genèses de gènes de tRNA." phrase à remanier.
2.d − Distribution des gènes de tRNAs par codon
modifier2.e − Corrélation entre les gènes des 121 eucaryotes et et ceux des bactéries
modifier- Diagrammes Eb45 Eb40 Eb40d ; Voir le chapitre sur les corrélations entre les 3 domaines ABE. Voir le tableau des diagrammes des corrélations entre codons des 121 eucaryotes et des bactéries
Comparaison avec zebrafish
modifierCritiques
modifier- La caractérisation par les effectifs et la comparaison avec les bactéries restent complexes, surtout avec le non regroupement des codons semblables et la comparaison en pourcentage (pour 100 000 tRNAs).
- La caractérisation des codons par les pentes seules ne suffit pas, il faut surtout le coefficient de détermination qui représente la variance autour de la pente ce qui rend cette caractérisation insignifiante.
- Les comparaisons entre zebrafish et les bactéries ainsi que les eucaryotes n'est pas faisable du fait le comportement physique d'un codon doit être indépendant du génome et donc doit être exprimé par une moyenne d'un effectif élevé des génomes.
Hypothèses
modifier- Pour améliorer la caractérisation des codons par les effectifs et la comparaison avec les bactéries j'ai utilisé l’ordre adénélique du code génétique, c a d qu'une ligne du code est représentée par la 3ème base et non la 1ère, une colonne est représentée par la 2ème base et la 1ère différencie les 4 codons d'un carré se terminant par la même 3ème base, à l'inverse du code traductionnelle. Par ailleurs Je ne compare plus des pourcentages ( effectifs pour 100 000 tRNAs) mais des indices de multiplicité qui permettent de faire des rapports qui ont un sens. Les comparaisons en ligne et colonne seront refaits avec les indices.
- La caractérisation des codons par les courbes se fera surtout avec les courbes de distribution des fréquences de leurs gènes. Ces courbes suivent la loi de Poisson étant les faibles effectifs des codons par génome. Distribution des codons dans le processus E, Distribution des tRNAs des 121_eucaryotes.
- Zebrafish sera comparée de génome à génome avec d'abord les eucaryotes à résonance puis avec quelques uns parmi les 121 sélectionnés pour l'étude du processus eucaryote: Processus Zebrafish et processus de résonance, distribution des codons sur les chromosomes (en cours).
- Schéma du code adénélique: Retour au texte du code.
ADN gène T C G tRNAg A G C . . a g c . t c g ARNm codon t c g tRNA a g c
Caractérisation des codons par les processus de genèse et de duplication des eucaryotes
modifier- Se reporter aux calculs effectués sur les 121 eucaryotes pour la problématique de cette étude.
- Tableau des effectifs calculés des gènes de tRNAs 121 eucaryotes
- Voir le Tableau analysé
- Liens: Résultats des calculs sur les 121 eucaryotes Tableaux des effectifs 121 3 domaines Les duplications excessives, tableau des différences III1−IV1.
Problématique de la comparaison avec les procaryotes et zébrafish
modifier- Chez les procaryotes la duplication est très faible et c'est la genèse qui prévaut. J'ai pu déterminer, dans les 3 domaines, la structuration par codons avec les archées (résultats.3a) et la structuration par doublets avec les bactéries (résultats.2b) qui présentent une bonne duplication par rapport aux archées. Ces structurations étaient possibles tant que la duplication restait faible. Pour zebrafish la situation est analogue à celle des procaryotes, tous les codons ont une forte duplication mais elle est quasi uniforme et l'on peut comparer avec les effectifs rapportés à 100 000 tRNAs. Avec les 121 eucaryotes, comme on l'a vu dans les calculs, la duplication varie continuellement même en réduisant celle des codons décuplés. La caractérisation des codons par les effectifs dépendrait du nombre des eucaryotes étudiés et surtout de celui des eucaryotes présentant des codons décuplés. Par contre si on fait l'hypothèse que le taux de ces derniers eucaryotes est constant, alors la pente de la droite de tendance restera constante et caractérisera mieux les codons pour le processus de duplication seul.
Méthode pour comparer
modifier- J'ai comparé les effectifs (rapportés à 100 000 tRNAs) des 121 eucaryotes réduits dont l'effectif total est de 55 830 (décompte du 3.11.17), de zébrafish dont l'effectif total est de 12 558 et des bactéries dont l’effectif total que j'ai décompté est de 235 027 ( total du tableau des effectifs comptés au 10.1.16 (pour mémoire NCBI/repete110.ods/GC code 110) et non celui des statistiques de la base de données gtRNAdb qui ne lui correspond pas et qui peut varier avec les mises à jour). J'ai comparé les indices de multiplicité des 121 eucaryotes réduits (total 55 830) à ceux des 121 non réduits ( total 92 530) pour repérer les codons décuplés. Enfin j’ai ajouté les tableaux des pentes et des coefficients de détermination des 121 réduits.
Résultats
modifierProcessus E et résonance des 121 eucaryotes
modifier- Voir le tableau analysé
Problématique
modifier- Voir la construction des tableaux, par le calcul, le chapitre "Calculs pour 121 eucaryotes". Dans ce dernier il est spécifié que "Les nombres des effectifs non réduits des 121 eucaryotes sont la somme d'un processus analogue à celui des procaryotes, que j'appelle processus E, et d'un processus de résonance. Il s'agit ici de séparer, par les différences entre les tableaux, entre le processus E et le processus de résonance.
Méthode d'analyse
modifier- La différence est faite "1er tableau de gauche" − "2ème tableau à droite". Le résultat est mis dans un 3ème tableau à droite. Ces différences sont faites entre les indices de multiplicité. Relativement une différence d'indice d'une unité fait doubler celui d'un codon moyen d'une bactérie. Ce qui est élevé. On peut le noter spécialement pour 2 codons faibles, tgt et gcc qui ont un indice inférieur à 0.30 dans le processus E. J'ai coloré en vert foncé les différences supérieures à 4.45, ce qui quintuple l'indice de base.
- − La somme du processus E et du processus de résonance apparaît dans le tableau III1.
- − Le processus E seul apparaît dans le tableau IV1.
- − Le processus B seul apparaît dans le tableau I1.
- − Le processus de résonance seul apparaît dans la différence entre les 121 eucaryotes non réduits par le calcul et les 121 eucaryotes réduits: III1 − IV1.
- Les codons xyc/t forts sont comparés aux forts et les faibles aux faibles, permutation des xyc/t.
Résultats
modifier- − Comparaison des processus E et B, tableaux IV1 et I1 en couleurs.
- − Différence quantitative entre E et B: les caractéristiques de chaque codon pour la bascule c/t, la genèse, la résonance, la sensibilité relative.
- − Distribution des différences: Les duplications se font par nombres entiers.
- − La résonance de duplication
Critiques
modifierHypothèses
modifier- Le contraste de phase: C'est une analogie avec la microscopie en contraste de phase et en polarisation. En contraste de phase on peut différencier les éléments par la couleur, comme avec les bactéries où existe un peu de duplication représentant la couleur. Avec les archées, sans les duplications on a alors du gris. On a du gris plus foncé avec les codons des bactéries à faible indice de multiplicité. En polarisation on se retrouve dans le domaine des eucaryotes où l'état vibratoire du codon est révélé par le processus de duplication des eucaryotes alors que cet état est le même chez les bactéries mais n'est pas révélé par leur processus. Les processus bactériens et eucaryotes sont les équivalents des filtres polarisant. On le voit clairement avec les codons ata gtg gcg et cca. Le facteur multiplicateur n'augmente pas leur duplication au-delà de celle de leurs semblables, tta cta gta pour ata, tcg ccg acg pour gcg, ttg ctg atg pour gtg bien que atg ait acquis ses duplications chez les bactéries alors que son facteur multiplicateur est le même que celui de son carré, et enfin tca aca gca pour cca.
Zebrafish et la résonance de duplication
modifierComparaison Zebrafisch, 121 Eucaryotes, Bactéries
modifierComparaison de Zebrafish aux eucaryotes à résonance
modifierZebrafish, distributions des tRNAs sur les chromosomes
modifierTaurus, distributions des tRNAs sur les chromosomes
modifierDistribution homogène des gènes de tRNA sur les chromosomes, Bos Taurus et Felis catus
modifierExemples de distributions des tRNAs sur les chromosomes
modifierLes introns des 121 eucaryotes
modifierChampignons détail des introns
modifierChampignons détail des tRNAs
modifierNon champignons détail des introns
modifierNon champignons détail des tRNAs
modifierIntrons, Comparaison des introns
modifierIntrons, Comparaison des tRNAs
modifierIntrons, Comparaison des sensibilités relatives
modifierLes modifications des tRNAs en 34 et 37.alpha
modifier- Lien Tableaux: Les modifications des tRNAs en 34 et 37.alpha
Les modifications des tRNAs
modifier- Lien Tableaux: Les modifications des tRNAs