Fiche mémoire sur Synthèse par clade
En raison de limitations techniques, la typographie souhaitable du titre, «
Fiche : Synthèse par clade
Les clusters de gènes tRNA et rRNA chez les procaryotes/Fiche/Synthèse par clade », n'a pu être restituée correctement ci-dessus.
- Lien tableur: Type y cumuls
- Légende: M.aas, moyenne et variance des tRNAs par génome, avec ou sans rRNA.
Sb1. Synthèse type 16s-y-23s5s
M.aas avec |
M.aas sans |
génomes |
blocs |
clade |
lien |
16s23s5s |
16s23s,5s |
16s,23s5s |
cds |
atcgca |
gcaatc |
gca |
atc |
atcgca-cds |
gcaatc-cds |
gca-cds |
cds-gca-atc-gta-cds |
atc-gaa |
atc-gcc |
gca-cca |
gaa |
gcc-gaa |
gaa-cds |
gaa-aaa-gta |
gaa-aaa-gca-gta |
gaa-aaa-gta-cds |
gcc |
atgf
|
14 ± 19 |
50 ± 16 |
11 |
66 |
a-firmicutes |
autres |
43 |
|
|
|
15 |
3 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
21 ± 23 |
48 ± 19 |
43 |
264 |
clostridia |
C4.cumuls |
160 |
|
|
5 |
24 |
23 |
26 |
12 |
3 |
1 |
|
|
|
|
|
|
|
|
|
|
|
8 |
2
|
59 ± 28 |
29 ± 19 |
32 |
288 |
bacilli |
Bx3 |
228 |
|
|
|
44 |
|
15 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 ± 5 |
46 ± 8 |
70 |
203 |
alpha |
alpha |
2 |
|
8 |
|
138 |
17 |
4 |
2 |
31 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
8 ± 4 |
54 ± 11 |
44 |
164 |
beta |
beta |
2 |
|
|
3 |
127 |
|
|
|
32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 ± 6 |
58 ± 20 |
144 |
733 |
gamma |
gamma |
79 |
|
|
|
349 |
15 |
|
4 |
1 |
|
7 |
|
3 |
1 |
4 |
254 |
1 |
3 |
6 |
2 |
3 |
1 |
|
5 ± 3 |
58 ± 12 |
19 |
64 |
delta |
delta |
18 |
|
|
|
42 |
|
1 |
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 ± 3 |
40 ± 3 |
40 |
110 |
epsilon |
epsilon |
|
|
11 |
1 |
41 |
30 |
18 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 ± 0 |
54 ± 10 |
99 |
354 |
actinobacteria |
actino |
330 |
|
|
24 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 ± 5 |
54 ± 17 |
29 |
122 |
bacteroides |
bactero |
18 |
|
|
|
102 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 ± 7 |
28 ± 6 |
20 |
32 |
tenericutes |
tener |
18 |
5 |
|
|
1 |
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 ± 1 |
48 ± 3 |
7 |
15 |
deinococcus |
deino |
2 |
|
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 ± 0 |
48 ± 2 |
8 |
15 |
chloroflexi |
chlor |
8 |
|
|
|
3 |
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 ± 1 |
37 ± 6 |
13 |
16 |
spirochaetes |
spiro |
|
|
2 |
|
2 |
|
7 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 ± 2 |
49 ± 14 |
31 |
78 |
cyanobacteria |
cyano |
17 |
|
|
|
47 |
|
|
13 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 ± 1 |
37 ± 1 |
12 |
17 |
chlamydiae |
chlam |
15 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 ± 1 |
46 ± 2 |
10 |
32 |
thermotogae |
toga |
18 |
5 |
|
|
1 |
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 ± 1 |
49 ± 3 |
5 |
6 |
acidobacteria |
autre |
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 ± 2 |
46 ± 17 |
8 |
15 |
aquificae |
autre |
2 |
|
|
|
13 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 ± 1 |
38 ± 1 |
3 |
6 |
deferribacteres |
autre |
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 ± 4 |
48 ± 19 |
3 |
16 |
fusobacteria |
autre |
11 |
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
6 |
nitrospirae |
autre |
1 |
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
15 |
planctomycetes |
autre |
12 |
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
8 |
synergistetes |
autre |
6 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
9 |
verrucomicrobia |
autre |
|
|
|
|
|
8 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
20 |
total11 |
tot11 |
5 |
|
|
|
13 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
678 |
2674 |
total type |
|
995 |
10 |
34 |
33 |
991 |
96 |
76 |
71 |
68 |
3 |
7 |
2 |
3 |
1 |
4 |
254 |
1 |
3 |
6 |
2 |
3 |
9 |
2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
% type |
|
373 |
3,7 |
13 |
12 |
371 |
36 |
28 |
27 |
25 |
0,7 |
2,6 |
0,7 |
1,1 |
0,4 |
1,5 |
95 |
0,4 |
1,1 |
2,2 |
0,7 |
1,1 |
3,4 |
0,7
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
% groupe |
|
401 |
|
|
|
494 |
|
|
|
|
|
|
|
|
|
|
101 |
|
|
|
|
|
|
|
|
|
|
|
groupe |
|
16s |
|
|
|
atc,gca |
|
|
|
|
|
|
|
|
|
|
gaa |
|
|
|
|
|
|
|
|
|
|
|
type |
|
16s23s5s |
16s23s,5s |
16s,23s5s |
cds |
atcgca |
gcaatc |
gca |
atc |
atcgca-cds |
gcaatc-cds |
gca-cds |
cds-gca-atc-gta-cds |
atc-gaa |
atc-gcc |
gca-cca |
gaa |
gcc-gaa |
gaa-cds |
gaa-aaa-gta |
gaa-aaa-gca-gta |
gaa-aaa-gta-cds |
gcc |
atgf
|
- Lien tableur: Type y par tRNA
- Légende: tri sur %16s, 16s23s5s. Jaune comme les protéobacteria, moins de 28% 16s, cyan comme les firmicutes plus de 53% de 16s.
- - total11, 11 clades mineurs, voir la liste
- Note: Le taux des jaunes ne contiennent pas les gamma
totaux clades génomes blocs
36 678 2674
tRNA cumul % clades génomes notes
gca 1249 316 31
atc 1235 312 31
16s 1039 263 27
gaa 272 69 1 68 sur 144 génomes gamma
cds 121 31 11
gta 13 3 2 6 4 gamma + 2 total11
gcc 11 3 2 6 3 gamma 3 clostridia
aaa 11 3 1 4 gamma
cca 4 1 1 2 gamma
atgf 2 1 1 1 clostridia
total 3957 10* * 1 % des tRNAs rares
Y Les types y
Y.1 Les types y , effectifs
blocs |
clade |
total 16s |
total gca,atc |
total gaa |
%16s |
%tgca |
%tgaa |
gca |
atc |
16s |
cds |
gaa |
rares
|
6 |
acidobacteria |
0 |
6 |
|
0 |
100 |
|
6 |
6 |
0 |
|
|
|
6 |
deferribacteres |
0 |
6 |
|
0 |
100 |
|
6 |
6 |
0 |
|
|
|
9 |
verrucomicrobia |
0 |
9 |
|
0 |
100 |
|
9 |
9 |
0 |
1 |
|
|
164 |
beta |
5 |
159 |
|
3 |
97 |
|
155 |
155 |
2 |
35 |
|
|
203 |
alpha |
10 |
193 |
|
5 |
95 |
|
191 |
189 |
10 |
32 |
|
|
733 |
gamma |
79 |
376 |
273 |
11 |
51 |
37 |
378 |
373 |
79 |
14 |
272 |
29
|
110 |
epsilon |
12 |
98 |
|
11 |
89 |
|
89 |
80 |
11 |
1 |
|
|
16 |
spirochaetes |
2 |
14 |
|
13 |
88 |
|
9 |
7 |
2 |
|
|
|
15 |
aquificae |
2 |
13 |
|
13 |
87 |
|
13 |
13 |
2 |
|
|
|
122 |
bacteroides |
18 |
104 |
|
15 |
85 |
|
102 |
104 |
18 |
|
|
|
6 |
nitrospirae |
1 |
5 |
|
17 |
83 |
|
5 |
5 |
1 |
|
|
|
78 |
cyanobacteria |
17 |
61 |
|
22 |
78 |
|
48 |
61 |
17 |
1 |
|
|
20 |
total11 |
5 |
15 |
|
25 |
75 |
|
15 |
15 |
5 |
4 |
|
2
|
64 |
delta |
18 |
46 |
|
28 |
72 |
|
43 |
45 |
18 |
|
|
|
15 |
chloroflexi |
8 |
7 |
|
53 |
47 |
|
3 |
7 |
8 |
|
|
|
264 |
clostridia |
165 |
99 |
|
63 |
38 |
|
75 |
63 |
160 |
9 |
|
10
|
66 |
a-firmicutes |
43 |
23 |
|
65 |
35 |
|
23 |
18 |
43 |
|
|
|
16 |
fusobacteria |
11 |
5 |
|
69 |
31 |
|
5 |
5 |
11 |
|
|
|
32 |
tenericutes |
23 |
9 |
|
72 |
28 |
|
1 |
9 |
23 |
|
|
|
32 |
thermotogae |
23 |
9 |
|
72 |
28 |
|
1 |
9 |
23 |
|
|
|
8 |
synergistetes |
6 |
2 |
|
75 |
25 |
|
2 |
2 |
6 |
|
|
|
288 |
bacilli |
228 |
60 |
|
79 |
21 |
|
59 |
45 |
228 |
|
|
|
15 |
planctomycetes |
12 |
3 |
|
80 |
20 |
|
3 |
3 |
12 |
|
|
|
17 |
chlamydiae |
15 |
2 |
|
88 |
12 |
|
2 |
2 |
15 |
|
|
|
15 |
deinococcus |
15 |
0 |
|
100 |
0 |
|
|
|
|
|
|
|
354 |
actinobacteria |
354 |
0 |
|
100 |
0 |
|
|
|
|
|
|
|
|
Y.2 Les types y , taux
|
|
Pour 1000 blocs |
Pour 1000 tRNAs
|
blocs |
clade |
gca |
atc |
16s |
cds |
gaa |
rares |
total |
gca |
atc |
16s |
cds |
gaa
|
164 |
beta |
945 |
945 |
12 |
213 |
|
|
2116 |
447 |
447 |
6 |
101 |
|
203 |
alpha |
941 |
931 |
49 |
158 |
|
|
2079 |
453 |
448 |
24 |
76 |
|
733 |
gamma |
516 |
509 |
108 |
19 |
371 |
40 |
1562 |
330 |
326 |
69 |
12 |
238
|
110 |
epsilon |
809 |
727 |
100 |
9 |
|
|
1645 |
492 |
442 |
61 |
6 |
|
16 |
spirochaetes |
563 |
438 |
125 |
|
|
|
1125 |
|
|
|
|
|
15 |
aquificae |
867 |
867 |
133 |
|
|
|
1867 |
|
|
|
|
|
122 |
bacteroides |
836 |
852 |
148 |
|
|
|
1836 |
455 |
464 |
80 |
|
|
6 |
nitrospirae |
833 |
833 |
167 |
|
|
|
1833 |
|
|
|
|
|
78 |
cyanobacteria |
615 |
782 |
218 |
13 |
|
|
1628 |
378 |
480 |
134 |
8 |
|
64 |
delta |
672 |
703 |
281 |
|
|
|
1656 |
406 |
425 |
170 |
|
|
|
total |
7081 |
7079 |
1233 |
393 |
|
|
15786 |
449 |
448 |
78 |
25 |
|
15 |
chloroflexi |
200 |
467 |
533 |
|
|
|
1200 |
167 |
389 |
444 |
|
|
264 |
clostridia |
284 |
239 |
606 |
34 |
|
38 |
1201 |
237 |
199 |
505 |
28 |
|
66 |
a-firmicutes |
348 |
273 |
652 |
|
|
|
1273 |
274 |
214 |
512 |
|
|
16 |
fusobacteria |
313 |
313 |
688 |
|
|
|
1313 |
|
|
|
|
|
32 |
tenericutes |
31 |
281 |
719 |
|
|
|
1031 |
|
|
|
|
|
32 |
thermotogae |
31 |
281 |
719 |
|
|
|
1031 |
|
|
|
|
|
8 |
synergistetes |
250 |
250 |
750 |
|
|
|
1250 |
|
|
|
|
|
288 |
bacilli |
205 |
156 |
792 |
|
|
|
1153 |
178 |
136 |
687 |
|
|
15 |
planctomycetes |
200 |
200 |
800 |
|
|
|
1200 |
|
|
|
|
|
17 |
chlamydiae |
118 |
118 |
882 |
|
|
|
1118 |
|
|
|
|
|
|
total |
1980 |
2577 |
7140 |
34 |
|
38 |
11769 |
168 |
219 |
607 |
3 |
|
|
- gca atc gaa: 2 aas remarquables atc gca pour tout clade sauf deino et actinobactéria qui n'en contiennent pas du tout. Puis pour les gamma 1 aa en plus, remarquable, gaa.
- Les cds: beta + alpha 68 pour 367 blocs et gamma 14 pour 733 blocs soit 10 fois moins. Les actino en ont autant que alpha beta, 24 pour 354 blocs. Les clostridia en ont autant que les gamma, 9 pour 264 blocs. Ils sont très rares chez les autres clades. La véracité des cds
- Les blocs 16s23s5s cassés, 16s,y23s5s: chez les archées ils sont courants et y peut être gca. Il en existe quelques rares cas chez la plupart des clades bactériens accompagnés par une majorité de blocs entiers. Cependant certains génomes n'ont que des blocs cassés. Ainsi Deino en a 13 sur 15 où les blocs sont de la forme 16s, 23s5s-ggc. Il y en a 8 chez les alpha et 11 chez les epsilon tous les deux sous la forme 16s,23s5s.
- Les blocs cassés 16s23s,5s: comme pour les précédents. Ils sont plus rares, 5 pour les tener et 5 pour les toga.
- Les clades bactériens sont regroupés nettement en 3 groupes, le 1er avec moins de 28% de blocs 16s23s5s et 72% de 16s-y-23s5s contient les protéobactéria, le 2ème avec un taux de 16s compris entre 53 et 80 %16s et contient les firmicutes, le 3ème sans type y est représenté par les actino avec un effectif élevé de 354 blocs, il est accompagné par les deino avec un effectif de 15 seulement.
- Les tRNAs y rares:
- - gcc tout seul, proche de gca, 8 chez les clostridia et 1 chez les gamma. Il accompagne gaa et atc chez les gamma, au total dans 11 blocs.
- - aaa gta accompagnent gaa chez les gamma dans 11 blocs, gaa-aaa-gta ou gaa-aaa-gca-gta.
- Les blocs propres aux firmicutes 16s5s-y-23s: bacilli clostridia
- - 16s5s-y-23s avec y absent on a 16s5s23s. Il y en a 6 chez les bacilli sur 288 blocs, 23 chez les clostridia sur 264 blocs et rien dans les a.firmicutes (autres) sur 66 blocs.
- - bacilli: 4 atcgca et 2 16s dont 5 ont un z long et 1 court. En jaune dans le tableau.
- - clostridia: les 23 concentrent 7 des 10 tRNAs rares et le seul long 15aas-16s5s-atcgca-23s des clostridia.
- - Ces blocs se comportent exactement comme les blocs 16s-y-23s5s chez les firmicutes:
- + dans la répartition des types y. Voir le type y
- + dans la répartition des z z' x avec une majorité de z z' x (1-3 ) pour les clostridia et une majorité de z4-23 chez les bacilli. Voir tableau des longueurs
16s5s23s clostridia et bacilli
z / y |
16s |
atc,gca |
gcc |
atgf |
z’
|
sans |
4 |
1 |
2 |
2 |
3
|
1-3 |
1+1 |
5 |
|
|
1
|
4-8 |
|
2 |
1 |
|
2
|
9-23 |
1 |
2 |
1 |
|
|
|
7 |
10 |
4 |
2 |
6
|
x / y |
16s |
atc,gca |
gcc |
atgf |
x
|
1-3 |
3 |
1 |
1 |
|
5
|
4-8 |
|
|
|
|
|
9-23 |
|
1 |
|
|
1
|
|
3 |
2 |
1 |
0 |
6
|
- Note: Les types z' des types x-16s23s5s-z' sont ici incorporés dans les décomptes.
Sb2. Longueurs du type 16s23s5s-z
clade |
sans |
1-3 |
>3 |
total |
% z
|
gamma |
507 |
218 |
0 |
725 |
30
|
alpha |
47 |
145 |
0 |
192 |
76
|
proteo-autres |
320 |
23 |
0 |
343 |
7
|
28 clades |
727 |
43 |
5 |
775 |
6
|
bacilli |
142 |
35 |
111 |
288 |
51
|
clostridia |
119 |
94 |
39 |
252 |
53
|
negativ |
48 |
12 |
6 |
66 |
27
|
- Lien tableur: Les types 1-3 majoritaires
- Légende
- - Colonne 23 clades, regroupe les clades à très faible effectif des 1-3. Ce sont delta (5), 4 clades de Les autres bactéries (1 pour chlam) et les 18 autres clades de autres sans fuso (5). L'effectif de ces 23 clades est de 11, en bas de la 2ème colonne Type.
Z13.1 Les types 1-3 majoritaires
type |
blocs |
%1-3 |
geno |
|
Type |
blocs |
geno |
|
23 clades |
blocs |
geno
|
gamma |
725 |
|
144 |
|
beta |
164 |
44 |
|
5 clades |
|
|
gac-tgg |
66 |
30 |
62 |
|
tac-gga-acc |
10 |
10 |
|
delta |
61 |
19
|
gac |
80 |
37 |
52 |
|
5s |
1 |
|
|
chlamydae |
17 |
12
|
acc- 5s |
46 |
21 |
46 |
|
|
|
|
|
cyano |
75 |
31
|
reste |
26 |
12 |
|
|
deino |
15 |
7 |
|
spiro |
21 |
13
|
total 1-3 |
218 |
100 |
|
|
ggc |
11 |
6 |
|
toga |
20 |
10
|
|
|
|
|
|
|
|
|
|
18 clades |
|
|
alpha |
192 |
|
70 |
|
chloro |
15 |
8 |
|
Acidobacteria |
6 |
5
|
atgf |
139 |
96 |
48 |
|
atgf |
6 |
3 |
|
Aquificae |
15 |
8
|
reste |
6 |
4 |
|
|
|
|
|
|
Armatimonadetes |
1 |
1
|
total 1-3 |
145 |
100 |
|
|
fuso |
16 |
3 |
|
Caldiserica |
1 |
1
|
|
|
|
|
|
aac |
5 |
3 |
|
Chrysiogenetes |
3 |
1
|
bacilli |
288 |
|
32 |
|
reste |
3 |
|
|
Deferribacteres |
6 |
3
|
atgf-gac |
19 |
54 |
19 |
|
|
|
|
|
Dictyoglomi |
2 |
1
|
aac-acc |
7 |
20 |
7 |
|
tener |
32 |
20 |
|
Elusimicrobia |
1 |
1
|
reste |
9 |
26 |
|
|
aac |
3 |
3 |
|
Fibrobacteres |
3 |
1
|
total 1-3 |
35 |
100 |
|
|
reste |
5 |
|
|
Gemmatimonadetes |
1 |
1
|
|
|
|
|
|
|
|
|
|
Ignavibacteriae |
1 |
1
|
clostridia |
252 |
|
43 |
|
actino |
353 |
99 |
|
Nitrospirae |
5 |
3
|
aac |
19 |
20 |
16 |
|
tcc |
2 |
2 |
|
Planctomycetes |
11 |
4
|
aaa |
12 |
13 |
7 |
|
|
|
|
|
Synergistetes |
8 |
3
|
atgi-gca |
10 |
11 |
8 |
|
bacteroi |
122 |
29 |
|
Thermobaculum |
2 |
1
|
ttc |
10 |
11 |
7 |
|
cca,tca |
2 |
|
|
Thermodesulfobacteria |
3 |
2
|
reste |
43 |
46 |
|
|
|
|
|
|
Verrucomicrobia |
9 |
4
|
total 1-3 |
94 |
100 |
|
|
epsilon |
111 |
40 |
|
Candidatus Saccharibacteria |
2 |
2
|
|
|
|
|
|
divers |
7 |
|
|
|
274 |
128
|
a.firmicutes |
66 |
|
11 |
|
|
|
|
|
|
|
|
aac |
5 |
42 |
2 |
|
23 clades |
274 |
128 |
|
|
|
|
reste |
7 |
58 |
|
|
divers |
11 |
|
|
|
|
|
total 1-3 |
12 |
100 |
|
|
|
|
|
|
|
|
|
- Lien tableur: Les types z taux des 1-3
- Légende: du tableau
- - deino*, les blocs sont cassés 16s,23s5s-ggc
- - chlam*, les 5 tRNA sont sur le brin opposé du bloc.
- - tener* 11aas voir la séquence
- - Ligne 16 clades, regroupe les clades à très faible effectif des x+z. Ce sont les 19 clades des autres sans fuso aquifecae planctomycetes.
- Note: clostridia, LOI.BINOMIALE(L641;254;0,0025;0)
- Les z de 4 de long: Voir ci-dessous le tableau des fréquences. Pour clostridia le cds étant considéré comme un intercalaire son bloc est compté comme un 1-3 et donc on a 3 fois 1-3 et 2 fois 4-8, c'est à dire 5 z de longueur 4.
clostridia 1-3 2 * 16s23s5s-ttc-5s-ttc-aaa clostridia 4-8 2 * 16s23s5s-caa-gaa-tac-ggc
16-gca-atc-235-aac-5s-ttc-tgc bacilli 4-8 16-gca-235-gta-gga-atc-gaa
16s23s5s-aaa-cds-5s-aaa
gamma 1-3 16s23s5s-acc-5s-acc-5s
- Les cds des 1-3 en x et z: sont considérés comme des intercalaires pour faire ressortir les tRNAs. Au total 13 blocs:
- - 9 blocs ont le cds après 23s
- - 3 blocs firmicutes ont le cds après le 5s
- - 1 bloc clostridia a le cds avant le 16s
gamma 16gaa23-cds-5s-5s
alpha 16atcgca-*-23-cds-5s-atgf 5
clostridia 16s-cds-16s°-23s-cds-5s
16s23s5s-aaa-cds-5s-aaa
ttc-cds-16s5s-atc-23s-aac-atgf
a.firmicutes 16s23s5s-cds-tgc-tta
16s23s5s-cds-tac-caa
T.desulfobacteria 16atcgca23-cds-5s 2
- Les types majoritaires en fréquence, voir ci-dessous les 2 tableaux des fréquences: Le rouge, un seul type. L'orange 1 seul type à plus de 70% ou bien partagé par 2 ou 3 types.
type n total %
alpha atgf 144 145 99
gamma avant cgg-cac-cca 10 10
gamma 1 gac 80 101 80
gamma 2 gac-tgg 66
acc-5s 46
112 115 97
bacilli après atgf-gac 19
aac-acc 7
26 28 93
bacilli avant cgt-gga 4 5 80
clostridia 2 atgi-gca 10 28 36
clostridia 1 aac 19
aaa 12
ttc 10
41 56 73
beta tac-gga-acc 10 10
tener* après 11aas 5 5
tener avant tac 5 5
deino* ggc 11 11
chloro atgf 6 6
chlam* avant cac 5 5
Z13.2 Les types z taux et fréquences des 1-3
Z13.21 taux des 1-3, après
clade |
total |
1-3 |
1-3% |
x+z |
x+z%
|
alpha |
192 |
145 |
76 |
145 |
76
|
gamma |
725 |
218 |
30 |
240 |
33
|
bacilli |
288 |
35 |
12 |
164 |
57
|
clostridia |
252 |
94 |
37 |
108 |
43
|
a.firm |
66 |
12 |
18 |
18 |
27
|
beta |
164 |
11 |
7 |
14 |
9
|
epsilon |
111 |
7 |
6 |
11 |
10
|
delta |
61 |
5 |
8 |
6 |
10
|
tenericutes |
32 |
8 |
|
20 |
|
deino |
15 |
11 |
|
11 |
|
chloro |
15 |
6 |
|
6 |
|
fuso |
16 |
8 |
|
8 |
|
chlam |
17 |
1 |
|
6 |
|
aquificae |
15 |
1 |
|
4 |
|
|
110 |
35 |
32 |
55 |
50
|
actino |
353 |
2 |
0,6 |
2 |
0,6
|
bacteroides |
122 |
2 |
1,6 |
4 |
3,3
|
cyano |
75 |
|
|
|
|
spiro |
21 |
|
|
|
|
toga |
20 |
|
|
|
|
planctomycetes |
11 |
|
|
|
|
|
602 |
4 |
0,7 |
6 |
1,0
|
16 clades |
54 |
3 |
6 |
5 |
9
|
total |
2625 |
569 |
22 |
772 |
29
|
|
Z13.22 fréquence des 1-3, après
clade |
0 |
1 |
2 |
3 |
4 |
>4
|
alpha |
47 |
145 |
|
|
|
|
gamma |
507 |
101 |
115 |
1 |
1 |
|
bacilli |
142 |
6 |
28 |
1 |
1 |
110
|
clostridia |
120 |
56 |
28 |
6 |
5 |
37
|
a.firm |
47 |
5 |
3 |
4 |
|
6
|
beta |
153 |
1 |
|
10 |
|
|
epsilon |
104 |
7 |
|
|
|
|
delta |
57 |
3 |
1 |
|
|
|
tenericutes* |
19 |
3 |
3 |
2 |
|
5
|
deino* |
4 |
11 |
|
|
|
|
chloro |
9 |
6 |
|
|
|
|
fuso |
8 |
6 |
2 |
|
|
|
chlam |
16 |
1 |
|
|
|
|
aquificae |
14 |
1 |
|
|
|
|
|
|
|
|
|
|
|
actino |
351 |
2 |
|
|
|
|
bacteroides |
120 |
2 |
|
|
|
|
cyano |
75 |
|
|
|
|
|
spiro |
21 |
|
|
|
|
|
toga |
20 |
|
|
|
|
|
planctomycetes |
11 |
|
|
|
|
|
|
|
|
|
|
|
|
16 clades |
51 |
3 |
|
|
|
|
total |
1896 |
359 |
180 |
24 |
7 |
158
|
|
Z13.23 fréquence des 1-3, avant
clade |
1 |
2 |
3 |
>4
|
alpha |
|
|
|
|
gamma |
9 |
3 |
10 |
|
bacilli |
1 |
5 |
|
12
|
clostridia |
5 |
6 |
1 |
2
|
a.firm |
|
|
|
|
beta |
3 |
|
|
|
epsilon |
1 |
1 |
1 |
1
|
delta |
1 |
|
|
|
tenericutes |
5 |
1 |
|
1
|
deino |
|
|
|
|
chloro |
|
|
|
|
fuso |
|
|
|
|
chlam* |
5 |
|
|
|
aquificae |
2 |
|
1 |
|
|
|
|
|
|
actino |
|
|
|
|
bacteroides |
2 |
|
|
|
cyano |
|
|
|
|
spiro |
|
|
|
|
toga |
|
|
|
|
planctomycetes |
|
|
|
|
|
|
|
|
|
16 clades |
1 |
|
1 |
|
total |
35 |
16 |
14 |
16
|
|
- Les z de longueur 1-3 sont en nette rupture avec les z de longueur 4, tableau z13-22. Les z de longueur 4 sont très peu nombreux, 7 sur 2625. Et quand on les compte dans les 1-3 ils contiennent un 5s. Ceux comptés dans les 4-8 s'apparentent aux autres de longueur supérieure à 4 et on en dénombre alors que 3 sur 2625 blocs.
- Les z' des blocs avant 16s x-16s23s5s-z' ont des types apparentés aux blocs sans x, voir analyse des clostridia et les z' des x des bacilli (atgf).
- Les 1-3 se répartissent en clades ayant beaucoup et en clades sans ou avec très peu, tableau sb2 et z13-21.
- - Chez les proteobacteria les alpha se distinguent des gamma par leurs taux de 1-3, 76% contre 30% pour les gamma.
- - Les firmicutes ont un taux de z de 50% mais le rapport 1-3 sur >3 s'inverse entre bacilli et clostrida, respectivement 35/111 et 94/39.
- - Les actino ont la particularité d'avoir 2 z de type 1-3 sur 354 et un seul type y, le 16s23s5s.
- - On peut distinguer donc 3 groupes par leurs taux de z (x + 1-3 + >3)
- Un groupe de 10 clades, à fort taux de z: alpha gamma firmicutes, à grands effectifs, tener deino chloro fuso chlam aquifecae, à petits effectifs.
- Un groupe de 6 clades à très faible taux de z: actino bacteroides cyano, à grands effectifs, spiro toga planctomycetes, à petits effectifs.
- Un groupe de 3 clades à taux de z intermédiaire, avec aussi des effectifs faibles: delta beta epsilon. Leurs taux peuvent évoluer dans un sens ou l'autre si les effectifs venaient à augmenter.
- Le groupe de 16 clades à très faibles effectifs sont donnés pour mémoire.
- Les 1-3 se répartissent en majoritaires et en rares. Seuls les clostridia possèdent beaucoup de rares alors que les alpha possèdent 144 d'un seul type majoritaire, atgf. Il y a 13 types majoritaires (voir la liste jointe au tableau z13.22 des fréquences).
- Les majoritaires se répartissent sur plusieurs génomes et procèdent donc d'un processus général, voir tableau z13.1.
- Les x de type 1-3 des blocs avant 16s, s'ils diffèrent des z 1-3, ont aussi des types majoritaires. Il y a 4 majoritaires chez les x. Voir tableau z13.23.
- Les blocs 16s-5s-23s: sont propres aux firmicutes dans les 1-3 x et >3
- Les blocs 16s23s-*-5s propres aux clostridia, existent en 5aas.
- Les cds des 1-3 (z et x) voir liste
- Note:
- - Sauf pour les clostridia les fréquences ne suivent pas une loi binomiale décroissante de 0 à 3. Les fréquences des alpha sont inversées (en % 24 76 0 0), celles des gamma (70 15 15 0), les bacilli, les clostridia.
- - En plus, à part les clostridia, un clade n'a qu'un à 2 types de z-1-3 se réduisant souvent à un seul aa (alpha atgf, gamma gac).
- - Les clades se constituent en 2 groupes, un avec beaucoup de z-1-3 (alpha …), l'autre avec très peu (actino) pour des effectifs élevés ou moyens.
Z13.3 Les tRNA 1-3 majoritaires
gamma |
total |
% |
|
clostridia |
total |
% |
|
bacilli |
total |
% |
|
31 clades |
total |
clade
|
gac |
151 |
45 |
|
aac |
38 |
26 |
|
atgf |
20 |
31 |
|
aac |
17 |
tener
|
tgg |
73 |
22 |
|
ttc |
19 |
13 |
|
gac |
19 |
29 |
|
5s |
14 |
delta
|
acc |
57 |
17 |
|
aaa |
17 |
12 |
|
aac |
12 |
18 |
|
acc |
13 |
beta
|
5s |
50 |
15 |
|
atgi |
14 |
10 |
|
acc |
7 |
11 |
|
ggc |
11 |
deino
|
tca |
3 |
|
|
gca |
14 |
10 |
|
cgt |
2 |
|
|
gga |
10 |
beta
|
ttc |
2 |
|
|
acc |
5 |
|
|
ctc |
1 |
|
|
tac |
10 |
beta
|
tta |
1 |
|
|
tgc |
5 |
|
|
ctg |
1 |
|
|
atgf |
6 |
chlor
|
tac |
1 |
|
|
5s |
4 |
|
|
gaa |
1 |
|
|
cds |
2 |
|
cds |
1 |
|
|
gaa |
4 |
|
|
tca |
1 |
|
|
gta |
2 |
|
|
339 |
98 |
|
atc |
3 |
|
|
gta |
1 |
|
|
tcc |
2 |
actino
|
alpha |
|
|
|
tta |
3 |
|
|
|
65 |
89 |
|
aga |
1 |
|
atgf |
144 |
96 |
|
gac |
2 |
|
|
a.firmicutes |
|
|
|
atgi |
1 |
|
cds |
5 |
|
|
gga |
2 |
|
|
aac |
6 |
26 |
|
atgj |
1 |
|
cgg |
1 |
|
|
ggg |
2 |
|
|
tgg |
4 |
17 |
|
cca |
1 |
|
|
150 |
96 |
|
gta |
2 |
|
|
cac |
2 |
|
|
cgc |
1 |
epsilon
|
|
|
|
|
aca |
1 |
|
|
cds |
2 |
|
|
gaa |
1 |
|
|
|
|
|
atgf |
2 |
|
|
cgt |
2 |
|
|
tca |
1 |
|
|
|
|
|
cds |
2 |
|
|
acg |
1 |
|
|
tgc |
1 |
|
|
|
|
|
cgg |
1 |
|
|
agc |
1 |
|
|
|
95 |
|
|
|
|
|
ctc |
1 |
|
|
caa |
1 |
|
|
|
|
|
|
|
|
|
ggc |
1 |
|
|
gaa |
1 |
|
|
|
|
|
|
|
|
|
gtg |
1 |
|
|
tac |
1 |
|
|
|
|
|
|
|
|
|
tgg |
1 |
|
|
tgc |
1 |
|
|
|
|
|
|
|
|
|
|
144 |
71 |
|
tta |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
43 |
|
|
|
|
- Lien tableur: Les tRNA 1-3 rares
- Légende
- - Les couleurs correspondent à la classe des tRNA, sans couleur sont des tRNA rares, rouge pour aucun effectif, jaune pour peu rares et cyan grands effectifs avec dégradé.
- - Tableau Z13.3 Les tRNA 1-3 rares, les effectifs de la couleur cyan (max) sont ceux des clades à faible effectif de ces tRNA. Ils correspondent à ceux de la colonne divers du tableau Z13.4 Liste des tRNA 1-3.
- - Tableau Z13.4 Liste des tRNA 1-3, les effectifs sont triés en ordre croissant. Deux colonnes sont affectées aux tRNA qui peuvent exister en grande quantité dans certains clades, max et très faibles dans d'autres, divers. Ainsi on a 713 max, 35 divers, 48 peu rares, 20 rares et 0 de la classe zéro. Le max de acc est égal à gamma + bacilli + beta (10). Le max de 5s est égal à gamma + delta (4).
- Les groupes de tRNA 1-3: 48+1+4-3
tRNA 1-3
classe |
tRNA |
effectif
|
zéro |
14 |
0
|
max |
13 |
22
|
rare |
14 |
19
|
cgc |
1 |
1
|
peu rare |
8 |
48
|
Z13.4 Les tRNA 1-3 de type 16s23s5s-z
Z13.41 Les tRNA 1-3 rares
1-3 |
|
total |
|
atgf |
atgi |
cds |
5s
|
tRNA |
|
103 |
|
2 |
1 |
12 |
14
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
1
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
2 |
tcc |
2 |
tac |
2 |
tgc |
7
|
atc |
3 |
acc |
8 |
aac |
0 |
agc |
1
|
ctc |
2 |
ccc |
0 |
cac |
2 |
cgt |
4
|
gtc |
0 |
gcc |
0 |
gac |
2 |
ggc |
1
|
tta |
5 |
tca |
5 |
taa |
|
tga |
|
ata |
0 |
aca |
1 |
aaa |
0 |
aga |
1
|
cta |
0 |
cca |
1 |
caa |
1 |
cga |
0
|
gta |
5 |
gca |
0 |
gaa |
7 |
gga |
2
|
ttg |
0 |
tcg |
0 |
tag |
|
tgg |
1
|
atgj |
1 |
acg |
1 |
aag |
0 |
agg |
0
|
ctg |
1 |
ccg |
0 |
cag |
0 |
cgg |
2
|
gtg |
1 |
gcg |
0 |
gag |
0 |
ggg |
2
|
|
Z13.42 Liste des tRNA 1-3
tRNA max |
tRNA rare
|
clade |
tRNA |
max |
divers |
tRNA |
divers |
tRNA |
divers
|
|
|
|
|
|
|
|
|
alpha |
atgf |
170 |
2 |
cds |
12 |
aca |
1
|
gama |
gac |
170 |
2 |
gaa |
7 |
acg |
1
|
" |
tgg |
77 |
1 |
tgc |
7 |
aga |
1
|
" |
acc |
74 |
8 |
gta |
5 |
agc |
1
|
firmicutes |
aac |
73 |
0 |
tca |
5 |
atgj |
1
|
gama |
5s |
54 |
14 |
tta |
5 |
caa |
1
|
clostridia |
ttc |
19 |
2 |
cgt |
4 |
cca |
1
|
" |
aaa |
17 |
0 |
atc |
3 |
cgc |
1
|
" |
atgi |
14 |
1 |
cac |
2 |
ctg |
1
|
" |
gca |
14 |
0 |
cgg |
2 |
gtg |
1
|
deino |
ggc |
11 |
1 |
ctc |
2 |
|
|
beta |
gga |
10 |
2 |
ggg |
2 |
|
|
beta |
tac |
10 |
2 |
tcc |
2 |
|
|
|
|
713 |
35 |
|
58 |
|
10
|
|
|
|
|
|
|
|
|
|
Les tRNA z1-3 sur fond de référence
modifier
- Lien tableur: Les tRNA z1-3 sur fond de référence
- Légende: Légende: pour les couleurs voir le tableau référence.
- - Note:
- + Les max se retrouvent dans les références jaunes aux taux supérieurs à 3.7% ( 8 / 13) sauf tgg (78) avec 2.5%. Parmi les 3 valeurs élevées en z-1-3 qui restent 2 ont des valeurs jaunes parmi les plus élevées (atgf 172 51, gac 172 55) et une, a sa valeur jaune moyenne (aac 73 39).
- + Les 4 autres max se répartissent en acc (82 12) complètement dissymétrique mais qui est accompagné de 5s (68 en z-1-3 et quasi nul en référence) dans le type acc-5s des gamma; en gca (14 21) à bascule directe, et en atgi (15 15) en bascule inverse. Les 2 gca et atgi se trouvent dans le type atgi-gca (10) des clostridia.
- + Les z-1-3 rares et peu rares se répartissent apparemment au hasard sur tous les références: ainsi les 14 rares ont 5 sur les blancs (15) et 9 sur les couleurs (30).
z13 Les tRNA 1-3, sur référence
tot |
max |
rare |
|
atgf |
atgi |
5s |
cds
|
816 |
748 |
68 |
|
172 |
15 |
68 |
12
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
1
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
21 |
tcc |
2 |
tac |
12 |
tgc |
7
|
atc |
3 |
acc |
82 |
aac |
73 |
agc |
1
|
ctc |
2 |
ccc |
|
cac |
2 |
cgt |
4
|
gtc |
|
gcc |
|
gac |
172 |
ggc |
12
|
tta |
5 |
tca |
5 |
taa |
|
tga |
|
ata |
|
aca |
1 |
aaa |
17 |
aga |
1
|
cta |
|
cca |
1 |
caa |
1 |
cga |
|
gta |
5 |
gca |
14 |
gaa |
7 |
gga |
12
|
ttg |
|
tcg |
|
tag |
|
tgg |
78
|
atgj |
1 |
acg |
1 |
aag |
|
agg |
|
ctg |
1 |
ccg |
|
cag |
|
cgg |
2
|
gtg |
1 |
gcg |
|
gag |
|
ggg |
2
|
- le classement des z-1-3: voir le calcul des majoritaires d'après le classement des types, et voir les rares.
- Comparer avec
- - Le type y, gca se caractérise par la bascule firmicute, un z-1-3 monolytique avec atgi-gca et un taux de 31%, unique en y. Le tRNA gca intervient aussi dans les blocs doublons des 9-23 des bacilli en compagnie de tta gta aca aac ggc.
- - Les z longs des firmicutes, voir la note sur les références des firmicutes en z longs.
- - Le type x: Voir la synthèse des x.
- Tableaux de multiplicité: alpha (atc 241 gca 239 atgf 236), gamma et actino bacteroidites.
- - gamma
- + > 250 max 377 aaa, ggc gaa gta aac 311, cgt atgf gac atc gca 283, ctg 252. tac 227 ttc 175.
- + < 10 gtg gcg gag
- - bacteroi, > 200 atc 295 gca 286. < 10 gtg gcg.
- - actino, max ggc 184 gtc 145 gag 143, mini gcg 86 et reste > 99.
Les type z supérieurs à 3 synthèse
modifier
Les type z supérieurs à 3 synthèse, caractéristiques
modifier
- Ce type z est quasiment propre aux firmicutes. J'ai trouvé deux exceptions, chez les tenericutes (6 génomes dont 5 z et un z') et epsilon (1 génome sous forme de type x).
- Le taux des z par rapport aux blocs sans z est proche de 50% contrairement aux alpha gamma actinomycètes chez qui ce rapport est respectivement de 76 30 et 99%.
- Le taux z1-3/z>3 est inversé entre bacilli et firmicutes.
- La frontière z3-z4 est très nette.
- Les séquences de tRNAs supérieures à 3 se trouvent aussi chez les avant-16s, dans les types x et/ou z' ( les avant-16s s'écrivant sous la forme x-16s-z', où 16s représente le bloc interne comprenant 16s 23s 5s et éventuellement quelques tRNAs entre 16s et 23s).
- La frontière paraît très nette entre z8-z9 chez les bacilli où les z9 ont un effectif de 25 contre seulement 3 pour z8. Chez les clostridia c'est moins nette 4 contre 3. J'ai analysé donc les z4-8 et les z9-23 séparément.
- Les séquences des z > 3 se caractérisent par
- - une grande variabilite de la longueur allant de 4 à 33 avec une moyenne de 13.9 chez les bacilli (97 15 12 blocs pour z9-23 z4-8 x9-23); chez les clostridia de 4 à 43 avec une moyenne de 13.0 (24 14 6 blocs pour z9-23 z4-8 x-16s-z')
- - au niveau total des tRNAs la multiplicité est due à la multiplicité des z et non à des doublons dans le même z contrairement aux cluster sans rRNAs étudiés dans les annexes. Les bacilli ont jusqu'à 14 z9 doublons.
- - Absence des doubles de tRNAs par répétition dans le bloc, cependant 2 blocs ont présenté des duplications de séquences. C'est ainsi dans le bloc de 33 aas de bacilli où il y a 2 séquences de 10 aas identiques séparées par une séquence de 8 autres, et dans un bloc de 8 aas d'epsilon avec 2 séquences de 3 qui se suivent.
- - La majorité des tRNAs composant ces séquences longues, z z' x, ne concerne qu'une vingtaine d'aas dans leurs cumuls chez les bacilli et les clostridia, B-C total blocs longs (tRNAs en jaune). Ramenés pour 1000 tRNAs les jaunes paraissent semblables mais les rouges basculent entre bacilli et clostridia, ainsi gca (37-2) aga (1-37) ttg (19-0). D'autres tRNAs sont équivoques. C'est pour cela que j'ai voulu lever ces cas équivoques, dans le tableau B2-C2 de la même référence, en calculant la plus grande variation en % des variations en pour 1000 de B2 moins C2, le dénominateur étant le plus faible entre B2 et C2 pour un tRNA donné. Effectivement apparaissent 2 nouvelles bascules tcc avec une variation de 898 et cgt avec 233 comparée à la plus petite variation rouge précédente, ttg de 1860. Les jaunes ont une variation inférieure à 78 (gga) en valeur absolue.
- Comparaison des z9-23 B-C avec la loi binomiale.
- - J'ai signalé ci-dessus qu'une grande différence entre B et C est due au grand nombre de doublons z9-23 des bacilli par rapport à celui des clostridia. J'ai éliminé donc les doublons et je ne considère donc ici que la comparaison sans les processus de duplication. Ainsi certains aas seront moins avantagés par les duplications. Les tableaux z9-23 des bacilli et des clostridia donnent les effectifs sans doublons et montrent les tRNAs qui sont avantagés (en jaune foncé).
- - Je n'ai pas intégré les z4-8 car ils contiennent peu de tRNAs (93+83) et pouraient faire intervenir des processus différents de ceux des z9-23.
- - De même je n'ai pas intégré les x longs des 2 clades car ceux des bacilli se comportent clairement de façon différente des z9-23. Les x9-23 des bacilli au nombres de 12 blocs ont très peu de duplication mais les blocs ne diffèrent que par 1 à 3 aas, ce qui fait que certains aas sont très avantagés. En plus le tRNA ctc, rare dans les totaux des z longs, est très avantagé aussi. Chez les clostridia les x longs se comportent comme les z longs.
- - Les types z9-23 des 2 clades, sans doublons, sont donc homogènes et comparables (tableaux B-C.4 5 6), avec 45 blocs et 709 aas pour les bacilli, 21 blocs et 351 aas pour les clostridia. Dans cette référence (tableaux B-C.1 2 3) je compare aussi les totaux précédemment étudiés dans les grandes variations. Les aas ggc et gga apparaissent significativement différents entre les 2 clades alors qu'ils ne le sont pas en ne tenant pas en compte les doublons, et je n'ai pas pu les distinguer avec les grandes variations. Ce résultat justifie à lui seul, la nécessité d'éliminer les doublons pour la comparaison des 2 clades.
- - J'utilise ici la loi binomiale en prenant comme probabilité de base les taux des bacilli à partir desquels je calcule les taux espérés des clostridia pour un effectif de 351 aas, ainsi que leur intervalle de confiance.
- - comparaison des z9-23 bacilli et clostridia: Voir le classement des aas par groupes de pourcentages.
- + 23 tRNAs (jaune) entre les 2 clades, tous significativement semblables.
- + 7 bascules entre les 2 clades, 7 rouges, tous significativement différents.
- + 15 tRNAs très déficients, en clair. Les différences significatives sont rares pour ces tRNAs, dues aux faibles effectifs.
- + quasi absence des 5s et des cds.
- - Le référentiel: La somme des z9-23 des bacilli et des clostridia fait 1060 blocs, assez grande pour la comparer à d'autres processus aux faibles effectifs, surtout pour les 23 tRNAs semblables dont la somme a un sens. La couleur rouge des bascules indiquera si le type x y z z' à comparer va dans le même sens que les bacilli ou ou celui des clostridia. De même le référentiel fera ressortir un effectif élevé des aas en clair (déficients chez les z9-23 des firmicutes). Le référentiel se présente sous forme d'effectifs, tableau B-C.9 somme des tableaux B-C.4 et B-C.5 de la comparaison B-C ou sous forme de pourcentages, tableau B-C.8.
- Comparaison des Cz'B-C9-23
- - Les z'9-23 sont ceux de 32 aas de 2 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 351 des z9-23, soit 383 aas contre 1060 des bacilli.
- - Les résultats sont les mêmes qu'avec les z9-23 B-C du paragraphe précédent à la différence près qu'ils sont plus précis faisant apparaître ggc comme bascule (voir les bascules en bas des notes de ces tableaux).
- Liens aux tableaux: B-C C-B somme, B-C 105.
- Jusqu'ici je considérait les z4-8 comme les z9-23 pour leur contenu en aas. C'est comme ça que j'avais additionné tous les z longs dans le tableau de comparaison du total des B et des C et que j'avais pu repérer les 1ers indices des bascules entre B et C (aas en rouge). Mais l'analyse plus fine que j'ai abordée au chapitre précédent en excluant les doublons des z9-23 m'a conduit à exlure aussi les avant-16s des bacilli pour leur comportement aberrant (paragraphe 3). Et pour plus d'homogénéité dans la comparaison des z9-23 B-C j'avais exclu les z4-8 aussi. C'est cela qui m'a conduit à comparer les effectifs des z4-8 B-C.
- Comparaisons CzB-C4-8 et CzC-B4-8
- - Les bascules des z9-23 B-C sont conservées dans les z4-8 B-C: C'est un résultat très important à cause des faibles effectifs pour certaines bascules des Z9-23 B-C mais aussi sur l'incertitude de la taille de mon échantillonnage en général. Du fait que ces bascules se font toujours dans le même sens cela confirme leur existence et du coup les bascules propres aux z4-8, différentes des bascules z9-23 dans leurs comparaisons entre elles (C4-8/B4-8) ou avec les z9-23 (Bz9-23 /Cz9-23), prennent de la valeurs et pourraient avoir un sens.
- - Les bascules propres aux z4-8: J'ai adopté au début le même principe d'homogénéité que pour la comparaison des z9-23 B-C, je n'ai comparé que les z en excluant les avant-16s.
- - Avec uniquement les effectifs et au visu seulement j'ai repéré 8 bascules aac 10-5 gta 11-5 gaa 6-11 acc 5-1 cca 6-1 caa 2-7 gga 1-7 atgj 5-0. atgj 5-0, est une bascule 9-23. C'est renforcé par le fait que atgi+atgj fait dans 9-23, 21 pour 709 bacilli contre 22 pour 351 clostridia. Mais dans 4-8 la bascule atgj n'est pas respectée 5/0 au lieu de 0/5.
- - Comparaison des z4-8 avec la loi binomiale: Pour utiliser la loi binomiale je dois utiliser le clade au total le plus élevé (B 93) pour définir la probabilité de référence, effectif de l'aa divisé par le total. Hors pour des effectifs faibles certains aas sont nulles et donc leur probabilité de référence sera nulle, non utilisable pour les estimations. Ces aas ne seront pas comparés. Pour se faire il faut repartir de l'autre clade (C 83). Ce que je ai fait dans le paragraphe suivant. Trois types de différences significatives:
- + cgt, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
- + atgj, cet aa appartient aux bascules des z9-23 mais ne confirme pas le sens de la bascule, il change de sens. Cela serait une caractéristique des z4-8
- + caa gga gga confirment la bascule propre aux z4-8.
- - Comparaison inverse C-B: Ici les probabilités de référence sont calculées sur les C4-8 avec un total de 83 aas. Deux types de différences significatives:
- + gca, cet aa appartient aux bascules des z9-23 et confirme cette bascule, sans changer de sens.
- + acc cca caa gga gta confirmant 3 nouvelles bascules propres aux z4-8, acc cca gta.
- - La comparaison des B-C et C-B révèle donc 6 bascules propres aux séquences de 4-8 de long, acc cca gga caa gaa gta qui n'appartiennent pas aux bascules des z9-23 et atgj qui appartient aux z9-23 mais qui change de sens dans les z4-8.
- Comparaisons Cz'B-C4-8 et Cz'C-B4-8
- - Les z'4-8 sont ceux de 17 aas de 3 blocs des clostridia, les bacilli n'en ont pas (x-16s23s5s-z'). Je les ai ajoutés aux 83, soit 100 aas contre 93 des bacilli.
- - Les résultats sont les mêmes sauf gta qui cède la place à gac: dans les z4-8 les bascules respectives sont 11-5 et 5-8 et dans les z'4-8 11-7 et 5-10. Une seule différence significative apparaît pour gta dans z4-8 sur 2 attendues et inversement dans z'4-8 c'est le cas de gac. Si j'adopte les bascules in visu, il serait intéressant de considérer 8 bascules propres aux blocs de longueurs 4-8: acc cca gga caa gaa gta gac atgj.
Comparaison des z9-23 / z4-8 B-C
modifier
- Liens aux tableaux: 9-23/4-8, Cz'B-C9-4, 9-23/105
- Remarque sur la comparaison z9-23 B-C: Si j'adopte les mêmes différences entre z9-23 bacilli et clostridia (diviser les bacilli par 2, procédé in visu que j'ai adopté au chapitre précédent) je ne trouve que 2 tRNAs présentant une bascule outre les rouges, ggc 20.5-12 et gga 11.5-17, tgc 10.5-6 étant la limite (9-23/4-8, tableaux B-C.9 et B-C4-8 somme B+C ). Ceci montre l'absence d'autres bascules que les rouges remarqués dans cette comparaison.
- Pour la comparaison z9-z4 je compare la somme Bz9-23 + Cz9-23 à la somme Bz4-8 + Cz4-8 et la somme Bz9-23 + Cz'9-23 à la somme Bz4-8 + Cz'4-8. Ce qui donne les tableaux 9-23/4-8 et Cz'B-C9-4. A la différence de la comparaison des z4-8 où les effectifs sont faibles et où j'ai du faire 4 tableaux Cz'B-C4-8 et des Cz'C-B4-8, ici je n'en fait que 2 grâce aux effectifs élevés des sommes des z4-8, 176, et des sommes des z'4-8 de 193. Les aas tca et gta ne sont pas significativement différents des z9-23 avec l'échantillon à 176 aas (9-23/4-8) et le deviennent avec 193 aas (Cz'B-C9-4).
- Signification de la comparaison z9-23/z4-8: Alors que les bascules dans les comparaisons z9-23 et z4-8 concernent 2 processus dans chaque clade et donc sont propres aux clades, les bascules de la comparaison z9-23/z4-8 ne concernent plus les clades mais les 2 types z9-23 et z4-8 donc leurs longueurs. On assiste là à la manifestation de la propriété physique de l'ADN et non des fonctions protéiques éventuelles dans les processus affectés aux clades.
- Les différences significatives de la comparaison z9-23/z4-8: Elles sont au nombre de 8.
- - Il y a 2 groupes un à bascules fortes et l'autre à bascule faible. Pour ce faire je fais le rapport cz'4-8 attendu (total 193) sur z'9-23 (total 1092). Pour un effectif nul je le remplace par l'unité. J'obtiens ainsi,
- + les bascules fortes atgf 55-6 cac 35-6 tgg 28-6 tca 33-6. Elles sont toutes directes de z9 vers z4. Le rapport de la bascule n'est pas inférieur à 4.9.
- + les bascules faibles aac 42-96 gta 62-102 gaa 61-108 acc 13-34. Elles sont toutes indirectes de z4 vers z9. Le rapport de la bascule n'est pas supérieur à 2.6.
- - Les intervalles de confiances sont solides: par là j'entends qu'avec un échantillon plus grand on aura toujours une différence significative ce qui rend la bascule réelle et effective.
- + L'existence effective de la bascule entre z9-23 et z4-8 pourrait être réduite à 2 intervalles de confiance solides avec une différence à la borne élevée: ce sont atgf avec une différence de 2,6 et aac avec 4,2, les 2 tRNA s'appuyant sur de grands effectifs.
- + Mais une solidité légèrement plus faible va toujours dans le même sens de la réalité des bascules de cette comparaison. Deux tRNA ont une différence à la borne de 1,3 et 1.8: cac gaa s'appuyant aussi sur de grands effectifs. Je considère que c'est une différence significative. gaa et cac ont respectivement dans le tableau 9-23/4-8, 1.0 et 1.1.
- + Quatre tRNAs pourraient porter sujet à caution, ce sont tgg tca gta acc avec soit des effectifs les plus faibles des 8 bascules, soit des différences à la borne aussi faibles avec respectivement 0.6 0.1 0.6 0.7 (Cz'B-C9-4) et 0.3 -0,2 -0.1 0.9 dans le tableau 9-23/4-8.
- - Manifestation de la propriété physique de l'ADN peut être à l'origine des bascules dans z9-23 et dans z4-8: Voir synthèse des bascules. Deux tRNA acc et gaa ont une bascule dans z4-8 et dans z9-z4, et atgj a une bascule dans z9-23 et dans z4-8.
- * La même bascule i9-4 est provoquée par C (gaa 6-13) ou B (acc 5-1) dans z4-8. La bascule d9-4 est provoquée par B et C dans z9-23 et leur absence simultanée dans z4-8 pour atgf cac tgg tca.
- * Pour atgj on a donc (i9, d4) et l'état de z9-4 dépend de C dans z9-23 (30-60) et de B dans z4-8 (5-0).
- * L'état de z9-4 dépend donc de B et/ou C dans Z4-8 et dans z9-23. Comme l'état de z9-4 est la manifestation physique de l'ADN (atgf cac tgg tca) les états des z9-23 et z4-8 le sont aussi.
Historique du typage x-16s-y-23s5s-z
modifier
- La question des duplications des tRNAs reliées à leurs fonctions [1]: Dans ce but j'ai commencé à étudier les duplications des tRNAs dans les opérons à RNAs.
- - Les intercalaires: Très vite est apparue l'idée que la structure en boucle du tRNA devrait opposer une résistance à la réplication et aux réparations de l'ADN. Ceci aurait pour conséquence une destruction du tRNA et surtout des rRNAs qui contiennent l'équivalent de 1 20 40 structures de type tRNA pour respectivement 5s 16s 23s. Cette opposition aux maintenances de l'ADN engendre aussi la conservation de ces gènes de génération en génération. Elle devrait se traduire aussi par une très grande variabilité des intercalaires. C'est ce que j'ai mis en évidence dans cette première approche.
- - 1ère ébauche du typage. En partant toujours de l'article (article qui introduit les opérons longs de tRNA et les opérons mixtes de tRNA et de protéines, page 17 [2]) qui m'a mis sur la voie des opérons à RNAs j'ai étudié les duplications chez E.Coli, où la duplication ne se fait plus dans ces opérons, mais dans un cluster de tRNAs seuls. Ce qui m'a amené à comparer les intercalaires en relation avec le %GC de 16 génomes. Petit à petit sont apparus alors les types z et y (notation, 16s-y-23s5s-z ou x-16s-y-23s5s-z'), d'abord z puisqu'il est à l'origine des duplications et les différences de celles-ci entre bsu et eco, ensuite est apparu y qui s'imposait par la constance du cas atc-gca qui n'a aucune relation avec la fonction des tRNAs.
- - Les cds: En partant toujours de l'article qui parle de 2 opérons tRNAs+protéine, tpr et tufB, j'ai ajouté à mes intercalaires ceux des cds intra clusters et à leurs bordures dans eco cds. L'étude des cds est faite dans plusieurs génomes des annexes.
- - Le typage x y z, les longueurs de z: Si les annexes permettent de repérer les duplications avec ou sans rRNAs, les fiches ne concernent que les clusters à rRNAs sans l'encombrement des intercalaires. J'ai échantillonné chaque clade avec le 1er génome de la rupture du tri sur les 2 1ers qualificatifs du nom. Cette étude m' a permis alors de définir plus proprement les types et notamment de définir les 3 longueurs de z, sans z, 1-3 et >3 tRNAs. Ainsi sont apparus les 1-3 majoritaires de z dont l'exemple impressionnant des alphas. L'abondance d'un type donné de z1-3 pose alors le problème du génome: est-ce que cette abondance est due au fait que je suis tombé sur un génome particulier ou bien c'est une propriété générale. Dans la quasi totalité des cas il y a plusieurs génomes pour un type donné.
- - Le typage x-y-z', x n'est pas un accident: Ce n'est qu'à la synthèse finale sur les x que j'ai démontré leur existence propre et qu'ils ne sont pas dus à un réassemblent au hasard, par les réparations de l'ADN, d'un cluster 16s-y-23s5s-z. Les destructions et les réassemblements sont étudiés dans les comparaisons entre 2 génomes proches phylogénétiquement: ecoN-eco, bsu-lmo, cdc - cdc8.
Hypothèse de la contrainte physique du cluster
modifier
- Voir dans la comparaison des z9-23/z4-8, la manifestation physique de l'ADN (dernier paragraphe).
- Voir comparaison B+C z2/z1 et comparaison B+C z4-8/z1-3.
- Notes:
- - La force des gènes tRNAs, émise dans l'historique précédent
- - Comparaison entre les longueurs des types de séquences et non entre clades: La somme B+C annule l'influence du clade et on passe au clade supérieur, ici les firmicutes. Le processus en cause pour une longueur donnée réagit par rapport à la caractéristique commune des clusters firmicute et cette réaction est différente entre les 2 longueurs comparées. Cette réaction est la contrainte physique du cluster dans son ensemble, c'est à dire les 3 rRNAs, 16s 23s 5s.
- - Comment se fait alors la création du gène de tRNA: exclure la création base par base et la façon de l'alphabet suivant un programme prédéfini. Elle se ferait plutôt par appui sur un modèle et ce modèle serait ici le 5s. Les processus comparables sont la réplication, l'édition de gène par CRISP (qui fait intervenir un brin RNA avec DNA et les protéines de réparations) et le transfert d'un domaine protéique entre gènes de protéines.
- - Ce type de création explique la fréquence élevée d'un type de séquence créée et donc les répétitions que j'ai relevées pour les z9-23 ne sont pas des copies d'éléments mobiles mais des créations identiques. La fréquence d'une séquence donnée est le résultat de la facilité avec laquelle la contrainte physique du cluster est résolue par le processus de réparation/réplication.
- - Cela explique aussi que les types x de x-16s-y-23s5s-z' fassent intervenir des tRNAs et des séquences différentes des z, avec des fréquences plus faibles, car ce processus x change le sens de la direction de réparation/réplication qui, apparemment se fait dans le sens 16s 23s 5s.
- - La destruction des clusters conserve les séquences de tRNAs et ne détruit que les rRNAs. Voir
- - Un autre processus est à l'origine de la création de séquence de tRNAs dans les clusters sans rRNAs où les gènes sont répétés alors que dans les clusters avec rRNAs les gènes ne sont jamais répétés. Cas des actinomycètes où le processus z est réduit à 2 z1-3 pour 354 blocs étudiés.
- - Si on revient au processus de création de type alphabet, nous voyons que le processus par modèle le reproduit mais par gène et non base par base. Le gène tRNA étant rigide (feuille de trèfle) le modèle est reproduit à l'identique sauf pour 3 bases (codon) ou 5 (codon plus les 2 bases l'entourant très sensibles lors de la maturation des ttRNAs) qui varient sous la contrainte physique du cluster dans le bloc de réparation.
- - La synthèse des z longs supérieurs à 3 m'a conduit à penser que même les comparaisons B-C révèlent la différence entre les 2 clusters qui contraignent différemment la réparation.
- - L'ajout des autres firmicutes ne modifie pas les résultats.
- - La comparaison entre proteobacteria, alpha + gamma, obéit toujours à la même hypothèse de la contrainte phsique du cluster.
- les longueurs, les taux, les génomes, les cds, les 16s5s23s, les cassés deino, les z' équivalents aux z. Sans z 1-3 4-8 9-23
- En conclusion: Malgré la ressemblance forte entre clostridia et bacilli pour les z longs, que ça soit les z9-23 (23 tRNAs jaunes) ou les z4-8 (17 sur 23 jaunes), les bascules fortes rouges ttg gca aga, la déficience en atgf chez les z4-8 et les caractéristiques uniques des x9-23 des bacilli ainsi que les nombreuses petites différences relevées (notamment les bascules des z4-8) laissent penser que chaque type de longueur z ou x correspond à un processus de création différent, Ce sont z1-3 z4-8 z9-23 et pour les avant 16s, x1-3 x4-8 x9-23 z'1-3 z'4-8 z'9-23.
- Suite *******
- Dans les totaux des blocs longs: les 2 types de bascules, tga cga ata (à compter sur toutes les bactéries), le 14 des ctc, ccc gcc gtc, 5s et cds.
- Les cds internes ? pas de cds chez les bacilli beaucoup chez clostridia et autres firmicutes, 16s23s5s-cds-tgc-tta.
- Les blocs bizarres 16s5s-*-23s propres aux firmicutes.
- Tableau de multiplicité des bacilli
- Tableau de multiplicité des clostridia
- Lien tableur: Type x récapitulatif
- Légende:
- - 16*, autres dans les autres bactéries contient 19 clades dont 16 n'ont pas de avant 16s. Les 3 autres sont acidobacteria (acido) aquificae gemmatimonadetes (gemmati) listées en dernier.
- - total blocs, somme du tableau + différents + incomplets. Voir pour chaque clade ses blocs (tableau) et ses notes (différents + incomplets).
- Notices: absence des x et y pour actino et x pour alpha
- - l'absence des x et y pour actino et x pour alpha peut être estimée par 2ơ, racine(effectif*p*(1-p))*2, l'intervalle de confiance[1] de la loi binomiale[2]. Pour p=0.01 la différence effectif*p moins 2ơ devient négative alors qu'elle reste positive pour p=0.02. Pour cette dernière valeur de p, zéro type avant 16s est statistiquement différent de effectf*0.02 puisque zéro est en dehors de l'intervalle effectf*0.02±2ơ. Pour actino (effectif de 354) il y a donc moins de 7 type x et y (354*0.02) et pour alpha (effectf de 208) moins de 4 de type x. Cela reste vrai pour le z de actino dont l'effectif est 2.
AV Bactéries. Récapitulatif des avant 16s, x.
AV1 Les taux des avant 16s par clade
références |
clade |
type |
longs |
courts |
sans |
total x |
total blocs |
x %
|
courts |
bacilli |
avant |
12 |
6 |
− |
18 |
288 |
6
|
longs |
|
après |
|
15 |
3 |
|
|
|
courts |
clostridia |
avant |
2 |
12 |
− |
14 |
264 |
5
|
longs |
|
après |
5 |
4 |
5 |
|
|
|
gamma |
gamma |
avant |
|
22 |
− |
22 |
742 |
3
|
|
|
après |
|
5 |
17 |
|
|
|
epsilon |
epsilon |
avant |
1 |
3 |
− |
4 |
113 |
4
|
|
|
après |
|
|
4 |
|
|
|
tenericutes |
tenericutes |
avant |
1 |
6 |
− |
7 |
32 |
22
|
|
|
après |
1 |
4 |
2 |
|
|
|
beta |
beta |
agc |
|
1 |
1 |
3 |
165 |
2
|
|
|
atgf |
|
2 |
2 |
|
|
|
delta |
delta |
gca |
|
1 |
1 |
1 |
64 |
2
|
bacteroi |
bacteroides |
cgt |
|
1 |
1 |
2 |
126 |
2
|
|
|
aac |
|
1 |
1 |
|
|
|
chlam |
chlam |
cac |
|
5 |
5 |
5 |
17 |
|
acido |
acidobacteria |
aag |
|
1 |
1 |
1 |
6 |
|
aquificae |
aquificae |
cca-aga-atgf |
|
1 |
1 |
3 |
15 |
|
|
|
gcc |
|
2 |
2 |
|
|
|
gemmati |
gemmati |
cca-aga-aag |
|
1 |
1 |
1 |
1 |
|
autres |
cyano |
|
|
|
|
|
82 |
|
|
spiro |
|
|
|
|
|
25 |
|
|
chlor |
|
|
|
|
|
15 |
|
|
deino |
|
|
|
|
|
17 |
|
|
toga |
|
|
|
|
|
20 |
|
apha |
alpha |
|
|
|
|
|
208 |
|
actino |
actino |
|
|
|
|
|
354 |
|
autres |
16 clades* |
|
|
|
|
|
86 |
|
autres |
a.firmicutes |
|
|
|
|
|
67 |
|
|
totaux |
|
longs |
courts |
sans |
total x |
total blocs |
x %
|
|
|
avant |
16 |
65 |
- |
|
|
|
|
|
après |
6 |
24 |
47 |
|
|
|
|
|
|
|
|
|
81 |
2730 |
3
|
|
|
|
|
|
|
|
|
|
|
clades étudiés |
|
|
|
|
|
total tRNAs |
|
|
total |
37 |
|
|
|
|
courts av |
112
|
|
avec x |
12 |
|
|
|
|
courts ap |
51
|
|
sans x |
25 |
|
|
|
|
longs av |
197
|
|
|
|
|
|
|
|
longs ap |
48
|
|
AV2 Les types courts des avant 16s
clade |
type avant |
n |
type après |
n
|
bacilli |
cgt-gga |
4 |
atgf-gac |
14
|
|
ctc-gga |
1 |
gta |
1
|
|
gga |
1 |
|
|
clostridia |
atgf |
1 |
aac |
2
|
|
gca-atc-gga |
1 |
aac-aac |
1
|
|
atgi-gca |
1 |
aac-atgf |
1
|
|
cag-gag |
1 |
|
|
|
5s-atgi-gca |
1 |
|
|
|
tcg |
1 |
|
|
|
tcc |
1 |
|
|
|
gac-ttc-ggc |
1 |
|
|
|
tca-tcc |
1 |
|
|
|
agc |
1 |
|
|
|
ttc-cds |
1 |
|
|
|
cgg-tgg |
1 |
|
|
gamma |
cgg-cac-cca |
10 |
|
|
|
agc-gta |
3 |
gac-tgg |
4
|
|
atgf |
3 |
x-tgg |
1
|
|
aaa |
2 |
|
|
|
ttc |
1 |
|
|
|
atgj |
1 |
|
|
|
cgg |
1 |
|
|
|
ttg |
1 |
|
|
epsilon |
aag-caa-atgf |
1 |
|
|
|
aac |
1 |
|
|
|
aac-aac |
1 |
|
|
tenericutes |
tac |
5 |
aac |
1
|
|
aaa-cta |
1 |
aac-5s-aac |
1
|
|
|
|
gta-aac |
2
|
beta |
agc |
1 |
|
|
|
atgf |
2 |
|
|
delta |
gca |
1 |
|
|
bacteroides |
cgt |
1 |
|
|
|
aac |
1 |
|
|
chlam |
cac |
5 |
|
|
acidobacteria |
aag |
1 |
|
|
aquificae |
cca-aga-atgf |
1 |
|
|
|
gcc |
2 |
|
|
gemmati |
cca-aga-aag |
1 |
|
|
|
- Note: ici le z remplace le z' dans la notation x-16s23s5s-z'
type x en court et long, x – z.
clade |
xcou |
xcou-zcou |
xcou-zlon |
xlon |
xlon-zcou |
xlon-zlon |
total
|
gamma |
17 |
5 |
|
|
|
|
22
|
bacilli |
1 |
5 |
|
2 |
10 |
|
18
|
clostridia |
4 |
4 |
4 |
1 |
|
1 |
14
|
epsilon |
3 |
|
|
1 |
|
|
4
|
tenericutes |
1 |
4 |
1 |
1 |
|
|
7
|
reste |
16 |
|
|
|
|
|
16
|
|
42 |
18 |
5 |
5 |
10 |
1 |
81
|
- Lien tableur: Type x tRNAs
- Légende:
- - Les couleurs adoptées ici sont celles des tRNA 1-3 rares des types 16s23s5s-z.
- - Le petit tableau précédent le grand affiche le total des effectifs de chaque couleur correspondant au degré de rareté des 1-3 de tpye z. Ainsi il y a 7 tRNA de classe zéro avec un effectif de 10, alors que chez les z cette classe a 14 tRNA avec un effectif de zéro.
- Notice: 10 blocs x de gamma dans 10 génomes différents ne sont pas décomptés ici, avec x = cgg-cac-cca. Les 3 tRNAs sont rares. Ils se répartissent en 4 types de blocs différents: 4 16atcgca235 2 16atcgca235-gac-tgg 2 16gaa235 2 16gaa235-gac-tgg
tRNA 1-3
classe |
tRNA |
effectif
|
zéro |
7 |
10
|
max |
12 |
40
|
rare |
9 |
21
|
cgc |
0 |
0
|
peu rare |
5 |
11
|
x16 Les tRNAs de type x-16s23s5s
x16.1 Sur couleurs de fond des types 16s23s5s-z
x-16 |
|
total |
|
atgf |
atgi |
cds |
5s
|
tRNA |
|
82 |
|
8 |
2 |
1 |
1
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
3 |
tcc |
2 |
tac |
5 |
tgc |
|
atc |
1 |
acc |
|
aac |
4 |
agc |
5
|
ctc |
1 |
ccc |
|
cac |
5 |
cgt |
5
|
gtc |
|
gcc |
2 |
gac |
1 |
ggc |
1
|
tta |
|
tca |
1 |
taa |
|
tga |
|
ata |
|
aca |
|
aaa |
3 |
aga |
2
|
cta |
1 |
cca |
2 |
caa |
1 |
cga |
|
gta |
3 |
gca |
4 |
gaa |
|
gga |
7
|
ttg |
1 |
tcg |
1 |
tag |
|
tgg |
1
|
atgj |
1 |
acg |
|
aag |
3 |
agg |
|
ctg |
|
ccg |
|
cag |
1 |
cgg |
2
|
gtg |
|
gcg |
|
gag |
1 |
ggg |
|
|
x16.2 Liste des tRNA x-16s
tRNA max |
tRNA rare
|
clade |
tRNA |
max |
divers |
tRNA |
divers |
tRNA |
divers
|
|
|
|
|
|
|
|
|
alpha |
atgf |
- |
8 |
cds |
1 |
atgj |
1
|
gama |
gac |
- |
1 |
gaa |
0 |
cca |
2
|
" |
tgg |
- |
1 |
tgc |
0 |
caa |
1
|
" |
acc |
- |
0 |
gta |
3 |
agc |
5
|
firmicutes |
aac |
- |
4 |
tca |
1 |
aga |
2
|
gama |
5s |
- |
1 |
tta |
0 |
|
11
|
clostridia |
ttc |
- |
3 |
cgt |
5 |
cta |
1
|
" |
aaa |
- |
3 |
atc |
1 |
ttg |
1
|
" |
atgi |
- |
2 |
cac |
5 |
gcc |
2
|
" |
gca |
- |
4 |
cgg |
2 |
tcg |
1
|
deino |
ggc |
- |
1 |
ctc |
1 |
aag |
3
|
beta |
gga |
- |
7 |
ggg |
0 |
cag |
1
|
beta |
tac |
- |
5 |
tcc |
2 |
gag |
1
|
|
|
- |
40 |
|
21 |
zéros |
10
|
|
|
|
|
|
|
|
|
|
x13 Les tRNA 1-3, sur référence
tot |
|
|
|
atgf |
atgi |
5s |
cds
|
82 |
|
|
|
8 |
2 |
1 |
1
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
3 |
tcc |
2 |
tac |
5 |
tgc |
|
atc |
1 |
acc |
|
aac |
4 |
agc |
5
|
ctc |
1 |
ccc |
|
cac |
5 |
cgt |
5
|
gtc |
|
gcc |
2 |
gac |
1 |
ggc |
1
|
tta |
|
tca |
1 |
taa |
|
tga |
|
ata |
|
aca |
|
aaa |
3 |
aga |
2
|
cta |
1 |
cca |
2 |
caa |
1 |
cga |
|
gta |
3 |
gca |
4 |
gaa |
|
gga |
7
|
ttg |
1 |
tcg |
1 |
tag |
|
tgg |
1
|
atgj |
1 |
acg |
|
aag |
3 |
agg |
|
ctg |
|
ccg |
|
cag |
1 |
cgg |
2
|
gtg |
|
gcg |
|
gag |
1 |
ggg |
|
- Légende: pour les couleurs vour le tableau référence.
- - Les tRNAs en foncé correspondent aux doubles des 97= blocs. Le rouge est l'exception des bacilli x-16s. Ici les 2 tableaux ayant été construits auparavant sont mis côte à côte pour la comparaison, tableau B9-23.2 et tableau B9-23. 12 Blocs avant 16s
- Comparaison x z, bacilli. Il n'y a pas x-16s23s5s-z.
B9-23. Comparaison x z
B9-23.2 Effectifs 45 blocs #
tot |
45# |
|
|
atgf |
atgi |
5s |
cds
|
709 |
|
|
|
34 |
7 |
|
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
27 |
tcc |
14 |
tac |
27 |
tgc |
15
|
atc |
24 |
acc |
9 |
aac |
28 |
agc |
13
|
ctc |
4 |
ccc |
|
cac |
24 |
cgt |
30
|
gtc |
3 |
gcc |
1 |
gac |
37 |
ggc |
41
|
tta |
19 |
tca |
24 |
taa |
|
tga |
|
ata |
|
aca |
33 |
aaa |
32 |
aga |
1
|
cta |
20 |
cca |
28 |
caa |
29 |
cga |
|
gta |
39 |
gca |
22 |
gaa |
38 |
gga |
23
|
ttg |
16 |
tcg |
2 |
tag |
|
tgg |
21
|
atgj |
14 |
acg |
2 |
aag |
|
agg |
|
ctg |
7 |
ccg |
|
cag |
|
cgg |
|
gtg |
|
gcg |
|
gag |
|
ggg |
1
|
|
B9-23. 12 Blocs avant 16s, x-16s.
tot |
12x |
|
|
atgf |
atgi |
5s |
cds
|
157 |
|
|
|
5 |
|
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
1 |
tcc |
|
tac |
|
tgc |
|
atc |
3 |
acc |
|
aac |
12 |
agc |
11
|
ctc |
10 |
ccc |
|
cac |
|
cgt |
13
|
gtc |
|
gcc |
|
gac |
13 |
ggc |
3
|
tta |
3 |
tca |
2 |
taa |
|
tga |
|
ata |
|
aca |
2 |
aaa |
12 |
aga |
|
cta |
6 |
cca |
13 |
caa |
12 |
cga |
|
gta |
10 |
gca |
2 |
gaa |
12 |
gga |
11
|
ttg |
|
tcg |
|
tag |
|
tgg |
1
|
atgj |
|
acg |
|
aag |
|
agg |
|
ctg |
|
ccg |
|
cag |
|
cgg |
|
gtg |
|
gcg |
|
gag |
|
ggg |
|
|
- Lien tableur
- Légende: Pour les couleurs voir le tableau C9-23.1. Les 2 qui le suivent correspondent au tableau de leur somme déjà étudié les clostridia avant 16s: le tableau à 5 blocs contient les séquences longues z et le tableau à 2 blocs contient les séquences x.
- Comparaison x z, clostridia. cd112 a un tRNA en plus non décompté, tcg-16s23s-gca-5s-12aas. cd001 contient du x et du z longs 5aas-16sgcaatc23s5s-6aas.
- - Autres x-16s, tenericutes et epsilon pour le 3ème tableau. Voir
- + aac-gaa-gta-aca-aaa-cta-16s23s5s tn012
- + 2*(aaa-gta-gac)-aaa-gag-16-gcaatc-235 ep057
- - Tenericutes 11aas, pour le 2ème tableau. Ce clade a 4 autres 16-atc-235-11aas, les 5 11aas ont une séquence identique.
- + tac-16-atcgca-235-gta-aca-aaa-tta-gca-atgj-atgi-tca-atgf-gac-ttc
C9-23. Comparaison x z
C9-23.1 Effectifs 21 blocs #
tot |
21# |
|
|
atgf |
atgi |
5s |
cds
|
351 |
|
|
|
20 |
9 |
|
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
17 |
tcc |
1 |
tac |
14 |
tgc |
5
|
atc |
8 |
acc |
4 |
aac |
13 |
agc |
7
|
ctc |
1 |
ccc |
2 |
cac |
10 |
cgt |
6
|
gtc |
3 |
gcc |
4 |
gac |
21 |
ggc |
12
|
tta |
10 |
tca |
8 |
taa |
|
tga |
|
ata |
|
aca |
16 |
aaa |
19 |
aga |
13
|
cta |
11 |
cca |
12 |
caa |
13 |
cga |
|
gta |
21 |
gca |
0 |
gaa |
21 |
gga |
17
|
ttg |
0 |
tcg |
1 |
tag |
|
tgg |
6
|
atgj |
13 |
acg |
1 |
aag |
1 |
agg |
|
ctg |
4 |
ccg |
2 |
cag |
1 |
cgg |
2
|
gtg |
|
gcg |
|
gag |
2 |
ggg |
|
|
C4-23 5 Blocs avant 16s, 16s23s5s-z.
tot |
5z |
|
|
atgf |
atgi |
5s |
cds
|
48 |
|
|
|
2 |
2 |
|
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
2 |
tcc |
|
tac |
3 |
tgc |
1
|
atc |
1 |
acc |
|
aac |
3 |
agc |
1
|
ctc |
|
ccc |
|
cac |
1 |
cgt |
|
gtc |
|
gcc |
|
gac |
4 |
ggc |
1
|
tta |
2 |
tca |
1 |
taa |
|
tga |
|
ata |
|
aca |
4 |
aaa |
3 |
aga |
1
|
cta |
1 |
cca |
1 |
caa |
1 |
cga |
|
gta |
4 |
gca |
|
gaa |
4 |
gga |
1
|
ttg |
|
tcg |
|
tag |
|
tgg |
1
|
atgj |
1 |
acg |
|
aag |
1 |
agg |
1
|
ctg |
|
ccg |
|
cag |
|
cgg |
|
gtg |
|
gcg |
|
gag |
|
ggg |
|
|
C4-23 2 Blocs avant 16s, x-16s.
tot |
2x |
|
|
atgf |
atgi |
5s |
cds
|
20 |
|
|
|
1 |
|
|
|
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
1 |
tcc |
|
tac |
1 |
tgc |
2
|
atc |
|
acc |
|
aac |
1 |
agc |
1
|
ctc |
|
ccc |
1 |
cac |
|
cgt |
1
|
gtc |
1 |
gcc |
|
gac |
1 |
ggc |
3
|
tta |
|
tca |
|
taa |
|
tga |
|
ata |
|
aca |
|
aaa |
1 |
aga |
|
cta |
|
cca |
1 |
caa |
|
cga |
|
gta |
1 |
gca |
|
gaa |
1 |
gga |
|
ttg |
|
tcg |
|
tag |
|
tgg |
|
atgj |
1 |
acg |
|
aag |
|
agg |
|
ctg |
1 |
ccg |
|
cag |
|
cgg |
|
gtg |
|
gcg |
|
gag |
|
ggg |
|
|
- Le 1/3 des clades a des blocs avec x (récapitulatif en bas du tableau AV1)
- Mais la moyenne par clade est de 3% des blocs (Av1, colonne x%)
- Quand un x-16s a un z', x-16sy23s5s-z', ce z' est souvent le même que le z dans les blocs, 16sy23s5s-z. Voir dernière colonne de Av2. Les types x sont différents donc des z courts en général, voir _x_.
- Comparaison des fréquences des tRNA 1-3 _z_ et _x_: Ces 2 tableaux montrent clairement que les x-16s et les 16s23s5s-z sont très différents, même quand un clade n'a pas de tRNA exceptionnels. Ainsi chez les x les rares rouges et blancs sont abondants alors que chez les z les rouges n'existent pas du tout. On a respectivement, pour jaune blanc rouge, 11 21 10 pour un total de 82, soit 50% chez les x et 48 20 0 pour un total de 103, soit 76%, chez les z. Cependant les divers cyan sont sous-estimés chez les z. Si on admet que les divers sont répartis au hasard, les clades max devraient en contenir autant. En doublant les divers (44) chez les z le total des 4 couleurs serait alors de 112 et le taux des jaunes + blancs + rouges serait de 68/112 = 61%, chez les z. Ceci montre qu'il y a un glissement aussi des divers vers les rares, jaune blanc rouge.
- Les types x-16s cgg-cac-cca au nombre de 10 chez les gamma renforcent encore cette différence entre x et z, les 3 tRNA sont de la classe blanc, rares et non rares.
- Comparaison des tRNA des x et z longs: Voir le tableau des types x en court et long
- - La dissymétrie quasi totale entre les bacilli (12 x-longs) qui n'ont pas de z-longs et les clostridia (5 z longs) qui n'ont qu'un seul x-long non ambigu montre bien que le processus à l'origine des avant 16s n'est pas aléatoire, c'est à dire qu'ils ne sont pas des réarrangements au hasard de blocs déjà produits par le processus de base. Cependant ce processus avant 16s paraît dérivé du processus de base. Ainsi le processus de base des bacilli donne très peu de 1-3 (voir pourcentage des z) et son processus avant ne donne que des x 9-23 longs (12) et peu de x 1-3 (6). Voir le récapitulatif. Le processus de base des clostridia donne beaucoup de 1-3 et son processus avant donne un seul x-long de 15aas et 12 x 1-3. Les clostridia donnent un bloc intéressant 5aas-16s23s5s-6aas qui s'apparente aux x 1-3 et ne peut être produit par le processus de base et donc est propre au processus avant des clostridia.
- - Les tRNA rares des x-longs: Les 12 x-longs des bacilli se différencient des 97 z-longs (tableau 97=) par le fait que les 10 blocs différents entre eux ne diffèrent que par 1 à 2 tRNA ce qui donne un tableau de tRNA très hétérogène alors que celui des z-long est homogène. C'est une propriété du processus avant des bacilli. La caractéristique des tRNA rares que j'ai montré pour les x 1-3 est moins évidente pour les x longs mais elle existe. Ainsi pour les bacilli le ctc rare chez les z-longs se trouve dans 10 x-longs comme une caractéristique de multiplication du processus avant. De même l'unique x-long des clostridia arbore 3 tRNA rares dont le plus rare d'entre eux, le ccc, les 2 autres sont gtc et ctg.
- - J'ai signalé d'autres x-longs appartenant à epsilon et aux tenericutes. Epsilon contient un tRNA rare aag et les tenericutes contiennent 5 séquences identiques, 1 x-long et 4 z-long (sans x) avec gca qui fait partie de la bascule bacilli-clostridia (ref).
- Les x sur fond de référence des z longs des firmicutes.
- Les réarrangements des clusters RNA (ref.) conservent les tRNA et les blocs avant-16s et surtout ne détruisent que les 16s et 23s.
- Les bacilles n'ont pas de cds intra bloc sur 288 blocs.
- Notes
- - récapitulatifs des cassés pour comparer avec les archées, 16s, 23s5s.
- - récapitulatifs des autres cassés, 16s*23s, perte du 5s
- - récapitulatifs des abîmés pour la théorie des cds