En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : archeo
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/archeo », n'a pu être restituée correctement ci-dessus.
- Lien tableur: mfi opérons
- Liens: gtRNAdb [1], NCBI [2], génome [orgn]
- Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanobacteria; Methanobacteriales; Methanobacteriaceae; Methanobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
Ar1. mfi opérons, Methanobacterium formicicum DSM1535
41.2%GC |
17.8.19 Paris |
47 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
|
157153..157563 |
CDS |
|
36 |
36 |
|
|
137 |
|
|
comp |
157600..157683 |
ctc |
|
246 |
246 |
|
|
|
|
|
|
157930..158232 |
CDS |
|
|
|
|
|
101 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
211693..213681 |
CDS |
|
206 |
206 |
|
|
663 |
|
|
|
213888..213971 |
tcg |
|
281 |
281 |
|
|
|
|
|
|
214253..215677 |
CDS |
|
|
|
|
|
475 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
314088..314264 |
CDS |
|
50 |
50 |
|
|
59 |
|
|
comp |
314315..314487 |
caa |
@1 |
-1 |
-1 |
|
|
|
|
|
comp |
314487..314654 |
CDS |
|
|
|
|
|
56 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
317759..318211 |
CDS |
|
198 |
198 |
|
|
151 |
|
|
comp |
318410..318494 |
tcc |
|
177 |
177 |
|
|
|
|
|
comp |
318672..319634 |
CDS |
|
|
|
|
|
321 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
419250..419975 |
CDS |
|
156 |
156 |
|
|
242 |
|
|
comp |
420132..420204 |
aac |
|
29 |
29 |
|
|
|
|
|
comp |
420234..420545 |
CDS |
|
|
|
|
|
104 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
466570..467484 |
CDS |
|
223 |
223 |
|
|
305 |
|
|
comp |
467708..467792 |
agc |
|
186 |
186 |
|
|
|
|
|
comp |
467979..468294 |
ncRNA |
@2 |
122 |
122 |
|
|
316 |
|
|
|
468417..469397 |
CDS |
|
|
|
|
|
327 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
681116..681676 |
CDS |
|
37 |
37 |
|
|
187 |
|
|
comp |
681714..681786 |
gcg |
|
195 |
195 |
|
|
|
|
|
comp |
681982..682488 |
CDS |
|
|
|
|
|
169 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
695936..696538 |
CDS |
|
939 |
939 |
|
|
201 |
|
|
comp |
697478..697600 |
5s |
|
305 |
|
|
|
123 |
|
|
comp |
697906..700772 |
23s |
|
233 |
|
|
|
2867 |
|
|
comp |
701006..701079 |
gca |
|
87 |
|
|
|
|
|
|
comp |
701167..702646 |
16s |
|
724 |
724 |
|
|
1480 |
|
|
|
703371..704336 |
CDS |
|
|
|
|
|
322 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
746487..747290 |
CDS |
|
155 |
155 |
|
|
268 |
|
|
comp |
747446..747518 |
acc |
|
85 |
|
85 |
|
|
|
|
comp |
747604..747686 |
tta |
|
303 |
303 |
|
|
|
|
|
|
747990..748163 |
CDS |
|
|
|
|
|
58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
800615..801820 |
CDS |
|
43 |
43 |
|
|
402 |
|
|
comp |
801864..801935 |
caa |
|
72 |
72 |
|
|
|
|
|
comp |
802008..802697 |
CDS |
|
|
|
|
|
230 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
963425..964432 |
CDS |
|
273 |
273 |
|
|
336 |
|
|
|
964706..964778 |
aac |
|
5 |
|
5 |
|
|
|
|
|
964784..964857 |
atgi |
|
58 |
|
58 |
|
|
|
|
|
964916..964990 |
gaa |
|
53 |
|
53 |
|
|
|
|
|
965044..965127 |
cta |
|
29 |
|
29 |
|
|
|
|
|
965157..965232 |
cac |
|
146 |
146 |
|
|
|
|
|
|
965379..965717 |
CDS |
|
|
|
|
|
113 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
974621..974842 |
CDS |
|
564 |
564 |
|
|
74 |
|
|
|
975407..975480 |
aag |
|
90 |
|
90 |
|
|
|
|
|
975571..975653 |
ttg |
|
504 |
|
504 |
|
|
|
|
|
976158..976231 |
aaa |
|
148 |
148 |
|
|
|
|
|
comp |
976380..976679 |
CDS |
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1006329..1008095 |
CDS |
|
397 |
397 |
|
|
589 |
|
|
|
1008493..1008614 |
5s |
@3 |
748 |
|
|
|
122 |
|
|
|
1009363..1009485 |
5s |
|
286 |
|
|
|
123 |
|
|
|
1009772..1012638 |
23s |
|
233 |
|
|
|
2867 |
|
|
|
1012872..1012945 |
gca |
|
72 |
|
|
|
|
|
|
|
1013018..1014497 |
16s |
|
454 |
454 |
|
|
1480 |
|
|
|
1014952..1016097 |
CDS |
|
|
|
|
|
382 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1088211..1088831 |
CDS |
|
53 |
53 |
|
|
207 |
|
|
comp |
1088885..1089038 |
tgg |
@1 |
40 |
|
40 |
|
|
|
|
comp |
1089079..1089150 |
tgc |
|
212 |
212 |
|
|
|
|
|
comp |
1089363..1089746 |
CDS |
|
|
|
|
|
128 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1143658..1144137 |
CDS |
|
166 |
166 |
|
|
160 |
|
|
comp |
1144304..1144610 |
ncRNA |
@2 |
14 |
14 |
|
|
307 |
|
|
comp |
1144625..1144699 |
atgf |
|
139 |
139 |
|
|
|
|
|
comp |
1144839..1145162 |
CDS |
|
|
|
|
|
108 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1153368..1154087 |
CDS |
|
56 |
56 |
|
|
240 |
|
|
|
1154144..1154217 |
aga |
|
62 |
|
62 |
|
|
|
|
|
1154280..1154354 |
agg |
|
552 |
552 |
|
|
|
|
|
comp |
1154907..1156157 |
CDS |
|
|
|
|
|
417 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1247204..1247659 |
CDS |
|
4 |
4 |
|
|
152 |
|
|
comp |
1247664..1247739 |
cga |
|
133 |
133 |
|
|
|
|
|
comp |
1247873..1248481 |
CDS |
|
|
|
|
|
203 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1320721..1321641 |
CDS |
|
183 |
183 |
|
|
307 |
|
|
|
1321825..1321896 |
gta |
|
99 |
|
99 |
|
|
|
|
|
1321996..1322067 |
gtg |
|
228 |
228 |
|
|
|
|
|
comp |
1322296..1323084 |
CDS |
|
|
|
|
|
263 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1403886..1409507 |
CDS |
|
351 |
351 |
|
|
1874 |
|
|
comp |
1409859..1409930 |
cgc |
|
222 |
222 |
|
|
|
|
|
comp |
1410153..1410620 |
CDS |
|
|
|
|
|
156 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1532795..1533088 |
CDS |
|
127 |
127 |
|
|
98 |
|
|
comp |
1533216..1533325 |
atgj |
@1 |
246 |
246 |
|
|
|
|
|
|
1533572..1534402 |
CDS |
|
|
|
|
|
277 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1541929..1542321 |
CDS |
|
127 |
127 |
|
|
131 |
|
|
|
1542449..1542522 |
ggg |
|
1 |
1 |
|
|
|
|
|
comp |
1542524..1543528 |
CDS |
|
|
|
|
|
335 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1602054..1603277 |
CDS |
|
257 |
257 |
|
|
408 |
|
|
|
1603535..1603608 |
aca |
|
76 |
|
76 |
|
|
|
|
|
1603685..1603759 |
cca |
|
44 |
|
44 |
|
|
|
|
|
1603804..1603877 |
tac |
|
170 |
|
170 |
|
|
|
|
|
1604048..1604119 |
gac |
|
7 |
|
7 |
|
|
|
|
|
1604127..1604200 |
aaa |
|
24 |
24 |
|
|
|
|
|
|
1604225..1604461 |
CDS |
|
|
|
|
|
79 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1617553..1617861 |
CDS |
|
187 |
187 |
|
|
103 |
|
|
|
1618049..1618133 |
tca |
|
252 |
252 |
|
|
|
|
|
|
1618386..1619444 |
CDS |
|
|
|
|
|
353 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1692202..1692552 |
CDS |
|
271 |
271 |
|
|
117 |
|
|
comp |
1692824..1692895 |
cag |
|
156 |
156 |
|
|
|
|
|
comp |
1693052..1693972 |
CDS |
|
|
|
|
|
307 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1887796..1888038 |
CDS |
|
136 |
136 |
|
|
81 |
|
|
|
1888175..1888257 |
ctg |
|
193 |
193 |
|
|
|
|
|
|
1888451..1891267 |
CDS |
|
|
|
|
|
939 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2057488..2057883 |
CDS |
|
230 |
230 |
|
|
132 |
|
|
|
2058114..2058184 |
tgc |
|
143 |
143 |
|
|
|
|
|
|
2058328..2059713 |
CDS |
|
|
|
|
|
462 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2128536..2129312 |
CDS |
|
123 |
123 |
|
|
259 |
|
|
|
2129436..2129509 |
acg |
|
362 |
362 |
|
|
|
|
|
comp |
2129872..2130963 |
CDS |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2204492..2204932 |
CDS |
|
178 |
178 |
|
|
147 |
|
|
|
2205111..2205182 |
gtc |
|
4 |
|
4 |
|
|
|
|
|
2205187..2205259 |
ttc |
|
283 |
283 |
|
|
|
|
|
comp |
2205543..2205875 |
CDS |
|
|
|
|
|
111 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2317208..2317498 |
CDS |
|
271 |
271 |
|
|
97 |
|
|
|
2317770..2317842 |
atc |
|
460 |
460 |
|
|
|
|
|
|
2318303..2318863 |
CDS |
|
|
|
|
|
187 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2414821..2415903 |
CDS |
|
491 |
491 |
|
|
361 |
|
|
|
2416395..2416468 |
gcc |
|
303 |
303 |
|
|
|
|
|
comp |
2416772..2417797 |
CDS |
|
|
|
|
|
342 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2432399..2432848 |
CDS |
|
537 |
537 |
|
|
150 |
|
|
|
2433386..2433459 |
ggc |
|
2 |
|
2 |
|
|
|
|
|
2433462..2433535 |
gga |
|
326 |
326 |
|
|
|
|
|
comp |
2433862..2434263 |
CDS |
|
|
|
|
|
134 |
|
|
cumuls. mfi.
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds chromosome
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa |
gammes |
cdsa 300
|
avec rRNA |
opérons |
2 |
1 |
0 |
- |
1 |
2 |
1 |
|
100 |
9 |
30 |
0
|
|
16 23 5s 0 |
0 |
20 |
4 |
|
50 |
8 |
20 |
|
200 |
21 |
60 |
3
|
|
16 gca 235 |
2 |
40 |
2 |
|
100 |
3 |
40 |
|
300 |
10 |
90 |
3
|
|
16 23 5s a |
0 |
60 |
3 |
|
150 |
10 |
60 |
|
400 |
12 |
120 |
10
|
|
max a |
1 |
80 |
2 |
|
200 |
12 |
80 |
|
500 |
5 |
150 |
7
|
|
a doubles |
0 |
100 |
3 |
|
250 |
8 |
100 |
|
600 |
1 |
180 |
5
|
|
autres |
2 |
120 |
0 |
|
300 |
7 |
120 |
|
700 |
1 |
210 |
5
|
|
total aas |
2 |
140 |
0 |
|
350 |
3 |
140 |
|
800 |
0 |
240 |
2
|
sans |
opérons |
29 |
160 |
0 |
|
400 |
3 |
160 |
|
900 |
0 |
270 |
4
|
|
1 aa |
20 |
180 |
1 |
|
450 |
0 |
180 |
|
1000 |
1 |
300 |
1
|
|
max a |
5 |
200 |
0 |
|
500 |
3 |
200 |
|
1100 |
0 |
330 |
6
|
|
a doubles |
0 |
|
1 |
|
|
5 |
|
|
|
1 |
|
15
|
|
total aas |
45 |
|
16 |
0 |
|
64 |
|
0 |
|
61 |
|
61
|
total aas |
|
47 |
|
|
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
83 |
|
|
224 |
|
|
|
266 |
|
|
|
|
|
variance |
121 |
|
|
176 |
|
|
|
265 |
|
|
sans jaune |
|
|
moyenne |
35 |
|
|
178 |
|
|
|
213 |
|
171
|
|
|
|
variance |
27 |
|
|
96 |
|
|
|
115 |
|
81
|
- Note: intercalaires prélevés de la colonne cds de mfi opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfi 62 52 31 83
deb fin deb fin grand petit grand petit
4 133 50 -1 50 -1 50 -1
14 139 127 1 72 43 127 1
36 246 257 24 127 1 133 4
37 195 156 29 133 4 139 14
43 72 43 72 139 14 257 24
50 -1 4 133 156 29 156 29
53 212 14 139 193 136 246 36
56 552 230 143 195 37 195 37
123 362 273 146 198 177 72 43
127 246 564 148 212 53 212 53
127 1 271 156 223 186 552 56
136 193 198 177 228 183 362 123
155 303 223 186 230 143 246 127
156 29 136 193 246 36 193 136
178 283 37 195 246 127 230 143
183 228 53 212 252 187 273 146
187 252 351 222 257 24 564 148
198 177 183 228 271 156 303 155
206 281 36 246 273 146 271 156
223 186 127 246 281 206 198 177
230 143 187 252 283 178 283 178
257 24 206 281 303 155 228 183
271 156 178 283 351 222 223 186
271 460 155 303 362 123 252 187
273 146 491 303 460 271 281 206
351 222 537 326 491 303 351 222
491 303 123 362 537 326 460 271
537 326 271 460 552 56 491 303
564 148 56 552 564 148 537 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
archeo cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
mfi 3,381 58 1 32 20 5 18 14 9 23
‰ 17 552 345 86 621 483 310 793
Ar1. mfi blocs, Methanobacterium formicicum DSM1535
CDS |
939 |
201
|
5s |
305 |
123
|
23s |
233 |
2867
|
gca |
87 |
|
16s |
724 |
1480
|
CDS |
|
322
|
|
|
|
CDS |
397 |
589
|
5s |
748 |
122
|
5s |
286 |
123
|
23s |
233 |
2867
|
gca |
72 |
|
16s |
454 |
1480
|
CDS |
|
382
|
- Lien tableur: mfi remarques
- Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
- @ Les introns des(gtRNAdb) archées existent pour tgg et atgj tujours. Ici en plus il y a un caa.
- - caa (Join(314315..314349,314448..314487)), l’intron empiète sur le cds d’où l’intercalaire négatif.
- - tgg ( join(1088885..1088919,1089000..1089038)), l’intron mais n’empiète pas sur les cds.
- - atgj Join(1533216..1533251,1533288..1533325), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
- @ Ces ncRNAs sont dans le même cluster, sur le même brin qu’ un tRNA et très proche de lui, agc 186 et atgf 14. Ils sont petits respectivement 316 et 307 pbs.
- @ Le 5s collé au cluster du 16sgca23s5s, il se comporte comme un tRNA. Il a une pb de moins que les 2 autres 5s.
- Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca aac aaa caa tgc.
- Tableau du code génétique de mfi
- Légende: prélèvement de la base gtRNAdb le 17.8.19
- - totaux en en-tête, 47 total de gtRNAdb contenant des pseudo et inconnus; 47 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
Ar1. mfi, Methanobacterium formicicum DSM1535
g1 |
|
t1 |
|
|
|
47 |
47
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
1 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
1 |
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
2 |
cga |
1
|
l gta |
1 |
o gca |
2 |
gaa |
1 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
Ar1. mfi distribution. Methanobacterium formicicum DSM1535. Archée
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
1 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
1 |
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
2 |
cga |
1
|
l gta |
1 |
o gca |
2 |
gaa |
1 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
arch |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
mfi |
25 |
20 * |
|
|
|
2 |
47
|
- mfi Le prélèvement: Aapal
- Le nom et le lien NCBI: mfi, Methanobacterium formicicum genome assembly DSM1535, chromosome:chrI, NCBI [3], date 25.9.19.
- mfi La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
mfi 403,834 2,478,074 16.3
Intergen51. mfi. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. mfi les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mfi les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,516 |
167 |
29 |
1,712 |
2.7 |
23 |
1 |
24
|
x |
626 |
5 |
0 |
631 |
|
0 |
3 |
3
|
t |
2,142 |
172 |
29 |
2,343 |
|
23 |
4 |
27
|
% |
91.4 |
7.3 |
1.2 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
33 |
1 |
0 |
34 |
1.5 |
tRNA-CDS |
56 |
64
|
x |
22 |
0 |
0 |
22 |
|
RNA-RNA |
23 |
26
|
t |
55 |
1 |
0 |
56 |
|
CDS-rRNA |
4 |
5
|
% |
98.2 |
1.8 |
0.0 |
|
|
non RNA |
4 |
5
|
- |
|
|
|
|
|
total |
87 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
6.0 |
2.9 |
4.2 |
20.2 |
5.9 |
55 |
1.7 |
0.0
|
x |
15.8 |
18.2 |
40.0 |
5.8 |
9.1 |
20 |
0.0 |
0.0
|
|
Intergen51. mfi. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: mfi données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mfi fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mfi fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mfi
R2 x3 x2 x c Inflexion poly3 x c
0.600 2.45E-06 -1.82E-03 3.38E-01 11.20 fx1 abscisse 246.8 164.3
0.837 -1.93E-06 1.64E-03 -5.19E-01 71.0 fc1 ordonnée 20.9 25.1
0.646 3.39E-06 -2.51E-03 4.92E-01 1.36 fx41
0.937 1.27E-06 -6.26E-04 -4.42E-02 43.6 fc41
- Le rfin après 400 est de 93 sur un total de 1545 . Jusqu'à 1% les freq10 sont en continu jusqu'à 720 , reste 15 . L'indice i.rfin1 = 78/320=0,244.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données mfi calculs poly3 mfi
effect 1545 R2.21 686 abscis 400
xm 25 pte 9,85 flexa 187
ym 5 cste 3,48 flexo 2,17
x1m 252 r400l 148 xm 25
y1m 1 restp 175,40 sup4 202,1
rfin 60,19 %sd 32,57 sup4t 514,6
bornf 160 lond 227 % 39,3
supd 202,6 %sf 32,62 long 162
supdt 622,0 lonf 135 R2 501
xmp 202,59 sf/lf 1,12
r400 115,21 sr/lr 0,56
supf 151,2 sd/ld 0,89
supft 463,4 i.r400 0,78
Intergen51. mfi. Les CDS-CDS négatifs
modifier
Sous-totaux mfi totale
fréquence x- c- x- c-
- 1 0 22 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 1 70 717 10938
- 5 0 0 5 19
sp6 4 75 1642 8424
total 5 167 2,456 23,544
reste 2 7 264 420
s6 1 0 361 41
s7 0 13 321 1438
s8 1 55 696 6525
rappot s1-5
4/2/1 - 3.2 8.4 2.6
% / sp6
s6/sp6 25.0 0.0 22.0 0.5
s7/sp6 0.0 17.3 19.5 17.1
s8/sp6 25.0 73.3 42.4 77.5
reste/sp6 50.0 9.3 16.1 5.0
total s1-5 1 92 814 15120
% / total
%s1-5 20.0 55.1 33.1 64.2
%sp6 80.0 44.9 66.9 35.8
Intergen51. mfi. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 2 CDS 16s 1 1
16s 23s 5s CDS 2
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 23s CDS
tRNA in CDS 23s
tRNA contig 5s 16s
tRNA hors 16 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s 1
total 23 0 total 1 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Methanocaldococcus jannaschii DSM 2661
modifier
- Lien tableur: mja opérons
- Liens: gtRNAdb [4], NCBI [5], génome [6]
- Phylogénie: Archaea; Euryarchaeota; Methanomada group; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus.
- Légende: cdsa: cds aas, cdsd: cds dirigé
Ar2. mja opérons, Methanocaldococcus jannaschii DSM 2661
31.3%GC |
17.8.19 Paris |
37 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
comp |
96499..97053 |
CDS |
|
372 |
372 |
|
|
185 |
|
|
comp |
97426..97537 |
atgj |
@1 |
91 |
|
91 |
|
|
|
|
|
97629..97716 |
ctc |
|
241 |
241 |
|
|
|
|
|
|
97958..99259 |
CDS |
|
|
|
|
|
434 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
110328..111545 |
CDS |
|
222 |
222 |
|
|
406 |
|
|
|
111768..111852 |
tga |
|
21 |
21 |
|
|
|
|
|
|
111874..112785 |
CDS |
|
|
|
|
|
304 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
137244..138245 |
CDS |
|
98 |
98 |
|
|
334 |
|
|
comp |
138344..138419 |
gtg |
|
59 |
59 |
|
|
|
|
|
comp |
138479..138781 |
CDS |
|
|
|
|
|
101 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
153070..154479 |
CDS |
|
182 |
182 |
|
|
470 |
|
|
comp |
154662..157639 |
23s |
|
207 |
|
|
|
2978 |
|
|
comp |
157847..157919 |
gca |
|
64 |
|
|
|
|
|
|
comp |
157984..159463 |
16s |
|
340 |
340 |
|
|
1480 |
|
|
|
159804..160085 |
CDS |
|
|
|
|
|
94 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
185874..186671 |
CDS |
|
306 |
306 |
|
|
266 |
|
|
|
186978..187066 |
tcc |
|
71 |
71 |
|
|
|
|
|
|
187138..187590 |
CDS |
|
|
|
|
|
151 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
190579..190800 |
CDS |
|
31 |
31 |
|
|
74 |
|
|
|
190832..190908 |
ccc |
|
32 |
32 |
|
|
|
|
|
|
190941..191114 |
CDS |
|
|
|
|
|
58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
214560..215060 |
CDS |
|
149 |
149 |
|
|
167 |
|
|
|
215210..215297 |
tta |
|
154 |
154 |
|
|
|
|
|
|
215452..216240 |
CDS |
|
|
|
|
|
263 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
226386..227639 |
CDS |
|
64 |
64 |
|
|
418 |
|
|
comp |
227704..227780 |
gcc |
|
239 |
239 |
|
|
|
|
|
|
228020..229720 |
CDS |
|
|
|
|
|
567 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
303613..303927 |
CDS |
|
64 |
64 |
|
|
105 |
|
|
|
303992..304081 |
tca |
|
230 |
230 |
|
|
|
|
|
comp |
304312..304752 |
CDS |
|
|
|
|
|
147 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
357984..358547 |
CDS |
|
220 |
220 |
|
|
188 |
|
|
|
358768..358845 |
aga |
|
23 |
|
23 |
|
|
|
|
|
358869..358943 |
gaa |
|
164 |
164 |
|
|
|
|
|
|
359108..359923 |
CDS |
|
|
|
|
|
272 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
359108..359923 |
CDS |
|
48 |
48 |
|
|
272 |
|
|
comp |
359972..360047 |
atgf |
|
103 |
103 |
|
|
|
|
|
comp |
360151..361485 |
CDS |
|
|
|
|
|
445 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
401945..402796 |
CDS |
|
171 |
171 |
|
|
284 |
|
|
comp |
402968..403044 |
gtc |
|
229 |
229 |
|
|
|
|
|
|
403274..403834 |
CDS |
|
|
|
|
|
187 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
618311..618757 |
CDS |
|
402 |
402 |
|
|
149 |
|
|
comp |
619160..619234 |
tgc |
|
63 |
63 |
|
|
|
|
|
comp |
619298..619915 |
CDS |
|
|
|
|
|
206 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
636394..637449 |
CDS |
|
133 |
133 |
|
|
352 |
|
|
|
637583..637659 |
ttc |
|
7 |
|
|
7 |
|
|
|
|
637667..637742 |
aac |
|
29 |
|
|
29 |
|
|
|
|
637772..637849 |
atgi |
|
18 |
|
|
18 |
|
|
|
|
637868..637942 |
gaa |
|
39 |
|
|
39 |
|
|
|
|
637982..638069 |
cta |
|
11 |
|
|
11 |
|
|
|
|
638081..638152 |
cac |
|
295 |
|
|
|
|
|
|
|
638448..639930 |
16s |
|
64 |
|
|
|
1483 |
|
|
|
639995..640067 |
gca |
|
207 |
|
|
|
|
|
|
|
640275..643254 |
23s |
|
78 |
|
|
|
2980 |
|
|
|
643333..643447 |
5s |
|
56 |
|
|
|
115 |
|
|
|
643504..643761 |
ncRNA |
@2 |
232 |
232 |
|
|
258 |
|
|
|
643994..644962 |
CDS |
|
|
|
|
|
323 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
762859..763608 |
CDS |
|
157 |
157 |
|
|
250 |
|
|
comp |
763766..763842 |
acc |
|
178 |
|
178 |
|
|
|
|
|
764021..764096 |
caa |
|
50 |
50 |
|
|
|
|
|
|
764147..764818 |
CDS |
|
|
|
|
|
224 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
862207..862410 |
CDS |
|
179 |
179 |
|
|
68 |
|
|
|
862590..862661 |
cga |
|
41 |
41 |
|
|
|
|
|
|
862703..863392 |
CDS |
|
86 |
86 |
|
|
230 |
|
|
|
863479..863555 |
aca |
|
14 |
|
|
14 |
|
|
|
|
863570..863647 |
cca |
|
8 |
|
|
8 |
|
|
|
|
863656..863732 |
tac |
|
83 |
|
|
83 |
|
|
|
|
863816..863889 |
aaa |
|
13 |
|
|
|
|
|
|
|
863903..864017 |
5s |
@3 |
46 |
|
|
|
115 |
|
|
|
864064..864141 |
gac |
|
80 |
80 |
|
|
|
|
|
|
864222..864842 |
CDS |
|
|
|
|
|
207 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
871492..873447 |
CDS |
|
238 |
238 |
|
|
652 |
|
|
comp |
873686..873763 |
atc |
|
102 |
102 |
|
|
|
|
|
comp |
873866..875110 |
CDS |
|
|
|
|
|
415 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
882566..883615 |
CDS |
|
65 |
65 |
|
|
350 |
|
|
|
883681..883754 |
gta |
|
123 |
123 |
|
|
|
|
|
comp |
883878..884297 |
CDS |
|
|
|
|
|
140 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1037197..1038504 |
CDS |
|
39 |
39 |
|
|
436 |
|
|
comp |
1038544..1038620 |
cgc |
@4 |
1 |
1 |
|
|
|
|
|
comp |
1038622..1039386 |
CDS |
|
|
|
|
|
255 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1148669..1149934 |
CDS |
|
210 |
210 |
|
|
422 |
|
|
|
1150145..1150220 |
ggc |
|
34 |
|
34 |
|
|
|
|
|
1150255..1150330 |
gga |
|
243 |
243 |
|
|
|
|
|
|
1150574..1151254 |
CDS |
|
|
|
|
|
227 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1188906..1189772 |
CDS |
|
172 |
172 |
|
|
289 |
|
|
|
1189945..1190055 |
tgg |
@1 |
95 |
95 |
|
|
|
|
|
|
1190151..1190684 |
CDS |
|
|
|
|
|
178 |
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1312335..1312781 |
CDS |
|
383 |
383 |
|
|
149 |
|
|
|
1313165..1313249 |
agc |
|
177 |
177 |
|
|
|
|
|
|
1313427..1314617 |
CDS |
|
|
|
|
|
397 |
|
|
cumuls. mja.
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds chromosome
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa |
gammes |
cdsa 300
|
avec rRNA |
opérons |
2 |
1 |
0 |
0 |
1 |
1 |
1 |
|
100 |
4 |
30 |
0
|
|
16 23 5s 0 |
0 |
20 |
0 |
5 |
50 |
7 |
20 |
|
200 |
12 |
60 |
1
|
|
16 atc gca |
0 |
40 |
2 |
2 |
100 |
10 |
40 |
|
300 |
13 |
90 |
2
|
|
16 23 5s a |
0 |
60 |
0 |
0 |
150 |
5 |
60 |
|
400 |
6 |
120 |
3
|
|
max a |
7 |
80 |
0 |
0 |
200 |
8 |
80 |
|
500 |
8 |
150 |
4
|
|
a doubles |
0 |
100 |
1 |
1 |
250 |
10 |
100 |
|
600 |
1 |
180 |
3
|
|
autres |
2 |
120 |
0 |
0 |
300 |
0 |
120 |
|
700 |
1 |
210 |
5
|
|
total aas |
13 |
140 |
0 |
0 |
350 |
2 |
140 |
|
800 |
0 |
240 |
3
|
sans |
opérons |
20 |
160 |
0 |
0 |
400 |
2 |
160 |
|
900 |
0 |
270 |
4
|
|
1 aa |
16 |
180 |
1 |
0 |
450 |
1 |
180 |
|
1000 |
0 |
300 |
4
|
|
max a |
2 |
200 |
0 |
0 |
500 |
0 |
200 |
|
1100 |
0 |
330 |
2
|
|
a doubles |
0 |
|
0 |
0 |
|
0 |
|
|
|
0 |
|
14
|
|
total aas |
24 |
|
4 |
8 |
|
46 |
|
0 |
|
45 |
|
45
|
total aas |
|
37 |
|
|
|
|
|
|
|
|
|
|
|
remarques |
|
4 |
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
82 |
26 |
|
154 |
|
|
|
269 |
|
|
|
|
|
variance |
71 |
25 |
|
102 |
|
|
|
137 |
|
|
sans jaune |
|
|
moyenne |
29 |
18 |
|
152 |
|
|
|
253 |
|
194
|
|
|
|
variance |
8 |
12 |
|
95 |
|
|
|
117 |
|
74
|
Ar2. mja blocs, Methanocaldococcus jannaschii DSM 2661
CDS |
182 |
|
23s |
207 |
2978
|
gca |
64 |
|
16s |
340 |
1480
|
CDS |
|
|
|
|
cac |
295 |
|
16s |
64 |
1483
|
gca |
207 |
|
23s |
78 |
2980
|
5s |
56 |
115
|
ncRNA |
232 |
258
|
CDS |
|
|
|
|
|
aaa |
13 |
|
5s |
46 |
115
|
gac |
80 |
|
CDS |
|
|
- Lien tableur: mja remarques
- Remarques: pas de doubles mais des séquences. Il n’y a pas de cgt, on est avec les archées.
- @ Les introns (gtRNAdb) des archées existent toujours pour tgg et atgj.
- - tgg, Join(1189945..1189984,1190018..1190055), l’ intron mais n’empiète pas sur les cds.
- - atgj, Join(97426..97464,97500..97537), n’empiète pas sur les cds. C’est Met mais pas Il2 ni atgf.
- @ Ce ncRNA est dans et sur le même brin que le cluster et très proche de lui, 56 au lieu de 232 avec cds. Il est petit, 258 pbs comme pour mfi.
- @ Le 5s est décollé du cluster du 16sgca23s, il se comporte comme un tRNA et est dans leur séquence. C’est pour ça que j’ai ces aas dans la colonne “avec rRNAs”.
- @ cgc très collé à ses 2 cds
- Séquence des doubles: aucun double dans une séquence. Les doubles exitants sont gca gaa.
- Tableau du code génétique de mja
- Légende: prélèvement de la base gtRNAdb le 17.8.19
- - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus; 37 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
Ar2. mja, Methanocaldococcus jannaschii DSM 2661
g1 |
|
t1 |
|
|
|
37 |
37
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
1 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atg |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
1 |
p gcg |
|
gag |
|
ggg |
|
Ar2. mja distribution, Methanocaldococcus jannaschii DSM 2661. Archée
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
1 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
1 |
p gcg |
|
gag |
|
ggg |
|
arch |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
mja |
8 |
16 |
1 |
4 |
6 * |
2 |
37
|
- mja Le prélèvement: Artb
- Le nom et le lien NCBI: mja, Methanocaldococcus jannaschii DSM 2661, NCBI [7], date 09.04.20.
- mja La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
mja 168,865 1,664,970 10.1
Intergen51. mja. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. mja les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mja les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,058 |
163 |
11 |
1,232 |
2.5 |
20 |
0 |
20
|
x |
431 |
56 |
10 |
497 |
|
0 |
2 |
2
|
t |
1,489 |
219 |
21 |
1,729 |
|
20 |
2 |
22
|
% |
86.1 |
12.7 |
1.2 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
25 |
0 |
0 |
25 |
1.4 |
tRNA-CDS |
43 |
43
|
x |
18 |
0 |
0 |
18 |
|
RNA-RNA |
20 |
20
|
t |
43 |
0 |
0 |
43 |
|
CDS-rRNA |
2 |
2
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
34 |
34
|
- |
|
|
|
|
|
total |
99 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
1.1 |
4.0 |
3.7 |
39.7 |
8.0 |
48 |
0.9 |
0.0
|
x |
5.4 |
0.0 |
1.8 |
22.0 |
0.0 |
46 |
2.0 |
0.0
|
|
Intergen51. mja. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: mja données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mja fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mja fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mja fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mja
R2 x3 x2 x c Inflexion poly3 x c
0.659 -1.51E-06 1.41E-03 -4.93E-01 71.50 fx1 abscisse 216.0 413.1
0.856 -9.20E-06 7.03E-03 -1.72E+00 143.0 fc1 ordonnée 5.5 0.4
0.703 4.80E-06 -3.11E-03 4.71E-01 13.9 fx41
0.960 -8.15E-07 1.01E-03 -4.38E-01 66.4 fc41
- Le rfin après 400 est de 12 sur un total de 1069 . Jusqu'à 1% les freq10 sont en continu jusqu'à 440 , reste 10 . L'indice i.rfin1 = 2/40=0,050.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données mja calculs poly3 mja
effect 1069 R2.21 738 abscis 250
xm 50 pte 20,35 flexa 134
ym 3,527 cste 4,32 flexo 2,45
x1m 163 r400l 237 xm 35
y1m 1 restp 152,48 sup4 137,9
rfin 11,23 %sd 38,68 sup4t 349,9
bornf 164 lond 113 % 39,4
supd 135,3 %sf 38,68 long 99
supdt 349,9 lonf 114 R2 366
xmp 497,66 sf/lf 1,19
r400 141,25 sr/lr 0,00
supf 135,3 sd/ld 1,20
supft 349,9 i.r400 0,60
Intergen51. mja. Les CDS-CDS négatifs
modifier
Sous-totaux mja totale
fréquence x- c- x- c-
- 1 0 25 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 26 51 717 10938
- 5 0 2 5 19
sp6 30 85 1642 8424
total 56 163 2,456 23,544
reste 1 6 264 420
s6 19 0 361 41
s7 3 17 321 1438
s8 7 62 696 6525
rappot s1-5
4/2/1 - 2.0 8.4 2.6
% / sp6
s6/sp6 63.3 0.0 22.0 0.5
s7/sp6 10.0 20.0 19.5 17.1
s8/sp6 23.3 72.9 42.4 77.5
reste/sp6 3.3 7.1 16.1 5.0
total s1-5 26 78 814 15120
% / total
%s1-5 46.4 47.9 33.1 64.2
%sp6 53.6 52.1 66.9 35.8
Intergen51. mja. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 1 CDS 16s 1
16s 23s 5s CDS
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 1 23s CDS
tRNA in CDS 23s
tRNA contig 8 5s 16s 1
tRNA hors 4 16s16s
tRNA 16s 1
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 20 0 total 0 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
- Lien NCBI [8] 9.4.20
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
mja. Sx+ Sc+ Les diagrammes 400
mja |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
-16 |
150 |
-532 |
77 |
660 |
313 |
min50 |
-94 |
719 |
-1762 |
147 |
856 |
255 |
min40
|
31 à 400 |
47 |
-300 |
424 |
21 |
711 |
213 |
2 parties |
-6.2 |
87 |
-410 |
65 |
964 |
468 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
154 |
57 |
- |
582 |
poly |
78 |
SF |
227 |
71 |
|
537 |
poly |
319 |
SF
|
31 à 400 |
115 |
46 |
- |
623 |
poly |
88 |
tF |
128 |
44 |
- |
859 |
poly |
105 |
SF
|
- Légende du tableau des corrélations
mja. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
rru |
min40 |
874 |
2056 |
2930 |
829 |
193 |
611 |
418 |
722 |
792 |
861
|
mja |
min30 |
406 |
1047 |
1453 |
776 |
326 |
571 |
245 |
844 |
857 |
881
|
ant |
min40 |
601 |
1616 |
2217 |
730 |
271 |
538 |
267 |
892 |
886 |
876
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
169 |
266 |
0.64 |
1037 |
2749 |
1 |
4 |
71 |
222 |
175 |
630 |
17
|
239 |
405 |
0.59 |
495 |
1234 |
20 |
9 |
113 |
132 |
113 |
474 |
502
|
281 |
485 |
0.58 |
714 |
2381 |
13 |
24 |
116 |
285 |
186 |
836 |
575
|
- Diagrammes 400: mja pmg, diagramme 1-40: c+ mja c+ pmg x+ pmg total, texte: pmg.
- Résumé: Ici je ne compare que les 2 génomes mja et pmg en sachant que pub est semblable à pmg. Car mja et pmg se ressemblent beaucoup avec des effectif des diagrammes 400 égaux, 1 454 contre 1453, et un rapport des fréquences faibles c+/x+ presque égaux, 0.59 contre 0.76. Par contre les corrélations à 41-250 sont très différentes, 571 contre 802.
- - La forme des courbes 400: Les 4 courbes de mja sont identiques une à une aux 4 courbes de pmg, seule la force de mja x+ 31-400 est légèrement supérieure, 88, à celle de pmg de la même courbe, 48.
- Les 2 courbes, c+ 1-400 mja pmg, sont SF avec R2’ 319 368.
- Les 2 courbes, x+ 1-400 mja pmg, sont SF avec R2’ 78 257.
- Les 2 courbes x+ 31-400 sont des tildes forts avec un R2’ de mja supérieur à celui de pmg noté quand même tm, 88 contre 48. Les 2 parties sont bien nettes.
- Les 2 courbes c+ 31-400 sont SF avec R2’ 105 286. Les 2 parties sont bien nettes. Il faut noter que les 2 SF de mja, c+ 31-400 et x+ 1-400, sont plus faibles que ceux de pmg, 105-78 contre 286-257.
- Les points d’inflexion des SF sont compris entre 255 et 313, 468 pour mja c+ 1-400. Les 2 tildes ont leurs points d’inflexion presque identiques 213 contre 180.
- - Les corrélations des courbes 400: C’est la différence la plus importante entre les 2 génômes.
- Chez pmg la corrélation 41-250, de 802 chute à 728 pour 41-200 avec une différence de 74. Et mja en parallèle passe de 571 à 326 avec une différence de 245.
- Par contre les 3 corrélations 1-n se comportent de la même façon chez les 2 génomes, elles augmentent fortement autour de 850 pour mja et 900 pour pmg.
- - Les fréquences faibles 1-30:
- Elles sont du même ordre de grandeur et dans des rapports x+/c+ élevés: 239/405 pour mja et 326/430 pour pmg, donnant les rapports respectifs 0.58 0.76.
- Elles sont réparties sur les 2 fréquences 10 20 dans les 4 courbes 1-400 des 2 génomes.
- Les minima des fréquences faibles: elles sont bien prononcées chez les 2 génomes x+ 1-400 et faiblement chez les 2 aussi dans c+ 1-400.
- Les fréquences des zéros sont moyens mais plus élevées chez pmg avec 46‰ que chez mja avec 29‰.
- Les fréquences négatives sont réparties entre x- et c- de la même façon chez les 2 génômes: 128/144 pour ade et 113/132 pour mja.
- - La forme des courbes 1-40:
- La courbe c+1-40: Les effectifs sont moyens, 449 pour pmg contre 474 pour mja. La courbe de mja est plus proche du total que pmg avec un excès à la fréquence 4. La courbe de pmg est moins nette à cause d’un excès à la fréquence 6. J’ai ajouté pour chaque génome un diagramme sans la fréquence en excès. La courbe de pmg ressemble alors à celle du total.
- La courbe x+1-40: Les 2 courbes sont différentes du modèle. Il y a un excès à la fréquence 6 et un creux profond à 11, et la bosse du 10 et très petite par rapport au modèle.Il faut que je publie la courbe de mja avec un effectif de 113. Les 2 courbes ont à peu près la même allure décroissante et les mêmes défauts par rapport au modèle.
- - Les corrélations des courbes 1-40: Les corrélations x+/c+ sont fortes pour les 2 génomes ce qui explique l’augmentation chez tous les 2 de celles des 3 plages de fréquences 1-n.
- Lien tableur: mja autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 15 repeat_region et 1 ncRNA
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ x- c+ x+ c- c+ x+ c-
26 20 19 2 15 17 99
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Methanosarcina barkeri str. Fusaro
modifier
- Lien tableur: mba opérons
- Liens: gtRNAdb [9], NCBI [10], génome [11]
- Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina.
- Légende: cdsa: cds aas, cdsd: cds dirigé
Ar3. mba opérons, Methanosarcina barkeri str. Fusaro
39.2%GC |
2.2.20 Paris |
62 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
|
91192..91938 |
cds |
|
137 |
137 |
|
|
249 |
|
DUF429 domain-containing protein
|
comp |
92076..92160 |
ctc |
+ |
132 |
|
132 |
|
|
|
|
comp |
92293..92377 |
ctc |
2 ctc |
298 |
298 |
|
|
|
|
|
comp |
92676..93476 |
cds |
|
|
|
|
|
267 |
|
DNA-directed RNA polymerase subunit D
|
|
|
|
|
|
|
|
|
|
|
|
comp |
98630..99337 |
cds |
|
535 |
535 |
|
|
236 |
|
ABC transporter ATP-binding protein
|
comp |
99873..99955 |
tcc |
|
222 |
222 |
|
|
|
|
|
comp |
100178..101194 |
cds |
|
|
|
|
|
339 |
|
RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
|
|
|
|
|
|
|
|
|
|
|
|
comp |
146979..147518 |
cds |
|
80 |
80 |
|
|
180 |
|
tyrosine-type recombinase/integrase
|
comp |
147599..147670 |
acc |
|
198 |
198 |
|
|
|
|
|
comp |
147869..148381 |
cds |
|
|
|
|
|
171 |
|
DUF98 domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
199345..200268 |
cds |
|
492 |
492 |
|
|
308 |
|
aldolase
|
comp |
200761..200833 |
aac |
+ |
71 |
|
71 |
|
|
|
|
comp |
200905..200979 |
atgi |
2 aac |
119 |
|
119 |
|
|
|
|
comp |
201099..201171 |
aac |
|
964 |
964 |
|
|
|
|
|
|
202136..202366 |
cds |
|
|
|
|
|
77 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
260990..261532 |
cds |
|
173 |
173 |
|
|
181 |
|
nitroreductase family protein"
|
|
261706..261777 |
cgg |
|
673 |
673 |
|
|
|
|
|
|
262451..262960 |
cds |
|
|
|
|
|
170 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
463836..464723 |
cds |
|
2075 |
2075 |
|
|
296 |
|
polyprenyl synthetase family protein
|
|
466799..466870 |
gga |
|
94 |
|
94 |
|
|
|
|
|
466965..467049 |
cta |
|
221 |
221 |
|
|
|
|
|
comp |
467271..468818 |
cds |
|
|
|
|
|
516 |
|
MBL fold metallo-hydrolase
|
|
|
|
|
|
|
|
|
|
|
|
|
473154..473723 |
cds |
|
298 |
298 |
|
|
190 |
|
hp
|
comp |
474022..474096 |
gag |
|
246 |
246 |
|
|
|
|
|
comp |
474343..475584 |
cds |
|
|
|
|
|
414 |
|
proteasome-activating nucleotidase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
692109..692987 |
cds |
|
349 |
349 |
|
|
293 |
|
branched-chain-amino-acid transaminase
|
|
693337..693411 |
aga |
|
400 |
400 |
|
|
|
|
|
comp |
693812..694420 |
cds |
|
|
|
|
|
203 |
|
sulfite exporter TauE/SafE family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
703446..703958 |
cds |
|
488 |
488 |
|
|
171 |
|
biotin transporter BioY
|
|
704447..704521 |
agg |
|
283 |
283 |
|
|
|
|
|
|
704805..705284 |
cds |
|
|
|
|
|
160 |
|
N-acetyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
800463..800642 |
cds |
|
799 |
799 |
|
|
60 |
|
hp
|
comp |
801442..801526 |
agc |
|
137 |
137 |
|
|
|
|
|
comp |
801664..801978 |
ncRNA |
@1 |
327 |
327 |
|
|
315 |
|
|
|
802306..803931 |
cds |
|
|
|
|
|
542 |
|
methylamine methyltransferase corrinoid protein reductive activase
|
|
|
|
|
|
|
|
|
|
|
|
|
1109819..1110013 |
cds |
|
15 |
15 |
|
|
65 |
|
hp
|
|
1110029..1110103 |
atgf |
+ |
63 |
|
63 |
|
|
|
|
|
1110167..1110241 |
atgf |
3 atg |
63 |
|
63 |
|
|
|
|
|
1110305..1110379 |
atgf |
|
273 |
273 |
|
|
|
|
|
|
1110653..1111984 |
cds |
|
|
|
|
|
444 |
|
signal recognition particle protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1134460..1135074 |
cds |
|
235 |
235 |
|
|
205 |
|
endonuclease III
|
comp |
1135310..1135381 |
tgc |
+ |
65 |
|
65 |
|
|
|
|
comp |
1135447..1135518 |
tgc |
2 tgc |
126 |
126 |
|
|
|
|
|
comp |
1135645..1136277 |
cds |
|
|
|
|
|
211 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
1137210..1137680 |
cds |
|
488 |
488 |
|
|
157 |
|
P-bacterioferritin
|
comp |
1138169..1138290 |
5s |
|
129 |
|
|
|
122 |
|
|
comp |
1138420..1141252 |
23s |
|
222 |
|
|
|
2833 |
|
|
comp |
1141475..1142963 |
16s |
|
830 |
830 |
|
|
1489 |
|
|
|
1143794..1145302 |
cds |
|
|
|
|
|
503 |
|
2-isopropylmalate synthase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1249870..1250040 |
cds |
|
423 |
423 |
|
|
57 |
|
CopG family transcriptional regulator
|
comp |
1250464..1250537 |
aag |
|
546 |
546 |
|
|
|
|
|
|
1251084..1251290 |
cds |
|
|
|
|
|
69 |
|
TRAM domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
|
1315521..1315691 |
cds |
@2 |
-12 |
-12 |
|
|
57 |
|
hp
|
comp |
1315680..1315751 |
cgc |
|
174 |
174 |
|
|
|
|
|
|
1315926..1317110 |
cds |
|
|
|
|
|
395 |
|
redox-regulated ATPase YchF
|
|
|
|
|
|
|
|
|
|
|
|
<comp |
1514831..1515373 |
cds |
|
1133 |
1133 |
|
|
181 |
|
ArsR family transcriptional regulator
|
|
1516507..1516579 |
caa |
|
760 |
760 |
|
|
|
|
|
comp |
1517340..1517663 |
cds |
|
|
|
|
|
108 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1538879..1539286 |
cds |
|
36 |
36 |
|
|
136 |
|
sensor histidine kinase
|
comp |
1539323..1539395 |
other |
@3 |
1249 |
1249 |
|
|
73 |
|
|
>comp |
1540645..1540794 |
cds |
|
|
|
|
|
50 |
|
PKD domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1546247..1547791 |
cds |
|
576 |
576 |
|
|
515 |
|
aminotransferase class V-fold PLP-dependent enzyme
|
comp |
1548368..1548441 |
aca |
|
448 |
448 |
|
|
|
|
|
< |
1548890..1549093 |
cds |
|
|
|
|
|
68 |
|
matrixin family metalloprotease
|
|
|
|
|
|
|
|
|
|
|
|
|
1550566..1550760 |
cds |
|
745 |
745 |
|
|
65 |
|
DeoR family transcriptional regulator
|
comp |
1551506..1551579 |
aca |
|
506 |
506 |
|
|
|
|
|
|
1552086..1552640 |
cds |
|
|
|
|
|
185 |
|
YkgJ family cysteine cluster protein
|
|
|
|
|
|
|
|
|
|
|
|
|
1621639..1622835 |
cds |
|
433 |
433 |
|
|
399 |
|
methionine adenosyltransferase
|
|
1623269..1623384 |
tac |
@4 |
112 |
|
112 |
|
|
|
|
|
1623497..1623569 |
gac |
|
300 |
300 |
|
|
|
|
|
comp |
1623870..1624067 |
cds |
|
|
|
|
|
66 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
1714788..1715069 |
cds |
|
154 |
154 |
|
|
94 |
|
hp
|
comp |
1715224..1715295 |
acg |
|
187 |
187 |
|
|
|
|
|
comp |
1715483..1716493 |
cds |
|
|
|
|
|
337 |
|
class I SAM-dependent methyltransferase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1755811..1755993 |
cds |
|
113 |
113 |
|
|
61 |
|
DNA-directed RNA polymerase subunit K
|
comp |
1756107..1756181 |
ccg |
@5 |
0 |
0 |
|
|
|
|
|
comp |
1756182..1756370 |
cds |
|
|
|
|
|
63 |
|
DNA-directed RNA polymerase subunit N
|
|
|
|
|
|
|
|
|
|
|
|
|
1842058..1842195 |
cds |
|
16 |
16 |
|
|
46 |
|
hp
|
comp |
1842212..1842285 |
gtg |
|
717 |
717 |
|
|
|
|
|
|
1843003..1843767 |
cds |
|
|
|
|
|
255 |
|
peptidase A24
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1852573..1852896 |
cds |
|
1364 |
1364 |
|
|
108 |
|
PadR family transcriptional regulator
|
comp |
1854261..1854338 |
ccc |
|
198 |
198 |
|
|
|
|
|
comp |
1854537..1855097 |
cds |
|
|
|
|
|
187 |
|
CDP-alcohol phosphatidyltransferase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1908225..1908989 |
cds |
|
349 |
349 |
|
|
255 |
|
hp
|
comp |
1909339..1909530 |
tgg |
|
445 |
445 |
|
|
|
|
|
> |
1909976..1910152 |
cds |
|
|
|
|
|
59 |
|
nitrogenase reductase
|
|
|
|
|
|
|
|
|
|
|
|
|
1926717..1927178 |
cds |
|
183 |
183 |
|
|
154 |
|
DUF4145 domain-containing protein
|
comp |
1927362..1927445 |
tcg |
|
125 |
125 |
|
|
|
|
|
comp |
1927571..1928944 |
cds |
|
|
|
|
|
458 |
|
endonuclease Q family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2005431..2007053 |
cds |
|
2315 |
2315 |
|
|
541 |
|
PKD domain-containing protein
|
comp |
2009369..2009443 |
cca |
|
199 |
199 |
|
|
|
|
|
comp |
2009643..2010194 |
cds |
|
|
|
|
|
184 |
|
UbiX family flavin prenyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2026807..2028456 |
cds |
|
314 |
314 |
|
|
550 |
|
ATP-dependent DNA ligase
|
|
2028771..2028842 |
ggg |
|
513 |
513 |
|
|
|
|
|
comp |
2029356..2029766 |
cds |
|
|
|
|
|
137 |
|
PaaI family thioesterase
|
|
|
|
|
|
|
|
|
|
|
|
|
2157926..2158684 |
cds |
|
567 |
567 |
|
|
253 |
|
hp
|
|
2159252..2159362 |
atgj |
|
349 |
349 |
|
|
|
|
|
|
2159712..2160225 |
cds |
|
|
|
|
|
171 |
|
amidohydrolase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2194967..2195302 |
cds |
|
713 |
713 |
|
|
112 |
|
translation initiation factor eIF-1A
|
|
2196016..2197504 |
16s |
|
222 |
|
|
|
1489 |
|
|
|
2197727..2200559 |
23s |
|
129 |
|
|
|
2833 |
|
|
|
2200689..2200810 |
5s |
|
607 |
607 |
|
|
122 |
|
|
comp |
2201418..2201615 |
cds |
|
|
|
|
|
66 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
>comp |
2434335..2434609 |
cds |
|
603 |
603 |
|
|
92 |
|
nucleoside deaminase
|
comp |
2435213..2435284 |
gcc |
|
223 |
|
223 |
|
|
|
|
|
2435508..2435584 |
atc |
+ |
74 |
|
74 |
|
|
|
|
|
2435659..2435735 |
atc |
2 atc |
241 |
241 |
|
|
|
|
|
comp |
2435977..2436390 |
cds |
|
|
|
|
|
138 |
|
transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
2622097..2624025 |
cds |
|
1489 |
1489 |
|
|
643 |
|
replication factor C large subunit
|
|
2625515..2625588 |
gta |
|
1102 |
1102 |
|
|
|
|
|
|
2626691..2626918 |
cds |
|
|
|
|
|
76 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
2650514..2651296 |
cds |
|
164 |
164 |
|
|
261 |
|
thiazole biosynthesis protein
|
|
2651461..2651532 |
cac |
|
218 |
218 |
|
|
|
|
|
|
2651751..2653460 |
cds |
|
|
|
|
|
570 |
|
radical SAM protein
|
|
|
|
|
|
|
|
|
|
|
|
|
2663547..2664668 |
cds |
|
318 |
318 |
|
|
374 |
|
PGF-pre-PGF domain-containing protein
|
comp |
2664987..2665058 |
ggc |
|
263 |
263 |
|
|
|
|
|
|
2665322..2666563 |
cds |
|
|
|
|
|
414 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
2856552..2857409 |
cds |
|
134 |
134 |
|
|
286 |
|
hp
|
comp |
2857544..2857628 |
tca |
|
153 |
153 |
|
|
|
|
|
comp |
2857782..2858546 |
cds |
|
|
|
|
|
255 |
|
peptidylprolyl isomerase
|
|
|
|
|
|
|
|
|
|
|
|
|
3326036..3326557 |
cds |
|
539 |
539 |
|
|
174 |
|
hp
|
|
3327097..3327168 |
tgc |
|
995 |
995 |
|
|
|
|
|
|
3328164..3328898 |
cds |
|
|
|
|
|
245 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
3994472..3994921 |
cds |
|
514 |
514 |
|
|
150 |
|
IS200/IS605 family transposase
|
comp |
3995436..3995529 |
cga |
|
477 |
477 |
|
|
|
|
|
|
3996007..3996714 |
cds |
|
|
|
|
|
236 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
4005709..4006026 |
cds |
|
269 |
269 |
|
|
106 |
|
divalent-cation tolerance protein CutA
|
|
4006296..4006378 |
ttg |
|
860 |
860 |
|
|
|
|
|
|
4007239..4009012 |
rpr |
@6 |
169 |
169 |
|
|
1774 |
|
Family CRISPR
|
comp |
4009182..4009478 |
cds |
|
|
|
|
|
99 |
|
CRISPR-associated endonuclease Cas2
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4031590..4031871 |
cds |
|
1075 |
1075 |
|
|
94 |
|
hp
|
|
4032947..4033019 |
cag |
|
182 |
182 |
|
|
|
|
|
comp |
4033202..4033765 |
cds |
|
|
|
|
|
188 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4041205..4041960 |
cds |
|
96 |
96 |
|
|
252 |
|
MBL fold metallo-hydrolase
|
|
4042057..4042141 |
tta |
|
375 |
375 |
|
|
|
|
|
comp |
4042517..4044976 |
cds |
|
|
|
|
|
820 |
|
beta-propeller fold lactonase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4045359..4048274 |
cds |
|
718 |
718 |
|
|
972 |
|
PKD domain-containing protein
|
|
4048993..4049077 |
tta |
|
35 |
35 |
|
|
|
|
|
comp |
4049113..4052403 |
cds |
|
241 |
241 |
|
|
1097 |
|
PGF-pre-PGF domain-containing protein
|
|
4052645..4052729 |
tta |
|
177 |
177 |
|
|
|
|
|
comp |
4052907..4053395 |
cds |
|
|
|
|
|
163 |
|
MarR family transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
4407561..4407830 |
cds |
|
64 |
64 |
|
|
90 |
|
elongation factor 1-beta
|
|
4407895..4407966 |
gcg |
|
675 |
675 |
|
|
|
|
|
comp |
4408642..4409715 |
cds |
|
|
|
|
|
358 |
|
radical SAM protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4504139..4504300 |
cds |
|
536 |
536 |
|
|
54 |
|
hp
|
comp |
4504837..4504921 |
ctg |
|
220 |
220 |
|
|
|
|
|
comp |
4505142..4506050 |
cds |
|
|
|
|
|
303 |
|
ornithine carbamoyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4551177..4551851 |
cds |
|
566 |
566 |
|
|
225 |
|
MBL fold metallo-hydrolase
|
|
4552418..4552491 |
gtc |
+ |
94 |
|
94 |
|
|
|
|
|
4552586..4552660 |
ttc |
2 gtc |
7 |
|
7 |
|
|
|
|
|
4552668..4552739 |
ggc |
2 ttc |
61 |
|
61 |
|
|
|
|
|
4552801..4552874 |
gtc |
2 ggc |
94 |
|
94 |
|
|
|
|
|
4552969..4553043 |
ttc |
|
7 |
|
7 |
|
|
|
|
|
4553051..4553122 |
ggc |
|
717 |
717 |
|
|
|
|
|
|
4553840..4554052 |
cds |
|
|
|
|
|
71 |
|
MoaD/ThiS family protein
|
|
|
|
|
|
|
|
|
|
|
|
|
4617920..4618339 |
cds |
|
200 |
200 |
|
|
140 |
|
hp
|
|
4618540..4618617 |
gaa |
|
351 |
351 |
|
|
|
|
|
|
4618969..4619190 |
cds |
|
377 |
377 |
|
|
74 |
|
hp
|
|
4619568..4619645 |
gaa |
|
214 |
214 |
|
|
|
|
|
comp |
4619860..4620678 |
cds |
|
|
|
|
|
273 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
4673041..4673643 |
cds |
|
289 |
289 |
|
|
201 |
|
adenosylcobinamide amidohydrolase
|
comp |
4673933..4674054 |
5s |
|
129 |
|
|
|
122 |
|
|
comp |
4674184..4677016 |
23s |
|
135 |
|
|
|
2833 |
|
|
comp |
4677152..4677224 |
gca |
|
79 |
|
|
|
|
|
|
comp |
4677304..4678792 |
16s |
|
1242 |
1242 |
|
|
1489 |
|
|
|
4680035..4680817 |
cds |
|
|
|
|
|
261 |
|
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4759174..4759410 |
cds |
|
89 |
89 |
|
|
79 |
|
DNA-directed RNA polymerase subunit H
|
comp |
4759500..4759576 |
aaa |
|
655 |
655 |
|
|
|
|
|
comp |
4760232..4760801 |
cds |
|
|
|
|
|
190 |
|
DJ-1/PfpI family protein
|
cumuls. mba.
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds chromosome
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa |
gammes |
cdsa 300
|
avec rRNA |
opérons |
3 |
1 |
0 |
- |
1 |
2 |
1 |
|
100 |
25 |
30 |
0
|
|
16 23 5s 0 |
2 |
20 |
2 |
|
50 |
4 |
20 |
|
200 |
27 |
60 |
7
|
|
16 gca 235 |
1 |
40 |
0 |
|
100 |
4 |
40 |
|
300 |
21 |
90 |
14
|
|
16 23 5s a |
0 |
60 |
0 |
|
150 |
6 |
60 |
|
400 |
8 |
120 |
8
|
|
max a |
1 |
80 |
6 |
|
200 |
14 |
80 |
|
500 |
4 |
150 |
5
|
|
a doubles |
0 |
100 |
3 |
|
250 |
9 |
100 |
|
600 |
7 |
180 |
10
|
|
autres |
0 |
120 |
2 |
|
300 |
8 |
120 |
|
700 |
1 |
210 |
11
|
|
total aas |
1 |
140 |
1 |
|
350 |
6 |
140 |
|
800 |
0 |
240 |
4
|
sans |
opérons |
44 |
160 |
0 |
|
400 |
4 |
160 |
|
900 |
1 |
270 |
10
|
|
1 aa |
37 |
180 |
0 |
|
450 |
4 |
180 |
|
1000 |
1 |
300 |
4
|
|
max a |
6 |
200 |
0 |
|
500 |
4 |
200 |
|
1100 |
1 |
330 |
2
|
|
a doubles |
6 |
|
1 |
|
|
35 |
|
|
|
0 |
|
21
|
|
total aas |
61 |
|
15 |
0 |
|
100 |
|
0 |
|
96 |
|
96
|
total aas |
|
62 |
|
|
|
|
|
|
|
|
|
|
|
remarques |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
85 |
|
|
457 |
|
|
|
240 |
|
|
|
|
|
variance |
52 |
|
|
407 |
|
|
|
194 |
|
|
sans jaune |
|
|
moyenne |
51 |
|
|
210 |
|
|
|
186 |
|
158
|
|
|
|
variance |
28 |
|
|
98 |
|
|
|
106 |
|
78
|
Ar3. mba blocs, Methanosarcina barkeri str. Fusaro
cds |
289 |
201 |
adenosylcobinamide amidohydrolase
|
5s |
129 |
122 |
|
23s |
135 |
2833 |
|
gca |
79 |
|
|
16s |
1242 |
1489 |
|
cds |
|
261 |
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
|
|
|
|
|
cds |
713 |
112 |
translation initiation factor eIF-1A
|
16s |
222 |
1489 |
|
23s |
129 |
2833 |
|
5s |
607 |
122 |
|
cds |
|
66 |
hp
|
|
|
|
|
cds |
488 |
157 |
P-bacterioferritin
|
5s |
129 |
122 |
|
23s |
222 |
2833 |
|
16s |
830 |
1489 |
|
cds |
|
503 |
2-isopropylmalate synthase
|
- Lien tableur: mba remarques
- Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
- @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
- @ intercalaire négatif du au changement de sens
- @ un autre aa, other
- @ 4 introns
- - tac 1623269..1623304,1623349..1623384
- - tgg 1909339..1909374,1909493..1909530
- - atgj 2159252..2159289,2159327..2159362
- - cga 3995436..3995470,3995491..3995529
- @ un intercalaire nul sans changement de sens
- @ rpr, repeat région famille CRISPR, assez grand 1774 pbs. Dans le même sens que l’aa.
- Séquence des doubles: 6 clusters avec des doubles dont une séquence de 3 aas et un triplet.
- - 2 doublets seuls ctc tgc
- - gcc 2atc
- - aac atgi aac
- - 3 atgf
- - 2 (gtc ttc ggc)
- Tableau du code génétique de mba
- Légende: prélèvement de la base gtRNAdb le 2.2.20
- - totaux en en-tête, 62 total de gtRNAdb contenant des pseudo et inconnus; 62 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
Ar3. mba, Methanosarcina barkeri str. Fusaro
g1 |
|
t1 |
|
|
|
62 |
62
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
4
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
2 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
2 |
n gcc |
1 |
gac |
1 |
ggc |
3
|
i tta |
3 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
2 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
1 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atg |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
1 |
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
- intercalaires élevés avec le cds 43/100
1315680 cgc -12 comp
1756107 ccg 0
1250464 aag 423
1623269 tac 433
1909339 tgg 445 comp
1548368 aca 448 comp
3995436 cga 477 comp
704447 agg 488 comp
1138169 5s 488 comp
200761 aac 492
1551506 aca 506 comp
2028771 ggg 513 comp
3995436 cga 514 comp
99873 tcc 535
4504837 ctg 536
3327097 tgc 539
1250464 aag 546 comp
4552418 gtc 566 comp
2159252 atgj 567
1548368 aca 576
2435213 gcc 603
2200689 5s 607 comp
4759500 aaa 655
261706 cgg 673
4407895 gcg 675 comp
2194967 16s 713 comp
1842212 gtg 717 comp
4553840 ggc 717
4048993 tta 718 comp
1551506 aca 745 comp
1516507 caa 760 comp
801442 agc 799
1141475 16s 830 comp
4006296 ttg 860
201099 aac 964 comp
3327097 tgc 995
4032947 cag 1075 comp
2625515 gta 1102
1516507 caa 1133 comp
4677304 16s 1242 comp
1539323 other 1249
1854261 ccc 1364
2625515 gta 1489
466799 gga 2075
2009369 cca 2315
moyenne 795
écart 415
- intercalaires élevés entre aas
ttc-ggc 7
ttc-ggc 7
ggc-gtc 61
atgf-atgf 63
atgf-atgf 63
tgc-tgc 65
aac-atgi 71
atc-atc 74
-- --
gga-cta 94
gtc-ttc 94
gtc-ttc 94
tac-gac 112 intron
atgi-aac 119 intron
ctc-ctc 132
gcc-atc 223
Ar3. mba distribution, Methanosarcina barkeri str. Fusaro. Archée
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
3
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
2 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
2 |
n gcc |
1 |
gac |
1 |
ggc |
3
|
i tta |
3 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
2 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
1 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
1 |
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
arch |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
mba |
23 * |
37 * |
|
|
|
1 |
61
|
- mba Le prélèvement: Acbn
- Le nom et le lien NCBI: mba, Methanosarcina barkeri str. Fusaro, NCBI [12], date 17.12.20.
- mba La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
mba 1,341,425 4,837,408 27.7
Intergen51. mba. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. mba les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mba les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,358 |
307 |
21 |
2,686 |
2.1 |
22 |
0 |
22
|
x |
1,234 |
22 |
1 |
1,257 |
|
0 |
6 |
6
|
t |
3,592 |
329 |
22 |
3,943 |
|
22 |
6 |
28
|
% |
91.1 |
8.3 |
0.6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
48 |
0 |
1 |
49 |
1.2 |
tRNA-CDS |
90 |
70
|
x |
40 |
1 |
0 |
41 |
|
RNA-RNA |
22 |
17
|
t |
88 |
1 |
1 |
90 |
|
CDS-rRNA |
6 |
5
|
% |
97.8 |
1.1 |
1.1 |
|
|
non RNA |
10 |
8
|
- |
|
|
|
|
|
total |
128 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
29.7 |
38.8 |
2.0 |
14.9 |
2.0 |
50 |
0.8 |
2.0
|
x |
42.8 |
41.5 |
13.6 |
2.6 |
2.4 |
27 |
0.1 |
0.0
|
|
Intergen51. mba. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: mba données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mba fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mba fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mba fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mba
R2 x3 x2 x c Inflexion poly3 x c
0.351 2.63E-07 -3.94E-04 1.23E-01 6.43 fx1 abscisse 347.8 246.6
0.821 -3.44E-06 2.49E-03 5.76E-01 55.6 fc1 ordonnée 11.0 13.3
0.304 6.70E-07 -6.99E-04 1.93E-01 1.78 fx41
0.739 -7.30E-07 5.40E-04 -1.58E-01 30.4 fc41
- Le rfin après 400 est de 707 sur un total de 2379 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1550 , reste 23 . L'indice i.rfin1 = 684/1150=0,595.
- Le reste après 1550 est de 23 sur un total de 2379 . Jusqu'à 3‰ les freq10 sont en continu jusqu'à 2080 , reste 7 . L'indice i.rf3 =16/530=0,030 .
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données mba calculs poly3 mba
effect 2379 R2.21 604 abscis 400
xm 26 pte 5,92 flexa 243
ym 6 cste 2,68 flexo 1,32
x1m 283 r400l 117 xm 45
y1m 1 restp 407,31 sup4 116,9
rfin 297,18 %sd 19,73 sup4t 340,9
bornf 198 lond 257 % 34,3
supd 88,6 %sf 17,40 long 198
supdt 449,3 lonf 172 R2 221
xmp 143,34 sf/lf 0,34
r400 110,13 sr/lr 0,36
supf 58,4 sd/ld 0,34
supft 335,4 i.r400 0,94
Intergen51. mba. Les CDS-CDS négatifs
modifier
Sous-totaux mba totale
fréquence x- c- x- c-
- 1 0 33 4 4140
- 2 2 0 85 11
- 3 0 2 3 12
- 4 3 117 717 10938
- 5 1 0 5 19
sp6 16 155 1642 8424
total 22 307 2,456 23,544
reste 3 6 264 420
s6 2 7 361 41
s7 2 34 321 1438
s8 9 108 696 6525
rappot s1-5
4/2/1 1.5 3.5 8.4 2.6
% / sp6
s6/sp6 12.5 4.5 22.0 0.5
s7/sp6 12.5 21.9 19.5 17.1
s8/sp6 56.3 69.7 42.4 77.5
reste/sp6 18.8 3.9 16.1 5.0
total s1-5 6 152 814 15120
% / total
%s1-5 27.3 49.5 33.1 64.2
%sp6 72.7 50.5 66.9 35.8
Intergen51. mba. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 3 CDS 16s 3
16s 23s 2 5s CDS 3
16s tRNA 1 16 CDS
tRNA 23s 1 CDS 5s
5s tRNA 23s CDS
tRNA in CDS 23s
tRNA contig 5s 16s
tRNA hors 15 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 22 0 total 0 6
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
- Lien NCBI [13] 17.12.20
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
mba. Sx+ Sc+ Les diagrammes 400
mba |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
4.9 |
-71 |
219 |
11 |
350 |
483 |
min10 |
-50 |
359 |
-832 |
80 |
823 |
239 |
min50
|
1 à 600 |
5.8 |
-62 |
170 |
7.4 |
465 |
354 |
2 parties |
-6.7 |
100 |
-498 |
10 |
789 |
495 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
2 |
25 |
- |
1 |
poly |
348 |
tF |
104 |
46 |
|
536 |
poly |
287 |
SF
|
1 à 600 |
14 |
20 |
- |
146 |
poly |
309 |
tF |
80 |
59 |
- |
580 |
poly |
209 |
SF
|
- Légende du tableau des corrélations et des fréquences faibles
mba. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
afn |
min10 |
328 |
1322 |
1650 |
607 |
-17 |
108 |
125 |
-467 |
-407 |
-8
|
mba |
min10 |
705 |
1651 |
2356 |
154 |
-330 |
-221 |
109 |
-512 |
-477 |
-223
|
cbei |
min10 |
950 |
3395 |
4345 |
402 |
-509 |
-375 |
134 |
-649 |
-648 |
-290
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
46 |
402 |
0.11 |
350 |
1688 |
6 |
5 |
11 |
180 |
36 |
580 |
-369
|
45 |
214 |
0.21 |
1255 |
2688 |
1 |
8 |
18 |
114 |
51 |
428 |
-74
|
26 |
244 |
0.11 |
1212 |
4400 |
0 |
4 |
8 |
89 |
35 |
954 |
272
|
- Diagrammes 400: mba cbei mba 600 , diagramme 1-40: c+ mba c+ cbei total, texte: cbei.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - mba / cbei: mba est un génome bien particulier avec une courbe x+ 1-400 sous forme d’un demi cercle. En fait c’est un tilde très fort, tF, avec un R2’ de 348, mais aussi un R2 très faible de 350 montrant sa grande variabilité. Cbei lui ressemble par ces 2 paramètres mais cbei a un tilde bien dessiné avec un R2’ de 708 et un R2 de 712. J’ai montré que pmq qui est un tilde très fort avec un R2’ de 813 et qui appartient au groupe des tildes réguliers varie beaucoup moins que cbei avec un R2 de 878. Ces 3 génomes ressemblent beaucoup entre eux pour les autres paramètres aussi mais se différencient pour de blo et scc qui ont des taux élevés en faibles fréquences 1-30. La ressemblance de mba avec cbei et non avec pmq est accentuée par le reste des intercalaires (reste) non pris en compte dans les diagrammes x+ 1-400. Le rapport de ce reste pour mba cbei pmq est respectivement 0.75 0.33 0.16. Aussi je vais comparer mba et cbei sur 1-400 et 1-600 pour apprécier mieux la forme des courbes et leurs variabilités.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 45‰ pour mba à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 348 (R2 350 1). Les R2 montrent bien la régularité de cbei par rapport à mba, 712 contre 350.
- + Le point d’inflexion est normal pour cbei 269, par conre celui de mba est très élevé 483 du au reste de 527 (reste) non compris dans l’effectif de x- 1-400.
- c+ 1-400: Ce sont 2 courbes de formes S fort, SF, avec un R2’ de 213 pour cbei contre 287 et 2 points d’inflexion normaux, 245 pour cbei et 239 pour mba. Les fréquences faibles s’accumulent à la fréquence 20 pour cbei qui est un maximum, alors que pour mba elles sont étalées sur 10 et 20 avec le maximum à 10.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26‰ pour cbei et 45‰ pour mba.
- c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont proches mais négatives, c’est à dire x+ et c+ s’opposent entre elles, -221 pour mba contre -377 pour cbei. Leurs comportements sont semblables quand on passe aux autres plages. Sur 41-200 leurs corrélations chutent avec à peu près la même différence (diff), 109 pour mba contre 133. La chute est aussi forte quand on passe à 1-250, de -221 à -512 pour mba et de -377 à -649 pour cbei.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et mba ils sont très faibles, respectivement 0.11 et 0.21. Les zéros sont à 4‰ pour cbei et 9‰ pour mba, alors que le taux des négatifs est légèrement plus élevé chez mba que chez cbei, 132‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: La courbe de cbei est très proche de celle du total des c+ 1-40, mais celle de mba en est proche avec le minimum du creux à la fréquence 7 et 8, mais avec un maximum local à 5 et un creux en 12.
- x+ 1-40: Avec des effectifs de 35 et 51, les courbes ne peuvent pas être significatives.
- - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
- cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
- mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.
- Lien tableur: mba autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 2 repeat_region et 3 ncRNA
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ x- c+ x+ c- c+ x+ c-
49 46 1 21 1 3 5 126 2 ac+
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
- Lien tableur: mfe opérons
- Liens: gtRNAdb [14], NCBI [15], génome [16], %GC 41.80 [17]
- Phylogénie: Archaea; Euryarchaeota; Stenosarchaea group; Methanomicrobia; Methanosarcinales; Methanosarcinaceae; Methanosarcina; unclassified Methanosarcina
- Légende: cdsa: cds aas, cdsd: cds dirigé
Ar4. mfe opérons, Methanosarcina sp. WH1
40.2%GC |
2.2.20 Paris |
56 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
comp |
38726..40264 |
cds |
|
698 |
698 |
|
|
513 |
|
2-isopropylmalate synthase
|
|
40963..42450 |
16s |
|
208 |
|
|
|
1488 |
|
|
|
42659..45491 |
23s |
|
130 |
|
|
|
2833 |
|
|
|
45622..45743 |
5s |
|
857 |
857 |
|
|
122 |
|
|
|
46601..47164 |
cds |
|
102 |
102 |
|
|
188 |
|
hp
|
|
47267..47338 |
tgc |
+ |
72 |
|
72 |
|
|
|
|
|
47411..47482 |
tgc |
2 tgc |
411 |
411 |
|
|
|
|
|
|
47894..48508 |
cds |
|
|
|
|
|
205 |
|
endonuclease III
|
|
|
|
|
|
|
|
|
|
|
|
comp |
71092..72423 |
cds |
|
384 |
384 |
|
|
444 |
|
signal recognition particle protein
|
comp |
72808..72882 |
atgf |
+ |
89 |
|
89 |
|
|
|
|
comp |
72972..73046 |
atgf |
2 atgf |
234 |
234 |
|
|
|
|
|
|
73281..73472 |
cds |
|
|
|
|
|
64 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
175573..176153 |
cds |
|
163 |
163 |
|
|
194 |
|
hp
|
comp |
176317..176389 |
gac |
|
111 |
|
111 |
|
|
|
|
comp |
176501..176614 |
tac |
@1 |
295 |
295 |
|
|
|
|
|
|
176910..177248 |
cds |
|
|
|
|
|
113 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
214884..215966 |
cds |
|
801 |
801 |
|
|
361 |
|
hp
|
comp |
216768..216841 |
aca |
|
150 |
150 |
|
|
|
|
|
|
216992..217582 |
cds |
|
|
|
|
|
197 |
|
aldolase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
372219..373091 |
cds |
|
558 |
558 |
|
|
291 |
|
hp
|
comp |
373650..373723 |
gtg |
|
340 |
340 |
|
|
|
|
|
|
374064..374828 |
cds |
|
|
|
|
|
255 |
|
peptidase A24
|
|
|
|
|
|
|
|
|
|
|
|
comp |
379248..381950 |
cds |
|
1076 |
1076 |
|
|
901 |
|
DNA mismatch repair protein MutS
|
comp |
383027..383104 |
ccc |
|
193 |
193 |
|
|
|
|
|
comp |
383298..383882 |
cds |
|
|
|
|
|
195 |
|
CDP-alcohol phosphatidyltransferase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
532751..533176 |
cds |
|
356 |
356 |
|
|
142 |
|
hp
|
comp |
533533..533607 |
cca |
|
149 |
149 |
|
|
|
|
|
comp |
533757..534308 |
cds |
|
|
|
|
|
184 |
|
UbiX family flavin prenyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
598666..599850 |
cds |
|
170 |
170 |
|
|
395 |
|
redox-regulated ATPase YchF
|
|
600021..600092 |
cgc |
|
341 |
341 |
|
|
|
|
|
|
600434..600868 |
cds |
|
|
|
|
|
145 |
|
cell surface lipoprotein
|
|
|
|
|
|
|
|
|
|
|
|
|
680493..681734 |
cds |
|
185 |
185 |
|
|
414 |
|
proteasome-activating nucleotidase
|
|
681920..681994 |
gag |
|
242 |
242 |
|
|
|
|
|
> |
682237..682560 |
cds |
|
|
|
|
|
108 |
|
p-IS200/IS605 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
|
689062..689631 |
cds |
|
36 |
36 |
|
|
190 |
|
phosphatase PAP2 family protein
|
comp |
689668..689752 |
cta |
|
73 |
|
73 |
|
|
|
|
comp |
689826..689897 |
gga |
|
1481 |
1481 |
|
|
|
|
|
|
691379..691483 |
cds |
|
|
|
|
|
35 |
|
CcmD family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
793563..795017 |
cds |
|
111 |
111 |
|
|
485 |
|
p-IS66 family transposase
|
comp |
795129..795213 |
ctc |
+ |
117 |
|
117 |
|
|
|
|
comp |
795331..795418 |
ctc |
2 ctc |
235 |
235 |
|
|
|
|
|
comp |
795654..796454 |
cds |
|
|
|
|
|
267 |
|
DNA-directed RNA polymerase subunit D
|
|
|
|
|
|
|
|
|
|
|
|
|
810088..810471 |
cds |
|
861 |
861 |
|
|
128 |
|
hp
|
comp |
811333..811415 |
tcc |
|
123 |
123 |
|
|
|
|
|
comp |
811539..812555 |
cds |
|
|
|
|
|
339 |
|
RNA-guided pseudouridylation complex pseudouridine synthase subunit Cbf5
|
|
|
|
|
|
|
|
|
|
|
|
comp |
893309..894232 |
cds |
|
391 |
391 |
|
|
308 |
|
aldolase
|
comp |
894624..894696 |
aac |
+ |
87 |
|
87 |
|
|
|
|
comp |
894784..894858 |
atgi |
2 aac |
110 |
|
110 |
|
|
|
|
comp |
894969..895041 |
aac |
|
1415 |
1415 |
|
|
|
|
|
comp |
896457..897506 |
cds |
|
|
|
|
|
350 |
|
TIGR00303 family protein
|
|
|
|
|
|
|
|
|
|
|
|
|
949570..950112 |
cds |
|
208 |
208 |
|
|
181 |
|
nitroreductase family protein
|
|
950321..950392 |
cgg |
|
498 |
498 |
|
|
|
|
|
comp |
950891..952300 |
cds |
|
|
|
|
|
470 |
|
NADPH-dependent glutamate synthase
|
|
|
|
|
|
|
|
|
|
|
|
|
1088496..1090946 |
cds |
|
360 |
360 |
|
|
817 |
|
PGF-pre-PGF domain-containing protein
|
comp |
1091307..1091378 |
gcc |
|
227 |
|
227 |
|
|
|
|
|
1091606..1091682 |
atc |
+ |
62 |
|
62 |
|
|
|
|
|
1091745..1091818 |
atc |
2 atc |
353 |
353 |
|
|
|
|
|
comp |
1092172..1092585 |
cds |
|
|
|
|
|
138 |
|
transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
1155736..1156137 |
cds |
|
210 |
210 |
|
|
134 |
|
AsnC family transcriptional regulator
|
|
1156348..1156425 |
gaa |
+ |
718 |
|
718 |
|
|
|
|
|
1157144..1157221 |
gaa |
2 gaa |
233 |
233 |
|
|
|
|
|
comp |
1157455..1158645 |
cds |
@4 |
|
|
|
|
397 |
|
ISH3 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1199367..1200149 |
cds |
|
967 |
967 |
|
|
261 |
|
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
|
|
1201117..1202604 |
16s |
|
80 |
|
|
|
1488 |
|
|
|
1202685..1202757 |
gca |
|
135 |
|
|
|
|
|
|
|
1202893..1205725 |
23s |
|
130 |
|
|
|
2833 |
|
|
|
1205856..1205977 |
5s |
|
5 |
5 |
|
|
122 |
|
|
comp |
1205983..1206231 |
cds |
|
|
|
|
|
83 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
1207508..1211485 |
cds |
|
12 |
12 |
|
|
1326 |
|
PAS domain S-box protein
|
comp |
1211498..1211582 |
ctg |
|
190 |
190 |
|
|
|
|
|
comp |
1211773..1212681 |
cds |
|
|
|
|
|
303 |
|
ornithine carbamoyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1220571..1220783 |
cds |
|
596 |
596 |
|
|
71 |
|
MoaD/ThiS family protein
|
comp |
1221380..1221451 |
ggc |
+ |
25 |
|
25 |
|
|
|
|
comp |
1221477..1221551 |
ttc |
2 ggc |
57 |
|
57 |
|
|
|
|
comp |
1221609..1221682 |
gtc |
2 ttc |
71 |
|
71 |
|
|
|
|
comp |
1221754..1221825 |
ggc |
2 gtc |
25 |
|
25 |
|
|
|
|
comp |
1221851..1221925 |
ttc |
|
118 |
|
118 |
|
|
|
|
comp |
1222044..1222117 |
gtc |
|
358 |
358 |
|
|
|
|
|
|
1222476..1223792 |
cds |
|
|
|
|
|
439 |
|
methanogenesis marker 16 metalloprotein
|
|
|
|
|
|
|
|
|
|
|
|
|
1400830..1401773 |
cds |
|
914 |
914 |
|
|
315 |
|
helix-turn-helix domain-containing protein
|
|
1402688..1402761 |
gta |
|
287 |
287 |
|
|
|
|
|
|
1403049..1403276 |
cds |
|
|
|
|
|
76 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1504221..1505630 |
cds |
|
686 |
686 |
|
|
470 |
|
F0F1 ATP synthase subunit beta
|
comp |
1506317..1506410 |
cga |
|
750 |
750 |
|
|
|
|
|
|
1507161..1508039 |
cds |
|
|
|
|
|
293 |
|
response regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
1513245..1513562 |
cds |
|
213 |
213 |
|
|
106 |
|
divalent-cation tolerance protein CutA
|
|
1513776..1513858 |
ttg |
|
268 |
268 |
|
|
|
|
|
> |
1514127..1514647 |
cds |
|
|
|
|
|
174 |
|
p-IS1634 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
|
1887880..1888338 |
cds |
|
392 |
392 |
|
|
153 |
|
pyridoxamine 5'-phosphate oxidase family protein
|
comp |
1888731..1888802 |
ggc |
|
378 |
378 |
|
|
|
|
|
|
1889181..1890518 |
cds |
|
|
|
|
|
446 |
|
DHH family phosphoesterase
|
|
|
|
|
|
|
|
|
|
|
|
|
1962666..1963553 |
cds |
|
130 |
130 |
|
|
296 |
|
hp
|
comp |
1963684..1963768 |
tta |
|
235 |
235 |
|
|
|
|
|
|
1964004..1964759 |
cds |
|
|
|
|
|
252 |
|
MBL fold metallo-hydrolase
|
|
|
|
|
|
|
|
|
|
|
|
|
1971331..1971852 |
cds |
|
319 |
319 |
|
|
174 |
|
hp
|
comp |
1972172..1972244 |
cag |
|
204 |
204 |
|
|
|
|
|
comp |
1972449..1972850 |
cds |
|
|
|
|
|
134 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2170713..2172446 |
cds |
|
156 |
156 |
|
|
578 |
|
radical SAM protein
|
comp |
2172603..2172674 |
cac |
|
174 |
174 |
|
|
|
|
|
comp |
2172849..2173631 |
cds |
|
|
|
|
|
261 |
|
thiazole biosynthesis protein
|
|
|
|
|
|
|
|
|
|
|
|
<comp |
2320809..2321131 |
cds |
|
141 |
141 |
|
|
108 |
|
p-IS200/IS605 family transposase
|
comp |
2321273..2321344 |
gcg |
|
65 |
65 |
|
|
|
|
|
comp |
2321410..2321679 |
cds |
|
|
|
|
|
90 |
|
elongation factor 1-beta
|
|
|
|
|
|
|
|
|
|
|
|
|
2387890..2388675 |
cds |
|
150 |
150 |
|
|
262 |
|
peptidylprolyl isomerase
|
|
2388826..2388911 |
tca |
|
326 |
326 |
|
|
|
|
|
comp |
2389238..2389453 |
cds |
|
|
|
|
|
72 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2678132..2678368 |
cds |
|
85 |
85 |
|
|
79 |
|
DNA-directed RNA polymerase subunit H
|
comp |
2678454..2678530 |
aaa |
|
824 |
824 |
|
|
|
|
|
comp |
2679355..2679537 |
cds |
|
|
|
|
|
61 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
3091524..3091754 |
cds |
|
271 |
271 |
|
|
77 |
|
hp
|
comp |
3092026..3092147 |
5s |
|
130 |
|
|
|
122 |
|
|
comp |
3092278..3095110 |
23s |
|
208 |
|
|
|
2833 |
|
|
comp |
3095319..3096806 |
16s |
|
839 |
839 |
|
|
1488 |
|
|
|
3097646..3097975 |
cds |
|
|
|
|
|
110 |
|
translation initiation factor eIF-1A
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3153517..3155214 |
cds |
|
599 |
599 |
|
|
566 |
|
diguanylate phosphodiesterase
|
comp |
3155814..3155923 |
atgj |
|
799 |
799 |
|
|
|
|
|
|
3156723..3157106 |
cds |
|
|
|
|
|
128 |
|
tRNA CCA-pyrophosphorylase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3241682..3242944 |
cds |
|
473 |
473 |
|
|
421 |
|
diaminopimelate decarboxylase
|
|
3243418..3243489 |
ggg |
|
377 |
377 |
|
|
|
|
|
|
3243867..3244073 |
cds |
|
|
|
|
|
69 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
|
3341829..3342017 |
cds |
@2 |
0 |
0 |
|
|
63 |
|
DNA-directed RNA polymerase subunit N
|
|
3342018..3342092 |
ccg |
|
112 |
112 |
|
|
|
|
|
|
3342205..3342387 |
cds |
|
|
|
|
|
61 |
|
DNA-directed RNA polymerase subunit K
|
|
|
|
|
|
|
|
|
|
|
|
|
3358176..3359186 |
cds |
|
533 |
533 |
|
|
337 |
|
class I SAM-dependent methyltransferase family protein
|
|
3359720..3359791 |
acg |
|
52 |
52 |
|
|
|
|
|
comp |
3359844..3360305 |
cds |
|
|
|
|
|
154 |
|
peroxiredoxin
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3397316..3398947 |
cds |
|
422 |
422 |
|
|
544 |
|
methylamine methyltransferase corrinoid protein reductive activase
|
|
3399370..3399684 |
ncRNA |
@3 |
149 |
149 |
|
|
315 |
|
|
|
3399834..3399918 |
agc |
|
230 |
230 |
|
|
|
|
|
|
3400149..3400847 |
cds |
|
|
|
|
|
233 |
|
ATPase
|
|
|
|
|
|
|
|
|
|
|
|
|
3435506..3436918 |
cds |
|
181 |
181 |
|
|
471 |
|
phosphotransferase
|
|
3437100..3437183 |
tcg |
|
273 |
273 |
|
|
|
|
|
|
3437457..3437948 |
cds |
|
870 |
870 |
|
|
164 |
|
rubrerythrin family protein
|
|
3438819..3438989 |
cds |
|
107 |
107 |
|
|
57 |
|
hp
|
|
3439097..3439289 |
tgg |
|
42 |
42 |
|
|
|
|
|
comp |
3439332..3439484 |
cds |
|
|
|
|
|
51 |
|
hp MLELDILDLDILDLDILDLKILELEILELEVLELEILELEILELEVLVQS
|
|
|
|
|
|
|
|
|
|
|
|
|
3456114..3456473 |
cds |
|
260 |
260 |
|
|
120 |
|
hp
|
comp |
3456734..3456805 |
acc |
|
200 |
200 |
|
|
|
|
|
comp |
3457006..3457518 |
cds |
|
|
|
|
|
171 |
|
DUF98 domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3583589..3584044 |
cds |
|
295 |
295 |
|
|
152 |
|
N-acetyltransferase
|
comp |
3584340..3584414 |
agg |
|
339 |
339 |
|
|
|
|
|
|
3584754..3585317 |
cds |
|
|
|
|
|
188 |
|
biotin transporter BioY
|
|
|
|
|
|
|
|
|
|
|
|
|
3593430..3593861 |
cds |
|
343 |
343 |
|
|
144 |
|
PspC domain-containing protein
|
comp |
3594205..3594279 |
aga |
|
348 |
348 |
|
|
|
|
|
|
3594628..3595506 |
cds |
|
|
|
|
|
293 |
|
branched-chain-amino-acid transaminase
|
|
|
|
|
|
|
|
|
|
|
|
|
3603458..3603697 |
cds |
|
389 |
389 |
|
|
80 |
|
type II toxin-antitoxin system HicB family antitoxin
|
|
3604087..3604159 |
caa |
|
633 |
633 |
|
|
|
|
|
comp |
3604793..3606301 |
cds |
|
|
|
|
|
503 |
|
lipopolysaccharide biosynthesis protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3856073..3856279 |
cds |
|
402 |
402 |
|
|
69 |
|
TRAM domain-containing protein
|
|
3856682..3856755 |
aag |
|
498 |
498 |
|
|
|
|
|
|
3857254..3857424 |
cds |
|
|
|
|
|
57 |
|
CopG family transcriptional regulator
|
cumuls. mfe.
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds chromosome
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa |
gammes |
cdsa 300
|
avec rRNA |
opérons |
3 |
1 |
0 |
- |
1 |
1 |
1 |
|
100 |
18 |
30 |
0
|
|
16 23 5s 0 |
2 |
20 |
0 |
|
50 |
4 |
20 |
|
200 |
29 |
60 |
4
|
|
16 gca 235 |
1 |
40 |
2 |
|
100 |
3 |
40 |
|
300 |
12 |
90 |
14
|
|
16 23 5s a |
0 |
60 |
1 |
|
150 |
11 |
60 |
|
400 |
9 |
120 |
6
|
|
max a |
1 |
80 |
4 |
|
200 |
9 |
80 |
|
500 |
9 |
150 |
8
|
|
a doubles |
0 |
100 |
2 |
|
250 |
10 |
100 |
|
600 |
5 |
180 |
7
|
|
autres |
0 |
120 |
4 |
|
300 |
7 |
120 |
|
700 |
0 |
210 |
9
|
|
total aas |
1 |
140 |
0 |
|
350 |
7 |
140 |
|
800 |
0 |
240 |
1
|
sans |
opérons |
40 |
160 |
0 |
|
400 |
10 |
160 |
|
900 |
1 |
270 |
6
|
|
1 aa |
31 |
180 |
0 |
|
450 |
3 |
180 |
|
1000 |
1 |
300 |
4
|
|
max a |
6 |
200 |
0 |
|
500 |
3 |
200 |
|
1100 |
0 |
330 |
3
|
|
a doubles |
7 |
|
2 |
|
|
20 |
|
|
|
1 |
|
23
|
|
total aas |
55 |
|
15 |
0 |
|
88 |
|
0 |
|
85 |
|
85
|
total aas |
|
56 |
|
|
|
|
|
|
|
|
|
|
|
remarques |
|
|
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
131 |
|
|
376 |
|
|
|
255 |
|
|
|
|
|
variance |
169 |
|
|
299 |
|
|
|
210 |
|
|
sans jaune |
|
|
moyenne |
55 |
|
|
223 |
|
|
|
207 |
|
157
|
|
|
|
variance |
21 |
|
|
108 |
|
|
|
127 |
|
80
|
- Note: intercalaires prélevés de la colonne cds de mfe opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
mfe 38 28 13 54
deb fin deb fin grand petit grand petit
0 112 107 42 107 42 112 0
12 190 533 52 112 0 190 12
36 1481 141 65 141 65 1481 36
85 824 0 112 174 156 107 42
107 42 861 123 190 12 533 52
111 235 356 149 230 149 141 65
130 235 801 150 233 210 824 85
141 65 156 174 235 111 235 111
149 230 12 190 235 130 861 123
150 326 1076 193 242 185 235 130
156 174 260 200 260 200 230 149
163 295 319 204 268 213 356 149
170 341 149 230 273 181 326 150
181 273 210 233 295 163 801 150
185 242 384 234 319 204 174 156
208 498 111 235 326 150 295 163
210 233 130 235 339 295 341 170
213 268 185 242 341 170 273 181
260 200 213 268 348 343 242 185
295 339 181 273 356 149 1076 193
319 204 914 287 360 353 260 200
343 348 163 295 384 234 319 204
356 149 150 326 392 378 498 208
360 353 295 339 473 377 233 210
384 234 558 340 498 208 268 213
389 633 170 341 498 402 384 234
391 1415 343 348 533 52 914 287
392 378 360 353 558 340 339 295
402 498 596 358 596 358 558 340
473 377 473 377 633 389 348 343
533 52 392 378 750 686 360 353
558 340 208 498 799 599 596 358
596 358 402 498 801 150 473 377
599 799 389 633 824 85 392 378
686 750 686 750 861 123 633 389
801 150 599 799 914 287 1415 391
861 123 85 824 1076 193 498 402
914 287 391 1415 1415 391 799 599
1076 193 36 1481 1481 36 750 686
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
archeo cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
mfe 2,374 78 26 27 14 11 15 11 5 21
‰ 333 346 179 141 385 282 128 538
Ar4. mfe blocs, Methanosarcina sp. WH1
cds |
698 |
513 |
2-isopropylmalate synthase
|
16s |
208 |
1488 |
|
23s |
130 |
2833 |
|
5s |
857 |
122 |
|
cds |
102 |
188 |
hp
|
|
|
|
|
cds |
967 |
261 |
methanol-5-hydroxybenzimidazolylcobamide methyltransferase
|
16s |
80 |
1488 |
|
gca |
135 |
|
|
23s |
130 |
2833 |
|
5s |
5 |
122 |
|
cds |
|
83 |
hp
|
|
|
|
|
cds |
271 |
77 |
hp
|
5s |
130 |
122 |
|
23s |
208 |
2833 |
|
16s |
839 |
1488 |
|
cds |
|
110 |
translation initiation factor eIF-1A
|
- Lien tableur: mfe remarques
- Remarques un génome avec beaucoup de doubles dont une séquence de 3 aas.
- @ ncRNA, dans le même ques l que’aa, taille de 315 pbs.
- @ 4 introns
- - tac 176501..176536,176579..176614
- - tgg 3439097..3439134,3439254..3439289
- - atgj 3155814..3155849,3155886..3155923
- - cga 1506317..1506351,1506372..1506410
- @ un intercalaire nul sans changement de sens
- @ intercalaire très élevé 718 pbs entre 2 aas, le nouveau doublet gaa.
- Séquence des doubles: 7 clusters avec des doubles dont une séquence de 3 aas
- - 4 doublets seuls ctc tgc atgf gaa
- - gcc 2atc
- - aac atgi aac
- - 2 (gtc ttc ggc)
- - par rapport à mja un noveau doublet, gaa. Le triplet atgf est changé en doublet. Les autres restent identiques.
- Tableau du code génétique de mfe
- Légende: prélèvement de la base gtRNAdb le 2.2.20
- - totaux en en-tête, 56 total de gtRNAdb contenant des pseudo et inconnus; 56 total du cumul.
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
- - Voir la légende des tris et couleurs, g1 t1.
Ar4. mfe, Methanosarcina sp. WH1
g1 |
|
t1 |
|
|
|
56 |
56
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
2 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
2 |
n gcc |
1 |
gac |
1 |
ggc |
3
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
1 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atg |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
1 |
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
- intercalaires élevés avec le cds 26/88
3856682 aag 402 comp
47411 tgc 411
3399370 ncRNA 422 comp
3243418 ggg 473 comp
950321 cgg 498 comp
3856682 aag 498
3359720 acg 533
373650 gtg 558
1221380 ggc 596
3155814 atgj 599
3604087 caa 633 comp
1506317 cga 686
40963 16s 698 comp
1506317 cga 750 comp
3155814 atgj 799 comp
216768 aca 801
2678454 aaa 824
3095319 16s 839 comp
45622 5s 857
811333 tcc 861 comp
3438819 cds 870
1402688 gta 914
1201117 16s 967 comp
383027 ccc 1076
894969 aac 1415
689826 gga 1481 comp
- intercalaires élevés entre aas
ggc-ttc 25
ggc-ttc 25
ttc-gtc 57
atc-atc 62
gtc-ggc 71
tgc-tgc 72
cta-gga 73
aac-atgi 87
atgf-atgf 89
atgi-aac 110
gac-tac 111
ctc-ctc 117
ttc-gtc 118
gcc-atc 227
gaa-gaa 718
Ar4. mfe distribution, Methanosarcina sp. WH1. Archée
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
2 |
f ccc |
1 |
cac |
1 |
cgc |
1
|
h gtc |
2 |
n gcc |
1 |
gac |
1 |
ggc |
3
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
1
|
l gta |
1 |
o gca |
1 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
1 |
h ccg |
1 |
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
arch |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
mfe |
24 * |
31 * |
|
|
|
1 |
56
|
- mfe Le prélèvement: Aapal
- Le nom et le lien NCBI: mfe, Methanosarcina sp. WH1 chromosome, NCBI [18], date 11.12.21.
- mfe La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
mfe 987,074 3,914,091 25.2
Intergen51. mfe. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. mfe les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 mfe les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,994 |
250 |
17 |
2,261 |
2.1 |
21 |
1 |
22
|
x |
1,066 |
17 |
1 |
1,084 |
|
1 |
5 |
6
|
t |
3,060 |
267 |
18 |
3,345 |
|
22 |
6 |
28
|
% |
91.5 |
8.0 |
0.5 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
47 |
0 |
1 |
48 |
1.5 |
tRNA-CDS |
79 |
65
|
x |
31 |
0 |
0 |
31 |
|
RNA-RNA |
22 |
18
|
t |
78 |
0 |
1 |
79 |
|
CDS-rRNA |
6 |
5
|
% |
98.7 |
0.0 |
1.3 |
|
|
non RNA |
15 |
12
|
- |
|
|
|
|
|
total |
122 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
23.2 |
25.0 |
1.2 |
15.9 |
0.0 |
57 |
0.8 |
2.1
|
x |
34.9 |
25.8 |
17.6 |
4.4 |
3.2 |
29 |
0.1 |
0.0
|
|
Intergen51. mfe. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: mfe données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées mfe fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. mfe fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 mfe
R2 x3 x2 x c Inflexion poly3 x c
0.317 1.04E-06 -7.63E-04 1.38E-01 12.80 fx1 abscisse 248.3 329,5
0.809 -3.02E-06 2.21E-03 -5.36E-01 57.3 fc1 ordonnée 2.4 10,4
0.309 8.74E-07 -6.51E-04 1.17E-01 13.6 fx41
0.884 -1,92E-07 1,90E-04 -1,07E-01 31.9 fc31
- Le rfin après 400 est de 467 sur un total de 2011 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1490 , reste 20 . L'indice i.rfin1 = 447/1090=0,410.
- Le reste après 1490 est de 20 sur un total de 2011 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1960 , reste 6 . L'indice i.rf3 = 14/470=0,030.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données mfe calculs poly3 mfe
effect 2011 R2.21 619 abscis 400
xm 32 pte 5,92 flexa 195
ym 5 cste 2,68 flexo 1,70
x1m 283 r400l 117 xm 55
y1m 1 restp 344,11 sup4 90,6
rfin 232,22 %sd 26,98 sup4t 293,4
bornf 217 lond 251 % 30,9
supd 131,0 %sf 24,94 long 140
supdt 485,3 lonf 185 R2 230
xmp 170,56 sf/lf 0,53
r400 111,88 sr/lr 0,49
supf 98,8 sd/ld 0,52
supft 396,3 i.r400 0,96
Intergen51. mfe. Les CDS-CDS négatifs
modifier
Sous-totaux mfe totale
fréquence x- c- x- c-
- 1 0 26 4 4140
- 2 1 0 85 11
- 3 0 0 3 12
- 4 4 116 717 10938
- 5 0 0 5 19
sp6 12 108 1642 8424
total 17 250 2,456 23,544
reste 3 3 264 420
s6 5 3 361 41
s7 2 22 321 1438
s8 2 80 696 6525
rapport s1-5
4/2/1 4.0 4.5 8.4 2.6
% / sp6
s6/sp6 41.7 2.8 22.0 0.5
s7/sp6 16.7 20.4 19.5 17.1
s8/sp6 16.7 74.1 42.4 77.5
reste/sp6 25.0 2.8 16.1 5.0
total s1-5 5 142 814 15120
% / total
%s1-5 29.4 56.8 33.1 64.2
%sp6 70.6 43.2 66.9 35.8
Intergen51. mfe. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 3 CDS 16s 3
16s 23s 2 5s CDS 1 2
16s tRNA 1 16 CDS
tRNA 23s 1 CDS 5s
5s tRNA 23s CDS
tRNA in CDS 23s
tRNA contig 5s 16s
tRNA hors 14 1 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 21 1 total 1 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 archeo. Les intercalaires tRNA-tRNA extra blocs
mfe |
hors |
|
mfi |
hors |
|
mba |
hors |
|
mja |
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
72 |
tgc |
|
85 |
acc |
|
132 |
ctc |
|
91 |
atgj
|
** |
tgc |
|
** |
tta |
|
** |
ctc |
|
** |
ctc
|
89 |
atgf |
|
5 |
aac |
|
71 |
aac |
|
23 |
aga
|
** |
atgf |
|
58 |
atgi |
|
119 |
atgi |
|
** |
gaa
|
111 |
gac |
|
53 |
gaa |
|
** |
aac |
|
178 |
acc
|
** |
tac |
|
29 |
cta |
|
94 |
gga |
|
** |
caa
|
73 |
cta |
|
** |
cac |
|
** |
cta |
|
34 |
ggc
|
** |
gga |
|
90 |
aag |
|
63 |
atgf |
|
** |
gga
|
117 |
ctc |
|
504 |
ttg |
|
63 |
atgf |
|
|
|
** |
ctc |
|
** |
aaa |
|
** |
atgf |
|
|
|
87 |
aac |
|
40 |
tgg |
|
65 |
tgc |
|
|
|
110 |
atgi |
|
** |
tgc |
|
** |
tgc |
|
|
|
** |
aac |
|
62 |
aga |
|
112 |
tac |
|
mja |
cont
|
227 |
gcc |
|
** |
agg |
|
** |
gac |
|
7 |
ttc
|
62 |
atc |
|
99 |
gta |
|
223 |
gcc |
|
29 |
aac
|
** |
atc |
|
** |
gtg |
|
74 |
atc |
|
18 |
atgi
|
718 |
gaa |
|
76 |
aca |
|
** |
atc |
|
39 |
gaa
|
** |
gaa |
|
44 |
cca |
|
94 |
gtc |
|
11 |
cta
|
25 |
ggc |
|
170 |
tac |
|
7 |
ttc |
|
** |
cac
|
57 |
ttc |
|
7 |
gac |
|
61 |
ggc |
|
14 |
aca
|
71 |
gtc |
|
** |
aaa |
|
94 |
gtc |
|
8 |
cca
|
25 |
ggc |
|
4 |
gtc |
|
7 |
ttc |
|
83 |
tac
|
118 |
ttc |
|
** |
ttc |
|
** |
ggc |
|
** |
aaa
|
** |
gtc |
|
2 |
ggc |
|
|
|
|
|
|
|
|
|
** |
gga |
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
archées distribution par génome
modifier
archées distribution par génome
arch |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
duplica |
1-3aas |
total
|
mba |
14 |
37 |
|
|
|
1 |
9 |
|
61
|
mfe |
14 |
31 |
|
|
|
1 |
10 |
|
56
|
mfi |
25 |
20 |
|
|
|
2 |
|
|
47
|
mja |
8 |
16 |
1 |
4 |
6 |
2 |
|
|
37
|
total |
61 |
104 |
1 |
4 |
6 |
6 |
19 |
0 |
201
|
- Lien tableur: archées distribution du total
- Liens indices: euryarchaeota
- Notes: Les -5s +5s et -16s sont colorés et correspondent à un seul tRNA du génome mja. Les +16s sont tout les 6 des gca. Les -16s sont d'un seul bloc de 6 aas. Les -5s et +5s sont inversés dans le bloc 4aas-5s-gac.
- Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Euryarcheota. distribution et indices.
Euryarcheota. distribution du total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
4 |
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
4 |
tac |
4 |
tgc |
8
|
f atc |
6 |
j acc |
4 |
aac |
7 |
agc |
4
|
g ctc |
6 |
f ccc |
3 |
cac |
4 |
cgc |
4
|
h gtc |
6 |
n gcc |
4 |
gac |
4 |
ggc |
8
|
i tta |
6 |
c tca |
4 |
taa |
|
tga |
1
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
4
|
k cta |
4 |
g cca |
4 |
caa |
5 |
cga |
4
|
l gta |
4 |
o gca |
6 |
gaa |
7 |
gga |
4
|
m ttg |
3 |
d tcg |
3 |
tag |
|
tgg |
4
|
n atgj |
4 |
l acg |
3 |
aag |
3 |
agg |
3
|
o ctg |
3 |
h ccg |
2 |
cag |
3 |
cgg |
2
|
p gtg |
4 |
p gcg |
3 |
gag |
2 |
ggg |
3
|
arch |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
total |
80 |
104 |
1 |
4 |
6 |
6 |
201
|
|
Euryarchaeota. indices du 16.1.21 143 génomes
g1 |
|
t1 |
|
143 |
6935 |
0 |
0
|
a atgi |
99 |
a tct |
|
tat |
|
atgf |
127
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
0.7 |
e cct |
|
cat |
|
cgt |
0.7
|
d gtt |
|
m gct |
|
gat |
|
ggt |
0.7
|
e ttc |
122 |
b tcc |
106 |
tac |
104 |
tgc |
181
|
f atc |
121 |
j acc |
104 |
aac |
122 |
agc |
104
|
g ctc |
122 |
f ccc |
93 |
cac |
101 |
cgc |
102
|
h gtc |
121 |
n gcc |
101 |
gac |
124 |
ggc |
141
|
i tta |
107 |
c tca |
101 |
taa |
|
tga |
13
|
j ata |
|
k aca |
110 |
aaa |
110 |
aga |
103
|
k cta |
103 |
g cca |
102 |
caa |
108 |
cga |
103
|
l gta |
103 |
o gca |
151 |
gaa |
132 |
gga |
103
|
m ttg |
87 |
d tcg |
87 |
tag |
|
tgg |
102
|
n atgj |
101 |
l acg |
90 |
aag |
87 |
agg |
88
|
o ctg |
85 |
h ccg |
78 |
cag |
87 |
cgg |
71
|
p gtg |
91 |
p gcg |
84 |
gag |
84 |
ggg |
79
|
|
inter |
|
max |
|
min |
|
total
|
eury |
|
|
|
|
|
|
|
|
- Lien tableur: archées distribution par type
- Notes: Le cyan pour les effectifs élevés des solitaires, le jaune celui des multiples sans duplicata et le blanc, le reste. En rapportant au total de chaque type je constate que les 3 processus sont distincts et se chevauchent très peu, respectivement pour 1aa >1aa duplicata, % 65 61 79.
1aa >1aa duplica %
104 % 61 % 19
jaune 4 4 37 61 0 0
cyan 68 65 7 11 4 21
blanc 32 31 17 28 15 79
Archées. Distribution par type.
Archées. distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
4 |
tac |
|
tgc |
3
|
f atc |
2 |
j acc |
2 |
aac |
1 |
agc |
4
|
g ctc |
1 |
f ccc |
3 |
cac |
2 |
cgc |
4
|
h gtc |
1 |
n gcc |
2 |
gac |
|
ggc |
2
|
i tta |
5 |
c tca |
4 |
taa |
|
tga |
1
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
2
|
k cta |
|
g cca |
2 |
caa |
4 |
cga |
4
|
l gta |
3 |
o gca |
|
gaa |
2 |
gga |
2
|
m ttg |
2 |
d tcg |
3 |
tag |
|
tgg |
3
|
n atgj |
3 |
l acg |
3 |
aag |
2 |
agg |
2
|
o ctg |
3 |
h ccg |
2 |
cag |
3 |
cgg |
2
|
p gtg |
3 |
p gcg |
3 |
gag |
2 |
ggg |
3
|
arch |
1aa |
104 |
|
|
|
|
|
|
Archées. distribution du type >1aa sans duplicata.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
3 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
5 |
b tcc |
|
tac |
3 |
tgc |
1
|
f atc |
|
j acc |
2 |
aac |
5 |
agc |
|
g ctc |
1 |
f ccc |
|
cac |
1 |
cgc |
|
h gtc |
5 |
n gcc |
2 |
gac |
3 |
ggc |
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
2
|
k cta |
3 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
1 |
o gca |
|
gaa |
2 |
gga |
4
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
1 |
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
1 |
p gcg |
|
gag |
|
ggg |
|
arch |
>1aa |
61 |
|
|
|
|
|
|
Archées. distribution des duplicata
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
5
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
4
|
f atc |
4 |
j acc |
|
aac |
|
agc |
|
g ctc |
4 |
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
|
gaa |
2 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
arch |
dupl |
19 |
|
|
|
|
|
|
archées par rapport au groupe de référence
modifier
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
archeo4 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
40 |
11 |
4 |
|
|
|
55
|
16 |
moyen |
39 |
16 |
8 |
|
|
9 |
72
|
14 |
fort |
25 |
34 |
7 |
4 |
|
4 |
74
|
|
|
104 |
61 |
19 |
4 |
|
13 |
201
|
10 |
g+cgg |
26 |
2 |
|
|
|
|
28
|
2 |
agg+cga |
6 |
1 |
|
|
|
|
7
|
4 |
carre ccc |
7 |
8 |
4 |
|
|
|
19
|
5 |
autres |
1 |
|
|
|
|
|
1
|
|
|
40 |
11 |
4 |
|
|
|
55
|
|
|
total tRNAs ‰ |
|
|
|
|
|
archeo4 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
archeo ‰ |
ref.‰
|
21 |
faible |
199 |
55 |
20 |
|
|
|
274 |
26
|
16 |
moyen |
194 |
80 |
40 |
|
|
45 |
358 |
324
|
14 |
fort |
124 |
169 |
35 |
20 |
|
20 |
368 |
650
|
|
|
517 |
303 |
95 |
20 |
|
65 |
201 |
729
|
10 |
g+cgg |
129 |
10 |
|
|
|
|
139 |
10
|
2 |
agg+cga |
30 |
5 |
|
|
|
|
35 |
|
4 |
carre ccc |
35 |
40 |
20 |
|
|
|
95 |
16
|
5 |
autres |
5 |
|
|
|
|
|
5 |
|
|
|
199 |
55 |
20 |
|
|
|
274 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
archeo4 |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
217 |
60 |
22 |
299 |
26 |
38 |
18
|
16 |
moyen |
212 |
87 |
43 |
342 |
324 |
38 |
26
|
14 |
fort |
136 |
185 |
38 |
359 |
650 |
24 |
56
|
|
|
565 |
332 |
103 |
184 |
729 |
104 |
61
|
10 |
g+cgg |
141 |
11 |
|
152 |
10 |
65 |
|
2 |
agg+cga |
33 |
5 |
|
38 |
|
15 |
|
4 |
carre ccc |
38 |
43 |
22 |
103 |
16 |
18 |
|
5 |
autres |
5 |
|
|
5 |
|
3 |
|
|
|
217 |
60 |
22 |
299 |
|
40 |
|
euryarchaeota, estimation des -rRNAs
modifier
- Lien tableur: euryarchaeota, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 16.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est iMet, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met iMet.
- - Voir la légende des tris, g1 t1 et des couleurs
euryarchaeota, calcul des -rRNAs
modifier
eur euryarchaeota 63 génomes
eur1 cumul des +rRNAs de la fiche euryarchaeota pour 63 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
2 |
tac |
|
tgc |
28
|
f atc |
1 |
j acc |
|
aac |
|
agc |
|
g ctc |
|
f ccc |
|
cac |
0 |
cgc |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
3 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
87 |
gaa |
|
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
1 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
2
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
eury63 |
inter |
|
max |
|
min |
|
total
|
|
118 |
|
3 |
|
3 |
|
124
|
|
eur2 indices du clade euryarchaeota du 16.1.21 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
99 |
a tct |
|
tat |
|
atgf |
127
|
b att |
|
i act |
° |
aat |
|
agt |
|
c ctt |
°0.7 |
e cct |
|
cat |
|
cgt |
0.7
|
d gtt |
|
m gct |
|
gat |
|
ggt |
0.7
|
e ttc |
122 |
b tcc |
106 |
tac |
104 |
tgc |
181
|
f atc |
121 |
j acc |
104 |
aac |
122 |
agc |
104
|
g ctc |
°122 |
f ccc |
°93 |
cac |
101 |
cgc |
102
|
h gtc |
°121 |
n gcc |
°101 |
gac |
124 |
ggc |
141
|
i tta |
107 |
c tca |
101 |
taa |
|
tga |
°13
|
j ata |
° |
k aca |
110 |
aaa |
110 |
aga |
103
|
k cta |
103 |
g cca |
102 |
caa |
108 |
cga |
°103
|
l gta |
103 |
o gca |
151 |
gaa |
132 |
gga |
103
|
m ttg |
87 |
d tcg |
°87 |
tag |
|
tgg |
102
|
n atgj |
101 |
l acg |
°90 |
aag |
°87 |
agg |
°88
|
o ctg |
85 |
h ccg |
°78 |
cag |
°87 |
cgg |
°71
|
p gtg |
°91 |
p gcg |
°84 |
gag |
°84 |
ggg |
°79
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
1757 |
|
1612 |
|
1480 |
|
4848
|
|
eur3 cumul des -rRNAs de l'annexe archeo 4 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
3 |
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
5 |
b tcc |
4 |
tac |
3 |
tgc |
8
|
f atc |
6 |
j acc |
4 |
aac |
6 |
agc |
4
|
g ctc |
6 |
f ccc |
3 |
cac |
3 |
cgc |
4
|
h gtc |
6 |
n gcc |
4 |
gac |
3 |
ggc |
8
|
i tta |
6 |
c tca |
4 |
taa |
|
tga |
1
|
j ata |
|
k aca |
4 |
aaa |
4 |
aga |
4
|
k cta |
3 |
g cca |
3 |
caa |
5 |
cga |
4
|
l gta |
4 |
o gca |
|
gaa |
6 |
gga |
4
|
m ttg |
3 |
d tcg |
3 |
tag |
|
tgg |
4
|
n atgj |
4 |
l acg |
3 |
aag |
3 |
agg |
3
|
o ctg |
3 |
h ccg |
2 |
cag |
3 |
cgg |
2
|
p gtg |
4 |
p gcg |
3 |
gag |
2 |
ggg |
3
|
eury4 |
inter |
|
max |
|
min |
|
total
|
|
63 |
|
66 |
|
55 |
|
184
|
|
eur4 indices des +rRNAs de la fiche euryarchaeota pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
3 |
tac |
|
tgc |
44
|
f atc |
2 |
j acc |
|
aac |
|
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
5 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
138 |
gaa |
|
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
2 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
3
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
eury63 |
inter |
|
max |
|
min |
|
total
|
|
187 |
|
5 |
|
5 |
|
197
|
|
eur5 estimation des -rRNA du clade euryarchaeota pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
99 |
a tct |
|
tat |
|
atgf |
127
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
0.7 |
e cct |
|
cat |
|
cgc |
0.7
|
d gtt |
|
m gct |
|
gat |
|
ggt |
0.7
|
e ttc |
122 |
b tcc |
102 |
tac |
104 |
tgc |
137
|
f atc |
119 |
j acc |
104 |
aac |
122 |
agc |
104
|
g ctc |
122 |
f ccc |
93 |
cac |
101 |
cgc |
102
|
h gtc |
121 |
n gcc |
101 |
gac |
124 |
ggc |
141
|
i tta |
107 |
c tca |
101 |
taa |
|
tga |
13
|
j ata |
|
k aca |
110 |
aaa |
106 |
aga |
103
|
k cta |
103 |
g cca |
102 |
caa |
108 |
cga |
103
|
l gta |
103 |
o gca |
13 |
gaa |
132 |
gga |
103
|
m ttg |
87 |
d tcg |
87 |
tag |
|
tgg |
102
|
n atgj |
101 |
l acg |
90 |
aag |
85 |
agg |
88
|
o ctg |
85 |
h ccg |
78 |
cag |
87 |
cgg |
68
|
p gtg |
91 |
p gcg |
84 |
gag |
84 |
ggg |
79
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1569 |
|
1607 |
|
1475 |
|
4651
|
|
eur6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
75 |
a tct |
|
tat |
|
atgf |
175
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
125 |
b tcc |
100 |
tac |
75 |
tgc |
200
|
f atc |
150 |
j acc |
100 |
aac |
150 |
agc |
100
|
g ctc |
150 |
f ccc |
75 |
cac |
75 |
cgc |
100
|
h gtc |
150 |
n gcc |
100 |
gac |
75 |
ggc |
200
|
i tta |
150 |
c tca |
100 |
taa |
|
tga |
25
|
j ata |
|
k aca |
100 |
aaa |
100 |
aga |
100
|
k cta |
75 |
g cca |
75 |
caa |
125 |
cga |
100
|
l gta |
100 |
o gca |
|
gaa |
150 |
gga |
100
|
m ttg |
75 |
d tcg |
75 |
tag |
|
tgg |
100
|
n atgj |
100 |
l acg |
75 |
aag |
75 |
agg |
75
|
o ctg |
75 |
h ccg |
50 |
cag |
75 |
cgg |
50
|
p gtg |
100 |
p gcg |
75 |
gag |
50 |
ggg |
75
|
eury4 |
inter |
|
max |
|
min |
|
total
|
|
1575 |
|
1650 |
|
1375 |
|
4600
|
|
euryarchaeota, comparaison clade-annexe des -rRNAs
modifier
- Lien tableur: euryarchaeota, comparaison clade-annexe des -rRNAs
- Légende
- - eur7. diff, somme des couleurs de eur7. La différence entre tRNAs est faite entre eur5 et eur6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - eur8. rap, rapport des sommes couleurs eur5/eur2. Le rapport -rRNA/total est celui du tRNA de eur5 sur celui de eur2.
- Fréquences des différences en % du tableau eur7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 1 17 14 10 3 2 0 0 0 0 0 1 48
tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des archées.
tRNAs fiche annexe
sans 2642 184
avec 150 17
genomes 63 4
indice % 42 46
eur euryarchaeota 63 génomes
eur7 euryarchaeota, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
24 |
a tct |
|
tat |
|
atgf |
28
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
2 |
tac |
28 |
tgc |
32
|
f atc |
20 |
j acc |
4 |
aac |
19 |
agc |
4
|
g ctc |
19 |
f ccc |
19 |
cac |
26 |
cgc |
2
|
h gtc |
19 |
n gcc |
1 |
gac |
39 |
ggc |
29
|
i tta |
29 |
c tca |
1 |
taa |
|
tga |
50
|
j ata |
|
k aca |
9 |
aaa |
5 |
aga |
3
|
k cta |
27 |
g cca |
27 |
caa |
13 |
cga |
3
|
l gta |
3 |
o gca |
100 |
gaa |
12 |
gga |
3
|
m ttg |
14 |
d tcg |
14 |
tag |
|
tgg |
2
|
n atgj |
1 |
l acg |
17 |
aag |
12 |
agg |
15
|
o ctg |
12 |
h ccg |
36 |
cag |
14 |
cgg |
27
|
p gtg |
9 |
p gcg |
11 |
gag |
40 |
ggg |
5
|
diff |
inter |
|
max |
|
min |
|
total
|
|
361 |
|
220 |
|
311 |
|
832
|
|
eur8 euryarchaeota, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
97 |
tac |
|
tgc |
75
|
f atc |
99 |
j acc |
|
aac |
|
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgc |
2
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
96 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
9 |
gaa |
|
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
98 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
96
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
rap |
inter |
|
max |
|
min |
|
total
|
|
89 |
|
100 |
|
100 |
|
96
|
|
Intergen51. Archeo. Introduction
modifier
Intergen51. Archeo. Historique des pré-études
modifier
total max1 reste max2 un
mba 2379 1733 12 2693 2705
mfe 2011 1740 10 2916 4246
mfi 1545 909 8 1722 11130
mja 1069 685 5 859 1019
archées données intercalaires 200
modifier
Intergen51. Archeo. Vue de l'ensemble
modifier
Intergen51. Archeo. La longueur totale des intercalaires d'un génome
modifier
- Note: voir la totale. Deux des archées présentent les taux les plus élevés de cette étude des 51 génomes, plus de 25% les 2 autres sont dans la moyenne des 12%.
Nom intercalaires génome taux en %
archeo
mba 1,341,425 4,837,408 27.7
mfe 987,074 3,914,091 25.2
mfi 403,834 2,478,074 16.3
mja 168,865 1,664,970 10.1
Intergen51. Archeo. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. Archeo. Les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t5/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
Int51.2 Archeo les différents types d'intercalaires entre gènes de 4 génomes
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
6 926 |
887 |
78 |
7 891 |
2,3 |
86 |
2 |
88
|
x |
3 357 |
100 |
12 |
3 469 |
|
2 |
15 |
17
|
t |
10 283 |
987 |
90 |
11 360 |
|
88 |
17 |
105
|
% |
90,5 |
8,7 |
0,8 |
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
153 |
1 |
2 |
156 |
1,4 |
tRNA-CDS |
268 |
42
|
x |
112 |
1 |
0 |
113 |
|
RNA-RNA |
88 |
14
|
t |
265 |
2 |
2 |
269 |
|
CDS-rRNA |
17 |
3
|
% |
98,5 |
0,7 |
0,7 |
|
|
non RNA |
63 |
10
|
|
|
|
|
|
|
total |
436 |
68
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
c |
18,3 |
21,2 |
2,5 |
20,1 |
3,2 |
52 |
1,0 |
1,3
|
x |
30,4 |
25,9 |
9,0 |
6,3 |
3,6 |
38 |
0,3 |
0,0
|
|
Intergen51. Archeo. Détail des intercalaires RNA-RNA et CDS-rRNA
modifier
archeo
RNA-RNA c x CDS-RNA c x
23s5s 9 CDS 16s 1 7
16s23s 4 5s CDS 1 7
16stRNA 6 16 CDS
tRNA23s 6 CDS 5s
5stRNA 1 23s CDS
tRNAin 0 CDS 23s 1
tRNAcontig 8 5s 16s 1
tRNAhors 49 1 16s16s
tRNA16s 1
23stRNA
tRNA5s 1
16s5s
5s23s
5s5s 1
total 86 1 total 2 16
Intergen51. Archeo. Les intercalaires rares
modifier
tRNA-CDS
gen x- c- c0
mfi -1
mba -12 1
mfe 1
tRNA h x+
mfe 227
5s5s c+
mfi 748
5s16s x+
mja 340
Intergen51. Archeo. Les diagrammes de la totale
modifier
Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS
modifier
Intergen51. Archeo. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
- Lien aux archées données intercalaires.
- Diagrammes des archeo: tar présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx% fc%, CDS-CDS discontinu continu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1
R2 x3 x2 x c Inflexion poly3 x c
0,691 6,84E-07 -5,39E-04 8,70E-02 1,78E+01 fx1 abscisse 250,9 762,1
0,856 -3,86E-06 2,91E-03 -7,27E-01 7,29E+01 fc1 ordonnée 16,3 5,6
poly3/droite 15,9 -22,9
0,753 1,78E-06 -1,34E-03 2,61E-01 7,03E+00 fx41
0,976 -9,36E-08 2,14E-04 -1,52E-01 3,86E+01 fc41 R2 f.1 x c
Poly 3 691 856
0,578 -0,036 24,9 fx41 Poly 6 761 979
0,940 -0,072 32,0 fc41 Poly 9 774 991
0,575 -0,031 23,8 fx1
0,623 -0,112 43,1 fc1
Intergen51. Archeo. Les diagrammes CDS-CDS négatifs
modifier
Intergen51. Archeo. comparaison avec la totale
modifier
Sous-totaux archeo totale
fréquence x- c- x- c-
-1 0 106 4 4140
-2 3 0 85 11
-3 0 2 3 12
-4 34 354 717 10938
-5 1 2 5 19
sp6 62 423 1642 8424
total 100 887 2 456 23 544
reste 9 22 264 420
s6 27 10 361 41
s7 7 86 321 1438
s8 19 305 696 6525
rappot s1-5
4/2/1 11,3 3,3 8,4 2,6
% / sp6
s6/sp6 43,5 2,4 22,0 0,5
s7/sp6 11,3 20,3 19,5 17,1
s8/sp6 30,6 72,1 42,4 77,5
reste/sp6 14,5 5,2 16,1 5,0
total s1-5 38 464 814 15120
% / total
%s1-5 38,0 52,3 33,1 64,2
%sp6 62,0 47,7 66,9 35,8
Intergen51. Archeo. homogénéité des génomes
modifier
- Lien aux données intercalaires des génomes
- Homogénéité des génomes:
- - Dans les discontinus mfe mfi mba sont homogènes pour s1-5/sp6 avec 1/4 et mja fait 1/1. Les 4 génomes sont hétérogènes pour le rapport 4/2, 4.0 ? 1.5 (mfe mfi mba) etsupérieur à 25 pour mja. Ils sont aussi hétérogènes pour s6 et s8, peut être homogènes pour s7.
- - Dans les continus les 4 génomes sont homogènes partout sauf mja qui a un rapport 4/1 de 2.0 contre plus de 3 pour les 3 autres. Les continus se distinguent des autres clades par un rapport s1-5/sp6 de 1/1 alors qu'en général il est de 1/4.
négatifs x mfe mfi mba mja total
total 17 5 22 56 100
s1-5 5 1 6 26 38
sp6 12 4 16 30 62
rapport s1-5
4/2 4.0 - 1.5 - 11.3
% / sp6
s6 42 25 13 63 44
s7 17 0 13 10 11
s8 17 25 56 23 31
reste 25 50 19 3 15
% / total
s1-5 29 20 27 46 38
sp6 71 80 73 54 62
négatifs c mfe mfi mba mja total
total 250 167 307 163 887
s1-5 142 92 152 78 464
sp6 108 75 155 85 423
rapport s1-5
4/1 4.5 3.2 3.5 2.0 3.3
% / sp6
s6 3 0 5 0 2
s7 20 17 22 20 20
s8 74 73 70 73 72
reste 3 9 4 7 5
% / total
s1-5 57 55 50 48 52
sp6 43 45 50 52 48
Intergen51. Archeo. Les grands négatifs inférieurs à -120
modifier
Intergen51. Archeo. Les diagrammes CDS-rRNA
modifier
Intergen51. Archeo. Les diagrammes CDS-16s
modifier
archeo CDS16sc CDS16sx 5sCDSc 5sCDSx
R2 - - - -
xs 454 799,8 857 410,4
plage 480 690-990 870 270-630
total-p 1 6 1 5
% 100 86 100 71
queue 0 1 0 1
% 0 14 0 14
tête 0 0 0 1
% 0 0 0 14
max 450;1 720;2 870;1 300;2
total4 1 7 1 7
freq 30 30 30 30
Intergen51.archeo. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
933,3 |
277,9 |
3,4 |
718 |
835 |
1247 |
16,8 |
156,0
|
mfe |
840,7 |
134,6 |
6,2 |
704 |
845 |
973 |
109,4 |
63,3
|
mfi |
724 |
|
|
724 |
|
|
226,1 |
-53,3
|
mja |
|
|
|
|
|
|
|
|
total |
863,7 |
194,2 |
4,4 |
|
|
|
950,1 |
777,3
|
|
CDS16sc. continu
CDS16sc |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
|
|
|
|
|
|
|
|
mfe |
|
|
|
|
|
|
|
|
mfi |
454 |
|
|
454 |
|
|
|
|
mja |
|
|
|
|
|
|
|
|
total |
454 |
|
|
|
|
|
|
|
|
Intergen51. Archeo. Les diagrammes 5s-CDS
modifier
voir données intercalaires
archeo 5sCDSc 5sCDSx ftx ftc
R2 - - 0,127 0,393
xs 857 410,4 285,9 138,7
plage 870 270-630 40-250 40-300
total-p 1 5 48 102
% 100 71 43 65
queue 0 1 59 46
% 0 14 53 29
tête 0 1 4 5
% 0 14 4 3
max 870;1 300;2 250;5 200;9
total4 1 7 112 156
freq 30 30 10 10
Intergen51.archeo. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
ftx-fx 92,7 ftc-fc 127,4
ftx-fx -1,7 ftc-fc -19,6
Intergen51.Archeo Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
mba |
330,2 |
153,1 |
2,2 |
2 |
7 |
-10,0 |
68,2
|
mfe |
305,4 |
135,0 |
2,3 |
2 |
4 |
14,7 |
43,5
|
mfi |
308,7 |
139,6 |
2,2 |
4 |
0 |
11,5 |
46,7
|
mja |
186,2 |
87,9 |
2,1 |
0 |
0 |
134,0 |
-75,7
|
total |
291,1 |
143,0 |
2,0 |
|
++ |
320,2 |
262,0
|
|
5sCDSx. 5s-CDS discontinu
5sCDSx |
moyenne |
écart |
m/e |
intercalaires |
-
|
mba |
461,3 |
160,7 |
2,9 |
289 |
488 |
607 |
|
mfe |
138,0 |
188,1 |
0,7 |
5 |
271 |
|
|
mfi |
397 |
|
|
397 |
*939 |
|
|
mja |
|
|
|
|
|
|
|
total |
342,8 |
207,8 |
1,6 |
++ |
377,1 |
308,6 |
-
|
|
ftc. tRNA-CDS continu
ftc |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
mba |
310,9 |
175,0 |
1,8 |
2 |
8 |
-43,6 |
92,2
|
mfe |
273,3 |
156,2 |
1,7 |
0 |
5 |
-5,9 |
54,5
|
mfi |
182,8 |
91,0 |
2,0 |
2 |
0 |
84,5 |
-35,9
|
mja |
144,0 |
102,3 |
1,4 |
5 |
0 |
123,4 |
-74,8
|
total |
243,1 |
154,5 |
1,6 |
|
++ |
267,4 |
218,7
|
|
5sCDSc. 5s-CDS continu
5sCDSc |
moyenne |
écart |
m/e |
intercalaires |
-
|
mba |
|
|
|
|
|
|
|
mfe |
857 |
|
|
*857 |
|
|
|
mfi |
|
|
|
|
|
|
|
mja |
|
|
|
|
|
|
|
total |
857 |
|
|
++ |
857 |
|
-
|
|
fx. CDS-CDS discontinu
fx |
moyenne |
écart |
m/e |
ftx-fx |
Sup 700 |
haut |
bas
|
mba |
314,0 |
172,6 |
1,8 |
16,2 |
229 |
-11,9 |
66,8
|
mfe |
288,4 |
170,2 |
1,7 |
17,0 |
140 |
13,6 |
41,3
|
mfi |
237,1 |
143,2 |
1,7 |
71,5 |
15 |
64,9 |
-10,0
|
mja |
185,1 |
127,3 |
1,5 |
1,1 |
0 |
116,9 |
-62,0
|
total |
274,6 |
166,7 |
1,65 |
16,5 |
++ |
302,0 |
247,1
|
|
fc. CDS-CDS continu
fc |
moyenne |
écart |
m/e |
ftc-fc |
Sup 700 |
haut |
bas
|
mba |
277,8 |
177,6 |
1,6 |
33,1 |
280 |
-24,7 |
70,7
|
mfe |
251,2 |
165,9 |
1,5 |
22,1 |
183 |
2,0 |
44,1
|
mfi |
181,7 |
123,9 |
1,5 |
1,1 |
17 |
71,4 |
-25,4
|
mja |
136,8 |
87,6 |
1,6 |
7,2 |
5 |
116,4 |
-70,3
|
total |
230,2 |
161,7 |
1,42 |
12,9 |
++ |
253,2 |
207,1
|
|
Intergen51. Archeo. Les CDS-rRNA rares
modifier
Intergen51. Archeo. Les diagrammes RNA-RNA
modifier
Intergen51. Archeo. Les diagrammes rRNA-rRNA
modifier
archeo 16s23s 16stRNA tRNA23s 23s5s
R2 - - - -
xs 202,5 76,0 185,8 110,6
plage 180-220 60-100 100-240 60-180
total-p 4 6 6 25
% 100 100 100 100
queue 0 0 0 0
% 0 0 0 0
tête 0 0 0 0
% 0 0 0 0
max 220;2 100;3 220;2 80;8
total8 4 6 6 25
freq 20 20 20 20
Intergen51. Archeo. Les diagrammes tRNA-rRNA
modifier
Intergen51.archeo. Moyennes rRNA-RNA
16s23s.
16s23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
209 |
|
|
2x209 |
|
|
13,8 |
26,8
|
mfe |
196 |
|
|
2x196 |
|
|
26,8 |
13,8
|
mfi |
|
|
|
|
|
|
|
|
mja |
|
|
|
|
|
|
|
|
total |
202,5 |
7,5 |
27,0 |
|
|
|
222,8 |
182,3
|
|
23s5s.
23s5s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
74 |
|
|
3x74 |
|
|
62,0 |
-37,3
|
mfe |
74 |
|
|
3x74 |
|
|
62,0 |
-37,3
|
mfi |
295,5 |
13,4 |
22,0 |
286 |
305 |
|
-159,5 |
184,2
|
mja |
78 |
|
|
78 |
|
|
58,0 |
-33,3
|
total |
123,7 |
97,5 |
1,3 |
|
|
|
136,0 |
111,3
|
|
16stRNA.
16stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
85 |
|
|
85 |
|
|
-1,4 |
16,6
|
mfe |
84 |
|
|
84 |
|
|
-0,4 |
15,6
|
mfi |
79,5 |
10,6 |
7,5 |
72 |
87 |
|
4,1 |
11,1
|
mja |
64 |
|
|
2x64 |
|
|
19,6 |
-4,4
|
total |
76,0 |
10,7 |
7,1 |
|
|
|
83,6 |
68,4
|
|
tRNA23s.
tRNA23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
mba |
116 |
|
|
116 |
|
|
88,4 |
-51,2
|
mfe |
119 |
|
|
119 |
|
|
85,4 |
-48,2
|
mfi |
233 |
|
|
2x 233 |
|
|
-28,6 |
65,8
|
mja |
207 |
|
|
2x 207 |
|
|
-2,6 |
39,8
|
total |
185,8 |
54,2 |
3,4 |
|
|
|
204,4 |
167,3
|
|
Intergen51. Archeo. Les diagrammes tRNA-tRNA
modifier
type c S40 % R2 diag total reste x+ restes hors tRNA 5s 5stRNA
hors 12 24 0,142 140 49 4 227 178 13 80
5s tRNA 0 1 1 223
tRNA 5s 1 1 1 504 tRNA contig
tRNA contig 7 87 40 8 1 718 83
Les pourcentages des tRNA-tRNA hors blocs
modifier
tRNA h mba mja mfi mfe total %
20 2 4 0 6 12.2
40 2 2 2 6 12.2
60 3 1 4 8.2
80 6 2 4 12 24.5
100 3 1 3 2 9 18.4
120 2 4 6 12.2
140 1 1 2.0
160
180 1 1 2 4.1
200
220
240 1 1 2.0
260
restes 1 1 2 4.1
total 15 4 16 14 49 100.0
repete 4 0 0 5 9 26
séquence 2 0 0 2 4 11
sans 2 9 9 2 22 63
clusters 8 9 9 9 35 100
5 0 0
10 2 3 5 10.2
15 1 1 2.0
20 0 0
Intergen51.archeo. Moyennes tRNA-tRNA
mja
mja |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
5stRNA |
80 |
|
|
1 |
100 |
|
|
|
tRNA in |
- |
|
|
0 |
|
|
|
|
tRNA cont |
26,1 |
25,5 |
1,0 |
8 |
88 |
0 |
|
|
- |
|
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
tRNA hors cluster
tRNA hors |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
mba |
71,1 |
34,2 |
2,1 |
15 |
13 |
2 |
-0,9 |
13,7
|
mfe |
78,2 |
31,4 |
2,5 |
14 |
21 |
1 |
-8,1 |
20,8
|
mfi |
46,7 |
33,8 |
1,4 |
16 |
56 |
2 |
23,5 |
-10,7
|
mja |
49,3 |
36,5 |
1,4 |
4 |
50 |
|
20,8 |
-8,1
|
total |
63,8 |
35,0 |
1,8 |
49 |
33 |
5 |
70,2 |
57,4
|
|
Intergen51. Archeo. Les RNA-RNA rares
modifier
- tRNA hors x+, mfe 227.
- tRNA 16s c+, 295.
- 5s5s c+, 748