En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : gamma
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/gamma », n'a pu être restituée correctement ci-dessus.
S1. Shewanella pealeana
39.1%GC |
30.6.19 Paris |
147 |
doubles |
interca
|
|
45136..46685 |
16s |
@1 |
339
|
|
47025..49946 |
23s |
|
112
|
|
50059..50174 |
5s |
|
|
|
|
|
|
|
|
51490..53039 |
16s |
|
339
|
|
53379..56298 |
23s |
|
114
|
|
56413..56528 |
5s |
|
|
|
|
|
|
|
|
182271..183820 |
16s |
@2 |
71
|
|
183892..183968 |
atc |
|
65
|
|
184034..184109 |
gca |
|
364
|
|
184474..187395 |
23s |
|
112
|
|
187508..187623 |
5s |
|
100
|
|
187724..187800 |
gac |
|
|
|
|
|
|
|
|
191614..191689 |
aca |
|
8
|
|
191698..191782 |
tac |
|
35
|
|
191818..191891 |
gga |
|
|
|
|
|
|
|
|
235182..236731 |
16s |
|
374
|
|
237106..240025 |
23s |
|
114
|
|
240140..240255 |
5s |
|
|
|
|
|
|
|
|
243631..245180 |
16s |
|
338
|
|
245519..248440 |
23s |
|
113
|
|
248554..248669 |
5s |
|
68
|
|
248738..248813 |
acc |
|
17
|
|
248831..248946 |
5s |
|
|
|
|
|
|
|
|
416766..416842 |
cgg |
|
39
|
|
416882..416957 |
cac |
|
41
|
|
416999..417075 |
cca |
+ |
58
|
|
417134..417210 |
cca |
2 cca |
|
|
|
|
|
|
|
493711..495260 |
16s |
|
339
|
|
495600..498519 |
23s |
|
114
|
|
498634..498749 |
5s |
|
|
|
|
|
|
|
|
641376..641466 |
tca |
@3 |
1172
|
|
642639..642729 |
tca |
|
|
|
|
|
|
|
|
645847..647396 |
16s |
|
71
|
|
647468..647544 |
atc |
|
65
|
|
647610..647685 |
gca |
|
329
|
|
648015..650937 |
23s |
|
156
|
|
651094..651209 |
5s |
|
|
|
|
|
|
|
|
728115..728199 |
ttg |
|
|
|
|
|
|
|
comp |
1168942..1169018 |
atgi |
|
|
|
|
|
|
|
comp |
1339706..1339781 |
aca |
+ |
52
|
comp |
1339834..1339909 |
ttc |
2 ttc |
539
|
comp |
1340449..1340524 |
aca |
2 aca |
52
|
comp |
1340577..1340652 |
ttc |
|
|
|
|
|
|
|
comp |
1342467..1342542 |
aca |
|
52
|
comp |
1342595..1342670 |
ttc |
|
|
|
|
|
|
|
|
1456724..1456815 |
agc |
|
21
|
|
1456837..1456913 |
cgt |
+ |
30
|
|
1456944..1457020 |
cgt |
7 cgt |
32
|
|
1457053..1457129 |
cgt |
3 agc |
30
|
|
1457160..1457236 |
cgt |
|
33
|
|
1457270..1457346 |
cgt |
|
9
|
|
1457356..1457447 |
agc |
|
76
|
|
1457524..1457600 |
cgt |
|
35
|
|
1457636..1457712 |
cgt |
|
9
|
|
1457722..1457813 |
agc |
|
|
|
|
|
|
|
comp |
1627363..1627438 |
agg |
|
|
|
|
|
|
|
comp |
1770483..1770558 |
gta |
+ |
37
|
comp |
1770596..1770671 |
gta |
11 gta |
37
|
comp |
1770709..1770784 |
gta |
|
37
|
comp |
1770822..1770897 |
gta |
|
37
|
comp |
1770935..1771010 |
gta |
|
37
|
comp |
1771048..1771123 |
gta |
|
37
|
comp |
1771161..1771236 |
gta |
|
37
|
comp |
1771274..1771349 |
gta |
|
37
|
comp |
1771387..1771462 |
gta |
|
37
|
comp |
1771500..1771575 |
gta |
|
39
|
comp |
1771615..1771690 |
gta |
|
|
|
|
|
|
|
|
1773910..1773985 |
gcc |
+ |
80
|
|
1774066..1774141 |
gaa |
13 gaa |
102
|
|
1774244..1774319 |
gaa |
2 gcc |
102
|
|
1774422..1774497 |
gaa |
|
102
|
|
1774600..1774675 |
gaa |
|
102
|
|
1774778..1774853 |
gaa |
|
102
|
|
1774956..1775031 |
gaa |
|
102
|
|
1775134..1775209 |
gaa |
|
102
|
|
1775312..1775387 |
gaa |
|
253
|
|
1775641..1775716 |
gaa |
|
102
|
|
1775819..1775894 |
gaa |
|
102
|
|
1775997..1776072 |
gaa |
|
102
|
|
1776175..1776250 |
gaa |
|
102
|
|
1776353..1776428 |
gaa |
|
47
|
|
1776476..1776551 |
gcc |
|
|
|
|
|
|
|
|
2081297..2082846 |
16s |
|
338
|
|
2083185..2086104 |
23s |
|
114
|
|
2086219..2086334 |
5s |
|
|
|
|
|
|
|
comp |
2143274..2143350 |
ccc |
|
|
|
|
|
|
|
comp |
2366164..2366240 |
atgf |
+ |
40
|
comp |
2366281..2366357 |
atgf |
4 atgf |
40
|
comp |
2366398..2366474 |
atgf |
|
40
|
comp |
2366515..2366591 |
atgf |
|
|
|
|
|
|
|
|
2376218..2376308 |
tca |
|
|
|
|
|
|
|
|
2379767..2379842 |
ggc |
|
13
|
|
2379856..2379929 |
tgc |
|
85
|
|
2380015..2380100 |
tta |
|
|
|
|
|
|
|
|
2550857..2550932 |
ggc |
|
13
|
|
2550946..2551019 |
tgc |
+ |
95
|
|
2551115..2551200 |
tta |
3 tgc |
634
|
|
2551835..2551908 |
tgc |
3 tta |
95
|
|
2552004..2552089 |
tta |
|
479
|
|
2552569..2552642 |
tgc |
|
132
|
|
2552775..2552860 |
tta |
|
|
|
|
|
|
|
|
2558019..2558109 |
tca |
|
|
|
|
|
|
|
comp |
2717566..2717655 |
tcc |
|
|
|
|
|
|
|
comp |
2759730..2759806 |
atgf |
+ |
189
|
comp |
2759996..2760072 |
atgf |
4 atgf |
45
|
comp |
2760118..2760194 |
gtc |
2 gtc |
2
|
comp |
2760197..2760273 |
atgf |
|
35
|
comp |
2760309..2760385 |
gtc |
|
13
|
comp |
2760399..2760475 |
atgf |
|
|
|
|
|
|
|
|
2858823..2858907 |
tac |
+ |
30
|
|
2858938..2859022 |
tac |
5 tac |
85
|
|
2859108..2859192 |
tac |
|
107
|
|
2859300..2859384 |
tac |
|
107
|
|
2859492..2859576 |
tac |
|
|
|
|
|
|
|
|
2866268..2866343 |
aac |
+ |
45
|
|
2866389..2866464 |
aac |
7aac |
41
|
|
2866506..2866581 |
aac |
|
26
|
|
2866608..2866683 |
aac |
|
32
|
|
2866716..2866791 |
aac |
|
33
|
|
2866825..2866900 |
aac |
|
40
|
|
2866941..2867016 |
aac |
|
|
|
|
|
|
|
comp |
2929429..2929505 |
gac |
+ |
97
|
comp |
2929603..2929679 |
gac |
4 gac |
97
|
comp |
2929777..2929853 |
gac |
|
83
|
comp |
2929937..2930013 |
gac |
|
|
|
|
|
|
|
comp |
3120289..3120364 |
aaa |
+ |
58
|
comp |
3120423..3120498 |
aaa |
12 aaa |
58
|
comp |
3120557..3120632 |
aaa |
|
58
|
comp |
3120691..3120766 |
aaa |
|
59
|
comp |
3120826..3120901 |
aaa |
|
57
|
comp |
3120959..3121034 |
aaa |
|
58
|
comp |
3121093..3121168 |
aaa |
|
58
|
comp |
3121227..3121302 |
aaa |
|
59
|
comp |
3121362..3121437 |
aaa |
|
58
|
comp |
3121496..3121571 |
aaa |
|
59
|
comp |
3121631..3121706 |
aaa |
|
59
|
comp |
3121766..3121841 |
aaa |
|
|
|
|
|
|
|
comp |
3269860..3269935 |
cac |
|
8
|
comp |
3269944..3270020 |
aga |
|
63
|
comp |
3270084..3270160 |
cca |
|
|
|
|
|
|
|
comp |
3757983..3758059 |
atgf |
|
|
comp |
3758163..3758249 |
ctc |
|
|
|
|
|
|
|
comp |
3835257..3835331 |
caa |
+ |
51
|
comp |
3835383..3835467 |
cta |
5 caa |
131
|
comp |
3835599..3835673 |
caa |
5 cta |
20
|
comp |
3835694..3835778 |
cta |
3 atg |
96
|
comp |
3835875..3835949 |
caa |
|
49
|
comp |
3835999..3836083 |
cta |
|
211
|
comp |
3836295..3836371 |
atg |
|
5
|
comp |
3836377..3836451 |
caa |
|
47
|
comp |
3836499..3836583 |
cta |
|
55
|
comp |
3836639..3836715 |
atg |
|
5
|
comp |
3836721..3836795 |
caa |
|
47
|
comp |
3836843..3836927 |
cta |
|
55
|
comp |
3836983..3837059 |
atg |
|
|
|
|
|
|
|
comp |
3862885..3862961 |
tgg |
+ |
167
|
comp |
3863129..3863205 |
tgg |
2 tgg |
|
|
|
|
|
|
comp |
3867049..3867164 |
5s |
|
114
|
comp |
3867279..3870198 |
23s |
|
338
|
comp |
3870537..3872086 |
16s |
|
|
|
|
|
|
|
|
3882154..3882229 |
ttc |
|
|
|
|
|
|
|
comp |
4331488..4331563 |
ggc |
+ |
130
|
comp |
4331694..4331769 |
ggc |
6 ggc |
47
|
comp |
4331817..4331892 |
ggc |
|
162
|
comp |
4332055..4332130 |
ggc |
|
16
|
comp |
4332147..4332222 |
ggc |
|
48
|
comp |
4332271..4332346 |
ggc |
|
|
|
|
|
|
|
comp |
4616881..4616996 |
5s |
|
112
|
comp |
4617109..4620030 |
23s |
|
364
|
comp |
4620395..4620470 |
gca |
|
65
|
comp |
4620536..4620612 |
atc |
|
71
|
comp |
4620684..4622233 |
16s |
|
|
|
|
|
|
|
comp |
5129770..5129846 |
gac |
|
100
|
comp |
5129947..5130062 |
5s |
|
115
|
comp |
5130178..5133097 |
23s |
|
339
|
comp |
5133437..5134986 |
16s |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.spl. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
spl cumuls opérons effectif
avec rRNA opérons 11
16 23 5s 0 6
16 atc gca 3
16 23 5s a 2
max a 3
a doubles 0
spéciaux 0
total aas 9
sans opérons 29
1 aa 8
max a 15
a doubles 15
total aas 133
total aas 142
remarques 3
S1. Shewanella pealeana, blocs à rRNA.
16s |
339 |
339 |
374 |
339 |
338 |
338 |
|
23s |
112 |
114 |
114 |
114 |
114 |
114 |
|
5s |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16s |
71 |
71 |
71 |
16s |
338 |
16s |
339
|
atc |
65 |
65 |
65 |
23s |
113 |
23s |
115
|
gca |
364 |
329 |
364 |
5s |
68 |
5s |
100
|
23s |
112 |
156 |
112 |
acc |
17 |
gac |
|
5s |
100 |
|
|
5s |
|
|
|
gac |
|
|
|
|
|
|
|
- Remarques :
- @1 8 blocs 16-23-5s. Ils ont tous les mêmes intercalaires, 338 113 68.
- - 6 blocs sont solo avec un dont l'intercalaire 16s-23s fait 11% de plus que le reste, 36/338.
- - 2 blocs avec 1 aa dont un possède en plus un 5s, gac et acc-5s.
- @2 Les 2 blocs 16-atc-gca ont les mêmes intercalaires, 71 65 364 112. L’intercalaire 23s-5s est le même que les 6 autres blocs.
- - Les 2 blocs n'ont que 5 aas, soit pour les 8 opérons à rRNA 7 aas au total. Ce qui est quasiment nul.
- @3 Les intercalaires élevés ne touchent que 3 opérons sans rRNAs
- anciens - nouveaux -
intercalires n aas doubles nv doubles nv opérons
1172 2 2 0 2
539 4 2,2 0 2
634, 479 6 3,3 0 3
résultats ancien nouveau
total opérons 29 33
1 aa 8 10
max aa 15 15
doubles 15 12
- Séquences des doubles : Les intercalaires excessives ne changent pas fondamentalement le spectre des doubles et leurs séquences. Ainsi les répétitions suivantes sont caractéristiques de ce génome.
- - opéron à 13 gaa avec 11 intercalalires identiques de 102 bases, soit 11 répétitions d’une séquence de 180 bases environ, longueur de gaa+102.
- - Les répétitions de séquences sont nombreuses. La plus longue est celle de l’opéron à 5 cta 5 caa 3 atg. Ce sont 5 séquences caa-cta avec un intercalaire de 50 interrompues par 2 atg et 2 intercalaires de 100 bases environ.
- - Les 2 autres opérons à séquences répétées sont, 4atgf 2gtc (2*(2atgf-gtc)) et 6 ggc (avec 2 ggc-ggc séparées par des intercalaires longs).
- - Répétitions du même codon avec son intercalaire comme pour le cas de l'opéron à 15 codons,
codon répétition intercalaire
gaa 13 102
gta 11 37
tac 5 100
aac 7 35
gac 4 97
aaa 12 58
atgf 4 40
- Lien tableur: spl distribution
- Notes:
- - gta11 tca2 cca2 tac5 aac7 gac4 aaa12 gaa13 atgf4+2 cgt5+2 ggc8 tgg2
- - tca: tca2, 2 1aa
- - gac: 2 5s, gac4
- - Séquences:
- (aca ttc)2
- (tgc tta)3
- (atf gtc)2
- (caa cta atgj)3 ou (caa cta)5
Gm1 spl, Shewanella pealeana. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
9
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
1 |
tac |
6 |
tgc |
4
|
f atc |
3 |
j acc |
1 |
aac |
7 |
agc |
3
|
g ctc |
1 |
f ccc |
1 |
cac |
2 |
cgt |
7
|
h gtc |
2 |
n gcc |
2 |
gac |
6 |
ggc |
8
|
i tta |
4 |
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
12 |
aga |
1
|
k cta |
5 |
g cca |
3 |
caa |
5 |
cga |
|
l gta |
11 |
o gca |
3 |
gaa |
13 |
gga |
1
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
spl |
125 |
8 |
|
3 |
|
6 |
140
|
- spl Le prélèvement: Aspl
- Le nom et le lien NCBI: spl, Shewanella pealeana ATCC 700345, NCBI [3], date 24.09.20.
- Note de l'étude préliminaire pour l'étude des intercalaires cds-cds:
- - Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
- spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
spl 789 212 5 174 581 15,3
Intergen51. spl. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. spl les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 spl les différents types d'intercalaires entre gènes
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2 482 |
414 |
17 |
2 913 |
2,2 |
141 |
7 |
148
|
x |
1 305 |
12 |
1 |
1 318 |
|
0 |
11 |
11
|
t |
3 787 |
426 |
18 |
4 231 |
|
141 |
18 |
159
|
% |
89,5 |
10,1 |
0,4 |
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
39 |
0 |
0 |
39 |
1,7 |
tRNA-CDS |
62 |
25
|
x |
22 |
1 |
0 |
23 |
|
RNA-RNA |
141 |
56
|
t |
61 |
1 |
0 |
62 |
|
CDS-rRNA |
18 |
7
|
% |
98,4 |
1,6 |
0,0 |
|
|
non RNA |
32 |
13
|
- |
|
|
|
|
|
total |
253 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
10,2 |
38,5 |
1,2 |
24,1 |
0,0 |
63 |
0,6 |
0,0
|
x |
17,6 |
30,4 |
8,3 |
3,1 |
0,0 |
58 |
0,1 |
0,0
|
|
Intergen51. spl. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: spl données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées spl fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. spl fx1
- Équations des courbes de tendance en pour 1000: à partir des colonnes fx fc des données intercalaires.
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 spl
R2 x3 x2 x c Inflexion poly3 x c
0,613 3,91E-06 -2,74E-03 4,89E-01 6,45 fx1 abscisse 220,9 150,6
0,805 -4,24E-06 3,25E-03 -8,35E-01 85,1 fc1 ordonnée 21,5 24,0
0,655 1,66E-06 -1,10E-03 1,26E-01 29,4 fx41
0,909 8,15E-07 -3,68E-04 -6,78E-02 39,8 fc41
- Le rfin après 400 est de 253 sur un total de 2482. Jusqu'à 1% les freq10 sont en continu jusqu'à 860, reste 26. L'indice i.rfin1 = 227/460 = 0.493.
- Moyennes glissantes des fc+400, diagonale. Voir le détail des calculs dans abs.
données spl calculs poly3 spl
effect 2482 R2.21 802 abscis 400
xm 45 pte 8,97 flexa 150
ym 7 cste 3,22 flexo 2,36
x1m 248 r400l 152 xm 42
y1m 1 restp 222,00 sup4 97,4
rfin 101,93 %sd 27,38 sup4t 334,0
bornf 147 lond 203 % 29,2
supd 132,4 %sf 28,56 long 108
supdt 483,5 lonf 102 R2 594
xmp 294,52 sf/lf 0,89
r400 120,06 sr/lr 0,41
supf 90,7 sd/ld 0,65
supft 317,5 i.r400 0,79
Intergen51. spl. Les CDS-CDS négatifs
modifier
Sous-totaux spl totale
fréquence x- c- x- c-
-1 0 126 4 4140
-2 2 0 85 11
-3 0 0 3 12
-4 5 136 717 10938
-5 0 0 5 19
sp6 5 152 1642 8424
total 12 414 2 456 23 544
reste 1 5 264 420
s6 1 0 361 41
s7 0 30 321 1438
s8 3 117 696 6525
rappot s1-5
4/2/1 2,5 1,1 8,4 2,6
% / sp6
s6/sp6 20,0 0,0 22,0 0,5
s7/sp6 0,0 19,7 19,5 17,1
s8/sp6 60,0 77,0 42,4 77,5
reste/sp6 20,0 3,3 16,1 5,0
total s1-5 7 262 814 15120
% / total
%s1-5 58,3 63,3 33,1 64,2
%sp6 41,7 36,7 66,9 35,8
Intergen51. spl. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 11 CDS 16s 5 5
16s 23s 8 5s CDS 2 6
16s tRNA 3 16 CDS
tRNA 23s 3 CDS 5s
5s tRNA 3 23s CDS
tRNA in 3 CDS 23s
tRNA contig 5s 16s 1
tRNA hors 108 16s16s
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 140 0 total 8 11
- Les rares voir gamma pour la longueur des intercalaires
type c x
tRNA CDS -23
tRNA5s-acc 17
5s16s 1319
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
- Lien tableur: Intergen51. spl. Les intercalaires tRNA-tRNA extra bloc
- Les contigus aux blocs: inexistants
- Les hors blocs: 108 au total avec de fortes répétitions qui donnent un diagramme en dents de scie (tableur). Voir les doubles dans ancien spl et le chapitre distribution qui le suit.
- Notes: les 12 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
1172 tca 51 caa 80 gcc
** tca 131 cta 11* 102 gaa
52 aca 20 caa 253 gaa
539 ttc 96 cta 47 gaa
52 aca 49 caa ** gcc
** ttc 211 cta 13 ggc
128 cat 5 atgj 95 tgc
128 cat 47 caa 634 tta
189 atgf 55 cta 95 tgc
45 atgf 5 atgj 479 tta
2 gtc 47 caa 132 tgc
35 atgf 55 cta ** tta
13 gtc ** atgj
** atgf 167 tgg
** tgg
Int51.31 spl. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
8 |
aca |
|
9* 37 |
gta |
|
30 |
tac |
|
8 |
cac
|
35 |
tac |
|
39 |
gta |
|
85 |
tac |
|
63 |
aga
|
** |
gga |
|
** |
gta |
|
107 |
tac |
|
** |
cca
|
39 |
cgg |
|
80 |
gcc |
|
107 |
tac |
|
103 |
atgf
|
41 |
cac |
|
11* 102 |
gaa |
|
** |
tac |
|
** |
ctc
|
58 |
cca |
|
253 |
gaa |
|
45 |
aac |
|
51 |
caa
|
** |
cca |
|
47 |
gaa |
|
41 |
aac |
|
131 |
cta
|
1172 |
tca |
|
** |
gcc |
|
26 |
aac |
|
20 |
caa
|
** |
tca |
|
3* 40 |
atgf |
|
32 |
aac |
|
96 |
cta
|
52 |
aca |
|
** |
atgf |
|
33 |
aac |
|
49 |
caa
|
539 |
ttc |
|
13 |
ggc |
|
40 |
aac |
|
211 |
cta
|
52 |
aca |
|
85 |
tgc |
|
** |
aac |
|
5 |
atgj
|
** |
ttc |
|
** |
tta |
|
97 |
gac |
|
47 |
caa
|
52 |
aca |
|
13 |
ggc |
|
97 |
gac |
|
55 |
cta
|
** |
ttc |
|
95 |
tgc |
|
83 |
gac |
|
5 |
atgj
|
21 |
agc |
|
634 |
tta |
|
** |
gac |
|
47 |
caa
|
30 |
cgt |
|
95 |
tgc |
|
58 |
aaa |
|
55 |
cta
|
32 |
cgt |
|
479 |
tta |
|
58 |
aaa |
|
** |
atgj
|
30 |
cgt |
|
132 |
tgc |
|
58 |
aaa |
|
167 |
tgg
|
33 |
cgt |
|
** |
tta |
|
59 |
aaa |
|
** |
tgg
|
9 |
cgt |
|
128 |
cat |
|
57 |
aaa |
|
20 |
ggc
|
76 |
agc |
|
128 |
cat |
|
58 |
aaa |
|
13 |
ggt
|
35 |
cgt |
|
189 |
atgf |
|
58 |
aaa |
|
47 |
ggc
|
9 |
cgt |
|
45 |
atgf |
|
59 |
aaa |
|
47 |
ggc
|
** |
agc |
|
2 |
gtc |
|
58 |
aaa |
|
15 |
ggt
|
|
|
|
35 |
atgf |
|
59 |
aaa |
|
16 |
ggc
|
|
|
|
13 |
gtc |
|
59 |
aaa |
|
48 |
ggc
|
|
|
|
** |
atgf |
|
** |
aaa |
|
** |
ggc
|
- Lien NCBI [4]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
spl. Sx+ Sc+ Les diagrammes 400
spl |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
47 |
-333 |
594 |
7.7 |
611 |
236 |
max80 |
-47 |
363 |
-934 |
95 |
806 |
257 |
min50
|
31 à 400 |
- |
- |
- |
- |
- |
- |
|
10.3 |
-50 |
-57 |
43 |
915 |
162 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
59 |
37 |
- |
275 |
poly |
336 |
tF |
158 |
57 |
|
614 |
poly |
192 |
SF
|
31 à 400 |
|
|
|
|
|
|
|
106 |
43 |
- |
885 |
dte |
30 |
tf
|
- Légende du tableau corrélations et fréquences faibles
spl. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
myr |
min20 |
828 |
2081 |
2909 |
872 |
649 |
764 |
115 |
-143 |
41 |
323
|
spl |
min10 |
1071 |
2215 |
3286 |
884 |
735 |
784 |
49 |
-353 |
-202 |
172
|
rru |
min40 |
874 |
2056 |
2930 |
829 |
193 |
611 |
418 |
722 |
792 |
861
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
71 |
392 |
0.18 |
999 |
2556 |
5 |
5 |
20 |
110 |
97 |
899 |
-78
|
37 |
270 |
0.14 |
1313 |
2900 |
1 |
6 |
9 |
143 |
69 |
683 |
-342
|
169 |
266 |
0.64 |
1037 |
2749 |
1 |
4 |
71 |
222 |
175 |
630 |
17
|
- Diagrammes 400: spl myr, diagramme 1-40: c+ spl myr total, texte: myr.
- Résumé: spl ressemble beaucoup à myr. C’est le 3ème génome sans fréquences faibles, 1-30, sur les 13 que j’ai signalés dans ase et cvi. Son minimum x+ est à la fréquence 10, min10. La conséquence, c’est 1 tilde fort du diagramme x+ 31-400. Mais ce génome a la particularité d’avoir une corrélation forte comme ase cvi abra myr dans la plage 41-250, en plus de n’avoir quasiment pas de fréquences faibles.
- - Les courbes des diagrammes 400
- Je n’ai pas représenté le diagramme x+ 31-400, les fréquences faibles ayant très peu d’effectifs pour modifier notablement la courbe de x+ 1-400.
- Au minimum local min50 de c+ 1-400, x+ 1-400 présente un maximum local max80, décalé par rapport à celui de myr, max70.
- Et toujours la courbe du c+ 1-400 est un SF.
- x+ 1-400 a un tilde très fort, tF, avec un R2’ de 336 comme cbei et pmq, et plus fort que celui de abra et myr , R2’ 96 68.
- c+ 31-400 a un tilde très faible, tf, avec un R2’ 30 contre 85 86 pour respectivement abra et myr. La courbe est quasiment une droite avec 2 renflements dans la 1ère partie.
- - Les corrélations
- Le total des effectifs est aussi élevé que celui de myr, 3286 contre 2909 et comme myr sa corrélation 41-250 est forte, 784 contre 764. Par contre sa corrélation se maintient dans la plage de fréquences 41-200, avec une différence (diff) de 49 contre 115 pour myr.
- A cause des fréquences faibles inexistantes les corrélations 1-n sont très faibles en positif ou en négatif, comme abra, mais au contraire de pmg qui a des taux de fréquences faibles élevés et des corrélations 1-n nettement supérieures à celles du 41-250, autour de 900.
- - Les courbes des diagrammes 1-40
- Avec un effectif réduit de 69 pour le total des fréquences x+ 1-40, le diagramme et la corrélation c+/x+ sont peu significatifs.
- Avec un effectif élevé de 683 le diagramme des c+ 1-40 ressemble beaucoup au modèle et à celui de ade avec un effectif de 876, nette mieux que celui de myr avec un effectif de 899.
- Liens: gtRNAdb [5], NCBI chr1 [6], NCBI chr2 [7], génome []
- Lien tableur: vpb opérons
- Légende:
- - cds1 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
- - cds2 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
- - cds3 180 MTSHQSCLQFLNMMQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKS
vpb1. Vibrio parahaemolyticus BB22OP
45.3%GC |
6.7.19 Paris |
126 |
doubles |
interca
|
|
|
chr1 |
|
|
|
33614..35175 |
16s |
@4 |
80
|
|
35256..35331 |
gaa |
|
2
|
|
35334..35409 |
aaa |
|
30
|
|
35440..35515 |
gta |
|
55
|
comp |
35571..35768 |
cds1 |
|
59
|
|
35828..38743 |
23s |
|
73
|
|
38817..38932 |
5s |
|
|
|
|
|
|
|
|
49997..50073 |
cgg |
|
32
|
|
50106..50181 |
cac |
+ |
72
|
|
50254..50330 |
cca |
2 cac |
49
|
|
50380..50455 |
cac |
2 cca |
24
|
|
50480..50556 |
cca |
|
|
|
|
|
|
|
comp |
400045..400120 |
atgi |
|
|
|
|
|
|
|
|
577971..579532 |
16s |
|
88
|
|
579621..579696 |
gcc |
|
12
|
|
579709..579784 |
gaa |
|
258
|
|
580043..582958 |
23s |
|
73
|
|
583032..583147 |
5s |
|
30
|
|
583178..583254 |
gac |
|
35
|
|
583290..583366 |
tgg |
|
|
|
|
|
|
|
comp |
769649..769733 |
cta |
+ |
29
|
comp |
769763..769847 |
cta |
10 cta |
47
|
comp |
769895..769971 |
atg |
4 atg |
24
|
comp |
769996..770080 |
cta |
5 caa |
52
|
comp |
770133..770207 |
caa |
|
29
|
comp |
770237..770321 |
cta |
|
53
|
comp |
770375..770451 |
atg |
|
24
|
comp |
770476..770560 |
cta |
|
52
|
comp |
770613..770687 |
caa |
|
29
|
comp |
770717..770801 |
cta |
|
54
|
comp |
770856..770930 |
caa |
|
29
|
comp |
770960..771044 |
cta |
|
35
|
comp |
771080..771154 |
caa |
|
48
|
comp |
771203..771287 |
cta |
|
31
|
comp |
771319..771403 |
cta |
|
77
|
comp |
771481..771557 |
atg |
|
77
|
comp |
771635..771709 |
caa |
|
31
|
comp |
771741..771825 |
cta |
|
40
|
comp |
771866..771942 |
atg |
|
|
|
|
|
|
|
|
786939..787015 |
cca |
|
|
|
|
|
|
|
comp |
802315..802391 |
agg |
|
|
|
|
|
|
|
|
910219..910295 |
aga |
|
|
|
|
|
|
|
comp |
982089..982173 |
tac |
+ |
81
|
comp |
982255..982339 |
tac |
4 tac |
81
|
comp |
982421..982505 |
tac |
|
81
|
comp |
982587..982671 |
tac |
|
|
|
|
|
|
|
|
1124715..1124802 |
tcc |
|
|
|
|
|
|
|
|
1418321..1418397 |
gtc |
+ |
32
|
|
1418430..1418506 |
gtc |
2gtc |
|
|
|
|
|
|
comp |
1988127..1988202 |
ggc |
+ |
10
|
comp |
1988213..1988299 |
tta |
2 ggc |
76
|
comp |
1988376..1988451 |
ggc |
|
20
|
comp |
1988472..1988545 |
tgc |
|
|
|
|
|
|
|
|
2164082..2164157 |
aac |
|
|
|
|
|
|
|
|
2193593..2193683 |
tca |
|
|
|
|
|
|
|
comp |
2547884..2547960 |
atgf |
|
56
|
comp |
2548017..2548100 |
ctc |
|
|
|
|
|
|
|
|
2652092..2652168 |
cgt |
+ |
56
|
comp |
2652225..2652301 |
cgt |
9 cgt |
57
|
comp |
2652359..2652435 |
cgt |
2 agc |
57
|
comp |
2652493..2652569 |
cgt |
|
57
|
comp |
2652627..2652703 |
cgt |
|
57
|
comp |
2652761..2652837 |
cgt |
|
56
|
comp |
2652894..2652970 |
cgt |
|
210
|
comp |
2653181..2653257 |
cgt |
|
31
|
comp |
2653289..2653380 |
agc |
@5 |
320
|
comp |
2653701..2653777 |
cgt |
|
31
|
comp |
2653809..2653900 |
agc |
|
|
|
|
|
|
|
|
2735697..2735772 |
ttc |
+ |
64
|
|
2735837..2735912 |
aca |
3 ttc |
7
|
|
2735920..2735995 |
ttc |
2 aca |
70
|
|
2736066..2736141 |
aac |
2 aac |
71
|
|
2736213..2736288 |
aca |
|
7
|
|
2736296..2736371 |
ttc |
|
43
|
|
2736415..2736490 |
aac |
|
|
|
|
|
|
|
|
2738623..2738698 |
ttc |
|
51
|
|
2738750..2738825 |
aca |
+ |
21
|
|
2738847..2738922 |
aac |
2 aca |
39
|
|
2738962..2739037 |
aca |
2 aac |
15
|
|
2739053..2739128 |
aac |
|
|
|
|
|
|
|
comp |
2741263..2741339 |
gac |
|
31
|
comp |
2741371..2741487 |
5s |
|
57
|
comp |
2741545..2741620 |
acc |
|
100
|
comp |
2741721..2741836 |
5s |
|
73
|
comp |
2741910..2744825 |
23s |
|
257
|
comp |
2745083..2745158 |
gca |
|
41
|
comp |
2745200..2745276 |
atc |
|
56
|
comp |
2745333..2746894 |
16s |
|
|
|
|
|
|
|
comp |
2755928..2756012 |
ttg |
|
|
|
|
|
|
|
comp |
2847646..2847722 |
tgg |
|
68
|
comp |
2847791..2847867 |
gac |
|
30
|
comp |
2847898..2848013 |
5s |
|
73
|
comp |
2848087..2851002 |
23s |
|
258
|
comp |
2851261..2851336 |
gaa |
|
80
|
comp |
2851417..2852978 |
16s |
|
|
|
|
|
|
|
comp |
2987485..2987561 |
atgf |
+ |
56
|
comp |
2987618..2987693 |
ggc |
5 atgf |
18
|
comp |
2987712..2987788 |
atgf |
8 ggc |
35
|
comp |
2987824..2987899 |
ggc |
|
50
|
comp |
2987950..2988025 |
ggc |
|
49
|
comp |
2988075..2988150 |
ggc |
|
49
|
comp |
2988200..2988275 |
ggc |
|
30
|
comp |
2988306..2988382 |
atgf |
|
55
|
comp |
2988438..2988513 |
ggc |
|
30
|
comp |
2988544..2988620 |
atgf |
|
39
|
comp |
2988660..2988735 |
ggc |
|
19
|
comp |
2988755..2988831 |
atgf |
|
35
|
comp |
2988867..2988942 |
ggc |
|
|
|
|
|
|
|
comp |
3060924..3061000 |
tgg |
|
68
|
comp |
3061069..3061145 |
gac |
|
30
|
comp |
3061176..3061291 |
5s |
|
73
|
comp |
3061365..3064280 |
23s |
|
257
|
comp |
3064538..3064613 |
gta |
|
14
|
comp |
3064628..3064703 |
gca |
|
32
|
comp |
3064736..3064811 |
aaa |
|
2
|
comp |
3064814..3064889 |
gaa |
|
80
|
comp |
3064970..3066531 |
16s |
@3 |
319
|
comp |
3066851..3066966 |
5s |
|
73
|
comp |
3067040..3069955 |
23s |
|
261
|
comp |
3070217..3071778 |
16s |
|
|
|
|
|
|
|
comp |
3105094..3105169 |
acc |
|
13
|
comp |
3105183..3105257 |
gga |
|
35
|
comp |
3105293..3105377 |
tac |
|
36
|
comp |
3105414..3105489 |
aca |
|
|
|
|
|
|
|
comp |
3111073..3111149 |
gac |
|
30
|
comp |
3111180..3111295 |
5s |
|
73
|
comp |
3111369..3114284 |
23s |
|
261
|
comp |
3114546..3116107 |
16s |
@1 |
317
|
comp |
3116425..3116540 |
5s |
|
73
|
comp |
3116614..3119529 |
23s |
|
261
|
comp |
3119791..3121352 |
16s |
|
|
|
|
|
|
|
comp |
3175944..3176034 |
tca |
|
69
|
comp |
3176104..3176219 |
5s |
|
73
|
comp |
3176293..3179211 |
23s |
|
257
|
comp |
3179469..3179544 |
gca |
|
41
|
comp |
3179586..3179662 |
atc |
|
56
|
comp |
3179719..3181280 |
16s |
@2 |
|
|
|
|
|
|
comp |
3217187..3217263 |
gac |
|
30
|
comp |
3217294..3217409 |
5s |
|
73
|
comp |
3217483..3220398 |
23s |
|
59
|
|
3220458..3220655 |
cds2 |
|
55
|
comp |
3220711..3220786 |
gta |
|
30
|
comp |
3220817..3220892 |
aaa |
|
2
|
comp |
3220895..3220970 |
gaa |
|
80
|
comp |
3221051..3222612 |
16s |
|
|
|
|
chr2 |
|
|
|
132908..134469 |
16s |
|
80
|
|
134550..134625 |
gaa |
|
2
|
|
134628..134703 |
aaa |
|
16
|
|
134720..134795 |
gca |
|
14
|
|
134810..134885 |
gta |
|
54
|
comp |
134940..135122 |
cds3 |
|
19
|
|
135142..138059 |
23s |
|
73
|
|
138133..138248 |
5s |
|
69
|
|
138318..138408 |
tca |
|
|
|
|
|
|
|
comp |
192886..192969 |
ctc |
|
|
|
|
|
|
|
comp |
591931..592021 |
tca |
|
|
|
|
|
|
|
comp |
1009457..1009530 |
tgc |
|
73
|
comp |
1009604..1009690 |
tta |
|
|
|
|
|
|
|
comp |
1021568..1021641 |
tgc |
|
73
|
comp |
1021715..1021801 |
tta |
|
|
|
|
|
|
|
comp |
1029973..1030048 |
ggc |
|
3
|
comp |
1030052..1030125 |
tgc |
|
|
|
|
|
|
|
|
1125193..1125267 |
gga |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vpb. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
vpb cumuls opérons effectif
avec rRNA opérons 9
16 23 5s 0 0
16 atc gca 2
16 23 5s a 1
max a 6
a doubles 0
spéciaux 6
total aas 33
sans opérons 25
1 aa 11
max a 19
a doubles 8
total aas 93
total aas 126
remarques 5
vpb1. Vibrio parahaemolyticus BB22OP, blocs à rRNA.
16s |
80 |
16s |
80 |
16s |
80 |
|
|
gaa |
2 |
gaa |
2 |
gaa |
2 |
|
|
aaa |
30 |
aaa |
30 |
aaa |
16 |
|
|
gta |
55 |
gta |
55 |
gca |
14 |
|
|
cds 198 |
59 |
cds 198 |
59 |
gta |
54 |
|
|
23s |
73 |
23s |
73 |
cds 180 |
19 |
|
|
5s |
|
5s |
30 |
23s |
73 |
|
|
|
|
gac |
|
5s |
69 |
|
|
|
|
|
|
tca |
|
|
|
|
|
|
|
|
|
|
|
16s |
56 |
16s |
56 |
16s |
88 |
16s |
80
|
atc |
41 |
atc |
41 |
gcc |
12 |
gaa |
258
|
gca |
257 |
gca |
257 |
gaa |
258 |
23s |
73
|
23s |
73 |
23s |
73 |
23s |
73 |
5s |
30
|
5s |
100 |
5s |
69 |
5s |
30 |
gac |
|
acc |
57 |
tca |
|
gac |
|
|
|
5s |
31 |
|
|
|
|
|
|
gac |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16s |
261 |
16s |
261 |
|
|
|
|
23s |
73 |
23s |
73 |
|
|
|
|
5s |
319 |
5s |
317 |
|
|
|
|
16s |
80 |
16s |
261 |
|
|
|
|
gaa |
2 |
23s |
73 |
|
|
|
|
aaa |
32 |
5s |
30 |
|
|
|
|
gca |
14 |
gac |
|
|
|
|
|
gta |
257 |
|
|
|
|
|
|
23s |
73 |
|
|
|
|
|
|
5s |
30 |
|
|
|
|
|
|
gac |
|
|
|
|
|
|
|
- Remarques : 2 chromosomes circulaires. EFTU et beaucoup de doubles.
- @1 Blocs 16-23-5s, il y en a 3 dont 2 sont sur un opéron avec 1 aa. Le 4ème appartient à un opéron spécial.
- - Les 3 ont les mêmes Intercalaires, 73 261. L’intercalaire 23-5s se retrouve dans tout les autres opérons.
- - Les 2 blocs accolés sont séparés du reste par de grands intercalaires, 320 bases.
- @2 Les opérons 16-atc-gca sont au nombre de 2 avec 3 aas en plus.
- - 4 de leurs intercalaires, 73 257 41 56, sont identiques et le 5ème est du même ordre de grandeur, 100 69.
- - Un opéron est clasisque et a un aa en plus, le 2ème a la séquence 5s-aa-5s-aa donc 2 aa en +.
- @3 Les opérons analogues aux 16-atc-gca sont au nombre de 3 et ont 2 intercalaires en commun avec eux, 257 73 correspondant à aa-23s-5s.
- - Un opéron 16-gcc-gaa-23s-5s avec 2 aas entre les 2 rRNAs. Il a 4 aas.
- - Un opéron 16-gaa-23s-5s avec 1 aa entre les 2 rRNAs. Il a 3 aas.
- - Un opéron 16-gaa-3aas-23s-5s avec 4 aas entre les 2 rRNAs. Il a 6 aas.
- @4 Les opérons analogues aux 16-atc-gca avec une protéine sont au nombre de 3 et ont l’intercalaire 73 du 23s-5s comme tous les autres opérons.
- - Différence importante avec lam qui a des opérons analogues, la protéine est dans le brin complémentaire du brin des RNAs. Alors que dans lam protéine et RNAs sont sur le même brin.
- - La séquence est 16s-gaa-aaa-xxx-gta-protéine-23s-5s et les 3 opérons ont en commun les 4 mêmes intercalaires, 16s-80-aaa-2-xxx-gta-55-protéine-23s-73-5s.
- - Deux opérons, sans xxx, sont identiques en aas, intercalaires et protéines mais un a un aa en plus après 5s. Ils ont respectivement 3 et 4 aas.
- - Un opéron a une protéine plus petite, 180 aas au lieu de 198, avec xxx=gca entre les rRNAs plus 1 au-delà du 5s, soit 5 aas au total.
- - Note du 4.10.20: contrôle des cds au 10.2.20 du NCBI, 0 cds.
- @5 L’opéron 9cgt 2agc a une intercalaire élevée, 320 bases.
- Séquences des doubles : beaucoup de doubles et de séquences répétées comme cbn.
- - 8 opérons sur 14 à 2aas et plus sont remarquables :
opéron n*séquence
cgg+4 2*2
10 cta 5caa 4atg 3*4
4 tac 4*1
2 gtc 2*1
9 cgt 2agc 8*1
ttc+6 2*3
ttc+4 2*2
8 ggc 5atgf 5*2
- Lien tableur: vpb distribution
- Notes:
- - gtc2 cta2+2 tac4 cgt8 ggc4
- - acc: 5s + >1aa
- - tca: 2 5s + 2 1aa
- - Séquences:
- (cac cca)2
- (cgt agc)2
- ttc (aca aac)2
- ttc (aca ttc aac)2
- cta (cta atgj cta caa)2 (cta caa)2 cta (cta atgj) caa (cta atgj)
- (atgf ggc)2 ggc3 (atgf ggc)3
Gm2 vpb, Vibrio parahaemolyticus BB22OP. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
6
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
1 |
tac |
5 |
tgc |
4
|
f atc |
2 |
j acc |
2 |
aac |
5 |
agc |
2
|
g ctc |
2 |
f ccc |
|
cac |
2 |
cgt |
9
|
h gtc |
2 |
n gcc |
1 |
gac |
6 |
ggc |
11
|
i tta |
3 |
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
4 |
aga |
1
|
k cta |
10 |
g cca |
3 |
caa |
5 |
cga |
|
l gta |
4 |
o gca |
4 |
gaa |
6 |
gga |
2
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
3
|
n atgj |
4 |
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
vpb |
82 |
11 |
|
12 |
|
21 |
126
|
- vpb1 Le prélèvement: gama
- Le nom et le lien NCBI: vpb1, Vibrio parahaemolyticus BB22OP chromosome 1, NCBI [8], date 20.02.22.
- vpb1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
vpb1 403,530 3,297,305 12.2
Intergen51. vpb1. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. vpb1 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vpb1 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,748 |
344 |
9 |
2,101 |
2.6 |
113 |
8 |
121
|
x |
781 |
13 |
1 |
795 |
|
0 |
3 |
3
|
t |
2,529 |
357 |
10 |
2,896 |
|
113 |
11 |
124
|
% |
87.3 |
12.3 |
0.3 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
27 |
0 |
0 |
27 |
1.4 |
tRNA-CDS |
47 |
23
|
x |
20 |
0 |
0 |
20 |
|
RNA-RNA |
113 |
56
|
t |
47 |
0 |
0 |
47 |
|
CDS-rRNA |
11 |
5
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
32 |
16
|
- |
|
|
|
|
|
total |
203 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
5.3 |
14.8 |
0.0 |
31.6 |
11.1 |
58 |
0.4 |
0.0
|
x |
11.5 |
30.0 |
7.7 |
4.2 |
0.0 |
15 |
0.1 |
0.0
|
|
Intergen51. vpb1. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: vpb1 données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vpb1 fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vpb1 fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vpb1
R2 x3 x2 x c Inflexion poly3 x c
0.539 5.80E-06 -3.66E-03 5.44E-01 16.10 fx1 abscisse 574.0 218.4
0.786 -6.92E-06 5.11E-03 -1.23E+00 110.0 fc1 ordonnée 24.1 16.6
0.749 -6.04E-07 1.04E-03 -5.00E-01 82.7 fx41
0.944 2,00E-06 -1,31E-03 1,48E-01 26.0 fc51
- Le rfin après 400 est de 93 sur un total de 1757. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 18. L'indice i.rfin1 = 75/270 = 0.278.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données vpb1 calculs poly3 vpb1
effect 1757 R2.21 767 abscis 400
xm 41 pte 9,71 flexa 203
ym 5 cste 3,24 flexo 1,78
x1m 231 r400l 169 xm 43
y1m 1 restp 159,36 sup4 178,5
rfin 52,93 %sd 32,70 sup4t 437,1
bornf 185 lond 190 % 40,8
supd 156,1 %sf 32,39 long 160
supdt 477,5 lonf 144 R2 529
xmp 363,12 sf/lf 0,92
r400 106,43 sr/lr 0,52
supf 132,4 sd/ld 0,82
supft 408,7 i.r400 0,63
Intergen51. vpb1. Les CDS-CDS négatifs
modifier
Sous-totaux vpb1 totale
fréquence x- c- x- c-
- 1 0 83 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 2 115 717 10938
- 5 0 0 5 19
sp6 11 146 1642 8424
total 13 344 2,456 23,544
reste 1 0 264 420
s6 3 0 361 41
s7 1 21 321 1438
s8 6 125 696 6525
rappot s1-5
4/2/1 - 1.4 8.4 2.6
% / sp6
s6/sp6 27.3 0.0 22.0 0.5
s7/sp6 9.1 14.4 19.5 17.1
s8/sp6 54.5 85.6 42.4 77.5
reste/sp6 9.1 0.0 16.1 5.0
total s1-5 2 198 814 15120
% / total
%s1-5 15.4 57.6 33.1 64.2
%sp6 84.6 42.4 66.9 35.8
Intergen51. vpb1. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 10 CDS 16s 6 2
16s 23s 3 5s CDS 1
16s tRNA 7 16 CDS
tRNA 23s 7 CDS 5s
5s tRNA 8 23s CDS
tRNA in 10 CDS 23s
tRNA contig 3 5s 16s 2
tRNA hors 64 16s16s
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 113 0 total 8 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
contig aa
35 gac
** tgg
68 tgg
** gac
68 tgg
** gac
Int51.31 vpb1. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
32 |
cgg |
|
81 |
tac |
|
31 |
cgt |
|
56 |
atgf
|
72 |
cac |
|
81 |
tac |
|
** |
agc |
|
18 |
ggc
|
49 |
cac |
|
81 |
tac |
|
64 |
ttc |
|
35 |
atgf
|
24 |
cac |
|
** |
tac |
|
7 |
aca |
|
50 |
ggc
|
** |
cac |
|
32 |
gtc |
|
70 |
ttc |
|
49 |
ggc
|
29 |
cta |
|
** |
gtc |
|
71 |
aac |
|
49 |
ggc
|
47 |
cta |
|
10 |
ggc |
|
7 |
aca |
|
30 |
ggc
|
24 |
atgj |
|
76 |
tta |
|
43 |
ttc |
|
55 |
atgf
|
52 |
cta |
|
20 |
ggc |
|
** |
aac |
|
30 |
ggc
|
29 |
caa |
|
** |
tgc |
|
51 |
ttc |
|
39 |
atgf
|
53 |
cta |
|
56 |
atgf |
|
21 |
aca |
|
19 |
ggc
|
24 |
atgj |
|
** |
ctc |
|
39 |
aac |
|
35 |
atgf
|
52 |
cta |
|
56 |
cgt |
|
15 |
aca |
|
** |
ggc
|
29 |
caa |
|
57 |
cgt |
|
** |
aac |
|
13 |
acc
|
54 |
cta |
|
57 |
cgt |
|
|
|
|
35 |
gga
|
29 |
caa |
|
57 |
cgt |
|
|
|
|
36 |
tac
|
35 |
cta |
|
57 |
cgt |
|
|
|
|
** |
aca
|
48 |
caa |
|
56 |
cgt |
|
|
|
|
|
|
31 |
cta |
|
210 |
cgt |
|
|
|
|
|
|
77 |
cta |
|
31 |
cgt |
|
|
|
|
|
|
77 |
atgj |
|
** |
agc |
|
|
|
|
|
|
31 |
caa |
|
|
|
|
|
|
|
|
|
40 |
cta |
|
|
|
|
|
|
|
|
|
** |
atgj |
|
|
|
|
|
|
|
|
|
- vpb2 Le prélèvement: gama
- Le nom et le lien NCBI: vpb2, Vibrio parahaemolyticus BB22OP chromosome 2, NCBI [9], date 20.02.22.
- vpb2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
vpb2 242,529 1,806,219 13.4
Intergen51. vpb2. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. vpb2 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vpb2 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
817 |
171 |
11 |
999 |
1.7 |
10 |
1 |
11
|
x |
560 |
14 |
1 |
575 |
|
0 |
0 |
0
|
t |
1,377 |
185 |
12 |
1,574 |
|
10 |
1 |
11
|
% |
87.5 |
11.8 |
0.8 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
5 |
0 |
0 |
5 |
0.6 |
tRNA-CDS |
13 |
41
|
x |
8 |
0 |
0 |
8 |
|
RNA-RNA |
10 |
31
|
t |
13 |
0 |
0 |
13 |
|
CDS-rRNA |
1 |
3
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
8 |
25
|
- |
|
|
|
|
|
total |
32 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
7.6 |
20.0 |
0.0 |
28.1 |
0.0 |
60 |
1.1 |
0.0
|
x |
12.7 |
50.0 |
7.1 |
5.0 |
12.5 |
36 |
0.2 |
0.0
|
|
Intergen51. vpb2. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: vpb2 données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vpb2 fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vpb2 fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vpb2
R2 x3 x2 x c Inflexion poly3 x c
0.570 5.31E-06 -3.50E-03 5.58E-01 12.10 fx1 abscisse 161.6 185.7
0.735 -6.33E-06 4.65E-03 -1.11E+00 99.2 fc1 ordonnée 29.8 19.8
0.672 1.64E-06 -7.95E-04 -4.75E-02 51.3 fx41
0.764 7.96E-07 -4.44E-04 -2.56E-02 34.7 fc41
- Le rfin après 400 est de 63 sur un total de 828. Jusqu'à 1% les freq10 sont en continu jusqu'à 810, reste 8. L'indice i.rfin1 = 55/410 = 0.134.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données vpb2 calculs poly3 vpb2
effect 828 R2.21 593 abscis 400
xm 45 pte 6,77 flexa 127
ym 2 cste 2,72 flexo 2,54
x1m 254 r400l 146 xm 45
y1m 1 restp 176,33 sup4 77,5
rfin 76,09 %sd 42,21 sup4t 246,4
bornf 192 lond 209 % 31,5
supd 205,9 %sf 42,57 long 82
supdt 487,9 lonf 147 R2 312
xmp 335,75 sf/lf 1,15
r400 100,24 sr/lr 0,60
supf 168,6 sd/ld 0,99
supft 396,1 i.r400 0,69
Intergen51. vpb2. Les CDS-CDS négatifs
modifier
Sous-totaux vpb2 totale
fréquence x- c- x- c-
- 1 0 50 4 4140
- 2 1 0 85 11
- 3 0 0 3 12
- 4 4 53 717 10938
- 5 0 0 5 19
sp6 9 68 1642 8424
total 14 171 2,456 23,544
reste 1 0 264 420
s6 3 0 361 41
s7 0 6 321 1438
s8 5 62 696 6525
rappot s1-5
4/2/1 4 1.1 8.4 2.6
% / sp6
s6/sp6 33.3 0.0 22.0 0.5
s7/sp6 0.0 8.8 19.5 17.1
s8/sp6 55.6 91.2 42.4 77.5
reste/sp6 11.1 0.0 16.1 5.0
total s1-5 5 103 814 15120
% / total
%s1-5 35.7 60.2 33.1 64.2
%sp6 64.3 39.8 66.9 35.8
Intergen51. vpb2. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 1 CDS 16s 1
16s 23s 5s CDS
16s tRNA 1 16 CDS
tRNA 23s 1 CDS 5s
5s tRNA 1 23s CDS
tRNA in 3 CDS 23s
tRNA contig 5s 16s
tRNA hors 3 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 10 0 total 1 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
hors b aa
73 tgc
** tta
73 tgc
** tta
3 ggc
** tgc
eal1. Escherichia albertii
49.6%GC |
10.3.19 Paris |
89 |
doubles |
interca
|
|
219063..219144 |
tac |
+ |
212
|
|
219357..219438 |
tac |
2 tac |
|
|
|
|
|
|
|
413135..413219 |
tcc |
|
|
|
|
|
|
|
|
462888..462972 |
tca |
|
|
|
|
|
|
|
comp |
489120..489191 |
gga |
|
6
|
comp |
489198..489270 |
aca |
|
|
|
|
|
|
|
|
615149..615233 |
tcc |
|
|
|
|
|
|
|
comp |
756823..756895 |
aaa |
+ |
5
|
comp |
756901..756973 |
gta |
3 aaa |
48
|
comp |
757022..757094 |
aaa |
2 gta |
5
|
comp |
757100..757172 |
gta |
|
48
|
comp |
757221..757293 |
aaa |
|
|
|
|
|
|
|
|
834529..834602 |
atgj |
+ |
10
|
|
834613..834694 |
cta |
2atgj |
26
|
|
834721..834792 |
caa |
2caa |
37
|
|
834830..834901 |
caa |
2 cag |
18
|
|
834920..834993 |
atgj |
|
51
|
|
835045..835116 |
cag |
|
35
|
|
835152..835223 |
cag |
|
|
|
|
|
|
|
comp |
968958..969031 |
aga |
|
|
|
|
|
|
|
comp |
1192416..1192488 |
acg |
|
|
|
|
|
|
|
comp |
1269526..1269599 |
gac |
|
|
|
|
|
|
|
comp |
1277040..1277113 |
gac |
|
52
|
comp |
1277166..1277285 |
5s |
@1 |
169
|
comp |
1277455..1280377 |
23s |
|
186
|
comp |
1280564..1280636 |
gca |
|
45
|
comp |
1280682..1280755 |
atc |
|
70
|
comp |
1280826..1282367 |
16s |
|
|
|
|
|
|
|
|
1567231..1567314 |
ctg |
+ |
31
|
|
1567346..1567429 |
ctg |
3 ctg |
35
|
|
1567465..1567548 |
ctg |
|
|
|
|
|
|
|
comp |
1657309..1657390 |
ttg |
|
|
|
|
|
|
|
comp |
1765401..1765473 |
ggc |
+ |
159
|
comp |
1765633..1765705 |
ggc |
2 ggc |
|
|
|
|
|
|
|
1795516..1795588 |
ttc |
|
|
|
|
|
|
|
comp |
2006002..2006121 |
5s |
|
169
|
comp |
2006291..2009214 |
23s |
|
186
|
comp |
2009401..2009473 |
gca |
|
45
|
comp |
2009519..2009592 |
atc |
|
70
|
comp |
2009663..2011202 |
16s |
|
|
|
|
|
|
|
comp |
2042057..2043241 |
tuf1 |
CDS 1185pb |
117
|
comp |
2043359..2043431 |
acc |
|
9
|
comp |
2043441..2043512 |
gga |
|
119
|
comp |
2043632..2043713 |
tac |
|
11
|
comp |
2043725..2043797 |
aca |
@3 |
|
|
|
|
|
|
comp |
2047429..2047548 |
5s |
|
169
|
comp |
2047718..2050648 |
23s |
|
186
|
comp |
2050835..2050907 |
gca |
|
45
|
comp |
2050953..2051026 |
atc |
|
68
|
comp |
2051095..2052636 |
16s |
|
|
|
|
|
|
|
comp |
2208305..2208424 |
5s |
@2 |
169
|
comp |
2208594..2211517 |
23s |
|
198
|
comp |
2211716..2211788 |
gaa |
|
85
|
comp |
2211874..2213418 |
16s |
|
|
|
|
|
|
|
comp |
2267554..2267627 |
cca |
|
43
|
comp |
2267671..2267754 |
ctg |
|
23
|
comp |
2267778..2267850 |
cac |
|
61
|
comp |
2267912..2267985 |
cgg |
|
|
|
|
|
|
|
comp |
2305358..2305430 |
tgg |
|
11
|
comp |
2305442..2305515 |
gac |
|
52
|
comp |
2305568..2305687 |
5s |
|
169
|
comp |
2305857..2308779 |
23s |
|
198
|
comp |
2308978..2309050 |
gaa |
|
85
|
comp |
2309136..2310676 |
16s |
|
|
|
|
|
|
|
comp |
2426158..2426248 |
tga |
|
|
|
|
|
|
|
|
2556305..2556378 |
ccg |
|
|
|
|
|
|
|
|
2810766..2812307 |
16s |
|
85
|
|
2812393..2812465 |
gaa |
|
198
|
|
2812664..2815586 |
23s |
|
169
|
|
2815756..2815875 |
5s |
|
151
|
|
2816027..2816099 |
acc |
|
40
|
|
2816140..2816259 |
5s |
|
|
|
|
|
|
|
|
2911129..2911212 |
ctc |
|
|
|
|
|
|
|
|
2913088..2913161 |
atgf |
|
|
|
|
|
|
|
comp |
3010332..3010404 |
atgi |
|
|
|
|
|
|
|
comp |
3177717..3177789 |
ttc |
|
|
|
|
|
|
|
|
3301617..3301687 |
ggg |
|
|
|
|
|
|
|
comp |
3366868..3366941 |
atgf |
+ |
37
|
comp |
3366979..3367052 |
atgf |
3 atgf |
37
|
comp |
3367090..3367163 |
atgf |
|
|
|
|
|
|
|
|
3469914..3470003 |
agc |
|
6
|
|
3470010..3470083 |
cgt |
+ |
201
|
|
3470285..3470358 |
cgt |
3 cgt |
200
|
|
3470559..3470632 |
cgt |
|
|
|
|
|
|
|
|
3505321..3505393 |
atgi |
|
|
|
|
|
|
|
|
3563056..3564598 |
16s |
|
85
|
|
3564684..3564756 |
gaa |
|
198
|
|
3564955..3567876 |
23s |
|
169
|
|
3568046..3568165 |
5s |
|
|
|
|
|
|
|
comp |
3779750..3779822 |
aaa |
|
7
|
comp |
3779830..3779902 |
gta |
+ |
47
|
comp |
3779950..3780022 |
gta |
2 gta |
|
|
|
|
|
|
|
3782718..3782790 |
gcc |
+ |
42
|
|
3782833..3782905 |
gcc |
2 gcc |
|
|
|
|
|
|
comp |
3810369..3810440 |
agg |
|
|
|
|
|
|
|
comp |
3993500..3993573 |
ccc |
|
|
|
|
|
|
|
comp |
4232176..4232248 |
aac |
|
|
|
|
|
|
|
|
4233996..4234068 |
aac |
|
|
|
|
|
|
|
comp |
4242952..4243024 |
aac |
|
|
|
|
|
|
|
comp |
4248342..4248414 |
aac |
|
|
|
|
|
|
|
|
4249406..4249492 |
tcg |
|
|
|
|
|
|
|
|
4256696..4256768 |
atgi |
|
100
|
|
4256869..4256942 |
aga |
|
|
|
|
|
|
|
|
4317980..4318052 |
ggc |
|
56
|
|
4318109..4318179 |
tgc |
|
14
|
|
4318194..4318277 |
tta |
|
|
|
|
|
|
|
comp |
4556753..4556826 |
gtc |
+ |
7
|
comp |
4556834..4556907 |
gtc |
2 gtc |
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eal. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eal cumuls opérons effectif
avec rRNA opérons 7
16 23 5s 0 0
16 atc gca 3
16 23 5s a 0
max a 3
a doubles 0
spéciaux 4
total aas 13
sans opérons 38
1 aa 23
max a 7
a doubles 10
total aas 71
total aas 84
remarques 3
eal1. Escherichia albertii, blocs à rRNA.
16s |
70 |
70 |
68
|
atc |
45 |
45 |
45
|
gca |
186 |
186 |
186
|
23s |
169 |
169 |
169
|
5s |
52 |
|
|
gac |
|
|
|
|
|
|
|
16s |
85 |
85 |
85
|
gaa |
198 |
198 |
198
|
23s |
169 |
169 |
169
|
5s |
52 |
|
|
gac |
|
|
|
|
|
|
|
16s |
85 |
|
|
gaa |
198 |
|
|
23s |
169 |
|
|
5s |
151 |
|
|
acc |
40 |
|
|
5s |
|
|
|
- Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles.
- @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
- - Les intercalaires sont les mêmes pour les 3 opérons, 70 45 186 169.
- - Un seul opéron a un aa en plus.
- @2 4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s.
- - Les intercalaires sont les mêmes pour les 4 opérons, 85 198 169.
- - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
- - Les aas suplémentaires sont absents pour 2 opérons et sont 2 pour un autre.
- - Le 4ème opéron a 1 aa et 1 5s en supplément.
- @3 2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
- Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
- - 5 opérons à 2 aas répétés
- - 3 opérons à 3 aas répétés
- - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
- - Un opéron à 5 aas a une séquence répétée, aaa + 2*2.
- - 5 opérons sans répétitions
eco eal
Opérons sans rRNAs avec doubles
2tac 2tac
2gtc 2gtc
2gcc 2gcc
3ctg 3ctg
3atgf 3atgf
atg cta 2caa atg 2cag atg cta 2caa atg 2cag
Remaniements des répétitions
3ggc 2ggc
aaa 3gta aaa 2gta
agc 4cgt agc 3cgt
5aaa 2gta 3aaa 2gta
Opérons sans rRNAs sans doubles
tta tgc ggc tta tgc ggc
cgg cac ctg cca cgg cac ctg cca
aca tac gga acc aca tac gga acc
Disparition de 2 opérons chez eco
- atgi aga
- gga aca
- Lien tableur: eal distribution
- Notes:
- - gtc2 gta2 ctg3 gcc2 tac2 caa2 cag2 atgf3 cgt3 ggc2
- - atgi: 2 1aa + 1 >1aa
- - gac: 1aa + 2 5s
- - Séquences:
- aaa (gta aaa)2
Gm3 eal, Escherichia albertii. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
3 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
2 |
tac |
3 |
tgc |
1
|
f atc |
3 |
j acc |
2 |
aac |
4 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
3
|
h gtc |
2 |
n gcc |
2 |
gac |
3 |
ggc |
3
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
2 |
aaa |
4 |
aga |
2
|
k cta |
1 |
g cca |
1 |
caa |
2 |
cga |
|
l gta |
4 |
o gca |
3 |
gaa |
4 |
gga |
2
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
4 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
eal |
48 |
23 |
|
4 |
|
10 |
85
|
- eal Le prélèvement: gama
- Le nom et le lien NCBI: eal, Escherichia albertii KF1, NCBI [12], date 28.2.14.
- eal La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
eal 594,081 4,701,875 12.6
Intergen51. eal. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. eal les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 eal les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,268 |
617 |
18 |
2,903 |
2.2 |
62 |
5 |
67
|
x |
1,173 |
119 |
12 |
1,304 |
|
0 |
7 |
7
|
t |
3,441 |
736 |
30 |
4,207 |
|
62 |
12 |
74
|
% |
81.8 |
17.5 |
0.7 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
42 |
0 |
0 |
42 |
1.2 |
tRNA-CDS |
77 |
14
|
x |
35 |
0 |
0 |
35 |
|
RNA-RNA |
62 |
12
|
t |
77 |
0 |
0 |
77 |
|
CDS-rRNA |
12 |
2
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
386 |
72
|
- |
|
|
|
|
|
total |
537 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
6.0 |
11.9 |
0.6 |
31.2 |
2.4 |
66 |
0.6 |
0.0
|
x |
10.3 |
8.6 |
5.9 |
8.4 |
2.9 |
36 |
0.9 |
0.0
|
|
Intergen51. eal. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: eal données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées eal fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. eal fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 eal
R2 x3 x2 x c Inflexion poly3 x c
0.697 2.04E-06 -1.21E-03 9.15E-02 36.00 fx1 abscisse 348.9 349.1
0.837 -6.99E-06 5.31E-03 -1.31E+00 115.0 fc1 ordonnée 9.0 4.6
0.791 -8.80E-07 9.21E-04 -3.75E-01 65.1 fx41
0.966 -9.74E-07 1.02E-03 -4.00E-01 61.4 fc41
- Le rfin après 400 est de 138 sur un total de 2286. Jusqu'à 1% les freq10 sont en continu jusqu'à 950, reste 22. L'indice i.rfin1 = 116/550 = 0.211.
- Moyennes glissantes des fc+400, diagonale. Voir le détail des calculs dans abs.
données eal calculs poly3 eal
effect 2286 R2.21 798 abscis 200
xm 43 pte 15,96 flexa 112
ym 9 cste 4,62 flexo 2,84
x1m 227 r400l 173 xm 35
y1m 1 restp 176,73 sup4 77,2
rfin 60,37 %sd 16,97 sup4t 283,0
bornf 138 lond 184 % 27,3
supd 76,8 %sf 10,41 long 77
supdt 452,3 lonf 95 R2 444
xmp 370,95 sf/lf 0,30
r400 116,36 sr/lr 0,55
supf 28,2 sd/ld 0,42
supft 270,8 i.r400 0,67
Intergen51. eal. Les CDS-CDS négatifs
modifier
Sous-totaux eal totale
fréquence x- c- x- c-
- 1 0 157 4 4140
- 2 4 0 85 11
- 3 0 0 3 12
- 4 39 250 717 10938
- 5 0 0 5 19
sp6 76 210 1642 8424
total 119 617 2,456 23,544
reste 7 4 264 420
s6 23 0 361 41
s7 16 42 321 1438
s8 30 164 696 6525
rappot s1-5
4/2/1 9.75 1.6 8.4 2.6
% / sp6
s6/sp6 30.3 0.0 22.0 0.5
s7/sp6 21.1 20.0 19.5 17.1
s8/sp6 39.5 78.1 42.4 77.5
reste/sp6 9.2 1.9 16.1 5.0
total s1-5 43 407 814 15120
% / total
%s1-5 36.1 66.0 33.1 64.2
%sp6 63.9 34.0 66.9 35.8
Intergen51. eal. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 7 CDS 16s 3 4
16s 23s 5s CDS 2 3
16s tRNA 7 16 CDS
tRNA 23s 7 CDS 5s
5s tRNA 3 23s CDS
tRNA in 3 CDS 23s
tRNA contig 1 5s 16s
tRNA hors 33 16s16s
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 62 0 total 5 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 eal. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
212 |
tac |
|
31 |
ctg |
|
6 |
agc
|
** |
tac |
|
35 |
ctg |
|
201 |
cgt
|
6 |
gga |
|
** |
ctg |
|
200 |
cgt
|
** |
aca |
|
159 |
ggc |
|
** |
cgt
|
5 |
aaa |
|
** |
ggc |
|
7 |
aaa
|
48 |
gta |
|
9 |
acc |
|
47 |
gta
|
5 |
aaa |
|
119 |
gga |
|
** |
gta
|
48 |
gta |
|
11 |
tac |
|
42 |
gcc
|
** |
aaa |
|
** |
aca |
|
** |
gcc
|
10 |
atgj |
|
43 |
cca |
|
100 |
atgi
|
26 |
cta |
|
23 |
ctc |
|
** |
aga
|
37 |
caa |
|
61 |
cac |
|
56 |
ggc
|
18 |
caa |
|
** |
cgg |
|
14 |
tgc
|
51 |
atgj |
|
37 |
atgf |
|
** |
tta
|
35 |
cag |
|
37 |
atgf |
|
7 |
gtc
|
** |
cag |
|
** |
atgf |
|
** |
gtc
|
eco1. Escherichia coli str. K-12 substr. MG1655
50.6%GC |
10.3.19 Paris |
89 |
doubles |
interca |
EcoCyc |
adIP
|
|
223771..225312 |
16s |
|
68 |
opéron |
|
|
225381..225457 |
atc |
|
42 |
ileV |
[15]
|
|
225500..225575 |
gca |
|
183 |
« |
|
|
225759..228662 |
23s |
|
93 |
« |
|
|
228756..228875 |
5s |
@1 |
52 |
« |
|
|
228928..229004 |
gac |
|
|
aspU |
[16]
|
|
|
|
|
|
|
|
|
236931..237007 |
gac |
|
|
|
|
|
|
|
|
|
|
|
|
262871..262946 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
564723..564799 |
aga |
|
|
|
|
|
|
|
|
|
|
|
comp |
696430..696504 |
cag |
+ |
37 |
opéron |
|
comp |
696542..696616 |
cag |
2 cag |
47 |
glnT |
[17]
|
comp |
696664..696740 |
atg |
2 atg |
15 |
« |
|
comp |
696756..696830 |
caa |
2 caa |
34 |
« |
|
comp |
696865..696939 |
caa |
|
23 |
« |
|
comp |
696963..697047 |
cta |
|
9 |
« |
|
comp |
697057..697133 |
atg |
|
|
|
|
|
|
|
|
|
|
|
|
780554..780629 |
aaa |
+ |
135 |
lysT |
[18]
|
|
780765..780840 |
gta |
5 aaa |
2 |
opéron |
|
|
780843..780918 |
aaa |
2 gta |
149 |
« |
|
|
781068..781143 |
gta |
|
3 |
valZ |
[19]
|
|
781147..781222 |
aaa |
|
146 |
opéron |
|
|
781369..781444 |
aaa |
|
132 |
lysZ |
[20]
|
|
781577..781652 |
aaa |
|
|
lysQ |
[21]
|
|
|
|
|
|
EcoCyc |
[22]
|
comp |
925884..925971 |
tcc |
|
|
InfA-serW |
[23]
|
|
|
|
|
|
|
|
comp |
1031625..1031712 |
tca |
|
|
|
|
|
|
|
|
|
|
|
comp |
1097565..1097652 |
tcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
1287087..1287176 |
tpr |
cds 90pb |
67 |
tpr |
|
comp |
1287244..1287328 |
tac |
+ |
209 |
opéron |
|
comp |
1287538..1287622 |
tac |
2 tac |
|
tyrT |
[24]
|
|
|
|
|
|
|
|
|
1746435..1746511 |
gtc |
+ |
4 |
valV |
[25]
|
|
1746516..1746592 |
gtc |
2 gtc |
|
opéron |
|
|
|
|
|
|
«RNA 67pb |
|
comp |
1991815..1991901 |
tta |
|
12 |
leuZ |
[26]
|
comp |
1991914..1991987 |
tgc |
|
54 |
« |
|
comp |
1992042..1992117 |
ggc |
|
|
opéron |
|
|
|
|
|
|
|
|
comp |
2043468..2043557 |
tcg |
|
|
|
|
|
|
|
|
|
|
|
|
2044549..2044624 |
aac |
|
|
|
|
|
|
|
|
|
|
|
comp |
2058027..2058102 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
2059851..2059926 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
2062260..2062335 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
2286211..2286287 |
ccc |
|
|
|
|
|
|
|
|
|
|
|
|
2466309..2466383 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2518041..2518116 |
gcc |
+ |
39 |
alaX |
[27]
|
comp |
2518156..2518231 |
gcc |
2 gcc |
|
opéron |
|
|
|
|
|
|
|
|
|
2520931..2521006 |
gta |
+ |
44 |
valU |
[28]
|
|
2521051..2521126 |
gta |
3gta |
46 |
opéron |
|
|
2521173..2521248 |
gta |
|
4 |
« |
|
|
2521253..2521328 |
aaa |
|
|
« |
|
|
|
|
|
|
|
|
comp |
2726069..2726188 |
5s |
@2 |
92 |
opéron |
|
comp |
2726281..2729184 |
23s |
|
184 |
|
|
comp |
2729369..2729444 |
gaa |
|
171 |
|
|
comp |
2729616..2731157 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2785762..2785837 |
atgi |
|
|
|
|
|
|
|
|
|
|
|
comp |
2817784..2817860 |
cgt |
+ |
198 |
« |
|
comp |
2818059..2818135 |
cgt |
4 cgt |
62 |
« |
|
comp |
2818198..2818274 |
cgt |
|
198 |
« |
|
comp |
2818473..2818549 |
cgt |
|
3 |
opéron |
|
comp |
2818553..2818645 |
agc |
|
|
serV |
[29]
|
|
|
|
|
|
|
|
|
2947387..2947463 |
atgf |
+ |
33 |
opéron |
|
|
2947497..2947573 |
atgf |
3 atgf |
33 |
metW |
[30]
|
|
2947607..2947683 |
atgf |
|
|
« |
|
|
|
|
|
|
|
|
comp |
2998984..2999057 |
ggg |
|
|
|
|
|
|
|
|
|
|
|
|
3110366..3110441 |
ttc |
|
|
|
|
|
|
|
|
|
|
|
|
3215598..3215673 |
atgi |
|
|
|
|
|
|
|
|
|
|
|
comp |
3318213..3318289 |
atgf |
|
|
|
|
|
|
|
|
|
|
|
comp |
3322072..3322158 |
ctc |
|
|
|
|
|
|
|
|
|
|
|
comp |
3423423..3423542 |
5s |
|
37 |
« |
|
comp |
3423580..3423655 |
acc |
|
12 |
« |
|
comp |
3423668..3423787 |
5s |
|
92 |
« |
|
comp |
3423880..3426783 |
23s |
|
174 |
« |
|
comp |
3426958..3427033 |
gca |
|
42 |
« |
|
comp |
3427076..3427152 |
atc |
|
68 |
ileU |
[31]
|
comp |
3427221..3428762 |
16s |
|
|
opéron |
|
|
|
|
|
|
|
|
comp |
3708616..3708692 |
ccg |
|
|
|
|
|
|
|
|
|
|
|
|
3836222..3836316 |
tga |
|
|
|
|
|
|
|
|
|
ecoliwiki |
[32]
|
|
3941808..3943349 |
16s |
|
85 |
gltU |
[33]
|
|
3943435..3943510 |
gaa |
|
193 |
opéron |
|
|
3943704..3946607 |
23s |
|
92 |
« |
|
|
3946700..3946819 |
5s |
|
52 |
« |
|
|
3946872..3946948 |
gac |
|
8 |
aspT |
[34]
|
|
3946957..3947032 |
tgg |
|
|
trpT |
[35]
|
|
|
|
|
|
|
|
|
3982375..3982451 |
cgg |
|
57 |
argX |
[36]
|
|
3982509..3982585 |
cac |
|
20 |
opéron |
|
|
3982606..3982692 |
ctg |
|
42 |
« |
|
|
3982735..3982811 |
cca |
|
|
« |
|
|
|
|
|
|
|
|
|
4035531..4037072 |
16s |
|
68 |
opéron |
|
|
4037141..4037217 |
atc |
|
42 |
ileT |
[37]
|
|
4037260..4037335 |
gca |
|
183 |
« |
|
|
4037519..4040423 |
23s |
|
93 |
« |
|
|
4040517..4040636 |
5s |
|
|
« |
|
|
|
|
|
|
|
|
|
4166659..4168200 |
16s |
|
171 |
opéron |
|
|
4168372..4168447 |
gaa |
|
193 |
|
|
|
4168641..4171544 |
23s |
|
92 |
|
|
|
4171637..4171756 |
5s |
|
|
|
|
|
|
|
|
|
|
|
|
4175388..4175463 |
aca |
@3 |
8 |
thrU |
[38]
|
|
4175472..4175556 |
tac |
|
116 |
opéron |
|
|
4175673..4175747 |
gga |
|
6 |
« |
|
|
4175754..4175829 |
acc |
|
114 |
« |
|
|
4175944..4177128 |
tufb |
cds 1185 pb |
|
« |
|
|
|
|
|
|
|
|
|
4208147..4209688 |
16s |
|
85 |
opéron |
|
|
4209774..4209849 |
gaa |
|
193 |
|
|
|
4210043..4212946 |
23s |
|
93 |
|
|
|
4213040..4213159 |
5s |
|
|
|
|
|
|
|
|
|
|
|
comp |
4362551..4362626 |
ttc |
|
|
|
|
|
|
|
|
|
|
|
|
4392360..4392435 |
ggc |
+ |
36 |
opéron |
|
|
4392472..4392547 |
ggc |
3 ggc |
35 |
glyX |
[39]
|
|
4392583..4392658 |
ggc |
|
|
« |
|
|
|
|
|
|
|
|
|
4496405..4496489 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
comp |
4606079..4606165 |
ctg |
+ |
34 |
opéron |
|
comp |
4606200..4606286 |
ctg |
3 ctg |
28 |
leuV |
[40]
|
comp |
4606315..4606401 |
ctg |
|
|
« |
|
- Liens: gtRNAdb [41], NCBI [42], génome [orgn]
- Lien tableur: eco cds
- Légende
- - protéines1: metY-yhbC-nusA-infB-rbfA-truB-rpsO-pnp
- - protéine2: secG
- - évidence faible1, avec un pseudo.
eco2. les CDS eco pour opérons
cluster |
6.8.19 Paris |
|
|
interca |
cdsa |
promoteur |
terminateur |
notes |
|
|
222833..223408 |
|
cds |
362 |
192 |
sigma FIS |
|
|
|
|
223771..225312 |
|
16s |
68 |
|
|
|
|
|
|
225381..225457 |
|
atc |
42 |
|
|
|
|
|
|
225500..225575 |
|
gca |
183 |
|
|
|
|
|
|
225759..228662 |
|
23s |
93 |
|
|
|
|
|
|
228756..228875 |
|
5s |
52 |
|
|
|
|
|
|
228928..229004 |
|
gac |
162 |
|
Terminateur |
+ sigma |
|
|
|
229167..229970 |
|
cds |
|
268 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2724448..2725746 |
|
cds |
322 |
433 |
rien |
début opéron |
rien |
|
comp |
2726069..2726188 |
|
5s |
92 |
|
|
|
|
|
comp |
2726281..2729184 |
|
23s |
184 |
|
|
|
|
|
comp |
2729369..2729444 |
|
gaa |
171 |
|
|
|
|
|
comp |
2729616..2731157 |
|
16s |
442 |
|
sigma FIS |
|
|
|
comp |
2731600..2734173 |
|
cds |
|
858 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3422436..3423194 |
|
cds |
228 |
253 |
Terminateur |
fin opéron |
rien |
|
comp |
3423423..3423542 |
|
5s |
37 |
|
|
|
|
|
comp |
3423580..3423655 |
|
acc |
12 |
|
|
|
|
|
comp |
3423668..3423787 |
|
5s |
92 |
|
|
|
|
|
comp |
3423880..3426783 |
|
23s |
174 |
|
|
|
|
|
comp |
3426958..3427033 |
|
gca |
42 |
|
|
|
|
|
comp |
3427076..3427152 |
|
atc |
68 |
|
|
|
|
|
comp |
3427221..3428762 |
|
16s |
473 |
|
sigma FIS |
|
|
|
|
3429236..3429790 |
|
cds |
|
185 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3940635..3941327 |
|
cds |
480 |
231 |
sigma FIS |
|
|
|
|
3941808..3943349 |
|
16s |
85 |
|
|
|
|
|
|
3943435..3943510 |
|
gaa |
193 |
|
|
|
|
|
|
3943704..3946607 |
|
23s |
92 |
|
|
|
|
|
|
3946700..3946819 |
|
5s |
52 |
|
|
|
|
|
|
3946872..3946948 |
|
gac |
8 |
|
|
|
|
|
|
3946957..3947032 |
|
tgg |
95 |
|
Terminateur |
fin opéron |
rien |
|
comp |
3947128..3947967 |
|
cds |
|
280 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4034608..4035153 |
|
cds |
377 |
182 |
Sigma Lrp-leu |
|
|
|
|
4035531..4037072 |
|
16s |
68 |
|
|
|
|
|
|
4037141..4037217 |
|
atc |
42 |
|
|
|
|
|
|
4037260..4037335 |
|
gca |
183 |
|
|
|
|
|
|
4037519..4040423 |
|
23s |
93 |
|
|
|
|
|
|
4040517..4040636 |
|
5s |
228 |
|
|
|
|
|
|
4040865..4040900 |
|
rprg |
5 |
|
pas de Term |
fin opéron |
rien |
|
comp |
4040906..4041433 |
|
cds |
|
176 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4165428..4166285 |
|
cds |
373 |
286 |
Sigma Lrp-leu |
|
|
|
|
4166659..4168200 |
|
16s |
171 |
|
|
|
|
|
|
4168372..4168447 |
|
gaa |
193 |
|
|
|
|
|
|
4168641..4171544 |
|
23s |
92 |
|
|
|
|
|
|
4171637..4171756 |
|
5s |
300 |
|
Terminateur |
début opéron |
rien |
|
|
4172057..4173085 |
|
cds |
|
343 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4205943..4207532 |
|
cds |
614 |
530 |
sigma FIS |
|
|
|
|
4208147..4209688 |
|
16s |
85 |
|
|
|
|
|
|
4209774..4209849 |
|
gaa |
193 |
|
|
|
|
|
|
4210043..4212946 |
|
23s |
93 |
|
|
|
|
|
|
4213040..4213159 |
|
5s |
74 |
|
Terminateur |
début opéron |
rien |
|
|
4213234..4213617 |
|
cds |
|
128 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
695101..696276 |
|
cds |
31 |
392 |
|
|
|
|
comp |
696308..696378 |
|
rprg |
51 |
|
Terminateur |
fin opéron |
rien |
|
comp |
696430..696504 |
|
cag |
37 |
|
|
|
|
|
comp |
696542..696616 |
|
cag |
47 |
|
|
|
|
|
comp |
696664..696740 |
|
atg |
15 |
|
|
|
|
|
comp |
696756..696830 |
|
caa |
34 |
|
|
|
|
|
comp |
696865..696939 |
|
caa |
23 |
|
|
|
|
|
comp |
696963..697047 |
|
cta |
9 |
|
|
|
|
|
comp |
697057..697133 |
|
atg |
379 |
|
sigma FIS |
fin opéron |
rien |
|
comp |
697513..699177 |
|
cds |
|
555 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
779598..780389 |
|
cds |
164 |
264 |
sigma FIS |
fin opéron |
rien |
|
|
780554..780629 |
|
aaa |
135 |
|
|
|
|
|
|
780765..780840 |
|
gta |
2 |
|
|
|
|
|
|
780843..780918 |
|
aaa |
149 |
|
|
|
|
|
|
781068..781143 |
|
gta |
3 |
|
|
|
|
|
|
781147..781222 |
|
aaa |
146 |
|
|
|
|
|
|
781369..781444 |
|
aaa |
132 |
|
|
|
|
|
|
781577..781652 |
|
aaa |
432 |
|
Terminateur |
début opéron |
NadR pas sigma |
|
|
782085..783128 |
|
cds |
|
348 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1286709..1286984 |
|
cds |
81 |
92 |
Terminateur |
|
|
|
comp |
1287066..1287236 |
|
ncRNA |
-150 |
|
|
|
|
|
comp |
1287087..1287176 |
|
tpr |
67 |
30 |
|
|
|
|
comp |
1287244..1287328 |
|
tac |
209 |
|
|
|
|
|
comp |
1287538..1287622 |
|
tac |
159 |
|
sigma FIS |
|
|
|
comp |
1287782..1288624 |
|
cds |
|
281 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
solitaire |
|
|
|
promoteur |
terminateur |
interc avant |
interc après |
protéines |
lien
|
|
236931..237007 |
|
gac |
sigma FIS |
Term 1 |
133 |
328 |
|
[43]
|
|
262871..262946 |
|
acg |
sigma FIS |
rien |
115 |
204 |
|
[44]
|
|
564723..564799 |
|
aga |
sigma FIS |
rien |
243 |
16 |
|
[45]
|
comp |
925884..925971 |
|
InfA-tcc |
sigma FIS |
Term 1 |
344 |
254 |
|
[46]
|
comp |
1031625..1031712 |
|
tca |
sigma FIS |
Term 2 |
207 |
427 |
|
[47]
|
comp |
1097565..1097652 |
|
tcc |
sigma FIS |
Term 4 |
736 |
234 |
|
[48]
|
comp |
2043468..2043557 |
|
tcg |
sigma - |
Term 1 |
570 |
94 |
|
[49]
|
|
2044549..2044624 |
|
aac |
sigma - |
Term 1 |
101 |
314 |
|
[50]
|
comp |
2058027..2058102 |
|
aac |
sigma - |
Term 1 |
453 |
101 |
|
[51]
|
|
2059851..2059926 |
|
aac |
sigma - |
Term 1 |
5 |
38 |
|
[52]
|
|
2062260..2062335 |
|
aac |
sigma NtrC |
rien |
327 |
56 |
|
[53]
|
|
2286211..2286287 |
|
ccc |
sigma FIS |
Term 1 |
75 |
103 |
|
[54]
|
|
2466309..2466383 |
|
agg |
sigma - |
Term 1 |
76 |
162 |
|
[55]
|
comp |
2785762..2785837 |
|
atgi |
rien |
rien |
410 |
-37 |
évidence faible1 |
[56]
|
comp |
2998984..2999057 |
|
ggg |
sigma FIS |
rien |
156 |
79 |
évidence faible |
[57]
|
|
3110366..3110441 |
|
ttc |
sigma FIS |
Term 1 |
106 |
149 |
|
[58]
|
|
3215598..3215673 |
|
atgi |
sigma - |
Term 1 |
125 |
54 |
|
[59]
|
comp |
3318213..3318289 |
|
atgf |
sigma FIS |
Term 2 |
207 |
348 |
protéines1 |
[60]
|
comp |
3322072..3322158 |
|
ctc |
sigma - |
Term 1 |
459 |
15 |
protéine2 |
[61]
|
comp |
3708616..3708692 |
|
ccg |
sigma FIS |
Term 2 |
911 |
92 |
|
[62]
|
|
3836222..3836316 |
|
tga |
sigma - |
rien |
293 |
109 |
|
[63]
|
comp |
4362551..4362626 |
|
ttc |
sigma FIS |
Term 1 |
198 |
107 |
|
[64]
|
|
4496405..4496489 |
|
ttg |
sigma FIS |
Term 1 |
196 |
261 |
|
[65]
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eco. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eco cumuls opérons effectif
avec rRNA opérons 7
16 23 5s 0 0
16 atc gca 3
16 23 5s a 0
max a 3
a doubles 0
spéciaux 4
total aas 14
sans opérons 36
1 aa 23
max a 7
a doubles 10
total aas 72
total aas 86
remarques 3
eco1. Escherichia coli, blocs à rRNA.
16s |
68 |
16s |
68 |
68
|
atc |
42 |
atc |
42 |
42
|
gca |
174 |
gca |
183 |
183
|
23s |
92 |
23s |
93 |
93
|
5s |
12 |
5s |
52 |
|
acc |
37 |
gac |
|
|
5s |
|
|
|
|
|
|
|
|
|
16s |
85 |
171 |
171 |
85
|
gaa |
193 |
184 |
193 |
193
|
23s |
92 |
92 |
92 |
93
|
5s |
52 |
|
|
|
gac |
|
|
|
|
- Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles. Comme eal.
- @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
- - Les intercalaires sont les mêmes pour les 3 opérons, 68 42 183 93.
- - Cependant les 3 1ers intercalaires diminuent de 3 bases chacun et le 4ème est divisé par 2.
- - Par rapport à eal un opéron sans aa de plus, s'est transformé avec 1 aa et 1 5s en plus. Son intercalaire gca-23s a diminué de 5 % par rapport aux 2 autres, 9/183.
- @2 4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s, comme eal.
- - Les intercalaires sont les mêmes pour 2 opérons sans aa supplémentaire, 171 193 92.
- - Pour les 2 autres opérons le 1er intrcalaire est divisé par 2, 85 193 92.
- - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
- - Par rapport à eal, l'opéron avec 1 aa et 1 5s a perdu ces suppléments. Et l’on a 3 opérons sans et 1 opéron avec 2 aas en supplément.
- @3 2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
- Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
- - Il y a 4 remaniements qui consistent tous en une ou 2 répétions de plus des répétitions déjà existantes
- - 2 opérons sans rRNAs et sans doubles ont été perdus de eal à eco.
- - Pour eco il y a toujours 10 opérons avec répétition et 3 sans répétitions:
- - 3 opérons à 2 aas répétés
- - 4 opérons à 3 aas répétés
- - 1 opéron à 4 aas répétés.
- - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
- - Un opéron à 7 aas a une séquence répétée, 3aaa + 2*2.
eco eal
Opérons sans rRNAs avec doubles
2tac 2tac
2gtc 2gtc
2gcc 2gcc
3ctg 3ctg
3atgf 3atgf
atg cta 2caa atg 2cag atg cta 2caa atg 2cag
Remaniements des répétitions
3ggc 2ggc
aaa 3gta aaa 2gta
agc 4cgt agc 3cgt
5aaa 2gta 3aaa 2gta
Opérons sans rRNAs sans doubles
tta tgc ggc tta tgc ggc
cgg cac ctg cca cgg cac ctg cca
aca tac gga acc aca tac gga acc
Disparition de 2 opérons chez eco
- atgi aga
- gga aca
- Lien tableur: eco distribution
- Notes:
- - gtc2 gta3 ctg3 gcc2 tac2 aaa3 caa2 cag2 atgf3 cgt4 ggc3
- - gac: 1aa + 2 5s
- - Séquences:
- (aaa gta)2 aaa3
Gm4 eco, Escherichia coli str. K-12 substr. MG1655. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
2 |
tac |
3 |
tgc |
1
|
f atc |
3 |
j acc |
2 |
aac |
4 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
4
|
h gtc |
2 |
n gcc |
2 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
1 |
aaa |
6 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
2 |
cga |
|
l gta |
5 |
o gca |
3 |
gaa |
4 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
4 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
eco |
49 |
23 |
|
4 |
|
10 |
86
|
- eco Le prélèvement: alpha gama
- Le nom et le lien NCBI: eco, Escherichia coli str. K-12 substr. MG1655, NCBI [66], date 7.3.22.
- spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
eco 501 283 4 641 652 10.8
Intergen51. eco. Les différents types d'intercalaires
modifier
Int51.2 eco les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2 188 |
647 |
16 |
2 851 |
2,4 |
65 |
6 |
71
|
x |
1 061 |
95 |
13 |
1 169 |
|
0 |
6 |
6
|
t |
3 249 |
742 |
29 |
4 020 |
|
65 |
12 |
77
|
% |
80,8 |
18,5 |
0,7 |
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
37 |
0 |
0 |
37 |
1,3 |
tRNA-CDS |
65 |
9
|
x |
28 |
0 |
0 |
28 |
|
RNA-RNA |
65 |
9
|
t |
65 |
0 |
0 |
65 |
|
CDS-rRNA |
12 |
2
|
% |
100,0 |
0,0 |
0,0 |
|
|
non RNA |
570 |
80
|
- |
|
|
|
|
|
total |
712 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
2,9 |
10,8 |
13,7 |
33,8 |
2,7 |
47 |
0,6 |
0,0
|
x |
5,3 |
14,3 |
3,9 |
5,9 |
3,6 |
65 |
1,1 |
0,0
|
|
Intergen51. eco. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées: eco fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées: eco fx1
- Équations des courbes de tendance en pour 1000: à partir des colonnes fx fc des données intercalaires.
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 eco
R2 x3 x2 x c Inflexion poly3 x c
0,538 2,01E-06 -1,39E-03 1,81E-01 29,40 fx1 abscisse 257,1 366,3
0,802 -7,30E-06 5,57E-03 1,38E+00 121,0 fc1 ordonnée 19,9 3,8
0,706 -1,40E-06 1,08E-03 -3,51E-01 62,5 fx41
0.964 -1,05E-06 1,16E-03 -4,61E-01 69.1 fc51
- Le rfin après 400 est de 64 sur un total de 2204. Jusqu'à 1% les freq10 sont en continu jusqu'à 520, reste 22. L'indice i.rfin1 = 42/120 = 0.350.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données eco calculs poly3 eco
effect 2204 R2.21 800 abscis 250
xm 46 pte 12,36 flexa 137
ym 7 cste 3,74 flexo 2,53
x1m 222 r400l 178 xm 35
y1m 1 restp 136,57 sup4 117,4
rfin 29,04 %sd 29,98 sup4t 353,4
bornf 121 lond 176 % 33,2
supd 139,4 %sf 31,14 long 102
supdt 465,1 lf 75 R2 467
xmp 398,37 sf/lonf 1,15
r400 107,53 sr/lr 0,53
supf 86,2 sd/ld 0,79
supft 276,8 i.r400 0,60
Intergen51. eco. Les CDS-CDS négatifs
modifier
Sous-totaux eco totale
fréquence x- c- x- c-
-1 0 162 4 4140
-2 2 0 85 11
-3 0 0 3 12
-4 43 260 717 10938
-5 0 0 5 19
sp6 50 225 1642 8424
total 95 647 2 456 23 544
reste 13 25 264 420
s6 14 0 361 41
s7 6 48 321 1438
s8 17 152 696 6525
rappot s1-5
4/2/1 21,5 1,6 8,4 2,6
% / sp6
s6/sp6 28,0 0,0 22,0 0,5
s7/sp6 12,0 21,3 19,5 17,1
s8/sp6 34,0 67,6 42,4 77,5
reste/sp6 26,0 11,1 16,1 5,0
total s1-5 45 422 814 15120
% / total
%s1-5 47,4 65,2 33,1 64,2
%sp6 52,6 34,8 66,9 35,8
Intergen51. eco. Les intercalaires des blocs
modifier
- Le détail et les rares
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
RNA-RNA c x CDS-RNA c x
23s 5s 7 CDS 16s 4 3
16s 23s 7 5s CDS 2 3
16s tRNA 16 CDS
tRNA 23s 7 CDS 5s
5s tRNA 3 23s CDS
tRNA in 3 CDS 23s
tRNA contig 5s 16s
tRNA hors 37 16s16s
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 65 0 total 6 6
- Lien tableur: Intergen51. eco. Les intercalaires tRNA-tRNA extra bloc
- Les contigus aux blocs: inexistants
- Les hors blocs: 37 au total avec de fortes répétitions qui donnent un diagramme à 2 pics aux abscisses 5 35. Voir les doubles dans ancien eco et le chapitre distribution qui le suit. Faire un tableau avec couleurs.
- Notes: les 7 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
Int51.31 eco. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
37 |
cag |
|
4 |
gtc |
|
33 |
atgf
|
47 |
cag |
|
** |
gtc |
|
33 |
atgf
|
15 |
atgj |
|
12 |
tta |
|
** |
atgf
|
34 |
caa |
|
54 |
tgc |
|
8 |
gac
|
23 |
caa |
|
** |
ggc |
|
** |
tgg
|
9 |
cta |
|
39 |
ggc |
|
57 |
cgg
|
** |
atgj |
|
** |
ggc |
|
20 |
cac
|
135 |
aaa |
|
44 |
gta |
|
42 |
ctg
|
2 |
gta |
|
46 |
gta |
|
** |
cca
|
149 |
aaa |
|
4 |
gta |
|
8 |
aca
|
3 |
gta |
|
** |
aaa |
|
116 |
tac
|
146 |
aaa |
|
198 |
cgt |
|
6 |
gga
|
132 |
aaa |
|
62 |
cgt |
|
** |
acc
|
** |
aaa |
|
198 |
cgt |
|
36 |
ggc
|
209 |
tac |
|
3 |
cgt |
|
35 |
ggc
|
** |
tac |
|
** |
agc |
|
** |
ggc
|
|
|
|
|
|
|
34 |
ctg
|
|
|
|
|
|
|
28 |
ctg
|
|
|
|
|
|
|
** |
ctg
|
- Lien NCBI [67] daté du 23-9-2020 pour ces prélèvements.
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
eco. Sx+ Sc+ Les diagrammes 400
eco |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
22 |
-151 |
195 |
32 |
532 |
230 |
max50 |
-74 |
565 |
-1405 |
124 |
805 |
255 |
min50
|
31 à 400 |
|
|
|
|
|
|
|
7.6 |
-18 |
-162 |
50 |
934 |
79 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
94 |
44 |
- |
489 |
dte |
43 |
tm |
197 |
65 |
- |
540 |
poly |
265 |
SF
|
31 à 400 |
|
|
|
|
|
|
|
117 |
43 |
- |
873 |
poly |
61 |
tm
|
- Légende du tableau des corrélations et des fréquences faibles
eco. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
cbn |
min20 |
489 |
1701 |
2190 |
731 |
543 |
505 |
-38 |
-222 |
-114 |
271
|
eco |
min20 |
1003 |
2130 |
3133 |
735 |
296 |
440 |
144 |
-178 |
-64 |
287
|
bsu |
min10 |
1028 |
2444 |
3472 |
659 |
8 |
282 |
274 |
152 |
257 |
470
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
65 |
312 |
0.21 |
553 |
1940 |
2 |
5 |
17 |
86 |
56 |
620 |
-382
|
63 |
348 |
0.18 |
1169 |
2855 |
11 |
6 |
80 |
226 |
126 |
821 |
-119
|
140 |
333 |
0.42 |
1125 |
3091 |
2 |
8 |
31 |
186 |
302 |
936 |
-432
|
- Diagrammes 400: eco cbn, diagramme 1-40: c+ eco c+ cbn x+ eco total, texte: cbn.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - eco ressemble beaucoup à cbn comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible et moyen (R2’ 43 26). Ils ne diffèrent que par le total des effectifs 3133 contre 2190.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50. Quand j’enlève les 3 fréquences faibles pour ne laisser que la pyramide, la courbe eco devient une S faible, Sf, R2’ à 36 et la courbe cbn devient une S forte, SF, R2’ à 75. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30 65 pour cbn et eco.
- + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 230.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 265 pour eco contre 203 et des 2 points d’inflexion normaux, 255 pour eco et 263 pour cbn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 environ pour les 2. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: Les 2 formes sont des tildes moyens , tm, avec un R2’ de 61 pour eco et 41 pour cbn. Les 2 points d’inflexions sont différents mais petits, 79 pour eco contre 121.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont quasiment identiques 440 pour eco contre 505. Par contre eco chute fortement sur 41-200, avec une différence de 144, alors que cbn s’améliore avec une différence de -38.
- Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez eco les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -178 pour 1-200 et -64 pour 1-250.
- + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives comme eco -222 pour 1-200 et -114 pour 1-250.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour eco et cbn ils sont autour de 0.20. Les zéros sont à 7‰ pour cbn et 17‰ pour eco, avantage donné par les x+; alors que le taux des négatifs fait le triple de cbn chez eco, 103‰ contre 306‰ comme chez cvi.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblables et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Eco avec 126 est différente du modèle c+ 1-40 car c’est une courbe régulièrement croissante à partir de la fréquence 8 et aussi à cause de la corrélation négative x+/c+ de -119.
- Lien tableur: eco autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - regul, pour regulatory
- - mobile, pour mobile_element
- - rep_or, pour rep_origin
- - gene, est dans NCBI, un pseudo gène
- Note: attention le dernier 233 n'est pas comp', contrôle à l'adresse 4392892. corrigé ici
- Totaux:
tRNA-cds tRNA-tRNA autres-cds total 676
c+ x+ x- c+ x+ c- c+ c- x+
49 28 0 65 0 0 142
cds-mob 19 44 63
cds-gen 149 30 1 180
cds-misc 39 17 56
cds-ncR 118 25 143 1 x-
non cds 57 31 1 89
rep-O 2 2
gene mobile misc_f ncRNA rep-O total 384 147 2 675
129 50 48 79 1 307
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
- Liens: gtRNAdb [68], NCBI [69], génome [70]
- Lien tableur: ecoN opérons
- Phylogénie: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia.
- Légende: cdsa: cds aas, cdsd: cds dirigé
G7. Escherichia coli Nissle 1917
50%GC |
21.8.19 Paris |
123 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
|
231864..232436 |
CDS |
|
365 |
365 |
|
|
191 |
|
D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase
|
|
232802..234321 |
16s |
|
73 |
|
|
|
1520 |
|
|
|
234395..234471 |
gaa |
|
12 |
|
|
12 |
|
|
|
|
234484..234557 |
gca |
|
174 |
|
|
|
|
|
|
|
234732..237319 |
23s |
|
83 |
|
|
|
2588 |
|
|
|
237403..237518 |
5s |
|
54 |
|
|
|
116 |
|
|
|
237573..237649 |
gac |
|
162 |
162 |
|
|
|
162 |
|
|
237812..238615 |
CDS |
|
|
|
|
|
268 |
|
2,5-didehydrogluconate reductase DkgB
|
|
|
|
|
|
|
|
|
|
|
|
|
244934..245665 |
CDS |
|
132 |
132 |
|
|
244 |
|
DNA polymerase III subunit epsilon
|
|
245798..245874 |
gac |
|
120 |
120 |
|
|
|
120 |
|
comp |
245995..246852 |
CDS |
|
|
|
|
|
286 |
|
DUF4942 domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
|
367329..368582 |
CDS |
|
114 |
114 |
|
|
418 |
114 |
glutamate-5-semialdehyde dehydrogenase
|
|
368697..368772 |
acg |
|
154 |
154 |
|
|
|
|
|
|
368927..369265 |
CDS |
|
|
|
|
|
113 |
|
DUF4102 domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
631149..632015 |
CDS |
|
270 |
270 |
|
|
289 |
|
bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD
|
|
632286..632362 |
aga |
|
15 |
15 |
|
|
|
15 |
|
comp |
632378..632997 |
CDS |
|
|
|
|
|
207 |
|
tyrosine-type recombinase/integrase
|
|
|
|
|
|
|
|
|
|
|
|
|
733188..734363 |
CDS |
|
153 |
153 |
|
|
392 |
153 |
2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase
|
comp |
734517..734591 |
cag |
+ |
37 |
|
37 |
|
|
|
|
comp |
734629..734703 |
cag |
2 cag |
48 |
|
48 |
|
|
|
|
comp |
734752..734828 |
atgj |
2 atgj |
15 |
|
15 |
|
|
|
|
comp |
734844..734918 |
caa |
2 caa |
34 |
|
34 |
|
|
|
|
comp |
734953..735027 |
caa |
|
23 |
|
23 |
|
|
|
|
comp |
735051..735135 |
cta |
|
10 |
|
10 |
|
|
|
|
comp |
735146..735222 |
atgj |
|
380 |
380 |
|
|
|
|
|
comp |
735603..737267 |
CDS |
|
|
|
|
|
555 |
|
asparagine synthase B
|
|
|
|
|
|
|
|
|
|
|
|
|
807377..808169 |
CDS |
|
164 |
164 |
|
|
264 |
164 |
Pseudo, cell division protein CpoB
|
|
808334..808409 |
aaa |
+ |
35 |
|
35 |
|
|
|
|
|
808445..808520 |
gta |
5 aaa |
2 |
|
2 |
|
|
|
|
|
808523..808598 |
aaa |
2 gta |
51 |
|
51 |
|
|
|
|
|
808650..808725 |
gta |
|
3 |
|
3 |
|
|
|
|
|
808729..808804 |
aaa |
|
48 |
|
48 |
|
|
|
|
|
808853..808928 |
aaa |
|
33 |
|
33 |
|
|
|
|
|
808962..809037 |
aaa |
|
277 |
277 |
|
|
|
|
|
|
809315..810358 |
CDS |
|
|
|
|
|
348 |
|
quinolinate synthase NadA
|
|
|
|
|
|
|
|
|
|
|
|
|
950069..952345 |
CDS |
|
343 |
343 |
|
|
759 |
343 |
ATP-dependent Clp protease ATP-binding subunit ClpA
|
comp |
952689..952776 |
tcc |
|
253 |
253 |
|
|
|
|
|
comp |
953030..953248 |
CDS |
|
|
|
|
|
73 |
|
translation initiation factor IF-1
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1047224..1047883 |
CDS |
|
206 |
206 |
|
|
220 |
206 |
FtsH protease modulator YccA
|
comp |
1048090..1048177 |
tca |
|
426 |
426 |
|
|
|
|
|
|
1048604..1049722 |
CDS |
|
|
|
|
|
373 |
|
hydrogenase 1 small subunit
|
|
|
|
|
|
|
|
|
|
|
|
|
1183656..1184018 |
CDS |
|
463 |
463 |
|
|
121 |
|
hp
|
|
1184482..1184558 |
aga |
|
278 |
278 |
|
|
|
278 |
|
> comp |
1184837..1185786 |
CDS |
|
|
|
|
|
317 |
|
Pseudo, IS4 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
|
1213982..1214809 |
CDS |
|
165 |
165 |
|
|
276 |
165 |
DUF4942 domain-containing protein
|
comp |
1214975..1215062 |
tcc |
|
233 |
233 |
|
|
|
|
|
|
1215296..1216234 |
CDS |
|
|
|
|
|
313 |
|
glyoxylate/hydroxypyruvate reductase GhrA
|
|
|
|
|
|
|
|
|
|
|
|
|
1216817..1217098 |
CDS |
|
165 |
165 |
|
|
94 |
165 |
DUF4942 domain-containing protein
|
comp |
1217264..1217351 |
tcc |
|
234 |
234 |
|
|
|
|
|
|
1217586..1218524 |
CDS |
|
|
|
|
|
313 |
|
glyoxylate/hydroxypyruvate reductase GhrA
|
|
|
|
|
|
|
|
|
|
|
|
|
1457038..1458129 |
CDS |
|
16 |
16 |
|
|
364 |
16 |
acyl-CoA desaturase
|
comp |
1458146..1458277 |
ncRNA |
|
46 |
|
|
|
44 |
|
RtT sRNA
|
comp |
1458324..1458408 |
tac |
+ |
33 |
|
33 |
|
|
|
|
comp |
1458442..1458526 |
tac |
2 tac |
159 |
159 |
|
|
|
|
|
comp |
1458686..1459528 |
CDS |
|
|
|
|
|
281 |
|
formyltetrahydrofolate deformylase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1829066..1830322 |
CDS |
|
307 |
307 |
|
|
419 |
|
hp
|
|
1830630..1830706 |
gtc |
+ |
4 |
|
4 |
|
|
|
|
|
1830711..1830787 |
gtc |
2 gtc |
6 |
6 |
|
|
|
6 |
|
< |
1830794..1831177 |
CDS |
@4 |
|
|
|
|
128 |
|
Pseudo, multidrug efflux MATE transporter MdtK
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1831218..1832474 |
CDS |
|
307 |
307 |
|
|
419 |
|
hp
|
|
1832782..1832858 |
gtc |
+ |
4 |
|
4 |
|
|
|
|
|
1832863..1832939 |
gtc |
2 gtc |
8 |
8 |
|
|
|
8 |
|
< |
1832948..1833280 |
CDS |
|
|
|
|
|
111 |
|
Pseudo, MATE family efflux transporter
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1833321..1834577 |
CDS |
|
307 |
307 |
|
|
419 |
|
hp
|
|
1834885..1834961 |
gtc |
+ |
4 |
|
4 |
|
|
|
|
|
1834966..1835042 |
gtc |
2 gtc |
108 |
108 |
|
|
|
108 |
|
|
1835151..1835456 |
CDS |
|
|
|
|
|
102 |
|
monooxygenase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2115794..2116459 |
CDS |
|
195 |
195 |
|
|
222 |
|
UPF0149 family protein YecA
|
comp |
2116655..2116741 |
tta |
|
12 |
|
12 |
|
|
|
|
comp |
2116754..2116827 |
tgc |
|
53 |
|
53 |
|
|
|
|
comp |
2116881..2116956 |
ggc |
|
151 |
151 |
|
|
|
151 |
|
comp |
2117108..2117656 |
CDS |
|
|
|
|
|
183 |
|
CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2191451..2192287 |
CDS |
|
278 |
278 |
|
|
279 |
|
hp
|
comp |
2192566..2192655 |
tcg |
|
93 |
93 |
|
|
|
93 |
|
|
2192749..2193546 |
CDS |
|
100 |
100 |
|
|
266 |
100 |
DgsA anti-repressor MtfA
|
|
2193647..2193722 |
aac |
|
161 |
161 |
|
|
|
|
|
|
2193884..2195146 |
CDS |
|
|
|
|
|
421 |
|
tyrosine-type recombinase/integrase
|
|
|
|
|
|
|
|
|
|
|
|
|
2232607..2233323 |
CDS |
|
453 |
453 |
|
|
239 |
|
YebC/PmpR family DNA-binding transcriptional regulator
|
comp |
2233777..2233852 |
acc |
|
326 |
326 |
|
|
|
326 |
|
|
2234179..2235096 |
CDS |
|
|
|
|
|
306 |
|
nitrogen assimilation transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
2235198..2236148 |
CDS |
|
37 |
37 |
|
|
317 |
|
HTH-type transcriptional regulator Cbl
|
comp |
2236186..2236261 |
aac |
|
4 |
4 |
|
|
|
4 |
|
|
2236266..2237909 |
CDS |
|
100 |
100 |
|
|
548 |
100 |
toxic metabolite efflux MATE transporter YeeO
|
|
2238010..2238085 |
aac |
|
161 |
161 |
|
|
|
|
|
|
2238247..2239518 |
CDS |
|
|
|
|
|
424 |
|
tyrosine-type recombinase/integrase
|
|
|
|
|
|
|
|
|
|
|
|
|
2546968..2548728 |
CDS |
|
74 |
74 |
|
|
587 |
74 |
cardiolipin transport protein PbgA
|
|
2548803..2548879 |
ccc |
|
101 |
101 |
|
|
|
|
|
comp |
2548981..2549136 |
CDS |
|
|
|
|
|
52 |
|
autotransporter outer membrane beta-barrel domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
|
2717780..2718712 |
CDS |
|
75 |
75 |
|
|
311 |
75 |
formate/nitrite transporter family protein
|
|
2718788..2718862 |
agg |
|
437 |
437 |
|
|
|
|
|
comp |
2719300..2719830 |
CDS |
|
|
|
|
|
177 |
|
OmpH family outer membrane protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2768744..2770933 |
CDS |
|
206 |
206 |
|
|
730 |
206 |
sensor domain-containing phosphodiesterase
|
comp |
2771140..2771215 |
gcc |
+ |
39 |
|
39 |
|
|
|
|
comp |
2771255..2771330 |
gcc |
2 gcc |
220 |
220 |
|
|
|
|
|
|
2771551..2771910 |
CDS |
|
|
|
|
|
120 |
|
putative DNA-binding transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2772355..2773770 |
CDS |
|
258 |
258 |
|
|
472 |
|
glutamate--tRNA ligase
|
|
2774029..2774104 |
gta |
+ |
43 |
|
43 |
|
|
|
|
|
2774148..2774223 |
gta |
3 gta |
46 |
|
46 |
|
|
|
|
|
2774270..2774345 |
gta |
|
4 |
|
4 |
|
|
|
|
|
2774350..2774425 |
aaa |
|
110 |
110 |
|
|
|
110 |
|
comp |
2774536..2775420 |
CDS |
|
|
|
|
|
295 |
|
LysR family transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
comp |
2959205..2960503 |
CDS |
|
323 |
323 |
|
|
433 |
323 |
alpha-ketoglutarate permease
|
comp |
2960827..2960942 |
5s |
|
83 |
|
|
|
116 |
|
|
comp |
2961026..2965477 |
23s |
|
184 |
|
|
|
4452 |
|
|
comp |
2965662..2965737 |
gaa |
|
431 |
|
|
|
|
|
|
comp |
2966169..2967720 |
16s |
|
441 |
441 |
|
|
1552 |
|
|
comp |
2968162..2970735 |
CDS |
|
|
|
|
|
858 |
|
ATP-dependent chaperone ClpB
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3027207..3027773 |
CDS |
|
280 |
280 |
|
|
189 |
280 |
fructose-1-phosphate/6-phosphogluconate phosphatase
|
comp |
3028054..3028130 |
cgt |
+ |
63 |
|
63 |
|
|
|
|
comp |
3028194..3028270 |
cgt |
5 cgt |
62 |
|
62 |
|
|
|
|
comp |
3028333..3028409 |
cgt |
|
62 |
|
62 |
|
|
|
|
comp |
3028472..3028548 |
cgt |
|
64 |
|
64 |
|
|
|
|
comp |
3028613..3028689 |
cgt |
|
3 |
|
3 |
|
|
|
|
comp |
3028693..3028785 |
agc |
|
315 |
315 |
|
|
|
|
|
comp |
3029101..3029286 |
CDS |
|
|
|
|
|
62 |
|
carbon storage regulator CsrA
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3157337..3158434 |
CDS |
|
208 |
208 |
|
|
366 |
208 |
murein transglycosylase A
|
|
3158643..3158719 |
atgf |
+ |
33 |
|
33 |
|
|
|
|
|
3158753..3158829 |
atgf |
3 atgf |
33 |
|
33 |
|
|
|
|
|
3158863..3158939 |
atgf |
|
635 |
635 |
|
|
|
|
|
|
3159575..3160075 |
CDS |
|
|
|
|
|
167 |
|
type VI secretion system contractile sheath small subunit
|
|
|
|
|
|
|
|
|
|
|
|
|
3230172..3231401 |
CDS |
|
316 |
316 |
|
|
410 |
|
HAAAP family serine/threonine permease
|
comp |
3231718..3231791 |
ggg |
|
78 |
78 |
|
|
|
78 |
|
comp |
3231870..3232625 |
CDS |
|
|
|
|
|
252 |
|
peptidoglycan DD-metalloendopeptidase family protein
|
|
|
|
|
|
|
|
|
|
|
|
|
3341048..3341755 |
CDS |
|
105 |
105 |
|
|
236 |
105 |
DUF554 domain-containing protein
|
|
3341861..3341936 |
ttc |
|
197 |
197 |
|
|
|
|
|
|
3342134..3343399 |
CDS |
|
|
|
|
|
422 |
|
integrase arm-type DNA-binding domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3569308..3569814 |
CDS |
|
124 |
124 |
|
|
169 |
|
G/U mismatch-specific DNA glycosylase
|
|
3569939..3570014 |
atgi |
|
53 |
53 |
|
|
|
53 |
|
comp |
3570068..3570832 |
CDS |
|
|
|
|
|
255 |
|
NADPH-dependent ferric chelate reductase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3670227..3670679 |
CDS |
|
206 |
206 |
|
|
151 |
206 |
ribosome maturation factor RimP
|
comp |
3670886..3670962 |
atgf |
|
347 |
347 |
|
|
|
|
|
> |
3671310..3672155 |
CDS |
|
|
|
|
|
282 |
|
Pseudo, argininosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3673935..3674387 |
CDS |
|
206 |
206 |
|
|
151 |
206 |
ribosome maturation factor RimP
|
comp |
3674594..3674670 |
atgf |
|
347 |
347 |
|
|
|
|
|
> |
3675018..3675869 |
CDS |
|
|
|
|
|
284 |
|
Pseudo, argininosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3677794..3678246 |
CDS |
|
206 |
206 |
|
|
151 |
206 |
ribosome maturation factor RimP
|
comp |
3678453..3678529 |
atgf |
|
347 |
347 |
|
|
|
|
|
> |
3678877..3679722 |
CDS |
|
|
|
|
|
282 |
|
Pseudo, argininosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3681532..3681984 |
CDS |
|
206 |
206 |
|
|
151 |
206 |
ribosome maturation factor RimP
|
comp |
3682191..3682267 |
atgf |
|
347 |
347 |
|
|
|
|
|
|
3682615..3683958 |
CDS |
|
|
|
|
|
448 |
|
argininosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3683966..3685591 |
CDS |
|
456 |
456 |
|
|
542 |
|
phosphoethanolamine transferase
|
comp |
3686048..3686134 |
ctc |
|
14 |
14 |
|
|
|
14 |
|
comp |
3686149..3686481 |
CDS |
|
|
|
|
|
111 |
|
preprotein translocase subunit SecG
|
|
|
|
|
|
|
|
|
|
|
|
|
3784553..3785311 |
CDS |
|
62 |
62 |
|
|
253 |
62 |
amino acid ABC transporter ATP-binding protein
|
comp |
3785374..3785489 |
5s |
@3 |
39 |
|
|
|
116 |
|
|
comp |
3785529..3785605 |
acc |
|
14 |
|
|
|
|
|
|
comp |
3785620..3785735 |
5s |
|
777 |
|
|
|
116 |
|
|
comp |
3786513..3786588 |
acc |
|
14 |
|
|
|
|
|
|
comp |
3786603..3786718 |
5s |
|
1834 |
|
|
|
116 |
|
|
comp |
3788553..3788628 |
gaa |
|
1360 |
1360 |
|
|
|
|
|
|
3789989..3790543 |
CDS |
|
|
|
|
|
185 |
|
gamma carbonic anhydrase family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4078635..4080242 |
CDS |
|
743 |
743 |
|
|
536 |
|
dipeptide ABC transporter substrate-binding protein DppA
|
comp |
4080986..4081062 |
ccg |
|
91 |
91 |
|
|
|
91 |
|
comp |
4081154..4082845 |
CDS |
|
|
|
|
|
564 |
|
kdo(2)-lipid A phosphoethanolamine 7-transferase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4205966..4207348 |
CDS |
|
292 |
292 |
|
|
461 |
292 |
glycoside-pentoside-hexuronide family transporter
|
|
4207641..4207735 |
tga |
|
300 |
300 |
|
|
|
|
|
> |
4208036..4208857 |
CDS |
|
|
|
|
|
274 |
|
Pseudo, DUF4102 domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4338643..4339335 |
CDS |
|
479 |
479 |
|
|
231 |
|
FadR family transcriptional regulator
|
|
4339815..4341342 |
16s |
|
73 |
|
|
|
1528 |
|
|
|
4341416..4341491 |
gaa |
|
184 |
|
|
|
|
|
|
|
4341676..4344286 |
23s |
|
83 |
|
|
|
2611 |
|
|
|
4344370..4344485 |
5s |
|
53 |
|
|
|
116 |
|
|
|
4344539..4344615 |
gac |
|
8 |
|
|
|
|
|
|
|
4344624..4344699 |
tgg |
|
95 |
95 |
|
|
|
95 |
|
comp |
4344795..4345634 |
CDS |
|
|
|
|
|
280 |
|
HTH-type transcriptional regulator HdfR
|
|
|
|
|
|
|
|
|
|
|
|
|
4377681..4379066 |
CDS |
|
102 |
102 |
|
|
462 |
102 |
amino acid permease
|
|
4379169..4379245 |
cgg |
|
58 |
|
58 |
|
|
|
|
|
4379304..4379379 |
cac |
|
20 |
|
20 |
|
|
|
|
|
4379400..4379486 |
ctg |
|
42 |
|
42 |
|
|
|
|
|
4379529..4379605 |
cca |
|
146 |
146 |
|
|
|
|
|
|
4379752..4380987 |
CDS |
|
|
|
|
|
412 |
|
anaerobic sulfatase maturase
|
|
|
|
|
|
|
|
|
|
|
|
|
4460971..4461516 |
CDS |
|
377 |
377 |
|
|
182 |
|
menaquinone-dependent protoporphyrinogen IX dehydrogenase
|
|
4461894..4463631 |
16s |
|
56 |
|
|
|
1738 |
|
|
|
4463688..4463764 |
atc |
|
42 |
|
|
42 |
|
|
|
|
4463807..4463882 |
gca |
|
165 |
|
|
|
|
|
|
|
4464048..4467338 |
23s |
|
83 |
|
|
|
3291 |
|
|
|
4467422..4467537 |
5s |
|
104 |
104 |
|
|
116 |
104 |
|
comp |
4467642..4468169 |
CDS |
|
|
|
|
|
176 |
|
molybdopterin-guanine dinucleotide biosynthesis protein B
|
|
|
|
|
|
|
|
|
|
|
|
|
4605577..4606434 |
CDS |
|
374 |
374 |
|
|
286 |
|
glutamate racemase
|
|
4606809..4608362 |
16s |
|
363 |
|
|
|
1554 |
|
|
|
4608726..4608801 |
gaa |
|
1112 |
|
|
|
|
|
|
|
4609914..4610029 |
5s |
|
136 |
136 |
|
|
116 |
136 |
|
|
4610166..4611194 |
CDS |
|
|
|
|
|
343 |
|
UDP-N-acetylenolpyruvoylglucosamine reductase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4612185..4613135 |
CDS |
|
361 |
361 |
|
|
317 |
|
type I pantothenate kinase
|
|
4613497..4613572 |
aca |
|
8 |
|
8 |
|
|
|
|
|
4613581..4613665 |
tac |
|
116 |
|
116 |
|
|
|
|
|
4613782..4613856 |
gga |
|
6 |
|
6 |
|
|
|
|
|
4613863..4613938 |
acc |
|
114 |
114 |
|
|
|
114 |
|
|
4614053..4615237 |
CDS |
|
|
|
|
|
395 |
|
elongation factor Tu
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4642984..4644573 |
CDS |
|
616 |
616 |
|
|
530 |
|
bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
|
|
4645190..4646378 |
16s’ |
@1 |
83 |
83 |
|
|
1189 |
83 |
|
|
4646462..4648150 |
CDS |
|
436 |
436 |
|
|
563 |
|
bifunctional isocitrate dehydrogenase kinase/phosphatase
|
|
4648587..4648662 |
gaa |
|
185 |
|
|
|
|
|
|
|
4648848..4651319 |
23s |
|
83 |
|
|
|
2472 |
|
|
|
4651403..4651518 |
5s |
|
76 |
76 |
|
|
116 |
76 |
|
|
4651595..4651978 |
CDS |
|
|
|
|
|
128 |
|
hypothetical protein
|
|
|
|
|
|
|
|
|
|
|
|
< comp |
4834504..4834961 |
CDS |
|
197 |
197 |
|
|
153 |
|
pseudo, integrase
|
comp |
4835159..4835234 |
ttc |
|
106 |
106 |
|
|
|
106 |
|
comp |
4835341..4835916 |
CDS |
|
|
|
|
|
192 |
|
transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
|
4864628..4865173 |
CDS |
|
210 |
210 |
|
|
182 |
210 |
oligoribonuclease
|
|
4865384..4865459 |
ggc |
+ |
36 |
|
36 |
|
|
|
|
|
4865496..4865571 |
ggc |
3 ggc |
35 |
|
35 |
|
|
|
|
|
4865607..4865682 |
ggc |
|
233 |
233 |
|
|
|
|
|
|
4865916..4865969 |
CDS |
|
|
|
|
|
18 |
|
hp
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4974178..4975197 |
CDS |
|
195 |
195 |
|
|
340 |
|
NADPH-dependent aldehyde reductase Ahr
|
|
4975393..4975477 |
ttg |
|
39 |
39 |
|
|
|
39 |
|
<> comp |
4975517..4976055 |
CDS |
|
|
|
|
|
180 |
|
pseudo, IS630 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
|
5042527..5042763 |
CDS |
|
38 |
38 |
|
|
79 |
38 |
DUF1435 domain-containing protein
|
comp |
5042802..5042888 |
ctg |
+ |
34 |
|
34 |
|
|
|
|
comp |
5042923..5043009 |
ctg |
3 ctg |
28 |
|
28 |
|
|
|
|
comp |
5043038..5043124 |
ctg |
|
290 |
290 |
|
|
|
|
|
comp |
5043415..5044446 |
CDS |
|
|
|
|
|
344 |
|
16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC
|
|
|
|
|
|
|
|
|
|
|
|
comp |
5079375..5079581 |
CDS |
|
117 |
117 |
|
|
69 |
117 |
AlpA family transcriptional regulator
|
|
5079699..5081218 |
16s |
|
73 |
|
|
|
1520 |
|
|
|
5081292..5081368 |
gaa |
|
12 |
|
|
12 |
|
|
|
|
5081381..5081454 |
gca |
|
366 |
366 |
|
|
|
|
|
|
5081821..5082018 |
CDS |
|
524 |
524 |
|
|
66 |
|
hypothetical protein
|
comp |
5082543..5082754 |
CDS |
|
|
|
|
|
71 |
|
hypothetical protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
5090325..5090876 |
CDS |
|
1808 |
1808 |
|
|
184 |
|
MarR family transcriptional regulator
|
comp |
5092685..5092760 |
gaa |
|
588 |
588 |
|
|
|
588 |
|
< comp |
5093349..5093474 |
CDS |
|
592 |
592 |
|
|
42 |
|
sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB
|
|
5094067..5094142 |
gaa |
+ |
1472 |
|
|
1472 |
|
|
|
|
5095615..5095691 |
atc |
3 gaa |
42 |
|
|
42 |
|
|
|
|
5095734..5095809 |
atc |
2 atc |
1130 |
|
|
1130 |
|
|
|
|
5096940..5097015 |
gaa |
|
1145 |
|
|
1145 |
|
|
|
|
5098161..5098236 |
gaa |
|
185 |
|
|
|
|
|
|
|
5098422..5100893 |
23s |
|
83 |
|
|
|
2472 |
|
|
|
5100977..5101092 |
5s |
|
76 |
76 |
|
|
116 |
76 |
|
|
5101169..5101552 |
CDS |
|
63 |
63 |
|
|
128 |
|
hypothetical protein
|
comp |
5101616..5102059 |
CDS |
|
|
|
|
|
148 |
|
acetyltransferase
|
|
|
|
|
|
|
|
|
|
|
|
|
5124754..5125197 |
CDS |
|
63 |
63 |
|
|
148 |
|
acetyltransferase
|
comp |
5125261..5125644 |
CDS |
|
76 |
76 |
|
|
128 |
|
hypothetical protein
|
comp |
5125721..5125836 |
5s |
|
83 |
|
|
|
116 |
|
|
comp |
5125920..5128366 |
23s’ |
@2 |
-10 |
-10 |
|
|
2447 |
-10 |
|
< |
5128357..5128479 |
CDS |
|
|
|
|
|
41 |
|
pilus assembly protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
5252659..5253870 |
CDS |
|
300 |
300 |
|
|
404 |
|
tyrosine-type recombinase/integrase
|
comp |
5254171..5254249 |
tga |
|
292 |
292 |
|
|
|
292 |
|
> |
5254542..5255171 |
CDS |
|
|
|
|
|
210 |
|
pseudo, glycoside-pentoside-hexuronide family transporter
|
|
|
|
|
|
|
|
|
|
|
|
> comp |
5305902..5306228 |
CDS |
|
0 |
0 |
|
|
109 |
0 |
pseudo, hp
|
comp |
5306229..5306302 |
atc |
|
1096 |
1096 |
|
|
|
|
|
|
5307399..5308450 |
CDS |
|
|
|
|
|
351 |
|
pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada
|
|
|
|
|
|
|
|
|
|
|
|
comp |
5321144..5321869 |
CDS |
|
206 |
206 |
|
|
242 |
206 |
pseudo, histidine kinase
|
comp |
5322076..5322151 |
gcc |
+ |
39 |
|
39 |
|
|
|
|
comp |
5322191..5322266 |
gcc |
3 gcc |
39 |
|
39 |
|
|
|
|
comp |
5322306..5322381 |
gcc |
|
220 |
220 |
|
|
|
|
|
|
5322602..5322961 |
CDS |
|
|
|
|
|
120 |
|
putative DNA-binding transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
comp |
5323406..5324821 |
CDS |
|
258 |
258 |
|
|
472 |
|
glutamate--tRNA ligase
|
|
5325080..5325155 |
gta |
+ |
44 |
|
44 |
|
|
|
|
|
5325200..5325275 |
gta |
2 gta |
0 |
0 |
|
|
|
0 |
|
< |
5325276..5325389 |
CDS |
|
|
|
|
|
38 |
|
pseudo, putative DNA-binding transcriptional regulator
|
|
|
|
|
|
|
|
|
|
|
|
> |
5375524..5376270 |
CDS |
|
891 |
891 |
|
|
249 |
891 |
pseudo, AI-2E family transporter
|
|
5377162..5377237 |
gaa |
|
1047 |
1047 |
|
|
|
|
|
comp |
5378285..5379589 |
CDS |
|
|
|
|
|
435 |
|
isocitrate lyase
|
|
|
|
|
|
|
|
|
|
|
|
comp > |
5341397..5341492 |
CDS |
|
-2 |
-2 |
|
|
32 |
-2 |
ABC transporter ATP-binding protein
|
comp |
5341491..5344303 |
23s |
|
174 |
|
|
|
2813 |
|
|
comp |
5344478..5344553 |
gca |
|
42 |
|
|
42 |
|
|
|
comp |
5344596..5344672 |
atc |
|
56 |
|
|
|
|
|
|
comp |
5344729..5346282 |
16s |
|
1063 |
|
|
|
1554 |
|
|
comp |
5347346..5347421 |
gca |
|
42 |
|
|
42 |
|
|
|
comp |
5347464..5347540 |
atc |
|
56 |
|
|
|
|
|
|
comp |
5347597..5349150 |
16s |
|
365 |
365 |
|
|
1554 |
|
|
comp |
5349516..5350088 |
CDS |
|
187 |
187 |
|
|
191 |
|
D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase
|
> |
5350276..5350914 |
CDS |
|
|
|
|
|
213 |
|
methionine ABC transporter ATP-binding protein MetN
|
|
|
|
|
|
|
|
|
|
|
|
> comp |
5359583..5360512 |
CDS |
|
120 |
120 |
|
|
310 |
|
tyrosine-type recombinase/integrase
|
comp |
5360633..5360708 |
gca |
|
42 |
|
|
|
|
|
|
comp |
5360751..5360827 |
atc |
|
56 |
|
|
|
|
|
|
comp |
5360884..5362138 |
16s’ |
|
1 |
1 |
|
|
1255 |
1 |
|
< comp |
5362140..5363543 |
CDS |
|
|
|
|
|
468 |
|
IS66 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
|
5425965..5426201 |
CDS |
|
38 |
38 |
|
|
79 |
38 |
DUF1435 domain-containing protein
|
comp |
5426240..5426325 |
ctg |
+ |
26 |
|
26 |
|
|
|
a disparu le 20.12.19
|
comp |
5426352..5426438 |
ctg |
3 ctg |
28 |
|
28 |
|
|
|
|
comp |
5426467..5426553 |
ctg |
|
63 |
63 |
|
|
|
|
|
< comp |
5426617..5427150 |
CDS |
|
|
|
|
|
178 |
|
pseudo, IS630-like element IS630 family transposase
|
|
|
|
|
|
|
|
|
|
|
|
> |
5433568..5433687 |
CDS |
|
39 |
39 |
|
|
40 |
39 |
pseudo, nicotinamide-nucleotide amidase
|
comp |
5433727..5433814 |
tcc |
|
253 |
253 |
|
|
|
|
|
comp |
5434068..5434286 |
CDS |
|
|
|
|
|
73 |
|
translation initiation factor IF-1
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.ecoN. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
- Lien tableur: ecoN cumuls
cumuls. Escherichia coli Nissle 1917
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa |
gammes |
cdsa 300
|
avec rRNA |
opérons |
12 |
1 |
0 |
|
1 |
5 |
1 |
5 |
100 |
16 |
1 |
0
|
|
16 23 5s |
0 |
20 |
13 |
2 |
50 |
11 |
40 |
10 |
200 |
34 |
30 |
1
|
|
16 atc gca |
2 |
40 |
17 |
|
100 |
17 |
80 |
7 |
300 |
29 |
60 |
6
|
|
16 gaa 235 |
2 |
60 |
9 |
4 |
150 |
16 |
120 |
16 |
400 |
18 |
90 |
8
|
|
max a |
5 |
80 |
4 |
|
200 |
15 |
160 |
3 |
500 |
18 |
120 |
8
|
|
a doubles |
1 |
100 |
0 |
|
250 |
14 |
200 |
4 |
600 |
8 |
150 |
7
|
|
spéciaux |
8 |
120 |
1 |
|
300 |
14 |
240 |
9 |
700 |
0 |
180 |
11
|
|
total aas |
27 |
140 |
0 |
|
350 |
12 |
280 |
2 |
800 |
2 |
210 |
11
|
sans |
opérons |
50 |
160 |
0 |
|
400 |
7 |
320 |
2 |
900 |
1 |
240 |
6
|
|
1 aa |
32 |
180 |
0 |
|
450 |
4 |
360 |
3 |
1000 |
0 |
270 |
9
|
|
max a |
7 |
200 |
0 |
|
500 |
4 |
400 |
0 |
1100 |
0 |
300 |
12
|
|
a doubles |
15 |
|
0 |
|
|
11 |
|
2 |
|
0 |
|
0
|
|
total aas |
94 |
|
44 |
6 |
|
130 |
|
63 |
|
126 |
|
79
|
total aas |
|
121 |
|
|
|
|
|
|
|
|
|
|
|
remarques |
|
4 |
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
33 |
32 |
|
253 |
|
142 |
|
272 |
|
172
|
|
|
|
variance |
23 |
15 |
|
258 |
|
145 |
|
162 |
|
79
|
sans jaune |
|
|
moyenne |
31 |
|
|
178 |
|
127 |
|
260 |
|
|
|
|
|
variance |
19 |
|
|
109 |
|
91 |
|
142 |
|
|
- Lien tableur: ecoN blocs
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - Protéines en vert, sont hypothétiques ou typées, gc anhydrase. Voir les noms longs.
ecoNb Escherichia coli Nissle 1917, ecoN blocs
ecoNb1 Escherichia coli Nissle 1917, ecoN blocs
gène |
interca |
pbs |
cdsa |
protéine
|
cds |
365 |
|
191 |
D-glycero
|
16s |
73 |
1520 |
|
|
gaa |
12 |
|
|
|
gca |
174 |
|
|
|
23s |
83 |
2588 |
|
|
5s |
54 |
116 |
|
|
gac |
162 |
|
|
|
cds |
|
|
268 |
gluDkgB
|
cds |
323 |
|
433 |
glutarate pm
|
5s |
83 |
116 |
|
|
23s |
184 |
4452 |
|
|
gaa |
431 |
|
|
|
16s |
441 |
1552 |
|
|
cds |
|
|
858 |
ClpB dep
|
cds |
616 |
|
530 |
AICAR2
|
16s’ |
83 |
1189 |
|
|
cds |
436 |
|
563 |
kinase isocit
|
gaa |
185 |
|
|
|
23s |
83 |
2472 |
|
|
5s |
76 |
116 |
|
|
cds |
|
|
128 |
hp-128
|
cds |
62 |
|
253 |
pu-ABC
|
5s |
39 |
116 |
|
|
acc |
14 |
|
|
|
5s |
777 |
116 |
|
|
acc |
14 |
|
|
|
5s |
1834 |
116 |
|
|
gaa |
1360 |
|
|
|
cds |
|
|
185 |
gc anhydrase
|
cds |
377 |
|
182 |
porphyrine M
|
16s |
56 |
1738 |
|
|
atc |
42 |
|
|
|
gca |
165 |
|
|
|
23s |
83 |
3291 |
|
|
5s |
104 |
116 |
|
|
cds |
|
|
176 |
Mlb pB
|
cds |
479 |
|
231 |
FadR tr
|
16s |
73 |
1528 |
|
|
gaa |
184 |
|
|
|
23s |
83 |
2611 |
|
|
5s |
53 |
116 |
|
|
gac |
8 |
|
|
|
tgg |
95 |
|
|
|
cds |
|
|
280 |
HdfR HTH
|
|
ecoNb2 Escherichia coli Nissle 1917, ecoN blocs
gène |
interca |
pbs |
cdsa |
protéine
|
cds |
374 |
|
286 |
Glu race
|
16s |
363 |
1554 |
|
|
gaa |
1112 |
|
|
|
5s |
136 |
116 |
|
|
cds |
|
|
343 |
UDP-N
|
cds |
117 |
|
69 |
tr AlpA
|
16s |
73 |
1520 |
|
|
gaa |
12 |
|
|
|
gca |
366 |
|
|
|
cds |
524 |
|
66 |
hp-66
|
cds |
|
|
71 |
hp-71
|
cds |
-2 |
|
32 |
ABC 32
|
23s |
174 |
2813 |
|
|
gca |
42 |
|
|
|
atc |
56 |
|
|
|
16s |
1063 |
1554 |
|
|
gca |
42 |
|
|
|
atc |
56 |
|
|
|
16s |
365 |
1554 |
|
|
cds |
187 |
|
191 |
D-glycero
|
cds |
|
|
213 |
ABC MetN
|
cds |
120 |
|
310 |
Tyr recb 310
|
gca |
42 |
|
|
|
atc |
56 |
|
|
|
16s’ |
1 |
1255 |
|
|
cds |
|
|
468 |
IS66
|
cds |
63 |
|
148 |
transferase
|
cds |
76 |
|
128 |
hp-128
|
5s |
83 |
116 |
|
|
23s’ |
-10 |
2447 |
|
|
cds |
|
|
41 |
pilus
|
cds |
1808 |
|
184 |
MarR
|
gaa |
588 |
|
|
|
cds |
592 |
|
42 |
sn-glycerol
|
gaa |
1472 |
|
|
|
atc |
42 |
|
|
|
atc |
1130 |
|
|
|
gaa |
1145 |
|
|
|
gaa |
185 |
|
|
|
23s |
83 |
2472 |
|
|
5s |
76 |
116 |
|
|
cds |
63 |
|
128 |
hp-128
|
cds |
|
|
148 |
transferase
|
|
|
|
|
|
|
ecoNb3 ecoN rRNAs
rRNAs pbs
|
16s
|
1189
|
1255
|
1520
|
1520
|
1528
|
1552
|
1554
|
1554
|
1554
|
1738
|
|
23s
|
2447
|
2472
|
2472
|
2588
|
2611
|
2813
|
3291
|
4452
|
|
5s
|
116 x 11
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- Remarques: ecoN opérons
- Beaucoup de blocs à rRNAs incomplets, 7 sur 12. Parmi les 5 complets 1 est semi-complet puisqu’il manque le 5s peu important. Les 5 blocs complets sont conformes au typage des gamma, avec y atcgca gaagca gaa et avec z sans gactgg gac.
- @1
- - Deux 16s aux extrémités non conformes, 16s’, adresses 4645190..4646378 et 5360884..5362138 .
- - Il n’y a pas de 16s° ou de 23s° courts, apparemment ils n’ont pas laissé de traces.
- - C’est ce qui expliquerait les 7 blocs incomplets et le nombre élevé de 32 des clusters sans rRNAs et à 1 seul tRNA.
- @2
- - Un 23s aux extrémités non comforme, 23s’, adresse 5125920..5128366 .
- - Même remarque que pour les 16s’, mais en plus je peux attribuer le grand nombre de petits cds aux remaniements qu’ont du subir ces blocs incomplets, voir ecoN blocs.
- 5128357..5128479 -10 cp 23s'
- 5341397..5341492 atcgca -2
- 5360884..5362138 16s’ 1
- @3
- - Les 5s se comportent en typage gamma même pour ceux qui sont dans un bloc incomplet. Parmi ces derniers la plupart n’ont pas de z mais dans le cluster comportant 3 5s, adresse 3785374..3785489 , on peut distinguer avec des intercalaires faibles un 5s-acc-5s et un 5s-acc, où les 5s du début appartiendraient à un bloc complet.
- @4
- - Parmi les 6 clusters sans rRNA et à 2 tRNAs tous sont doubles et 3 sont identiques même en intercalaires, les 3 gtc. Les 3 autres sont gta tac et gcc.
- - Parmi les 6 clusters sans rRNA et à 3 tRNAs 5 sont des triples dont 2 à cgt ont même 2 intercalaires identiques, adresses. Les tRNAs de ces triplets sont atgf ggc gcc et 2 fois cgt. Le 6ème cluster à 3 tRNAs n’ a pas de doubles.
- Séquences des doubles:
aas clusters doubles séquences
1 32 -
2 6 6 2 tac 2 gtc*3 2 gcc 2 gta
3 6 5 3 atgf 3 ctg*2 3 ggc 3 gcc
4 3 1 3 gta
5 0
6 1 1 5 cgt
7 2 2 5 aaa 2 gta 2 cag 2 atgj 2 caa
- Lien tableur: ecoN distribution
- Notes:
- - 3gtc2 gta2+3 2ctg3 gcc2+3 tac2 aaa3 atgf3 ggc3
- - atc: 4 16s, atc2, 1aa
- - gaa: 7 16s, 5s, 4 1aa
- - acc: 2 5s, >1aa, 1aa
- - gac: 2 5s, 1aa
- - Séquences: (aaa gta)2 aaa3
- - Adresse 5098422: ce bloc est compté dans « avec rRNA » dans cumuls. Mais ici je compte
- 1 gaa avec rRNA
- 2 gaa 1aa
- 2 atc >1aa
Gm5 ecoN, Escherichia coli Nissle 1917. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
|
tac |
3 |
tgc |
1
|
f atc |
7 |
j acc |
4 |
aac |
3 |
agc |
1
|
g ctc |
1 |
f ccc |
4 |
cac |
1 |
cgt |
5
|
h gtc |
6 |
n gcc |
1 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
5 |
taa |
|
tga |
2
|
j ata |
|
k aca |
1 |
aaa |
6 |
aga |
2
|
k cta |
1 |
g cca |
1 |
caa |
2 |
cga |
|
l gta |
7 |
o gca |
1 |
gaa |
12 |
gga |
1
|
m ttg |
1 |
d tcg |
6 |
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
7 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
|
p gcg |
1 |
gag |
|
ggg |
1
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ecoN |
64 |
34 |
|
6 |
|
17 |
121
|
- Lien tableur: ecoN eco tableaux
- Légende: eco 435, la recherche de isocitrate, voir noms longs, se trouve à l'adresse 4217109..4218413 chez eco.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - Colonne cdsa
- . en clair la longueur de la protéine en aas
- . en orange 1542, longueur des rRNAs en pbs.
- - Colonne cds, les noms courts des cds
- . en clair
- . en vert D glycero, protéine identique entre eco et ecoN, à peu près en longueur et par le nom.
- . en bleu YdiA, protéine complètement différente en nom et/ou en longueur, entre ecoN et eco
- . en turquoise hp-419, protéine identique par la longueur mais différente par le nom, entre ecoN et eco
- . en gris clair D glycero, dans le tableau E13, protéine transposée par complement (colonne sens) entre ecoN et eco alors qu'il y a transposition des intercalaires (colonne interca), 365.
- . en gris foncé ABC 32, dans le tableau E13, protéine non transposée par complement (colonne sens) entre ecoN et eco alors qu'il n'y a pas transposition des intercalaires (colonne interca), 174.
- . en vert très foncé, dans le tableau E13, Tyr recb 404,protéine existant dans ecoN mais non trouvée dans eco.
- Notes: Les dates de prélèvements des blocs de eco sont ceux de eco opérons du 10.3.19 alors que les cds de eco ont été prélevés le 19.12.19, qu'on voit dans le tableur ecoN eco tableaux. Pour ecoN la date de prélèvement est celle de ecoN opérons.
E1. Comparaison eco ecoN
E11. Clusters eco
cluster |
sens |
|
gènes |
interca |
cdsa |
cds
|
eco1 |
|
222833..223408 |
cds |
362 |
192 |
D-glycero
|
|
|
223771..225312 |
16s |
68 |
1542 |
|
|
|
225381..225457 |
atc |
42 |
|
|
|
|
225500..225575 |
gca |
183 |
|
|
|
|
225759..228662 |
23s |
93 |
2904 |
|
|
|
228756..228875 |
5s |
52 |
120 |
|
|
|
228928..229004 |
gac |
162 |
|
|
|
|
229167..229970 |
cds |
|
268 |
metDkgB
|
|
|
|
|
|
|
|
eco2 |
|
236067..236798 |
cds |
132 |
244 |
DNAIIIe
|
|
|
236931..237007 |
gac |
327 |
|
|
|
|
237335..238120 |
cds |
|
262 |
lipo YafT
|
|
|
|
|
|
|
|
eco3 |
|
261503..262756 |
cds |
114 |
418 |
glu5dH
|
|
|
262871..262946 |
acg |
203 |
|
|
|
comp |
263150..263212 |
cds |
|
21 |
YdiA
|
|
|
262898..297205 |
phage |
|
11436 |
pp CP4-6
|
|
|
|
|
|
|
|
eco4 |
comp |
563848..564480 |
cds |
242 |
211 |
put FimZ
|
|
|
564723..564799 |
aga |
15 |
|
|
|
comp |
564815..565978 |
cds |
|
388 |
put DLP12
|
|
|
564755..586056 |
phage |
|
7101 |
pp DLP12
|
|
|
|
|
|
|
|
eco5 |
|
695101..696276 |
cds |
31 |
392 |
octaprenyl
|
|
comp |
696308..696378 |
rpr |
51 |
71 |
rpt71
|
|
comp |
696430..696504 |
cag |
37 |
|
|
|
comp |
696542..696616 |
cag |
47 |
|
|
|
comp |
696664..696740 |
atg |
15 |
|
|
|
comp |
696756..696830 |
caa |
34 |
|
|
|
comp |
696865..696939 |
caa |
23 |
|
|
|
comp |
696963..697047 |
cta |
9 |
|
|
|
comp |
697057..697133 |
atg |
379 |
|
|
|
comp |
697513..699177 |
cds |
|
555 |
Asn B
|
|
|
|
|
|
|
|
eco6 |
|
779598..780389 |
cds |
164 |
264 |
cell CpoB
|
|
|
780554..780629 |
aaa |
135 |
|
|
|
|
780765..780840 |
gta |
2 |
|
|
|
|
780843..780918 |
aaa |
149 |
|
|
|
|
781068..781143 |
gta |
3 |
|
|
|
|
781147..781222 |
aaa |
146 |
|
|
|
|
781369..781444 |
aaa |
132 |
|
|
|
|
781577..781652 |
aaa |
432 |
|
|
|
|
782085..783128 |
cds |
|
348 |
quino
|
|
|
|
|
|
|
|
eco7 |
|
923264..925540 |
cds |
343 |
759 |
ATP ClpA
|
|
comp |
925884..925971 |
tcc |
253 |
|
|
|
comp |
926225..926443 |
cds |
|
73 |
tif IF-1
|
|
|
|
|
|
|
|
eco8 |
comp |
1030759..1031418 |
cds |
206 |
220 |
FtsH
|
|
comp |
1031625..1031712 |
tca |
426 |
|
|
|
|
1032139..1033257 |
cds |
|
373 |
Hnase1
|
|
|
|
|
|
|
|
eco9 |
|
|
|
|
|
|
|
|
|
*****aga***** |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco10 |
|
1095843..1096829 |
cds |
735 |
329 |
un-YcdU
|
|
comp |
1097565..1097652 |
tcc |
233 |
|
|
|
|
1097886..1098824 |
cds |
|
313 |
glyoxylate A
|
|
|
|
|
|
|
|
eco11 |
|
|
|
|
|
|
|
|
|
*****tcc***** |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco12 |
|
1286709..1286984 |
cds |
81 |
92 |
p-un-YchS
|
|
comp |
1287066..1287236 |
ncRNA |
-150 |
171 |
RttR sRNA
|
|
comp |
1287087..1287176 |
cds |
67 |
30 |
tpr
|
|
comp |
1287244..1287328 |
tac |
209 |
|
|
|
comp |
1287538..1287622 |
tac |
159 |
|
|
|
comp |
1287782..1288624 |
cds |
|
281 |
fTHF
|
|
|
|
|
|
|
|
eco13 |
|
|
|
|
|
|
|
|
***** |
gtc |
***** |
|
|
|
|
|
gtc |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco14 |
|
***** |
gtc |
***** |
|
|
|
|
|
gtc |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco15 |
comp |
1744871..1746127 |
cds |
307 |
419 |
adhes YdhQ
|
|
|
1746435..1746511 |
gtc |
4 |
|
|
|
|
1746516..1746592 |
gtc |
107 |
|
|
|
|
1746700..1747005 |
cds |
|
102 |
pu-YdhR
|
|
|
|
|
|
|
|
eco16 |
comp |
1990954..1991619 |
cds |
195 |
222 |
UPF0149 YecA
|
|
comp |
1991815..1991901 |
tta |
12 |
|
|
|
comp |
1991914..1991987 |
tgc |
54 |
|
|
|
comp |
1992042..1992117 |
ggc |
151 |
|
|
|
comp |
1992269..1992817 |
cds |
|
183 |
glycerolP
|
|
|
|
|
|
|
|
eco17 |
|
2042368..2042898 |
cds |
569 |
177 |
pu-cytochrom
|
|
comp |
2043468..2043557 |
tcg |
93 |
|
|
|
|
2043651..2044448 |
cds |
100 |
266 |
Mtf
|
|
|
2044549..2044624 |
aac |
313 |
|
|
|
|
2044938..2052014 |
cds |
|
2359 |
Inv-adhesin
|
|
|
|
|
|
|
|
eco18 |
|
2056858..2057574 |
cds |
452 |
239 |
pu-tr-YeeN
|
|
comp |
2058027..2058102 |
aac |
100 |
|
|
|
comp |
2058203..2059846 |
cds |
4 |
548 |
exporter
|
|
|
2059851..2059926 |
aac |
37 |
|
|
|
comp |
2059964..2060914 |
cds |
101 |
317 |
tact Cbl
|
|
comp |
2061016..2061933 |
cds |
326 |
306 |
tr-Nac
|
|
|
2062260..2062335 |
aac |
55 |
|
|
|
comp |
2062391..2063323 |
cds |
|
311 |
ErfK
|
|
|
|
|
|
|
|
eco19 |
|
2284376..2286136 |
cds |
74 |
587 |
pu-cardiolip
|
|
|
2286211..2286287 |
ccc |
102 |
|
|
|
comp |
2286390..2288914 |
cds |
|
842 |
adhes YejO
|
|
|
|
|
|
|
|
eco20 |
|
2465301..2466233 |
cds |
75 |
311 |
YfdC
|
|
|
2466309..2466383 |
agg |
161 |
|
|
|
|
2466545..2467702 |
cds |
|
386 |
KpLE1
|
|
|
2466369..2476583 |
phage |
|
3405 |
pp CPS-53
|
|
|
|
|
|
|
|
eco21 |
comp |
2515643..2517832 |
cds |
208 |
730 |
pu-sensor
|
|
comp |
2518041..2518116 |
gcc |
39 |
|
|
|
comp |
2518156..2518231 |
gcc |
235 |
|
|
|
|
2518467..2518811 |
cds |
|
115 |
pu- YfeC
|
|
|
|
|
|
|
|
eco22 |
comp |
2519257..2520672 |
cds |
258 |
472 |
Glu ligase
|
|
|
2520931..2521006 |
gta |
44 |
|
|
|
|
2521051..2521126 |
gta |
46 |
|
|
|
|
2521173..2521248 |
gta |
4 |
|
|
|
|
2521253..2521328 |
aaa |
210 |
|
|
|
|
2521539..2521567 |
rpr |
25 |
29 |
rpt-29
|
|
comp |
2521593..2522477 |
cds |
|
295 |
XapR
|
|
|
|
|
|
|
|
eco23 |
comp |
2724448..2725746 |
cds |
322 |
433 |
glutarate sm
|
|
comp |
2726069..2726188 |
5s |
92 |
120 |
|
|
comp |
2726281..2729184 |
23s |
184 |
2904 |
|
|
comp |
2729369..2729444 |
gaa |
171 |
|
|
|
comp |
2729616..2731157 |
16s |
442 |
1542 |
|
|
comp |
2731600..2734173 |
cds |
|
858 |
ClpB
|
|
|
|
|
|
|
|
eco24 |
comp |
2784529..2785011 |
cds |
750 |
161 |
DUF5507
|
|
comp |
2785762..2785837 |
atgi |
559 |
|
|
|
|
2786397..2788649 |
cds |
|
751 |
pu-unYgaQ
|
|
|
|
|
|
|
|
eco25 |
comp |
2816937..2817503 |
cds |
280 |
189 |
fructose
|
|
comp |
2817784..2817860 |
cgt |
198 |
|
|
|
comp |
2818059..2818135 |
cgt |
62 |
|
|
|
comp |
2818198..2818274 |
cgt |
198 |
|
|
|
comp |
2818473..2818549 |
cgt |
3 |
|
|
|
comp |
2818553..2818645 |
agc |
315 |
|
|
|
comp |
2818961..2819146 |
cds |
|
62 |
Csr
|
|
|
|
|
|
|
|
eco26 |
comp |
2946081..2947178 |
cds |
208 |
366 |
murein lytic
|
|
|
2947387..2947463 |
atgf |
33 |
|
|
|
|
2947497..2947573 |
atgf |
33 |
|
|
|
|
2947607..2947683 |
atgf |
73 |
|
|
|
comp |
2947757..2949010 |
cds |
|
418 |
Ala C
|
|
|
|
|
|
|
|
eco27 |
comp |
2998034..2998828 |
cds |
155 |
265 |
YgeQ
|
|
comp |
2998984..2999057 |
ggg |
78 |
|
|
|
comp |
2999136..2999891 |
cds |
|
252 |
pu-LysM
|
|
|
|
|
|
|
|
eco28 |
|
3109553..3110260 |
cds |
105 |
236 |
DUF554
|
|
|
3110366..3110441 |
ttc |
148 |
|
|
|
comp |
3110590..3111126 |
cds |
|
179 |
pu-ssM
|
|
|
|
|
|
|
|
eco29 |
comp |
3214967..3215473 |
cds |
124 |
169 |
G/U station
|
|
|
3215598..3215673 |
atgi |
53 |
|
|
|
comp |
3215727..3216491 |
cds |
|
255 |
ferric
|
|
|
|
|
|
|
|
eco30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco31 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco32 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
eco33 |
comp |
3317554..3318006 |
cds |
206 |
151 |
RimP
|
|
comp |
3318213..3318289 |
atgf |
347 |
|
|
|
|
3318637..3319980 |
cds |
|
448 |
Arg-suc
|
|
|
|
|
|
|
|
eco34 |
comp |
3319988..3321613 |
cds |
458 |
542 |
pu-hydrolase
|
|
comp |
3322072..3322158 |
ctc |
14 |
|
|
|
comp |
322173..3322505 |
cds |
|
111 |
SecG-t
|
|
|
|
|
|
|
|
eco35 |
|
3422436..3423194 |
cds |
228 |
253 |
pu-YhdZ
|
|
comp |
3423423..3423542 |
5s |
37 |
120 |
|
|
comp |
3423580..3423655 |
acc |
12 |
|
|
|
comp |
3423668..3423787 |
5s |
92 |
120 |
|
|
comp |
3423880..3426783 |
23s |
174 |
2904 |
|
|
comp |
3426958..3427033 |
gca |
42 |
|
|
|
comp |
3427076..3427152 |
atc |
68 |
|
|
|
comp |
3427221..3428762 |
16s |
473 |
1542 |
|
|
|
3429236..3429790 |
cds |
|
185 |
protein YrdA
|
|
|
|
|
|
|
|
eco36 |
comp |
3706098..3707705 |
cds |
567 |
536 |
dip ABC
|
|
comp |
3708273..3708306 |
rpr |
16 |
34 |
rpt-34
|
|
|
3708323..3708358 |
rpr |
257 |
36 |
rpt-36
|
|
comp |
3708616..3708692 |
ccg |
91 |
|
|
|
comp |
3708784..3710475 |
cds |
|
564 |
kdo2
|
|
|
|
|
|
|
|
eco37 |
comp |
3834547..3835929 |
cds |
292 |
461 |
pu-YicJ
|
|
|
3836222..3836316 |
tga |
108 |
|
|
|
|
3836425..3836556 |
pseudo |
396 |
132 |
p-yicT
|
|
|
3836953..3838137 |
cds |
|
395 |
pu-arabi
|
|
|
|
|
|
|
|
eco38 |
comp |
3940635..3941327 |
cds |
480 |
231 |
pu-tr YieP
|
|
|
3941808..3943349 |
16s |
85 |
1542 |
|
|
|
3943435..3943510 |
gaa |
193 |
|
|
|
|
3943704..3946607 |
23s |
92 |
2904 |
|
|
|
3946700..3946819 |
5s |
52 |
120 |
|
|
|
3946872..3946948 |
gac |
8 |
|
|
|
|
3946957..3947032 |
tgg |
95 |
|
|
|
comp |
3947128..3947967 |
cds |
|
280 |
HdfR
|
|
|
|
|
|
|
|
eco39 |
|
3980887..3982272 |
cds |
102 |
462 |
pu-YifK
|
|
|
3982375..3982451 |
cgg |
57 |
|
|
|
|
3982509..3982585 |
cac |
20 |
|
|
|
|
3982606..3982692 |
ctg |
42 |
|
|
|
|
3982735..3982811 |
cca |
146 |
|
|
|
|
3982958..3984193 |
cds |
|
412 |
pu-AslB
|
|
|
|
|
|
|
|
eco40 |
|
4034608..4035153 |
cds |
377 |
182 |
porphyrine O
|
|
|
4035531..4037072 |
16s |
68 |
1542 |
|
|
|
4037141..4037217 |
atc |
42 |
|
|
|
|
4037260..4037335 |
gca |
183 |
|
|
|
|
4037519..4040423 |
23s |
93 |
2905 |
|
|
|
4040517..4040636 |
5s |
228 |
120 |
|
|
|
4040865..4040900 |
rpr |
5 |
36 |
rpt-36
|
|
comp |
4040906..4041433 |
cds |
|
176 |
Mlb adapt
|
|
|
|
|
|
|
|
eco41 |
|
4165428..4166285 |
cds |
373 |
286 |
Glu race
|
|
|
4166659..4168200 |
16s |
171 |
1542 |
|
|
|
4168372..4168447 |
gaa |
193 |
|
|
|
|
4168641..4171544 |
23s |
92 |
2904 |
|
|
|
4171637..4171756 |
5s |
300 |
120 |
|
|
|
4172057..4173085 |
cds |
|
343 |
UDP-N
|
|
|
|
|
|
|
|
eco42 |
comp |
4174076..4175026 |
cds |
361 |
317 |
B5 kinase
|
|
|
4175388..4175463 |
aca |
8 |
|
|
|
|
4175472..4175556 |
tac |
116 |
|
|
|
|
4175673..4175747 |
gga |
6 |
|
|
|
|
4175754..4175829 |
acc |
114 |
|
|
|
|
4175944..4177128 |
cds |
229 |
395 |
tufb
|
|
|
4177358..4177741 |
cds |
|
128 |
SecE
|
|
|
|
|
|
|
|
eco43 |
comp |
4205943..4207532 |
cds |
614 |
530 |
AICAR1
|
|
|
4208147..4209688 |
16s |
85 |
1542 |
|
|
|
4209774..4209849 |
gaa |
193 |
|
|
|
|
4210043..4212946 |
23s |
93 |
2904 |
|
|
|
4213040..4213159 |
5s |
74 |
120 |
|
|
|
4213234..4213617 |
cds |
|
128 |
stress
|
|
|
|
|
|
|
|
eco44 |
comp |
4360396..4361934 |
cds |
256 |
513 |
CadC
|
|
comp |
4362191..4362353 |
pseudo |
197 |
163 |
yjdQ
|
|
comp |
4362551..4362626 |
ttc |
106 |
|
|
|
comp |
4362733..4363308 |
cds |
|
192 |
pu-tr YjdC
|
|
|
|
|
|
|
|
eco45 |
|
4391604..4392149 |
cds |
210 |
182 |
oligo-rnase
|
|
|
4392360..4392435 |
ggc |
36 |
|
|
|
|
4392472..4392547 |
ggc |
35 |
|
|
|
|
4392583..4392658 |
ggc |
233 |
|
|
|
|
4392892..4392945 |
cds |
|
18 |
un-YjeV
|
|
|
|
|
|
|
|
eco46 |
comp |
4495190..4496209 |
cds |
195 |
340 |
NADPH- Ah
|
|
|
4496405..4496489 |
ttg |
260 |
|
|
|
|
4496750..4497940 |
cds |
|
397 |
pu-KpLE2
|
|
|
4496675..4497940 |
phage |
|
422 |
pp PR-Y
|
|
|
|
|
|
|
|
eco47 |
|
4605804..4606040 |
cds |
38 |
79 |
protein YjjZ
|
|
comp |
4606079..4606165 |
ctg |
34 |
|
|
|
comp |
4606200..4606286 |
ctg |
28 |
|
|
|
comp |
4606315..4606401 |
ctg |
157 |
|
|
|
|
4606559..4606594 |
rpr |
22 |
36 |
rpt 36
|
|
comp |
4606617..4606650 |
rpr |
18 |
34 |
rpt 34
|
|
comp |
4606669..4607700 |
cds |
|
344 |
G1207
|
|
E12. Clusters ecoN alignés sur les clusters de eco
cluster |
sens |
|
gènes |
interca |
cdsa |
cds
|
ecoN1 |
|
231864..232436 |
CDS |
365 |
191 |
D-glycero
|
|
|
232802..234321 |
16s |
73 |
1520 |
|
|
|
234395..234471 |
gaa |
12 |
|
|
|
|
234484..234557 |
gca |
174 |
|
|
|
|
234732..237319 |
23s |
83 |
2588 |
|
|
|
237403..237518 |
5s |
54 |
116 |
|
|
|
237573..237649 |
gac |
162 |
|
|
|
|
237812..238615 |
CDS |
|
268 |
gluDkgB
|
|
|
|
|
|
|
|
ecoN2 |
|
244934..245665 |
CDS |
132 |
244 |
DNAIIIe
|
|
|
245798..245874 |
gac |
120 |
|
|
|
comp |
245995..246852 |
CDS |
|
286 |
DUF4942
|
|
|
|
|
|
|
|
ecoN3 |
|
367329..368582 |
CDS |
114 |
418 |
glu5dH
|
|
|
368697..368772 |
acg |
154 |
|
|
|
|
368927..369265 |
CDS |
|
113 |
DUF4102
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN4 |
comp |
631149..632015 |
CDS |
270 |
289 |
cyclo FolD
|
|
|
632286..632362 |
aga |
15 |
|
|
|
comp |
632378..632997 |
CDS |
|
207 |
Tyr recb 207
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN5 |
|
733188..734363 |
CDS |
153 |
392 |
octaprenyl
|
|
comp |
734517..734591 |
cag |
37 |
|
|
|
comp |
734629..734703 |
cag |
48 |
|
|
|
comp |
734752..734828 |
atgj |
15 |
|
|
|
comp |
734844..734918 |
caa |
34 |
|
|
|
comp |
734953..735027 |
caa |
23 |
|
|
|
comp |
735051..735135 |
cta |
10 |
|
|
|
comp |
735146..735222 |
atgj |
380 |
|
|
|
comp |
735603..737267 |
CDS |
|
555 |
Asn B
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN6 |
|
807377..808169 |
CDS |
164 |
264 |
p-cell CpoB
|
|
|
808334..808409 |
aaa |
35 |
|
|
|
|
808445..808520 |
gta |
2 |
|
|
|
|
808523..808598 |
aaa |
51 |
|
|
|
|
808650..808725 |
gta |
3 |
|
|
|
|
808729..808804 |
aaa |
48 |
|
|
|
|
808853..808928 |
aaa |
33 |
|
|
|
|
808962..809037 |
aaa |
277 |
|
|
|
|
809315..810358 |
CDS |
|
348 |
quino NadA
|
|
|
|
|
|
|
|
ecoN7 |
|
950069..952345 |
CDS |
343 |
759 |
ATP ClpA
|
|
comp |
952689..952776 |
tcc |
253 |
|
|
|
comp |
953030..953248 |
CDS |
|
73 |
tif IF-1
|
|
|
|
|
|
|
|
ecoN8 |
comp |
1047224..1047883 |
CDS |
206 |
220 |
FtsH YccA
|
|
comp |
1048090..1048177 |
tca |
426 |
|
|
|
|
1048604..1049722 |
CDS |
|
373 |
Hnase1
|
|
|
|
|
|
|
|
ecoN9 |
|
1183656..1184018 |
CDS |
463 |
121 |
hp-121
|
|
|
1184482..1184558 |
aga |
278 |
|
|
|
> comp |
1184837..1185786 |
CDS |
|
317 |
p-IS4
|
|
|
|
|
|
|
|
ecoN10 |
|
1213982..1214809 |
CDS |
165 |
276 |
DUF4942
|
|
comp |
1214975..1215062 |
tcc |
233 |
|
|
|
|
1215296..1216234 |
CDS |
|
313 |
glyoxyl GhrA
|
|
|
|
|
|
|
|
ecoN11 |
|
1216817..1217098 |
CDS |
165 |
94 |
DUF4942
|
|
comp |
1217264..1217351 |
tcc |
234 |
|
|
|
|
1217586..1218524 |
CDS |
|
313 |
glyoxyl GhrA
|
|
|
|
|
|
|
|
ecoN12 |
|
1457038..1458129 |
CDS |
16 |
364 |
acyl-CoA
|
|
comp |
1458146..1458277 |
ncRNA |
46 |
44 |
RtT sRNA
|
|
comp |
1458324..1458408 |
tac |
33 |
|
|
|
comp |
1458442..1458526 |
tac |
159 |
|
|
|
comp |
1458686..1459528 |
CDS |
|
281 |
fTHF
|
|
|
|
|
|
|
|
ecoN13 |
comp |
1829066..1830322 |
CDS |
307 |
419 |
hp-419
|
|
|
1830630..1830706 |
gtc |
4 |
|
|
|
|
1830711..1830787 |
gtc |
6 |
|
|
|
< |
1830794..1831177 |
CDS |
|
128 |
p-MdtK
|
|
|
|
|
|
|
|
ecoN14 |
comp |
1831218..1832474 |
CDS |
307 |
419 |
hp-419
|
|
|
1832782..1832858 |
gtc |
4 |
|
|
|
|
1832863..1832939 |
gtc |
8 |
|
|
|
< |
1832948..1833280 |
CDS |
|
111 |
p-MATE
|
|
|
|
|
|
|
|
ecoN15 |
comp |
1833321..1834577 |
CDS |
307 |
419 |
hp-419
|
|
|
1834885..1834961 |
gtc |
4 |
|
|
|
|
1834966..1835042 |
gtc |
108 |
|
|
|
|
1835151..1835456 |
CDS |
|
102 |
mono-O2
|
|
|
|
|
|
|
|
ecoN16 |
comp |
2115794..2116459 |
CDS |
195 |
222 |
UPF0149 YecA
|
|
comp |
2116655..2116741 |
tta |
12 |
|
|
|
comp |
2116754..2116827 |
tgc |
53 |
|
|
|
comp |
2116881..2116956 |
ggc |
151 |
|
|
|
comp |
2117108..2117656 |
CDS |
|
183 |
CDP-diacyl
|
|
|
|
|
|
|
|
ecoN17 |
comp |
2191451..2192287 |
CDS |
278 |
279 |
hp-279
|
|
comp |
2192566..2192655 |
tcg |
93 |
|
|
|
|
2192749..2193546 |
CDS |
100 |
266 |
MtfA
|
|
|
2193647..2193722 |
aac |
161 |
|
|
|
|
2193884..2195146 |
CDS |
|
421 |
Tyr recb-421
|
|
|
|
|
|
|
|
ecoN18 |
|
2232607..2233323 |
CDS |
453 |
239 |
tr-YebC
|
|
comp |
2233777..2233852 |
acc |
326 |
|
|
|
|
2234179..2235096 |
CDS |
101 |
306 |
tr-nitrogen
|
|
|
2235198..2236148 |
CDS |
37 |
317 |
tr-Cbl
|
|
comp |
2236186..2236261 |
aac |
4 |
|
|
|
|
2236266..2237909 |
CDS |
100 |
548 |
trp-YeeO
|
|
|
2238010..2238085 |
aac |
161 |
|
|
|
|
2238247..2239518 |
CDS |
|
424 |
Tyr recb 424
|
|
|
|
|
|
|
|
ecoN19 |
|
2546968..2548728 |
CDS |
74 |
587 |
cardiolipine
|
|
|
2548803..2548879 |
ccc |
101 |
|
|
|
comp |
2548981..2549136 |
CDS |
|
52 |
barrel
|
|
|
|
|
|
|
|
ecoN20 |
|
2717780..2718712 |
CDS |
75 |
311 |
nitrite
|
|
|
2718788..2718862 |
agg |
437 |
|
|
|
comp |
2719300..2719830 |
CDS |
|
177 |
OmpH
|
|
|
|
|
|
|
|
ecoN21 |
comp |
2768744..2770933 |
CDS |
206 |
730 |
sensor
|
|
comp |
2771140..2771215 |
gcc |
39 |
|
|
|
comp |
2771255..2771330 |
gcc |
220 |
|
|
|
|
2771551..2771910 |
CDS |
|
120 |
pu-tr 120
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN22 |
comp |
2772355..2773770 |
CDS |
258 |
472 |
Glu ligase
|
|
|
2774029..2774104 |
gta |
43 |
|
|
|
|
2774148..2774223 |
gta |
46 |
|
|
|
|
2774270..2774345 |
gta |
4 |
|
|
|
|
2774350..2774425 |
aaa |
110 |
|
|
|
comp |
2774536..2775420 |
CDS |
|
295 |
LysR
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN23 |
comp |
2959205..2960503 |
CDS |
323 |
433 |
glutarate pm
|
|
comp |
2960827..2960942 |
5s |
83 |
116 |
|
|
comp |
2961026..2965477 |
23s |
184 |
4452 |
|
|
comp |
2965662..2965737 |
gaa |
431 |
|
|
|
comp |
2966169..2967720 |
16s |
441 |
1552 |
|
|
comp |
2968162..2970735 |
CDS |
|
858 |
ClpB dep
|
|
|
|
|
|
|
|
ecoN24 |
|
|
|
|
|
|
|
|
|
****atgi***** |
|
|
|
ecoN25 |
|
|
|
|
|
|
|
comp |
3027207..3027773 |
CDS |
280 |
189 |
fructose 6
|
|
comp |
3028054..3028130 |
cgt |
63 |
|
|
|
comp |
3028194..3028270 |
cgt |
62 |
|
|
|
comp |
3028333..3028409 |
cgt |
62 |
|
|
|
comp |
3028472..3028548 |
cgt |
64 |
|
|
|
comp |
3028613..3028689 |
cgt |
3 |
|
|
|
comp |
3028693..3028785 |
agc |
315 |
|
|
|
comp |
3029101..3029286 |
CDS |
|
62 |
CsrA
|
|
|
|
|
|
|
|
ecoN26 |
comp |
3157337..3158434 |
CDS |
208 |
366 |
murein
|
|
|
3158643..3158719 |
atgf |
33 |
|
|
|
|
3158753..3158829 |
atgf |
33 |
|
|
|
|
3158863..3158939 |
atgf |
635 |
|
|
|
|
3159575..3160075 |
CDS |
|
167 |
sscs VI
|
|
|
|
|
|
|
|
ecoN27 |
|
3230172..3231401 |
CDS |
316 |
410 |
HAAAP
|
|
comp |
3231718..3231791 |
ggg |
78 |
|
|
|
comp |
3231870..3232625 |
CDS |
|
252 |
glycan DD
|
|
|
|
|
|
|
|
ecoN28 |
|
3341048..3341755 |
CDS |
105 |
236 |
DUF554
|
|
|
3341861..3341936 |
ttc |
197 |
|
|
|
|
3342134..3343399 |
CDS |
|
422 |
arm-type
|
|
|
|
|
|
|
|
ecoN29 |
comp |
3569308..3569814 |
CDS |
124 |
169 |
G/U
|
|
|
3569939..3570014 |
atgi |
53 |
|
|
|
comp |
3570068..3570832 |
CDS |
|
255 |
ferric
|
|
|
|
|
|
|
|
ecoN30 |
comp |
3670227..3670679 |
CDS |
206 |
151 |
RimP
|
|
comp |
3670886..3670962 |
atgf |
347 |
|
|
|
> |
3671310..3672155 |
CDS |
|
282 |
p-Arg-sc 282
|
|
|
|
|
|
|
|
ecoN31 |
comp |
3673935..3674387 |
CDS |
206 |
151 |
RimP
|
|
comp |
3674594..3674670 |
atgf |
347 |
|
|
|
> |
3675018..3675869 |
CDS |
|
284 |
p-Arg-sc 284
|
|
|
|
|
|
|
|
ecoN32 |
comp |
3677794..3678246 |
CDS |
206 |
151 |
RimP
|
|
comp |
3678453..3678529 |
atgf |
347 |
|
|
|
> |
3678877..3679722 |
CDS |
|
282 |
p-Arg-sc 282
|
|
|
|
|
|
|
|
ecoN33 |
comp |
3681532..3681984 |
CDS |
206 |
151 |
RimP
|
|
comp |
3682191..3682267 |
atgf |
347 |
|
|
|
|
3682615..3683958 |
CDS |
|
448 |
Arg-suc
|
|
|
|
|
|
|
|
ecoN34 |
comp |
3683966..3685591 |
CDS |
456 |
542 |
Pet
|
|
comp |
3686048..3686134 |
ctc |
14 |
|
|
|
comp |
3686149..3686481 |
CDS |
|
111 |
SecG-p
|
|
|
|
|
|
|
|
ecoN35 |
|
3784553..3785311 |
CDS |
62 |
253 |
pu-ABC
|
|
comp |
3785374..3785489 |
5s |
39 |
116 |
|
|
comp |
3785529..3785605 |
acc |
14 |
|
|
|
comp |
3785620..3785735 |
5s |
777 |
116 |
|
|
comp |
3786513..3786588 |
acc |
14 |
|
|
|
comp |
3786603..3786718 |
5s |
1834 |
116 |
|
|
comp |
3788553..3788628 |
gaa |
1360 |
|
|
|
|
3789989..3790543 |
CDS |
|
185 |
gc anhydrase
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN36 |
comp |
4078635..4080242 |
CDS |
743 |
536 |
DppA
|
|
comp |
4080986..4081062 |
ccg |
91 |
|
|
|
comp |
4081154..4082845 |
CDS |
|
564 |
kdo2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN37 |
comp |
4205966..4207348 |
CDS |
292 |
461 |
glycoside-p5
|
|
|
4207641..4207735 |
tga |
300 |
|
|
|
> |
4208036..4208857 |
CDS |
|
274 |
p-DUF4102
|
|
|
|
|
|
|
|
ecoN38 |
comp |
4338643..4339335 |
CDS |
479 |
231 |
FadR tr
|
|
|
4339815..4341342 |
16s |
73 |
1528 |
|
|
|
4341416..4341491 |
gaa |
184 |
|
|
|
|
4341676..4344286 |
23s |
83 |
2611 |
|
|
|
4344370..4344485 |
5s |
53 |
116 |
|
|
|
4344539..4344615 |
gac |
8 |
|
|
|
|
4344624..4344699 |
tgg |
95 |
|
|
|
comp |
4344795..4345634 |
CDS |
|
280 |
HdfR HTH
|
|
|
|
|
|
|
|
ecoN39 |
|
4377681..4379066 |
CDS |
102 |
462 |
aa permease
|
|
|
4379169..4379245 |
cgg |
58 |
|
|
|
|
4379304..4379379 |
cac |
20 |
|
|
|
|
4379400..4379486 |
ctg |
42 |
|
|
|
|
4379529..4379605 |
cca |
146 |
|
|
|
|
4379752..4380987 |
CDS |
|
412 |
ans maturase
|
|
|
|
|
|
|
|
ecoN40 |
|
4460971..4461516 |
CDS |
377 |
182 |
porphyrine M
|
|
|
4461894..4463631 |
16s |
56 |
1738 |
|
|
|
4463688..4463764 |
atc |
42 |
|
|
|
|
4463807..4463882 |
gca |
165 |
|
|
|
|
4464048..4467338 |
23s |
83 |
3291 |
|
|
|
4467422..4467537 |
5s |
104 |
116 |
|
|
comp |
4467642..4468169 |
CDS |
|
176 |
Mlb pB
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN41 |
|
4605577..4606434 |
CDS |
374 |
286 |
Glu race
|
|
|
4606809..4608362 |
16s |
363 |
1554 |
|
|
|
4608726..4608801 |
gaa |
1112 |
|
|
|
|
4609914..4610029 |
5s |
136 |
116 |
|
|
|
4610166..4611194 |
CDS |
|
343 |
UDP-N
|
|
|
|
|
|
|
|
ecoN42 |
comp |
4612185..4613135 |
CDS |
361 |
317 |
B5 kinase I
|
|
|
4613497..4613572 |
aca |
8 |
|
|
|
|
4613581..4613665 |
tac |
116 |
|
|
|
|
4613782..4613856 |
gga |
6 |
|
|
|
|
4613863..4613938 |
acc |
114 |
|
|
|
|
4614053..4615237 |
CDS |
|
395 |
tuf
|
|
|
|
|
|
|
|
ecoN43 |
comp |
4642984..4644573 |
CDS |
616 |
530 |
AICAR2
|
|
|
4645190..4646378 |
16s’ |
83 |
1189 |
|
|
|
4646462..4648150 |
CDS |
436 |
563 |
kinase isocit
|
|
|
4648587..4648662 |
gaa |
185 |
|
|
|
|
4648848..4651319 |
23s |
83 |
2472 |
|
|
|
4651403..4651518 |
5s |
76 |
116 |
|
|
|
4651595..4651978 |
CDS |
|
128 |
hp-128
|
|
|
|
|
|
|
|
ecoN44 |
|
|
|
|
|
|
|
< comp |
4834504..4834961 |
CDS |
197 |
153 |
pu-integrase
|
|
comp |
4835159..4835234 |
ttc |
106 |
|
|
|
comp |
4835341..4835916 |
CDS |
|
192 |
tr 192
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN45 |
|
4864628..4865173 |
CDS |
210 |
182 |
oligo-rnase
|
|
|
4865384..4865459 |
ggc |
36 |
|
|
|
|
4865496..4865571 |
ggc |
35 |
|
|
|
|
4865607..4865682 |
ggc |
233 |
|
|
|
|
4865916..4865969 |
CDS |
|
18 |
hp-18
|
|
|
|
|
|
|
|
ecoN46 |
comp |
4974178..4975197 |
CDS |
195 |
340 |
NADPH- Ahr
|
|
|
4975393..4975477 |
ttg |
39 |
|
|
|
<> comp |
4975517..4976055 |
CDS |
|
180 |
p-IS630
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN47 |
|
5042527..5042763 |
CDS |
38 |
79 |
DUF1435
|
|
comp |
5042802..5042888 |
ctg |
34 |
|
|
|
comp |
5042923..5043009 |
ctg |
28 |
|
|
|
comp |
5043038..5043124 |
ctg |
290 |
|
|
|
comp |
5043415..5044446 |
CDS |
|
344 |
G1207 RsmC
|
|
E13. Clusters ecoN au-delà de eco
ecoN suite |
sens |
|
gènes |
interca |
cdsa |
cds
|
EcoN 48 |
comp |
5079375..5079581 |
CDS |
117 |
69 |
tr AlpA
|
ok |
|
5079699..5081218 |
16s |
73 |
1520 |
|
|
|
5081292..5081368 |
gaa |
12 |
|
|
|
|
5081381..5081454 |
gca |
366 |
|
|
|
|
5081821..5082018 |
CDS |
524 |
66 |
hp-66
|
|
comp |
5082543..5082754 |
CDS |
|
71 |
hp-71
|
|
|
|
|
|
|
|
eco1 |
|
222833..223408 |
cds |
362 |
192 |
D-glycero
|
|
|
223771..225312 |
16s |
68 |
1542 |
|
|
|
225381..225457 |
atc |
42 |
|
|
|
|
225500..225575 |
gca |
183 |
|
|
|
|
225759..228662 |
23s |
93 |
2904 |
|
|
|
228756..228875 |
5s |
52 |
120 |
|
|
|
228928..229004 |
gac |
162 |
|
|
|
|
229167..229970 |
cds |
|
268 |
metDkgB
|
EcoN 56 |
comp > |
5341397..5341492 |
CDS |
-2 |
32 |
ABC 32
|
ok |
comp |
5341491..5344303 |
23s |
174 |
2813 |
|
|
comp |
5344478..5344553 |
gca |
42 |
|
|
|
comp |
5344596..5344672 |
atc |
56 |
|
|
|
comp |
5344729..5346282 |
16s |
1063 |
1554 |
|
|
comp |
5347346..5347421 |
gca |
42 |
|
|
|
comp |
5347464..5347540 |
atc |
56 |
|
|
|
comp |
5347597..5349150 |
16s |
365 |
1554 |
|
|
comp |
5349516..5350088 |
CDS |
187 |
191 |
D-glycero
|
|
> |
5350276..5350914 |
CDS |
|
213 |
ABC MetN
|
eco35 |
eco |
3422436..3423194 |
cds |
228 |
253 |
pu-YhdZ
|
|
comp |
3423423..3423542 |
5s |
37 |
120 |
|
|
comp |
3423580..3423655 |
acc |
12 |
|
|
|
comp |
3423668..3423787 |
5s |
92 |
120 |
|
|
comp |
3423880..3426783 |
23s |
174 |
2904 |
|
|
comp |
3426958..3427033 |
gca |
42 |
|
|
|
comp |
3427076..3427152 |
atc |
68 |
|
|
|
comp |
3427221..3428762 |
16s |
473 |
1542 |
|
|
|
3429236..3429790 |
cds |
|
185 |
protein YrdA
|
ecoN35 |
|
3784553..3785311 |
CDS |
62 |
253 |
pu-ABC
|
|
comp |
3785374..3785489 |
5s |
39 |
116 |
|
|
comp |
3785529..3785605 |
acc |
14 |
|
|
|
comp |
3785620..3785735 |
5s |
777 |
116 |
|
|
comp |
3786513..3786588 |
acc |
14 |
|
|
|
comp |
3786603..3786718 |
5s |
1834 |
116 |
|
|
comp |
3788553..3788628 |
gaa |
1360 |
|
|
|
|
3789989..3790543 |
CDS |
|
185 |
gc anhydrase
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
EcoN 59 |
> |
5433568..5433687 |
CDS |
39 |
40 |
p-Nam
|
ok |
comp |
5433727..5433814 |
tcc |
253 |
|
|
|
comp |
5434068..5434286 |
CDS |
|
73 |
tif IF-1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN |
|
|
|
|
|
EcoN 53 |
comp |
5321144..5321869 |
CDS |
206 |
242 |
p-His kinase
|
ok |
comp |
5322076..5322151 |
gcc |
39 |
|
|
|
comp |
5322191..5322266 |
gcc |
39 |
|
|
|
comp |
5322306..5322381 |
gcc |
220 |
|
|
|
|
5322602..5322961 |
CDS |
|
120 |
pu-tr 120
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ecoN |
|
|
|
|
|
EcoN 54 |
comp |
5323406..5324821 |
CDS |
258 |
472 |
Glu ligase
|
ok |
|
5325080..5325155 |
gta |
44 |
|
|
|
|
5325200..5325275 |
gta |
0 |
|
|
|
< |
5325276..5325389 |
CDS |
|
38 |
p-pu-tr 38
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
EcoN 51 |
comp |
5252659..5253870 |
CDS |
300 |
404 |
Tyr recb 404
|
ok |
comp |
5254171..5254249 |
tga |
292 |
|
|
|
> |
5254542..5255171 |
CDS |
|
210 |
p-glycoside
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
EcoN 52 |
> comp |
5305902..5306228 |
CDS |
0 |
109 |
p-hp
|
|
comp |
5306229..5306302 |
atc |
1096 |
|
|
ecoN ? |
|
5307399..5308450 |
CDS |
|
351 |
p-Ada
|
|
|
|
|
|
|
|
EcoN 57 |
> comp |
5359583..5360512 |
CDS |
120 |
310 |
Tyr recb 310
|
|
comp |
5360633..5360708 |
gca |
42 |
|
|
ecoN40 |
comp |
5360751..5360827 |
atc |
56 |
|
|
|
comp |
5360884..5362138 |
16s’ |
1 |
1255 |
|
|
< comp |
5362140..5363543 |
CDS |
|
468 |
IS66
|
|
|
|
|
|
|
|
EcoN 55 |
> |
5375524..5376270 |
CDS |
891 |
249 |
p-AI-2E
|
|
|
5377162..5377237 |
gaa |
1047 |
|
eco 435
|
ecoN ? |
comp |
5378285..5379589 |
CDS |
|
435 |
isocitrate
|
|
|
|
|
|
|
|
EcoN 49 |
comp |
5090325..5090876 |
CDS |
1808 |
184 |
MarR
|
|
comp |
5092685..5092760 |
gaa |
588 |
|
|
ecoN ? |
< comp |
5093349..5093474 |
CDS |
592 |
42 |
sn-glycerol
|
|
|
5094067..5094142 |
gaa |
1472 |
|
|
|
|
5095615..5095691 |
atc |
42 |
|
|
|
|
5095734..5095809 |
atc |
1130 |
|
|
|
|
5096940..5097015 |
gaa |
1145 |
|
|
ok ecoN43 |
|
5098161..5098236 |
gaa |
185 |
|
|
|
|
5098422..5100893 |
23s |
83 |
2472 |
|
|
|
5100977..5101092 |
5s |
76 |
116 |
|
|
|
5101169..5101552 |
CDS |
63 |
128 |
hp-128
|
|
comp |
5101616..5102059 |
CDS |
|
148 |
transferase
|
|
|
|
|
|
|
|
EcoN 50 |
|
5124754..5125197 |
CDS |
63 |
148 |
transferase
|
|
comp |
5125261..5125644 |
CDS |
76 |
128 |
hp-128
|
ecoN40 |
comp |
5125721..5125836 |
5s |
83 |
116 |
|
|
comp |
5125920..5128366 |
23s’ |
-10 |
2447 |
|
|
< |
5128357..5128479 |
CDS |
|
41 |
pilus
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
EcoN 58 |
|
5425965..5426201 |
CDS |
38 |
79 |
DUF1435
|
ok |
comp |
5426240..5426325 |
ctg |
26 |
|
|
|
comp |
5426352..5426438 |
ctg |
28 |
|
|
|
comp |
5426467..5426553 |
ctg |
63 |
|
|
|
< comp |
5426617..5427150 |
CDS |
|
178 |
p-IS630
|
|
ecoN eco. Liste des noms longs et courts, et des fonctions
fonction |
Noms courts |
Noms longs
|
tr-regulator |
XapR |
DNA-binding transcriptional activator XapR
|
permease |
aa permease |
amino acid permease
|
ABC bind |
ABC 32 |
ABC transporter ATP-binding protein
|
ABC bind |
ABC MetN |
methionine ABC transporter ATP-binding protein MetN
|
desaturase |
acyl-CoA |
acyl-CoA desaturase
|
adhesin |
adhes YdhQ |
adhesin-like autotransporter YdhQ
|
adhesin |
adhes YejO |
adhesin-like autotransporter YejO, gene fragment 2 of yejO, misc_feature
|
hydrolase |
AICAR1 |
bifunctional AICAR transformylase/IMP cyclohydrolase
|
hydrolase |
AICAR2 |
bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
|
amidase |
Ala C |
N-acetylmuramoyl-L-alanine amidase C
|
maturase |
ans maturase |
anaerobic sulfatase maturase
|
synthetase |
Arg-suc |
argininosuccinate synthetase
|
integrase |
arm-type |
integrase arm-type DNA-binding domain-containing protein
|
synthetase |
Asn B |
asparagine synthetase B
|
protease b |
ATP ClpA |
ATP-dependent Clp protease ATP-binding subunit ClpA
|
kinase |
B5 kinase |
pantothenate kinase
|
kinase |
B5 kinase I |
type I pantothenate kinase
|
transporter |
barrel |
autotransporter outer membrane beta-barrel domain-containing protein
|
tr-regulator |
CadC |
DNA-binding transcriptional activator CadC
|
cardiolipin |
cardiolipine |
cardiolipin transport protein PbgA
|
transferase |
CDP-diacyl |
CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase
|
division |
cell CpoB |
cell division coordinator CpoB
|
chaperone |
ClpB |
ClpB chaperone
|
chaperone |
ClpB dep |
ATP-dependent chaperone ClpB
|
storage |
Csr |
carbon storage regulator
|
storage |
CsrA |
carbon storage regulator CsrA
|
hydrolase |
cyclo FolD |
bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD
|
phosphatase |
D-glycero |
D-glycero-beta-D-manno-heptose-1,7-bisphosphate 7-phosphatase
|
ABC bind |
dip ABC |
dipeptide ABC transporter periplasmic binding protein
|
polymerase |
DNAIIIe |
DNA polymerase III subunit epsilon
|
ABC bind |
DppA |
dipeptide ABC transporter substrate-binding protein DppA
|
DUF |
DUF1435 |
DUF1435 domain-containing protein
|
DUF |
DUF4102 |
DUF4102 domain-containing protein
|
DUF |
DUF4942 |
DUF4942 domain-containing protein
|
DUF |
DUF5507 |
DUF5507 domain-containing protein YpjC
|
DUF |
DUF554 |
DUF554 domain-containing protein
|
DUF |
DUF554 Yqg |
DUF554 domain-containing protein YqgA
|
peptidase |
ErfK |
L,D-transpeptidase ErfK
|
exporter |
exporter |
FMN/FAD exporter
|
tr-regulator |
FadR tr |
FadR family transcriptional regulator
|
reductase |
ferric |
NADPH-dependent ferric chelate reductase
|
phosphatase |
fructose |
fructose-1-phosphatase
|
phosphatase |
fructose 6 |
fructose-1-phosphate/6-phosphogluconate phosphatase
|
deformylase |
fTHF |
formyltetrahydrofolate deformylase
|
protase |
FtsH |
modulator of FtsH protease
|
protease |
FtsH YccA |
FtsH protease modulator YccA
|
glycosylase |
G/U |
G/U mismatch-specific DNA glycosylase
|
glycosylase |
G/U station |
stationary phase mismatch/uracil DNA glycosylase
|
transferase |
G1207 |
16S rRNA m(2)G1207 methyltransferase
|
transferase |
G1207 RsmC |
16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC
|
anhydrase |
gc anhydrase |
gamma carbonic anhydrase family protein
|
ligase |
Glu ligase |
glutamate--tRNA ligase
|
racemase |
Glu race |
glutamate racemase
|
dehydrogenase |
glu5dH |
glutamate-5-semialdehyde dehydrogenase
|
reductase |
gluDkgB |
2,5-didehydrogluconate reductase DkgB
|
permease |
glutarate pm |
alpha-ketoglutarate permease
|
symporter |
glutarate sm |
alpha-ketoglutarate:H(+) symporter
|
peptidase |
glycan DD |
peptidoglycan DD-metalloendopeptidase family protein
|
synthetase |
glycerolP |
phosphatidylglycerophosphate synthase
|
transporter |
glycoside-p5 |
glycoside-pentoside-hexuronide family transporter
|
reductase |
glyoxyl A |
glyoxylate/hydroxypyruvate reductase A
|
reductase |
glyoxyl GhrA |
glyoxylate/hydroxypyruvate reductase GhrA
|
permease |
HAAAP |
HAAAP family serine/threonine permease
|
tr-regulator |
HdfR |
DNA-binding transcriptional dual regulator HdfR
|
tr-regulator |
HdfR HTH |
HTH-type transcriptional regulator HdfR
|
hydrogenase |
Hnase1 |
hydrogenase 1 small subunit
|
hp |
hp-121 |
hp-121
|
hp |
hp-128 |
hypothetical protein
|
hp |
hp-18 |
hp-18
|
adhesin |
Inv-adhesin |
inverse autotransporter adhesin
|
transposase |
IS66 |
IS66 family transposase
|
lyase |
isocitrate |
isocitrate lyase
|
transferase |
kdo2 |
kdo(2)-lipid A phosphoethanolamine 7-transferase
|
kinase/Pase |
kinase isocit |
bifunctional isocitrate dehydrogenase kinase/phosphatase
|
prophage |
KpLE1 |
CPS-53 (KpLE1) prophage; prophage CPS-53 integrase
|
lipoprotein |
lipo YafT |
lipoprotein YafT
|
tr-regulator |
LysR |
LysR family transcriptional regulator
|
tr-regulator |
MarR |
MarR family transcriptional regulator
|
reductase |
metDkgB |
methylglyoxal reductase DkgB
|
GDP |
Mlb adapt |
molybdopterin-guanine dinucleotide biosynthesis adaptor protein
|
GDP |
Mlb pB |
molybdopterin-guanine dinucleotide biosynthesis protein B
|
oxygenase |
mono-O2 |
monooxygenase
|
titration |
Mtf |
Mlc titration factor
|
tr-regulator |
MtfA |
DgsA anti-repressor MtfA
|
glycosylase |
murein |
murein transglycosylase A
|
glycosylase |
murein lytic |
membrane-bound lytic murein transglycosylase A
|
reductase |
NADPH- Ah |
aldehyde reductase, NADPH-dependent
|
reductase |
NADPH- Ahr |
NADPH-dependent aldehyde reductase Ahr
|
transporter |
nitrite |
formate/nitrite transporter family protein
|
hydroxylase |
octaprenyl |
2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase
|
rnase |
oligo-rnase |
oligoribonuclease
|
protein |
OmpH |
OmpH family outer membrane protein
|
transferase |
p-Ada |
pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada
|
transporter |
p-AI-2E |
pseudo, AI-2E family transporter
|
synthetase |
p-Arg-sc 282 |
Pseudo, argininosuccinate synthase
|
synthetase |
p-Arg-sc 284 |
Pseudo, argininosuccinate synthase
|
division |
p-cell CpoB |
Pseudo, cell division protein CpoB
|
DUF |
p-DUF4102 |
Pseudo, DUF4102 domain-containing protein
|
transporter |
p-glycoside |
pseudo, glycoside-pentoside-hexuronide family transporter
|
kinase |
p-His kinase |
pseudo, histidine kinase
|
hp |
p-hp |
pseudo, hp 109
|
integrase |
p-integrase |
pseudo, integrase
|
transposase |
p-IS4 |
Pseudo, IS4 family transposase
|
transposase |
p-IS630 |
pseudo, IS630 family transposase
|
transporter |
p-MATE |
Pseudo, MATE family efflux transporter
|
transporter |
p-MdtK |
Pseudo, multidrug efflux MATE transporter MdtK
|
amidase |
p-Nam |
pseudo, nicotinamide-nucleotide amidase
|
tr-regulator |
p-pu-tr 38 |
pseudo, putative DNA-binding transcriptional regulator
|
protein |
p-un-YchS |
putative uncharacterized protein YchS
|
gene |
p-yicT |
p-yicT
|
transferase |
Pet |
phosphoethanolamine transferase
|
protein |
pilus |
pilus assembly protein
|
dehydrogenase |
porphyrine M |
menaquinone-dependent protoporphyrinogen IX dehydrogenase
|
oxidase |
porphyrine O |
protoporphyrinogen oxidase
|
prophage |
pp CP4-6 |
note="cryptic prophage CP4-6" misc_feature
|
prophage |
pp CPS-53 |
cryptic prophage CPS-53, misc_feature
|
prophage |
pp DLP12 |
note="cryptic prophage DLP12" misc_feature
|
prophage |
pp PR-Y |
cryptic prophage PR-Y
|
protein |
protein YjjZ |
protein YjjZ
|
protein |
protein YrdA |
protein YrdA
|
tr-regulator |
pu- YfeC |
putative DNA-binding transcriptional regulator YfeC
|
ABC bind |
pu-ABC |
amino acid ABC transporter ATP-binding protein
|
exporter |
pu-arabi |
putative arabinose exporter
|
sulfatase |
pu-AslB |
putative anaerobic sulfatase maturation enzyme AslB
|
cardiolipin |
pu-cardiolip |
putative cardiolipin transport protein
|
cytochrome |
pu-cytochrom |
putative cytochrome
|
hydrolase |
pu-hydrolase |
putative hydrolase, inner membrane
|
integrase |
pu-KpLE2 |
KpLE2 phage-like element; putative integrase
|
peptidase |
pu-LysM |
LysM domain-containing putative peptidase lipoprotein YgeR
|
GMP |
pu-sensor |
putative c-di-GMP phosphodiesterase PdeA
|
protein |
Pu-ssM |
putative type II secretion system M-type protein
|
tr-regulator |
pu-tr 120 |
putative DNA-binding transcriptional regulator
|
tr-regulator |
pu-tr YieP |
putative transcriptional regulator YieP
|
tr-regulator |
pu-tr YjdC |
putative DNA-binding transcriptional regulator YjdC
|
tr-regulator |
pu-tr-YeeN |
putative transcriptional regulator YeeN
|
protein |
pu-unYgaQ |
putative uncharacterized protein YgaQ
|
oxygenase |
pu-YdhR |
putative monooxygenase YdhR
|
ABC bind |
pu-YhdZ |
putative ABC transporter ATP-binding subunit YhdZ
|
transporter |
pu-YicJ |
putative xyloside transporter YicJ
|
transporter |
pu-YifK |
putative transporter YifK
|
prophage |
put DLP12 |
DLP12 prophage; putative integrase
|
tr-regulator |
put FimZ |
putative LuxR family transcriptional regulator FimZ
|
synthetase |
quino |
quinolinate synthase
|
synthetase |
quino NadA |
quinolinate synthase NadA
|
ribosome |
RimP |
ribosome maturation factor RimP
|
rpt |
rpt-29 |
rpt-29
|
rpt |
rpt-34 |
rpt_type=other
|
rpt |
rpt-36 |
rpt_type=other
|
rpt |
rpt71 |
rpt_type=other 71
|
sRNA |
RttR sRNA |
small RNA RttR
|
translocase |
SecE |
Sec translocon subunit SecE
|
translocase |
SecG-p |
preprotein translocase subunit SecG
|
translocase |
SecG-t |
Sec translocon subunit SecG
|
esterase |
sensor |
sensor domain-containing phosphodiesterase
|
ABC bind |
sn-glycerol |
sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB
|
protein |
sscs VI |
type VI secretion system contractile sheath small subunit
|
protein |
stress |
stress response protein
|
tr-regulator |
tact Cbl |
DNA-binding transcriptional activator Cbl
|
translation |
tif IF-1 |
translation initiation factor IF-1
|
protein |
tpr |
protamine-like protein
|
tr-regulator |
tr 192 |
transcriptional regulator
|
tr-regulator |
tr AlpA |
AlpA family transcriptional regulator
|
tr-regulator |
tr-Cbl |
HTH-type transcriptional regulator Cbl
|
tr-regulator |
tr-Nac |
DNA-binding transcriptional dual regulator Nac
|
tr-regulator |
tr-nitrogen |
nitrogen assimilation transcriptional regulator
|
tr-regulator |
tr-YebC |
YebC/PmpR family DNA-binding transcriptional regulator
|
transferase |
transferase |
acetyltransferase
|
transporter |
trp-YeeO |
toxic metabolite efflux MATE transporter YeeO
|
translation |
tuf |
elongation factor Tu
|
translation |
tufb |
tufb, translation elongation factor Tu 2
|
integrase |
Tyr recb 207 |
tyrosine-type recombinase/integrase
|
integrase |
Tyr recb 404 |
tyrosine-type recombinase/integrase
|
integrase |
Tyr recb 421 |
tyrosine-type recombinase/integrase
|
integrase |
Tyr recb 424 |
tyrosine-type recombinase/integrase
|
reductase |
UDP-N |
UDP-N-acetylenolpyruvoylglucosamine reductase
|
protein |
un-YcdU |
uncharacterized protein YcdU
|
protein |
un-YjeV |
uncharacterized protein YjeV
|
protein |
UPF0149 YecA |
UPF0149 family protein YecA
|
protein |
YdiA |
YdiA family protein
|
protein |
YfdC |
inner membrane protein YfdC
|
protein |
YgeQ |
protein YgeQ
|
gene |
yjdQ |
gene="yjdQ"
|
DUF |
DUF1435 |
DUF1435 domain-containing protein
|
transposase |
p-IS630 |
pseudo, IS630-like element IS630 family transposase
|
- ecoN Le prélèvement: gama
- Le nom et le lien NCBI: ecoN, Escherichia coli Nissle 1917 chromosome, NCBI [71], date 11.5.21.
- ecoN La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
ecoN 646,219 5,441,200 11.9
Intergen51. ecoN. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. ecoN les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ecoN les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,793 |
782 |
29 |
3,604 |
2.4 |
84 |
13 |
97
|
x |
1,364 |
105 |
18 |
1,487 |
|
0 |
4 |
4
|
t |
4,157 |
887 |
47 |
5,091 |
|
84 |
17 |
101
|
% |
81.7 |
17.4 |
0.9 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
56 |
0 |
2 |
58 |
1.3 |
tRNA-CDS |
104 |
48
|
x |
46 |
0 |
0 |
46 |
|
RNA-RNA |
84 |
39
|
t |
102 |
0 |
2 |
104 |
|
CDS-rRNA |
17 |
8
|
% |
98.1 |
0.0 |
1.9 |
|
|
non RNA |
12 |
6
|
- |
|
|
|
|
|
total |
217 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
4.4 |
12.1 |
1.3 |
32.7 |
5.2 |
65 |
0.8 |
3.4
|
x |
10.3 |
15.2 |
4.8 |
6.4 |
4.3 |
47 |
1.2 |
0.0
|
|
Intergen51. ecoN. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: ecoN données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ecoN fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ecoN fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ecoN
R2 x3 x2 x c Inflexion poly3 x c
0.561 1.45E-06 -8.87E-04 5.65E-02 35.30 fx1 abscisse 261.5 434.8
0.853 -6.60E-06 5.18E-03 -1.32E+00 119.0 fc1 ordonnée 15.7 5.2
0.784 -2.46E-06 1.93E-03 -5.54E-01 72.6 fx41
0.959 -8.05E-07 1.05E-03 -4.48E-01 67.7 fc41
- Le rfin après 400 est de 125 sur un total de 2822. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 27. L'indice i.rfin1 = 98/270 = 0.363.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données ecoN calculs poly3 ecoN
effect 2822 R2.21 814 abscis 250
xm 37 pte 12,85 flexa 123
ym 10 cste 4,02 flexo 2,71
x1m 235 r400l 165 xm 35
y1m 1 restp 136,07 sup4 103,6
rfin 44,29 %sd 22,42 sup4t 327,4
bornf 116 lond 198 % 31,7
supd 112,3 %sf 25,49 long 88
supdt 500,7 lonf 79 R2 565
xmp 363,22 sf/lf 0,99
r400 91,78 sr/lr 0,29
supf 77,9 sd/ld 0,57
supft 305,8 i.r400 0,56
Intergen51. ecoN. Les CDS-CDS négatifs
modifier
Sous-totaux ecoN totale
fréquence x- c- x- c-
- 1 2 173 4 4140
- 2 4 5 85 11
- 3 2 0 3 12
- 4 39 328 717 10938
- 5 2 2 5 19
sp6 56 274 1642 8424
total 105 782 2,456 23,544
reste 5 10 264 420
s6 18 5 361 41
s7 10 51 321 1438
s8 23 208 696 6525
rappot s1-5
4/2/1 9.75 1.9 8.4 2.6
% / sp6
s6/sp6 32.1 1.8 22.0 0.5
s7/sp6 17.9 18.6 19.5 17.1
s8/sp6 41.1 75.9 42.4 77.5
reste/sp6 8.9 3.6 16.1 5.0
total s1-5 49 508 814 15120
% / total
%s1-5 46.7 65.0 33.1 64.2
%sp6 53.3 35.0 66.9 35.8
Intergen51. ecoN. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 7 CDS 16s 6 2
16s 23s 5s CDS 5 2
16s tRNA 9 16 CDS
tRNA 23s 7 CDS 5s
5s tRNA 4 23s CDS 2
tRNA in 4 CDS 23s
tRNA contig 5 5s 16s
tRNA hors 43 16s16s
tRNA 16s 1
23s tRNA
tRNA 5s 4
16s 5s
5s 23s
5s 5s
total 84 0 total 13 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
inter aa
8 gac
** tgg
1472 °gaa
42 °atc
2351 $atc
** $gaa
42 gca
** atc
Int51.31 ecoN. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
37 |
cag |
|
4 |
gtc |
|
58 |
cgg
|
48 |
cag |
|
** |
gtc |
|
20 |
cac
|
15 |
atgj |
|
12 |
tta |
|
42 |
ctg
|
34 |
caa |
|
53 |
tgc |
|
** |
cca
|
23 |
caa |
|
** |
ggc |
|
8 |
aca
|
10 |
cta |
|
39 |
gcc |
|
116 |
tac
|
** |
atgj |
|
** |
gcc |
|
6 |
gga
|
35 |
aaa |
|
43 |
gta |
|
** |
acc
|
2 |
gta |
|
46 |
gta |
|
36 |
ggc
|
51 |
aaa |
|
4 |
gta |
|
35 |
ggc
|
3 |
gta |
|
** |
aaa |
|
** |
ggc
|
48 |
aaa |
|
63 |
cgt |
|
34 |
ctg
|
33 |
aaa |
|
62 |
cgt |
|
28 |
ctg
|
** |
aaa |
|
62 |
cgt |
|
** |
ctg
|
33 |
tac |
|
64 |
cgt |
|
39 |
gcc
|
** |
tac |
|
3 |
cgt |
|
39 |
gcc
|
4 |
gtc |
|
** |
agc |
|
** |
gcc
|
** |
gtc |
|
33 |
atgf |
|
44 |
gta
|
4 |
gtc |
|
33 |
atgf |
|
** |
gta
|
** |
gtc |
|
** |
atgf |
|
28 |
ctg
|
|
|
|
|
|
|
** |
ctg
|
vha1. Vibrio campbellii ATCC BAA-1116
45.4%GC |
26.7.19 Paris |
121 |
doubles |
interca |
cds |
aa |
avec aa |
cdsa |
cdsd
|
Chromosome I |
|
|
|
|
|
|
|
|
|
comp |
1..1384 |
16s |
@1 |
103 |
103 |
|
|
|
|
comp |
1488..1604 |
cds |
|
102507 |
|
|
|
39 |
|
|
|
|
|
|
|
|
|
|
|
|
104112..105239 |
cds |
|
529 |
529 |
|
|
376 |
529
|
comp |
105769..105845 |
atgf |
+ |
158 |
|
158 |
|
|
|
comp |
106004..106079 |
ggc |
7 ggc |
35 |
|
35 |
|
|
|
comp |
106115..106190 |
ggc |
5 atgf |
35 |
|
35 |
|
|
|
comp |
106226..106301 |
ggc |
|
18 |
|
18 |
|
|
|
comp |
106320..106396 |
atgf |
|
39 |
|
39 |
|
|
|
comp |
106436..106511 |
ggc |
|
90 |
|
90 |
|
|
|
comp |
106602..106678 |
atgf |
|
39 |
|
39 |
|
|
|
comp |
106718..106793 |
ggc |
|
18 |
|
18 |
|
|
|
comp |
106812..106888 |
atgf |
|
39 |
|
39 |
|
|
|
comp |
106928..107003 |
ggc |
|
18 |
|
18 |
|
|
|
comp |
107022..107098 |
atgf |
|
39 |
|
39 |
|
|
|
comp |
107138..107213 |
ggc |
|
156 |
156 |
|
|
|
156
|
comp |
107370..107915 |
cds |
|
81764 |
|
|
|
182 |
|
|
|
|
|
|
|
|
|
|
|
|
189680..190715 |
cds |
|
101 |
101 |
|
|
345 |
101
|
comp |
190817..190933 |
5s |
|
107 |
|
|
|
|
|
comp |
191041..193955 |
23s |
|
290 |
|
|
|
|
|
comp |
194246..194321 |
gca |
|
43 |
|
|
43 |
|
|
comp |
194365..194441 |
atc |
|
97 |
|
|
|
|
|
comp |
194539..196096 |
16s |
@2 |
371 |
|
|
|
|
|
comp |
196468..196584 |
5s |
|
77 |
|
|
|
|
|
comp |
196662..199576 |
23s |
|
290 |
|
|
|
|
|
comp |
199867..199942 |
gca |
|
43 |
|
|
43 |
|
|
comp |
199986..200062 |
atc |
|
97 |
|
|
|
|
|
comp |
200160..201717 |
16s |
|
853 |
853 |
|
|
|
853
|
comp |
202571..204706 |
cds |
|
29595 |
|
|
|
712 |
|
|
|
|
|
|
|
|
|
|
|
comp |
234302..235486 |
cds |
|
101 |
101 |
|
|
395 |
101
|
comp |
235588..235663 |
acc |
|
13 |
|
13 |
|
|
|
comp |
235677..235751 |
gga |
|
35 |
|
35 |
|
|
|
comp |
235787..235871 |
tac |
|
52 |
|
52 |
|
|
|
comp |
235924..235999 |
aca |
|
206 |
206 |
|
|
|
|
|
236206..237129 |
cds |
|
4144 |
|
|
|
308 |
|
|
|
|
|
|
|
|
|
|
|
comp |
241274..242467 |
cds |
|
546 |
546 |
|
|
398 |
546
|
comp |
243014..243090 |
tgg |
|
68 |
|
|
68 |
|
|
comp |
243159..243235 |
gac |
|
32 |
|
|
|
|
|
comp |
243268..243384 |
5s |
|
117 |
|
|
|
|
|
comp |
243502..246404 |
23s |
|
310 |
|
|
|
|
|
comp |
246715..246790 |
gta |
|
30 |
|
|
30 |
|
|
comp |
246821..246896 |
aaa |
|
2 |
|
|
2 |
|
|
comp |
246899..246974 |
gaa |
|
122 |
|
|
|
|
|
comp |
247097..248654 |
16s |
|
554 |
554 |
|
|
|
554
|
|
249209..249664 |
cds |
|
60596 |
|
|
|
152 |
|
|
|
|
|
|
|
|
|
|
|
|
310261..311296 |
cds |
|
121 |
121 |
|
|
345 |
121
|
comp |
311418..311508 |
tca |
|
91 |
|
|
|
|
|
comp |
311600..311716 |
5s |
|
108 |
|
|
|
|
|
comp |
311825..314739 |
23s |
|
289 |
|
|
|
|
|
comp |
315029..315104 |
gca |
|
43 |
|
|
43 |
|
|
comp |
315148..315224 |
atc |
|
56 |
|
|
|
|
|
comp |
315281..316842 |
16s |
|
471 |
471 |
|
|
|
471
|
comp |
317314..318027 |
cds |
|
40242 |
|
|
|
238 |
|
|
|
|
|
|
|
|
|
|
|
|
358270..359305 |
cds |
|
147 |
147 |
|
|
345 |
|
comp |
359453..359529 |
gac |
|
31 |
|
|
|
|
|
comp |
359561..359677 |
5s |
|
108 |
|
|
|
|
|
comp |
359786..362700 |
23s |
|
310 |
|
|
|
|
|
comp |
363011..363086 |
gta |
|
30 |
|
|
30 |
|
|
comp |
363117..363192 |
aaa |
|
2 |
|
|
2 |
|
|
comp |
363195..363270 |
gaa |
|
82 |
|
|
|
|
|
comp |
363353..364914 |
16s |
|
83 |
83 |
|
|
|
83
|
comp |
364998..365133 |
cds |
|
84252 |
|
|
|
45 |
|
|
|
|
|
|
|
|
|
|
|
|
449386..449521 |
cds |
|
83 |
83 |
|
|
45 |
83
|
|
449605..451162 |
16s |
|
122 |
|
|
|
|
|
|
451285..451360 |
gaa |
|
2 |
|
|
2 |
|
|
|
451363..451438 |
aaa |
|
9 |
|
|
9 |
|
|
|
451448..451523 |
gca |
|
37 |
|
|
37 |
|
|
|
451561..451636 |
gta |
|
51 |
51 |
|
|
|
51
|
comp |
451688..451873 |
cds |
|
16 |
16 |
|
|
62 |
16
|
|
451890..454804 |
23s |
|
77 |
|
|
|
|
|
|
454882..454998 |
5s |
|
32 |
|
|
|
|
|
|
455031..455107 |
gac |
|
162 |
162 |
|
|
|
|
comp |
455270..455533 |
cds |
|
11718 |
|
|
|
88 |
|
|
|
|
|
|
|
|
|
|
|
comp |
467252..467665 |
cds |
|
361 |
361 |
|
|
138 |
|
|
468027..468103 |
cgg |
|
35 |
|
35 |
|
|
|
|
468139..468214 |
cac |
|
76 |
|
76 |
|
|
|
|
468291..468367 |
cca |
|
46 |
|
46 |
|
|
|
|
468414..468489 |
cac |
|
64 |
|
64 |
|
|
|
|
468554..468630 |
cca |
|
194 |
194 |
|
|
|
194
|
comp |
468825..469550 |
cds |
|
365688 |
|
|
|
242 |
|
|
|
|
|
|
|
|
|
|
|
comp |
835239..835550 |
cds |
|
138 |
138 |
|
|
104 |
138
|
comp |
835689..835764 |
atgi |
|
145 |
145 |
|
|
|
|
comp |
835910..837772 |
cds |
|
182191 |
|
|
|
621 |
|
|
|
|
|
|
|
|
|
|
|
|
1019964..1020128 |
cds |
|
119 |
119 |
|
|
55 |
|
|
1020248..1021805 |
16s |
|
129 |
|
|
|
|
|
|
1021935..1022010 |
gcc |
|
41 |
|
|
41 |
|
|
|
1022052..1022127 |
gaa |
|
55 |
55 |
|
|
|
55
|
comp |
1022183..1022368 |
cds |
|
16 |
16 |
|
|
62 |
16
|
|
1022385..1025299 |
23s |
|
111 |
|
|
|
|
|
|
1025411..1025527 |
5s |
|
31 |
|
|
|
|
|
|
1025559..1025635 |
gac |
|
35 |
|
|
35 |
|
|
|
1025671..1025747 |
tgg |
|
3 |
3 |
|
|
|
3
|
comp |
1025751..1025933 |
cds |
|
225465 |
|
|
|
61 |
|
|
|
|
|
|
|
|
|
|
|
|
1251399..1252574 |
cds |
|
158 |
158 |
|
|
392 |
|
comp |
1252733..1252817 |
cta |
+ |
54 |
|
54 |
|
|
|
comp |
1252872..1252946 |
caa |
5 cta |
46 |
|
46 |
|
|
|
comp |
1252993..1253077 |
cta |
3 atgj |
21 |
|
21 |
|
|
|
comp |
1253099..1253183 |
cta |
2 caa |
18 |
|
18 |
|
|
|
comp |
1253202..1253278 |
atgj |
|
23 |
|
23 |
|
|
|
comp |
1253302..1253386 |
cta |
|
70 |
|
70 |
|
|
|
comp |
1253457..1253533 |
atgj |
|
79 |
|
79 |
|
|
|
comp |
1253613..1253687 |
caa |
|
31 |
|
31 |
|
|
|
comp |
1253719..1253803 |
cta |
|
39 |
|
39 |
|
|
|
comp |
1253843..1253919 |
atgj |
|
26 |
26 |
|
|
|
26
|
comp |
1253946..1254157 |
cds |
|
14564 |
|
|
|
71 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1268722..1268862 |
cds |
|
260 |
260 |
|
|
47 |
|
|
1269123..1269199 |
cca |
|
243 |
243 |
|
|
|
243
|
comp |
1269443..1269628 |
cds |
|
16361 |
|
|
|
62 |
|
|
|
|
|
|
|
|
|
|
|
|
1285990..1286571 |
cds |
|
88 |
88 |
|
|
194 |
|
comp |
1286660..1286736 |
agg |
|
68 |
68 |
|
|
|
68
|
comp |
1286805..1287938 |
cds |
|
116753 |
|
|
|
378 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1404692..1405552 |
cds |
|
204 |
204 |
|
|
287 |
204
|
|
1405757..1405833 |
aga |
|
244 |
244 |
|
|
|
|
|
1406078..1407685 |
cds |
|
49950 |
|
|
|
536 |
|
|
|
|
|
|
|
|
|
|
|
|
1457636..1458508 |
cds |
|
407 |
407 |
|
|
291 |
|
comp |
1458916..1459000 |
tac |
+ |
100 |
|
100 |
|
|
|
comp |
1459101..1459185 |
tac |
4 tac |
100 |
|
100 |
|
|
|
comp |
1459286..1459370 |
tac |
@7 |
100 |
|
100 |
|
|
|
comp |
1459471..1459555 |
tac |
|
282 |
282 |
|
|
|
282
|
|
1459838..1460935 |
cds |
|
170368 |
|
|
|
366 |
|
|
|
|
|
|
|
|
|
|
|
|
1631304..1631753 |
cds |
|
144 |
144 |
|
|
150 |
144
|
|
1631898..1631985 |
tcc |
|
312 |
312 |
|
|
|
|
|
1632298..1632684 |
cds |
|
550413 |
|
|
|
129 |
|
|
|
|
|
|
|
|
|
|
|
|
2183098..2183436 |
cds |
|
179 |
179 |
|
|
113 |
|
|
2183616..2183692 |
gtc |
+ |
46 |
|
46 |
|
|
|
|
2183739..2183815 |
gtc |
2 gtc |
149 |
149 |
|
|
|
149
|
|
2183965..2185344 |
cds |
|
578546 |
|
|
|
460 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2763891..2766782 |
cds |
|
763 |
763 |
|
|
964 |
763
|
comp |
2767546..2767621 |
ggc |
+ |
11 |
|
11 |
|
|
|
comp |
2767633..2767719 |
tta |
2 ggc |
78 |
|
78 |
|
|
|
comp |
2767798..2767873 |
ggc |
|
37 |
|
37 |
|
|
|
comp |
2767911..2767984 |
tgc |
|
400 |
400 |
|
|
|
400
|
comp |
2768385..2768942 |
cds |
|
82481 |
|
|
|
186 |
|
|
|
|
|
|
|
|
|
|
|
|
2851424..2851855 |
cds |
|
62 |
62 |
|
|
144 |
62
|
|
2851918..2851992 |
gga |
|
333 |
333 |
|
|
|
|
|
2852326..2852970 |
cds |
|
133282 |
|
|
|
215 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2986253..2986402 |
cds |
|
1 |
1 |
|
|
50 |
1
|
|
2986404..2986479 |
aac |
|
372 |
372 |
|
|
|
|
|
2986852..2989149 |
cds |
|
60873 |
|
|
|
766 |
|
|
|
|
|
|
|
|
|
|
|
|
3050023..3051831 |
cds |
|
139 |
139 |
|
|
603 |
139
|
|
3051971..3052061 |
tca |
|
321 |
321 |
|
|
|
|
|
3052383..3053693 |
cds |
|
384243 |
|
|
|
437 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3437937..3438392 |
cds |
|
233 |
233 |
|
|
152 |
|
comp |
3438626..3438702 |
atgf |
|
56 |
|
56 |
|
|
|
comp |
3438759..3438842 |
ctc |
|
18 |
18 |
|
|
|
18
|
comp |
3438861..3439199 |
cds |
|
113972 |
|
|
|
113 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3553172..3554167 |
cds |
|
189 |
189 |
|
|
332 |
189
|
comp |
3554357..3554433 |
cgt |
+ |
59 |
|
59 |
|
|
|
comp |
3554493..3554569 |
cgt |
7 cgt |
57 |
|
57 |
|
|
|
comp |
3554627..3554703 |
cgt |
2 agc |
57 |
|
57 |
|
|
|
comp |
3554761..3554837 |
cgt |
|
57 |
|
57 |
|
|
|
comp |
3554895..3554971 |
cgt |
|
57 |
|
57 |
|
|
|
comp |
3555029..3555105 |
cgt |
|
85 |
|
85 |
|
|
|
comp |
3555191..3555282 |
agc |
|
29 |
|
29 |
|
|
|
comp |
3555312..3555388 |
cgt |
|
31 |
|
31 |
|
|
|
comp |
3555420..3555511 |
agc |
|
243 |
243 |
|
|
|
|
comp |
3555755..3555952 |
cds |
|
83212 |
|
|
|
66 |
|
|
|
|
|
|
|
|
|
|
|
|
3639165..3640295 |
cds |
|
108 |
108 |
|
|
377 |
108
|
|
3640404..3640479 |
ttc |
+ |
51 |
|
51 |
|
|
|
|
3640531..3640606 |
aca |
3 ttc |
7 |
|
7 |
|
|
|
|
3640614..3640689 |
ttc |
2 aca |
43 |
|
43 |
|
|
|
|
3640733..3640808 |
aac |
2 aac |
69 |
|
69 |
|
|
|
|
3640878..3640953 |
aca |
|
10 |
|
10 |
|
|
|
|
3640964..3641039 |
ttc |
|
42 |
|
42 |
|
|
|
|
3641082..3641158 |
aac |
|
292 |
292 |
|
|
|
|
|
3641451..3643076 |
cds |
|
233 |
233 |
|
|
542 |
|
|
3643310..3643385 |
ttc |
|
51 |
|
51 |
|
|
|
|
3643437..3643512 |
aca |
+ |
21 |
|
21 |
|
|
|
|
3643534..3643609 |
aac |
2 aca |
39 |
|
39 |
|
|
|
|
3643649..3643724 |
aca |
2 aac |
15 |
|
15 |
|
|
|
|
3643740..3643815 |
aac |
|
156 |
156 |
|
|
|
156
|
comp |
3643972..3645405 |
cds |
|
561 |
561 |
|
|
478 |
561
|
comp |
3645967..3646043 |
gac |
|
31 |
|
|
|
|
|
comp |
3646075..3646191 |
5s |
|
57 |
|
|
|
|
|
comp |
3646249..3646324 |
acc |
|
100 |
|
|
|
|
|
comp |
3646425..3646541 |
5s |
|
111 |
|
|
|
|
|
comp |
3646653..3649567 |
23s |
|
-13 |
-13 |
|
|
|
-13
|
comp |
3649555..3649797 |
cds |
@3 |
35 |
35 |
|
|
81 |
35
|
comp |
3649833..3649908 |
gca |
|
43 |
|
|
43 |
|
|
comp |
3649952..3650028 |
atc |
|
97 |
|
|
|
|
|
comp |
3650126..3651683 |
16s |
|
557 |
557 |
|
|
|
557
|
comp |
3652241..3653491 |
cds |
|
9514 |
|
|
|
417 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3663006..3663598 |
cds |
|
181 |
181 |
|
|
198 |
|
comp |
3663780..3663864 |
ttg |
|
177 |
177 |
|
|
|
177
|
comp |
3664042..3664707 |
cds |
|
93515 |
|
|
|
222 |
|
|
|
|
|
|
|
|
|
|
|
|
3758223..3759258 |
cds |
|
578 |
578 |
|
|
345 |
578
|
comp |
3759837..3759913 |
gac |
|
68 |
|
|
|
|
|
comp |
3759982..3760098 |
5s |
|
111 |
|
|
|
|
|
comp |
3760210..3763124 |
23s |
|
290 |
|
|
|
|
|
comp |
3763415..3763490 |
gca |
|
43 |
|
|
43 |
|
|
comp |
3763534..3763610 |
atc |
|
97 |
|
|
|
|
|
comp |
3763708..3765265 |
16s |
|
86 |
|
|
|
|
|
comp |
3765351 |
16s |
début |
|
|
|
|
|
|
Chromosome II |
|
|
|
|
|
|
|
|
|
comp |
673782..674186 |
cds |
|
358 |
358 |
|
|
135 |
|
comp |
674545..674635 |
tca |
|
329 |
329 |
|
|
|
329
|
|
674965..675645 |
cds |
|
205537 |
|
|
|
227 |
|
|
|
|
|
|
|
|
|
|
|
|
881183..882640 |
cds |
|
244 |
244 |
|
|
486 |
244
|
|
882885..882958 |
tgc |
|
302 |
302 |
|
|
|
|
|
883261..883725 |
cds |
|
1229 |
|
|
|
155 |
|
|
|
|
|
|
|
|
|
|
|
|
884955..886649 |
cds |
|
245 |
245 |
|
|
565 |
245
|
|
886895..886981 |
tta |
|
97 |
|
97 |
|
|
|
|
887079..887154 |
ggc |
|
5 |
|
5 |
|
|
|
|
887160..887233 |
tgc |
|
317 |
317 |
|
|
|
|
|
887551..889074 |
cds |
|
465 |
|
|
|
508 |
|
|
|
|
|
|
|
|
|
|
|
comp |
889540..890328 |
cds |
|
386 |
386 |
|
|
263 |
|
|
890715..890801 |
tta |
+ |
53 |
|
53 |
|
|
|
|
890855..890928 |
tgc |
2 tgc |
181 |
|
181 |
|
|
|
|
891110..891183 |
tgc |
|
366 |
366 |
|
|
|
366
|
|
891550..891891 |
cds |
|
443950 |
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
|
1335842..1336042 |
cds |
|
17 |
17 |
|
|
|
17
|
|
1336060..1336134 |
gga |
|
272 |
272 |
|
|
|
|
comp |
1336407..1337222 |
cds |
|
505333 |
|
|
|
272 |
|
|
|
|
|
|
|
|
|
|
|
|
1842556..1842741 |
cds |
|
-36 |
-36 |
|
|
62 |
-36
|
|
1842706..1842789 |
ctc |
|
29 |
29 |
|
|
|
29
|
|
1842819..1843430 |
cds |
|
77699 |
|
|
|
204 |
|
|
|
|
|
|
|
|
|
|
|
|
1921130..1921561 |
cds |
|
62 |
62 |
|
|
144 |
62
|
|
1921624..1921698 |
gga |
|
337 |
337 |
|
|
|
|
comp |
1922036..1922209 |
cds |
|
15660 |
|
|
|
58 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1937870..1939129 |
cds |
|
84 |
84 |
|
|
420 |
|
comp |
1939214..1939304 |
tca |
|
90 |
|
|
|
|
|
comp |
1939395..1939511 |
5s |
|
77 |
|
|
|
|
|
comp |
1939589..1942503 |
23s |
|
306 |
|
|
|
|
|
comp |
1942810..1942885 |
gta |
|
35 |
|
|
35 |
|
|
comp |
1942921..1942996 |
gca |
|
24 |
|
|
24 |
|
|
comp |
1943021..1943096 |
aaa |
|
2 |
|
|
2 |
|
|
comp |
1943099..1943174 |
gaa |
|
114 |
|
|
|
|
|
comp |
1943289..1944850 |
16s |
|
83 |
83 |
|
|
|
83
|
comp |
1944934..1945071 |
cds |
|
|
|
|
|
46 |
|
- Lien tableur: vha cumuls
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vha. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cumuls. Vibrio campbellii ATCC BAA-1116
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
11 |
1 |
0 |
0 |
1 |
3 |
1 |
1 |
100 |
17
|
|
16 aas 23 5s |
3 |
20 |
10 |
5 |
50 |
8 |
20 |
5 |
200 |
17
|
|
16 atc gca |
4 |
40 |
17 |
6 |
100 |
10 |
40 |
3 |
300 |
10
|
|
16 cds 23 5s |
3 |
60 |
16 |
6 |
150 |
12 |
60 |
2 |
400 |
13
|
|
max a |
5 |
80 |
6 |
1 |
200 |
9 |
80 |
3 |
500 |
6
|
|
a doubles |
0 |
100 |
6 |
0 |
250 |
9 |
100 |
3 |
600 |
4
|
|
spéciaux |
1 |
120 |
0 |
0 |
300 |
4 |
120 |
3 |
700 |
2
|
|
total aas |
37 |
140 |
0 |
0 |
350 |
7 |
140 |
3 |
800 |
2
|
sans |
opérons |
27 |
160 |
1 |
0 |
400 |
6 |
160 |
4 |
900 |
0
|
|
1 aa |
14 |
180 |
0 |
0 |
450 |
1 |
180 |
1 |
1000 |
1
|
|
max a |
12 |
200 |
1 |
0 |
500 |
1 |
200 |
2 |
1100 |
0
|
|
a doubles |
10 |
|
0 |
0 |
|
8 |
|
8 |
|
0
|
|
total aas |
84 |
|
57 |
18 |
|
78 |
|
38 |
|
72
|
total aas |
|
121 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
30 |
|
|
|
|
|
266
|
|
|
|
variance |
|
19 |
|
|
|
|
|
199
|
sans jaune |
|
|
moyenne |
46 |
|
|
183 |
|
86 |
|
240
|
|
|
|
variance |
25 |
|
|
114 |
|
59 |
|
178
|
- Note: intercalaires prélevés de la colonne cds de vha opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
vha 56 37 22 70
deb fin deb fin grand petit grand petit
-36 29 233 18 29 -36 29 -36
1 372 158 26 88 68 372 1
17 272 -36 29 145 138 272 17
62 333 88 68 158 26 233 18
62 337 138 145 179 149 158 26
88 68 179 149 181 177 333 62
101 206 233 156 206 101 337 62
108 292 529 156 233 18 88 68
138 145 181 177 233 156 206 101
139 321 361 194 243 189 292 108
144 312 101 206 244 204 145 138
158 26 189 243 260 243 321 139
179 149 260 243 272 17 312 144
181 177 204 244 292 108 179 149
189 243 17 272 302 244 233 156
204 244 407 282 312 144 529 156
233 18 108 292 317 245 181 177
233 156 244 302 321 139 243 189
244 302 144 312 333 62 361 194
245 317 245 317 337 62 244 204
260 243 139 321 358 329 260 243
358 329 358 329 361 194 302 244
361 194 62 333 372 1 317 245
386 366 62 337 386 366 407 282
407 282 386 366 407 282 358 329
529 156 1 372 529 156 386 366
763 400 763 400 763 400 763 400
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
gama cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
vha 5,432 54 1 24 23 5 1 14 10 6 18
‰ 19 444 426 93 19 519 370 222 667
vha1. Vibrio campbellii ATCC BAA-1116, blocs à rRNA.
cds |
853 |
cds |
471 |
cds |
103
|
16s |
97 |
16s |
56 |
16s |
86
|
atc |
43 |
atc |
43 |
16s |
97
|
gca |
290 |
gca |
289 |
atc |
43
|
23s |
77 |
23s |
108 |
gca |
290
|
5s |
371 |
5s |
91 |
23s |
111
|
16s |
97 |
tca |
121 |
5s |
68
|
atc |
43 |
cds |
|
gac |
578
|
gca |
290 |
|
|
cds |
|
23s |
107 |
|
|
|
|
5s |
101 |
|
|
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
cds |
554 |
cds |
83 |
cds |
119
|
16s |
122 |
16s |
82 |
16s |
129
|
gaa |
2 |
gaa |
2 |
gcc |
41
|
aaa |
30 |
aaa |
30 |
gaa |
55
|
gta |
310 |
gta |
310 |
cds |
16
|
23s |
117 |
23s |
108 |
23s |
111
|
5s |
32 |
5s |
31 |
5s |
31
|
gac |
68 |
gac |
147 |
gac |
35
|
tgg |
546 |
cds |
|
tgg |
3
|
cds |
|
|
|
cds |
|
|
|
|
|
|
|
cds |
83 |
cds |
83 |
cds |
557
|
16s |
114 |
16s |
122 |
16s |
97
|
gaa |
2 |
gaa |
2 |
atc |
43
|
aaa |
24 |
aaa |
9 |
gca |
35
|
gca |
35 |
gca |
37 |
cds |
-13
|
gta |
306 |
gta |
51 |
23s |
111
|
23s |
77 |
cds |
16 |
5s |
100
|
5s |
90 |
23s |
77 |
acc |
57
|
tca |
84 |
5s |
32 |
5s |
31
|
cds |
|
gac |
162 |
gac |
561
|
|
|
cds |
|
cds |
|
- A faire, en comparaison avec vpb
- Note du 4.10.20: contrôle des cds, 0/3 cds dans NCBI du 1.8.20
- Lien tableur: vha distribution
- Notes:
- - gtc2 cta2 tac4 tgc2 cgt6 ggc3
- - acc: 5s + >1aa
- - tca: 2 5s+ 2 1aa
- - gga: 1>a + 3 1aa
- - Séquences:
- (cac cca)2
- cgt5 (cgt agc)2
- ttc (aca aac)2
- (atgf ggc) ggc2 (atgf ggc)4
- ttc aca (ttc aac) aca (ttc aac)
Gm6 vha, Vibrio campbellii ATCC BAA-1116. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
8
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
1 |
tac |
5 |
tgc |
5
|
f atc |
5 |
j acc |
2 |
aac |
5 |
agc |
2
|
g ctc |
2 |
f ccc |
|
cac |
2 |
cgt |
7
|
h gtc |
2 |
n gcc |
1 |
gac |
6 |
ggc |
8
|
i tta |
3 |
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
4 |
aga |
1
|
k cta |
5 |
g cca |
3 |
caa |
2 |
cga |
|
l gta |
4 |
o gca |
7 |
gaa |
5 |
gga |
4
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
vha |
70 |
14 |
|
11 |
|
26 |
121
|
- vha1 Le prélèvement: gama
- Le nom et le lien NCBI: vha1, Vibrio campbellii ATCC BAA-1116 chromosome I, NCBI [76], date 12.12.21.
- vha1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
vha1 499,733 3,765,351 13.3
Intergen51. vha1. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. vha1 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vha1 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,936 |
402 |
9 |
2,347 |
2.4 |
104 |
8 |
112
|
x |
931 |
25 |
3 |
959 |
|
0 |
3 |
3
|
t |
2,867 |
427 |
12 |
3,306 |
|
104 |
11 |
115
|
% |
86.7 |
12.9 |
0.4 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
29 |
0 |
0 |
29 |
1.6 |
tRNA-CDS |
47 |
25
|
x |
18 |
0 |
0 |
18 |
|
RNA-RNA |
104 |
55
|
t |
47 |
0 |
0 |
47 |
|
CDS-rRNA |
11 |
6
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
28 |
15
|
- |
|
|
|
|
|
total |
190 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
7.5 |
13.8 |
0.0 |
27.5 |
3.4 |
60 |
0.4 |
0.0
|
x |
13.4 |
22.2 |
0.0 |
4.6 |
0.0 |
36 |
0.3 |
0.0
|
|
Intergen51. vha1. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: vha1 données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vha1 fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vha1 fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vha1
R2 x3 x2 x c Inflexion poly3 x c
0.625 4.79E-06 -3.09E-03 4.70E-01 15.50 fx1 abscisse 82.7 189.0
0.796 -5.34E-06 4.01E-03 -1.01E+00 96.9 fc1 ordonnée 40.9 20.1
0.736 8.54E-07 -2.12E-04 -1.61E-01 55.2 fx41
0.929 1.23E-06 -7.00E-04 -8.87E-04 37.0 fc41
- Le rfin après 400 est de 146 sur un total de 1945. Jusqu'à 1% les freq10 sont en continu jusqu'à 700, reste 19. L'indice i.rfin1 = 127/300 = 0.423.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données vha1 calculs poly3 vha1
effect 1945 R2.21 757 abscis 400
xm 45 pte 8,98 flexa 179
ym 5 cste 2,97 flexo 2,08
x1m 220 r400l 180 xm 43
y1m 1 restp 203,08 sup4 150,2
rfin 75,06 %sd 38,71 sup4t 407,2
bornf 158 lond 175 % 36,9
supd 181,5 %sf 39,67 long 136
supdt 468,9 lonf 113 R2 475
xmp 328,02 sf/lf 1,25
r400 128,02 sr/lr 0,65
supf 141,3 sd/ld 1,04
supft 356,3 i.r400 0,71
Intergen51. vha1. Les CDS-CDS négatifs
modifier
Sous-totaux vha1 totale
fréquence x- c- x- c-
- 1 0 98 4 4140
- 2 0 0 85 11
- 3 0 2 3 12
- 4 9 141 717 10938
- 5 0 1 5 19
sp6 16 160 1642 8424
total 25 402 2,456 23,544
reste 0 0 264 420
s6 7 0 361 41
s7 1 27 321 1438
s8 8 133 696 6525
rappot s1-5
4/2/1 - 1.4 8.4 2.6
% / sp6
s6/sp6 43.8 0.0 22.0 0.5
s7/sp6 6.3 16.9 19.5 17.1
s8/sp6 50.0 83.1 42.4 77.5
reste/sp6 0.0 0.0 16.1 5.0
total s1-5 9 242 814 15120
% / total
%s1-5 36.0 60.2 33.1 64.2
%sp6 64.0 39.8 66.9 35.8
Intergen51. vha1. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 9 CDS 16s 6 2
16s 23s 5s CDS 1
16s tRNA 9 16 CDS
tRNA 23s 9 CDS 5s
5s tRNA 8 23s CDS
tRNA in 13 CDS 23s
tRNA contig 2 5s 16s 1
tRNA hors 53 16s16s 1
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 104 0 total 8 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
contig aa
68 tgg
** gac
35 gac
** tgg
Int51.31 vha1. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
158 |
atgf |
|
54 |
cta |
|
59 |
cgt
|
35 |
ggc |
|
46 |
caa |
|
57 |
cgt
|
35 |
ggc |
|
21 |
cta |
|
57 |
cgt
|
18 |
ggc |
|
18 |
cta |
|
57 |
cgt
|
39 |
atgf |
|
23 |
atgj |
|
57 |
cgt
|
90 |
ggc |
|
70 |
cta |
|
85 |
cgt
|
39 |
atgf |
|
79 |
atgj |
|
29 |
agc
|
18 |
ggc |
|
31 |
caa |
|
31 |
cgt
|
39 |
atgf |
|
39 |
cta |
|
** |
agc
|
18 |
ggc |
|
** |
atgj |
|
51 |
ttc
|
39 |
atgf |
|
100 |
tac |
|
7 |
aca
|
** |
ggc |
|
100 |
tac |
|
43 |
ttc
|
13 |
acc |
|
100 |
tac |
|
69 |
aac
|
35 |
gga |
|
** |
tac |
|
10 |
aca
|
52 |
tac |
|
46 |
gtc |
|
42 |
ttc
|
** |
aca |
|
** |
gtc |
|
** |
aac
|
35 |
cgg |
|
11 |
ggc |
|
51 |
ttc
|
76 |
cac |
|
78 |
tta |
|
21 |
aca
|
46 |
cca |
|
37 |
ggc |
|
39 |
aac
|
64 |
cac |
|
** |
tgc |
|
15 |
aca
|
** |
cca |
|
56 |
atgf |
|
** |
aac
|
|
|
|
** |
ctc |
|
|
|
- vha2 Le prélèvement: gama
- Le nom et le lien NCBI: vha2, Vibrio campbellii ATCC BAA-1116 chromosome II, NCBI [77], date 12.12.21.
- vha2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
vha2 317,649 2,204,018 14.4
Intergen51. vha2. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. vha2 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vha2 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,059 |
227 |
16 |
1,302 |
1.8 |
11 |
1 |
12
|
x |
688 |
25 |
1 |
714 |
|
0 |
0 |
0
|
t |
1,747 |
252 |
17 |
2,016 |
|
11 |
1 |
12
|
% |
86.7 |
12.5 |
0.8 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
9 |
1 |
0 |
10 |
2.0 |
tRNA-CDS |
15 |
45
|
x |
5 |
0 |
0 |
5 |
|
RNA-RNA |
11 |
33
|
t |
14 |
1 |
0 |
15 |
|
CDS-rRNA |
1 |
3
|
% |
93.3 |
6.7 |
0.0 |
|
|
non RNA |
6 |
18
|
- |
|
|
|
|
|
total |
33 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
7.8 |
10.0 |
0.0 |
25.1 |
10.0 |
62 |
1.2 |
0.0
|
x |
13.9 |
0.0 |
0.0 |
6.1 |
0.0 |
20 |
0.1 |
0.0
|
|
Intergen51. vha2. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: vha2 données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vha2 fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vha2 fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 vha2
R2 x3 x2 x c Inflexion poly3 x c
0.661 4.10E-06 -2.65E-03 3.97E-01 17.80 fx1 abscisse 155.6 197,2
0.763 -3.90E-06 3.05E-03 -8.11E-01 85.8 fc1 ordonnée 28.4 19,4
0.742 1.39E-06 -6.49E-04 -4.87E-02 46.5 fx41
0.800 2,02E-06 -1,19E-03 9,37E-02 31.8 fc31
- Le rfin après 400 est de 84 sur un total de 1075. Jusqu'à 1% les freq10 sont en continu jusqu'à 740, reste 11. L'indice i.rfin1 = 73/340 = 0.215.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données vha2 calculs poly3 vha2
effect 1075 R2.21 577 abscis 400
xm 35 pte 0,02 flexa 191
ym 1,08 cste 1,01 flexo 1,96
x1m 238 r400l 162 xm 35
y1m 1 restp 201,86 sup4 196,1
rfin 78,14 %sd 66,00 sup4t 448,4
bornf 158 lond 203 % 43,7
supd 343,8 %sf 70,46 long 156
supdt 520,9 lonf 123 R2 316
xmp 277,21 sf/lf 2,24
r400 123,72 sr/lr 0,85
supf 276,0 sd/ld 1,69
supft 391,6 i.r400 0,76
Intergen51. vha2. Les CDS-CDS négatifs
modifier
Sous-totaux vha2 totale
fréquence x- c- x- c-
- 1 0 62 4 4140
- 2 2 0 85 11
- 3 0 0 3 12
- 4 3 77 717 10938
- 5 0 1 5 19
sp6 20 87 1642 8424
total 25 227 2,456 23,544
reste 0 0 264 420
s6 7 0 361 41
s7 1 12 321 1438
s8 12 75 696 6525
rappot s1-5
4/2/1 1.5 1.2 8.4 2.6
% / sp6
s6/sp6 35.0 0.0 22.0 0.5
s7/sp6 5.0 13.8 19.5 17.1
s8/sp6 60.0 86.2 42.4 77.5
reste/sp6 0.0 0.0 16.1 5.0
total s1-5 5 140 814 15120
% / total
%s1-5 20.0 61.7 33.1 64.2
%sp6 80.0 38.3 66.9 35.8
Intergen51. vha2. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 1 CDS 16s 1
16s 23s 5s CDS
16s tRNA 1 16 CDS
tRNA 23s 1 CDS 5s
5s tRNA 1 23s CDS
tRNA in 3 CDS 23s
tRNA contig 5s 16s
tRNA hors 4 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 11 0 total 1 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
hors b aa
97 tta
5 ggc
** tgc
53 tta
181 tgc°
** tgc°
amed1. Aeromonas media WS
61.2%GC |
25.7.19 Paris |
126 |
doubles |
interca |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
6590..7159 |
cds |
|
3 |
|
|
|
190 |
|
|
|
|
|
|
|
|
|
|
|
comp |
7163..8359 |
cds |
|
512 |
512 |
|
|
399 |
|
|
8872..10421 |
16s |
|
66 |
|
|
|
|
|
|
10488..10564 |
atc |
|
10 |
|
|
10 |
|
|
|
10575..10650 |
gca |
|
231 |
|
|
|
|
|
|
10882..13800 |
23s |
|
98 |
|
|
|
|
|
|
13899..14013 |
5s |
|
386 |
386 |
|
|
|
386
|
|
14400..14717 |
cds |
|
102422 |
|
|
|
106 |
|
|
|
|
|
|
|
|
|
|
|
|
117140..117850 |
cds |
|
47 |
47 |
|
|
237 |
47
|
|
117898..117973 |
ttc |
|
52 |
|
52 |
|
|
|
|
118026..118101 |
aca |
|
3 |
|
3 |
|
|
|
|
118105..118180 |
ttc |
|
45 |
|
45 |
|
|
|
|
118226..118301 |
aac |
|
252 |
252 |
|
|
|
|
|
118554..119573 |
cds |
|
50489 |
|
|
|
340 |
|
|
|
|
|
|
|
|
|
|
|
comp |
170063..170329 |
cds |
|
103 |
103 |
|
|
89 |
103
|
comp |
170433..170518 |
ctg |
+ |
71 |
|
71 |
|
|
|
comp |
170590..170675 |
ctg |
5 ctg |
46 |
|
46 |
|
|
|
comp |
170722..170807 |
ctg |
|
46 |
|
46 |
|
|
|
comp |
170854..170939 |
ctg |
|
51 |
|
51 |
|
|
|
comp |
170991..171076 |
ctg |
|
116 |
116 |
|
|
|
|
comp |
171193..172653 |
cds |
|
146173 |
|
|
|
487 |
|
|
|
|
|
|
|
|
|
|
|
|
318827..320692 |
cds |
|
190 |
190 |
|
|
622 |
190
|
|
320883..320959 |
atgi |
|
244 |
244 |
|
|
|
|
comp |
321204..323780 |
cds |
|
62601 |
|
|
|
859 |
|
|
|
|
|
|
|
|
|
|
|
|
386382..386732 |
cds |
|
514 |
514 |
|
|
117 |
|
|
387247..388802 |
16s |
|
268 |
|
|
|
|
|
|
389071..389146 |
gaa |
|
245 |
|
|
|
|
|
|
389392..392312 |
23s |
|
104 |
|
|
|
|
|
|
392417..392531 |
5s |
|
268 |
268 |
|
|
|
268
|
comp |
392800..394413 |
cds |
|
81847 |
|
|
|
538 |
|
|
|
|
|
|
|
|
|
|
|
|
476261..476482 |
cds |
|
64 |
64 |
|
|
74 |
64
|
comp |
476547..476622 |
aac |
|
5 |
|
5 |
|
|
|
comp |
476628..476703 |
ttc |
|
622 |
622 |
|
|
|
|
|
477326..477547 |
cds |
|
22721 |
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
|
500269..500814 |
cds |
|
177 |
177 |
|
|
182 |
177
|
|
500992..501067 |
ggc |
+ |
24 |
|
24 |
|
|
|
|
501092..501167 |
ggc |
6 ggc |
29 |
|
29 |
|
|
|
|
501197..501272 |
ggc |
|
38 |
|
38 |
|
|
|
|
501311..501386 |
ggc |
|
25 |
|
25 |
|
|
|
|
501412..501487 |
ggc |
|
23 |
|
23 |
|
|
|
|
501511..501586 |
ggc |
|
363 |
363 |
|
|
|
|
comp |
501950..502159 |
cds |
|
4810 |
|
|
|
70 |
|
|
|
|
|
|
|
|
|
|
|
|
506970..507110 |
cds |
|
236 |
236 |
|
|
47 |
236
|
|
507347..507422 |
gcc |
+ |
28 |
|
28 |
|
|
|
|
507451..507526 |
gcc |
5 gcc |
66 |
|
66 |
|
|
|
|
507593..507668 |
gcc |
|
58 |
|
58 |
|
|
|
|
507727..507802 |
gcc |
|
40 |
|
40 |
|
|
|
|
507843..507918 |
gcc |
|
471 |
471 |
|
|
|
|
|
508390..508473 |
riboswitch |
@1 |
134002 |
|
|
|
28 |
|
|
|
|
|
|
|
|
|
|
|
|
642476..642802 |
cds |
|
9 |
9 |
|
|
109 |
9
|
|
642812..642896 |
ctc |
|
91 |
|
91 |
|
|
|
|
642988..643064 |
atgf |
|
166 |
166 |
|
|
|
|
|
643231..643689 |
cds |
|
128528 |
|
|
|
153 |
|
|
|
|
|
|
|
|
|
|
|
|
772218..774050 |
cds |
|
195 |
195 |
|
|
611 |
195
|
comp |
774246..774329 |
cta |
+ |
8 |
|
8 |
|
|
|
comp |
774338..774414 |
atg |
3 atg |
38 |
|
38 |
|
|
|
comp |
774453..774527 |
caa |
4 caa |
47 |
|
47 |
|
|
|
comp |
774575..774649 |
caa |
|
17 |
|
17 |
|
|
|
comp |
774667..774743 |
atg |
|
35 |
|
35 |
|
|
|
comp |
774779..774853 |
caa |
|
47 |
|
47 |
|
|
|
comp |
774901..774975 |
caa |
|
13 |
|
13 |
|
|
|
comp |
774989..775065 |
atg |
|
235 |
235 |
|
|
|
|
comp |
775301..776392 |
cds |
|
3148 |
|
|
|
364 |
|
|
|
|
|
|
|
|
|
|
|
comp |
779541..780557 |
cds |
|
104 |
104 |
|
|
339 |
104
|
comp |
780662..780736 |
caa |
|
-21 |
-21 |
|
|
|
-21
|
comp |
780716..781612 |
cds |
|
373301 |
|
|
|
299 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1154914..1155384 |
cds |
|
131 |
131 |
|
|
157 |
131
|
comp |
1155516..1155592 |
ccc |
|
226 |
226 |
|
|
|
|
comp |
1155819..1157162 |
cds |
|
67691 |
|
|
|
448 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1224854..1226290 |
cds |
|
301 |
301 |
|
|
479 |
|
comp |
1226592..1226667 |
aac |
|
2 |
|
2 |
|
|
|
comp |
1226670..1226744 |
gga |
|
164 |
164 |
|
|
|
164
|
comp |
1226909..1227181 |
cds |
|
13604 |
|
|
|
91 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1240786..1241733 |
cds |
|
350 |
350 |
|
|
316 |
|
comp |
1242084..1242156 |
aac |
+ |
2 |
|
2 |
|
|
|
comp |
1242159..1242234 |
aac |
2 aac |
49 |
49 |
|
|
|
49
|
|
1242284..1242496 |
cds |
|
294 |
|
|
|
71 |
|
|
|
|
|
|
|
|
|
|
|
|
1242791..1244527 |
cds |
|
181 |
181 |
|
|
579 |
181
|
|
1244709..1244796 |
tcc |
|
407 |
407 |
|
|
|
|
|
1245204..1246064 |
cds |
|
161293 |
|
|
|
287 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1407358..1408338 |
cds |
|
410 |
410 |
|
|
327 |
|
comp |
1408749..1408836 |
tcc |
|
177 |
177 |
|
|
|
177
|
comp |
1409014..1409631 |
cds |
|
34595 |
|
|
|
206 |
|
|
|
|
|
|
|
|
|
|
|
|
1444227..1444688 |
cds |
|
146 |
146 |
|
|
154 |
|
|
1444835..1444922 |
tcc |
|
127 |
127 |
|
|
|
127
|
|
1445050..1446834 |
cds |
|
14349 |
|
|
|
595 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1461184..1462401 |
cds |
|
163 |
163 |
|
|
406 |
163
|
comp |
1462565..1462640 |
cac |
|
124 |
|
124 |
|
|
|
comp |
1462765..1462838 |
aga |
|
240 |
240 |
|
|
|
|
comp |
1463079..1464389 |
cds |
|
61984 |
|
|
|
437 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1526374..1527606 |
cds |
|
151 |
151 |
|
|
411 |
151
|
comp |
1527758..1527833 |
cac |
|
123 |
|
123 |
|
|
|
comp |
1527957..1528033 |
aga |
|
36 |
|
36 |
|
|
|
comp |
1528070..1528146 |
cca |
|
203 |
203 |
|
|
|
|
|
1528350..1529207 |
cds |
|
60230 |
|
|
|
286 |
|
|
|
|
|
|
|
|
|
|
|
|
1589438..1589644 |
cds |
|
138 |
138 |
|
|
69 |
|
comp |
1589783..1589858 |
aac |
|
132 |
132 |
|
|
|
132
|
|
1589991..1592003 |
cds |
|
57434 |
|
|
|
671 |
|
|
|
|
|
|
|
|
|
|
|
|
1649438..1651867 |
cds |
|
104 |
104 |
|
|
810 |
104
|
comp |
1651972..1652048 |
gtc |
+ |
36 |
|
36 |
|
|
|
comp |
1652085..1652161 |
gtc |
5 gtc |
26 |
|
26 |
|
|
|
comp |
1652188..1652264 |
gtc |
|
15 |
|
15 |
|
|
|
comp |
1652280..1652356 |
gtc |
|
11 |
|
11 |
|
|
|
comp |
1652368..1652444 |
gtc |
|
170 |
170 |
|
|
|
|
comp |
1652615..1653994 |
cds |
|
277443 |
|
|
|
460 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1931438..1932934 |
cds |
|
145 |
145 |
|
|
499 |
145
|
comp |
1933080..1933156 |
atgf |
+ |
110 |
|
110 |
|
|
|
comp |
1933267..1933343 |
atgf |
9 atgf |
102 |
|
102 |
|
|
|
comp |
1933446..1933522 |
atgf |
@2 |
101 |
|
101 |
|
|
|
comp |
1933624..1933700 |
atgf |
|
101 |
|
101 |
|
|
|
comp |
1933802..1933877 |
atgf |
|
103 |
|
103 |
|
|
|
comp |
1933981..1934057 |
atgf |
|
102 |
|
102 |
|
|
|
comp |
1934160..1934236 |
atgf |
|
102 |
|
102 |
|
|
|
comp |
1934339..1934415 |
atgf |
|
92 |
|
92 |
|
|
|
comp |
1934508..1934584 |
atgf |
|
268 |
268 |
|
|
|
|
comp |
1934853..1935572 |
cds |
|
490897 |
|
|
|
240 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2426470..2427675 |
cds |
|
350 |
350 |
|
|
402 |
|
comp |
2428026..2428112 |
tta |
|
40 |
|
40 |
|
|
|
comp |
2428153..2428226 |
tgc |
|
35 |
|
35 |
|
|
|
comp |
2428262..2428337 |
ggc |
|
181 |
181 |
|
|
|
181
|
comp |
2428519..2429073 |
cds |
|
117921 |
|
|
|
185 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2546995..2547534 |
cds |
|
271 |
271 |
|
|
180 |
271
|
|
2547806..2547882 |
ccc |
|
1103 |
1103 |
|
|
|
|
|
2548986..2550593 |
cds |
|
107760 |
|
|
|
536 |
|
|
|
|
|
|
|
|
|
|
|
|
2658354..2659094 |
cds |
|
87 |
87 |
|
|
247 |
87
|
|
2659182..2659257 |
acg |
|
108 |
108 |
|
|
|
|
< comp |
2659366..2659705 |
cds |
|
198821 |
|
|
|
113 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2858527..2859036 |
cds |
|
126 |
126 |
|
|
170 |
|
|
2859163..2859247 |
tac |
+ |
30 |
|
30 |
|
|
|
|
2859278..2859362 |
tac |
2 tac |
121 |
121 |
|
|
|
121
|
comp |
2859484..2863335 |
cds |
|
115303 |
|
|
|
1284 |
|
|
|
|
|
|
|
|
|
|
|
|
2978639..2979358 |
cds |
|
119 |
119 |
|
|
240 |
119
|
comp |
2979478..2979552 |
gga |
|
104 |
|
104 |
|
|
|
comp |
2979657..2979730 |
ggg |
|
201 |
201 |
|
|
|
|
|
2979932..2981701 |
cds |
|
41492 |
|
|
|
590 |
|
|
|
|
|
|
|
|
|
|
|
|
3023194..3023487 |
cds |
|
75 |
75 |
|
|
98 |
75
|
comp |
3023563..3023636 |
tgc |
|
57 |
|
57 |
|
|
|
comp |
3023694..3023769 |
ggc |
|
248 |
248 |
|
|
|
|
|
3024018..3027455 |
cds |
|
17375 |
|
|
|
1146 |
|
|
|
|
|
|
|
|
|
|
|
|
3044831..3045361 |
cds |
|
133 |
133 |
|
|
177 |
133
|
comp |
3045495..3045584 |
tcg |
|
380 |
380 |
|
|
|
|
|
3045965..3046882 |
cds |
|
221147 |
|
|
|
306 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3268030..3268398 |
cds |
|
318 |
318 |
|
|
123 |
|
comp |
3268717..3268804 |
tca |
|
198 |
198 |
|
|
|
198
|
|
3269003..3269752 |
cds |
|
20717 |
|
|
|
250 |
|
|
|
|
|
|
|
|
|
|
|
|
3290470..3291624 |
cds |
|
50 |
50 |
|
|
385 |
50
|
|
3291675..3291751 |
agg |
|
126 |
126 |
|
|
|
|
comp |
3291878..3292804 |
cds |
|
41865 |
|
|
|
309 |
|
|
|
|
|
|
|
|
|
|
|
|
3334670..3335758 |
cds |
|
230 |
230 |
|
|
363 |
|
|
3335989..3336073 |
tac |
+ |
32 |
|
32 |
|
|
|
|
3336106..3336190 |
tac |
3 tac |
45 |
|
45 |
|
|
|
|
3336236..3336320 |
tac |
|
135 |
135 |
|
|
|
135
|
|
3336456..3336731 |
cds |
|
169091 |
|
|
|
92 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3505823..3506272 |
cds |
|
275 |
275 |
|
|
150 |
275
|
comp |
3506548..3506662 |
5s |
|
101 |
|
|
|
|
|
comp |
3506764..3509682 |
23s |
|
229 |
|
|
|
|
|
comp |
3509912..3509987 |
gaa |
|
218 |
|
|
|
|
|
comp |
3510206..3511760 |
16s |
|
592 |
592 |
|
|
|
|
|
3512353..3515220 |
cds |
|
161083 |
|
|
|
956 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3676304..3677323 |
cds |
|
113 |
113 |
|
|
340 |
|
comp |
3677437..3677521 |
ttg |
|
49 |
49 |
|
|
|
49
|
|
3677571..3678182 |
cds |
|
9862 |
|
|
|
204 |
|
|
|
|
|
|
|
|
|
|
|
|
3688045..3688872 |
cds |
|
369 |
369 |
|
|
276 |
|
comp |
3689242..3689318 |
cgt |
+ |
25 |
|
25 |
|
|
|
comp |
3689344..3689420 |
cgt |
5 cgt |
25 |
|
25 |
|
|
|
comp |
3689446..3689522 |
cgt |
|
26 |
|
26 |
|
|
|
comp |
3689549..3689625 |
cgt |
|
98 |
|
98 |
|
|
|
comp |
3689724..3689800 |
cgt |
|
4 |
|
4 |
|
|
|
comp |
3689805..3689897 |
agc |
|
213 |
213 |
|
|
|
213
|
comp |
3690111..3690299 |
cds |
|
196546 |
|
|
|
63 |
|
|
|
|
|
|
|
|
|
|
|
|
3886846..3887601 |
cds |
|
302 |
302 |
|
|
252 |
302
|
comp |
3887904..3887980 |
gac |
|
98 |
|
|
|
|
|
comp |
3888079..3888193 |
5s |
|
105 |
|
|
|
|
|
comp |
3888299..3891217 |
23s |
|
231 |
|
|
|
|
|
comp |
3891449..3891524 |
gca |
|
10 |
|
|
10 |
|
|
comp |
3891535..3891611 |
atc |
|
66 |
|
|
|
|
|
comp |
3891678..3893232 |
16s |
|
420 |
420 |
|
|
|
|
comp |
3893653..3894195 |
cds |
|
18750 |
|
|
|
181 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3912946..3913317 |
cds |
|
60 |
60 |
|
|
124 |
|
comp |
3913378..3913454 |
tgg |
|
52 |
52 |
|
|
|
52
|
comp |
3913507..3914691 |
cds |
@3 |
171 |
171 |
|
|
395 |
171
|
comp |
3914863..3914937 |
gga |
|
38 |
|
38 |
|
|
|
comp |
3914976..3915060 |
tac |
|
263 |
263 |
|
|
|
|
|
3915324..3916262 |
cds |
|
45900 |
|
|
|
313 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3962163..3963533 |
cds |
|
306 |
306 |
|
|
457 |
|
comp |
3963840..3963916 |
tgg |
|
202 |
202 |
|
|
|
202
|
|
3964119..3964703 |
cds |
|
59641 |
|
|
|
195 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4024345..4026816 |
cds |
|
658 |
658 |
|
|
824 |
|
comp |
4027475..4027551 |
ccg |
|
140 |
140 |
|
|
|
140
|
comp |
4027692..4028417 |
cds |
|
80995 |
|
|
|
242 |
|
|
|
|
|
|
|
|
|
|
|
|
4109413..4111986 |
cds |
|
99 |
99 |
|
|
858 |
|
comp |
4112086..4112200 |
5s |
|
101 |
|
|
|
|
|
comp |
4112302..4115220 |
23s |
|
231 |
|
|
|
|
|
comp |
4115452..4115527 |
gaa |
|
192 |
|
|
|
|
|
comp |
4115720..4117273 |
16s |
|
94 |
94 |
|
|
|
94
|
comp |
4117368..4117547 |
cds |
|
32227 |
|
|
|
60 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4149775..4150248 |
cds |
|
204 |
204 |
|
|
158 |
204
|
comp |
4150453..4150529 |
cca |
|
58 |
|
58 |
|
|
|
comp |
4150588..4150673 |
ctg |
|
20 |
|
20 |
|
|
|
comp |
4150694..4150769 |
cac |
|
49 |
|
49 |
|
|
|
comp |
4150819..4150895 |
cgg |
|
258 |
258 |
|
|
|
|
|
4151154..4151744 |
cds |
|
74862 |
|
|
|
197 |
|
|
|
|
|
|
|
|
|
|
|
|
4226607..4227725 |
cds |
|
428 |
428 |
|
|
373 |
|
|
4228154..4229708 |
16s |
|
192 |
|
|
|
|
|
|
4229901..4229976 |
gaa |
|
229 |
|
|
|
|
|
|
4230206..4233124 |
23s |
|
104 |
|
|
|
|
|
|
4233229..4233343 |
5s |
|
106 |
|
|
|
|
|
|
4233450..4233525 |
acc |
|
23 |
|
|
|
|
|
|
4233549..4233663 |
5s |
|
164 |
164 |
|
|
|
164
|
|
4233828..4234793 |
cds |
|
119351 |
|
|
|
322 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4354145..4355686 |
cds |
|
622 |
622 |
|
|
514 |
|
|
4356309..4357863 |
16s |
|
268 |
|
|
|
|
|
|
4358132..4358207 |
gaa |
|
230 |
|
|
|
|
|
|
4358438..4361364 |
23s |
|
102 |
|
|
|
|
|
|
4361467..4361581 |
5s |
|
106 |
|
|
|
|
|
|
4361688..4361763 |
acc |
|
233 |
233 |
|
|
|
233
|
|
4361997..4363241 |
cds |
|
71363 |
|
|
|
415 |
|
|
|
|
|
|
|
|
|
|
|
|
4434605..4435198 |
cds |
|
465 |
465 |
|
|
198 |
|
|
4435664..4437217 |
16s |
|
219 |
|
|
|
|
|
|
4437437..4437512 |
gaa |
|
229 |
|
|
|
|
|
|
4437742..4440657 |
23s |
|
103 |
|
|
|
|
|
|
4440761..4440875 |
5s |
|
98 |
|
|
|
|
|
|
4440974..4441050 |
gac |
|
167 |
167 |
|
|
|
167
|
|
4441218..4442054 |
cds |
|
39919 |
|
|
|
279 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4481974..4482513 |
cds |
|
477 |
477 |
|
|
180 |
|
|
4482991..4484545 |
16s |
|
513 |
|
|
|
|
|
|
4485059..4485549 |
23s° |
|
37 |
|
|
|
|
|
comp |
4485587..4486115 |
23s° |
|
229 |
|
|
|
|
|
comp |
4486345..4486419 |
gaa |
|
218 |
|
|
|
|
|
comp |
4486638..4488193 |
16s |
|
94 |
94 |
|
|
|
94
|
comp |
4488288..4488509 |
cds |
|
72132 |
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4560642..4561676 |
cds |
|
192 |
192 |
|
|
345 |
|
comp |
4561869..4561944 |
gta |
+ |
18 |
|
18 |
|
|
|
comp |
4561963..4562038 |
aaa |
7 gta |
34 |
|
34 |
|
|
|
comp |
4562073..4562148 |
gta |
5 aaa |
18 |
|
18 |
|
|
|
comp |
4562167..4562242 |
aaa |
2 aag |
23 |
|
23 |
|
|
|
comp |
4562266..4562341 |
gta |
|
18 |
|
18 |
|
|
|
comp |
4562360..4562435 |
aaa |
|
23 |
|
23 |
|
|
|
comp |
4562459..4562534 |
gta |
|
18 |
|
18 |
|
|
|
comp |
4562553..4562628 |
aaa |
|
34 |
|
34 |
|
|
|
comp |
4562663..4562738 |
gta |
|
22 |
|
22 |
|
|
|
comp |
4562761..4562836 |
aag |
|
46 |
|
46 |
|
|
|
comp |
4562883..4562958 |
gta |
|
22 |
|
22 |
|
|
|
comp |
4562981..4563056 |
aag |
|
46 |
|
46 |
|
|
|
comp |
4563103..4563178 |
gta |
|
32 |
|
32 |
|
|
|
comp |
4563211..4563286 |
aaa |
|
174 |
174 |
|
|
|
174
|
comp |
4563461..4564276 |
cds |
|
70895 |
|
|
|
272 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4635172..4636173 |
cds |
|
275 |
275 |
|
|
334 |
275
|
comp |
4636449..4636525 |
gac |
|
95 |
|
|
|
|
|
comp |
4636621..4636735 |
5s |
|
101 |
|
|
|
|
|
comp |
4636837..4639756 |
23s |
|
231 |
|
|
|
|
|
comp |
4639988..4640063 |
gca |
|
10 |
|
|
10 |
|
|
comp |
4640074..4640150 |
atc |
|
66 |
|
|
|
|
|
comp |
4640217..4641771 |
16s |
|
512 |
512 |
|
|
|
|
|
4642284..4643480 |
cds |
|
3 |
|
|
|
399 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4643484..4644053 |
cds |
|
|
|
|
|
190 |
|
- Lien tableur: amed cumuls
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.amed. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cumuls. Aeromonas media WS
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
10 |
1 |
0 |
- |
1 |
1 |
40 |
1 |
100 |
14
|
|
16 gaa 23 5s |
6 |
20 |
15 |
|
50 |
5 |
60 |
5 |
200 |
21
|
|
16 atc gca |
3 |
40 |
27 |
|
100 |
8 |
80 |
2 |
300 |
15
|
|
16 23 5s |
0 |
60 |
14 |
|
150 |
19 |
100 |
3 |
400 |
18
|
|
max a |
3 |
80 |
2 |
|
200 |
17 |
120 |
4 |
500 |
11
|
|
a doubles |
0 |
100 |
3 |
|
250 |
13 |
140 |
7 |
600 |
6
|
|
spéciaux |
1 |
120 |
8 |
|
300 |
8 |
160 |
2 |
700 |
3
|
|
total aas |
18 |
140 |
2 |
|
350 |
6 |
180 |
8 |
800 |
0
|
sans |
opérons |
38 |
160 |
0 |
|
400 |
4 |
200 |
5 |
900 |
4
|
|
1 aa |
16 |
180 |
0 |
|
450 |
4 |
220 |
3 |
1000 |
1
|
|
max a |
14 |
200 |
0 |
|
500 |
3 |
240 |
2 |
1100 |
0
|
|
a doubles |
12 |
|
0 |
|
|
8 |
|
6 |
|
2
|
|
total aas |
109 |
|
71 |
0 |
|
96 |
|
48 |
|
95
|
total aas |
|
127 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
49 |
|
|
|
|
156 |
|
|
|
|
|
variance |
34 |
|
|
|
|
77 |
|
|
sans jaune |
|
|
moyenne |
|
|
|
214 |
|
|
|
274
|
|
|
|
variance |
|
|
|
122 |
|
|
|
157
|
A1. Aeromonas media WS, blocs à rRNA.
cds |
512 |
cds |
302 |
cds |
275
|
16s |
66 |
gac |
98 |
gac |
95
|
atc |
10 |
5s |
105 |
5s |
101
|
gca |
231 |
23s |
231 |
23s |
231
|
23s |
98 |
gca |
10 |
gca |
10
|
5s |
386 |
atc |
66 |
atc |
66
|
|
|
16s |
420 |
16s |
512
|
|
|
|
|
|
|
cds |
514 |
275 |
99 |
|
|
16s |
268 |
101 |
101 |
|
|
gaa |
245 |
229 |
231 |
|
|
23s |
104 |
218 |
192 |
|
|
5s |
268 |
592 |
94 |
|
|
|
|
|
|
|
|
cds |
428 |
cds |
622 |
cds |
465
|
16s |
192 |
16s |
268 |
16s |
219
|
gaa |
229 |
gaa |
230 |
gaa |
229
|
23s |
104 |
23s |
102 |
23s |
103
|
5s |
106 |
5s |
106 |
5s |
98
|
acc |
23 |
acc |
233 |
gac |
167
|
5s |
164 |
|
|
|
|
- Lien tableur: amed distribution
- Notes:
- - gtc5 ctg5 gcc5 tac3+2 aac2 caa2+2 atgf9 cgt5 ggc6
- - Séquences
- (atgj caa2)2
- (gta aaa)4 (gta aag)2 gta aaa
Gm7 amed, Aeromonas media WS. gama
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
10
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
3 |
tac |
6 |
tgc |
2
|
f atc |
3 |
j acc |
2 |
aac |
6 |
agc |
1
|
g ctc |
1 |
f ccc |
2 |
cac |
3 |
cgt |
5
|
h gtc |
5 |
n gcc |
5 |
gac |
3 |
ggc |
8
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
5 |
aga |
2
|
k cta |
1 |
g cca |
2 |
caa |
5 |
cga |
|
l gta |
7 |
o gca |
3 |
gaa |
7 |
gga |
3
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
2
|
n atgj |
3 |
l acg |
1 |
aag |
2 |
agg |
1
|
o ctg |
6 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
gama |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
amed |
93 |
16 |
|
5 |
|
13 |
127
|
- amed Le prélèvement: alpha gama
- Le nom et le lien NCBI: amed, Aeromonas media WS chromosome, NCBI [81], date 15.1.22.
- amed La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
amed 601,332 4,777,154 12.6
Intergen51. amed. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. amed les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 amed les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,370 |
444 |
12 |
2,826 |
2.0 |
106 |
8 |
114
|
x |
1,341 |
42 |
2 |
1,385 |
|
0 |
8 |
8
|
t |
3,711 |
486 |
14 |
4,211 |
|
106 |
16 |
122
|
% |
88.1 |
11.5 |
0.3 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
53 |
1 |
0 |
54 |
2.2 |
tRNA-CDS |
79 |
33
|
x |
25 |
0 |
0 |
25 |
|
RNA-RNA |
106 |
44
|
t |
78 |
1 |
0 |
79 |
|
CDS-rRNA |
16 |
7
|
% |
98.7 |
1.3 |
0.0 |
|
|
non RNA |
38 |
16
|
- |
|
|
|
|
|
total |
239 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
4.6 |
11.1 |
1.4 |
21.1 |
1.9 |
68 |
0.4 |
0.0
|
x |
8.2 |
4.0 |
9.5 |
6.0 |
0.0 |
21 |
0.1 |
0.0
|
|
Intergen51. amed. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: amed données intercalaires
- Diagrammes des gamma:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées amed fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. amed fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 amed
R2 x3 x2 x c Inflexion poly3 x c
0.603 4.21E-06 -2.73E-03 3.91E-01 23.20 fx1 abscisse 366.7 185.9
0.856 -1.07E-06 1.09E-03 -4.42E-01 71.9 fc1 ordonnée 7.2 23.7
0.777 -1.00E-06 1.10E-03 -4.62E-01 78.0 fx41
0.902 2.15E-06 -1.20E-03 -4.04E-02 43.9 fc41
- Le rfin après 400 est de 109 sur un total de 2382. Jusqu'à 1% les freq10 sont en continu jusqu'à 700, reste 23. L'indice i.rfin1 = 86/340 = 0.287.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données amed calculs poly3 amed
effect 2382 R2.21 760 abscis 400
xm 45 pte 10,48 flexa 162
ym 7 cste 3,41 flexo 2,68
x1m 230 r400l 170 xm 45
y1m 1 restp 166,67 sup4t 150,3
rfin 45,76 %sd 39,58 sup4t 447,5
bornf 138 lond 185 % 33,6
supd 224,2 %sf 41,00 long 117
supdt 566,3 lonf 93 R2 674
xmp 267,00 sf/lf 1,68
r400 120,91 sr/lr 0,74
supf 155,9 sd/ld 1,21
supft 380,4 i.r400 0,71
Intergen51. amed. Les CDS-CDS négatifs
modifier
Sous-totaux amed totale
fréquence x- c- x- c-
- 1 0 91 4 4140
- 2 1 0 85 11
- 3 0 0 3 12
- 4 8 212 717 10938
- 5 0 0 5 19
sp6 33 141 1642 8424
total 42 444 2,456 23,544
reste 4 6 264 420
s6 8 0 361 41
s7 9 33 321 1438
s8 12 102 696 6525
rappot s1-5
4/2/1 8 2.3 8.4 2.6
% / sp6
s6/sp6 24.2 0.0 22.0 0.5
s7/sp6 27.3 23.4 19.5 17.1
s8/sp6 36.4 72.3 42.4 77.5
reste/sp6 12.1 4.3 16.1 5.0
total s1-5 9 303 814 15120
% / total
%s1-5 21.4 68.2 33.1 64.2
%sp6 78.6 31.8 66.9 35.8
Intergen51. amed. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 9 CDS 16s 5 6
16s 23s 5s CDS 3 2
16s tRNA 10 16 CDS
tRNA 23s 9 CDS 5s
5s tRNA 5 23s CDS
tRNA in 3 CDS 23s
tRNA contig 5s 16s
tRNA hors 69 16s16s
tRNA 16s
23s tRNA
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 106 0 total 8 8
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 amed. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
52 |
ttc |
|
28 |
gcc |
|
36 |
gtc |
|
30 |
tac |
|
58 |
cca
|
3 |
aca |
|
66 |
gcc |
|
26 |
gtc |
|
** |
tac |
|
20 |
ctg
|
45 |
ttc |
|
58 |
gcc |
|
15 |
gtc |
|
104 |
gga |
|
49 |
cac
|
** |
aac |
|
40 |
gcc |
|
11 |
gtc |
|
** |
ggg |
|
** |
cgg
|
71 |
ctg |
|
** |
gcc |
|
** |
gtc |
|
57 |
tgc |
|
18 |
gta
|
46 |
ctg |
|
91 |
ctc |
|
110 |
atgf |
|
** |
ggc |
|
34 |
aaa
|
46 |
ctg |
|
** |
atgf |
|
102 |
atgf |
|
32 |
tac |
|
18 |
gta
|
51 |
ctg |
|
8 |
cta |
|
101 |
atgf |
|
45 |
tac |
|
23 |
aaa
|
** |
ctg |
|
38 |
atgj |
|
101 |
atgf |
|
** |
tac |
|
18 |
gta
|
5 |
aac |
|
47 |
caa |
|
103 |
atgf |
|
25 |
cgt |
|
23 |
aaa
|
** |
ttc |
|
17 |
caa |
|
102 |
atgf |
|
25 |
cgt |
|
18 |
gta
|
24 |
ggc |
|
35 |
atgj |
|
102 |
atgf |
|
26 |
cgt |
|
34 |
aaa
|
29 |
ggc |
|
47 |
caa |
|
92 |
atgf |
|
98 |
cgt |
|
22 |
gta
|
38 |
ggc |
|
13 |
caa |
|
** |
atgf |
|
4 |
cgt |
|
46 |
aag
|
25 |
ggc |
|
** |
atgj |
|
40 |
tta |
|
** |
agc |
|
22 |
gta
|
23 |
ggc |
|
2 |
aac |
|
35 |
tgc |
|
38 |
gga |
|
46 |
aag
|
** |
ggc |
|
** |
gga |
|
** |
ggc |
|
** |
tac |
|
32 |
gta
|
|
|
|
123 |
cac |
|
|
|
|
|
|
|
** |
aaa
|
|
|
|
36 |
aga |
|
|
|
|
|
|
|
|
|
|
|
|
** |
cca |
|
|
|
|
|
|
|
|
|
gamma. distribution par génome
gama |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
duplica |
1-3aas |
total
|
spl |
46 |
8 |
|
|
|
6 |
79 |
3 |
142
|
vpb |
60 |
11 |
|
|
|
21 |
22 |
12 |
126
|
vha |
51 |
14 |
|
|
|
26 |
19 |
11 |
121
|
amed |
47 |
16 |
|
|
|
13 |
46 |
5 |
127
|
eal |
25 |
23 |
|
|
|
10 |
23 |
4 |
85
|
eco |
20 |
23 |
|
|
|
10 |
29 |
4 |
86
|
ecoN |
20 |
34 |
|
|
|
17 |
44 |
6 |
121
|
total |
269 |
129 |
0 |
0 |
0 |
103 |
262 |
45 |
808
|
- Lien tableur: gamma distribution du total
- Notes: dans le tableau de droite gaa comprend 33 +16s et 1 +5s.
- Légende:
- - Couleurs du 1er tableau: voir bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Gamma. Distribution du total.
gamma. Distribution du total sans +16s +5s
g1 |
|
t1 |
|
|
|
|
|
a atgi |
11 |
a tct |
|
tat |
|
atgf |
48
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
21 |
b tcc |
14 |
tac |
30 |
tgc |
18
|
f atc |
3 |
j acc |
6 |
aac |
34 |
agc |
11
|
g ctc |
9 |
f ccc |
6 |
cac |
12 |
cgc |
40
|
h gtc |
21 |
n gcc |
16 |
gac |
7 |
ggc |
46
|
i tta |
14 |
c tca |
12 |
taa |
|
tga |
4
|
j ata |
|
k aca |
19 |
aaa |
33 |
aga |
10
|
k cta |
24 |
g cca |
14 |
caa |
23 |
cga |
|
l gta |
34 |
o gca |
|
gaa |
17 |
gga |
14
|
m ttg |
7 |
d tcg |
4 |
tag |
|
tgg |
4
|
n atgj |
19 |
l acg |
4 |
aag |
2 |
agg |
7
|
o ctg |
21 |
h ccg |
4 |
cag |
6 |
cgg |
7
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
4
|
gama7 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
531 |
129 |
0 |
0 |
0 |
0 |
660
|
|
gamma. Distribution du total. +16s +5s (1-3aas)
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
0
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
|
f atc |
23 |
j acc |
9 |
aac |
|
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
2 |
gac |
23 |
ggc |
|
i tta |
|
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
8 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
8 |
o gca |
29 |
gaa |
34 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
8
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama7 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
|
|
|
45 |
|
103 |
148
|
|
gamma. indices du 27.5.20 1183 génomes
g1 |
|
t1 |
|
1183 |
86713 |
1,5 |
0
|
a atgi |
130 |
a tct |
1,7 |
tat |
1,3 |
atgf |
292
|
b att |
0,1 |
i act |
0,5 |
aat |
0,2 |
agt |
|
c ctt |
0,9 |
e cct |
|
cat |
|
cgc |
|
d gtt |
0,5 |
m gct |
|
gat |
|
ggt |
0,5
|
e ttc |
175 |
b tcc |
152 |
tac |
227 |
tgc |
114
|
f atc |
285 |
j acc |
155 |
aac |
311 |
agc |
106
|
g ctc |
102 |
f ccc |
86 |
cac |
115 |
cgt |
298
|
h gtc |
173 |
n gcc |
167 |
gac |
289 |
ggc |
351
|
i tta |
120 |
c tca |
140 |
taa |
1,0 |
tga |
64
|
j ata |
0,8 |
k aca |
141 |
aaa |
377 |
aga |
151
|
k cta |
128 |
g cca |
141 |
caa |
189 |
cga |
13
|
l gta |
321 |
o gca |
283 |
gaa |
324 |
gga |
114
|
m ttg |
103 |
d tcg |
83 |
tag |
2,7 |
tgg |
113
|
n atgj |
170 |
l acg |
71 |
aag |
24 |
agg |
110
|
o ctg |
252 |
h ccg |
62 |
cag |
102 |
cgg |
100
|
p gtg |
8,3 |
p gcg |
6,9 |
gag |
7,6 |
ggg |
72
|
|
inter |
|
max |
|
min |
|
total
|
|
|
|
|
|
|
|
|
|
Gamma. Distribution par type.
gamma. distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
9 |
a tct |
|
tat |
|
atgf |
6
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
7 |
b tcc |
14 |
tac |
|
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
14 |
agc |
|
g ctc |
5 |
f ccc |
6 |
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
|
i tta |
|
c tca |
10 |
taa |
|
tga |
4
|
j ata |
|
k aca |
|
aaa |
|
aga |
6
|
k cta |
|
g cca |
2 |
caa |
1 |
cga |
|
l gta |
|
o gca |
|
gaa |
4 |
gga |
4
|
m ttg |
7 |
d tcg |
4 |
tag |
|
tgg |
2
|
n atgj |
|
l acg |
4 |
aag |
|
agg |
7
|
o ctg |
|
h ccg |
4 |
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
3
|
gama7 |
1aa |
129 |
|
|
|
|
|
|
gamma. distribution du type >1aa sans duplicata.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
18
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
14 |
b tcc |
|
tac |
6 |
tgc |
15
|
f atc |
|
j acc |
5 |
aac |
11 |
agc |
11
|
g ctc |
4 |
f ccc |
|
cac |
12 |
cgt |
2
|
h gtc |
2 |
n gcc |
2 |
gac |
|
ggc |
17
|
i tta |
14 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
19 |
aaa |
15 |
aga |
4
|
k cta |
18 |
g cca |
10 |
caa |
12 |
cga |
|
l gta |
13 |
o gca |
|
gaa |
|
gga |
10
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
19 |
l acg |
|
aag |
2 |
agg |
|
o ctg |
4 |
h ccg |
|
cag |
|
cgg |
7
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
gama7 |
>1aa |
269 |
|
|
|
|
|
|
gamma. distribution du type duplicata
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
24
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
24 |
tgc |
2
|
f atc |
2 |
j acc |
|
aac |
9 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
38
|
h gtc |
19 |
n gcc |
14 |
gac |
4 |
ggc |
29
|
i tta |
|
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
18 |
aga |
|
k cta |
6 |
g cca |
2 |
caa |
10 |
cga |
|
l gta |
21 |
o gca |
|
gaa |
13 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
17 |
h ccg |
|
cag |
6 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama7 |
dupli |
262 |
|
|
|
|
|
|
gamma par rapport au groupe de référence
modifier
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
gama7 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
37 |
18 |
39 |
|
|
2 |
96
|
16 |
moyen |
51 |
104 |
31 |
|
21 |
52 |
259
|
14 |
fort |
41 |
147 |
192 |
|
24 |
49 |
453
|
|
|
129 |
269 |
262 |
|
45 |
103 |
808
|
10 |
g+cga |
15 |
3 |
6 |
|
|
|
24
|
2 |
agg+cgg |
7 |
7 |
|
|
|
|
14
|
4 |
carre ccc |
11 |
8 |
33 |
|
|
2 |
54
|
5 |
autres |
4 |
|
|
|
|
|
4
|
|
|
37 |
18 |
39 |
|
|
2 |
96
|
|
|
total tRNAs ‰ |
|
|
|
|
|
gama7 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
gama ‰ |
ref.‰
|
21 |
faible |
46 |
22 |
48 |
|
|
2 |
119 |
26
|
16 |
moyen |
63 |
129 |
38 |
|
26 |
64 |
321 |
324
|
14 |
fort |
51 |
182 |
238 |
|
30 |
61 |
561 |
650
|
|
|
160 |
333 |
324 |
|
56 |
127 |
808 |
729
|
10 |
g+cga |
19 |
4 |
7 |
|
|
|
30 |
10
|
2 |
agg+cgg |
9 |
9 |
|
|
|
|
17 |
|
4 |
carre ccc |
14 |
10 |
41 |
|
|
2 |
67 |
16
|
5 |
autres |
5 |
|
|
|
|
|
5 |
|
|
|
46 |
22 |
48 |
|
|
2 |
119 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
gama7 |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
56 |
27 |
59 |
142 |
26 |
29 |
7 |
15
|
16 |
moyen |
77 |
158 |
47 |
282 |
324 |
40 |
39 |
12
|
14 |
fort |
62 |
223 |
291 |
576 |
650 |
32 |
55 |
73
|
|
|
195 |
408 |
397 |
660 |
729 |
129 |
269 |
262
|
10 |
g+cga |
23 |
5 |
9 |
36 |
10 |
41 |
|
15
|
2 |
agg+cgg |
11 |
11 |
|
21 |
|
19 |
|
|
4 |
carre ccc |
17 |
12 |
50 |
79 |
16 |
30 |
|
85
|
5 |
autres |
6 |
|
|
6 |
|
11 |
|
|
|
|
56 |
27 |
59 |
142 |
|
37 |
|
39
|
- Lien tableur: gamma, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
gam gamma 144 génomes
gam1 cumul des +rRNAs de la fiche gamma pour 144 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
1 |
tgc |
|
f atc |
373 |
j acc |
57 |
aac |
|
agc |
3
|
g ctc |
|
f ccc |
|
cac |
10 |
cgt |
|
h gtc |
|
n gcc |
3 |
gac |
151 |
ggc |
|
i tta |
1 |
c tca |
3 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
13 |
aga |
|
k cta |
|
g cca |
14 |
caa |
|
cga |
|
l gta |
14 |
o gca |
378 |
gaa |
423 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
73
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
11
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
gama144 |
inter |
|
max |
|
min |
|
total
|
|
900 |
|
622 |
|
14 |
|
1536
|
|
gam2 indices du clade gamma du 27.5.20 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
1183 |
1.5 |
0
|
a atgi |
130 |
a tct |
1.7 |
tat |
1.3 |
atgf |
292
|
b att |
0.1 |
i act |
0.5 |
aat |
0.2 |
agt |
|
c ctt |
0.9 |
e cct |
|
cat |
|
cgc |
|
d gtt |
0.5 |
m gct |
|
gat |
|
ggt |
0.5
|
e ttc |
175 |
b tcc |
152 |
tac |
227 |
tgc |
114
|
f atc |
285 |
j acc |
155 |
aac |
311 |
agc |
106
|
g ctc |
102 |
f ccc |
86 |
cac |
115 |
cgt |
298
|
h gtc |
173 |
n gcc |
167 |
gac |
289 |
ggc |
351
|
i tta |
120 |
c tca |
140 |
taa |
1.0 |
tga |
64
|
j ata |
0.8 |
k aca |
141 |
aaa |
377 |
aga |
151
|
k cta |
128 |
g cca |
141 |
caa |
189 |
cga |
13
|
l gta |
321 |
o gca |
283 |
gaa |
324 |
gga |
114
|
m ttg |
103 |
d tcg |
83 |
tag |
2.7 |
tgg |
113
|
n atgj |
170 |
l acg |
71 |
aag |
24 |
agg |
110
|
o ctg |
252 |
h ccg |
62 |
cag |
102 |
cgg |
100
|
p gtg |
8.3 |
p gcg |
6.9 |
gag |
7.6 |
ggg |
72
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2517 |
|
3550 |
|
1254 |
|
7321
|
|
gam3 cumul des -rRNAs de l'annexe gamma 7 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
11 |
a tct |
|
tat |
|
atgf |
48
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
21 |
b tcc |
14 |
tac |
30 |
tgc |
18
|
f atc |
3 |
j acc |
6 |
aac |
34 |
agc |
11
|
g ctc |
9 |
f ccc |
6 |
cac |
12 |
cgt |
40
|
h gtc |
21 |
n gcc |
16 |
gac |
7 |
ggc |
46
|
i tta |
14 |
c tca |
12 |
taa |
|
tga |
4
|
j ata |
|
k aca |
19 |
aaa |
33 |
aga |
10
|
k cta |
24 |
g cca |
14 |
caa |
23 |
cga |
|
l gta |
34 |
o gca |
|
gaa |
17 |
gga |
14
|
m ttg |
7 |
d tcg |
4 |
tag |
|
tgg |
4
|
n atgj |
19 |
l acg |
4 |
aag |
2 |
agg |
7
|
o ctg |
21 |
h ccg |
4 |
cag |
6 |
cgg |
7
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
4
|
gama7 |
inter |
|
max |
|
min |
|
total
|
|
186 |
|
380 |
|
94 |
|
660
|
|
gam4 indices des +rRNAs de la fiche gamma pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
|
tac |
1 |
tgc |
18
|
f atc |
259 |
j acc |
40 |
aac |
|
agc |
2
|
g ctc |
|
f ccc |
|
cac |
7 |
cgt |
40
|
h gtc |
|
n gcc |
2 |
gac |
105 |
ggc |
46
|
i tta |
1 |
c tca |
2 |
taa |
|
tga |
4
|
j ata |
|
k aca |
|
aaa |
9 |
aga |
10
|
k cta |
|
g cca |
10 |
caa |
|
cga |
|
l gta |
10 |
o gca |
263 |
gaa |
294 |
gga |
14
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
51
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
7
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
8
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
4
|
gama144 |
inter |
|
max |
|
min |
|
total
|
|
625 |
|
432 |
|
10 |
|
1067
|
|
gam5 estimation des -rRNA du clade gamma pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
130 |
a tct |
1.7 |
tat |
1.3 |
atgf |
290
|
b att |
0.1 |
i act |
0.5 |
aat |
0.2 |
agt |
|
c ctt |
0.9 |
e cct |
|
cat |
|
cgc |
|
d gtt |
0.5 |
m gct |
|
gat |
|
ggt |
0.5
|
e ttc |
173 |
b tcc |
152 |
tac |
226 |
tgc |
114
|
f atc |
26 |
j acc |
115 |
aac |
311 |
agc |
104
|
g ctc |
102 |
f ccc |
86 |
cac |
108 |
cgt |
298
|
h gtc |
173 |
n gcc |
165 |
gac |
184 |
ggc |
351
|
i tta |
119 |
c tca |
138 |
taa |
|
tga |
64
|
j ata |
0.8 |
k aca |
141 |
aaa |
368 |
aga |
151
|
k cta |
128 |
g cca |
131 |
caa |
189 |
cga |
13
|
l gta |
311 |
o gca |
21 |
gaa |
30 |
gga |
114
|
m ttg |
102 |
d tcg |
83 |
tag |
|
tgg |
62
|
n atgj |
169 |
l acg |
71 |
aag |
24 |
agg |
110
|
o ctg |
252 |
h ccg |
62 |
cag |
102 |
cgg |
92
|
p gtg |
8.3 |
p gcg |
6.9 |
gag |
7.6 |
ggg |
72
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1892 |
|
3118 |
|
1244 |
|
6254
|
|
gam6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
157 |
a tct |
|
tat |
|
atgf |
686
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
0.5
|
e ttc |
300 |
b tcc |
200 |
tac |
429 |
tgc |
257
|
f atc |
43 |
j acc |
86 |
aac |
486 |
agc |
157
|
g ctc |
129 |
f ccc |
86 |
cac |
171 |
cgt |
571
|
h gtc |
300 |
n gcc |
229 |
gac |
100 |
ggc |
657
|
i tta |
200 |
c tca |
171 |
taa |
|
tga |
57
|
j ata |
|
k aca |
271 |
aaa |
471 |
aga |
143
|
k cta |
343 |
g cca |
200 |
caa |
329 |
cga |
13
|
l gta |
486 |
o gca |
|
gaa |
243 |
gga |
200
|
m ttg |
100 |
d tcg |
57 |
tag |
|
tgg |
57
|
n atgj |
271 |
l acg |
57 |
aag |
29 |
agg |
100
|
o ctg |
300 |
h ccg |
57 |
cag |
86 |
cgg |
100
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
57
|
gama7 |
inter |
|
max |
|
min |
|
total
|
|
2657 |
|
5429 |
|
1343 |
|
9429
|
|
gamma, comparaison clade-annexe des -rRNAs
modifier
- Lien tableur: gamma, comparaison clade-annexe des -rRNAs
- Légende
- - gam7. diff, somme des couleurs de gam7. La différence entre tRNAs est faite entre gam5 et gam6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - gam8. rap, rapport des sommes couleurs gam5/gam2. Le rapport -rRNA/total est celui du tRNA de gam5 sur celui de gam2.
- Fréquences des différences en % du tableau gam7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 0 7 7 6 8 10 2 1 0 1 6 0 48
tot ≤ 50 38
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 62% au dessus de celle de la fiche des gamma.
tRNAs fiche annexe
sans 8335 660
avec 1401 148
genomes 144 7
indice % 58 94
gam gamma 63 génomes
gam7 gamma, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
17 |
a tct |
100 |
tat |
100 |
atgf |
58
|
b att |
100 |
i act |
100 |
aat |
100 |
agt |
|
c ctt |
100 |
e cct |
|
cat |
|
cgc |
|
d gtt |
100 |
m gct |
|
gat |
|
ggt |
100
|
e ttc |
42 |
b tcc |
24 |
tac |
47 |
tgc |
56
|
f atc |
39 |
j acc |
26 |
aac |
36 |
agc |
34
|
g ctc |
21 |
f ccc |
0 |
cac |
37 |
cgt |
48
|
h gtc |
42 |
n gcc |
28 |
gac |
46 |
ggc |
47
|
i tta |
40 |
c tca |
20 |
taa |
|
tga |
11
|
j ata |
100 |
k aca |
48 |
aaa |
22 |
aga |
5
|
k cta |
63 |
g cca |
34 |
caa |
42 |
cga |
100
|
l gta |
36 |
o gca |
100 |
gaa |
88 |
gga |
43
|
m ttg |
2 |
d tcg |
31 |
tag |
|
tgg |
8
|
n atgj |
38 |
l acg |
20 |
aag |
16 |
agg |
9
|
o ctg |
16 |
h ccg |
8 |
cag |
16 |
cgg |
8
|
p gtg |
100 |
p gcg |
100 |
gag |
100 |
ggg |
21
|
diff |
inter |
|
max |
|
min |
|
total
|
|
425 |
|
656 |
|
229 |
|
1310
|
|
gam8 gamma, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
99
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
99 |
b tcc |
|
tac |
|
tgc |
|
f atc |
9 |
j acc |
74 |
aac |
|
agc |
98
|
g ctc |
|
f ccc |
|
cac |
94 |
cgt |
|
h gtc |
|
n gcc |
99 |
gac |
64 |
ggc |
|
i tta |
99 |
c tca |
99 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
98 |
aga |
|
k cta |
|
g cca |
93 |
caa |
|
cga |
|
l gta |
97 |
o gca |
7 |
gaa |
9 |
gga |
|
m ttg |
99 |
d tcg |
|
tag |
|
tgg |
55
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
92
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
rap |
inter |
|
max |
|
min |
|
total
|
|
75 |
|
88 |
|
99 |
|
85
|
|
Intergen51. Historique des pré-études
modifier
total max1 reste max2 un
spl 2482 1016 12 2727 3180
eco 2204 602 11 846 852
ecoN 2822 847 14 1486 1847
eal 2286 1073 11 1791 2324
vpb1 1757 799 9 1347 1605
vpb2 828 1030 4 1427 1439
vha1 1945 821 10 1507 2251
vha2 1075 914 5 1262 2682
amed 2382 815 12 2076 2281
gamma données intercalaires 200
modifier
Intergen51. Gamma vue de l'ensemble
modifier
Intergen51. La longueur totale des intercalaires d'un génome
modifier
- Légende: intercals pour longueur totale des intercalaires positifs en pdb et génome pour celle de l'ADN du génome donnée par NCBI
- Note: Les 9 éléments ont un taux autour de 12%
Nom intercals génome taux en %
amed 601 332 4 777 154 12,6
eal 594 081 4 701 875 12,6
eco 501 283 4 641 652 10,8
ecoN 646 219 5 441 200 11,9
spl 789 212 5 174 581 15,3
vha1 499 733 3 765 351 13,3
vha2 317 649 2 204 018 14,4
vpb1 403 530 3 297 305 12,2
vpb2 242 529 1 806 219 13,4
Intergen51. Gamma les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. Gamma les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
- - taux des R-: c-/c = 100*2/301 = 0.7 et x-/x = 100*1/208 = 0.5.
Int51.2 Gamma les différents types d'intercalaires entre gène de 7 génomes
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
17 644 |
4 048 |
137 |
21 829 |
2,2 |
695 |
58 |
753
|
x |
9 203 |
450 |
52 |
9 705 |
|
0 |
42 |
42
|
t |
26 847 |
4 498 |
189 |
31 534 |
|
695 |
100 |
795
|
% |
85,1 |
14,3 |
0,6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
297 |
2 |
2 |
301 |
1,4 |
tRNA-CDS |
509 |
21
|
x |
207 |
1 |
0 |
208 |
|
RNA-RNA |
695 |
29
|
t |
504 |
3 |
2 |
509 |
|
CDS-rRNA |
100 |
4
|
% |
99,0 |
0,6 |
0,4 |
|
|
non RNA |
1 112 |
46
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
c |
6,0 |
15,6 |
1,3 |
28,5 |
3,7 |
64 |
0,6 |
0,7
|
x |
11,3 |
17,3 |
7,8 |
5,6 |
2,4 |
39 |
0,5 |
0,0
|
|
Intergen51. Gamma Détail des intercalaires RNA-RNA et CDS-rRNA
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 62 CDS 16s 37 24
16s 23s 11 5s CDS 14 18
16s tRNA 54 16 CDS
tRNA 23s 51 CDS 5s
5s tRNA 36 23s CDS 2
tRNA in 45 CDS 23s
tRNA contig 11 5s 16s 4
tRNA hors 414 16s16s 1
tRNA 16s 1
23s tRNA
tRNA 5s 10
16s 5s
5s 23s
5s 5s
total 695 0 total 58 42
Intergen51. Gamma Les intercalaires rares
modifier
tRNA-CDS
gen x- c- zéro c
spl -23
ecoN 2
vha2 -36
amed -21
16s16s c+
vha1 0
Intergen51. Les diagrammes des gamma
modifier
Intergen51. Les diagrammes CDS-CDS et tRNA-CDS
modifier
Intergen51. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
- Lien aux données intercalaires.
- Diagrammes des gamma: tg présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1
R2 x3 x2 x c Inflexion poly3 x c
0,790 3,47E-06 -2,26E-03 3,24E-01 22,6 fx1 abscisse 534,8 55,7
0,828 -5,39E-06 4,14E-03 1,06E+00 101,0 fc1 ordonnée 4,7 39,3
poly3/droite -12,8 35,3
0,963 -3,16E-07 5,07E-04 -2,86E-01 61,0 fx41
0,976 5,33E-07 -8,91E-05 -1,60E-01 48,4 fc41 R2 f.1 x c
Poly 3 790 828
0,908 -1,12E-01 47,1 fx41 Poly 6 899 970
0,925 -1,09E-01 41,4 fc41 Poly 9 977 986
0,650 -8,30E-02 39,1 fx1
0,650 -1,68E-01 57,8 fc1
Intergen51. Gamma CDS-CDS négatifs
modifier
Intergen51. Gama comparaison avec la totale
modifier
- Lien aux données intercalaires.
- Gamma se distingue de la totale par le 4/1 des négatifs c, avec 1.6 contre 2.6
Sous-totaux gama totale
fréquence x- c- x- c-
-1 2 1 002 4 4 140
-2 16 5 85 11
-3 2 2 3 12
-4 152 1 572 717 10 938
-5 2 4 5 19
sp6 276 1 463 1 642 8 424
total 450 4 048 2 456 23 544
reste 35 53 264 420
s6 84 5 361 41
s7 44 270 321 1 438
s8 113 1 135 696 6 525
rapport s1-5
4/2/1 9,5 1,6 8,4 2,6
% / sp6
s6/sp6 30,4 0,3 22,0 0,5
s7/sp6 15,9 18,5 19,5 17,1
s8/sp6 40,9 77,6 42,4 77,5
reste/sp6 12,7 3,6 16,1 5,0
total s1-5 174 2 585 814 15 120
% / total
%s1-5 38,7 63,9 33,1 64,2
%sp6 61,3 36,1 66,9 35,8
Intergen51. Gama homogénéité des génomes
modifier
- Lien aux données intercalaires des génomes
- Grande homogénéité des génomes qui confirme la faiblesse du 4/1 des continus, à part amed avec 2.3 proche de 2.6 la totale.
négatifs x amed spl eco ecoN eal vpb1 vpb2 vha1 vha2 total
total 42 12 95 105 119 13 14 25 25 450
s1-5 9 7 45 49 43 2 5 9 5 174
sp6 33 5 50 56 76 11 9 16 20 276
rapport s1-5
4/2 8.0 2.5 21.5 9.8 9.8 - 4.0 - 1.5 9.5
% / sp6
s6 24 20 28 32 30 27 33 44 35 30
s7 27 0 12 18 21 9 0 6 5 16
s8 36 60 34 41 39 55 56 50 60 41
reste 12 20 26 9 9 9 11 0 0 13
% / total
s1-5 21 58 47 47 36 15 36 36 20 39
sp6 79 42 53 53 64 85 64 64 80 61
négatifs c amed spl eco ecoN eal vpb1 vpb2 vha1 vha2 total
total 444 414 647 782 617 344 171 402 227 4048
s1-5 303 262 422 508 407 198 103 242 140 2585
sp6 141 152 225 274 210 146 68 160 87 1463
rapport s1-5
4/1 2.3 1.1 1.6 1.9 1.6 1.4 1.1 1.4 1.2 1.6
% / sp6
s6 0 0 0 2 0 0 0 0 0 0
s7 23 20 21 19 20 14 9 17 14 18
s8 72 77 68 76 78 86 91 83 86 78
reste 4 3 11 4 2 0 0 0 0 4
% / total
s1-5 68 63 65 65 66 58 60 60 62 64
sp6 32 37 35 35 34 42 40 40 38 36
Intergen51. Gama Les grands négatifs inférieurs à -120
modifier
Intergen51. Les diagrammes CDS-rRNA
modifier
Intergen51. Gamma. Les diagrammes CDS-16s
modifier
gama CDS16sc CDS16sx 5sCDSc 5sCDSx
R2 - - - -
moyenne 473,0 533,2 186,8 221,5
plage 360-690 450-630 30-390 60-480
total-p 31 17 12 14
% 84 71 86 78
queue 4 3 2 2
% 11 12,5 14 11
tête 2 4 0 0
% 5,4 16,7 0 0
max 390;9 480;4 90;4 120;6
total7 37 24 14 18
freq 30 30 30 30
- Les moyennes CDS-16s par génome
Intergen51.gamma. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
560,3 |
63,6 |
8,8 |
3x481-516 |
626:627 |
|
35,4 |
72,9
|
eal |
386,8 |
103,2 |
3,7 |
264 |
339 |
467:471 |
209,0 |
-100,7
|
eco |
522,3 |
79,5 |
6,6 |
473:480 |
614 |
|
73,4 |
34,9
|
ecoN |
298 |
256,0 |
1,2 |
117 |
479 |
|
297,7 |
-189,4
|
spl |
821,5 |
250,6 |
3,3 |
614 |
687:807 |
1178:*1908 |
-225,8 |
334,1
|
vha1 |
523,0 |
43,8 |
11,9 |
492 |
554 |
|
72,7 |
35,6
|
vha2 |
|
|
|
|
|
|
|
|
vpb1 |
526,0 |
42,4 |
12,4 |
496 |
556 |
|
69,7 |
38,6
|
vpb2 |
|
|
|
|
|
|
|
|
total |
541,6 |
197,1 |
2,7 |
|
|
|
595,7 |
487,4
|
|
CDS16sc. continu
CDS16sc |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
488,4 |
72,1 |
6,8 |
424:432 |
469:518 |
599 |
63,5 |
36,8
|
eal |
298,3 |
119,0 |
2,5 |
161 |
364:370 |
|
253,6 |
-153,2
|
eco |
388,5 |
36,2 |
10,7 |
362 |
373:377 |
442 |
163,4 |
-63,1
|
ecoN |
435,7 |
118,9 |
3,7 |
4x365-385 |
441 |
672 |
116,2 |
-15,9
|
spl |
665,6 |
301,2 |
2,2 |
206 |
611:647 |
876:988 |
-113,7 |
214,0
|
vha1 |
584,3 |
146,6 |
4,0 |
4x451-557 |
631:853 |
|
-32,4 |
132,8
|
vha2 |
448 |
|
|
448 |
|
|
103,9 |
-3,6
|
vpb1 |
551,5 |
136,6 |
4,0 |
4x454-504 |
575:817 |
|
0,4 |
99,9
|
vpb2 |
468 |
|
|
468 |
|
|
83,9 |
16,4
|
total |
501,7 |
173,5 |
2,9 |
|
|
|
551,9 |
451,6
|
|
Intergen51. Les diagrammes 5s-CDS
modifier
- Lien aux données intercalaires.
- Comparaison avec les tRNA-CDS
- - Les équations des polynômes de d°3
- fct f(x) = 1.16E-06 x3 – 9,33E-04 x2 + 1,98E-01 x – 2,05
- fxt f(X) = -2.37E-07 x3 + 7.01E-05 x2 + 6.66E-03 x +3.00E+00
- - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
gama fct fxt 5sCDSc 5sCDSx
R2 0,509 0,105 - -
xs 145,7 236,8 186,8 221,5
plage 80-240 40-370 30-390 60-480
total-p 170 162 12 14
% 56 78 86 78
queue 103 40 2 2
% 34 19 14 11
tête 24 5 0 0
% 8,0 2,4 0 0
max 160;18 100;10 90;4 120;6
total7 301 208 14 18
freq 10 10 30 30
Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
- Lien tableur: Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
- Légende:
- - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
- - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
- - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
- + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
- + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
- + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
- + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
- + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
- - Les colonnes f*t-f* représentent la différence entre les 2 moyennes.
- - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
- Note: Sommes des différences f*t-f*, positives et négatives, dans les tableaux correspondants
fct-fc 509,0
fct-fc -0
fxt-fx 804,9
fxt-fx -0
Intergen51.gamma Comparaison 5s-CDS tRNA-CDS CDS-CDS
fxt. tRNA-CDS discontinu
fxt |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
amed |
215,8 |
114,5 |
1,9 |
0 |
0 |
71,6 |
-19,3
|
eal |
213,1 |
140,6 |
1,5 |
2 |
0 |
74,3 |
-22,1
|
eco |
243,8 |
133,8 |
1,8 |
3 |
1 |
43,5 |
8,7
|
ecoN |
259,6 |
117,9 |
2,2 |
6 |
3 |
27,8 |
24,4
|
spl |
300,0 |
140,1 |
2,1 |
1 |
3 |
-12,6 |
64,9
|
vha1 |
277,3 |
152,6 |
1,8 |
0 |
0 |
10,0 |
42,2
|
vha2 |
329,8 |
40,5 |
8,1 |
0 |
0 |
-42,4 |
94,7
|
vpb1 |
288,7 |
166,5 |
1,7 |
0 |
1 |
-1,3 |
53,6
|
vpb2 |
487,0 |
141,3 |
3,4 |
2 |
0 |
-237,7 |
283,1
|
total |
261,2 |
141,9 |
1,8 |
|
++ |
287,4 |
235,1
|
|
5sCDSx. 5s-CDS discontinu
5sCDSx |
moyenne |
écart |
m/e |
intercalaires |
-
|
amed |
183,5 |
119,5 |
1,5 |
99 |
268 |
|
|
eal |
223,7 |
204,8 |
1,1 |
98:113 |
460 |
|
|
eco |
192,7 |
98,9 |
1,9 |
81 |
228:269 |
|
|
ecoN |
83,0 |
29,7 |
2,8 |
62 |
104 |
|
|
spl |
387,8 |
77,8 |
5,0 |
304:339 |
2x454 |
*768:798 |
|
vha1 |
101 |
|
|
101 |
|
|
|
vha2 |
|
|
|
|
|
|
|
vpb1 |
110 |
|
|
110 |
|
|
|
vpb2 |
|
|
|
|
|
|
|
total |
221,5 |
145,6 |
1,5 |
++ |
243,7 |
199,4 |
-
|
|
fct. tRNA-CDS continu
fct |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
amed |
201,0 |
117,5 |
1,7 |
1 |
2 |
48,2 |
-2,9
|
eal |
212,5 |
133,7 |
1,6 |
1 |
0 |
36,8 |
8,5
|
eco |
187,9 |
105,6 |
1,8 |
1 |
2 |
61,3 |
-16,0
|
ecoN |
214,4 |
127,2 |
1,7 |
4 |
2 |
34,9 |
10,4
|
spl |
298,3 |
187,7 |
1,6 |
0 |
4 |
-49,1 |
94,4
|
vha1 |
238,1 |
138,9 |
1,7 |
1 |
1 |
11,2 |
34,1
|
vha2 |
254,0 |
125,2 |
2,0 |
1 |
0 |
-4,7 |
50,1
|
vpb1 |
253,9 |
138,9 |
1,8 |
3 |
1 |
-4,6 |
49,9
|
vpb2 |
266,3 |
77,7 |
3,4 |
1 |
1 |
-17,1 |
62,4
|
total |
226,6 |
137,5 |
1,6 |
|
++ |
249,3 |
203,9
|
|
5sCDSc. 5s-CDS continu
5sCDSc |
moyenne |
écart |
m/e |
intercalaires |
-
|
amed |
275,0 |
111,0 |
2,5 |
164 |
275 |
386 |
|
eal |
178,0 |
172,5 |
1,0 |
56 |
300 |
|
|
eco |
187,0 |
159,8 |
1,2 |
74 |
300 |
|
|
ecoN |
137,4 |
107,0 |
1,3 |
3x76 |
136 |
323 |
|
spl |
*715 |
17,0 |
42,1 |
*703 |
*727 |
|
|
vha1 |
|
|
|
|
|
|
|
vha2 |
|
|
|
|
|
|
|
vpb1 |
|
|
|
|
|
|
|
vpb2 |
|
|
|
|
|
|
|
total |
186,8 |
121,1 |
1,5 |
++ |
205,5 |
168,2 |
-
|
|
fx. CDS-CDS discontinu
fx |
moyenne |
écart |
m/e |
fxt-fx |
Sup 700 |
haut |
bas
|
amed |
183,3 |
129,6 |
1,41 |
32,5 |
16 |
36,4 |
3,5
|
eal |
198,0 |
142,2 |
1,39 |
15,1 |
26 |
21,8 |
18,2
|
eco |
185,9 |
118,7 |
1,57 |
57,9 |
9 |
33,8 |
6,1
|
ecoN |
199,8 |
138,9 |
1,44 |
59,8 |
35 |
19,9 |
20,0
|
spl |
227,7 |
147,9 |
1,54 |
72,3 |
48 |
-7,9 |
47,9
|
vha1 |
205,7 |
144,3 |
1,43 |
71,7 |
26 |
14,1 |
25,9
|
vha2 |
213,6 |
152,5 |
1,40 |
116,2 |
20 |
6,1 |
33,8
|
vpb1 |
195,2 |
146,0 |
1,34 |
93,5 |
12 |
24,5 |
15,4
|
vpb2 |
201,0 |
142,8 |
1,41 |
286,0 |
11 |
18,7 |
21,3
|
total |
199,8 |
138,8 |
1,44 |
61,5 |
|
219,7 |
179,8
|
|
fc. CDS-CDS continu
fc |
moyenne |
écart |
m/e |
fct-fc |
Sup 700 |
haut |
bas
|
amed |
165,4 |
113,5 |
1,5 |
35,6 |
23 |
30,3 |
5,3
|
eal |
175,7 |
129,9 |
1,4 |
36,8 |
34 |
20,0 |
15,6
|
eco |
161,6 |
111,5 |
1,4 |
26,3 |
3 |
34,1 |
1,5
|
ecoN |
164,0 |
121,1 |
1,4 |
50,3 |
26 |
31,7 |
3,9
|
spl |
201,0 |
142,9 |
1,4 |
97,4 |
58 |
-5,3 |
40,8
|
vha1 |
189,3 |
136,6 |
1,4 |
48,8 |
19 |
6,4 |
29,1
|
vha2 |
188,8 |
136,8 |
1,4 |
65,2 |
17 |
6,9 |
28,7
|
vpb1 |
177,7 |
120,7 |
1,5 |
76,2 |
17 |
18,0 |
17,6
|
vpb2 |
193,9 |
131,6 |
1,5 |
72,5 |
12 |
1,8 |
33,7
|
total |
177,9 |
127,5 |
1,4 |
48,7 |
|
195,7 |
160,1
|
|
23sCDSc tRNA16sc 16s16sc
331 1063 0
385
Intergen51. Les diagrammes RNA-RNA
modifier
Intergen51. Gamma. Les diagrammes rRNA-rRNA
modifier
gama 16s23s 16stRNA tRNA23sc 23s5sc
R2 - - - -
moyenne 332,3 118,7 243,8 118,0
plage 280-360 80-140 180-340 80-180
total-p 10 43 49 61
% 91 80 96 98
queue 1 11 2 1
% 9,1 20 4,0 1,6
tête 0 0 0 0
% 0 0 0 0
max 360;7 80;19 200;18 100;27
total7 11 54 51 61
freq 20 20 20 20
Intergen51. Les diagrammes rRNA-RNA
modifier
Intergen51.gamma. Moyennes rRNA-RNA
16s23s.
16s23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
|
|
|
|
|
|
|
|
eal |
|
|
|
|
|
|
|
|
eco |
|
|
|
|
|
|
|
|
ecoN |
|
|
|
|
|
|
|
|
spl |
353,0 |
12,5 |
28,2 |
7x348-349 |
384 |
|
12,5 |
54,0
|
vha1 |
|
|
|
|
|
|
|
|
vha2 |
|
|
|
|
|
|
|
|
vpb1 |
277 |
|
|
3x277 |
|
|
88,5 |
-22,0
|
vpb2 |
|
|
|
|
|
|
|
|
total |
332,3 |
37,0 |
9,0 |
|
|
|
365,5 |
299,0
|
|
23s5s.
23s5s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
123,4 |
2,6 |
48,3 |
9x120-127 |
|
|
6,3 |
17,3
|
eal |
169 |
|
|
7x169 |
|
|
-39,3 |
62,8
|
eco |
92,4 |
0,5 |
172,9 |
7x92-93 |
|
|
37,3 |
-13,7
|
ecoN |
95 |
|
|
6x95 |
*1881 |
|
34,7 |
-11,2
|
spl |
136,3 |
13,5 |
10,1 |
10x132-133 |
177 |
|
-6,5 |
30,1
|
vha1 |
121,0 |
15,0 |
8,1 |
2x95 |
7x125-135 |
|
8,7 |
14,8
|
vha2 |
95 |
|
|
95 |
|
|
34,7 |
-11,2
|
vpb1 |
91 |
|
|
10x91 |
|
|
38,7 |
-15,2
|
vpb2 |
91 |
|
|
91 |
|
|
38,7 |
-15,2
|
total |
118,0 |
26,5 |
4,4 |
|
|
|
129,7 |
106,2
|
|
16stRNA.
16stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
183,3 |
81,0 |
2,3 |
3x72 |
7x198-274 |
|
-52,7 |
76,5
|
eal |
78,3 |
8,4 |
9,3 |
7x68-85 |
|
|
52,3 |
-28,6
|
eco |
102,3 |
47,6 |
2,2 |
5x68-85 |
2x171 |
|
28,3 |
-4,6
|
ecoN |
149,4 |
148,3 |
1,0 |
7x68-85 |
375 |
443 |
-18,8 |
42,6
|
spl |
74 |
|
|
3x74 |
|
|
56,6 |
-32,8
|
vha1 |
105,8 |
21,3 |
5,0 |
65 |
5x91-102 |
3x127-134 |
24,8 |
-1,1
|
vha2 |
123 |
|
|
123 |
|
|
7,6 |
16,2
|
vpb1 |
83,3 |
12,8 |
6,5 |
2x65 |
5x89 |
97 |
47,3 |
-23,6
|
vpb2 |
89 |
|
|
89 |
|
|
41,6 |
-17,8
|
total |
118,7 |
79,4 |
1,5 |
|
|
|
130,6 |
106,9
|
|
tRNA23s.
tRNA23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
238,8 |
5,0 |
47,3 |
8x236-238 |
252 |
|
29,4 |
19,4
|
eal |
192,9 |
6,4 |
30,1 |
3x186 |
4x198 |
|
75,3 |
-26,5
|
eco |
186,1 |
7,2 |
25,8 |
174 |
3x183-184 |
3x193 |
82,0 |
-33,3
|
ecoN |
200,0 |
31,3 |
6,4 |
174 |
5x183-194 |
269 |
68,2 |
-19,4
|
spl |
359,3 |
20,2 |
17,8 |
336 |
2x371 |
|
-91,2 |
139,9
|
vha1 |
290,8 |
21,0 |
13,8 |
3x260-272 |
6x296-317 |
|
-22,6 |
71,4
|
vha2 |
313 |
|
|
313 |
|
|
-44,8 |
93,6
|
vpb1 |
280,0 |
26,6 |
10,5 |
5x264-265 |
2x319 |
|
-11,8 |
60,6
|
vpb2 |
263 |
|
|
263 |
|
|
5,2 |
43,6
|
total |
243,8 |
53,8 |
4,5 |
|
|
|
268,2 |
219,4
|
|
Intergen51. Gamma. Les diagrammes tRNA-tRNA
modifier
type c S40 % R2 diag total reste x+ restes 5stRNA hors contig tRNA 5s
hors 213 51 0,656 260 414 4 - 151 479 1472 777
contig 4 36 - 70 11 2 - 539 2351 1112
in 24 53 - 70 45 0 - 634 1360
5stRNA 14 39 - 120 36 1 - 1172
tRNA5s 5 50 - 60 10 3 -
Pourcentage des tRNA-tRNA hors blocs
modifier
tRNA h amed spl eco ecoN eal vpb vha vpb2 vha2 total %
20 14 15 12 13 11 9 10 1 1 84 20.3
40 27 27 10 16 8 24 17 129 31.2
60 14 29 6 9 7 21 16 1 102 24.6
80 2 3 1 4 1 9 6 2 26 6.3
100 3 8 0 0 1 3 6 1 21 5.1
120 8 14 1 1 1 25 6.0
140 1 4 2 0 0 7 2
160 0 0 2 0 1 1 4 1
180 1 1 0
200 1 2 1 1 1 5 1
220 1 1 2 1 5 1
240 0 0 0
260 1 1 0
reste 4 4 1
total 69 108 37 43 33 67 57 3 4 414 100
repete 8 9 8 13 8 4 5 0 1 55 48
séquence 3 7 2 2 2 4 5 0 0 25 22
sans 9 5 4 3 4 7 3 3 1 35 30
clusters 20 21 14 18 14 15 13 3 2 115 100
Les moyennes des tRNA-tRNA par génome
modifier
Intergen51.gamma. Moyennes tRNA-tRNA
5stRNA
5stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
100,6 |
5,1 |
19,8 |
95 |
2x98 |
2x106 |
-35,2 |
47,1
|
eal |
52 |
57,2 |
1,5 |
2x52 |
*151 |
|
13,4 |
-1,5
|
eco |
38,7 |
23,1 |
1,7 |
12 |
2x52 |
|
26,7 |
-14,8
|
ecoN |
33,8 |
22,8 |
1,5 |
2x14 |
53:54 |
|
31,6 |
-19,7
|
spl |
89,3 |
18,5 |
4,8 |
68 |
2x100 |
|
-24,0 |
35,9
|
vha1 |
55,0 |
30,8 |
1,8 |
5x31-32 |
68 |
91:100 |
10,4 |
1,5
|
vha2 |
90 |
|
|
90 |
|
|
-24,6 |
36,5
|
vpb1 |
43,8 |
26,5 |
1,7 |
6x30 |
69 |
100 |
21,6 |
-9,7
|
vpb2 |
69 |
|
|
69 |
|
|
-3,6 |
15,5
|
total |
59,4 |
31,3 |
1,9 |
|
|
|
65,4 |
53,5
|
|
tRNA contigu
tRNA cont |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
|
|
|
|
|
|
|
|
eal |
11 |
|
|
11 |
|
|
35,1 |
-26,7
|
eco |
|
|
|
|
|
|
|
|
ecoN |
30,7 |
19,6 |
1,6 |
8 |
2x42 |
*1472:2351 |
15,4 |
-7,0
|
spl |
|
|
|
|
|
|
|
|
vha1 |
51,5 |
23,3 |
2,2 |
35 |
68 |
|
-5,4 |
13,8
|
vha2 |
|
|
|
|
|
|
|
|
vpb1 |
57,0 |
19,1 |
3,0 |
35 |
2x68 |
|
-10,9 |
19,3
|
vpb2 |
|
|
|
|
|
|
|
|
total |
41,9 |
23,0 |
1,8 |
|
|
|
46,1 |
37,7
|
|
tRNA intra cluster
tRNA in |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
amed |
10 |
|
|
3x10 |
|
|
23,7 |
-17,6
|
eal |
45 |
|
|
3x45 |
|
|
-11,3 |
17,4
|
eco |
42 |
|
|
3x42 |
|
|
-8,3 |
14,4
|
ecoN |
42 |
|
|
4x42 |
|
|
-8,3 |
14,4
|
spl |
65 |
|
|
3x65 |
|
|
-31,3 |
37,4
|
vha1 |
30,5 |
16,6 |
1,8 |
5x43 |
4x2-9 |
4x30-41 |
3,2 |
2,9
|
vha2 |
20,3 |
16,8 |
1,2 |
2 |
24 |
35 |
13,4 |
-7,2
|
vpb1 |
21,8 |
16,3 |
1,3 |
2x41 |
4x2-14 |
|
12,0 |
-5,8
|
vpb2 |
10,7 |
7,6 |
1,4 |
2 |
14 |
16 |
23,0 |
-16,9
|
total |
30,6 |
18,5 |
1,7 |
|
|
|
33,7 |
27,6
|
|
tRNA hors cluster
tRNA hors |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
amed |
43,0 |
29,5 |
1,5 |
69 |
80 |
1 |
4,3 |
4,3
|
eal |
33,6 |
27,5 |
1,2 |
33 |
79 |
4 |
13,7 |
-5,1
|
eco |
29,8 |
24,3 |
1,2 |
37 |
76 |
7 |
17,5 |
-8,9
|
ecoN |
33,3 |
22,9 |
1,5 |
43 |
88 |
0 |
14,0 |
-5,4
|
spl |
52,3 |
29,9 |
1,7 |
108 |
66 |
12 |
-5,0 |
13,6
|
vha1 |
45,8 |
24,3 |
1,9 |
53 |
77 |
1 |
1,6 |
7,1
|
vha2 |
51,7 |
46,0 |
1,1 |
4 |
50 |
1 |
-4,3 |
13,0
|
vpb1 |
43,1 |
19,6 |
2,2 |
64 |
83 |
1 |
4,2 |
4,4
|
vpb2 |
49,7 |
40,4 |
1,2 |
3 |
100 |
0 |
-2,3 |
11,0
|
total |
43,0 |
27,2 |
1,6 |
414 |
76 |
27 |
47,3 |
38,7
|
|