En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : bacilli
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/bacilli », n'a pu être restituée correctement ci-dessus.
Tanger le 21.10.19
B1. Bacillus subtilis subsp. subtilis str. 168
43.6%GC |
7.3.19 Paris |
86 |
doubles |
intercal
|
|
9810..11364 |
16s |
@2 |
99
|
|
11464..11540 |
atc |
|
11
|
|
11552..11627 |
gca |
|
81
|
|
11709..14636 |
23s |
|
55
|
|
14692..14810 |
5s |
|
|
|
|
|
|
|
|
22292..22384 |
tca |
|
|
|
|
|
|
|
|
30279..31832 |
16s |
|
99
|
|
31932..32008 |
atc |
|
11
|
|
32020..32095 |
gca |
|
81
|
|
32177..35103 |
23s |
|
133
|
|
35237..35355 |
5s |
|
|
|
|
|
|
|
|
70181..70257 |
atg |
|
9
|
|
70267..70338 |
gaa |
|
|
|
|
|
|
|
|
90536..92089 |
16s |
@1 |
164
|
|
92254..95181 |
23s |
|
55
|
|
95237..95354 |
5s |
|
20
|
|
95375..95450 |
gta |
|
4
|
|
95455..95530 |
aca |
|
36
|
|
95567..95642 |
aaa |
|
6
|
|
95649..95731 |
cta |
|
40
|
|
95772..95846 |
ggc |
|
14
|
|
95861..95946 |
tta |
|
9
|
|
95956..96032 |
cgt |
|
27
|
|
96060..96136 |
cca |
|
9
|
|
96146..96221 |
gca |
|
170
|
|
96392..97945 |
16s |
|
164
|
|
98110..101037 |
23s |
|
55
|
|
101093..101211 |
5s |
|
|
|
|
|
|
|
|
160893..162445 |
16s |
|
164
|
|
162610..165535 |
23s |
|
55
|
|
165591..165707 |
5s |
|
46
|
|
165754..165825 |
aac |
|
4
|
|
165830..165902 |
acc |
|
56
|
|
165959..166033 |
ggc |
|
30
|
|
166064..166140 |
cgt |
|
27
|
|
166168..166244 |
cca |
|
8
|
|
166253..166328 |
gca |
|
171
|
|
166500..168053 |
16s |
|
164
|
|
168218..171141 |
23s |
|
55
|
|
171197..171314 |
5s |
|
183
|
|
171498..173049 |
16s |
|
164
|
|
173214..176141 |
23s |
|
55
|
|
176197..176315 |
5s |
|
|
|
|
|
|
|
|
194205..194279 |
gaa |
|
3
|
|
194283..194358 |
gta |
|
4
|
|
194363..194435 |
aca |
|
22
|
|
194458..194542 |
tac |
|
4
|
|
194547..194621 |
caa |
|
|
|
|
|
|
|
|
528704..528778 |
aac |
|
4
|
|
528783..528873 |
agc |
|
29
|
|
528903..528974 |
gaa |
|
11
|
|
528986..529060 |
caa |
|
26
|
|
529087..529162 |
aaa |
|
11
|
|
529174..529255 |
cta |
|
80
|
|
529336..529422 |
ctc |
|
|
|
|
|
|
|
|
635110..635186 |
cgt |
|
13
|
|
635200..635273 |
gga |
|
159
|
|
635433..636987 |
16s |
|
167
|
|
637155..640082 |
23s |
|
55
|
|
640138..640254 |
5s |
|
13
|
|
640268..640344 |
atgf |
|
60
|
|
640405..640481 |
gac |
|
|
|
|
|
|
|
|
946696..948250 |
16s |
|
167
|
|
948418..951345 |
23s |
|
111
|
|
951457..951572 |
5s |
|
9
|
|
951582..951656 |
aac |
|
5
|
|
951662..951753 |
tcc |
|
34
|
|
951788..951859 |
gaa |
|
9
|
|
951869..951944 |
gta |
|
9
|
|
951954..952030 |
atgf |
|
11
|
|
952042..952118 |
gac |
|
12
|
|
952131..952206 |
ttc |
|
5
|
|
952212..952284 |
aca |
|
22
|
|
952307..952391 |
tac |
|
5
|
|
952397..952470 |
tgg |
|
24
|
|
952495..952570 |
cac |
|
9
|
|
952580..952651 |
caa |
|
49
|
|
952701..952775 |
ggc |
|
5
|
|
952781..952851 |
tgc |
|
7
|
|
952859..952947 |
tta |
@3 |
265
|
|
953213..953294 |
ttg |
|
|
|
|
|
|
|
|
967065..967138 |
gga |
|
|
|
|
|
|
|
|
1262789..1262861 |
gtc |
|
|
|
|
|
|
|
comp |
2003276..2003348 |
agg |
|
|
|
|
|
|
|
|
2563889..2563959 |
caa |
|
|
|
|
|
|
|
comp |
2899816..2899889 |
aga |
|
|
|
|
|
|
|
comp |
3171879..3171950 |
gaa |
|
25
|
comp |
3171976..3172066 |
agc |
|
3
|
comp |
3172070..3172144 |
aac |
|
10
|
comp |
3172155..3172231 |
atc |
|
15
|
comp |
3172247..3172320 |
gga |
|
10
|
comp |
3172331..3172406 |
cac |
|
17
|
comp |
3172424..3172499 |
ttc |
|
12
|
comp |
3172512..3172588 |
gac |
|
11
|
comp |
3172600..3172676 |
atgf |
|
17
|
comp |
3172694..3172786 |
tca |
|
6
|
comp |
3172793..3172869 |
atgi |
|
2
|
comp |
3172872..3172948 |
atgj |
|
19
|
comp |
3172968..3173040 |
gca |
|
5
|
comp |
3173046..3173122 |
cca |
|
15
|
comp |
3173138..3173214 |
cgt |
|
9
|
comp |
3173224..3173309 |
tta |
|
14
|
comp |
3173324..3173398 |
ggc |
|
5
|
comp |
3173404..3173490 |
ctg |
|
10
|
comp |
3173501..3173576 |
aaa |
|
37
|
comp |
3173614..3173689 |
aca |
|
32
|
comp |
3173722..3173797 |
gta |
|
20
|
comp |
3173818..3173935 |
5s |
|
55
|
comp |
3173991..3176918 |
23s |
|
167
|
comp |
3177086..3178640 |
16s |
|
|
|
|
|
|
|
comp |
3194455..3194527 |
gcc |
|
|
|
|
|
|
|
comp |
3545889..3545964 |
cgg |
|
|
|
|
|
|
|
comp |
4154787..4154859 |
ttc |
|
35
|
comp |
4154895..4154971 |
gac |
|
81
|
comp |
4155053..4155124 |
gaa |
|
9
|
comp |
4155134..4155209 |
aaa |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.bsu. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
bsu cumuls opérons effectif
avec rRNA opérons 10
16 23 5s 0 3
16 atc gca 2
16 23 5s a 5
max a 21
a doubles 0
spéciaux 0
total aas 60
sans opérons 12
1 aa 8
max a 7
a doubles 0
total aas 26
total aas 86
remarques 3
- Nombre de gènes protéines: 4174 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre
l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
en termes d’opréons à RNAs avec des taux %GC très proches 38-44 %.
@1 Blocs 16-23-5s : il y en a 8 avec 2 dans l’opéron 9aas et 3 dans 6aas.
Soit le double de lmo.
- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues
d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement
entre opérons. Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus
courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s, 164 55 20.
- L'opéron 16aas a un intercalaire 23s-5s double des autres blocs, 111 contre 55.
- L'opéron 4aas contient 2 aas avant le 16s et 2 après le 5s. L'intercalaire aa-16s
est à peu près égale à celui de 16s-23s, 159 contre 167.
- Les intercalaires qui séparent les blocs surnuméraires sont aussi du même ordre
que celui de 16s-23s, 170 171 183 contre 164 pour le 16s-23s.
- Les 5 opérons avec ces blocs ont 4 6 9 16 21 aas.
@2 Blocs 16-atc-gca : il y en a 2 et n’ont pas d’autres aas comme l’opéron
16aas de lmo.
- Les intercalaires sont les mêmes pour les 2 opérons, 99 11 81, sauf pour celui de
23s-5s, 55 bases pour l’un, comme 7 blocs 16-23-5s, et le double pour l’autre,
113 comme pour l’opéron 16aas.
@3 intercalaire élevé pour 2 aas. Est-ce que le dernier aa est solitaire ?
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme lmo.
- Lien tableur: bsu distribution
- Notes:
- - Les 1-3aas après 5s, +5s, sont soulignés:atgf gac.
Bc1 bsu, Bacillus subtilis subsp. subtilis str. 168. bacilli.
bc11 bsu, distribution des blocs sans rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
|
tac |
1 |
tgc |
|
f atc |
2 |
j acc |
|
aac |
1 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
|
cgt |
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
|
i tta |
|
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
|
caa |
3 |
cga |
|
l gta |
1 |
o gca |
2 |
gaa |
4 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
bsu |
18 |
8 |
|
|
|
4 |
30
|
|
bc12 bsu. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
3 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
4
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
4
|
i tta |
3 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
|
k cta |
1 |
g cca |
3 |
caa |
1 |
cga |
|
l gta |
3 |
o gca |
3 |
gaa |
2 |
gga |
2
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
1 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
bsu |
|
|
|
54 |
2 |
|
56
|
|
- Lien tableur: bsu lmo
- Légende:
- - La couleur cyan pour les différents entre bsu et lmo; bois pour les identiques entre les clusters 21 16 9 aas de bsu d'une part et ceux de lmo. Le gène cac est conservé dans les 3 clusters.
- - Le bleu pour des intercalaires exceptionnels.
- - Les bordures très épaisses noires encadrent 3 gènes pour les distingués entre eux.
- Notes:
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau B14 et sont établies sur la plage des différences entre intercalaires bsu et lmo du tableau B11 pour des couples identiques (entre génomes), et entre intercalaires bsu-bsu et lmo-lmo (intra génome). Ces résultats sont à mettre en parallèle avec ceux de la comparaison cdc-psor. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
B1. Comparaison bsu-lmo
B11. Comparaison bsu-lmo
bsu |
intercal |
lmo |
intercal |
diff
|
gaa |
25 |
gaa |
5 |
-20
|
agc |
3 |
agc |
34 |
31
|
aac |
10 |
aac |
6 |
-4
|
atc |
15 |
atc |
25 |
10
|
gga |
10 |
gga |
23 |
13
|
cac |
17 |
cac |
28 |
11
|
ttc |
12 |
ttc |
4 |
-8
|
gac |
11 |
gac |
4 |
-7
|
atgf |
17 |
atgf |
42 |
25
|
tca |
6 |
tca |
22 |
16
|
atgi |
2 |
atgi |
11 |
9
|
atgj |
19 |
atgj |
42 |
23
|
gca |
5 |
gca |
22 |
17
|
cca |
15 |
cca |
10 |
-5
|
cgt |
9 |
cgt |
9 |
0
|
tta |
14 |
tta |
14 |
0
|
ggc |
5 |
ggc |
15 |
10
|
ctg |
10 |
cta |
5 |
-5
|
aaa |
37 |
aaa |
41 |
4
|
aca |
32 |
aca |
8 |
-24
|
gta |
20 |
gta |
13 |
|
5s |
55 |
5s |
81 |
|
23s |
167 |
23s |
244 |
|
16s |
|
16s |
|
|
|
|
|
|
|
16s |
167 |
16s |
127 |
|
23s |
111 |
atc |
46 |
|
5s |
9 |
gca |
172 |
|
aac |
5 |
23s |
80 |
|
tcc |
34 |
5s |
14 |
|
gaa |
9 |
aac |
6 |
1
|
gta |
9 |
tcc |
33 |
-1
|
atgf |
11 |
gaa |
56 |
47
|
gac |
12 |
gta |
21 |
12
|
ttc |
5 |
atgf |
6 |
-5
|
aca |
22 |
gac |
4 |
-8
|
tac |
5 |
ttc |
20 |
|
tgg |
24 |
tac |
7 |
2
|
cac |
9 |
tgg |
15 |
-9
|
caa |
49 |
cac |
29 |
20
|
ggc |
5 |
caa |
5 |
-44
|
tgc |
7 |
ggc |
19 |
14
|
tta |
265 |
tgc |
45 |
|
ttg |
|
ttg |
|
|
|
|
|
|
|
16s |
164 |
16s |
244 |
|
23s |
55 |
23s |
80 |
|
5s |
20 |
5s |
13 |
|
gta |
4 |
gta |
8 |
4
|
aca |
36 |
aca |
41 |
5
|
aaa |
6 |
aaa |
5 |
-1
|
cta |
40 |
cta |
14 |
-26
|
ggc |
14 |
ggc |
21 |
7
|
tta |
9 |
tta |
12 |
3
|
cgt |
27 |
cgt |
10 |
-17
|
cca |
9 |
cca |
19 |
10
|
gca |
170 |
gca |
341 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B12. Comparaisons internes
bsu |
intercal |
bsu |
intercal |
diff
|
16s |
167 |
16s |
167 |
|
23s |
55 |
23s |
111 |
|
5s |
20 |
5s |
9 |
|
gta |
32 |
aac |
5 |
|
aca |
37 |
tcc |
34 |
|
aaa |
10 |
gaa |
9 |
|
ctg |
5 |
gta |
9 |
|
ggc |
14 |
atgf |
11 |
0
|
tta |
9 |
gac |
12 |
0
|
cgt |
15 |
ttc |
5 |
|
cca |
5 |
aca |
22 |
|
gca |
19 |
tac |
5 |
|
atgj |
2 |
tgg |
24 |
|
atgi |
6 |
cac |
9 |
|
tca |
17 |
caa |
49 |
|
atgf |
11 |
ggc |
5 |
|
gac |
12 |
tgc |
7 |
|
ttc |
17 |
tta |
265 |
|
cac |
10 |
ttg |
|
|
gga |
15 |
|
|
|
atc |
10 |
16s |
164 |
|
aac |
3 |
23s |
55 |
|
agc |
25 |
5s |
20 |
|
gaa |
|
gta |
4 |
-28
|
|
|
aca |
36 |
-1
|
|
|
aaa |
6 |
-4
|
|
|
cta |
40 |
35
|
|
|
ggc |
14 |
0
|
|
|
tta |
9 |
0
|
|
|
cgt |
27 |
12
|
|
|
cca |
9 |
4
|
|
|
gca |
170 |
|
|
|
|
|
|
lmo |
intercal |
lmo |
intercal |
diff
|
16s |
244 |
16s |
127 |
|
23s |
81 |
atc |
46 |
|
5s |
13 |
gca |
172 |
|
gta |
8 |
23s |
80 |
|
aca |
41 |
5s |
14 |
|
aaa |
5 |
aac |
6 |
|
cta |
15 |
tcc |
33 |
|
ggc |
14 |
gaa |
56 |
|
tta |
9 |
gta |
21 |
|
cgt |
10 |
atgf |
6 |
2
|
cca |
22 |
gac |
4 |
0
|
gca |
42 |
ttc |
20 |
|
atgj |
11 |
tac |
7 |
|
atgi |
22 |
tgg |
15 |
|
tca |
42 |
cac |
29 |
|
atgf |
4 |
caa |
5 |
|
gac |
4 |
ggc |
19 |
|
ttc |
28 |
tgc |
45 |
|
cac |
23 |
ttg |
|
|
gga |
25 |
|
|
|
atc |
6 |
16s |
244 |
|
aac |
34 |
23s |
80 |
|
agc |
5 |
5s |
13 |
|
gaa |
|
gta |
8 |
0
|
|
|
aca |
41 |
0
|
|
|
aaa |
5 |
0
|
|
|
cta |
14 |
-1
|
|
|
ggc |
21 |
7
|
|
|
tta |
12 |
3
|
|
|
cgt |
10 |
0
|
|
|
cca |
19 |
-3
|
|
|
gca |
341 |
|
|
B13. Petits clusters
bsu |
intercal |
lmo |
intercal |
|
gaa |
3 |
gaa |
157 |
|
gta |
4 |
acg |
9 |
|
aca |
22 |
tac |
11 |
|
tac |
4 |
caa |
6 |
|
caa |
|
aaa |
|
|
|
|
|
|
|
aga |
|
aga |
|
|
|
|
|
|
|
cgg |
|
cgg |
|
|
|
|
|
|
|
gga |
|
gga |
|
|
|
|
|
|
|
gtc |
|
gtc |
|
|
|
|
|
|
|
agg |
|
cgt |
|
|
|
|
|
|
|
caa |
|
ctc |
|
|
|
|
|
|
|
gcc |
|
tcg |
|
|
|
|
|
|
|
tca |
|
|
|
|
|
|
|
|
|
atg |
9 |
aac |
3 |
|
gaa |
|
agc |
|
|
|
|
|
|
|
|
|
gaa |
27 |
|
|
|
gac |
|
|
|
|
|
|
|
cgt |
13 |
16s |
127 |
|
gga |
159 |
atc |
46 |
|
16s |
167 |
gca |
172 |
|
23s |
55 |
23s |
80 |
|
5s |
13 |
5s |
14 |
|
atgf |
60 |
aac |
24 |
|
gac |
|
acc |
|
|
|
B14. Fréquence des différences des intercalaires
Entre génomes |
|
intra génome
|
gamme |
fréquence |
|
gamme |
fréquence
|
-15 |
5 |
|
-7 |
1
|
-14 |
|
|
-6 |
|
-13 |
|
|
-5 |
|
-12 |
|
|
-4 |
1
|
-11 |
|
|
-3 |
1
|
-10 |
|
|
-2 |
|
-9 |
1 |
|
-1 |
2
|
-8 |
2 |
|
0 |
9
|
-7 |
1 |
|
1 |
|
-6 |
|
|
2 |
1
|
-5 |
3 |
|
3 |
1
|
-4 |
1 |
|
4 |
1
|
-3 |
|
|
5 |
|
-2 |
|
|
6 |
|
-1 |
2 |
|
7 |
1
|
0 |
2 |
|
|
2
|
1 |
1 |
|
total |
20
|
2 |
1 |
|
-2+2 |
11
|
3 |
1 |
|
|
|
4 |
2 |
|
|
|
5 |
1 |
|
|
|
6 |
|
|
|
|
7 |
1 |
|
|
|
8 |
|
|
|
|
9 |
1 |
|
|
|
10 |
3 |
|
|
|
11 |
1 |
|
|
|
12 |
1 |
|
|
|
13 |
1 |
|
|
|
14 |
1 |
|
|
|
15 |
|
|
|
|
|
7 |
|
|
|
total |
39 |
|
|
|
-2+2 |
6 |
|
|
|
|
B1. Bacillus subtilis subsp. subtilis str. 168, blocs à rRNA.
Types |
|
|
|
|
|
|
|
|
|
I |
I1 |
I2 |
I3 |
I4 |
|
II |
II1 |
II2 |
II3
|
16s |
167 |
167 |
164 |
164 |
|
16s |
164 |
164 |
164
|
23s |
111 |
55 |
55 |
55 |
|
23s |
55 |
55 |
55
|
5s |
9 |
20 |
46 |
20 |
|
5s |
|
|
|
|
5 |
32 |
4 |
4 |
|
|
|
|
|
|
aac |
gta |
aac |
gta |
|
|
|
|
|
|
**15aas |
**20aas |
**5aas |
** 8aas |
|
|
|
|
|
III |
|
|
|
|
|
IV |
|
|
|
16s |
99 |
99 |
|
|
|
cgt |
13 |
|
|
atc |
11 |
11 |
|
|
|
gga |
159 |
|
|
gca |
81 |
81 |
|
|
|
16s |
167 |
|
|
23s |
55 |
133 |
|
|
|
23s |
55 |
|
|
5s |
|
|
|
|
|
5s |
13 |
|
|
|
|
|
|
|
|
atgf |
60 |
|
|
|
|
|
|
|
|
gac |
|
|
|
groupe1 |
|
|
groupe2 |
|
|
|
16s |
164 |
|
|
|
16s |
164 |
|
|
I3 |
23s |
55 |
|
|
I4 |
23s |
55 |
|
|
|
5s |
46 |
|
|
|
5s |
20 |
|
|
|
aac |
4 |
|
|
|
gta |
4 |
|
|
|
**4aas |
8 |
|
|
|
** 7aas |
9 |
|
|
|
gca |
171 |
|
|
|
gca |
170 |
|
|
II1 |
16s |
164 |
|
|
II3 |
16s |
164 |
|
|
|
23s |
55 |
|
|
|
23s |
55 |
|
|
II2 |
5s |
183 |
|
|
|
5s |
|
|
|
|
16s |
164 |
|
|
|
|
|
|
|
|
23s |
55 |
|
|
|
|
|
|
|
|
5s |
|
|
|
|
|
|
|
|
- bsu Le prélèvement: Aspl
- Le nom et le lien NCBI: bsu, Bacillus subtilis subsp. subtilis str. 168, NCBI [4], date 08.02.18.
- bsu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
bsu 434,723 4,215,606 10.3
Intergen51. bsu. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. bsu les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 bsu les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,487 |
573 |
25 |
3,085 |
2.7 |
96 |
8 |
104
|
x |
1,091 |
35 |
2 |
1,128 |
|
0 |
2 |
2
|
t |
3,578 |
608 |
27 |
4,213 |
|
96 |
10 |
106
|
% |
84.9 |
14.4 |
0.6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
12 |
0 |
0 |
12 |
0.8 |
tRNA-CDS |
28 |
9
|
x |
16 |
0 |
0 |
16 |
|
RNA-RNA |
96 |
30
|
t |
28 |
0 |
0 |
28 |
|
CDS-rRNA |
10 |
3
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
190 |
59
|
- |
|
|
|
|
|
total |
324 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
2.0 |
0.0 |
3.0 |
32.4 |
0.0 |
53 |
0.8 |
0.0
|
x |
5.5 |
6.3 |
20.0 |
13.1 |
0.0 |
40 |
0.2 |
0.0
|
|
Intergen51. bsu. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: bsu données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées bsu fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. bsu fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 bsu
R2 x3 x2 x c Inflexion poly3 x c
0.457 -4.94E-07 5.75E-04 -3.05E-01 62.5 fx1 abscisse 218.1 166.0
0.790 -4.03E-06 3.46E-03 -1.02E+00 109.0 fc1 ordonnée 19.2 23.8
0.620 4.31E-07 -2.82E-04 -5.47E-02 40.1 fx41
0.936 2.33E-06 -1.16E-03 -1.36E-02 47.4 fc41
- Le rfin après 400 est de 49 sur un total de 2512. Jusqu'à 1% les freq10 sont en continu jusqu'à 510, reste 25. L'indice i.rfin1 = 24/110 = 0.218.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données bsu calculs poly3 bsu
effect 2512 R2.21 847 abscis 400
xm 45 pte 14,09 flexa 151
ym 8 cste 3,82 flexo 2,59
x1m 200 r400l 200 xm 45
y1m 1 restp 110,67 sup4 137,9
rfin 19,51 %sd 37,55 sup4t 398,1
bornf 138 lond 155 % 34,6
supd 184,6 %sf 37,24 long 106
supdt 491,6 lonf 93 R2 715
xmp 397,69 sf/lf 1,45
r400 91,16 sr/lr 0,80
supf 135,1 sd/ld 1,19
supft 362,7 i.r400 0,46
Intergen51. bsu. Les CDS-CDS négatifs
modifier
Sous-totaux bsu totale
fréquence x- c- x- c-
- 1 0 72 4 4140
- 2 0 4 85 11
- 3 0 0 3 12
- 4 14 229 717 10938
- 5 0 0 5 19
sp6 21 268 1642 8424
total 35 573 2,456 23,544
reste 7 17 264 420
s6 4 0 361 41
s7 6 42 321 1438
s8 4 209 696 6525
rappot s1-5
4/2/1 - 3.2 8.4 2.6
% / sp6
s6/sp6 19.0 0.0 22.0 0.5
s7/sp6 28.6 15.7 19.5 17.1
s8/sp6 19.0 78.0 42.4 77.5
reste/sp6 33.3 6.3 16.1 5.0
total s1-5 14 305 814 15120
% / total
%s1-5 40.0 53.2 33.1 64.2
%sp6 60.0 46.8 66.9 35.8
Intergen51. bsu. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 10 CDS 16s 4 1
16s 23s 8 5s CDS 3 1
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 5 23s CDS
tRNA in 2 CDS 23s
tRNA contig 50 5s 16s 1
tRNA hors 14 16s16s
tRNA 16s 3
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 96 0 total 8 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 bsu. Les intercalaires tRNA-tRNA extra blocs
|
contig |
|
|
contig |
|
|
contig |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
4 |
gta |
|
5 |
aac |
|
25 |
gaa |
|
9 |
atgj
|
36 |
aca |
|
34 |
tcc |
|
3 |
agc |
|
** |
gaa
|
6 |
aaa |
|
9 |
gaa |
|
10 |
aac |
|
3 |
gaa
|
40 |
cta |
|
9 |
gta |
|
15 |
atc |
|
4 |
gta
|
14 |
ggc |
|
11 |
atgf |
|
10 |
gga |
|
22 |
aca
|
9 |
tta |
|
12 |
gac |
|
17 |
cac |
|
4 |
tac
|
27 |
cgt |
|
5 |
ttc |
|
12 |
ttc |
|
** |
caa
|
9 |
cca |
|
22 |
aca |
|
11 |
gac |
|
4 |
aac
|
** |
gca |
|
5 |
tac |
|
17 |
atgf |
|
29 |
agc
|
4 |
aac |
|
24 |
tgg |
|
6 |
tca |
|
11 |
gaa
|
56 |
acc |
|
9 |
cac |
|
2 |
atgi |
|
26 |
caa
|
30 |
ggc |
|
49 |
caa |
|
19 |
atgj |
|
11 |
aaa
|
27 |
cgt |
|
5 |
ggc |
|
5 |
gca |
|
80 |
cta
|
8 |
cca |
|
7 |
tgc |
|
15 |
cca |
|
** |
ctc
|
** |
gca |
|
265 |
tta |
|
9 |
cgt |
|
35 |
ttc
|
13 |
cgt |
|
** |
ttg |
|
14 |
tta |
|
81 |
gac
|
** |
gga |
|
|
|
|
5 |
ggc |
|
9 |
gaa
|
60 |
atgf |
|
|
|
|
10 |
ctg |
|
** |
aaa
|
** |
gac |
|
|
|
|
37 |
aaa |
|
|
|
|
|
|
|
|
|
32 |
aca |
|
|
|
|
|
|
|
|
|
** |
gta |
|
|
|
- Lien NCBI [5]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
bsu. Sx+ Sc+ Les diagrammes 400
bsu |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
-6.4 |
69 |
-338 |
67 |
458 |
359 |
max40 |
-41 |
352 |
-1040 |
112 |
790 |
286 |
min50
|
51 à 400 |
48 |
-359 |
711 |
-11 |
861 |
249 |
2 parties |
12 |
-27 |
-230 |
64 |
954 |
75 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
152 |
56 |
- |
440 |
dte |
18 |
max40 |
211 |
68 |
|
617 |
poly |
173 |
SF
|
51 à 400 |
94 |
40 |
- |
694 |
poly |
167 |
tF |
145 |
50 |
- |
850 |
poly |
104 |
tF
|
- Légende du tableau corrélations et faibles fréquences
bsu. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
eco |
min20 |
1003 |
2130 |
3133 |
735 |
296 |
440 |
144 |
-178 |
-64 |
287
|
bsu |
min10 |
1028 |
2444 |
3472 |
659 |
8 |
282 |
274 |
152 |
257 |
470
|
rtb |
min30 |
118 |
402 |
520 |
536 |
-105 |
148 |
253 |
-277 |
-165 |
202
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
63 |
348 |
0.18 |
1169 |
2855 |
11 |
6 |
80 |
226 |
126 |
821 |
-119
|
140 |
333 |
0.42 |
1125 |
3091 |
2 |
8 |
31 |
186 |
302 |
936 |
-432
|
51 |
294 |
0.17 |
189 |
604 |
5 |
7 |
21 |
162 |
8 |
131 |
-81
|
- Diagrammes 400: bsu eco, diagramme 1-40: c+ bsu c+ eco x+ bsu x+ eco total, texte: eco.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - bsu ressemble beaucoup à eco comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde moyen pour eco (R2’ 43) et Sf pour bsu (R2’ 18). Ils ont des effectifs égaux 3133 contre 3472.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour eco contre 40 pour bsu. Quand j’enlève les 3 fréquences faibles de eco pour ne laisser que la pyramide, sa courbe devient une S faible, Sf, R2’ à 36 et la courbe bsu sans la fréquence 10 devient une S moyenne, Sm, R2’ à 60. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour eco et 140 pour bsu.
- + Les fréquences faibles 1-30 sont en opposition avec celles de bsu c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux mais nettement différents, 359 pour bsu contre 230 pour eco, différence due à la différence de forme.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 173 pour bsu contre 265 et des 2 points d’inflexion normaux, 286 pour bsu et 255 pour eco.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 140 et 65. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus. Néanmoins j’ai fait la courbe qui donne un SF avec un R2’ de 121 (R2 554 433 pour la droite) et celle d’eco qui a donné un Sf de 36 (R2 742 706 pour la droite). Il y a encore une bonne ressemblance.
- x+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 167 (861 694). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu là aussi un tilde très fort, tF, avec un R2’ de 120 (835 715) donc on a le même ordre de grandeur.
- c+ 31-400: j’ai fait la courbe de bsu qui a donné un tilde fort, tF, avec un R2’ de 80 (942 862). La courbe d’eco avait donné un tilde moyen, R2’ 67 (948 881). Encore même ordre de grandeur. La différence entre les courbes est le point d’inflexion, négatif et grand chez eco -407, positif et normal chez bsu 150 environ.
- c+ 51-400: A la place de 31-400 j’ai fait pour bsu 51-400, sans la pyramide et j’ai obtenu un tilde très fort, tF, avec un R2’ de 104 (954 850). Avec eco j’ai fait la courbe 71-400 pour respecter la modification faite sur bsu et j’ai obtenu par contre là, un S fort, SF, avec un R2’ de 94 (956 862) donc là les 2 génomes diffèrent.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont nettement différentes, la corrélation de bsu devient faible, 282, alors qu’eco reste moyenne, 440. Sur 41-200, elles chutent toutes les 2 fortement avec une différence (diff) de 144 pour eco et 274 pour bsu qui devient quasi nulle, 8. 178 -64
- Sur les plages 1-n: Le rapport x+/c+ des faibles fréquences que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez eco il y a très peu de faibles fréquences 1-30, avec un rapport de 0.18, d’où des corrélations sur 1-n négatives, -178 pour 1-200 et -64 pour 1-250.
- + Chez bsu il y a beaucoup plus de faibles fréquences 1-30, avec un rapport de 0.42, d’où des corrélations sur les plages 1-n positives qui améliorent celles des plages 41-n. La corrélation de 282 sur 41-250 est maintenue à 257, grâces aux taux élevés des fréquences faibles dans x+ 1-400.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Bsu en a beaucoup dans x+ par rapport à eco, 0.42 contre 0.18. Ce rapport explique bien le comportement des corrélations de bsu sur les plages 1-n où les faibles fréquences maintiennent et améliorent même celles des plages 41-n. L’absence notable des faibles fréquences de eco explique la chute de ses corrélations sur les plages 1-n par rapport à celles des plages. Les zéros sont à 10‰ pour bsu et 17‰ pour eco, avantage donné par les x+. Le taux des négatifs est presque le même pour les 2 génomes, 217‰ contre 306‰ pour eco, avec un déficit en x- chez bsu.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblables et très proches de celle du total des c+ 1-40.
- x+ 1-40: Avec des effectifs élevés, 302 pour bsu et 126 pour eco, et des corrélations (corel) fortement négatives, l’éloignement du modèle c+ 1-40 est sans équivoques, les 2 courbes croissent régulièrement au lieu de présenter un creux à la fréquence 7 suivi d’une bosse à la fréquence 11.
- Lien tableur: bsu autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux
tRNA-cds tRNA-tRNA autres-cds total
gen c+ x+ x- c+ x+ c- c+ x+ c-
19 19 97 169 1 17 322 2 misc-misc
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
- Liens: gtRNAdb [6], NCBI [7]
- Lien tableur: lmo
B2. Listeria monocytogenes EGD-e
37.9%GC |
7.3.19 Paris |
67 |
doubles |
intercal
|
|
82705..82777 |
aag |
|
|
|
|
|
|
|
|
237466..239020 |
16s |
@1 |
244
|
|
239265..242195 |
23s |
|
80
|
|
242276..242385 |
5s |
|
13
|
|
242399..242471 |
gta |
|
8
|
|
242480..242555 |
aca |
|
41
|
|
242597..242669 |
aaa |
|
5
|
|
242675..242756 |
cta |
|
14
|
|
242771..242842 |
ggc |
|
21
|
|
242864..242949 |
tta |
|
12
|
|
242962..243035 |
cgt |
|
10
|
|
243046..243119 |
cca |
|
19
|
|
243139..243214 |
gca |
|
341
|
|
243556..245041 |
16s |
|
244
|
|
245286..248216 |
23s |
|
80
|
|
248297..248406 |
5s |
|
|
|
|
|
|
|
|
677464..677553 |
tcg |
|
|
|
|
|
|
|
|
936656..936728 |
aac |
|
3
|
|
936732..936819 |
agc |
|
|
|
|
|
|
|
|
940017..940088 |
gaa |
|
27
|
|
940116..940188 |
gac |
|
|
|
|
|
|
|
|
970867..970937 |
gga |
|
|
|
|
|
|
|
|
1266675..1266748 |
aga |
|
|
|
|
|
|
|
comp |
1740916..1740987 |
gaa |
|
5
|
comp |
1740993..1741083 |
agc |
|
34
|
comp |
1741118..1741190 |
aac |
|
6
|
comp |
1741197..1741270 |
atc |
|
25
|
comp |
1741296..1741366 |
gga |
|
23
|
comp |
1741390..1741462 |
cac |
|
28
|
comp |
1741491..1741563 |
ttc |
|
4
|
comp |
1741568..1741643 |
gac |
|
4
|
comp |
1741648..1741721 |
atgf |
|
42
|
comp |
1741764..1741853 |
tca |
|
22
|
comp |
1741876..1741949 |
atgi |
|
11
|
comp |
1741961..1742034 |
atgj |
|
42
|
comp |
1742077..1742149 |
gca |
|
22
|
comp |
1742172..1742245 |
cca |
|
10
|
comp |
1742256..1742329 |
cgt |
|
9
|
comp |
1742339..1742424 |
tta |
|
14
|
comp |
1742439..1742513 |
ggc |
|
15
|
comp |
1742529..1742610 |
cta |
|
5
|
comp |
1742616..1742688 |
aaa |
|
41
|
comp |
1742730..1742805 |
aca |
|
8
|
comp |
1742814..1742886 |
gta |
|
13
|
comp |
1742900..1743009 |
5s |
|
81
|
comp |
1743091..1746021 |
23s |
|
244
|
comp |
1746266..1747811 |
16s |
|
|
|
|
|
|
|
|
1776112..1776183 |
cgt |
|
|
|
|
|
|
|
comp |
1848821..1848930 |
5s |
|
81
|
comp |
1849012..1851942 |
23s |
|
244
|
comp |
1852187..1853732 |
16s |
|
|
|
|
|
|
|
|
2162187..2162273 |
ctc |
|
|
|
|
|
|
|
|
2215375..2215446 |
gaa |
|
157
|
|
2215604..2215677 |
acg |
|
9
|
|
2215687..2215770 |
tac |
|
11
|
|
2215782..2215856 |
caa |
|
6
|
|
2215863..2215935 |
aaa |
|
|
|
|
|
|
|
comp |
2436493..2436576 |
ttg |
|
45
|
comp |
2436622..2436695 |
tgc |
|
19
|
comp |
2436715..2436786 |
ggc |
|
5
|
comp |
2436792..2436863 |
caa |
|
29
|
comp |
2436893..2436965 |
cac |
|
15
|
comp |
2436981..2437054 |
tgg |
|
7
|
comp |
2437062..2437145 |
tac |
|
20
|
comp |
2437166..2437238 |
ttc |
|
4
|
comp |
2437243..2437318 |
gac |
|
6
|
comp |
2437325..2437398 |
atgf |
|
21
|
comp |
2437420..2437495 |
gta |
|
56
|
comp |
2437552..2437623 |
gaa |
|
33
|
comp |
2437657..2437745 |
tcc |
|
6
|
comp |
2437752..2437827 |
aac |
|
14
|
comp |
2437842..2437951 |
5s |
|
80
|
comp |
2438032..2440962 |
23s |
|
172
|
comp |
2441135..2441210 |
gca |
|
46
|
comp |
2441257..2441330 |
atc |
|
127
|
comp |
2441458..2443003 |
16s |
@2 |
|
|
|
|
|
|
comp |
2540230..2540301 |
cgg |
|
|
|
|
|
|
|
comp |
2672664..2672736 |
acc |
|
24
|
comp |
2672761..2672836 |
aac |
|
14
|
comp |
2672851..2672960 |
5s |
|
80
|
comp |
2673041..2675971 |
23s |
|
172
|
comp |
2676144..2676219 |
gca |
|
46
|
comp |
2676266..2676339 |
atc |
|
127
|
comp |
2676467..2678012 |
16s |
|
|
|
|
|
|
|
|
2930362..2930434 |
gtc |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lmo. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lmo cumuls opérons effectif
avec rRNA opérons 6
16 23 5s 0 2
16 atc gca 2
16 23 5s a 2
max a 21
a doubles 0
spéciaux 0
total aas 50
sans opérons 11
1 aa 8
max a 5
a doubles 0
total aas 17
total aas 67
remarques 2
B2. Listeria monocytogenes EGD-e, blocs à rRNA.
Types |
|
|
|
|
|
|
|
|
I |
I1 |
I2 |
I3 |
I4 |
|
II |
II1 |
II2
|
16s |
|
244 |
|
244 |
|
16s |
244 |
244
|
23s |
|
81 |
|
80 |
|
23s |
80 |
81
|
5s |
|
13 |
|
13 |
|
5s |
|
|
|
|
8 |
|
8 |
|
|
|
|
|
|
gta |
|
gta |
|
|
|
|
|
|
**20aas |
|
**8aas |
|
|
|
|
III |
|
|
|
|
|
IV |
|
|
16s |
127 |
127 |
|
|
|
|
|
|
atc |
46 |
46 |
|
|
|
|
|
|
gca |
172 |
172 |
|
|
|
|
|
|
23s |
80 |
80 |
|
|
|
|
|
|
5s |
14 |
14 |
|
|
|
|
|
|
|
6 |
24 |
|
|
|
|
|
|
|
aac |
aac |
|
|
|
|
|
|
|
**13aas |
acc |
|
|
|
|
|
|
Groupes |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16s |
244 |
|
|
|
|
|
|
I4 |
23s |
80 |
|
|
|
|
|
|
|
5s |
13 |
|
|
|
|
|
|
|
gta |
8 |
|
|
|
|
|
|
|
**7aas |
19 |
|
|
|
|
|
|
|
gca |
341 |
|
|
|
|
|
|
|
16s |
244 |
|
|
|
|
|
|
II1 |
23s |
80 |
|
|
|
|
|
|
|
5s |
|
|
- Nombre de gènes protéines: 2867 (KEGG)
*Remarques : lmo-bsu (ref. sont les 1ers génomes de cette étude qui m’ont poussé à étendre
l’échantillon. Lma* lmo et bsu sont des bacilli et donc ont des points communs
en termes d’opréons à RNAs avec des taux %GC très proches 38-44 %.
@1 Blocs 16-23-5s : il y en a 4 dont 1 sans aas et 2 réunis dans un seul opéron.
- Dans la 1ère étude ces blocs paraissaient arborer les séquences les plus longues
d’aas et j’attribuait la longueur de 16 aas de l’opéron 16-act-gca à un remaniement
entre opérons. Ce n’est plus le cas puisqu’il s’est avéré que ces derniers sont plus
courants et peuvent être aussi long que les premiers avec 18 aas chez lam (ref..
- Les intercalaires sont les mêmes pour les 4 blocs 16-23-5s, 244 80 13.
- L'opéron à 2 blocs: le 2ème n'ayant pas d'aa à la suite de 5s et ayant une
intercalaire du côté de 16s, très élevée, 341 bases, pourrait être un solitaire.
@2 Blocs 16-atc-gca : il y en a 2 dont un le fameux 16aas et l’autre avec 4 aas.
- Les intercalaires sont les mêmes pour les 2 opérons, 127 46 172 80 14.
- Ils partagent les mêmes intercalaires 5s-aa avec les blocs 16-23-5s-aa, 80 13.
Séquences des doubles : aucun double sur 7 opérons à 2 aas et plus. Comme bsu.
- Lien tableur: lmo distribution
- Notes:- Les 1-3aas après 5s, +5s, sont soulignés:aac acc.
Bc2 lmo, Listeria monocytogenes EGD-e. bacilli.
bc21 lmo, distribution des blocs sans rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
1 |
tgc |
|
f atc |
2 |
j acc |
|
aac |
1 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
|
cgt |
1
|
h gtc |
1 |
n gcc |
|
gac |
1 |
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
1
|
k cta |
|
g cca |
|
caa |
1 |
cga |
|
l gta |
|
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
|
d tcg |
1 |
tag |
|
tgg |
|
n atgj |
|
l acg |
1 |
aag |
1 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lmo |
9 |
8 |
|
|
|
4 |
21
|
|
bc22 lmo. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
3 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
3
|
i tta |
2 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
2 |
aaa |
2 |
aga |
|
k cta |
2 |
g cca |
2 |
caa |
1 |
cga |
|
l gta |
3 |
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lmo |
|
|
|
46 |
|
|
46
|
|
- lmo Le prélèvement: Abacilli
- Le nom et le lien NCBI: lmo, Listeria monocytogenes EGD-e, NCBI [8], date 27.2.15.
- lmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
lmo 288,032 2,944,528 9.8
Intergen51. lmo. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. lmo les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lmo les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,822 |
393 |
27 |
2,242 |
3.8 |
69 |
7 |
76
|
x |
586 |
10 |
1 |
597 |
|
0 |
0 |
0
|
t |
2,408 |
403 |
28 |
2,839 |
|
69 |
7 |
76
|
% |
84.8 |
14.2 |
1.0 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
15 |
0 |
0 |
15 |
1.5 |
tRNA-CDS |
25 |
25
|
x |
10 |
0 |
0 |
10 |
|
RNA-RNA |
69 |
68
|
t |
25 |
0 |
0 |
25 |
|
CDS-rRNA |
7 |
7
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
0 |
0
|
- |
|
|
|
|
|
total |
101 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
2.8 |
0.0 |
1.8 |
36.5 |
6.7 |
60 |
1.2 |
0.0
|
x |
6.3 |
10.0 |
10.0 |
8.5 |
0.0 |
30 |
0.2 |
0.0
|
|
Intergen51. lmo. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: lmo données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lmo fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lmo fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lmo
R2 x3 x2 x c Inflexion poly3 x c
0.325 1.78E-07 2.12E-04 -2.46E-01 59.10 fx1 abscisse 255.6 201.9
0.671 -6.21E-06 4.88E-03 -1.27E+00 118.0 fc1 ordonnée 14.4 17.0
0.418 -5.23E-06 4.01E-03 -1.03E+00 103.0 fx41
0.850 3.17E-06 -1.92E-03 2.08E-01 27.2 fc41
- Le rfin après 400 est de 51 sur un total de 1849. Jusqu'à 1% les freq10 sont en continu jusqu'à 600, reste 19. L'indice i.rfin1 = 32/200 = 0.160.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données lmo calculs poly3 lmo
effect 1849 R2.21 816 abscis 400
xm 45 pte 6,10 flexa 193
ym 3,70 cste 2,28 flexo 1,78
x1m 209 r400l 191 xm 45
y1m 1 restp 125,47 sup4 188,0
rfin 27,58 %sd 48,43 sup4t 427,3
bornf 140 lond 164 % 44,0
supd 217,7 %sf 51,37 long 148
supdt 449,4 lonf 95 R2 626
xmp 425,09 sf/lf 1,76
r400 97,89 sr/lr 0,73
supf 167,5 sd/ld 1,33
supft 326,1 i.r400 0,51
Intergen51. lmo. Les CDS-CDS négatifs
modifier
Sous-totaux lmo totale
fréquence x- c- x- c-
- 1 0 61 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 3 173 717 10938
- 5 0 0 5 19
sp6 7 159 1642 8424
total 10 393 2,456 23,544
reste 1 7 264 420
s6 1 0 361 41
s7 3 18 321 1438
s8 2 134 696 6525
rappot s1-5
4/2/1 - 2.8 8.4 2.6
% / sp6
s6/sp6 14.3 0.0 22.0 0.5
s7/sp6 42.9 11.3 19.5 17.1
s8/sp6 28.6 84.3 42.4 77.5
reste/sp6 14.3 4.4 16.1 5.0
total s1-5 3 234 814 15120
% / total
%s1-5 30.0 59.5 33.1 64.2
%sp6 70.0 40.5 66.9 35.8
Intergen51. lmo. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 6 CDS 16s 5
16s 23s 4 5s CDS 2
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 4 23s CDS
tRNA in 2 CDS 23s
tRNA contig 42 5s 16s
tRNA hors 6 16s16s
tRNA 16s 1
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 69 0 total 7 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 lmo. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
5 |
gaa |
|
45 |
ttg |
|
8 |
gta
|
34 |
agc |
|
19 |
tgc |
|
41 |
aca
|
6 |
aac |
|
5 |
ggc |
|
5 |
aaa
|
25 |
atc |
|
29 |
caa |
|
14 |
cta
|
23 |
gga |
|
15 |
cac |
|
21 |
ggc
|
28 |
cac |
|
7 |
tgg |
|
12 |
tta
|
4 |
ttc |
|
20 |
tac |
|
10 |
cgt
|
4 |
gac |
|
4 |
ttc |
|
19 |
cca
|
42 |
atgf |
|
6 |
gac |
|
** |
gca
|
22 |
tca |
|
21 |
atgf |
|
24 |
acc
|
11 |
atgi |
|
56 |
gta |
|
** |
aac
|
42 |
atgj |
|
33 |
gaa |
|
|
hors
|
22 |
gca |
|
6 |
tcc |
|
3 |
aac
|
10 |
cca |
|
** |
aac |
|
** |
agc
|
9 |
cgt |
|
|
|
|
27 |
gaa
|
14 |
tta |
|
|
|
|
** |
gac
|
15 |
ggc |
|
|
|
|
157 |
gaa
|
5 |
cta |
|
|
|
|
9 |
acg
|
41 |
aaa |
|
|
|
|
11 |
tac
|
8 |
aca |
|
|
|
|
6 |
caa
|
** |
gta |
|
|
|
|
** |
aaa
|
- |
|
|
|
|
|
|
|
Lactobacillus amylovorus strain 30SC
modifier
- Liens: gtRNAdb [9], NCBI [10]
- Lien tableur: lam
- Légende:
- -cds1, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQGVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
- -cds2, hp 186: hypothetical protein, 186 pb, MESRNTKRSIQSKRKHTEKLCLVLRVVPQRVSTLKTEYNPSKKPRQSKRTDCRATEKRILE
B3. Lactobacillus amylovorus strain 30SC
38%GC |
30.6.19 Paris |
63 |
doubles |
intercal
|
|
447399..448972 |
16s |
@1 |
125
|
|
449098..449172 |
atc |
|
52
|
|
449225..449297 |
gca |
|
115
|
|
449413..452324 |
23s |
|
68
|
|
452393..452509 |
5s |
|
4
|
|
452514..452586 |
gta |
|
2
|
|
452589..452661 |
aaa |
|
13
|
|
452675..452756 |
cta |
|
23
|
|
452780..452852 |
aca |
|
10
|
|
452863..452934 |
ggc |
|
11
|
|
452946..453031 |
tta |
|
8
|
|
453040..453113 |
cgt |
|
5
|
|
453119..453192 |
cca |
|
29
|
|
453222..453295 |
atg |
|
12
|
|
453308..453381 |
atgi |
|
27
|
|
453409..453482 |
atgf |
|
3
|
|
453486..453559 |
gac |
|
6
|
|
453566..453638 |
ttc |
|
19
|
|
453658..453728 |
gga |
|
5
|
|
453734..453808 |
atc |
|
2
|
|
453811..453900 |
agc |
|
|
|
|
|
|
|
|
57091..58664 |
16s |
|
125
|
|
58790..58864 |
atc |
|
52
|
|
58917..58989 |
gca |
|
115
|
|
59105..62016 |
23s |
|
68
|
|
62085..62201 |
5s |
|
13
|
|
62215..62287 |
aac |
|
|
|
|
|
|
|
|
469566..471139 |
16s |
@2 |
9
|
|
471149..471334 |
cds1 |
hp 186 |
-3
|
|
471332..474243 |
23s |
|
68
|
|
474312..474428 |
5s |
|
13
|
|
474442..474514 |
aac |
|
|
|
|
|
|
|
comp |
1709284..1709374 |
tcc |
|
10
|
comp |
1709385..1709457 |
aac |
|
13
|
comp |
1709471..1709587 |
5s |
|
68
|
comp |
1709656..1712567 |
23s |
|
-3
|
comp |
1712565..1712750 |
cds2 |
hp 186 |
9
|
comp |
1712760..1714333 |
16s |
|
|
|
|
|
|
|
comp |
79386..79458 |
aag |
|
|
|
|
|
|
|
comp |
79913..79985 |
aag |
|
|
|
|
|
|
|
|
193922..193994 |
acc |
|
|
|
|
|
|
|
comp |
210866..210939 |
ggg |
|
|
|
|
|
|
|
|
287678..287752 |
ggc |
+ |
111
|
|
287864..287938 |
ggc |
3 ggc |
109
|
|
288048..288122 |
ggc |
|
35
|
|
288158..288231 |
ccg |
|
|
|
|
|
|
|
|
457611..457682 |
gaa |
|
35
|
|
457718..457804 |
tca |
|
9
|
|
457814..457887 |
atgf |
|
3
|
|
457891..457964 |
gac |
|
6
|
|
457971..458046 |
ttc |
|
4
|
|
458051..458132 |
tac |
|
4
|
|
458137..458207 |
tgg |
|
12
|
|
458220..458295 |
cac |
|
4
|
|
458300..458371 |
caa |
|
23
|
|
458395..458465 |
tgc |
|
40
|
|
458506..458590 |
ttg |
|
|
|
|
|
|
|
|
474442..474514 |
aac |
|
|
|
|
|
|
|
|
507688..507760 |
acg |
|
|
|
|
|
|
|
|
526886..526957 |
caa |
|
|
|
|
|
|
|
|
551550..551631 |
tac |
|
34
|
|
551666..551737 |
caa |
|
|
|
|
|
|
|
|
567329..567416 |
ctt |
|
|
|
|
|
|
|
|
583327..583413 |
tca |
|
6
|
|
583420..583493 |
gac |
|
7
|
|
583501..583576 |
cac |
|
4
|
|
583581..583653 |
gta |
|
|
|
|
|
|
|
|
642034..642106 |
agg |
|
|
|
|
|
|
|
comp |
729370..729441 |
cgg |
|
|
|
|
|
|
|
|
784793..784864 |
gag |
|
|
|
|
|
|
|
|
917887..917975 |
tcg |
|
|
|
|
|
|
|
|
1456724..1456800 |
aga |
|
|
|
|
|
|
|
|
1681218..1681301 |
ctg |
|
|
|
|
|
|
|
comp |
1707998..1708070 |
gta |
|
5
|
comp |
1708076..1708147 |
gaa |
|
|
|
|
|
|
|
|
1987190..1987263 |
cgt |
|
8
|
|
1987272..1987345 |
cca |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.lam. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
lam cumuls opérons effectif
avec rRNA opérons 4
16 23 5s 0 0
16 atc gca 2
16 23 5s a 0
max a 18
a doubles 0
spéciaux 2
total aas 24
sans opérons 20
1 aa 14
max a 11
a doubles 1
total aas 39
total aas 63
remarques 2
B3. lam, blocs à rRNA.
16s |
125 |
1574 |
16s |
9 |
1574
|
atc |
52 |
|
cds1 |
-3 |
62
|
gca |
115 |
|
23s |
68 |
2912
|
23s |
68 |
2912 |
5s |
13 |
117
|
5s |
4 |
117 |
aac |
|
|
gta |
|
|
|
|
|
|
|
|
|
|
|
16s |
125 |
1574 |
16s |
9 |
1574
|
atc |
52 |
|
cds2 |
-3 |
62
|
gca |
115 |
|
23s |
68 |
2912
|
23s |
68 |
2912 |
5s |
13 |
117
|
5s |
13 |
117 |
aac |
|
|
aac |
|
|
|
|
|
*Remarques : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11.
- Que des blocs de type 16-atcgca, il y en a 4.
@1 Les 2 blocs 16-atcgca sont standard comme dans bsu et lmo (ref..
- Ils ont les mêmes intercalaires du début, 125 52 115 68 13.
- un opéron avec 1 aa en plus, aac comme dans bsu-lmo.
- un opéron à 18 aas plus grand que celui de lmo avec 16.
@2 Les 2 blocs 16s-protéine-23s-5s. Ressemblance avec EFTU.
- très petite protéine, 62 aas.
- Dans les 2 cas les intercalaires sont les mêmes, 9 -3 68 13
- Notez le -3 pour le stop.
- les intercalaires 25s-5s-aac sont à peu près les mêmes que les
Blocs 16 atc gca 23-5s-aa, 68 13.
contrôle du 3.10.20: les 2 cds ont disparus dans NCBI du 31.7.2020.
Séquences des doubles : pratiquement pas de doublons, 1 seul triplet dans 1 opéron sur 11
opérons à plus de 2 aas.
- Lien tableur: lam distribution
- Notes:
- - Les 1-3aas après 5s, +5s, sont soulignés: 3 aac et tcc.
- - duplicata: ggc3
Bc3 lam, Lactobacillus amylovorus strain 30SC. bacilli.
bc31 lam, distribution des blocs sans rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
1 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
|
tac |
2 |
tgc |
1
|
f atc |
2 |
j acc |
1 |
aac |
1 |
agc |
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
3
|
i tta |
|
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
1
|
k cta |
|
g cca |
1 |
caa |
3 |
cga |
|
l gta |
2 |
o gca |
2 |
gaa |
2 |
gga |
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
|
l acg |
1 |
aag |
2 |
agg |
1
|
o ctg |
1 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
1
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lam |
25 |
14 |
|
|
|
4 |
43
|
|
bc32 lam. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
|
tgc |
|
f atc |
1 |
j acc |
|
aac |
3 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
1 |
caa |
|
cga |
|
l gta |
1 |
o gca |
|
gaa |
|
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lam |
|
|
|
20 |
|
|
20
|
|
- lam Le prélèvement: Abacilli
- Le nom et le lien NCBI: lam, Lactobacillus amylovorus, NCBI [11], date 6.3.22.
- lam La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
lam 210,907 2,078,001 10.1
Intergen51. lam. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. lam les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lam les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,232 |
272 |
16 |
1,520 |
3.1 |
51 |
2 |
53
|
x |
481 |
15 |
2 |
498 |
|
0 |
2 |
2
|
t |
1,713 |
287 |
18 |
2,018 |
|
51 |
4 |
55
|
% |
84.9 |
14.2 |
0.9 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
28 |
0 |
0 |
28 |
1.9 |
tRNA-CDS |
43 |
28
|
x |
15 |
0 |
0 |
15 |
|
RNA-RNA |
51 |
34
|
t |
43 |
0 |
0 |
43 |
|
CDS-rRNA |
4 |
3
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
54 |
36
|
- |
|
|
|
|
|
total |
152 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
2.0 |
0.0 |
0.0 |
34.8 |
0.0 |
53 |
1.1 |
0.0
|
x |
5.6 |
0.0 |
0.0 |
4.8 |
0.0 |
53 |
0.4 |
0.0
|
|
Intergen51. lam. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: lam données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lam fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lam fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lam fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lam
R2 x3 x2 x c Inflexion poly3 x c
0.608 4.90E-06 -3.13E-03 4.29E-01 26.70 fx1 abscisse 295.7 148,9
0.769 -6.64E-06 5.24E-03 -1.36E+00 123.0 fc1 ordonnée 11.2 24,9
0.835 -2.66E-06 2.36E-03 -7.69E-01 101.0 fx41
0.840 1,85E-06 -8,25E-04 -6,50E-02 46.8 fc31
- Le rfin après 400 est de 25 sur un total de 1248. Jusqu'à 1% les freq10 sont en continu jusqu'à 520, reste 12. L'indice i.rfin1 = 13/120 = 0.108.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données lam calculs poly3 lam
effect 1248 R2.21 838 abscis 400
xm 35 pte 9,96 flexa 120
ym 3,25 cste 2,95 flexo 2,93
x1m 196 r400l 204 xm 35
y1m 1 restp 140,22 sup4 120,0
rfin 20,03 %sd 45,44 sup4t 349,4
bornf 128 lond 161 % 34,4
supd 221,0 %sf 48,43 long 85
supdt 486,4 lonf 93 R2 544
xmp 373,40 sf/lf 1,94
r400 120,19 sr/lr 0,60
supf 180,1 sd/ld 1,37
supft 371,8 i.r400 0,59
Intergen51. lam. Les CDS-CDS négatifs
modifier
Sous-totaux lam totale
fréquence x- c- x- c-
- 1 0 96 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 8 49 717 10938
- 5 0 0 5 19
sp6 7 127 1642 8424
total 15 272 2,456 23,544
reste 0 0 264 420
s6 0 0 361 41
s7 1 13 321 1438
s8 6 114 696 6525
rappot s1-5
4/2/1 - 0.5 8.4 2.6
% / sp6
s6/sp6 0.0 0.0 22.0 0.5
s7/sp6 14.3 10.2 19.5 17.1
s8/sp6 85.7 89.8 42.4 77.5
reste/sp6 0.0 0.0 16.1 5.0
total s1-5 8 145 814 15120
% / total
%s1-5 53.3 53.3 33.1 64.2
%sp6 46.7 46.7 66.9 35.8
Intergen51. lam. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 4 CDS 16s 2 2
16s 23s 2 5s CDS
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 4 23s CDS
tRNA in 2 CDS 23s
tRNA contig 16 5s 16s
tRNA hors 19 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 51 0 total 2 2
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 lam. Les intercalaires tRNA-tRNA extra blocs
|
cont |
|
|
hors |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
2 |
gta |
|
111 |
ggc |
|
34 |
tac
|
13 |
aaa |
|
112 |
ggc |
|
** |
caa
|
23 |
cta |
|
35 |
ggc |
|
6 |
tca
|
10 |
aca |
|
** |
ccg |
|
7 |
gac
|
11 |
ggc |
|
35 |
gaa |
|
4 |
cac
|
8 |
tta |
|
9 |
tca |
|
** |
gta
|
5 |
cgt |
|
3 |
atgf |
|
5 |
gta
|
29 |
cca |
|
6 |
gac |
|
** |
gaa
|
12 |
atgj |
|
7 |
ttc |
|
8 |
cgt
|
27 |
atgi |
|
4 |
tac |
|
** |
cca
|
3 |
atgf |
|
12 |
tgg |
|
|
|
6 |
gac |
|
7 |
cac |
|
|
|
19 |
ttc |
|
23 |
caa |
|
|
|
5 |
gga |
|
40 |
tgc |
|
|
|
2 |
atc |
|
** |
ttg |
|
|
|
** |
agc |
|
|
|
|
|
|
10 |
tcc |
|
|
|
|
|
|
** |
aac |
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
- Liens: gtRNAdb [12], NCBI [13]
- Lien tableur: ppm
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 Chromosome
45.5%GC |
26.7.19 Paris |
110 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
10545..11633 |
CDS |
|
327 |
327 |
|
|
363 |
|
|
11961..13519 |
16s |
|
280 |
|
|
|
|
|
|
13800..16728 |
23s |
|
143 |
|
|
|
|
|
|
16872..16988 |
5s |
|
232 |
232 |
|
|
|
232
|
|
17221..17640 |
CDS |
|
93 855 |
|
|
|
140 |
|
|
|
|
|
|
|
|
|
|
|
comp |
111496..112530 |
CDS |
|
616 |
|
|
|
345 |
|
|
113147..114705 |
16s |
|
207 |
|
|
|
|
|
|
114913..117843 |
23s |
|
76 |
|
|
|
|
|
|
117920..118036 |
5s |
|
343 |
343 |
|
|
|
|
|
118380..119837 |
CDS |
|
3 348 |
|
|
|
486 |
|
|
|
|
|
|
|
|
|
|
|
|
123186..124469 |
CDS |
|
90 |
90 |
|
|
428 |
90
|
|
124560..124648 |
tca |
|
145 |
145 |
|
|
|
|
|
124794..125135 |
CDS |
|
55 592 |
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
|
180728..181003 |
CDS |
|
412 |
|
|
|
92 |
|
|
181416..182974 |
16s |
|
108 |
|
|
|
|
|
|
183083..183199 |
5s |
@1 |
39 |
|
|
|
|
|
|
183239..183315 |
atc |
|
20 |
|
|
20 |
|
|
|
183336..183411 |
gca |
|
128 |
|
|
|
|
|
|
183540..186468 |
23s |
|
130 |
|
|
|
|
|
|
186599..186690 |
agc |
|
28 |
|
|
28 |
|
|
|
186719..186795 |
atgj |
|
10 |
|
|
10 |
|
|
|
186806..186881 |
gta |
|
4 |
|
|
4 |
|
|
|
186886..186961 |
aca |
|
19 |
|
|
19 |
|
|
|
186981..187057 |
gac |
|
77 |
|
|
77 |
|
|
|
187135..187210 |
ttc |
|
6 |
|
|
6 |
|
|
|
187217..187302 |
tac |
|
7 |
|
|
7 |
|
|
|
187310..187385 |
aaa |
|
154 |
154 |
|
|
|
154
|
|
187540..188682 |
CDS |
|
24 062 |
|
|
|
381 |
|
|
|
|
|
|
|
|
|
|
|
comp |
212745..213341 |
CDS |
|
211 |
211 |
|
|
199 |
211
|
comp |
213553..213624 |
cgg |
|
259 |
259 |
|
|
|
|
|
213884..214921 |
CDS |
|
238 832 |
|
|
|
346 |
|
|
|
|
|
|
|
|
|
|
|
|
453754..455364 |
CDS |
|
392 |
|
|
|
537 |
|
|
455757..457315 |
16s |
|
207 |
|
|
|
|
|
|
457523..460453 |
23s |
|
76 |
|
|
|
|
|
|
460530..460646 |
5s |
|
34 |
|
|
|
|
|
|
460681..460757 |
atc |
|
22 |
|
|
22 |
|
|
|
460780..460855 |
gca |
|
4 |
|
|
4 |
|
|
|
460860..460935 |
aac |
|
34 |
|
|
34 |
|
|
|
460970..461043 |
atgj |
|
3 |
|
|
3 |
|
|
|
461047..461138 |
agc |
|
31 |
|
|
31 |
|
|
|
461170..461241 |
gaa |
|
6 |
|
|
6 |
|
|
|
461248..461323 |
gta |
|
10 |
|
|
10 |
|
|
|
461334..461407 |
atgf |
|
25 |
|
|
25 |
|
|
|
461433..461509 |
gac |
|
50 |
|
|
50 |
|
|
|
461560..461635 |
ttc |
|
22 |
|
|
22 |
|
|
|
461658..461733 |
aca |
|
5 |
|
|
5 |
|
|
|
461739..461824 |
tac |
|
16 |
|
|
16 |
|
|
|
461841..461913 |
cac |
|
18 |
|
|
18 |
|
|
|
461932..462006 |
caa |
|
4 |
|
|
4 |
|
|
|
462011..462086 |
aaa |
|
15 |
|
|
15 |
|
|
|
462102..462189 |
ctg |
|
6 |
|
|
6 |
|
|
|
462196..462270 |
ggc |
|
10 |
|
|
10 |
|
|
|
462281..462351 |
tgc |
|
26 |
|
|
26 |
|
|
|
462378..462454 |
cgt |
|
22 |
|
|
22 |
|
|
|
462477..462550 |
cca |
|
9 |
|
|
9 |
|
|
|
462560..462630 |
gga |
|
204 |
204 |
|
|
|
204
|
comp |
462835..463938 |
CDS |
|
1 537 |
|
|
|
368 |
|
|
|
|
|
|
|
|
|
|
|
|
465476..466216 |
CDS |
|
524 |
|
|
|
247 |
|
|
466741..468299 |
16s |
|
207 |
|
|
|
|
|
|
468507..471434 |
23s |
|
76 |
|
|
|
|
|
|
471511..471627 |
5s |
|
629 |
|
|
|
|
|
|
472257..473588 |
CDS |
|
103 459 |
|
|
|
444 |
|
|
|
|
|
|
|
|
|
|
|
|
577048..577794 |
CDS |
|
1 116 |
|
|
|
249 |
|
|
578911..580469 |
16s |
|
207 |
|
|
|
|
|
|
580677..583607 |
23s |
|
76 |
|
|
|
|
|
|
583684..583800 |
5s |
|
82 |
|
|
|
|
|
|
583883..583958 |
gca |
|
4 |
|
|
4 |
|
|
|
583963..584038 |
aac |
|
3 |
|
|
3 |
|
|
|
584042..584133 |
tcc |
|
19 |
|
|
19 |
|
|
|
584153..584224 |
gaa |
|
9 |
|
|
9 |
|
|
|
584234..584309 |
gta |
|
29 |
|
|
29 |
|
|
|
584339..584412 |
atgf |
|
25 |
|
|
25 |
|
|
|
584438..584514 |
gac |
|
13 |
|
|
13 |
|
|
|
584528..584603 |
aca |
|
4 |
|
|
4 |
|
|
|
584608..584693 |
tac |
|
102 |
|
|
102 |
|
|
|
584796..584870 |
caa |
|
4 |
|
|
4 |
|
|
|
584875..584950 |
aaa |
|
12 |
|
|
12 |
|
|
|
584963..585043 |
cta |
|
10 |
|
|
10 |
|
|
|
585054..585128 |
ggc |
|
5 |
|
|
5 |
|
|
|
585134..585210 |
cgt |
|
12 |
|
|
12 |
|
|
|
585223..585302 |
ttg |
|
7 |
|
|
7 |
|
|
|
585310..585386 |
cca |
|
7 |
|
|
7 |
|
|
|
585394..585464 |
gga |
|
1 133 |
|
|
|
|
|
|
586598..587560 |
CDS |
|
22 016 |
|
|
|
321 |
|
|
|
|
|
|
|
|
|
|
|
|
609577..609924 |
CDS |
|
73 |
73 |
|
|
116 |
73
|
|
609998..610069 |
acg |
|
1 613 |
|
|
|
|
|
comp |
611683..612030 |
CDS |
|
140 810 |
|
|
|
116 |
|
|
|
|
|
|
|
|
|
|
|
|
752841..754124 |
CDS |
|
611 |
|
|
|
428 |
|
|
754736..756294 |
16s |
|
208 |
|
|
|
|
|
|
756503..759431 |
23s |
|
75 |
|
|
|
|
|
|
759507..759623 |
5s |
|
183 |
183 |
|
|
|
183
|
comp |
759807..760232 |
CDS |
|
173 078 |
|
|
|
142 |
|
|
|
|
|
|
|
|
|
|
|
|
933311..934681 |
CDS |
|
449 |
|
|
|
457 |
|
|
935131..936689 |
16s |
|
221 |
|
|
|
|
|
|
936911..939839 |
23s |
|
76 |
|
|
|
|
|
|
939916..940032 |
5s |
|
216 |
216 |
|
|
|
216
|
|
940249..941241 |
CDS |
|
521 183 |
|
|
|
331 |
|
|
|
|
|
|
|
|
|
|
|
|
1462425..1462937 |
CDS |
|
44 |
44 |
|
|
171 |
44
|
|
1462982..1463057 |
aac |
|
1 |
|
1 |
|
|
|
|
1463059..1463147 |
agc |
|
122 |
122 |
|
|
|
|
comp |
1463270..1464145 |
CDS |
|
74 |
|
|
|
292 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1464220..1464981 |
CDS |
|
246 |
246 |
|
|
254 |
|
|
1465228..1465299 |
gaa |
|
86 |
|
86 |
|
|
|
|
1465386..1465461 |
aaa |
|
15 |
|
15 |
|
|
|
|
1465477..1465562 |
ctc |
|
162 |
162 |
|
|
|
162
|
|
1465725..1466180 |
CDS |
|
1 667 |
|
|
|
152 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1467848..1468585 |
CDS |
|
262 |
262 |
|
|
246 |
|
|
1468848..1468930 |
ctc |
|
148 |
148 |
|
|
|
148
|
comp |
1469079..1469564 |
CDS |
|
112 990 |
|
|
|
162 |
|
|
|
|
|
|
|
|
|
|
|
|
1582555..1583361 |
CDS |
|
490 |
|
|
|
269 |
|
|
1583852..1583925 |
ccc |
|
244 |
244 |
|
|
|
|
comp |
1584170..1585441 |
CDS |
|
32 099 |
|
|
|
424 |
|
|
|
|
|
|
|
|
|
|
|
|
1617541..1619682 |
CDS |
|
107 |
107 |
|
|
714 |
107
|
|
1619790..1619860 |
gga |
|
265 |
265 |
|
|
|
|
|
1620126..1621163 |
CDS |
|
254 529 |
|
|
|
346 |
|
|
|
|
|
|
|
|
|
|
|
|
1875693..1876160 |
CDS |
|
129 |
129 |
|
|
156 |
129
|
|
1876290..1876365 |
gcc |
|
11 |
|
11 |
|
|
|
|
1876377..1876449 |
aag |
|
520 |
|
|
|
|
|
comp |
1876970..1877974 |
CDS |
|
55 215 |
|
|
|
335 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1933190..1933630 |
CDS |
|
381 |
|
|
|
147 |
|
|
1934012..1934096 |
ctg |
|
91 |
91 |
|
|
|
91
|
comp |
1934188..1934718 |
CDS |
|
74 847 |
|
|
|
177 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2009566..2010102 |
CDS |
|
222 |
222 |
|
|
179 |
|
|
2010325..2010409 |
ctg |
|
213 |
213 |
|
|
|
|
|
2010623..2011135 |
CDS |
|
432 608 |
|
|
|
171 |
|
|
|
|
|
|
|
|
|
|
|
|
2443744..2448333 |
CDS |
|
540 |
|
|
|
1530 |
|
|
2448874..2450432 |
16s |
|
400 |
|
|
|
|
|
|
2450833..2453761 |
23s |
|
143 |
|
|
|
|
|
|
2453905..2454021 |
5s |
|
236 |
236 |
|
|
|
236
|
comp |
2454258..2455367 |
CDS |
|
186 804 |
|
|
|
370 |
|
|
|
|
|
|
|
|
|
|
|
|
2642172..2643329 |
CDS |
|
426 |
|
|
|
386 |
|
|
2643756..2645314 |
16s |
|
343 |
|
|
|
|
|
|
2645658..2648586 |
23s |
|
144 |
|
|
|
|
|
|
2648731..2648847 |
5s |
|
156 |
156 |
|
|
|
156
|
|
2649004..2649228 |
CDS |
|
884 577 |
|
|
|
75 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3533806..3534249 |
CDS |
|
139 |
139 |
|
|
148 |
139
|
|
3534389..3534460 |
gtc |
|
279 |
279 |
|
|
|
|
comp |
3534740..3535069 |
CDS |
|
103 837 |
|
|
|
110 |
|
|
|
|
|
|
|
|
|
|
|
|
3638907..3639338 |
CDS |
|
728 |
|
|
|
144 |
|
comp |
3640067..3640152 |
tta |
|
249 |
249 |
|
|
|
249
|
|
3640402..3640560 |
CDS |
|
28 092 |
|
|
|
53 |
|
|
|
|
|
|
|
|
|
|
|
|
3668653..3669450 |
CDS |
|
247 |
247 |
|
|
266 |
|
comp |
3669698..3669766 |
atg |
|
267 |
267 |
|
|
|
|
comp |
3670034..3670234 |
CDS |
|
54 456 |
|
|
|
67 |
|
|
|
|
|
|
|
|
|
|
|
|
3724691..3725086 |
CDS |
|
122 |
122 |
|
|
132 |
122
|
comp |
3725209..3725282 |
atgi |
|
435 |
|
|
|
|
|
comp |
3725718..3726359 |
CDS |
|
612 148 |
|
|
|
214 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4338508..4339209 |
CDS |
|
107 |
107 |
|
|
234 |
107
|
comp |
4339317..4339390 |
cca |
|
7 |
|
|
7 |
|
|
comp |
4339398..4339477 |
ttg |
|
12 |
|
|
12 |
|
|
comp |
4339490..4339566 |
cgt |
|
5 |
|
|
5 |
|
|
comp |
4339572..4339646 |
ggc |
|
35 |
|
|
35 |
|
|
comp |
4339682..4339757 |
aaa |
|
28 |
|
|
28 |
|
|
comp |
4339786..4339862 |
gac |
|
26 |
|
|
26 |
|
|
comp |
4339889..4339965 |
atgf |
|
30 |
|
|
30 |
|
|
comp |
4339996..4340071 |
gta |
|
9 |
|
|
9 |
|
|
comp |
4340081..4340152 |
gaa |
|
17 |
|
|
17 |
|
|
comp |
4340170..4340261 |
tcc |
|
3 |
|
|
3 |
|
|
comp |
4340265..4340340 |
aac |
|
18 |
|
|
|
|
|
comp |
4340359..4340475 |
5s |
|
76 |
|
|
|
|
|
comp |
4340552..4343482 |
23s |
|
400 |
|
|
|
|
|
comp |
4343883..4345441 |
16s |
|
493 |
|
|
|
|
|
comp |
4345935..4347563 |
CDS |
|
46 596 |
|
|
|
543 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4394160..4395092 |
CDS |
|
238 |
238 |
|
|
311 |
|
|
4395331..4395404 |
aga |
|
214 |
214 |
|
|
|
|
|
4395619..4396383 |
CDS |
|
49 894 |
|
|
|
255 |
|
|
|
|
|
|
|
|
|
|
|
|
4446278..4447621 |
CDS |
|
207 |
207 |
|
|
448 |
|
comp |
4447829..4447902 |
aga |
|
174 |
174 |
|
|
|
|
|
4448077..4448370 |
CDS |
|
256 556 |
|
|
|
98 |
|
|
|
|
|
|
|
|
|
|
|
|
4704927..4705187 |
CDS |
|
361 |
|
|
|
87 |
|
comp |
4705549..4705627 |
ttg |
|
11 |
|
11 |
|
|
|
comp |
4705639..4705713 |
tgc |
|
11 |
|
11 |
|
|
|
comp |
4705725..4705796 |
ggc |
|
6 |
|
6 |
|
|
|
comp |
4705803..4705877 |
caa |
|
9 |
|
9 |
|
|
|
comp |
4705887..4705959 |
cac |
|
17 |
|
17 |
|
|
|
comp |
4705977..4706050 |
tgg |
|
7 |
|
7 |
|
|
|
comp |
4706058..4706143 |
tac |
|
4 |
|
4 |
|
|
|
comp |
4706148..4706223 |
aca |
|
22 |
|
22 |
|
|
|
comp |
4706246..4706318 |
ttc |
|
35 |
|
35 |
|
|
|
comp |
4706354..4706430 |
gac |
|
15 |
|
15 |
|
|
|
comp |
4706446..4706522 |
atgf |
|
25 |
|
25 |
|
|
|
comp |
4706548..4706623 |
gta |
|
58 |
|
58 |
|
|
|
comp |
4706682..4706753 |
gaa |
|
17 |
|
17 |
|
|
|
comp |
4706771..4706862 |
tcc |
|
3 |
|
3 |
|
|
|
comp |
4706866..4706941 |
aac |
|
326 |
326 |
|
|
|
|
comp |
4707268..4707597 |
CDS |
|
279 544 |
|
|
|
110 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4987142..4989934 |
CDS |
|
726 |
|
|
|
931 |
|
comp |
4990661..4990731 |
gga |
|
9 |
|
|
9 |
|
|
comp |
4990741..4990814 |
cca |
|
22 |
|
|
22 |
|
|
comp |
4990837..4990913 |
cgt |
|
5 |
|
|
5 |
|
|
comp |
4990919..4990993 |
ggc |
|
10 |
|
|
10 |
|
|
comp |
4991004..4991084 |
cta |
|
11 |
|
|
11 |
|
|
comp |
4991096..4991171 |
aaa |
|
4 |
|
|
4 |
|
|
comp |
4991176..4991250 |
caa |
|
55 |
|
|
55 |
|
|
comp |
4991306..4991381 |
gta |
|
11 |
|
|
11 |
|
|
comp |
4991393..4991464 |
gaa |
|
11 |
|
|
11 |
|
|
comp |
4991476..4991548 |
acc |
|
3 |
|
|
3 |
|
|
comp |
4991552..4991627 |
aac |
|
18 |
|
|
|
|
|
comp |
4991646..4991762 |
5s |
|
76 |
|
|
|
|
|
comp |
4991839..4994768 |
23s |
|
129 |
|
|
|
|
|
comp |
4994898..4994973 |
gca |
|
20 |
|
|
20 |
|
|
comp |
4994994..4995070 |
atc |
|
38 |
|
|
|
|
|
comp |
4995109..4995225 |
5s |
|
93 |
|
|
|
|
|
comp |
4995319..4996877 |
16s |
|
367 |
|
|
|
|
|
comp |
4997245..4997475 |
CDS |
|
60 140 |
|
|
|
77 |
|
|
|
|
|
|
|
|
|
|
|
comp |
5057616..5058803 |
CDS |
|
163 |
163 |
|
|
396 |
163
|
comp |
5058967..5059083 |
5s |
|
76 |
|
|
|
|
|
comp |
5059160..5062089 |
23s |
|
185 |
|
|
|
|
|
comp |
5062275..5062350 |
gca |
|
89 |
|
|
|
|
|
comp |
5062440..5063998 |
16s |
|
380 |
|
|
|
|
|
comp |
5064379..5066394 |
CDS |
|
647 899 |
|
|
|
672 |
|
|
|
|
|
|
|
|
|
|
|
|
5714294..5714611 |
CDS |
|
206 |
206 |
|
|
106 |
|
comp |
5714818..5714908 |
tcg |
|
77 |
77 |
|
|
|
77
|
comp |
5714986..5715210 |
CDS |
|
|
|
|
|
75 |
|
- Liens: gtRNAdb [14], NCBI [15]
- Lien tableur: ppm
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B4 Paenibacillus polymyxa SC2 plasmide
B4 Paenibacillus polymyxa SC2 plasmide MAJ
comp |
23.10.19 Tanger |
49 aas |
doubles |
intercal
|
|
3920..4174 |
cds hp |
|
|
|
4711..4803 |
agc |
+ |
|
|
4809..4883 |
tgc |
3 aac |
|
|
4947..5021 |
gaa |
2 atc |
|
|
5029..5105 |
ctt |
2 cca |
|
|
5112..5186 |
cca |
2 cga |
|
|
5288..5361 |
tgg |
2 gaa |
|
|
5366..5441 |
tat |
3 tgg |
7
|
|
5449..5522 |
caa |
|
|
|
5529..5605 |
cac |
|
|
|
5611..5686 |
gac |
|
|
|
5812..5887 |
gga |
|
|
|
5898..5973 |
aac |
@1 |
|
|
5978..6066 |
tac |
ctt |
|
|
6076..6153 |
ata |
ata |
82
|
|
|
**** |
tat |
|
|
6236..6311 |
atgi |
|
|
|
6317..6392 |
aac |
|
|
|
6397..6470 |
tgg |
|
|
|
6602..6678 |
gaa |
|
|
|
6684..6757 |
ggc |
|
|
|
6813..6885 |
ttc |
|
|
|
6908..6980 |
cga |
|
7
|
|
6988..7065 |
cca |
|
|
|
7071..7155 |
ttg |
|
|
|
7161..7235 |
atc |
|
4
|
|
7240..7317 |
atgf |
|
|
|
7323..7398 |
gca |
|
|
|
7508..7584 |
cga |
|
|
|
7588..7668 |
cta |
|
|
|
7682..7758 |
atc |
|
|
|
7767..7841 |
aac |
|
|
|
7846..7919 |
tgg |
|
|
|
7953..8324 |
cds hp |
|
|
|
8301..8378 |
gac |
|
|
|
8387..8473 |
tac |
|
|
|
8560..8632 |
aaa |
|
|
|
8647..8720 |
gga |
|
|
|
8725..8800 |
ttc |
|
|
|
8808..8882 |
acg |
@2 |
|
comp |
8983..9600 |
cds hp |
acg |
|
|
9690..9771 |
tta |
|
|
|
9775..9849 |
aca |
|
|
comp |
9885..10169 |
cds hp |
|
|
|
|
|
|
|
comp |
10320..10622 |
cds hp |
|
|
|
10739..10813 |
aca |
|
|
comp |
10832..11146 |
cds hp |
|
|
|
|
|
|
|
comp |
11363..11599 |
cds hp |
|
|
|
11694..11765 |
aga |
|
85
|
|
11851..12312 |
cds rev-trans |
|
|
|
|
|
|
|
comp |
12508..12756 |
cds trans-rg |
|
442
|
|
**** |
**** |
|
|
|
13199..14083 |
cds hp |
|
|
|
|
|
|
|
|
14310..14385 |
tcg |
+ |
|
|
14394..14481 |
tcc |
2 tcg |
|
|
14489..14560 |
ctt |
@3 |
6
|
|
14567..14654 |
tcg |
tcg |
|
|
14660..14751 |
tca |
ctt |
|
|
14871..15080 |
cds hp |
|
|
|
|
|
|
|
comp |
227125..227388 |
cds hp |
|
|
comp |
227833..227903 |
gga |
|
|
comp |
228152..228391 |
cds hp |
|
|
|
|
|
|
|
comp |
229793..229999 |
cds hp |
|
|
comp |
230024..230108 |
tca |
|
783
|
|
**** |
**** |
|
|
|
|
|
|
|
comp |
230872..231393 |
cds hp |
|
|
comp |
231558..231640 |
tta |
|
|
|
232618..233067 |
cds hp |
|
|
|
510118..1 |
|
|
|
|
B4 Paenibacillus polymyxa SC2 plasmide
37.6%GC |
26.7.19 Paris |
51 |
doubles |
intercal |
CDS |
aa |
avec aa |
cdsa |
cdsd
|
|
3920..4174 |
CDS |
|
536 |
536 |
|
|
85 |
|
|
4711..4803 |
agc |
+ |
5 |
|
5 |
|
|
|
|
4809..4883 |
tgc |
3 aac |
63 |
|
63 |
|
|
|
|
4947..5021 |
gaa |
2 atc |
7 |
|
7 |
|
|
|
|
5029..5105 |
ctt |
2 caa |
6 |
|
6 |
|
|
|
|
5112..5186 |
cca |
2 cca |
101 |
|
101 |
|
|
|
|
5288..5361 |
tgg |
2 cga |
4 |
|
4 |
|
|
|
|
5366..5444 |
tac |
2 gaa |
4 |
|
4 |
|
|
|
|
5449..5522 |
caa |
2 tac |
6 |
|
6 |
|
|
|
|
5529..5605 |
cac |
3 tgg |
5 |
|
5 |
|
|
|
|
5611..5686 |
gac |
|
125 |
|
125 |
|
|
|
|
5812..5887 |
gga |
|
10 |
|
10 |
|
|
|
|
5898..5973 |
aac |
@1 |
4 |
|
4 |
|
|
|
|
5978..6066 |
tac |
ctt |
9 |
|
9 |
|
|
|
|
6076..6153 |
ata |
ata |
4 |
|
4 |
|
|
|
|
6158..6231 |
caa |
|
4 |
|
4 |
|
|
|
|
6236..6311 |
atgi |
|
5 |
|
5 |
|
|
|
|
6317..6392 |
aac |
|
4 |
|
4 |
|
|
|
|
6397..6470 |
tgg |
|
131 |
|
131 |
|
|
|
|
6602..6678 |
gaa |
|
5 |
|
5 |
|
|
|
|
6684..6757 |
ggc |
|
55 |
|
55 |
|
|
|
|
6813..6885 |
ttc |
|
22 |
|
22 |
|
|
|
|
6908..6983 |
cga |
|
4 |
|
4 |
|
|
|
|
6988..7065 |
cca |
|
5 |
|
5 |
|
|
|
|
7071..7155 |
ttg |
|
5 |
|
5 |
|
|
|
|
7161..7235 |
atc |
|
5 |
|
5 |
|
|
|
|
7241..7317 |
atgf |
|
5 |
|
5 |
|
|
|
|
7323..7398 |
gca |
|
109 |
|
109 |
|
|
|
|
7508..7584 |
cga |
|
3 |
|
3 |
|
|
|
|
7588..7668 |
cta |
|
13 |
|
13 |
|
|
|
|
7682..7758 |
atc |
|
8 |
|
8 |
|
|
|
|
7767..7841 |
aac |
|
4 |
|
4 |
|
|
|
|
7846..7919 |
tgg |
|
33 |
33 |
|
|
|
33
|
|
7953..8324 |
CDS |
@4 |
-24 |
-24 |
|
|
124 |
|
|
8301..8378 |
gac |
|
8 |
|
8 |
|
|
|
|
8387..8473 |
tac |
|
86 |
|
86 |
|
|
|
|
8560..8632 |
aaa |
|
14 |
|
14 |
|
|
|
|
8647..8720 |
gga |
|
4 |
|
4 |
|
|
|
|
8725..8800 |
ttc |
|
7 |
|
7 |
|
|
|
|
8808..8882 |
acg |
@2 |
100 |
100 |
|
|
|
|
comp |
8983..9600 |
CDS |
acg |
89 |
89 |
|
|
206 |
|
|
9690..9771 |
tta |
|
3 |
|
3 |
|
|
|
|
9775..9849 |
aca |
|
35 |
35 |
|
|
|
35
|
comp |
9885..10169 |
CDS |
|
150 |
|
|
|
95 |
|
|
|
|
|
|
|
|
|
|
|
comp |
10320..10622 |
CDS |
|
116 |
116 |
|
|
101 |
|
|
10739..10813 |
aca |
|
18 |
18 |
|
|
|
18
|
comp |
10832..11146 |
CDS |
|
216 |
|
|
|
105 |
|
|
|
|
|
|
|
|
|
|
|
comp |
11363..11599 |
CDS |
|
94 |
94 |
|
|
79 |
94
|
|
11694..11768 |
aga |
|
103 |
103 |
|
|
|
|
|
11872..12312 |
CDS |
|
195 |
|
|
|
147 |
|
|
|
|
|
|
|
|
|
|
|
comp |
12508..12756 |
CDS |
|
293 |
293 |
|
|
83 |
|
|
13050..13126 |
atc |
|
72 |
72 |
|
|
|
72
|
|
13199..14083 |
CDS |
|
226 |
226 |
|
|
295 |
|
|
|
|
|
|
|
|
|
|
|
|
14310..14385 |
tcg |
+ |
8 |
|
8 |
|
|
|
|
14394..14481 |
tcc |
2 tcg |
7 |
|
7 |
|
|
|
|
14489..14563 |
ctt |
@3 |
3 |
|
3 |
|
|
|
|
14567..14654 |
tcg |
tcg |
5 |
|
5 |
|
|
|
|
14660..14751 |
tca |
ctt |
119 |
119 |
|
|
|
119
|
|
14871..15080 |
CDS |
|
212044 |
|
|
|
70 |
|
|
|
|
|
|
|
|
|
|
|
comp |
227125..227388 |
CDS |
|
444 |
444 |
|
|
88 |
|
comp |
227833..227903 |
gga |
|
248 |
248 |
|
|
|
248
|
comp |
228152..228391 |
CDS |
|
1401 |
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
comp |
229793..229999 |
CDS |
|
24 |
24 |
|
|
69 |
24
|
comp |
230024..230108 |
tca |
|
289 |
289 |
|
|
|
|
comp |
230398..230640 |
CDS |
|
231 |
|
|
|
81 |
|
|
|
|
|
|
|
|
|
|
|
comp |
230872..231393 |
CDS |
|
161 |
161 |
|
|
174 |
161
|
comp |
231555..231640 |
tta |
|
977 |
977 |
|
|
|
|
|
232618..233067 |
CDS |
|
277050 |
|
|
|
150 |
|
|
510118..1 |
|
|
|
|
|
|
|
|
|
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, chromosome.
Opérons |
Fréquences intercalaires |
Fréquences aas cds
|
|
|
effectifs |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsa |
cdsj |
gammes |
cdsd
|
avec rRNA |
opérons |
13 |
1 |
1 |
0 |
1 |
0 |
100 |
8 |
5 |
40 |
0
|
|
16 23 5s 0 |
7 |
20 |
12 |
46 |
50 |
1 |
200 |
20 |
17 |
60 |
1
|
|
16 5 atc gca |
2 |
40 |
3 |
15 |
100 |
4 |
300 |
10 |
6 |
80 |
2
|
|
16 23 5s a |
3 |
60 |
1 |
2 |
150 |
8 |
400 |
13 |
9 |
100 |
2
|
|
max a |
21 |
80 |
0 |
1 |
200 |
6 |
500 |
7 |
4 |
120 |
2
|
|
a doubles |
0 |
100 |
1 |
0 |
250 |
15 |
600 |
2 |
0 |
140 |
3
|
|
16 gca 23 5s |
1 |
120 |
0 |
1 |
300 |
5 |
700 |
1 |
0 |
160 |
3
|
|
total aas |
73 |
140 |
0 |
0 |
350 |
3 |
800 |
1 |
1 |
180 |
2
|
sans |
opérons |
19 |
160 |
0 |
0 |
400 |
5 |
900 |
0 |
0 |
200 |
1
|
|
1 aa |
15 |
180 |
0 |
0 |
450 |
4 |
1000 |
1 |
0 |
220 |
3
|
|
max a |
15 |
200 |
0 |
0 |
500 |
2 |
1100 |
0 |
0 |
240 |
2
|
|
a doubles |
0 |
|
0 |
0 |
|
11 |
|
1 |
0 |
|
1
|
|
total aas |
37 |
|
18 |
65 |
|
64 |
|
64 |
42 |
|
22
|
total aas |
|
110 |
moyenne |
20 |
17 |
|
193 |
|
292 |
229 |
|
150
|
remarques |
|
1 |
variance |
21 |
17 |
|
73 |
|
234 |
123 |
|
58
|
jaune |
|
|
|
|
|
|
sans |
|
|
sans |
|
|
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
cumuls. Paenibacillus polymyxa SC2, plasmide.
Opérons |
Fréquences intercalaires |
Fréquences aas cds
|
|
|
effectifs |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsa |
cdsj |
gammes |
cdsd
|
avec rRNA |
opérons |
0 |
1 |
0 |
|
1 |
1 |
60 |
0 |
|
40 |
4
|
|
16 23 5s 0 |
|
20 |
33 |
|
50 |
4 |
80 |
4 |
|
60 |
0
|
|
16 5 atc gca |
|
40 |
1 |
|
100 |
4 |
100 |
5 |
|
80 |
1
|
|
16 23 5s a |
|
60 |
1 |
|
150 |
3 |
120 |
2 |
|
100 |
1
|
|
max a |
|
80 |
1 |
|
200 |
1 |
140 |
1 |
|
120 |
1
|
|
a doubles |
|
100 |
1 |
|
250 |
2 |
160 |
2 |
|
140 |
0
|
|
16 gca 23 5s |
|
120 |
2 |
|
300 |
2 |
180 |
1 |
|
160 |
0
|
|
total aas |
|
140 |
2 |
|
350 |
0 |
200 |
0 |
|
180 |
1
|
sans |
opérons |
10 |
160 |
0 |
|
400 |
0 |
220 |
1 |
|
200 |
0
|
|
1 aa |
6 |
180 |
0 |
|
450 |
1 |
240 |
0 |
|
220 |
0
|
|
max a |
32 |
200 |
0 |
|
500 |
0 |
260 |
0 |
|
240 |
0
|
|
a doubles |
2 |
|
0 |
|
|
2 |
|
1 |
|
|
1
|
|
total aas |
51 |
|
41 |
|
|
20 |
|
17 |
|
|
9
|
total aas |
|
51 |
moyenne |
6 |
|
|
126 |
|
102 |
|
|
89
|
remarques |
|
3 |
variance |
3 |
|
|
92 |
|
32 |
|
|
77
|
jaune |
|
|
|
sans |
|
|
sans |
|
sans |
|
|
|
- Note: intercalaires prélevés de la colonne cds de ppm opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ppm 45 48 21 72
deb fin deb fin grand petit grand petit
-24 100 116 18 100 35 100 -24
24 289 536 33 100 -24 116 18
44 122 100 35 103 94 289 24
73 1613 293 72 116 18 536 33
90 145 206 77 122 44 100 35
94 103 381 91 145 90 122 44
100 35 -24 100 206 77 293 72
107 265 94 103 207 174 1613 73
116 18 226 119 222 213 206 77
122 435 44 122 226 119 145 90
129 520 90 145 238 214 381 91
139 279 262 148 246 162 103 94
161 977 246 162 259 211 265 107
206 77 207 174 262 148 226 119
207 174 222 213 265 107 435 122
211 259 238 214 267 247 520 129
222 213 490 244 279 139 279 139
226 119 444 248 289 24 262 148
238 214 728 249 293 72 977 161
246 162 211 259 361 326 246 162
247 267 107 265 381 91 207 174
262 148 247 267 435 122 259 211
293 72 139 279 444 248 222 213
361 326 24 289 490 244 238 214
381 91 361 326 520 129 490 244
444 248 122 435 536 33 267 247
490 244 129 520 728 249 444 248
536 33 161 977 977 161 728 249
728 249 73 1613 1613 73 361 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
ppm 5,384 58 1 26 22 6 3 12 14 6 20
ppm ‰ 17 448 379 103 52 414 483 207 690
B4. Paenibacillus polymyxa SC2, blocs à rRNA.
cds |
392 |
|
cds |
1116 |
|
cds |
493
|
16s |
207 |
|
16s |
207 |
|
16s |
400
|
23s |
76 |
|
23s |
76 |
|
23s |
76
|
5s |
34 |
|
5s |
82 |
|
5s |
18
|
atc |
22 |
|
gca |
4 |
|
aac |
3
|
19aas |
* |
|
15aas |
* |
|
9aas |
*
|
gga |
204’ |
|
gga |
1133 |
|
cca |
107
|
cds |
|
|
cds |
|
|
cds |
|
cds |
367 |
|
cds |
412 |
|
cds |
380
|
16s |
93 |
|
16s |
108 |
|
16s |
89
|
5s |
38 |
|
5s |
39 |
|
gca |
185
|
atc |
20 |
|
atc |
20 |
|
23s |
76
|
gca |
129 |
|
gca |
128 |
|
5s |
163
|
23s |
76 |
|
23s |
130 |
|
cds |
|
5s |
18 |
|
agc |
28 |
|
|
|
aac |
3 |
|
6aas |
* |
|
|
|
9aas |
* |
|
aaa |
154 |
|
|
|
gga |
726 |
|
cds |
|
|
|
|
cds |
|
|
|
|
|
|
|
cds |
327 |
616’ |
524 |
611 |
449 |
540 |
426
|
16s |
280 |
207 |
207 |
208 |
221 |
400 |
343
|
23s |
143 |
76 |
76 |
75 |
76 |
143 |
144
|
5s |
232 |
343 |
629 |
183’ |
216 |
236’ |
156
|
cds |
|
|
|
|
|
|
|
5s |
constant |
39 aas |
117 pbs |
|
|
|
|
tRNAs 21 17 11
16s 207 207 400
23s 76 76 76
5s 34 82 18
tRNAs 13 - - 10
16s 93 16s 108 16s 89
5s 38 5s 39 gca 185
atc 20 atc 20 23s 76
gca 129 gca 128 5s
23s 76 23s 130
5s 18
16s 280 207 207 208 221 400 343
23s 143 76 76 75 76 143 144
5s
5s constant 39 aas 117 pb
*Remarques :Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.
- La majorité des tRNAs se trouvent dans les clusters à rRNA 73 contre 37.
- Les blocs 16s23s5s sont majoritaires , 10 sur 13, dont 7 ne portent pas de tRNAs.
- Les intercalaires 16s-23s sont quasiment identiques pour 7 blocs/10 les 3 autres sont doubles.
- Les intercalaires 23s-5s sont aussi quasiment identiques pour 10/12 les autres sont doubles.
- Les 2 intercalaires 16s-5s sont moitié de ceux de23s-5s.
- Voir la liste ci-dessus pour les intercalaires et le nombre de tRNAs.
@1 - Le bloc 16s5s-atcgca-23s-10aas a son 5s anormalement positionné, pas après 23s
mais après 16s. Certains génomes (ref.) n’ont que que ce type.
-Le bloc 16s5s-atcgca-23s5s-13aas porte les 2 types de position alors que en général
un bloc à 2 5s est du type 16s23s5s5s, avec les 2 5s du même côté du 23s.
Séquences des doubles : Il n’y a pas de doublons dans les 13 blocs à rRNA, ni dans les blocs sans rRNA.
Plasmide
24.10.19 Tanger
*Remarques :
- Il n'y a pas de cluster avec des gènes rRNAs, mais il existe au moins un plasmide avec ce type
de cluster (ref.) chez les bactéries.
- 46 gènes de tRNA sur 49 sont regroupés en 11 152 pb pour une longueur de plasmide de 510 118.
Soit 2 % seulement de la taille du plasmide.
- Ces 46 gènes sont répartis en 4 clusters dont le principal avec 39 gènes contient 2 cds entourés
chacun par 2 tRNAs. Les 3 autres ne contiennent pas de cds à l’intérieur . Les 3 1ers clusters sont contigus
et entre le 3ème et le 4ème existe un seul cds particulier de 83 aas, trans-rg, transcription regulator.
Il est précédé d’une transcriptase reverse, rev-trans, de154 aas.
- Particularité du cluster principal: régularité qui n'existe pas chez les clusters du chromosome.
+ dans le chromosome les intercalaires des clusters avec ou sans rRNA,
moyenne et variance sont égales et du même ordre que la moyenne du cluster principal,
à peu près 20, alors que sa variance est quasiment double, 36 pb.
+ 33 des intercalaires faibles du plasmide ont 6 et 3 pour respectivement moyenne et variance
+ Les intercalaires élevés sont répartis régulièrement et sont du même ordre que ceux
entre tRNA-cds. Voir la liste ci-dessous où les intercalaires avec cds sont signalés en gras.
- Les intercalaires entre les cds d'encadrement des 4 clusters sont aussi du même ordre que ceux à l'intérieur du cluster principal.
Cette similitude et la contiguité entre les cds militent pour le regroupent de ces 4 clusters.
- Les 3 derniers tRNAs du plasmide, aux adresses élevées, ne semblent pas former un groupe de clusters :
Chaque tRNA est, à peu près, aussi proche d’un cds d’encadrement que dans le cluster principal (248 24 161),
mais il est très éloigné de l’autre cds d’encadrement (444 783 977). De même la distance entre les cds est très élevées, 1401.
- Si l'on considère le groupe des 4 clusters à 46 gènes de tRNA comme encadré par 2 cds, les intercalaires proches et éloignés
équivalents respectivement à ceux des 3 tRNA à adresses élevées, sont du même ordre, 109 et 536. Et dans ce groupe
la distance entre 2 cds contigus reste largement inférieure aux 1401 des gènes à adresses élevées, 442 qui est une exception
par la fonction régulatrice d’un des 2 cds de l’intercalaire, « cds trans-rg », alors que les autres intercalaires
sont inférieurs à 216.
- Dans la série de 31 gènes il y a très peu de doublons comme le chromosome: Ils sont signalés par le signe +.
Mais ils ne présentent pas de séries de gènes identiques ou de répétitions de séquences comme dans d’autres génomes,
(ref.) à part la séquence cca-tgg répétée 2 fois. Sinon les doublons sont séparés par de nombreux autres gènes.
Si l’on compare par rapport aux séries longues des clusters avec rRNA du chromosome, 21 aas, ou sans rRNA, 15 aas,
les 31 aas de la série du plasmide, de part sa longueur et le nombre limité de type de gènes (ceux se terminant par a et c)
candidats à la création dans le cluster, il est normal qu’il y ait des doublons. D’autant plus que la série fait appel
à des gènes rares, ctt ata tat.
Donc le plasmide ne déroge pas à l’absence des doublons du génome en entier.
- @1,2 aas rares, acg et ctt, ou très rares, tat et ata.
- @3 regroupement de 5 gènes de tRNA longs dont 4 Ser, 3 rares et un doublets de rares. Alors qu’aucun gène de ser n’est
présent dans la série de 31 gènes.
- @4 l’intercalaire négatif élevé entre le cds (124aas) et le gène de gac illustre bien l’intégration des cds du groupe des 4 clusters
au processus de création de gènes.
entre aas et cds du
cluster principal
1-2 cds 536
2-3 tgc 63
5-6 cca 101
10-11 gac 125
18-19 tgg 131
20-21 ggc 55
21-22 ttc 22
27-28 gca 109
31-32 tgg 33
33-34 cds -24
35-36 tac 86
39-40 acg 100
40-41 cds 89
42-43 aca 35
entre cds de clusters
cl1-cl2 150
cl2-cl3 216
cl3-trans rg 195
trans rg-cl4 442
Bc4 ppm, Paenibacillus polymyxa SC2. bacilli.
bc41 ppm, distribution des blocs sans rRNA. Chromosome
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
1
|
f atc |
2 |
j acc |
|
aac |
2 |
agc |
1
|
g ctc |
2 |
f ccc |
1 |
cac |
1 |
cgt |
|
h gtc |
1 |
n gcc |
1 |
gac |
1 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
2
|
k cta |
|
g cca |
|
caa |
1 |
cga |
|
l gta |
1 |
o gca |
3 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ppm |
22 |
15 |
|
|
|
5 |
42
|
|
bc42 ppm. Distribution des blocs avec rRNA. Chromosome
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
2 |
tac |
3 |
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
4 |
agc |
2
|
g ctc |
|
f ccc |
|
cac |
1 |
cgt |
4
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
4
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
5 |
aga |
|
k cta |
2 |
g cca |
4 |
caa |
3 |
cga |
|
l gta |
5 |
o gca |
2 |
gaa |
4 |
gga |
3
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
2 |
l acg |
|
aag |
|
agg |
|
o ctg |
1 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ppm |
|
|
|
68 |
|
|
68
|
|
bc43 ppm. Distribution des blocs sans rRNA. Plasmide
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
3 |
tgc |
1
|
f atc |
3 |
j acc |
|
aac |
3 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
1 |
cgt |
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
1
|
i tta |
2 |
c tca |
2 |
taa |
|
tga |
|
j ata |
1 |
k aca |
2 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
2 |
caa |
2 |
cga |
2
|
l gta |
|
o gca |
1 |
gaa |
2 |
gga |
3
|
m ttg |
1 |
d tcg |
2 |
tag |
|
tgg |
3
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ppm |
45 |
6 |
|
|
|
|
51
|
|
- ppm Le prélèvement: Abacilli
- Le nom et le lien NCBI: ppm, Paenibacillus polymyxa SC2, NCBI [16], date 10.11.21.
- ppm La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
ppm 791,310 5,728,392 13.8
Intergen51. ppm. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. ppm les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ppm les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
3,157 |
523 |
19 |
3,699 |
2.9 |
118 |
16 |
134
|
x |
1,267 |
29 |
0 |
1,296 |
|
0 |
5 |
5
|
t |
4,424 |
552 |
19 |
4,995 |
|
118 |
21 |
139
|
% |
88.6 |
11.1 |
0.4 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
20 |
0 |
0 |
20 |
0.9 |
tRNA-CDS |
43 |
23
|
x |
23 |
0 |
0 |
23 |
|
RNA-RNA |
118 |
62
|
t |
43 |
0 |
0 |
43 |
|
CDS-rRNA |
21 |
11
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
8 |
4
|
- |
|
|
|
|
|
total |
190 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
7.0 |
20.0 |
1.3 |
21.3 |
0.0 |
55 |
0.5 |
0.0
|
x |
11.9 |
8.7 |
10.3 |
3.7 |
0.0 |
24 |
0.0 |
0.0
|
|
Intergen51. ppm. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: ppm données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ppm fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ppm fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ppm
R2 x3 x2 x c Inflexion poly3 x c
0.802 4.30E-06 -3.28E-03 6.47E-01 -1.18 fx1 abscisse 251.3 201.3
0.917 -2.23E-06 1.78E-03 -5.37E-01 72.1 fc1 ordonnée 22.1 20.7
0.823 5.20E-06 -3.92E-03 7.79E-01 -8.61 fx41
0.956 1.25E-06 -7.55E-04 1.74E-02 37.6 fc41
- Le rfin après 400 est de 221 sur un total de 3176. Jusqu'à 1% les freq10 sont en continu jusqu'à 830, reste 32. L'indice i.rfin1 = 189/430 = 0.440.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données ppm calculs poly3 ppm
effect 3176 R2.21 831 abscis 400
xm 60 pte 9,21 flexa 209
ym 9 cste 3,39 flexo 1,93
x1m 259 r400l 141 xm 55
y1m 1 restp 162,15 sup4 158,2
rfin 69,58 %sd 28,76 sup4t 442,4
bornf 147 lond 199 % 35,8
supd 144,2 %sf 26,30 long 154
supdt 501,6 lonf 87 R2 670
xmp 336,27 sf/lf 0,83
r400 92,57 sr/lr 0,64
supf 72,5 sd/ld 0,72
supft 275,8 i.r400 0,66
Intergen51. ppm. Les CDS-CDS négatifs
modifier
Sous-totaux ppm totale
fréquence x- c- x- c-
- 1 0 59 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 7 229 717 10938
- 5 0 0 5 19
sp6 22 235 1642 8424
total 29 523 2,456 23,544
reste 3 7 264 420
s6 4 1 361 41
s7 3 24 321 1438
s8 12 203 696 6525
rappot s1-5
4/2/1 - 3.9 8.4 2.6
% / sp6
s6/sp6 18.2 0.4 22.0 0.5
s7/sp6 13.6 10.2 19.5 17.1
s8/sp6 54.5 86.4 42.4 77.5
reste/sp6 13.6 3.0 16.1 5.0
total s1-5 7 288 814 15120
% / total
%s1-5 24.1 55.1 33.1 64.2
%sp6 75.9 44.9 66.9 35.8
Intergen51. ppm. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 12 CDS 16s 11 2
16s 23s 10 5s CDS 5 3
16s tRNA 1 16 CDS
tRNA 23s 3 CDS 5s
5s tRNA 6 23s CDS
tRNA in 2 CDS 23s
tRNA contig 63 5s 16s
tRNA hors 18 16s16s
tRNA 16s
23s tRNA 1
tRNA 5s
16s 5s 2
5s 23s
5s 5s
total 118 0 total 16 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 ppm. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3 |
|
|
cont4 |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
28 |
agc |
|
22 |
atc |
|
4 |
gca |
|
7 |
cca |
|
1 |
aac
|
10 |
atgj |
|
4 |
gca |
|
3 |
aac |
|
12 |
ttg |
|
** |
agc
|
4 |
gta |
|
34 |
aac |
|
19 |
tcc |
|
5 |
cgt |
|
86 |
gaa
|
19 |
aca |
|
3 |
atgj |
|
9 |
gaa |
|
38 |
ggc |
|
15 |
aaa
|
77 |
gac |
|
31 |
agc |
|
29 |
gta |
|
28 |
aaa |
|
** |
ctc
|
9 |
ttc |
|
6 |
gaa |
|
25 |
atgf |
|
26 |
gac |
|
11 |
gcc
|
7 |
tac |
|
10 |
gta |
|
13 |
gac |
|
30 |
atgf |
|
** |
aag
|
** |
aaa |
|
25 |
atgf |
|
4 |
aca |
|
9 |
gta |
|
11 |
ttg
|
|
|
|
50 |
gac |
|
102 |
tac |
|
17 |
gaa |
|
11 |
tgc
|
|
|
|
25 |
ttc |
|
4 |
caa |
|
3 |
tcc |
|
6 |
ggc
|
|
|
|
5 |
aca |
|
12 |
aaa |
|
** |
aac |
|
9 |
caa
|
|
|
|
16 |
tac |
|
10 |
cta |
|
9 |
gga |
|
17 |
cac
|
|
|
|
18 |
cac |
|
5 |
ggc |
|
22 |
cca |
|
7 |
tgg
|
|
|
|
4 |
caa |
|
12 |
cgt |
|
5 |
cgt |
|
4 |
tac
|
|
|
|
15 |
aaa |
|
7 |
ttg |
|
10 |
ggc |
|
22 |
aca
|
|
|
|
6 |
ctg |
|
7 |
cca |
|
11 |
cta |
|
35 |
ttc
|
|
|
|
10 |
ggc |
|
** |
gga |
|
4 |
aaa |
|
15 |
gac
|
|
|
|
26 |
tgc |
|
|
|
|
55 |
caa |
|
25 |
atgf
|
|
|
|
22 |
cgt |
|
|
|
|
11 |
gta |
|
58 |
gta
|
|
|
|
9 |
cca |
|
|
|
|
11 |
gaa |
|
17 |
gaa
|
|
|
|
** |
gga |
|
|
|
|
3 |
acc |
|
3 |
tcc
|
|
|
|
|
|
|
|
|
|
** |
aac |
|
** |
aac
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
- ppmp Le prélèvement: Abacilli
- Le nom et le lien NCBI: ppmp, Paenibacillus polymyxa SC2, plasmid pSC2., NCBI [17], date 10.11.21.
- ppmp La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
ppmp 119,608 510,118 23.4
Intergen51. ppmp. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. ppmp les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ppmp les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
435 |
32 |
3 |
470 |
4.4 |
41 |
0 |
41
|
x |
107 |
0 |
0 |
107 |
|
0 |
0 |
0
|
t |
542 |
32 |
3 |
577 |
|
41 |
0 |
41
|
% |
93.9 |
5.5 |
0.5 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
12 |
0 |
0 |
12 |
1.7 |
tRNA-CDS |
19 |
31
|
x |
7 |
0 |
0 |
7 |
|
RNA-RNA |
41 |
66
|
t |
19 |
0 |
0 |
19 |
|
CDS-rRNA |
0 |
0
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
2 |
3
|
- |
|
|
|
|
|
total |
62 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
12.3 |
23.1 |
6.3 |
14.8 |
7.7 |
47 |
0.6 |
0.0
|
x |
23.4 |
14.3 |
- |
3.7 |
14.3 |
- |
0.0 |
0.0
|
|
Intergen51. ppmp. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: ppmp données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ppm fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ppm fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ppmp
R2 x3 x2 x c Inflexion poly3 x c
0.257 2.11E-06 -1.88E-03 4.14E-01 2.61 fx1 abscisse 322.2 196.4
0.794 2.49E-08 1.91E-04 -1.99E-01 51.6 fc1 ordonnée 12.0 21.1
0.247 1.50E-06 -1.45E-03 3.25E-01 7.65 fx41
0.726 1.31E-06 -7.72E-04 2.02E-02 37.0 fc41
- Le rfin après 400 est de 54 sur un total de 438. Jusqu'à 1% les freq10 sont en continu jusqu'à 1020, reste 4. L'indice i.rfin1 = 50/620 = 0.081.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données ppmp calculs poly3 ppmp
effect 438 R2.21 331 abscis 400
xm 45 pte 4,88 flexa 133
ym 0,876 cste 2,22 flexo 2,83
x1m 250 r400l 150 xm 45
y1m 1 restp 230,59 sup4 111,5
rfin 123,29 %sd 60,31 sup4t 292,2
bornf 108 lond 205 % 38,2
supd 334,6 %sf 58,72 long 88
supdt 554,8 lonf 63 R2 241
xmp 214,61 sf/lf 2,17
r400 107,31 sr/lr 1,39
supf 136,7 sd/ld 1,63
supft 232,9 i.r400 0,72
Intergen51. ppmp. Les CDS-CDS négatifs
modifier
Sous-totaux ppmp totale
fréquence x- c- x- c-
- 1 0 4 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 0 11 717 10938
- 5 0 0 5 19
sp6 0 17 1642 8424
total 0 32 2,456 23,544
reste 0 2 264 420
s6 0 1 361 41
s7 0 2 321 1438
s8 0 12 696 6525
rappot s1-5
4/2/1 - 2.8 8.4 2.6
% / sp6
s6/sp6 - 5.9 22.0 0.5
s7/sp6 - 11.8 19.5 17.1
s8/sp6 - 70.6 42.4 77.5
reste/sp6 - 11.8 16.1 5.0
total s1-5 0 15 814 15120
% / total
%s1-5 - 46.9 33.1 64.2
%sp6 - 53.1 66.9 35.8
Intergen51. ppmp. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s CDS 16s
16s 23s 5s CDS
16s tRNA 16 CDS
tRNA 23s CDS 5s
5s tRNA 23s CDS
tRNA in CDS 23s
tRNA contig 36 5s 16s
tRNA hors 5 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 41 0 total 0 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 ppmp. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont1 |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
5 |
agc |
|
55 |
ggc |
|
3 |
tta
|
63 |
tgc |
|
22 |
ttc |
|
** |
aca
|
7 |
gaa |
|
7 |
cga |
|
8 |
tcg
|
6 |
ctt |
|
5 |
cca |
|
7 |
tcc
|
101 |
cca |
|
5 |
ttg |
|
6 |
ctt
|
4 |
tgg |
|
4 |
atc |
|
5 |
tcg
|
7 |
tat |
|
5 |
atgf |
|
** |
tca
|
6 |
caa |
|
109 |
gca |
|
|
|
5 |
cac |
|
3 |
cga |
|
|
|
125 |
gac |
|
13 |
cta |
|
|
|
10 |
gga |
|
8 |
atc |
|
|
|
4 |
aac |
|
4 |
aac |
|
|
|
9 |
tac |
|
** |
tgg |
|
|
|
82 |
ata |
|
8 |
gac |
|
|
|
5 |
atgi |
|
86 |
tac |
|
|
|
4 |
aac |
|
14 |
aaa |
|
|
|
131 |
tgg |
|
4 |
gga |
|
|
|
5 |
gaa |
|
7 |
ttc |
|
|
|
|
|
|
** |
acg |
|
|
|
- |
|
|
|
|
|
|
|
Paenibacillus mucilaginosus 3016
modifier
- Liens: gtRNAdb [18], NCBI [19], génome [20]
- Lien tableur: pmq opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B5 Paenibacillus mucilaginosus 3016
58.3%GC |
24.7.19 Paris |
110 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
9206..10276 |
CDS |
|
322 |
322 |
|
|
357 |
|
|
10599..12139 |
16s |
|
269 |
|
|
|
|
|
|
12409..15343 |
23s |
|
95 |
|
|
|
|
|
|
15439..15555 |
5s |
|
178 |
178 |
|
|
|
178
|
|
15734..17190 |
CDS |
|
3061 |
|
|
|
486 |
|
|
|
|
|
|
|
|
|
|
|
|
20252..21532 |
CDS |
|
47 |
47 |
|
|
427 |
47
|
|
21580..21666 |
tca |
|
140 |
140 |
|
|
|
|
|
21807..22157 |
CDS hp |
@1 |
17 |
|
|
|
117 |
|
|
22175..22357 |
CDS hp |
|
23 |
|
|
|
*61 |
|
|
22381..22524 |
CDS hp |
|
86 |
|
|
|
*48 |
|
comp |
22611..22796 |
CDS hp |
|
138 |
|
|
|
*62 |
|
comp |
22935..25265 |
replicase |
|
156 |
|
|
|
*777 |
|
|
|
|
|
|
|
|
|
|
|
|
25422..26165 |
CDS |
|
220 |
220 |
|
|
248 |
|
comp |
26386..26460 |
cgg |
|
183 |
183 |
|
|
|
183
|
|
26644..27168 |
CDS |
|
151287 |
|
|
|
175 |
|
|
|
|
|
|
|
|
|
|
|
|
178456..179454 |
CDS |
|
298 |
298 |
|
|
333 |
|
|
179753..181299 |
16s |
|
254 |
|
|
|
|
|
|
181554..184488 |
23s |
|
168 |
|
|
|
|
|
|
184657..184773 |
5s |
|
15 |
|
|
|
|
|
|
184789..184876 |
agc |
|
29 |
|
|
29 |
|
|
|
184906..184982 |
atgj |
|
39 |
|
|
39 |
|
|
|
185022..185097 |
gta |
|
15 |
|
|
15 |
|
|
|
185113..185189 |
atgf |
|
14 |
|
|
14 |
|
|
|
185204..185280 |
gac |
|
48 |
|
|
48 |
|
|
|
185329..185404 |
ttc |
|
5 |
|
|
5 |
|
|
|
185410..185485 |
aca |
|
9 |
|
|
9 |
|
|
|
185495..185579 |
tac |
|
15 |
|
|
15 |
|
|
|
185595..185670 |
aaa |
|
183 |
183 |
|
|
|
183
|
comp |
185854..187104 |
CDS |
|
30460 |
|
|
|
417 |
|
|
|
|
|
|
|
|
|
|
|
comp |
217565..218146 |
CDS |
|
129 |
129 |
|
|
194 |
129
|
comp |
218276..218350 |
cgg |
|
261 |
261 |
|
|
|
|
|
218612..219643 |
CDS |
|
34238 |
|
|
|
344 |
|
|
|
|
|
|
|
|
|
|
|
|
253882..254526 |
CDS |
|
677 |
*677 |
|
|
215 |
|
|
255204..256745 |
16s |
|
268 |
|
|
|
|
|
|
257014..259948 |
23s |
|
95 |
|
|
|
|
|
|
260044..260160 |
5s |
|
55 |
|
|
|
|
|
|
260216..260292 |
atc |
|
19 |
|
|
19 |
|
|
|
260312..260387 |
gca |
+ |
16 |
|
|
16 |
|
|
|
260404..260475 |
gaa |
2 gca |
9 |
|
|
9 |
|
|
|
260485..260569 |
tac |
|
20 |
|
|
20 |
|
|
|
260590..260665 |
aac |
|
3 |
|
|
3 |
|
|
|
260669..260744 |
gta |
|
19 |
|
|
19 |
|
|
|
260764..260840 |
gac |
|
20 |
|
|
20 |
|
|
|
260861..260933 |
ttc |
|
15 |
|
|
15 |
|
|
|
260949..261021 |
aaa |
|
10 |
|
|
10 |
|
|
|
261032..261118 |
ctg |
|
3 |
|
|
3 |
|
|
|
261122..261196 |
ggc |
|
12 |
|
|
12 |
|
|
|
261209..261280 |
tgc |
|
15 |
|
|
15 |
|
|
|
261296..261369 |
cgt |
|
5 |
|
|
5 |
|
|
|
261375..261448 |
cca |
|
158 |
|
|
*158 |
|
|
|
261607..261682 |
gca |
|
4 |
|
|
4 |
|
|
|
261687..261759 |
acc |
|
5 |
|
|
5 |
|
|
|
261765..261854 |
tcg |
|
19 |
|
|
19 |
|
|
|
261874..261961 |
agc |
|
17 |
|
|
17 |
|
|
|
261979..262054 |
gtc |
|
5 |
|
|
5 |
|
|
|
262060..262134 |
acg |
|
39 |
|
|
39 |
|
|
|
262174..262262 |
tcc |
|
41 |
|
|
41 |
|
|
|
262304..262386 |
ctc |
|
283 |
283 |
|
|
|
*283
|
|
262670..263515 |
CDS |
|
314679 |
|
|
|
282 |
|
|
|
|
|
|
|
|
|
|
|
|
578195..579055 |
CDS |
|
324 |
324 |
|
|
287 |
|
|
579380..580921 |
16s |
|
258 |
|
|
|
|
|
|
581180..584114 |
23s |
|
166 |
|
|
|
|
|
|
584281..584397 |
5s |
|
31 |
|
|
|
|
|
|
584429..584505 |
aac |
|
6 |
|
|
6 |
|
|
|
584512..584600 |
tcc |
|
38 |
|
|
38 |
|
|
|
584639..584710 |
gaa |
|
11 |
|
|
11 |
|
|
|
584722..584797 |
gta |
|
17 |
|
|
17 |
|
|
|
584815..584891 |
atgf |
|
15 |
|
|
15 |
|
|
|
584907..584983 |
gac |
|
67 |
|
|
67 |
|
|
|
585051..585125 |
acg |
|
11 |
|
|
11 |
|
|
|
585137..585212 |
cac |
|
10 |
|
|
10 |
|
|
|
585223..585297 |
caa |
|
5 |
|
|
5 |
|
|
|
585303..585378 |
aaa |
|
17 |
|
|
17 |
|
|
|
585396..585470 |
ggc |
+ |
40 |
|
|
40 |
|
|
|
585511..585585 |
ggc |
2 ggc |
24 |
|
|
24 |
|
|
|
585610..585692 |
ttg |
|
5 |
|
|
5 |
|
|
|
585698..585774 |
cca |
|
19 |
|
|
19 |
|
|
|
585794..585867 |
gga |
|
1 |
|
|
1 |
|
|
|
585869..585942 |
aga |
|
187 |
187 |
|
|
|
187
|
|
586130..586885 |
CDS |
|
85587 |
|
|
|
252 |
|
|
|
|
|
|
|
|
|
|
|
|
672473..672949 |
CDS |
|
18 |
18 |
|
|
159 |
18
|
|
672968..673043 |
aac |
|
7 |
|
7 |
|
|
|
|
673051..673138 |
agc |
@2 |
297 |
|
297 |
|
|
|
|
673436..673507 |
gaa |
|
9 |
|
9 |
|
|
|
|
673517..673599 |
ctc |
|
180 |
180 |
|
|
|
|
|
673780..674199 |
CDS |
|
182 |
|
|
|
140 |
|
|
|
|
|
|
|
|
|
|
|
|
674382..675278 |
CDS |
|
159 |
159 |
|
|
299 |
|
|
675438..675520 |
ctc |
|
64 |
64 |
|
|
|
64
|
|
675585..675833 |
CDS |
|
18450 |
|
|
|
83 |
|
|
|
|
|
|
|
|
|
|
|
|
694284..695636 |
CDS |
|
797 |
*797 |
|
|
451 |
|
|
696434..697974 |
16s |
|
261 |
|
|
|
|
|
|
698236..701170 |
23s |
|
94 |
|
|
|
|
|
|
701265..701381 |
5s |
|
43 |
|
|
|
|
|
|
701425..701498 |
atc |
|
11 |
|
|
11 |
|
|
|
701510..701584 |
gaa |
|
5 |
|
|
5 |
|
|
|
701590..701665 |
gtc |
|
5 |
|
|
5 |
|
|
|
701671..701747 |
atgf |
|
4 |
|
|
4 |
|
|
|
701752..701825 |
tgg |
|
9 |
|
|
9 |
|
|
|
701835..701909 |
caa |
|
8 |
|
|
8 |
|
|
|
701918..701990 |
aaa |
|
18 |
|
|
18 |
|
|
|
702009..702095 |
ctg |
|
4 |
|
|
4 |
|
|
|
702100..702174 |
ggc |
|
11 |
|
|
11 |
|
|
|
702186..702259 |
cgt |
|
12 |
|
|
12 |
|
|
|
702272..702348 |
cca |
|
577 |
*577 |
|
|
|
*577
|
|
702926..703120 |
CDS |
|
370320 |
|
|
|
65 |
|
|
|
|
|
|
|
|
|
|
|
|
1073441..1074214 |
CDS |
|
373 |
373 |
|
|
258 |
|
|
1074588..1076136 |
16s |
|
260 |
|
|
|
|
|
|
1076397..1079331 |
23s |
|
168 |
|
|
|
|
|
|
1079500..1079616 |
5s |
|
9 |
|
|
|
|
|
|
1079626..1079701 |
aac |
|
6 |
|
|
6 |
|
|
|
1079708..1079796 |
tcc |
|
38 |
|
|
38 |
|
|
|
1079835..1079906 |
gaa |
|
11 |
|
|
11 |
|
|
|
1079918..1079993 |
gta |
|
17 |
|
|
17 |
|
|
|
1080011..1080087 |
atgf |
|
13 |
|
|
13 |
|
|
|
1080101..1080177 |
gac |
|
49 |
|
|
49 |
|
|
|
1080227..1080302 |
ttc |
|
4 |
|
|
4 |
|
|
|
1080307..1080382 |
aca |
|
13 |
|
|
13 |
|
|
|
1080396..1080481 |
tac |
|
8 |
|
|
8 |
|
|
|
1080490..1080560 |
tgg |
|
13 |
|
|
13 |
|
|
|
1080574..1080649 |
cac |
|
26 |
|
|
26 |
|
|
|
1080676..1080747 |
caa |
|
9 |
|
|
9 |
|
|
|
1080757..1080831 |
ggc |
|
12 |
|
|
12 |
|
|
|
1080844..1080917 |
tgc |
|
10 |
|
|
10 |
|
|
|
1080928..1081016 |
tta |
|
20 |
|
|
20 |
|
|
|
1081037..1081113 |
cgt |
|
3 |
|
|
3 |
|
|
|
1081117..1081199 |
ttg |
|
147 |
147 |
|
|
|
147
|
|
1081347..1081973 |
CDS |
|
128630 |
|
|
|
209 |
|
|
|
|
|
|
|
|
|
|
|
|
1210604..1213519 |
CDS |
|
354 |
354 |
|
|
972 |
|
|
1213874..1213949 |
gca |
|
16 |
|
16 |
|
|
|
|
1213966..1214037 |
gaa |
|
12 |
|
12 |
|
|
|
|
1214050..1214125 |
gta |
|
16 |
|
16 |
|
|
|
|
1214142..1214218 |
gac |
|
17 |
|
17 |
|
|
|
|
1214236..1214311 |
cac |
|
9 |
|
9 |
|
|
|
|
1214321..1214395 |
caa |
|
9 |
|
9 |
|
|
|
|
1214405..1214477 |
aaa |
|
8 |
|
8 |
|
|
|
|
1214486..1214572 |
ctg |
|
3 |
|
3 |
|
|
|
|
1214576..1214647 |
ggc |
|
169 |
169 |
|
|
|
169
|
comp |
1214817..1215602 |
CDS |
|
378784 |
|
|
|
262 |
|
|
|
|
|
|
|
|
|
|
|
|
1594387..1594665 |
CDS |
|
537 |
*537 |
|
|
93 |
|
|
1595203..1596743 |
16s |
|
252 |
|
|
|
|
|
|
1596996..1599930 |
23s |
|
94 |
|
|
|
|
|
|
1600025..1600141 |
5s |
|
43 |
|
|
|
|
|
|
1600185..1600261 |
atc |
|
19 |
|
|
19 |
|
|
|
1600281..1600356 |
gca |
|
17 |
|
|
17 |
|
|
|
1600374..1600445 |
gaa |
|
8 |
|
|
8 |
|
|
|
1600454..1600529 |
gta |
+ |
5 |
|
|
5 |
|
|
|
1600535..1600610 |
aca |
2 gta |
10 |
|
|
10 |
|
|
|
1600621..1600705 |
tac |
|
18 |
|
|
18 |
|
|
|
1600724..1600799 |
aac |
|
4 |
|
|
4 |
|
|
|
1600804..1600879 |
gta |
|
21 |
|
|
21 |
|
|
|
1600901..1600977 |
atgf |
|
12 |
|
|
12 |
|
|
|
1600990..1601066 |
gac |
|
34 |
|
|
34 |
|
|
|
1601101..1601176 |
cac |
|
13 |
|
|
13 |
|
|
|
1601190..1601264 |
caa |
|
8 |
|
|
8 |
|
|
|
1601273..1601345 |
aaa |
|
17 |
|
|
17 |
|
|
|
1601363..1601448 |
ctc |
|
13 |
|
|
13 |
|
|
|
1601462..1601548 |
ctg |
|
5 |
|
|
5 |
|
|
|
1601554..1601628 |
ggc |
|
14 |
|
|
14 |
|
|
|
1601643..1601713 |
tgc |
|
10 |
|
|
10 |
|
|
|
1601724..1601797 |
cgt |
|
5 |
|
|
5 |
|
|
|
1601803..1601876 |
cca |
|
105 |
105 |
|
|
|
105
|
|
1601982..1602245 |
CDS |
|
232535 |
|
|
|
88 |
|
|
|
|
|
|
|
|
|
|
|
|
1834781..1835260 |
CDS |
|
106 |
106 |
|
|
160 |
106
|
|
1835367..1835439 |
gcc |
|
137 |
137 |
|
|
|
|
comp |
1835577..1835978 |
CDS |
|
371114 |
|
|
|
134 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2207093..2208091 |
CDS |
|
192 |
192 |
|
|
333 |
192
|
|
2208284..2208367 |
ctg |
+ |
49 |
|
49 |
|
|
|
|
2208417..2208500 |
ctg |
2 ctg |
315 |
315 |
|
|
|
|
|
2208816..2209952 |
CDS |
|
1246561 |
|
|
|
379 |
|
|
|
|
|
|
|
|
|
|
|
|
3456514..3456786 |
CDS |
|
256 |
256 |
|
|
91 |
|
|
3457043..3457119 |
ccc |
|
142 |
142 |
|
|
|
142
|
|
3457262..3457483 |
CDS |
|
1547757 |
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
comp |
5005241..5005426 |
CDS |
|
127 |
127 |
|
|
62 |
127
|
comp |
5005554..5005636 |
ctc |
|
40 |
|
40 |
|
|
|
comp |
5005677..5005765 |
tcc |
|
13 |
|
13 |
|
|
|
comp |
5005779..5005852 |
atg |
|
19 |
|
19 |
|
|
|
comp |
5005872..5005958 |
tcg |
|
167 |
167 |
|
|
|
|
|
5006126..5006220 |
ncRNA |
|
1377035 |
|
|
|
32 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6383256..6384173 |
CDS |
|
228 |
228 |
|
|
306 |
|
|
6384402..6384477 |
gtc |
|
69 |
69 |
|
|
|
69
|
comp |
6384547..6385458 |
CDS |
|
5453 |
|
|
|
304 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6390912..6391130 |
CDS |
|
142 |
142 |
|
|
73 |
142
|
comp |
6391273..6391358 |
tta |
|
7 |
|
7 |
|
|
|
comp |
6391366..6391442 |
atgi |
|
19 |
|
19 |
|
|
|
comp |
6391462..6391538 |
atgf |
|
370 |
370 |
|
|
|
|
comp |
6391909..6392460 |
CDS |
|
962046 |
|
|
|
184 |
|
|
|
|
|
|
|
|
|
|
|
|
7354507..7354737 |
CDS |
|
342 |
342 |
|
|
77 |
*342
|
comp |
7355080..7355162 |
ctc |
|
28 |
|
|
28 |
|
|
comp |
7355191..7355279 |
tcc |
|
12 |
|
|
12 |
|
|
comp |
7355292..7355368 |
atgf |
|
14 |
|
|
14 |
|
|
comp |
7355383..7355459 |
atgj |
|
14 |
|
|
14 |
|
|
comp |
7355474..7355561 |
agc |
|
8 |
|
|
8 |
|
|
comp |
7355570..7355659 |
tcg |
|
4 |
|
|
4 |
|
|
comp |
7355664..7355736 |
acc |
|
4 |
|
|
4 |
|
|
comp |
7355741..7355816 |
gca |
|
119 |
|
|
|
|
|
|
7355936..7356030 |
ncRNA |
@3 |
36 |
|
|
|
|
|
comp |
7356067..7356140 |
cca |
|
6 |
|
|
6 |
|
|
comp |
7356147..7356220 |
cgt |
|
104 |
|
|
*104 |
|
|
comp |
7356325..7356396 |
ggc |
|
7 |
|
|
7 |
|
|
comp |
7356404..7356490 |
ctg |
|
9 |
|
|
9 |
|
|
comp |
7356500..7356572 |
aaa |
|
9 |
|
|
9 |
|
|
comp |
7356582..7356656 |
caa |
|
9 |
|
|
9 |
|
|
comp |
7356666..7356741 |
cac |
|
17 |
|
|
17 |
|
|
comp |
7356759..7356835 |
gac |
|
12 |
|
|
12 |
|
|
comp |
7356848..7356923 |
gta |
|
4 |
|
|
4 |
|
|
comp |
7356928..7357003 |
aac |
|
15 |
|
|
15 |
|
|
comp |
7357019..7357103 |
tac |
|
8 |
|
|
8 |
|
|
comp |
7357112..7357187 |
aca |
|
5 |
|
|
5 |
|
|
comp |
7357193..7357264 |
gaa |
|
15 |
|
|
15 |
|
|
comp |
7357280..7357355 |
gcc |
|
9 |
|
|
9 |
|
|
comp |
7357365..7357438 |
atc |
|
54 |
|
|
|
|
|
comp |
7357493..7357609 |
5s |
|
112 |
|
|
|
|
|
comp |
7357722..7360655 |
23s |
|
258 |
|
|
|
|
|
comp |
7360914..7362454 |
16s |
|
403 |
*403 |
|
|
|
|
|
7362858..7363397 |
CDS |
|
254752 |
|
|
|
180 |
|
|
|
|
|
|
|
|
|
|
|
|
7618150..7618842 |
CDS |
|
280 |
280 |
|
|
231 |
*280
|
comp |
7619123..7619193 |
ggg |
|
335 |
335 |
|
|
|
|
|
7619529..7620461 |
CDS |
|
46171 |
|
|
|
311 |
|
|
|
|
|
|
|
|
|
|
|
comp |
7666633..7668069 |
CDS |
|
104 |
104 |
|
|
479 |
104
|
comp |
7668174..7668244 |
ggg |
|
5 |
|
|
5 |
|
|
comp |
7668250..7668326 |
cca |
|
106 |
|
|
*106 |
|
|
comp |
7668433..7668506 |
cgt |
|
11 |
|
|
11 |
|
|
comp |
7668518..7668592 |
ggc |
|
5 |
|
|
5 |
|
|
comp |
7668598..7668684 |
ctg |
|
13 |
|
|
13 |
|
|
comp |
7668698..7668783 |
ctc |
|
16 |
|
|
16 |
|
|
comp |
7668800..7668872 |
aaa |
|
10 |
|
|
10 |
|
|
comp |
7668883..7668967 |
tac |
|
28 |
|
|
28 |
|
|
comp |
7668996..7669071 |
ttc |
|
12 |
|
|
|
|
|
comp |
7669084..7669200 |
5s |
|
159 |
|
|
|
|
|
comp |
7669360..7672297 |
23s |
|
256 |
|
|
|
|
|
comp |
7672554..7674095 |
16s |
|
537 |
*537 |
|
|
|
|
|
7674633..7675382 |
CDS |
|
177794 |
|
|
|
250 |
|
|
|
|
|
|
|
|
|
|
|
comp |
7853177..7853761 |
CDS |
|
57 |
57 |
|
|
195 |
57
|
comp |
7853819..7853892 |
cac |
|
230 |
|
230 |
|
|
|
comp |
7854123..7854196 |
cac |
|
404 |
*404 |
|
|
|
|
comp |
7854601..7854801 |
CDS |
|
245639 |
|
|
|
67 |
|
|
|
|
|
|
|
|
|
|
|
comp |
8100441..8100854 |
CDS |
|
123 |
123 |
|
|
138 |
123
|
comp |
8100978..8101094 |
5s |
|
167 |
|
|
|
|
|
comp |
8101262..8104180 |
23s |
|
248 |
|
|
|
|
|
comp |
8104429..8105969 |
16s |
|
325 |
325 |
|
|
|
|
comp |
8106295..8106636 |
CDS |
|
45281 |
|
|
|
114 |
|
|
|
|
|
|
|
|
|
|
|
comp |
8151918..8152448 |
CDS |
|
460 |
*460 |
|
|
177 |
*460
|
comp |
8152909..8153031 |
5s |
|
94 |
|
|
|
|
|
comp |
8153126..8156060 |
23s |
|
258 |
|
|
|
|
|
comp |
8156319..8157859 |
16s |
|
456 |
*456 |
|
|
|
|
|
8158316..8158642 |
CDS |
|
98285 |
|
|
|
109 |
|
|
|
|
|
|
|
|
|
|
|
|
8256928..8257746 |
CDS |
|
83 |
83 |
|
|
273 |
83
|
comp |
8257830..8257903 |
gga |
|
5 |
|
|
5 |
|
|
comp |
8257909..8257985 |
cca |
|
16 |
|
|
16 |
|
|
comp |
8258002..8258078 |
cgt |
|
4 |
|
|
4 |
|
|
comp |
8258083..8258157 |
ggc |
|
8 |
|
|
8 |
|
|
comp |
8258166..8258248 |
cta |
|
42 |
|
|
42 |
|
|
comp |
8258291..8258366 |
aaa |
|
8 |
|
|
8 |
|
|
comp |
8258375..8258449 |
caa |
|
9 |
|
|
9 |
|
|
comp |
8258459..8258532 |
tgg |
|
4 |
|
|
4 |
|
|
comp |
8258537..8258613 |
atgf |
|
5 |
|
|
5 |
|
|
comp |
8258619..8258694 |
gtc |
|
5 |
|
|
5 |
|
|
comp |
8258700..8258774 |
gaa |
|
11 |
|
|
11 |
|
|
comp |
8258786..8258859 |
atc |
|
43 |
|
|
|
|
|
comp |
8258903..8259019 |
5s |
|
94 |
|
|
|
|
|
comp |
8259114..8262048 |
23s |
|
255 |
|
|
|
|
|
comp |
8262304..8263845 |
16s |
|
306 |
306 |
|
|
|
|
comp |
8264152..8264370 |
CDS |
|
58373 |
|
|
|
73 |
|
|
|
|
|
|
|
|
|
|
|
comp |
8322744..8323205 |
CDS |
|
393 |
393 |
|
|
154 |
*393
|
comp |
8323599..8323715 |
5s |
|
94 |
|
|
|
|
|
comp |
8323810..8326748 |
23s |
|
258 |
|
|
|
|
|
comp |
8327007..8328547 |
16s |
|
369 |
369 |
|
|
|
|
comp |
8328917..8330413 |
CDS |
|
21505 |
|
|
|
499 |
|
|
|
|
|
|
|
|
|
|
|
comp |
8351919..8354414 |
CDS |
|
396 |
396 |
|
|
832 |
|
comp |
8354811..8354884 |
atg |
|
149 |
149 |
|
|
|
149
|
comp |
8355034..8355537 |
CDS |
|
34450 |
|
|
|
168 |
|
|
|
|
|
|
|
|
|
|
|
|
8389988..8390512 |
CDS |
|
296 |
296 |
|
|
175 |
*296
|
comp |
8390809..8390925 |
5s |
|
94 |
|
|
|
|
|
comp |
8391020..8393954 |
23s |
|
259 |
|
|
|
|
|
comp |
8394214..8395754 |
16s |
|
234 |
234 |
|
|
|
|
comp |
8395989..8396255 |
CDS |
|
220222 |
|
|
|
89 |
|
|
|
|
|
|
|
|
|
|
|
comp |
8616478..8616924 |
CDS |
|
417 |
*417 |
|
|
149 |
|
|
8617342..8617418 |
gac |
|
157 |
157 |
|
|
|
157
|
|
8617576..8618541 |
CDS |
|
105821 |
|
|
|
322 |
|
|
|
|
|
|
|
|
|
|
|
|
8724363..8724614 |
CDS |
|
455 |
*455 |
|
|
84 |
|
comp |
8725070..8725160 |
tcg |
|
165 |
165 |
|
|
|
165
|
comp |
8725326..8725559 |
CDS |
|
9205 |
|
|
|
78 |
|
|
|
opéron |
doubles |
intercalaires |
cds |
aa |
avec aa |
cdsa |
cdsd
|
cumuls. Paenibacillus mucilaginosus 3016
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cds dirigé |
gammes |
cdsa |
cdsd
|
avec rRNA |
opérons |
14 |
1 |
0 |
1 |
1 |
0 |
1 |
0 |
100 |
15 |
8
|
|
16 23 5s 0 |
5 |
20 |
14 |
107 |
50 |
3 |
20 |
1 |
200 |
18 |
10
|
|
16 atc gca |
0 |
40 |
1 |
12 |
100 |
4 |
40 |
0 |
300 |
12 |
6
|
|
16 23 5s a |
9 |
60 |
1 |
4 |
150 |
11 |
60 |
2 |
400 |
9 |
3
|
|
max a |
23 |
80 |
0 |
1 |
200 |
11 |
80 |
2 |
500 |
6 |
4
|
|
a doubles |
3 |
100 |
0 |
0 |
250 |
3 |
100 |
1 |
600 |
0 |
0
|
|
spéciaux |
0 |
120 |
0 |
2 |
300 |
6 |
120 |
3 |
700 |
0 |
0
|
|
total aas |
138 |
140 |
0 |
0 |
350 |
7 |
140 |
3 |
800 |
0 |
0
|
sans |
opérons |
17 |
160 |
0 |
1 |
400 |
6 |
160 |
5 |
900 |
1 |
0
|
|
1 aa |
11 |
180 |
0 |
0 |
450 |
3 |
180 |
3 |
1000 |
1 |
0
|
|
max a |
9 |
200 |
0 |
0 |
500 |
3 |
200 |
4 |
1100 |
0 |
0
|
|
a doubles |
1 |
|
2 |
0 |
|
5 |
|
7 |
|
0 |
0
|
|
total aas |
35 |
|
18 |
128 |
|
62 |
|
31 |
|
62 |
31
|
total aas |
|
173 |
|
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
16 |
|
|
|
|
|
235 |
213
|
|
|
|
variance |
|
20 |
|
|
|
|
|
184 |
122
|
sans jaune |
|
|
moyenne |
16 |
14 |
|
207 |
|
126 |
|
|
|
|
|
|
variance |
12 |
11 |
|
106 |
|
49 |
|
|
|
B5 Paenibacillus mucilaginosus 3016, RNAs blocs
CDS |
298 |
324 |
373 |
12 |
|
16s |
254 |
258 |
260 |
159 |
|
23s |
168 |
166 |
168 |
256 |
|
5s |
15 |
31 |
9 |
537 |
|
1er aa |
agc |
aac |
aac |
ttc |
|
aas |
9 |
16 |
17 |
9 |
|
CDS |
183 |
187 |
147 |
104 |
|
|
|
|
|
|
|
CDS |
677 |
797 |
537 |
54 |
43
|
16s |
268 |
261 |
252 |
112 |
94
|
23s |
95 |
94 |
94 |
258 |
255
|
5s |
55 |
43 |
43 |
403 |
306
|
atc / aas |
22 |
11 |
19 |
23 |
12
|
CDS |
283 |
577 |
105 |
342 |
83
|
|
|
|
|
|
|
CDS |
322 |
123 |
460 |
393 |
296
|
16s |
269 |
167 |
94 |
94 |
94
|
23s |
95 |
248 |
258 |
258 |
259
|
5s |
178 |
325 |
456 |
369 |
234
|
*Remarques :
Que des blocs 16-23-5s, 14. Très peu d’opérons sans rRNA, 35 aas pour 17 opérons. Très peu de doubles, 4 doublets.
#@1 Suite aux gènes de protéines cotranscrits avec les gènes de tRNA, voir eco, j’ai entouré les opérons tRNA, dans les 7 génomes suivants,
Par 2 CDS, un avant et un après. Dans cette remarque j’ai voulu montré les intercalalires et les tailles des CDS qui suivent l’opéron.
Ce sont pour la plupart de petites protéines hypothétiques, largement plus petites que FT-U mais plus grandes que tpr (voir eco).
#@2 L’intercalaire maximum qui laisserait penser qu’on a affaire à 2 opérons différents. Une recherche simple des promoteurs me paraît
difficile dans les bases de données , sauf dans BioCyc qui est payant, aussi je me base sur le regroupement des gènes pour
décider que je suis en présence d’un opéron ou non. Mais arrivé à ce stade de ma réflexion, comme je l’expiciterai plus tard, je ne
m’interesse plus à l’existence de l’opéron mais seulement au regroupement CDS-séquence à t-rRNAs-CDS qu’il soit sur 1 ou 2 brins.
Ce sont seulement les statistiques des intercalaires et, surtout, le sens 16s-23s qui paraît prévilégier les intercalaires courts,
qui m’ontpoussé à changer cette limite vers 400 pb au lieu de 210, limite basée sur l’intercalaire max de 264 entre les 2 derniers
tRNAs du 21aas de bsu qui est bien un opéron dans BioCyc.
#@3 Voici une séquence qui n’est pas un CDS et pas sur le même brin que le reste du groupe, mais qui répond aux niveaux critères
de la remarque @2 précédente. L’intercalaire entre les 2 tRNAs du même brin qui enjambent cette séquence est de 250 pb.
#Séquence des doubles : Très peu de doubles. 3 doublets se trouvent avec les rRNAs dont 1 est successif, un 4ème doublet successif se trouve dans
un opéron sans rRNAs. Les doublets dans ce génome sont rares mais se répartissent proportionnellement sur les 2 types d’opérons.
#Les intercalaires dans les blocs : rappel des opérons à bloc chez eco voir sigma FIS 362 162 Terminateur
#: - CDS-16s 234, 298-537, 677 797 voir ici sigma FIS 442 322 rien
#: - 16s-23s 258 néant sigma FIS 473 228 Terminateur
#: - 23s-5s 168*4, 112, 94*9 93*7 sigma FIS 480 95 Terminateur
#: - 5s-tRNA 9-15*3 31-54*6 8-12*2, 52 Sigma Lrp-leu 377 228 rien
#: - L’orientation CDS-16s, CDS de fin de bloc. 83-105*3 Sigma Lrp-leu 373 300 Terminateur
123-187*5 sigma FIS 614 74 Terminateur
283-577*6
#Les intercalaires entre tRNAs
#: - Dans les opérons sans rRNAs inf à 20 14/18 16±12
#: - Dans les opérons à rRNAs inf à 20 107/128 16±20
#Les intercalaires avec les CDS des bordures
#: - tous les CDS
#: - Les CDS orientés
#Taille des CDS de bordure en aas
#: - tous les CDS
#: - Les CDS orientés
Notes : l’opéron de BioCyc et la direction 16s-23s dans les statistiques des intercalaires des CDS. Promoteur et terminateur.
Les cds
Bacteria; Firmicutes; Bacilli; Bacillales; Paenibacillaceae;Paenibacillus.
bloc protein interc aas
268 262304..262386 ctc 283 -
95 262670..263515 PRD domain 267 282
55 263783..265834 GlcT 179 684
atc 266014..266286 Hpr -8 91
22 266279..268003 PeP 575
258 585869..585942 aga 187 -
166 586130..586885 biotine Stase 40 252
31 586926..587918 BioB 8 331
aac 587927..589093 nanoate 176 389
16 589270..589914 hydrolase 215
20252..21532 Ser ligase 47 427
21580..21666 tca 140
21807..22157 CDS hp 17 117
22175..22357 CDS hp 23 61
22381..22524 CDS hp 86 48
22611..22796 CDS hp 138 62
22935..25265 Replicase 156 777
25422..26165 Peptidase 220 248
comp 26386..26460 cgg 183
26644..27168 sigma factor 151287 175
Les blocs à rRNAs
CDS 298 324 373 12
16s 254 258 260 159
23s 168 166 168 256
5s 15 31 9 537
1er aa agc aac aac ttc
aas 9 16 17 9
CDS 183 187 147 104
CDS 677 797 537 54 43
16s 268 261 252 112 94
23s 95 94 94 258 255
5s 55 43 43 403 306
atc/aas 22 11 19 23 12
CDS 283 577 105 342 83
CDS 322 123 460 393 296
16s 269 167 94 94 94
23s 95 248 258 258 259
5s 178 325 456 369 234
Bc5 pmq, Paenibacillus mucilaginosus 3016. bacilli.
bc51 pmq, distribution des blocs sans rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
1 |
agc |
1
|
g ctc |
3 |
f ccc |
1 |
cac |
3 |
cgt |
|
h gtc |
1 |
n gcc |
1 |
gac |
2 |
ggc |
1
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
|
k cta |
|
g cca |
|
caa |
1 |
cga |
|
l gta |
1 |
o gca |
1 |
gaa |
2 |
gga |
|
m ttg |
|
d tcg |
2 |
tag |
|
tgg |
|
n atgj |
2 |
l acg |
|
aag |
|
agg |
|
o ctg |
3 |
h ccg |
|
cag |
|
cgg |
2
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
pmq |
24 |
11 |
|
|
|
|
35
|
|
bc52 pmq. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
4 |
tac |
6 |
tgc |
3
|
f atc |
5 |
j acc |
2 |
aac |
4 |
agc |
3
|
g ctc |
4 |
f ccc |
|
cac |
4 |
cgt |
7
|
h gtc |
3 |
n gcc |
1 |
gac |
6 |
ggc |
9
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
8 |
aga |
1
|
k cta |
1 |
g cca |
7 |
caa |
4 |
cga |
|
l gta |
7 |
o gca |
4 |
gaa |
4 |
gga |
2
|
m ttg |
2 |
d tcg |
2 |
tag |
|
tgg |
3
|
n atgj |
2 |
l acg |
2 |
aag |
|
agg |
|
o ctg |
5 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
pmq |
|
|
|
138 |
|
|
138
|
|
- pmq Le prélèvement: Apmq
- Le nom et le lien NCBI: pmq, Paenibacillus mucilaginosus 3016, NCBI [21], date 07.02.21.
- pmq La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
pmq 1,228,719 8,739,048 14.1
Intergen51. pmq. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. pmq les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 pmq les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
4,514 |
753 |
26 |
5,293 |
2.7 |
183 |
15 |
198
|
x |
1,883 |
42 |
5 |
1,930 |
|
0 |
4 |
4
|
t |
6,397 |
795 |
31 |
7,223 |
|
183 |
19 |
202
|
% |
88.6 |
11.0 |
0.4 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
27 |
0 |
0 |
27 |
1.8 |
tRNA-CDS |
42 |
16
|
x |
15 |
0 |
0 |
15 |
|
RNA-RNA |
183 |
71
|
t |
42 |
0 |
0 |
42 |
|
CDS-rRNA |
19 |
7
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
12 |
5
|
- |
|
|
|
|
|
total |
256 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
7.8 |
7.4 |
2.1 |
20.0 |
3.7 |
62 |
0.5 |
0.0
|
x |
14.0 |
13.3 |
11.9 |
2.7 |
0.0 |
33 |
0.3 |
0.0
|
|
Intergen51. pmq. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: pmq données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées pmq fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmq fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmq fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 pmq
R2 x3 x2 x c Inflexion poly3 x c
0.878 2.70E-06 -2.45E-03 5.77E-01 -6.46 fx1 abscisse 27.4 387.5
0.946 -2.70E-06 2.12E-03 -5.95E-01 73.0 fc1 ordonnée -3.3 5.0
0.502 5.02E-06 -4.13E-04 9.41E-01 -28.9 fx41
0.950 -3.20E-07 3.72E-04 -2.08E-01 48.4 fc41
- Le rfin après 400 est de 354 sur un total de 4540. Jusqu'à 1% les freq10 sont en continu jusqu'à 910, reste 45. L'indice i.rfin1 = 309/510 = 0.606.
- Le reste après 910 est de 45 sur un total de 4540. Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1280, reste 9. L'indice i.rf2 = 36/370 = 0.097.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données pmq calculs poly3 pmq
effect 4540 R2.21 839 abscis 300
xm 54 pte 10,02 flexa 186
ym 15 cste 3,84 flexo 2,08
x1m 284 r400l 116 xm 45
y1m 1 restp 159,25 sup4 118,0
rfin 77,97 %sd 14,91 sup4t 397,8
bornf 155 lond 230 % 29,7
supd 78,5 %sf 12,42 long 141
supdt 526,4 lonf 101 R2 577
xmp 314,32 sf/lf 0,36
r400 81,28 sr/lr 0,32
supf 36,7 sd/ld 0,34
supft 295,8 i.r400 0,70
Intergen51. pmq. Les CDS-CDS négatifs
modifier
Sous-totaux pmq totale
fréquence x- c- x- c-
- 1 0 80 4 4140
- 2 3 0 85 11
- 3 0 1 3 12
- 4 11 384 717 10938
- 5 0 1 5 19
sp6 28 287 1642 8424
total 42 753 2,456 23,544
reste 5 16 264 420
s6 6 1 361 41
s7 4 44 321 1438
s8 13 226 696 6525
rappot s1-5
4/2/1 3.7 4.8 8.4 2.6
% / sp6
s6/sp6 21.4 0.3 22.0 0.5
s7/sp6 14.3 15.3 19.5 17.1
s8/sp6 46.4 78.7 42.4 77.5
reste/sp6 17.9 5.6 16.1 5.0
total s1-5 14 466 814 15120
% / total
%s1-5 33.3 61.9 33.1 64.2
%sp6 66.7 38.1 66.9 35.8
Intergen51. pmq. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 14 CDS 16s 11 3
16s 23s 14 5s CDS 4 1
16s tRNA 16 CDS
tRNA 23s CDS 5s
5s tRNA 9 23s CDS
tRNA in CDS 23s
tRNA contig 128 5s 16s
tRNA hors 18 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 183 0 total 15 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 pmq. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont1 |
|
|
cont2 |
|
|
cont2 |
|
|
cont3 |
|
|
cont4 |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
29 |
agc |
|
5 |
acc |
|
11 |
atc |
|
10 |
tgc |
|
28 |
ctc |
|
5 |
ggg |
|
7 |
aac
|
39 |
atgj |
|
19 |
tcg |
|
5 |
gaa |
|
20 |
tta |
|
12 |
tcc |
|
106 |
cca |
|
297 |
agc
|
15 |
gta |
|
17 |
agc |
|
5 |
gtc |
|
3 |
cgt |
|
14 |
atgf |
|
11 |
cgt |
|
9 |
gaa
|
14 |
atgf |
|
5 |
gtc |
|
4 |
atgf |
|
** |
ttg |
|
14 |
atgj |
|
5 |
ggc |
|
** |
ctc
|
48 |
gac |
|
39 |
acg |
|
9 |
tgg |
|
19 |
atc |
|
8 |
agc |
|
13 |
ctg |
|
16 |
gca
|
5 |
ttc |
|
41 |
tcc |
|
8 |
caa |
|
17 |
gca |
|
4 |
tcg |
|
16 |
ctc |
|
12 |
gaa
|
9 |
aca |
|
** |
ctc |
|
18 |
aaa |
|
8 |
gaa |
|
4 |
acc |
|
10 |
aaa |
|
16 |
gta
|
15 |
tac |
|
10 |
aac |
|
7 |
ctg |
|
5 |
gta |
|
x119 |
gca |
|
28 |
tac |
|
17 |
gac
|
** |
aaa |
|
38 |
tcc |
|
11 |
ggc |
|
10 |
aca |
|
x36 |
ncRNA |
|
** |
ttc |
|
9 |
cac
|
19 |
atc |
|
11 |
gaa |
|
12 |
cgt |
|
18 |
tac |
|
6 |
cca |
|
5 |
gga |
|
9 |
caa
|
16 |
gca |
|
17 |
gta |
|
** |
cca |
|
4 |
aac |
|
104 |
cgt |
|
16 |
cca |
|
8 |
aaa
|
9 |
gaa |
|
15 |
atgf |
|
6 |
aac |
|
21 |
gta |
|
7 |
ggc |
|
4 |
cgt |
|
3 |
ctg
|
20 |
tac |
|
67 |
gac |
|
38 |
tcc |
|
12 |
atgf |
|
9 |
ctg |
|
8 |
ggc |
|
** |
ggc
|
3 |
aac |
|
11 |
acg |
|
11 |
gaa |
|
34 |
gac |
|
9 |
aaa |
|
42 |
cta |
|
49 |
ctg
|
19 |
gta |
|
10 |
cac |
|
17 |
gta |
|
13 |
cac |
|
9 |
caa |
|
8 |
aaa |
|
** |
ctg
|
20 |
gac |
|
5 |
caa |
|
13 |
atgf |
|
8 |
caa |
|
17 |
cac |
|
9 |
caa |
|
40 |
ctc
|
15 |
ttc |
|
17 |
aaa |
|
49 |
gac |
|
17 |
aaa |
|
12 |
gac |
|
4 |
tgg |
|
13 |
tcc
|
10 |
aaa |
|
40 |
ggc |
|
4 |
ttc |
|
13 |
ctc |
|
4 |
gta |
|
5 |
atgf |
|
19 |
atgj
|
3 |
ctg |
|
24 |
ggc |
|
13 |
aca |
|
5 |
ctg |
|
15 |
aac |
|
5 |
gtc |
|
** |
tcg
|
12 |
ggc |
|
8 |
ttg |
|
8 |
tac |
|
14 |
ggc |
|
8 |
tac |
|
11 |
gaa |
|
7 |
tta
|
15 |
tgc |
|
19 |
cca |
|
13 |
tgg |
|
10 |
tgc |
|
5 |
aca |
|
** |
atc |
|
19 |
atgi
|
5 |
cgt |
|
1 |
gga |
|
26 |
cac |
|
5 |
cgt |
|
15 |
gaa |
|
|
|
|
** |
atgf
|
158 |
cca |
|
** |
aga |
|
9 |
caa |
|
** |
cca |
|
9 |
gcc |
|
|
|
|
230 |
cac
|
4 |
gca |
|
|
|
|
12 |
ggc |
|
|
|
|
** |
atc |
|
|
|
|
** |
cac
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- Lien NCBI [22]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
pmq. Sx+ Sc+ Les diagrammes 400
pmq |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
31 |
-283 |
664 |
-7.0 |
878 |
304 |
max190 |
-29 |
229 |
-645 |
79 |
946 |
263 |
min70
|
31 à 400 |
|
|
|
|
|
|
2 parties |
-13 |
112 |
-388 |
63 |
937 |
287 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
28 |
31 |
- |
65 |
poly |
813 |
tF |
143 |
54 |
|
806 |
poly |
140 |
SF
|
31 à 400 |
|
|
|
|
|
|
|
113 |
46 |
- |
886 |
dte |
51 |
Sf
|
- Légende du tableau des corrélations et des fréquences faibles
pmq. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
mba |
min10 |
705 |
1651 |
2356 |
154 |
-330 |
-221 |
109 |
-512 |
-477 |
-223
|
cbei |
min10 |
950 |
3395 |
4345 |
402 |
-509 |
-375 |
134 |
-649 |
-648 |
-290
|
pmq |
min10 |
1614 |
4164 |
5778 |
458 |
-832 |
-651 |
181 |
-866 |
-825 |
-61
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
45 |
214 |
0.21 |
1255 |
2688 |
1 |
8 |
18 |
114 |
51 |
428 |
-74
|
26 |
244 |
0.11 |
1212 |
4400 |
0 |
4 |
8 |
89 |
35 |
954 |
272
|
32 |
218 |
0.15 |
1927 |
5296 |
3 |
5 |
22 |
140 |
68 |
1156 |
-207
|
- Diagrammes 400: pmq cbei, diagramme 1-40: c+ pmq c+ cbei total, texte: cbei.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - pmq / cbei: Les 2 génomes se ressemblent beaucoup, totaux des effectifs très élevés et diffèrent à peine de 33%, 5778 contre 4345; corrélations sur 41-250 les plus négatives des 21 génomes,-651 contre -377 et les courbes sur x+ 1-400 sont presque identiques avec les tildes très forts, tF, 813 contre 708 et de même sur c+ 31-400 avec la forme S faible, Sf, 8 contre 51.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes se ressemblent beaucoup, de forme tilde fort, avec un R2’ de 813 pour pmq contre 708. Cependant les allures sont différentes, plus grande variabilité chez cbei avec un R2 de 712 contre 878 pour pmq et la courbe cbei est plus étirée à la fin car le reste de l’effectif non pris en compte dans le diagramme (reste) est plus élevé que chez pmq, dans un rapport de 0.28 (262/946) contre 0.16 (266/1614 ) pour pmq. De ce point de vue cbei est plus proche de mba que ne l’est pmq, avec un rapport de 0.75 (527/705).
- + Les taux des fréquences faibles 1-30 sont parmi les plus faibles des 21 génomes, 32‰ pour pmq contre 26 pour cbei , et expliquent la forte chute des corrélations sur 1-250 par rapport à 41-250.
- + Les points d’inflexion sont normaux, 304 pour pmq contre 269 pour cbei. Avec pmq, le point d’inflexion élevé et le reste faible non pris en compte dans le diagramme fait que la courbe est arrondie.
- c+ 1-400: Ce sont 2 courbes semblables de forme S fort, cbei avec un R2’ de 213 et pmq avec un R2’ de 140. Les 2 points d’inflexion sont normaux, 263 pour pmq et 245 pour cbei. Les fréquences faibles sont concentrées à la fréquence 20 qui est maximum local pour cbei. C’est un maximum pour pmq mais les taux sont répartis régulièrement de 10 à 40. Les minima locaux sont différents pour les 2 génomes, min70 pour pmq et min50 pour cbei.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30.
- c+ 31-400: Les 2 formes sont 2 S faibles, Sf, très faible pour cbei avec un R2’ de 8 (935 927) et faible pour pmq avec un R2’ de 51 (937 886). Les points d’inflexion sont aussi différents, il est normal pour pmq à la fréquence 287 et très faible pour cbei à 38. La courbe de pmq présente bien 2 parties avec un début renflé, alors que cbei se confond avec une droite d’un seul tenant sans renflement au début d’où le commentaire de “1 partie”.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont négatives et du même ordre de grandeur, -651 pour pmq et -377 pour cbei. Elles chutent fortement pour les 2 génomes sur 41-200, avec une différence (diff) de 181 pour pmq et 133 pour cbei.
- Sur les plages 1-n: les 2 génomes chutent fortement aussi, -825 pour pmq et -646 pour cbei.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici pmq et cbei se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.15 et 0.11, les zéros sont très faibles, 8‰ et 4‰. Les négatifs sont faibles par rapport aux autres génomes mais chez pmq ils sont nettement plus élevés que chez cbei, 162‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif commun de 68 pour les 2 génomes, les courbes ne peuvent pas être significatives.
- Lien tableur: pmq autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux: 1 tmRNA 3 ncRNA
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ x- c+ x+ c- c+ x+ c-
44 19 185 7 255 1 ax+
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
modifier
- Liens: gtRNAdb [23], NCBI [24]
- Lien tableur: lbu opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B6 Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
49.8%GC |
29.7.19 Paris |
110 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
comp |
18533..19237 |
CDS |
|
128 |
128 |
|
|
235 |
128
|
|
19366..19438 |
act |
@1 |
195 |
195 |
|
|
|
|
|
19634..20371 |
CDS |
|
6912 |
|
|
|
246 |
|
|
|
|
|
|
|
|
|
|
|
|
27284..29785 |
CDS |
|
276 |
276 |
|
|
*834 |
|
|
30062..30134 |
act |
|
134 |
134 |
|
|
|
134
|
|
30269..30907 |
CDS |
|
11768 |
|
|
|
213 |
|
|
|
|
|
|
|
|
|
|
|
|
42676..43248 |
cds hp |
|
451 |
*451 |
|
|
*191 |
|
|
43700..45271 |
16s |
|
209 |
|
|
|
|
|
|
45481..48391 |
23s |
|
69 |
|
|
|
|
|
|
48461..48577 |
5s |
|
275 |
275 |
|
|
|
275
|
|
48853..49091 |
cds hp |
|
56679 |
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
comp |
105771..106547 |
CDS |
|
56 |
56 |
|
|
259 |
56
|
comp |
106604..106679 |
aag |
|
125 |
125 |
|
|
|
|
|
106805..107533 |
CDS |
|
103754 |
|
|
|
243 |
|
|
|
|
|
|
|
|
|
|
|
|
211288..212553 |
CDS |
|
94 |
94 |
|
|
422 |
|
|
212648..212720 |
acc |
|
23 |
23 |
|
|
|
23
|
comp< |
212744..213262 |
CDS |
|
64997 |
|
|
|
173 |
|
|
|
|
|
|
|
|
|
|
|
|
278260..278928 |
CDS |
|
69 |
69 |
|
|
223 |
69
|
comp |
278998..279068 |
ggg |
|
181 |
181 |
|
|
|
|
|
279250..280275 |
CDS |
|
44047 |
|
|
|
342 |
|
|
|
|
|
|
|
|
|
|
|
comp |
324323..324949 |
CDS |
|
117 |
117 |
|
|
209 |
117
|
|
325067..325138 |
ggc |
+ |
4 |
|
4 |
|
|
|
|
325143..325216 |
ccg |
2 ggc |
108 |
|
|
|
|
|
|
325325..325399 |
ggc |
|
155 |
155 |
|
|
|
|
|
325555..326016 |
CDS |
|
37886 |
|
|
|
154 |
|
|
|
|
|
|
|
|
|
|
|
|
363903..364394 |
CDS |
|
98 |
98 |
|
|
164 |
98
|
|
364493..364564 |
caa |
|
614 |
*614 |
|
|
|
|
|
365179..366360 |
CDS |
|
-14 |
|
|
|
*394 |
|
|
|
|
|
|
|
|
|
|
|
|
366347..367402 |
CDS |
|
75 |
75 |
|
|
352 |
|
|
367478..367559 |
tac |
|
5 |
|
5 |
|
|
|
|
367565..367636 |
caa |
|
62 |
62 |
|
|
|
62
|
< |
367699..368318 |
CDS |
|
14127 |
|
|
|
207 |
|
|
|
|
|
|
|
|
|
|
|
|
382446..382907 |
CDS |
|
30 |
30 |
|
|
154 |
30
|
|
382938..383026 |
ctt |
|
118 |
118 |
|
|
|
|
|
383145..383768 |
CDS |
|
70441 |
|
|
|
208 |
|
|
|
|
|
|
|
|
|
|
|
|
454210..455529 |
CDS |
|
61 |
61 |
|
|
440 |
61
|
|
455591..455665 |
agg |
|
341 |
341 |
|
|
|
|
|
456007..457035 |
CDS |
|
75557 |
|
|
|
343 |
|
|
|
|
|
|
|
|
|
|
|
|
532593..533285 |
CDS |
|
82 |
82 |
|
|
231 |
82
|
comp |
533368..533442 |
cgg |
|
296 |
296 |
|
|
|
|
|
533739..534782 |
CDS |
|
48963 |
|
|
|
348 |
|
|
|
|
|
|
|
|
|
|
|
|
583746..584728 |
CDS |
|
57 |
57 |
|
|
328 |
57
|
comp |
584786..584858 |
cag |
|
5 |
|
5 |
|
|
|
comp |
584864..584935 |
gag |
|
170 |
170 |
|
|
|
|
|
585106..586110 |
CDS |
|
94988 |
|
|
|
335 |
|
|
|
|
|
|
|
|
|
|
|
|
681099..682741 |
CDS |
|
518 |
*518 |
|
|
*548 |
|
|
683260..684831 |
16s |
|
106 |
|
|
|
|
|
|
684938..685011 |
atc |
|
69 |
|
|
69 |
|
|
|
685081..685153 |
gca |
|
127 |
|
|
|
|
|
|
685281..688191 |
23s |
|
68 |
|
|
|
|
|
|
688260..688376 |
5s |
|
208 |
208 |
|
|
|
208
|
comp |
688585..689801 |
CDS |
|
55794 |
|
|
|
406 |
|
|
|
|
|
|
|
|
|
|
|
comp |
745596..745821 |
CDS |
|
134 |
134 |
|
|
75 |
134
|
comp |
745956..746044 |
tcg |
|
787 |
*787 |
|
|
|
|
|
746832..749597 |
CDS |
|
36741 |
|
|
|
*922 |
|
|
|
|
|
|
|
|
|
|
|
|
786339..787004 |
CDS |
|
54 |
54 |
|
|
222 |
54
|
|
787059..787142 |
ctg |
|
109 |
109 |
|
|
|
|
comp |
787252..787872 |
CDS |
|
2072 |
|
|
|
207 |
|
|
|
|
|
|
|
|
|
|
|
comp |
789945..791867 |
CDS |
|
613 |
*613 |
|
|
*641 |
|
|
792481..794052 |
16s |
|
105 |
|
|
|
|
|
|
794158..794231 |
atc |
|
69 |
|
|
69 |
|
|
|
794301..794373 |
gca |
|
126 |
|
|
|
|
|
|
794500..797410 |
23s |
|
69 |
|
|
|
|
|
|
797480..797596 |
5s |
|
87 |
87 |
|
|
|
87
|
|
797684..798559 |
CDS |
|
36 |
|
|
|
292 |
|
|
|
|
|
|
|
|
|
|
|
comp |
798596..800178 |
CDS |
|
530 |
*530 |
|
|
*528 |
|
|
800709..800781 |
aac |
@2 |
3 |
|
3 |
|
|
|
|
800785..800858 |
cca |
|
24 |
|
24 |
|
|
|
|
800883..800954 |
ggc |
|
30 |
|
30 |
|
|
|
|
800985..801058 |
cgt |
|
2 |
|
2 |
|
|
|
|
801061..801133 |
gta |
|
3 |
|
3 |
|
|
|
|
801137..801208 |
gaa |
|
42 |
|
42 |
|
|
|
|
801251..801338 |
tca |
|
9 |
|
9 |
|
|
|
|
801348..801421 |
atgf |
|
3 |
|
3 |
|
|
|
|
801425..801498 |
gac |
|
6 |
|
6 |
|
|
|
|
801505..801577 |
ttc |
|
8 |
|
8 |
|
|
|
|
801586..801667 |
tac |
|
4 |
|
4 |
|
|
|
|
801672..801742 |
tgg |
|
13 |
|
13 |
|
|
|
|
801756..801831 |
cac |
|
26 |
|
26 |
|
|
|
|
801858..801928 |
tgc |
|
28 |
|
28 |
|
|
|
|
801957..802041 |
ttg |
|
356 |
356 |
|
|
|
356
|
|
802398..802961 |
CDS |
|
284259 |
|
|
|
188 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1087221..1088531 |
CDS |
|
157 |
157 |
|
|
437 |
157
|
comp |
1088689..1088760 |
caa |
|
656 |
*656 |
|
|
|
|
comp |
1089417..1090313 |
CDS |
|
173317 |
|
|
|
*299 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1263631..1265769 |
CDS |
|
188 |
188 |
|
|
*713 |
188
|
comp |
1265958..1266031 |
aga |
|
222 |
222 |
|
|
|
|
|
1266254..1268632 |
CDS |
|
84103 |
|
|
|
*793 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1352736..1354022 |
CDS |
|
98 |
98 |
|
|
429 |
98
|
|
1354121..1354204 |
ctg |
|
204 |
204 |
|
|
|
|
comp |
1354409..1354928 |
CDS |
|
13182 |
|
|
|
173 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1368111..1369307 |
CDS |
|
161 |
161 |
|
|
399 |
161
|
comp |
1369469..1369541 |
gta |
|
3 |
|
|
3 |
|
|
comp |
1369545..1369616 |
gaa |
|
138 |
|
|
*138 |
|
|
comp |
1369755..1369828 |
atgj |
|
6 |
|
|
6 |
|
|
comp |
1369835..1369925 |
tcc |
|
8 |
|
|
8 |
|
|
comp |
1369934..1370006 |
aac |
|
7 |
|
|
|
|
|
comp |
1370014..1370130 |
5s |
|
69 |
|
|
|
|
|
comp |
1370200..1373111 |
23s |
|
126 |
|
|
|
|
|
comp |
1373238..1373310 |
gca |
|
69 |
|
|
69 |
|
|
comp |
1373380..1373453 |
atc |
|
105 |
|
|
|
|
|
comp |
1373559..1375130 |
16s |
|
547 |
*547 |
|
|
|
|
|
1375678..1376604 |
CDS |
|
102845 |
|
|
|
*309 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1479450..1479824 |
CDS |
|
200 |
200 |
|
|
125 |
|
comp |
1480025..1480101 |
gac |
|
26 |
|
|
26 |
|
|
comp |
1480128..1480199 |
gaa |
|
3 |
|
|
3 |
|
|
comp |
1480203..1480275 |
gta |
|
2 |
|
|
2 |
|
|
comp |
1480278..1480351 |
cgt |
|
35 |
|
|
35 |
|
|
comp |
1480387..1480458 |
ggc |
|
36 |
|
|
|
|
|
comp |
1480495..1480611 |
5s |
|
68 |
|
|
|
|
|
comp |
1480680..1483590 |
23s |
|
208 |
|
|
|
|
|
comp |
1483799..1485370 |
16s |
|
153 |
153 |
|
|
|
153
|
comp |
1485524..1485716 |
CDS |
|
20944 |
|
|
|
64 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1506661..1507464 |
CDS |
|
270 |
270 |
|
|
268 |
|
comp |
1507735..1507807 |
aag |
+ |
34 |
|
34 |
|
|
|
comp |
1507842..1507914 |
aag |
5 aag |
33 |
|
33 |
|
|
|
comp |
1507948..1508020 |
aag |
|
33 |
|
33 |
|
|
|
comp |
1508054..1508126 |
aag |
@3 |
33 |
|
33 |
|
|
|
comp |
1508160..1508232 |
aag |
|
130 |
130 |
|
|
|
130
|
comp |
1508363..1509226 |
CDS |
|
167 |
|
|
|
288 |
|
|
|
|
|
|
|
|
|
|
|
|
1509394..1510872 |
CDS |
|
106 |
106 |
|
|
493 |
106
|
comp |
1510979..1511051 |
gta |
|
3 |
|
3 |
|
|
|
comp |
1511055..1511126 |
gaa |
|
151 |
|
*151 |
|
|
|
|
1511278..1511366 |
ctt |
|
113 |
113 |
|
|
|
|
|
1511480..1512010 |
CDS |
|
21195 |
|
|
|
177 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1533206..1534129 |
CDS |
|
355 |
355 |
|
|
308 |
|
comp |
1534485..1534557 |
acg |
|
154 |
154 |
|
|
|
154
|
comp |
1534712..1535950 |
CDS |
|
18502 |
|
|
|
413 |
|
|
|
|
|
|
|
|
|
|
|
|
1554453..1554638 |
CDS |
|
303 |
303 |
|
|
62 |
303
|
comp |
1554942..1555029 |
agc |
|
673 |
*673 |
|
|
|
|
comp |
1555703..1556203 |
CDS |
|
595 |
|
|
|
*167 |
|
|
|
|
|
|
|
|
|
|
|
|
1556799..1558178 |
CDS |
|
277 |
277 |
|
|
460 |
|
comp |
1558456..1558572 |
5s |
|
68 |
|
|
|
|
|
comp |
1558641..1561551 |
23s |
|
126 |
|
|
|
|
|
comp |
1561678..1561750 |
gca |
|
69 |
|
|
69 |
|
|
comp |
1561820..1561893 |
atc |
|
105 |
|
|
|
|
|
comp |
1561999..1563570 |
16s |
|
189 |
189 |
|
|
|
189
|
|
1563760..1563948 |
CDS |
|
19274 |
|
|
|
63 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1583223..1584392 |
CDS |
|
151 |
151 |
|
|
390 |
151
|
comp |
1584544..1584628 |
ttg |
+ |
17 |
|
17 |
|
|
|
comp |
1584646..1584730 |
ttg |
2 ttg |
28 |
|
28 |
|
|
|
comp |
1584759..1584829 |
tgc |
2 ttc |
26 |
|
26 |
|
|
|
comp |
1584856..1584931 |
cac |
2 atgf |
13 |
|
13 |
|
|
|
comp |
1584945..1585015 |
tgg |
|
4 |
|
4 |
|
|
|
comp |
1585020..1585101 |
tac |
|
8 |
|
8 |
|
|
|
comp |
1585110..1585182 |
ttc |
|
6 |
|
6 |
|
|
|
comp |
1585189..1585262 |
gac |
|
3 |
|
3 |
|
|
|
comp |
1585266..1585339 |
atgf |
|
9 |
|
9 |
|
|
|
comp |
1585349..1585436 |
tca |
|
42 |
|
42 |
|
|
|
comp |
1585479..1585550 |
gaa |
|
258 |
|
*258 |
|
|
|
comp |
1585809..1585899 |
agc |
|
2 |
|
2 |
|
|
|
comp |
1585902..1585975 |
atc |
|
3 |
|
3 |
|
|
|
comp |
1585979..1586049 |
gga |
|
14 |
|
14 |
|
|
|
comp |
1586064..1586136 |
ttc |
|
17 |
|
17 |
|
|
|
comp |
1586154..1586227 |
atgf |
|
11 |
|
11 |
|
|
|
comp |
1586239..1586312 |
atgi |
|
12 |
|
12 |
|
|
|
comp |
1586325..1586398 |
atg |
|
36 |
|
36 |
|
|
|
comp |
1586435..1586508 |
cca |
|
6 |
|
6 |
|
|
|
comp |
1586515..1586588 |
cgt |
|
5 |
|
5 |
|
|
|
comp |
1586594..1586679 |
tta |
|
15 |
|
15 |
|
|
|
comp |
1586695..1586766 |
ggc |
|
4 |
|
4 |
|
|
|
comp |
1586771..1586843 |
aca |
|
11 |
|
11 |
|
|
|
comp |
1586855..1586936 |
cta |
|
12 |
|
12 |
|
|
|
comp |
1586949..1587021 |
aaa |
|
2 |
|
2 |
|
|
|
comp |
1587024..1587096 |
gta |
|
157 |
157 |
|
|
|
|
comp |
1587254..1588681 |
CDS |
|
539 |
|
|
|
476 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1589221..1590557 |
CDS |
|
156 |
156 |
|
|
446 |
156
|
comp |
1590714..1590830 |
5s |
|
68 |
|
|
|
|
|
comp |
1590899..1593809 |
23s |
|
126 |
|
|
|
|
|
comp |
1593936..1594008 |
gca |
|
69 |
|
|
69 |
|
|
comp |
1594078..1594151 |
atc |
|
105 |
|
|
|
|
|
comp |
1594257..1595828 |
16s |
|
581 |
*581 |
|
|
|
|
comp |
1596410..1597276 |
CDS |
|
189853 |
|
|
|
*289 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1787130..1788440 |
CDS |
|
298 |
298 |
|
|
437 |
298
|
comp |
1788739..1788855 |
5s |
|
68 |
|
|
|
|
|
comp |
1788924..1791834 |
23s |
@4 |
208 |
|
|
|
|
|
comp |
1792043..1793614 |
16s |
|
436 |
*436 |
|
|
|
|
comp |
1794051..1794596 |
CDS |
|
-8 |
|
|
|
*182 |
|
comp |
1794589..1795436 |
CDS |
|
138 |
138 |
|
|
283 |
138
|
comp |
1795575..1795648 |
gac |
|
3 |
|
|
3 |
|
|
comp |
1795652..1795724 |
gta |
|
2 |
|
|
2 |
|
|
comp |
1795727..1795800 |
cgt |
|
35 |
|
|
35 |
|
|
comp |
1795836..1795907 |
ggc |
|
19 |
|
|
19 |
|
|
comp |
1795927..1796000 |
cca |
|
3 |
|
|
3 |
|
|
comp |
1796004..1796076 |
aac |
|
7 |
|
|
|
|
|
comp |
1796084..1796200 |
5s |
|
68 |
|
|
|
|
|
comp |
1796269..1799179 |
23s |
|
208 |
|
|
|
|
|
comp |
1799388..1800959 |
16s |
|
501 |
*501 |
|
|
|
|
comp |
1801461..1802087 |
CDS |
|
|
|
|
|
*209 |
|
cumuls. Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
9 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
100 |
5
|
|
16 23 5s 0 |
2 |
20 |
33 |
9 |
50 |
2 |
20 |
0 |
200 |
11
|
|
16 atc gca |
5 |
40 |
11 |
3 |
100 |
12 |
40 |
2 |
300 |
19
|
|
16 23 5s a |
2 |
60 |
2 |
0 |
150 |
11 |
60 |
3 |
400 |
11
|
|
max a |
7 |
80 |
0 |
5 |
200 |
14 |
80 |
3 |
500 |
11
|
|
a doubles |
0 |
100 |
0 |
0 |
250 |
3 |
100 |
4 |
600 |
2
|
|
autres |
0 |
120 |
0 |
0 |
300 |
6 |
120 |
2 |
700 |
1
|
|
total aas |
26 |
140 |
0 |
1 |
350 |
2 |
140 |
5 |
800 |
2
|
sans |
opérons |
23 |
160 |
1 |
0 |
400 |
2 |
160 |
5 |
900 |
1
|
|
1 aa |
16 |
180 |
0 |
0 |
450 |
1 |
180 |
1 |
1000 |
1
|
|
max a |
26 |
200 |
0 |
0 |
500 |
1 |
200 |
2 |
1100 |
0
|
|
a doubles |
3 |
|
1 |
0 |
|
10 |
|
5 |
|
0
|
|
total aas |
72 |
|
48 |
18 |
|
64 |
|
32 |
|
64
|
total aas |
|
98 |
|
|
|
|
|
|
|
|
|
remarques |
|
|
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
|
|
|
|
138 |
|
320
|
|
|
|
variance |
|
|
|
|
|
81 |
|
182
|
sans jaune |
|
|
moyenne |
14 |
29 |
|
159 |
|
114 |
|
275
|
|
|
|
variance |
12 |
29 |
|
85 |
|
50 |
|
122
|
- Note: intercalaires prélevés de la colonne cds de lbu opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
lbu 78 61 48 91
deb fin deb fin grand petit grand petit
30 118 94 23 75 62 94 23
54 109 75 62 94 23 118 30
56 125 54 109 109 54 109 54
57 170 106 113 113 106 125 56
61 341 30 118 118 30 170 57
69 181 56 125 125 56 341 61
75 62 270 130 155 117 75 62
82 296 276 134 157 151 181 69
94 23 355 154 170 57 296 82
98 614 117 155 181 69 204 98
98 204 151 157 195 128 614 98
106 113 57 170 204 98 113 106
117 155 69 181 222 188 155 117
128 195 128 195 270 130 195 128
134 787 98 204 276 134 270 130
151 157 188 222 296 82 276 134
157 656 82 296 341 61 787 134
188 222 61 341 355 154 157 151
270 130 530 356 530 356 355 154
276 134 98 614 614 98 656 157
303 673 157 656 656 157 222 188
355 154 303 673 673 303 673 303
530 356 134 787 787 134 530 356
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
lbu 1,838 46 32 9 1 4 18 14 11 21
lbu ‰ 696 196 22 87 783 609 478 913
B6 Lactobacillus delbrueckii, RNAs blocs
cds |
277’ |
|
cds |
156 |
|
cds |
298
|
5s |
68 |
|
5s |
68 |
|
5s |
68
|
23s |
126 |
|
23s |
126 |
|
23s |
208
|
gca |
69 |
|
gca |
69 |
|
16s |
436
|
atc |
105 |
|
atc |
105 |
|
cds |
-8
|
16s |
189’ |
|
16s |
581 |
|
cds |
138
|
cds |
|
|
cds |
|
|
gac |
3
|
|
|
|
|
|
|
4aas |
*
|
cds |
518 |
|
cds |
613’ |
|
aac |
7
|
16s |
106 |
|
16s |
105 |
|
5s |
68
|
atc |
69 |
|
atc |
69 |
|
23s |
208
|
gca |
127 |
|
gca |
126 |
|
16s |
501
|
23s |
68 |
|
23s |
69 |
|
cds |
|
5s |
208’ |
|
5s |
87 |
|
|
|
cds |
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
|
cds |
161 |
|
cds hp |
451 |
|
cds |
200
|
gta |
3 |
|
16s |
209 |
|
gac |
26
|
3aas |
* |
|
23s |
69 |
|
3aas |
*
|
aac |
7 |
|
5s |
275 |
|
ggc |
36
|
5s |
69 |
|
cds hp |
|
|
5s |
68
|
23s |
126 |
|
|
|
|
23s |
208
|
gca |
69 |
|
|
|
|
16s |
153
|
atc |
105 |
|
|
|
|
cds |
|
16s |
547’ |
|
|
|
|
|
|
cds |
|
|
|
|
|
|
|
*Remarques : Ce génome se distingue par un indice 4 fois supérieur des gènes de tRNAs
par rapport à ceux du total des bacilli.
@1 Les gènes de tRNA se terminant par g et t sont rares chez les
et ont un indice total de 5 par génome. Ce génome en a 20.
La plupart sont isolés, seuls ou dans de petits clusters sans rRNA.
aag se distingue par sa fréquence élevée, 6, et surtout par sa répétition de 5
dans un seul cluster.
Cependant chez les bacilli les gènes présents ont un indice plus élevés que
les très rares. J’ai repéré 4 groupes :
indice présents absents
rares moyens 99>ind>43 aag6 cgg agg ctt2 ctg2 (ctc gtc)
tcg acg (acc tcc)
rares 26>ind>11 ggg ccg cag gag act2 (gcc)
très rares 7,9>ind>0,6 gtg gcg ttt cct (ccc ata)
nuls 0,6>ind autres xxt, tous absents
@2 Les clusters sans rRNAs sont beaucoup plus longs que ceux avec rRNA, 26 15 5,
contre 6 5 5. Les petits clusters sont en grande partie ceux de @1.
Les clusters 26 et 15 n’ont pas de doublons ou très peu et se comportent comme
les clusters avec rRNAs longs des bacilli (ppm bsu lmo lma* pmq ban*) :
pas de répétition, pas de séquence et doublons séparés.
@3 répétition de 5 de aag, voir @1 ci-dessus.
@4 5 blocs 635 et 4 blocs 6-atcgca-35 avec des intercalaires identiques. Très peu de
gènes tRNA à la suite de ces blocs (6 5 5 ) contrairement aux autres bacilli étudiés qui
dépassent les 21 aas : ppm bsu lmo lma* pmq ban*.
Séquences des doubles (indiqués par le signe + dans le tableau):
Les doubles, peu nombreux, se trouvent dans les clusters sans rRNAs. pas de séquences mais une répétition de 5 chez les gènes rares.
Voir ci-dessus @2.
Bc6 lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365. bacilli.
bc61 lbu, distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
1 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
2 |
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
1 |
aac |
1 |
agc |
1
|
g ctc |
|
f ccc |
2 |
cac |
2 |
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
4
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
3 |
o gca |
|
gaa |
3 |
gga |
1
|
m ttg |
3 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
1 |
l acg |
|
aag |
5 |
agg |
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lbu |
56 |
|
|
|
|
|
56
|
|
bc62 lbu. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
2 |
aat |
|
agt |
|
c ctt |
1 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
5 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
2
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
1
|
k cta |
|
g cca |
1 |
caa |
2 |
cga |
|
l gta |
3 |
o gca |
5 |
gaa |
2 |
gga |
|
m ttg |
|
d tcg |
1 |
tag |
|
tgg |
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
lbu |
|
16 |
|
16 |
|
10 |
42
|
|
- lbu Le prélèvement: Abacilli
- Le nom et le lien NCBI: lbu, Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA-365, NCBI [25], date 13.2.22.
- lbu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
lbu 222,489 1,856,951 12.0
Intergen51. lbu. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. lbu les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 lbu les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,088 |
280 |
10 |
1,378 |
3.2 |
92 |
10 |
102
|
x |
409 |
20 |
2 |
431 |
|
1 |
5 |
6
|
t |
1,497 |
300 |
12 |
1,809 |
|
93 |
15 |
108
|
% |
82.8 |
16.6 |
0.7 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
30 |
0 |
0 |
30 |
1.7 |
tRNA-CDS |
48 |
24
|
x |
18 |
0 |
0 |
18 |
|
RNA-RNA |
93 |
47
|
t |
48 |
0 |
0 |
48 |
|
CDS-rRNA |
15 |
8
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
42 |
21
|
- |
|
|
|
|
|
total |
198 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
4.6 |
3.3 |
0.0 |
31.7 |
3.3 |
49 |
0.7 |
0.0
|
x |
7.8 |
11.1 |
30.0 |
2.9 |
5.6 |
30 |
0.5 |
0.0
|
|
Intergen51. lbu. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: lbu données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées lbu fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. lbu fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 lbu
R2 x3 x2 x c Inflexion poly3 x c
0.582 5.83E-06 -3.82E-03 5.83E-01 17.0 fx1 abscisse 296.7 162.1
0.815 -5.52E-06 4.32E-03 -1.12E+00 108.0 fc1 ordonnée 11.3 23.2
0.837 -2.64E-06 2.35E-03 -7.67E-01 101.0 fx41
0.936 1.54E-06 -7.49E-04 -4.16E-02 43.1 fc41
- Le rfin après 400 est de 51 sur un total de 1098. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 11. L'indice i.rfin1 = 40/270 = 0.148.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données lbu calculs poly3 lbu
effect 1098 R2.21 777 abscis 400
xm 35 pte 11,36 flexa 177
ym 3,405 cste 3,50 flexo 2,05
x1m 220 r400l 180 xm 35
y1m 1 restp 152,09 sup4 190,3
rfin 46,45 %sd 36,46 sup4t 445,4
bornf 171 lond 185 % 42,7
supd 184,9 %sf 36,62 long 142
supdt 507,3 lonf 136 R2 504
xmp 340,62 sf/lf 1,17
r400 105,65 sr/lr 0,53
supf 159,1 sd/ld 1,00
supft 434,4 i.r400 0,59
Intergen51. lbu. Les CDS-CDS négatifs
modifier
Sous-totaux lbu totale
fréquence x- c- x- c-
- 1 1 80 4 4140
- 2 1 0 85 11
- 3 0 1 3 12
- 4 4 55 717 10938
- 5 0 0 5 19
sp6 14 144 1642 8424
total 20 280 2,456 23,544
reste 6 0 264 420
s6 3 1 361 41
s7 0 19 321 1438
s8 5 124 696 6525
rappot s1-5
4/2/1 4.0 0.7 8.4 2.6
% / sp6
s6/sp6 21.4 0.7 22.0 0.5
s7/sp6 0.0 13.2 19.5 17.1
s8/sp6 35.7 86.1 42.4 77.5
reste/sp6 42.9 0.0 16.1 5.0
total s1-5 6 136 814 15120
% / total
%s1-5 30.0 48.6 33.1 64.2
%sp6 70.0 51.4 66.9 35.8
Intergen51. lbu. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 9 CDS 16s 6 3
16s 23s 4 5s CDS 4 2
16s tRNA 5 16 CDS
tRNA 23s 5 CDS 5s
5s tRNA 3 23s CDS
tRNA in 5 CDS 23s
tRNA contig 13 5s 16s
tRNA hors 48 1 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 92 1 total 10 5
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 lbu. Les intercalaires tRNA-tRNA extra blocs
|
contig |
|
|
hors |
|
|
hors |
|
|
hors
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
3 |
gta |
|
4 |
ggc |
|
34 |
aag |
|
17 |
ttg
|
138 |
gaa |
|
108 |
ccg |
|
33 |
aag |
|
28 |
ttg
|
6 |
atgj |
|
** |
ggc |
|
33 |
aag |
|
29 |
tgc
|
8 |
tcc |
|
5 |
tac |
|
33 |
aag |
|
13 |
cac
|
** |
aac |
|
** |
caa |
|
** |
aag |
|
4 |
tgg
|
26 |
gac |
|
5 |
cag |
|
3 |
gta |
|
8 |
tac
|
3 |
gaa |
|
** |
gag |
|
x151 |
gaa |
|
6 |
ttc
|
2 |
gta |
|
3 |
aac |
|
** |
ctt |
|
3 |
gac
|
35 |
cgt |
|
24 |
cca |
|
|
|
|
9 |
atgf
|
** |
ggc |
|
30 |
ggc |
|
|
|
|
42 |
tca
|
3 |
gac |
|
2 |
cgt |
|
|
|
|
261 |
gaa
|
2 |
gta |
|
3 |
gta |
|
|
|
|
2 |
agc
|
35 |
cgt |
|
42 |
gaa |
|
|
|
|
3 |
atc
|
19 |
ggc |
|
9 |
tca |
|
|
|
|
14 |
gga
|
3 |
cca |
|
3 |
atgf |
|
|
|
|
17 |
ttc
|
** |
aac |
|
6 |
gac |
|
|
|
|
11 |
atgf
|
|
|
|
8 |
ttc |
|
|
|
|
12 |
atgi
|
|
|
|
4 |
tac |
|
|
|
|
36 |
atgj
|
|
|
|
13 |
tgg |
|
|
|
|
6 |
cca
|
|
|
|
29 |
cac |
|
|
|
|
5 |
cgt
|
|
|
|
28 |
tgc |
|
|
|
|
15 |
tta
|
|
|
|
** |
ttg |
|
|
|
|
4 |
ggc
|
|
|
|
|
|
|
|
|
|
11 |
aca
|
|
|
|
|
|
|
|
|
|
12 |
cta
|
|
|
|
|
|
|
|
|
|
2 |
aaa
|
|
|
|
|
|
|
|
|
|
** |
gta
|
- |
|
|
|
|
|
|
|
|
|
|
ban* Bacillus anthracis strain 2002013094
modifier
- Attention: la notation KEGG pour ce génome n'existe pas. Elle est remplacée par ban*. Mais par commodité j'ai mis ban pour la suite. Ce n'est pas le génome ban de KEGG Bacillus anthracis Ames
- Liens: gtRNAdb [26], NCBI [27], génome [orgn]
- Lien tableur: ban opérons
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
B7 Bacillus anthracis strain 2002013094
35.1%GC |
15.8.19 Paris |
112 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
618142..618366 |
CDS |
|
188 |
188 |
|
|
75 |
188
|
|
618555..618627 |
gtc |
|
419 |
*419 |
|
|
|
|
comp |
619047..619235 |
CDS |
|
|
|
|
|
63 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1102183..1102602 |
CDS |
|
130 |
130 |
|
|
140 |
130
|
comp |
1102733..1102804 |
gaa |
+ |
1 |
|
|
1 |
|
|
comp |
1102806..1102880 |
aac |
2 aca |
8 |
|
|
8 |
|
|
comp |
1102889..1102965 |
atc |
2 tca |
11 |
|
|
11 |
|
|
comp |
1102977..1103047 |
tgg |
|
6 |
|
|
6 |
|
|
comp |
1103054..1103126 |
aca |
|
9 |
|
|
9 |
|
|
comp |
1103136..1103211 |
ttc |
|
9 |
|
|
9 |
|
|
comp |
1103221..1103296 |
gac |
|
4 |
|
|
4 |
|
|
comp |
1103301..1103377 |
atgf |
|
20 |
|
|
20 |
|
|
comp |
1103398..1103490 |
tca |
|
54 |
|
|
54 |
|
|
comp |
1103545..1103637 |
tca |
|
20 |
|
|
20 |
|
|
comp |
1103658..1103730 |
gca |
|
16 |
|
|
16 |
|
|
comp |
1103747..1103820 |
cca |
|
10 |
|
|
10 |
|
|
comp |
1103831..1103904 |
cgt |
|
3 |
|
|
3 |
|
|
comp |
1103908..1103996 |
tta |
|
16 |
|
|
16 |
|
|
comp |
1104013..1104087 |
ggc |
|
29 |
|
|
29 |
|
|
comp |
1104117..1104197 |
cta |
|
22 |
|
|
22 |
|
|
comp |
1104220..1104295 |
cac |
|
9 |
|
|
9 |
|
|
comp |
1104305..1104380 |
aca |
|
4 |
|
|
4 |
|
|
comp |
1104385..1104460 |
gta |
|
4 |
|
|
|
|
|
comp |
1104465..1104580 |
5s |
|
97 |
|
|
|
|
|
comp |
1104678..1107604 |
23s |
|
141 |
|
|
|
|
|
comp |
1107746..1109299 |
16s |
|
694 |
*694 |
|
|
|
|
|
1109994..1113038 |
CDS |
|
|
|
|
|
*1015 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1306706..1307848 |
CDS |
|
198 |
198 |
|
|
381 |
|
comp |
1308047..1308120 |
gga |
|
115 |
115 |
|
|
|
115
|
comp |
1308236..1308889 |
CDS |
|
|
|
|
|
218 |
|
|
|
|
|
|
|
|
|
|
|
|
1312025..1312345 |
CDS |
|
207 |
207 |
|
|
107 |
207
|
comp |
1312553..1312637 |
ttg |
|
10 |
|
|
10 |
|
|
comp |
1312648..1312718 |
tgc |
|
14 |
|
|
14 |
|
|
comp |
1312733..1312807 |
ggc |
|
5 |
|
|
5 |
|
|
comp |
1312813..1312887 |
caa |
|
63 |
|
|
63 |
|
|
comp |
1312951..1313026 |
cac |
|
19 |
|
|
19 |
|
|
comp |
1313046..1313119 |
tgg |
|
7 |
|
|
7 |
|
|
comp |
1313127..1313210 |
tac |
|
17 |
|
|
17 |
|
|
comp |
1313228..1313303 |
gta |
|
5 |
|
|
5 |
|
|
comp |
1313309..1313383 |
gaa |
|
24 |
|
|
24 |
|
|
comp |
1313408..1313480 |
acc |
|
4 |
|
|
4 |
|
|
comp |
1313485..1313559 |
aac |
|
9 |
|
|
|
|
|
comp |
1313569..1313684 |
5s |
|
96 |
|
|
|
|
|
comp |
1313781..1316709 |
23s |
|
141 |
|
|
|
|
|
comp |
1316851..1318405 |
16s |
|
386 |
*386 |
|
|
|
|
|
1318792..1319148 |
CDS |
|
|
|
|
|
119 |
|
|
|
|
|
|
|
|
|
|
|
|
1556278..1556507 |
CDS |
|
57 |
57 |
|
|
77 |
57
|
comp |
1556565..1556680 |
5s |
|
49 |
|
|
|
|
|
comp |
1556730..1560126 |
23s |
|
173 |
|
|
|
|
|
comp |
1560300..1562132 |
16s |
|
476 |
*476 |
|
|
|
|
|
1562609..1563322 |
CDS |
|
|
|
|
|
238 |
|
|
|
|
|
|
|
|
|
|
|
> |
1566949..1567219 |
CDS |
|
99 |
99 |
|
|
90 |
99
|
comp |
1567319..1567434 |
5s |
|
46 |
|
|
|
|
|
comp |
1567481..1570409 |
23s |
|
142 |
|
|
|
|
|
comp |
1570552..1572115 |
16s |
|
451 |
*451 |
|
|
|
|
|
1572567..1574498 |
CDS |
|
|
|
|
|
*644 |
|
|
|
|
|
|
|
|
|
|
|
|
1579539..1580615 |
CDS |
|
14 |
14 |
|
|
359 |
14
|
comp |
1580630..1580745 |
5s |
|
45 |
|
|
|
|
|
comp |
1580791..1583912 |
23s |
|
153 |
|
|
|
|
|
comp |
1584066..1585720 |
16s |
|
294 |
294 |
|
|
|
|
comp |
1586015..1587520 |
CDS |
|
|
|
|
|
*502 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1600693..1601166 |
CDS |
|
174 |
174 |
|
|
158 |
|
comp |
1601341..1601416 |
gac |
|
3 |
|
|
3 |
|
|
comp |
1601420..1601496 |
atgf |
|
12 |
|
|
|
|
|
comp |
1601509..1601624 |
5s |
@1 |
46 |
|
|
|
|
|
comp |
1601671..1604598 |
23s |
|
141 |
|
|
|
|
|
comp |
1604740..1606294 |
16s |
|
75 |
|
|
|
|
|
comp |
1606370..1606440 |
gga |
|
1 |
|
1 |
|
|
|
comp |
1606442..1606518 |
cca |
+ |
4 |
|
4 |
|
|
|
comp |
1606523..1606599 |
cgt |
Séquence 10 |
3 |
|
3 |
|
|
|
comp |
1606603..1606691 |
tta |
|
16 |
|
16 |
|
|
|
comp |
1606708..1606782 |
ggc |
|
29 |
|
29 |
|
|
|
comp |
1606812..1606892 |
cta |
|
14 |
|
14 |
|
|
|
comp |
1606907..1606982 |
aaa |
|
5 |
|
5 |
|
|
|
comp |
1606988..1607062 |
caa |
|
87 |
|
*87 |
|
|
|
comp |
1607150..1607225 |
gac |
|
46 |
|
46 |
|
|
|
comp |
1607272..1607347 |
gta |
|
4 |
|
4 |
|
|
|
comp |
1607352..1607426 |
gaa |
|
1 |
|
1 |
|
|
|
comp |
1607428..1607502 |
aac |
2 aac |
8 |
|
8 |
|
|
|
comp |
1607511..1607587 |
atc |
|
11 |
|
11 |
|
|
|
comp |
1607599..1607669 |
tgg |
|
6 |
|
6 |
|
|
|
comp |
1607676..1607748 |
aca |
|
9 |
|
9 |
|
|
|
comp |
1607758..1607833 |
ttc |
|
8 |
|
8 |
|
|
|
comp |
1607842..1607917 |
gac |
|
4 |
|
4 |
|
|
|
comp |
1607922..1607998 |
atgf |
|
20 |
|
20 |
|
|
|
comp |
1608019..1608111 |
tca |
2 tca |
54 |
|
54 |
|
|
|
comp |
1608166..1608258 |
tca |
|
20 |
|
20 |
|
|
|
comp |
1608279..1608351 |
gca |
|
16 |
|
16 |
|
|
|
comp |
1608368..1608441 |
cca |
|
10 |
|
10 |
|
|
|
comp |
1608452..1608525 |
cgt |
|
3 |
|
3 |
|
|
|
comp |
1608529..1608617 |
tta |
|
16 |
|
16 |
|
|
|
comp |
1608634..1608708 |
ggc |
|
29 |
|
29 |
|
|
|
comp |
1608738..1608818 |
cta |
|
13 |
|
13 |
|
|
|
comp |
1608832..1608907 |
aaa |
|
5 |
|
5 |
|
|
|
comp |
1608913..1608987 |
caa |
|
87 |
|
*87 |
|
|
|
comp |
1609075..1609150 |
gac |
|
46 |
|
46 |
|
|
|
comp |
1609197..1609272 |
gta |
|
4 |
|
4 |
|
|
|
comp |
1609277..1609351 |
gaa |
|
8 |
|
8 |
|
|
|
comp |
1609360..1609450 |
agc |
|
3 |
|
3 |
|
|
|
comp |
1609454..1609528 |
aac |
|
114 |
114 |
|
|
|
114
|
comp |
1609643..1610101 |
CDS |
|
|
|
|
|
153 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1702642..1703788 |
CDS |
|
114 |
114 |
|
|
382 |
114
|
comp |
1703903..1703975 |
gca |
|
10 |
|
|
10 |
|
|
comp |
1703986..1704057 |
ggc |
|
5 |
|
|
5 |
|
|
comp |
1704063..1704138 |
aaa |
|
5 |
|
|
5 |
|
|
comp |
1704144..1704218 |
caa |
|
65 |
|
|
65 |
|
|
comp |
1704284..1704366 |
tac |
|
17 |
|
|
17 |
|
|
comp |
1704384..1704459 |
gta |
|
5 |
|
|
5 |
|
|
comp |
1704465..1704539 |
gaa |
|
24 |
|
|
24 |
|
|
comp |
1704564..1704636 |
acc |
|
4 |
|
|
4 |
|
|
comp |
1704641..1704715 |
aac |
|
9 |
|
|
|
|
|
comp |
1704725..1704840 |
5s |
|
82 |
|
|
|
|
|
comp |
1704923..1707851 |
23s |
|
141 |
|
|
|
|
|
comp |
1707993..1709545 |
16s |
|
223 |
223 |
|
|
|
|
comp |
1709769..1709987 |
CDS |
|
|
|
|
|
73 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1767157..1767618 |
CDS |
|
206 |
206 |
|
|
154 |
206
|
comp |
1767825..1767940 |
5s |
|
45 |
|
|
|
|
|
comp |
1767986..1770913 |
23s |
|
141 |
|
|
|
|
|
comp |
1771055..1772608 |
16s |
|
372 |
*372 |
|
|
|
|
comp |
1772981..1774480 |
CDS |
|
|
|
|
|
*500 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1787717..1790188 |
CDS |
|
259 |
259 |
|
|
*824 |
|
comp |
1790448..1790519 |
gaa |
|
13 |
|
13 |
|
|
|
comp |
1790533..1790606 |
atgj |
@2 |
160 |
160 |
|
|
|
160
|
comp |
1790767..1791249 |
CDS |
|
|
|
|
|
161 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1820538..1820717 |
CDS |
|
190 |
190 |
|
|
60 |
190
|
comp |
1820908..1821023 |
5s |
|
44 |
|
|
|
|
|
comp |
1821068..1823996 |
23s |
|
77 |
|
|
|
|
|
comp |
1824074..1824149 |
gca |
|
8 |
|
|
8 |
|
|
comp |
1824158..1824234 |
atc |
|
130 |
|
|
|
|
|
comp |
1824365..1825919 |
16s |
|
217 |
217 |
|
|
|
|
comp |
1826137..1826406 |
CDS |
|
|
|
|
|
90 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1832600..1832992 |
CDS |
|
166 |
166 |
|
|
131 |
|
comp |
1833159..1833251 |
tca |
|
156 |
156 |
|
|
|
156
|
comp |
1833408..1834682 |
CDS |
|
|
|
|
|
425 |
|
|
|
|
|
|
|
|
|
|
|
|
1839668..1840669 |
CDS |
|
34 |
34 |
|
|
334 |
34
|
comp |
1840704..1840819 |
5s |
|
44 |
|
|
|
|
|
comp |
1840864..1843791 |
23s |
|
76 |
|
|
|
|
|
comp |
1843868..1843943 |
gca |
|
8 |
|
|
8 |
|
|
comp |
1843952..1844028 |
atc |
|
130 |
|
|
|
|
|
comp |
1844159..1845713 |
16s |
|
240 |
240 |
|
|
|
|
comp |
1845954..1848425 |
CDS |
|
|
|
|
|
*824 |
|
|
|
|
|
|
|
|
|
|
|
|
1873838..1875127 |
CDS |
|
139 |
139 |
|
|
430 |
139
|
|
1875267..1875342 |
aaa |
|
13 |
|
13 |
|
|
|
|
1875356..1875427 |
gaa |
|
21 |
|
21 |
|
|
|
|
1875449..1875524 |
gac |
|
41 |
|
41 |
|
|
|
|
1875566..1875638 |
ttc |
|
403 |
*403 |
|
|
|
|
|
1876042..1876749 |
CDS |
|
|
|
|
|
236 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2217640..2217846 |
CDS |
|
205 |
205 |
|
|
69 |
205
|
|
2218052..2218130 |
cgg |
|
255 |
255 |
|
|
|
|
|
2218386..2219693 |
CDS |
|
|
|
|
|
436 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2428815..2429495 |
CDS |
|
404 |
*404 |
|
|
227 |
|
|
2429900..2431456 |
16s |
|
139 |
|
|
|
|
|
|
2431596..2434524 |
23s |
|
97 |
|
|
|
|
|
|
2434622..2434737 |
5s |
|
4 |
|
|
|
|
|
|
2434742..2434817 |
gta |
+ |
4 |
|
|
4 |
|
|
|
2434822..2434897 |
aca |
2 cta |
9 |
|
|
9 |
|
|
|
2434907..2434982 |
cac |
2 aca |
22 |
|
|
22 |
|
|
|
2435005..2435085 |
cta |
|
29 |
|
|
29 |
|
|
|
2435115..2435189 |
ggc |
|
16 |
|
|
16 |
|
|
|
2435206..2435294 |
tta |
|
3 |
|
|
3 |
|
|
|
2435298..2435371 |
cgt |
|
10 |
|
|
10 |
|
|
|
2435382..2435455 |
cca |
|
16 |
|
|
16 |
|
|
|
2435472..2435544 |
gca |
|
20 |
|
|
20 |
|
|
|
2435565..2435657 |
tca |
|
54 |
|
|
54 |
|
|
|
2435712..2435805 |
cta |
|
20 |
|
|
20 |
|
|
|
2435826..2435902 |
atgf |
|
1 |
|
|
1 |
|
|
|
2435904..2435979 |
gac |
|
12 |
|
|
12 |
|
|
|
2435992..2436067 |
ttc |
|
14 |
|
|
14 |
|
|
|
2436082..2436157 |
aca |
|
10 |
|
|
10 |
|
|
|
2436168..2436243 |
aaa |
|
13 |
|
|
13 |
|
|
|
2436257..2436327 |
gga |
|
10 |
|
|
10 |
|
|
|
2436338..2436414 |
atc |
|
7 |
|
|
7 |
|
|
|
2436422..2436496 |
aac |
|
7 |
|
|
7 |
|
|
|
2436504..2436594 |
agc |
|
6 |
|
|
6 |
|
|
|
2436601..2436672 |
gaa |
|
59 |
59 |
|
|
|
59
|
|
2436732..2436842 |
CDS |
|
|
|
|
|
37 |
|
|
|
|
|
|
|
|
|
|
|
|
2798971..2799474 |
CDS |
|
109 |
109 |
|
|
168 |
109
|
|
2799584..2799657 |
gga |
|
1 |
|
1 |
|
|
|
|
2799659..2799735 |
aga |
|
407 |
*407 |
|
|
|
|
|
2800143..2800343 |
CDS |
|
|
|
|
|
67 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2991608..2992366 |
CDS |
|
242 |
242 |
|
|
253 |
|
|
2992609..2992682 |
atgi |
|
221 |
221 |
|
|
|
221
|
|
2992904..2993515 |
CDS |
|
|
|
|
|
204 |
|
- Lien tableur: ban cumuls
- Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
cumuls. Bacillus anthracis strain 2002013094
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
11 |
1 |
3 |
2 |
1 |
0 |
1 |
0 |
100 |
10
|
|
16 23 5s 0 |
4 |
20 |
25 |
47 |
50 |
2 |
20 |
1 |
200 |
9
|
|
16 atc gca |
2 |
40 |
3 |
6 |
100 |
3 |
40 |
1 |
300 |
6
|
|
16 23 5s a |
5 |
60 |
4 |
2 |
150 |
6 |
60 |
2 |
400 |
4
|
|
max a |
21 |
80 |
0 |
2 |
200 |
7 |
80 |
0 |
500 |
4
|
|
a doubles |
2 |
100 |
2 |
0 |
250 |
8 |
100 |
1 |
600 |
1
|
|
autres |
0 |
120 |
0 |
0 |
300 |
3 |
120 |
4 |
700 |
1
|
|
total aas |
66 |
140 |
0 |
0 |
350 |
0 |
140 |
2 |
800 |
0
|
sans |
opérons |
9 |
160 |
0 |
0 |
400 |
2 |
160 |
2 |
900 |
2
|
|
1 aa |
5 |
180 |
0 |
0 |
450 |
3 |
180 |
0 |
1000 |
0
|
|
max a |
33 |
200 |
0 |
0 |
500 |
0 |
200 |
2 |
1100 |
1
|
|
a doubles |
1 |
|
0 |
0 |
|
0 |
|
4 |
|
0
|
|
total aas |
46 |
|
37 |
59 |
|
34 |
|
19 |
|
38
|
total aas |
|
112 |
|
|
|
|
|
|
|
|
|
remarques |
|
2 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
18 |
15 |
|
232 |
|
132 |
|
274
|
|
|
|
variance |
21 |
14 |
|
143 |
|
62 |
|
238
|
sans jaune |
|
|
moyenne |
14 |
|
|
165 |
|
|
|
191
|
|
|
|
variance |
14 |
|
|
71 |
|
|
|
124
|
- Note: intercalaires prélevés de la colonne cds de ban opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
ban 63 38 25 75
deb fin deb fin grand petit grand petit
109 407 198 115 166 156 407 109
139 403 166 156 198 115 198 115
166 156 259 160 242 221 403 139
188 419 242 221 255 205 166 156
198 115 205 255 259 160 259 160
205 255 139 403 403 139 419 188
242 221 109 407 407 109 255 205
259 160 188 419 419 188 242 221
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
bacilli cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
ban 5,700 16 8 5 3 5 3 2 6
ban ‰ 500 312.5 187.5 0 625 375 250 750
B7 Bacillus anthracis, RNAs blocs
cds |
694’ |
|
cds |
386’ |
cds |
114 |
|
16s |
141 |
|
16s |
141 |
aac |
* |
|
23s |
97 |
|
23s |
96 |
31aas |
1 |
|
5s |
4 |
|
5s |
9 |
gga |
75 |
|
gta |
* |
|
aac |
* |
16s |
141 |
|
17aas |
1 |
|
9aas |
10 |
23s |
46 |
|
gaa |
130 |
|
ttg |
207’ |
5s |
12 |
|
cds |
|
|
cds |
|
atgf |
3 |
|
|
|
|
|
|
gac |
174 |
|
cds |
223 |
|
cds |
404’ |
cds |
|
|
16s |
141 |
|
16s |
139 |
|
|
|
23s |
82 |
|
23s |
97 |
cds |
217 |
240
|
5s |
9 |
|
5s |
4 |
16s |
130 |
130
|
aac |
* |
|
gta |
4 |
atc |
8 |
8
|
7aas |
10 |
|
19aas |
* |
gca |
77 |
76
|
gca |
114 |
|
gaa |
59 |
23s |
44 |
44
|
cds |
|
|
cds |
|
5s |
190 |
34’
|
|
|
|
|
|
cds |
|
|
cds |
476’ |
451’ |
294 |
372 |
|
|
|
16s |
173 |
142 |
153 |
141 |
|
|
|
23s |
49 |
46 |
45 |
45 |
|
|
|
5s |
57’ |
99’ |
14’ |
206 |
|
|
|
cds |
|
|
|
|
|
|
|
- Lien au tableau ban opérons
- Lien tableur: ban séquences
- Lien bsu-lmo
- Légende: 33 aas, cluster à 33 gènes de tRNA
- - répétitions de séquence intra bloc: Dans le bloc 33aas uniquement, il y a une séquence de 10aas répétée. Elle est divisée de 2 séquences de 5 chacune, cyan et bleu.
- - répétitions de séquence entre blocs
- - entre les clusters 11aas et 9aas: une séquence de 5 se répète, le jaune.
- - entre les clusters 33aas 21aas et 19aas je repère 3 grandes séquences qui se répètent, contenant des sous séquences qui se répètent aussi: séquence de 16 (cadre solide) commune à 33aas et 19aas, séquence de 15 (cadre en tirets) commune à 21aas et 19aas et une séquence de 12 commune aux 3 clusters et composée de la séquence 5 cyan et d'une séquence de 7aas (rouge) contenant atgf et un doublet tca. Il faut noter ici que tca est modifié en cta alors que les intercalaires atgf-cta-tca et atgf-tca-tca ne changement pas, 20-54. C'est que cta et tca sont des tRNAs de même longueur, seule une mutation ponctuelle est en cause.
- - entre le cluster 33aas et 21aas existe un bloc commun de 3 gènes gaa-agc-acc qu'on ne peut mettre en parallèle. A-t-il un rôle important dans les recombinaisons?
- - Les intercalaires qui changent: la plupart des intercalaires se répètent comme les gènes sauf les intercalaires de aca-ttc-gac-atgf qui sont constants dans les clusters 33aas et 19aas et diffèrent dans le 21aas. De même pour cca-cgt (cyan) qui diffèrent dans 33as mais restent constants entre les 3 clusters. Ce qui différencie les 2 séquences cyan de 33aas. En fin de 33aas le triplet gaa-agc-aac se répète au début de 21aas mais avec des intercalaires changeant, 8-3 contre 6-7. Ces changements dans les intercalaires laissent penser qu'ils se produisent lors des recombinaisons des blocs intra cluster (cyan 1 et 2 de 33aas) ou entre clusters.
B7. Bacillus anthracis strain 2002013094,
séquences des gènes tRNA dans les clusters à rRNA.
33 aas |
inter |
21 aas |
inter |
19 aas |
inter |
11 aas |
inter
|
|
|
|
|
|
|
|
|
gga |
1 |
|
|
|
|
ttg |
10
|
cca |
4 |
|
|
|
|
tgc |
14
|
cgt |
3 |
|
|
|
|
ggc |
5
|
tta |
16 |
|
|
|
|
caa |
63
|
ggc |
29 |
|
|
|
|
cac |
19
|
cta |
14 |
|
|
|
|
tgg |
7
|
aaa |
5 |
|
|
|
|
tac |
17
|
caa |
87 |
|
|
|
|
gta |
5
|
gac |
46 |
gaa |
6 |
|
|
gaa |
24
|
gta |
4 |
agc |
7 |
|
|
acc |
4
|
gaa |
1 |
aac |
7 |
gaa |
1 |
aac |
|
aac |
8 |
atc |
10 |
aac |
8 |
|
|
atc |
11 |
gga |
13 |
atc |
11 |
|
|
tgg |
6 |
aaa |
10 |
tgg |
6 |
|
|
aca |
9 |
aca |
14 |
aca |
9 |
|
|
ttc |
8 |
ttc |
12 |
ttc |
9 |
|
|
gac |
4 |
gac |
1 |
gac |
4 |
|
|
atgf |
20 |
atgf |
20 |
atgf |
20 |
|
|
tca |
54 |
cta |
54 |
tca |
54 |
9 aas |
inter
|
tca |
20 |
tca |
20 |
tca |
20 |
|
|
gca |
16 |
gca |
16 |
gca |
16 |
gca |
10
|
cca |
10 |
cca |
10 |
cca |
10 |
ggc |
5
|
cgt |
3 |
cgt |
3 |
cgt |
3 |
aaa |
5
|
tta |
16 |
tta |
16 |
tta |
16 |
caa |
65
|
ggc |
29 |
ggc |
29 |
ggc |
29 |
tac |
17
|
cta |
13 |
cta |
22 |
cta |
22 |
gta |
5
|
aaa |
5 |
cac |
9 |
cac |
9 |
gaa |
24
|
caa |
87 |
aca |
4 |
aca |
4 |
acc |
4
|
gac |
46 |
gta |
|
gta |
|
aac |
|
gta |
4 |
|
|
|
|
|
|
gaa |
8 |
|
|
|
|
|
|
agc |
3 |
|
|
|
|
|
|
aac |
|
|
|
|
|
|
|
- Légende: atgi pour Ile2, atgf pour fMet et atgj pour Met
I11. Occurrence des gènes tRNA chez ban*
ttt |
|
tct |
|
tat |
|
tgt |
|
att |
|
act |
|
aat |
|
agt |
|
ctt |
|
cct |
|
cat |
|
cgc |
|
gtt |
|
gct |
|
gat |
|
ggt |
|
ttc |
4 |
tcc |
|
tac |
2 |
tgc |
1
|
atc |
5 |
acc |
2 |
aac |
6 |
agc |
2
|
ctc |
|
ccc |
|
cac |
3 |
cgt |
4
|
gtc |
1 |
gcc |
|
gac |
7 |
ggc |
6
|
tta |
4 |
tca |
6 |
taa |
|
tga |
|
atgi |
1 |
aca |
5 |
aaa |
5 |
aga |
1
|
cta |
5 |
cca |
4 |
caa |
4 |
cga |
|
gta |
6 |
gca |
6 |
gaa |
8 |
gga |
4
|
ttg |
1 |
tcg |
|
tag |
|
tgg |
3
|
atgf/j |
4/1 |
acg |
|
aag |
|
agg |
|
ctg |
|
ccg |
|
cag |
|
cgg |
1
|
gtg |
|
gcg |
|
gag |
|
ggg |
|
- Légende: aa pour gène tRNA, inter aa pour intercalaire rRNA-aa
I11. Intercalaires des rRNAs chez ban*
aa |
gta |
aac |
atgf |
aac |
CDS
|
inter aa |
4 |
9 |
12 |
9 |
404
|
5s |
97 |
96 |
46 |
82 |
139
|
23s |
141 |
141 |
141 |
141 |
97
|
16s |
694 |
386 |
75 |
223 |
4
|
CDS |
CDS |
CDS |
gga |
CDS |
gta
|
|
|
|
|
|
|
CDS |
57 |
99 |
14 |
206 |
|
5s |
49 |
46 |
45 |
45 |
|
23s |
173 |
142 |
153 |
141 |
|
16s |
476 |
451 |
294 |
372 |
|
CDS |
|
|
|
|
|
|
|
|
|
|
|
CDS |
190 |
34 |
|
|
|
5s |
44 |
44 |
|
|
|
23s |
77 |
76 |
|
|
|
gca |
8 |
8 |
|
|
|
atc |
130 |
130 |
|
|
|
16s |
217 |
240 |
|
|
|
CDS |
|
|
|
|
|
- Liens: ban séquences, ban intercalaires, ban occurrences, indices bacilli
- Note du 16.11.20: attention le @1 doit être intégré dans les rRNA et non dans les sans. Refaire les calculs.
- Remarques:
- @1 Existence des blocs à rRNA inversés
- - Ce sont des blocs dont les gènes tRNAs se trouvent juste après le rRNA 16s au lieu d’être après le 5s ou parfois le 23s dans le sens 16s23s5s. J’en ai rencontré beaucoup dans les génomes détaillés dans ces annexes. Mais leurs présences systématiques dans les études exhaustives des fiches me laissaient penser à croire en leur existence.
- - En effet, le comportement des blocs normaux laissait penser que la juxtaposition des gènes tRNAs et du 16s était fortuite, le bloc 16s serait mobile et s’introduirait au hasard à côté d’une séquence de gènes tRNA. Dans l’étude des intercalaires entre gènes de tRNA, je voulais savoir s’il y avait une différence entre les blocs à rRNA et les blocs sans. Tout au début, je considérais les gènes de tRNA des blocs inversés comme appartenant aux blocs sans rRNA. Cependant l’intercalaire entre le 16s et le 1er aa était si faible quelquefois que cela me gênait de l’en séparer. Dans les cumuls de ce génome ban*, j’ai considéré la séquence de 33aas comme n’appartenant pas au bloc 16s adjacent. Cependant la moyenne et la variance des intercalaires sont les mêmes que celles des blocs 16s normaux.
- -Avec le génome ban* j’ai pu comparer les séquences des gènes tRNA ici et il est évident qu’avec la disposition des sous séquences et leurs intercalaires tout se passe comme si les réarrangements étaient dus à l’existence des blocs 16s. Et donc que la séquence des 33aas devait se trouver à la suite du 5s et a été déplacée par retournement, ce qui a facilité l’homogénéisation des séquences 12aas (cadres en tirets) par conversion dans les 3 blocs. Ensuite une conversion entre blocs 2 à 2 s’est faite séparément. Donc avant les conversions, il y a eu le retournement de 33aas et avant d’être 33aas, il y a eu duplication du bloc cyan+bleu.
- - Donc après cette analyse des séquences, je considérerai tous les blocs inversés comme appartenant au bloc 16s quelle que soit la distance de juxtaposition. Il reste cependant une inconnue : est-ce que l’espace entre 16s et le 1er aa est dû à notre incapacité à reconnaître une séquence fonctionnelle, ou bien effectivement dans certains rares cas li y a eu juxtaposition au hasard.
- @2 Il n’y a que 13 tRNAs sans rRNA. Tous les atgf se trouvent avec rRNA alors qu’il n’y a qu’un seul exemplaire de atgi et atgj. Voir le tableau des occurrences totales de ban* et le tableau ci-dessous pour les gènes rares.
- - Ils se répartissent en 8 clusters dont 5 ne contiennent qu’un seul gène. Trois gènes rares chez les bacilli s’y trouvent, gtc cgg aga.
- - Par comparaison les clusters à rRNAs ne contiennent que 3 gènes rares sur 99, 2 acc et tgc.
- - Le plus grand cluster à 4 gènes ressemble beaucoup au au bloc bleu du cluster 33aas, aaa gaa gac ttc contre aaa caa gac gta gaa pour le bloc bleu.
- - Au tableau des indices bacilliles 3527 gènes atg ne sont pas différenciés pour 672 génomes. Le décompte suivant montre que atgi et agj ont un indice moyen, un gène par génome, donc c’est un gène obligatoire comme l’est tgc.
Les gènes rares chez les bacilli Clusters sans rRNAs de ban*
indice pour 100 génomes occurrence chez ban*
tcc 108 0 aaa gaa gac ttc
acc 83 2 gtc
ccc 5,7 0 gga
gcc 26 0 gaa atgj
tgc 106 1 tca
aga 108 1 cgg
cga 5,4 0 gga aga
agg 66 0 atgi
cgg 99 1
ctc 67 0
gtc 47 1
Décompte des atg pour 678 génomes, 30.10.19 Tanger .
atg indice décompte
fMet 260 1762
Ile2 133 901
Met 139 941
total 3604
- Les intercalaires des clusters à rRNAs. Dans le tableau ban intercalaires, je ne mets en valeur que les intercalaires faisant intervenir les rRNAs.
- - les intercalaires 5s-23s: 4 blocs avec des gènes tRNA ont un intercalaire double des 7 autres et le bloc inversé se comporte comme les autres: 97-82 contre 49-44.
- - L'intercalaire 23s-16s: il est constant pour 7 blocs, 142-139 les 2 autres ont 10% (153) et 20% (173) de plus.
- - L'intercalaire aa-5s: il est très faible, 4-12. L’intercalaire aa-16s du bloc inversé est du même ordre que le 5s-23s et cela est du au retournement de la séquence des 33aas.
- - L'intercalaire cds-5s : sur les 6 blocs qui le portent 3 sont très faibles, 57 34 14 et les 3 autres sont moyens relativement aux cds-16s, 99 190 206, et restent orientés cds-16s-5s-cds.
- - L'intercalaire cds-16s: ils sont très élevés mais peu variables. 5 blocs ne contenant pas d'aas tournent autour de 420, 476-372, un sixième a 50% de plus, 694. Les 4 restants ont un intercalaire faible et se répartissent en 2 avec aas, 217 240, et 2 sans aas, 223 294.
- - L'homogénéité de ces blocs est comparable avec celle de bsu.
- Séquence des doubles : Très peu de doubles, si l’on ne tient pas compte de la duplication des blocs cyan et bleu de 10 aas dans le cluster à 33aas. Dans celui-ci il y a 2 doubles gac aac et une répétition tca-tca. Si l’on tient compte des aas proche du 5s, il faut ajouter atgf (double) et gac (triple). Pour le cluster 21aas aca et cta sont doubles, et pour le 19aas aca est double et tca répété. Les clusters 11aas et 9aas n’ont pas de doubles.
- Lien tableur: ban distribution
- Notes:
- - Les avant 16s, -16s, sont comptés comme les après 5s, +5s. Ils sont au nombre de 33 et ne sont pas soulignés.
- - Les 1-3aas après 5s, +5s, sont soulignés: atgf gac
- - duplicata: tca2
Bc7 ban, Bacillus anthracis strain 2002013094. bacilli.
bc71 ban, distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
|
tac |
|
tgc |
|
f atc |
2 |
j acc |
|
aac |
|
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
1 |
n gcc |
|
gac |
1 |
ggc |
2
|
i tta |
|
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
1
|
l gta |
|
o gca |
2 |
gaa |
2 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ban |
8 |
5 |
|
|
|
4 |
17
|
|
bc72 ban. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
2 |
tgc |
1
|
f atc |
3 |
j acc |
2 |
aac |
6 |
agc |
2
|
g ctc |
|
f ccc |
|
cac |
3 |
cgt |
4
|
h gtc |
|
n gcc |
|
gac |
6 |
ggc |
6
|
i tta |
4 |
c tca |
5 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
4 |
aga |
|
k cta |
5 |
g cca |
4 |
caa |
4 |
cga |
|
l gta |
6 |
o gca |
4 |
gaa |
6 |
gga |
2
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
3
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
ban |
|
|
|
95 |
|
|
95
|
|
- ban Le prélèvement: Abacilli
- Le nom et le lien NCBI: ban, Bacillus anthracis strain 2002013094 chromosome, NCBI [28], date 21.1.22.
- ban La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
ban 749,857 5,321,900 14.1
Intergen51. ban. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. ban les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ban les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
3,256 |
564 |
33 |
3,853 |
2.4 |
125 |
7 |
132
|
x |
1,579 |
13 |
0 |
1,592 |
|
0 |
9 |
9
|
t |
4,835 |
577 |
33 |
5,445 |
|
125 |
16 |
141
|
% |
88.8 |
10.6 |
0.6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
18 |
0 |
0 |
18 |
4.5 |
tRNA-CDS |
22 |
13
|
x |
4 |
0 |
0 |
4 |
|
RNA-RNA |
126 |
73
|
t |
22 |
0 |
0 |
22 |
|
CDS-rRNA |
16 |
9
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
9 |
5
|
- |
|
|
|
|
|
total |
173 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
5.1 |
16.7 |
0.0 |
25.9 |
0.0 |
56 |
0.9 |
0.0
|
x |
10.3 |
25.0 |
7.7 |
8.7 |
0.0 |
23 |
0.0 |
0.0
|
|
Intergen51. ban. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: ban données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ban fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ban fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 ban
R2 x3 x2 x c Inflexion poly3 x c
0.541 1.52E-06 -8.89E-04 3.90E-02 38.1 fx1 abscisse 431.0 198.3
0.739 -3.16E-06 2.60E-03 -7.46E-01 85.6 fc1 ordonnée 3.5 19.9
0.772 -1.98E-07 2.56E-04 -1.76E-01 47.7 fx41
0.900 2.37E-06 -1.41E-03 1.28E-01 31.5 fc41
- Le rfin après 400 est de 168 sur un total de 3289. Jusqu'à 1% les freq10 sont en continu jusqu'à 640, reste 33. L'indice i.rfin1 = 135/240 = 0.562.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données ban calculs poly3 ban
effect 3289 R2.21 800 abscis 400
xm 45 pte 9,81 flexa 194
ym 9 cste 3,18 flexo 1,98
x1m 222 r400l 178 xm 45
y1m 1 restp 191,24 sup4 162,8
rfin 51,08 %sd 34,88 sup4t 437,5
bornf 152 lond 177 % 37,2
supd 169,0 %sf 35,81 long 149
supdt 484,3 lonf 107 R2 645
xmp 324,41 sf/lf 1,19
r400 140,16 sr/lr 0,59
supf 127,5 sd/ld 0,95
supft 356,0 i.r400 0,79
Intergen51. ban. Les CDS-CDS négatifs
modifier
Sous-totaux ban totale
fréquence x- c- x- c-
- 1 0 73 4 4140
- 2 0 1 85 11
- 3 0 0 3 12
- 4 3 241 717 10938
- 5 0 0 5 19
sp6 10 249 1642 8424
total 13 564 2,456 23,544
reste 1 0 264 420
s6 4 0 361 41
s7 2 40 321 1438
s8 3 209 696 6525
rappot s1-5
4/2/1 - 3.3 8.4 2.6
% / sp6
s6/sp6 40.0 0.0 22.0 0.5
s7/sp6 20.0 16.1 19.5 17.1
s8/sp6 30.0 83.9 42.4 77.5
reste/sp6 10.0 0.0 16.1 5.0
total s1-5 3 315 814 15120
% / total
%s1-5 23.1 55.9 33.1 64.2
%sp6 76.9 44.1 66.9 35.8
Intergen51. ban. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 11 CDS 16s 5 5
16s 23s 9 5s CDS 2 4
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 5 23s CDS
tRNA in 2 CDS 23s
tRNA contig 89 5s 16s
tRNA hors 5 16s16s
tRNA 16s 1
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 126 0 total 7 9
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 ban. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3 |
|
|
cont3 |
|
|
cont4
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
1 |
gaa |
|
10 |
ttg |
|
1 |
gga |
|
20 |
atgf |
|
4 |
gta
|
8 |
aac |
|
14 |
tgc |
|
4 |
cca |
|
54 |
tca |
|
9 |
aca
|
11 |
atc |
|
5 |
ggc |
|
3 |
cgt |
|
20 |
tca |
|
22 |
cac
|
6 |
tgg |
|
63 |
caa |
|
16 |
tta |
|
16 |
gca |
|
29 |
cta
|
9 |
aca |
|
19 |
cac |
|
29 |
ggc |
|
10 |
cca |
|
16 |
ggc
|
9 |
ttc |
|
7 |
tgg |
|
14 |
cta |
|
3 |
cgt |
|
3 |
tta
|
4 |
gac |
|
17 |
tac |
|
5 |
aaa |
|
16 |
tta |
|
10 |
cgt
|
20 |
atgf |
|
5 |
gta |
|
87 |
caa |
|
29 |
ggc |
|
16 |
cca
|
54 |
tca |
|
24 |
gaa |
|
46 |
gac |
|
13 |
cta |
|
20 |
gca
|
20 |
tca |
|
4 |
acc |
|
4 |
gta |
|
5 |
aaa |
|
54 |
tca
|
16 |
gca |
|
** |
aac |
|
1 |
gaa |
|
87 |
caa |
|
20 |
cta
|
10 |
cca |
|
3 |
gac |
|
8 |
aac |
|
46 |
gac |
|
1 |
atgf
|
3 |
cgt |
|
** |
atgf |
|
11 |
atc |
|
4 |
gta |
|
12 |
gac
|
16 |
tta |
|
|
hors |
|
6 |
tgg |
|
8 |
gaa |
|
14 |
ttc
|
29 |
ggc |
|
13 |
gaa |
|
9 |
aca |
|
3 |
agc |
|
10 |
aca
|
22 |
cta |
|
** |
atgj |
|
8 |
ttc |
|
** |
aac |
|
13 |
aaa
|
9 |
cac |
|
13 |
aaa |
|
4 |
gac |
|
|
|
|
10 |
gga
|
4 |
aca |
|
21 |
gaa |
|
|
|
|
|
|
|
7 |
atc
|
** |
gta |
|
41 |
gac |
|
|
|
|
|
|
|
7 |
aac
|
|
|
|
** |
ttc |
|
|
|
|
|
|
|
6 |
agc
|
|
|
|
1 |
gga |
|
|
|
|
|
|
|
** |
gaa
|
|
|
|
** |
aga |
|
|
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
bacilli distribution par génome
modifier
bacilli distribution par génome
baci |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
duplica |
1-3aas |
total
|
bsu |
18 |
8 |
|
52 |
2 |
4 |
|
2 |
86
|
lmo |
9 |
8 |
|
44 |
|
4 |
|
2 |
67
|
lam |
22 |
14 |
|
16 |
|
4 |
3 |
4 |
63
|
ppm |
67 |
21 |
|
68 |
|
5 |
|
|
161
|
pmq |
22 |
11 |
|
138 |
|
0 |
2 |
|
173
|
lbu |
49 |
16 |
|
16 |
|
10 |
7 |
|
98
|
ban |
8 |
5 |
|
60 |
33 |
4 |
|
2 |
112
|
total |
195 |
83 |
0 |
394 |
35 |
31 |
12 |
10 |
760
|
- Lien tableur: bacilli distribution du total
- Légende:
- Tableau de gauche
- - Les couleurs cyan et jaune sont les emplacements des >3 des +5s de bacilli + clostridia
- Cyan pour les valeurs faibles, total 82.
- Jaune pour les valeurs fortes et en gras les plus fortes, total 410.
- blanc pour les valeurs intermédiaires, gca et atc le sont aussi, total 225.
- - Le rouge pour l'emplacement des +16s occupés, gca et atc.
- - Les encadrés sont les emplacements des 1-3aas des +5s de alpha + gamma.
- - Le -16s de 33 aas est compté ici comme un +5s long (inversion).
- Tableau de droite: Les duplicata ne sont pas comptés dans le total de 43 mais dans le total des >1aa du tableau de gauche.
- Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Bacilli. Distribution du total.
bacilli. Distribution du total: >1aa 1aa +5s >3
g1 |
|
t1 |
|
|
|
|
|
a atgi |
8 |
a tct |
|
tat |
|
atgf |
34
|
b att |
|
i act |
2 |
aat |
|
agt |
|
c ctt |
5 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
23 |
b tcc |
12 |
tac |
24 |
tgc |
12
|
f atc |
16 |
j acc |
8 |
aac |
32 |
agc |
17
|
g ctc |
11 |
f ccc |
2 |
cac |
21 |
cgt |
27
|
h gtc |
8 |
n gcc |
4 |
gac |
34 |
ggc |
39
|
i tta |
16 |
c tca |
17 |
taa |
|
tga |
|
j ata |
1 |
k aca |
23 |
aaa |
30 |
aga |
9
|
k cta |
15 |
g cca |
27 |
caa |
29 |
cga |
2
|
l gta |
36 |
o gca |
17 |
gaa |
42 |
gga |
19
|
m ttg |
13 |
d tcg |
10 |
tag |
|
tgg |
15
|
n atgj |
14 |
l acg |
7 |
aag |
10 |
agg |
3
|
o ctg |
15 |
h ccg |
2 |
cag |
1 |
cgg |
8
|
p gtg |
|
p gcg |
|
gag |
2 |
ggg |
4
|
baci7 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
207 |
83 |
0 |
394 |
33 |
0 |
717
|
|
bacilli. Distribution du total: +16s -16s +5s <4 dupli
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
15 |
j acc |
1 |
aac |
4 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
3
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
16 |
gaa |
|
gga |
1
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
5 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
baci7 |
dupli |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
12 |
|
|
10 |
2 |
31 |
43
|
|
bacilli. indices du 29.5.20 618 génomes
g1 |
|
t1 |
|
618 |
49366 |
0,2 |
0
|
a atgi |
146 |
a tct |
0,3 |
tat |
0,5 |
atgf |
285
|
b att |
0,2 |
i act |
11 |
aat |
0,5 |
agt |
|
c ctt |
47 |
e cct |
0,6 |
cat |
0,2 |
cgc |
0,2
|
d gtt |
0,2 |
m gct |
0,5 |
gat |
|
ggt |
|
e ttc |
272 |
b tcc |
120 |
tac |
239 |
tgc |
117
|
f atc |
310 |
j acc |
92 |
aac |
378 |
agc |
159
|
g ctc |
75 |
f ccc |
6,1 |
cac |
186 |
cgt |
288
|
h gtc |
53 |
n gcc |
30 |
gac |
386 |
ggc |
310
|
i tta |
211 |
c tca |
244 |
taa |
1,1 |
tga |
1,8
|
j ata |
2,1 |
k aca |
294 |
aaa |
340 |
aga |
119
|
k cta |
199 |
g cca |
243 |
caa |
299 |
cga |
6,3
|
l gta |
397 |
o gca |
443 |
gaa |
468 |
gga |
305
|
m ttg |
125 |
d tcg |
47 |
tag |
0,8 |
tgg |
137
|
n atgj |
152 |
l acg |
47 |
aag |
73 |
agg |
72
|
o ctg |
60 |
h ccg |
19 |
cag |
17 |
cgg |
109
|
p gtg |
0,8 |
p gcg |
8,6 |
gag |
16 |
ggg |
18
|
|
inter |
|
max |
|
min |
|
total
|
|
2820 |
|
4504 |
|
634 |
|
7958
|
|
Bacilli. Distribution par type.
bacilli. distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
2 |
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
|
f atc |
1 |
j acc |
2 |
aac |
1 |
agc |
1
|
g ctc |
3 |
f ccc |
2 |
cac |
|
cgc |
1
|
h gtc |
5 |
n gcc |
2 |
gac |
1 |
ggc |
|
i tta |
2 |
c tca |
5 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
|
aga |
7
|
k cta |
|
g cca |
|
caa |
4 |
cga |
|
l gta |
|
o gca |
|
gaa |
|
gga |
5
|
m ttg |
|
d tcg |
5 |
tag |
|
tgg |
|
n atgj |
2 |
l acg |
3 |
aag |
4 |
agg |
3
|
o ctg |
5 |
h ccg |
|
cag |
|
cgg |
8
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
3
|
baci7 |
inter |
|
max |
|
min |
|
total
|
1aa |
27 |
|
13 |
|
43 |
|
83
|
|
bacilli. distribution du type >1aa sans duplicata.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
3 |
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
3 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
9 |
b tcc |
3 |
tac |
11 |
tgc |
5
|
f atc |
3 |
j acc |
|
aac |
9 |
agc |
6
|
g ctc |
4 |
f ccc |
|
cac |
9 |
cgc |
3
|
h gtc |
|
n gcc |
1 |
gac |
11 |
ggc |
7
|
i tta |
3 |
c tca |
5 |
taa |
|
tga |
|
j ata |
1 |
k aca |
4 |
aaa |
8 |
aga |
1
|
k cta |
3 |
g cca |
5 |
caa |
10 |
cga |
2
|
l gta |
8 |
o gca |
2 |
gaa |
19 |
gga |
4
|
m ttg |
4 |
d tcg |
3 |
tag |
|
tgg |
7
|
n atgj |
4 |
l acg |
2 |
aag |
1 |
agg |
|
o ctg |
1 |
h ccg |
2 |
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
baci7 |
inter |
|
max |
|
min |
|
total
|
>1aa |
59 |
|
115 |
|
21 |
|
195
|
|
bacilli. distribution des +5s >3
g1 |
|
t1 |
|
|
|
|
|
a atgi |
3 |
a tct |
|
tat |
|
atgf |
18
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
14 |
b tcc |
9 |
tac |
13 |
tgc |
7
|
f atc |
12 |
j acc |
6 |
aac |
22 |
agc |
10
|
g ctc |
4 |
f ccc |
|
cac |
12 |
cgc |
23
|
h gtc |
3 |
n gcc |
1 |
gac |
22 |
ggc |
29
|
i tta |
11 |
c tca |
7 |
taa |
|
tga |
|
j ata |
|
k aca |
18 |
aaa |
22 |
aga |
1
|
k cta |
12 |
g cca |
22 |
caa |
15 |
cga |
|
l gta |
28 |
o gca |
15 |
gaa |
23 |
gga |
10
|
m ttg |
7 |
d tcg |
2 |
tag |
|
tgg |
8
|
n atgj |
8 |
l acg |
2 |
aag |
|
agg |
|
o ctg |
7 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
baci7 |
inter |
|
max |
|
min |
|
total
|
+5s>3 |
135 |
|
279 |
|
13 |
|
427
|
|
bacilli par rapport au groupe de référence
modifier
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
baci8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
43 |
21 |
5 |
13 |
|
|
82 |
|
16 |
moyen |
27 |
59 |
4 |
135 |
2 |
31 |
227 |
|
14 |
fort |
13 |
115 |
3 |
279 |
8 |
2 |
418 |
|
|
|
83 |
195 |
12 |
427 |
10 |
33 |
760 |
|
10 |
g+cga |
16 |
12 |
5 |
5 |
|
|
38 |
|
2 |
agg+cgg |
11 |
0 |
|
|
|
|
11 |
|
4 |
carre ccc |
12 |
5 |
|
8 |
|
|
25 |
|
5 |
autres |
4 |
4 |
|
|
|
|
8 |
|
|
|
43 |
21 |
5 |
13 |
|
|
82 |
|
|
|
total tRNAs ‰ |
|
|
|
|
|
baci8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
baci ‰ |
ref.‰
|
21 |
faible |
57 |
28 |
7 |
17 |
|
|
108 |
26
|
16 |
moyen |
36 |
78 |
5 |
178 |
3 |
41 |
299 |
324
|
14 |
fort |
17 |
151 |
4 |
367 |
11 |
3 |
550 |
650
|
|
|
109 |
257 |
16 |
562 |
13 |
43 |
760 |
729
|
10 |
g+cga |
21 |
16 |
7 |
7 |
|
|
50 |
10
|
2 |
agg+cgg |
14 |
|
|
|
|
|
14 |
|
4 |
carre ccc |
16 |
7 |
|
11 |
|
|
33 |
16
|
5 |
autres |
5 |
5 |
|
|
|
|
11 |
|
|
|
57 |
28 |
7 |
17 |
|
|
108 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
baci8 |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
148 |
72 |
17 |
238 |
26 |
52 |
11 |
|
16 |
moyen |
93 |
203 |
14 |
310 |
324 |
33 |
30 |
|
14 |
fort |
45 |
397 |
10 |
452 |
650 |
16 |
59 |
|
|
|
286 |
672 |
41 |
290 |
729 |
83 |
195 |
|
10 |
g+cga |
55 |
41 |
17 |
114 |
10 |
37 |
|
|
2 |
agg+cgg |
38 |
|
|
38 |
|
26 |
|
|
4 |
carre ccc |
41 |
17 |
|
59 |
16 |
28 |
|
|
5 |
autres |
14 |
14 |
|
28 |
|
9 |
|
|
|
|
148 |
72 |
17 |
238 |
|
43 |
|
|
- Lien tableur: bacilli, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 29.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
bac bacilli 32 génomes
bac1 cumul des +rRNAs de la fiche bacilli pour 32 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
20 |
a tct |
|
tat |
|
atgf |
91
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
63 |
b tcc |
30 |
tac |
56 |
tgc |
30
|
f atc |
92 |
j acc |
27 |
aac |
99 |
agc |
38
|
g ctc |
15 |
f ccc |
|
cac |
53 |
cgt |
82
|
h gtc |
3 |
n gcc |
1 |
gac |
106 |
ggc |
101
|
i tta |
59 |
c tca |
49 |
taa |
|
tga |
|
j ata |
|
k aca |
87 |
aaa |
84 |
aga |
1
|
k cta |
54 |
g cca |
77 |
caa |
69 |
cga |
|
l gta |
113 |
o gca |
122 |
gaa |
94 |
gga |
49
|
m ttg |
32 |
d tcg |
2 |
tag |
|
tgg |
42
|
n atgj |
32 |
l acg |
3 |
aag |
|
agg |
|
o ctg |
12 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
baci32 |
inter |
|
max |
|
min |
|
total
|
|
693 |
|
1171 |
|
25 |
|
1889
|
|
bac2 indices du clade bacilli du 29.5.20 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
618 |
0.2 |
0
|
a atgi |
146 |
a tct |
0.3 |
tat |
0.5 |
atgf |
285
|
b att |
0.2 |
i act |
11 |
aat |
0.5 |
agt |
|
c ctt |
47 |
e cct |
0.6 |
cat |
0.2 |
cgc |
0.2
|
d gtt |
0.2 |
m gct |
0.5 |
gat |
|
ggt |
|
e ttc |
272 |
b tcc |
120 |
tac |
239 |
tgc |
117
|
f atc |
310 |
j acc |
92 |
aac |
378 |
agc |
159
|
g ctc |
75 |
f ccc |
6.1 |
cac |
186 |
cgt |
288
|
h gtc |
53 |
n gcc |
30 |
gac |
386 |
ggc |
310
|
i tta |
211 |
c tca |
244 |
taa |
1.1 |
tga |
1.8
|
j ata |
2.1 |
k aca |
294 |
aaa |
340 |
aga |
119
|
k cta |
199 |
g cca |
243 |
caa |
299 |
cga |
6.3
|
l gta |
397 |
o gca |
443 |
gaa |
468 |
gga |
305
|
m ttg |
125 |
d tcg |
47 |
tag |
0.8 |
tgg |
137
|
n atgj |
152 |
l acg |
47 |
aag |
73 |
agg |
72
|
o ctg |
60 |
h ccg |
19 |
cag |
17 |
cgg |
109
|
p gtg |
0.8 |
p gcg |
8.6 |
gag |
16 |
ggg |
18
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2820 |
|
4504 |
|
660 |
|
7984
|
|
bac3 cumul des -rRNAs de l'annexe bacilli 7 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
5 |
a tct |
|
tat |
|
atgf |
7
|
b att |
|
i act |
2 |
aat |
|
agt |
|
c ctt |
5 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
9 |
b tcc |
3 |
tac |
11 |
tgc |
5
|
f atc |
4 |
j acc |
2 |
aac |
10 |
agc |
7
|
g ctc |
7 |
f ccc |
2 |
cac |
9 |
cgt |
4
|
h gtc |
5 |
n gcc |
3 |
gac |
12 |
ggc |
10
|
i tta |
5 |
c tca |
10 |
taa |
|
tga |
|
j ata |
1 |
k aca |
5 |
aaa |
8 |
aga |
8
|
k cta |
3 |
g cca |
5 |
caa |
14 |
cga |
2
|
l gta |
8 |
o gca |
2 |
gaa |
19 |
gga |
9
|
m ttg |
6 |
d tcg |
8 |
tag |
|
tgg |
7
|
n atgj |
6 |
l acg |
5 |
aag |
10 |
agg |
3
|
o ctg |
8 |
h ccg |
2 |
cag |
1 |
cgg |
8
|
p gtg |
|
p gcg |
|
gag |
2 |
ggg |
3
|
baci7 |
inter |
|
max |
|
min |
|
total
|
|
90 |
|
131 |
|
69 |
|
290
|
|
bac4 indices des +rRNAs de la fiche bacilli pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
63 |
a tct |
|
tat |
|
atgf |
284
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
197 |
b tcc |
94 |
tac |
175 |
tgc |
94
|
f atc |
288 |
j acc |
84 |
aac |
309 |
agc |
119
|
g ctc |
47 |
f ccc |
|
cac |
166 |
cgt |
256
|
h gtc |
9.4 |
n gcc |
3.1 |
gac |
331 |
ggc |
316
|
i tta |
184 |
c tca |
153 |
taa |
|
tga |
|
j ata |
|
k aca |
272 |
aaa |
263 |
aga |
3.1
|
k cta |
169 |
g cca |
241 |
caa |
216 |
cga |
2.0
|
l gta |
353 |
o gca |
381 |
gaa |
294 |
gga |
153
|
m ttg |
100 |
d tcg |
6.3 |
tag |
|
tgg |
131
|
n atgj |
100 |
l acg |
9.4 |
aag |
|
agg |
3.0
|
o ctg |
38 |
h ccg |
|
cag |
|
cgg |
8.0
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
3.1
|
baci32 |
inter |
|
max |
|
min |
|
total
|
|
2166 |
|
3659 |
|
78 |
|
5903
|
|
bac5 estimation des -rRNA du clade bacilli pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
84 |
a tct |
0.3 |
tat |
0.5 |
atgf |
1
|
b att |
0.2 |
i act |
11 |
aat |
0.5 |
agt |
|
c ctt |
47 |
e cct |
0.6 |
cat |
0.2 |
cgc |
0.2
|
d gtt |
0.2 |
m gct |
0.5 |
gat |
|
ggt |
|
e ttc |
75 |
b tcc |
26 |
tac |
64 |
tgc |
23
|
f atc |
23 |
j acc |
8 |
aac |
69 |
agc |
40
|
g ctc |
28 |
f ccc |
6.1 |
cac |
20 |
cgt |
32
|
h gtc |
44 |
n gcc |
27 |
gac |
55 |
ggc |
-6
|
i tta |
27 |
c tca |
91 |
taa |
1.1 |
tga |
1.8
|
j ata |
2.1 |
k aca |
22 |
aaa |
78 |
aga |
116
|
k cta |
30 |
g cca |
2.0 |
caa |
83 |
cga |
6.3
|
l gta |
44 |
o gca |
62 |
gaa |
174 |
gga |
152
|
m ttg |
25 |
d tcg |
41 |
tag |
0.8 |
tgg |
6.0
|
n atgj |
52 |
l acg |
38 |
aag |
73 |
agg |
72
|
o ctg |
23 |
h ccg |
19 |
cag |
17 |
cgg |
109
|
p gtg |
0.8 |
p gcg |
8.6 |
gag |
16 |
ggg |
15
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
654 |
|
845 |
|
582 |
|
2081
|
|
bac6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
71 |
a tct |
|
tat |
|
atgf |
100
|
b att |
|
i act |
29 |
aat |
|
agt |
|
c ctt |
71 |
e cct |
|
cat |
|
cgc |
0.2
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
129 |
b tcc |
43 |
tac |
157 |
tgc |
71
|
f atc |
57 |
j acc |
29 |
aac |
143 |
agc |
100
|
g ctc |
100 |
f ccc |
29 |
cac |
129 |
cgt |
57
|
h gtc |
71 |
n gcc |
43 |
gac |
171 |
ggc |
143
|
i tta |
71 |
c tca |
143 |
taa |
|
tga |
1.8
|
j ata |
14 |
k aca |
71 |
aaa |
114 |
aga |
114
|
k cta |
43 |
g cca |
71 |
caa |
200 |
cga |
29
|
l gta |
114 |
o gca |
29 |
gaa |
271 |
gga |
129
|
m ttg |
86 |
d tcg |
114 |
tag |
|
tgg |
100
|
n atgj |
86 |
l acg |
71 |
aag |
143 |
agg |
43
|
o ctg |
114 |
h ccg |
29 |
cag |
14 |
cgg |
114
|
p gtg |
|
p gcg |
|
gag |
29 |
ggg |
43
|
baci7 |
inter |
|
max |
|
min |
|
total
|
|
1286 |
|
1871 |
|
986 |
|
4143
|
|
bacilli, comparaison clade-annexe des -rRNAs
modifier
- Lien tableur: bacilli, comparaison clade-annexe des -rRNAs
- Légende
- - bac7. diff, somme des couleurs de bac7. La différence entre tRNAs est faite entre bac5 et bac6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - bac8. rap, rapport des sommes couleurs bac5/bac2. Le rapport -rRNA/total est celui du tRNA de bac5 sur celui de bac2.
- Fréquences des différences en % du tableau bac7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 0 2 3 1 9 6 5 9 5 3 6 1 50
tot ≤ 50 21
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 43% au dessus de celle de la fiche des bacilli.
tRNAs fiche annexe
sans 925 290
avec 1902 470
genomes 32 7
indice % 29 41
bac bacilli 32 génomes
bac7 bacilli, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
14 |
a tct |
100 |
tat |
100 |
atgf |
99
|
b att |
100 |
i act |
62 |
aat |
100 |
agt |
|
c ctt |
34 |
e cct |
100 |
cat |
100 |
cgc |
100
|
d gtt |
100 |
m gct |
100 |
gat |
|
ggt |
|
e ttc |
42 |
b tcc |
39 |
tac |
59 |
tgc |
67
|
f atc |
61 |
j acc |
73 |
aac |
52 |
agc |
60
|
g ctc |
72 |
f ccc |
79 |
cac |
84 |
cgt |
44
|
h gtc |
39 |
n gcc |
37 |
gac |
68 |
ggc |
104
|
i tta |
63 |
c tca |
36 |
taa |
100 |
tga |
100
|
j ata |
85 |
k aca |
69 |
aaa |
32 |
aga |
1
|
k cta |
29 |
g cca |
97 |
caa |
58 |
cga |
78
|
l gta |
62 |
o gca |
54 |
gaa |
36 |
gga |
15
|
m ttg |
71 |
d tcg |
64 |
tag |
100 |
tgg |
94
|
n atgj |
39 |
l acg |
47 |
aag |
49 |
agg |
40
|
o ctg |
80 |
h ccg |
34 |
cag |
16 |
cgg |
5
|
p gtg |
100 |
p gcg |
100 |
gag |
44 |
ggg |
65
|
diff |
inter |
|
max |
|
min |
|
total
|
|
867 |
|
838 |
|
850 |
|
2554
|
|
bac8 bacilli, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
57 |
a tct |
|
tat |
|
atgf |
0.2
|
b att |
|
i act |
100 |
aat |
|
agt |
|
c ctt |
100 |
e cct |
|
cat |
|
cgc |
100
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
28 |
b tcc |
22 |
tac |
27 |
tgc |
20
|
f atc |
7 |
j acc |
8 |
aac |
18 |
agc |
25
|
g ctc |
38 |
f ccc |
100 |
cac |
11 |
cgt |
11
|
h gtc |
82 |
n gcc |
90 |
gac |
14 |
ggc |
-2
|
i tta |
13 |
c tca |
37 |
taa |
|
tga |
100
|
j ata |
100 |
k aca |
8 |
aaa |
23 |
aga |
97
|
k cta |
15 |
g cca |
1 |
caa |
28 |
cga |
100
|
l gta |
11 |
o gca |
14 |
gaa |
37 |
gga |
50
|
m ttg |
20 |
d tcg |
87 |
tag |
|
tgg |
4
|
n atgj |
34 |
l acg |
80 |
aag |
100 |
agg |
100
|
o ctg |
38 |
h ccg |
100 |
cag |
100 |
cgg |
100
|
p gtg |
100 |
p gcg |
100 |
gag |
100 |
ggg |
83
|
rap |
inter |
|
max |
|
min |
|
total
|
|
23 |
|
19 |
|
88 |
|
26
|
|
Intergen51. Bacilli. Introduction
modifier
Intergen51. Bacilli. Historique des pré-études
modifier
total max1 reste max2 un
bsu 2512 582 13 1021 7511
lmo 1849 767 9 913 949
lam 1248 558 6 1100 1332
ppm 3176 1020 16 1614 2159
ppmp 438 1053 2 1137 1882
pmq 4540 1141 23 1613 1742
lbu 1098 755 5 1005 1054
ban 3289 721 16 1078 1152
bacilli données intercalaires 200
modifier
Intergen51. Bacilli. Vue de l'ensemble
modifier
Intergen51. Bacilli. La longueur totale des intercalaires d'un génome
modifier
- Note: Seul le plasmide ppmp sort de la médiane des 51 génomes qui est de 12.6%.
Nom intercalaires génome taux en %
bacilli
ban 749,857 5,321,900 14.1
bsu 434,723 4,215,606 10.3
lam 210,907 2,078,001 10.1
lbu 222,489 1,856,951 12.0
lmo 288,032 2,944,528 9.8
pmq 1,228,719 8,739,048 14.1
ppm 791,310 5,728,392 13.8
ppmp 119,608 510,118 23.4
Intergen51. Bacilli. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. bacilli les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note:
- - taux des R-: c-/c = 100*1/163 = 0.9 et x-/x = 100*0/108 = 0.
Int51.2 Bacilli les différents types d'intercalaires entre gène de 7 génomes
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
17 991 |
3 390 |
159 |
21 540 |
2,8 |
775 |
65 |
840
|
x |
7 403 |
164 |
12 |
7 579 |
|
1 |
27 |
28
|
t |
25 394 |
3 554 |
171 |
29 119 |
|
776 |
92 |
868
|
% |
87,2 |
12,2 |
0,6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
162 |
1 |
0 |
163 |
1,5 |
tRNA-CDS |
271 |
19
|
x |
108 |
0 |
0 |
108 |
|
RNA-RNA |
776 |
53
|
t |
270 |
1 |
0 |
271 |
|
CDS-rRNA |
92 |
6
|
% |
99,6 |
0,4 |
0,0 |
|
|
non RNA |
317 |
22
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
c |
5,4 |
8,0 |
1,4 |
26,3 |
2,5 |
56 |
0,7 |
0,0
|
x |
10,2 |
9,3 |
14,0 |
6,3 |
1,9 |
34 |
0,2 |
0,0
|
|
Intergen51. Bacilli. Détail des intercalaires RNA-RNA et CDS-rRNA
modifier
RNA-RNA c x CDS-RNA c x
23s5s 66 CDS 16s 44 16
16s23s 51 5s CDS 20 11
16stRNA 14 16 CDS
tRNA23s 16 CDS 5s
5stRNA 36 23s CDS
tRNAin 24 CDS 23s
tRNAcontig 391 5s 16s 1
tRNAhors 169 1 16s16s
tRNA16s 5
23stRNA 1
tRNA5s
16s5s 2
5s23s
5s5s
total 775 1 total 65 27
Intergen51. Bacilli. Les intercalaires rares
modifier
tRNA-CDS c-
ppmp -24
tRNAhors x+
lbu 151
5s16s c
bsu 183
16s 5s c
ppm 102
ppm 117
23stRNA c
ppm 131
tRNA16s c
ban 76
bsu 159
bsu 170
bsu 171
lmo 341
Intergen51. Bacilli. Les diagrammes des bacilli
modifier
Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS
modifier
Intergen51. Bacilli. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
- Lien aux données intercalaires.
- Diagrammes des bacilli: tbl présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1
R2 x3 x2 x c Inflexion poly3 x c
0,738 2,36E-06 -1,72E-03 2,68E-01 22,9 fx1 abscisse 254,5 170,3
0,857 -3,62E-06 2,91E-03 -8,14E-01 89,8 fc1 ordonnée 19,1 23,0
poly3/droite 18,6 23,4
0,901 1,48E-06 -1,13E-03 1,58E-01 27,7 fx41
0,979 1,37E-06 -7,00E-04 -2,94E-02 41,5 fc41 R2 f.1 x c
Poly 3 738 857
0,873 -0,097 43,3 fx41 Poly 6 812 915
0,935 -0,110 42,2 fc41 Poly 9 864 942
0,614 -0,082 39,2 fx1
0,687 -0,162 56,6 fc1
Intergen51. Bacilli. Les diagrammes CDS-CDS négatifs
modifier
Intergen51. Bacilli. comparaison avec la totale
modifier
- Lien aux données intercalaires.
- Comparaison avec la totale: bacilli et la totale sont comparables notamment le 4/2/1 des c-, égale à 2.6.
Sous-totaux bacilli totale
fréquence x- c- x- c-
-1 1 525 4 4140
-2 4 5 85 11
-3 0 2 3 12
-4 50 1371 717 10938
-5 0 1 5 19
sp6 109 1486 1642 8424
total 164 3390 2 456 23 544
reste 23 49 264 420
s6 22 4 361 41
s7 19 202 321 1438
s8 45 1231 696 6525
rappot s1-5
4/2/1 12,5 2,6 8,4 2,6
% / sp6
s6/sp6 20,2 0,3 22,0 0,5
s7/sp6 17,4 13,6 19,5 17,1
s8/sp6 41,3 82,8 42,4 77,5
reste/sp6 21,1 3,3 16,1 5,0
total s1-5 55 1904 814 15120
% / total
%s1-5 33,5 56,2 33,1 64,2
%sp6 66,5 43,8 66,9 35,8
Intergen51. Bacilli. Homogénéité des génomes
modifier
- Lien aux données intercalaires de chaque génome
- Homogénéité: Les 8 génomes sont homogènes dans l'ensemble, sauf lam et lbu qui se distinguent par leur rapport 4/1 inverse des autres, 0.5 et 0.7 contre 2.6 du total. Pour compenser ce rapport ppm et pmq se distinguent par le leur très élevé, 3.9 et 4.8 respectivement.
négatifs x bsu ban lam lbu lmo pmq ppm ppmp total
total 35 13 15 20 10 42 29 0 164
s1-5 14 3 8 6 3 14 7 55
sp6 21 10 7 14 7 28 22 109
rapport s1-5
4/2 - - - 4.0 - 3.7 - 12.5
% / sp6
s6 19 40 0 21 14 21 18 20
s7 29 20 14 0 43 14 14 17
s8 19 30 86 36 29 46 55 41
reste 33 10 0 43 14 18 14 21
% / total
s1-5 40 23 53 30 30 33 24 34
sp6 60 77 47 70 70 67 76 66
négatifs c bsu ban lam lbu lmo pmq ppm ppmp total
total 573 564 272 280 393 753 523 32 3390
s1-5 305 315 145 136 234 466 288 15 1904
sp6 268 249 127 144 159 287 235 17 1486
rapport s1-5
4/1 3.2 3.3 0.5 0.7 2.8 4.8 3.9 2.8 2.6
% / sp6
s6 0 0 0 1 0 0 0 6 0
s7 16 16 10 13 11 15 10 12 14
s8 78 84 90 86 84 79 86 71 83
reste 6 0 0 0 4 6 3 12 3
% / total
s1-5 53 56 53 49 60 62 55 47 56
sp6 47 44 47 51 40 38 45 53 44
Intergen51. Bacilli. Les grands négatifs inférieurs à -120
modifier
Intergen51. Bacilli. Les diagrammes CDS-rRNA
modifier
Intergen51. Bacilli. Les diagrammes CDS-16s
modifier
CDS16sc CDS16sx 5sCDSc 5sCDSx
0,542 - - -
353,9 499,7 232,9 146,9
210-540 270-720 60-480 30-300
40 15 19 11
91 94 95 100
4 1 1 0
9 6 5 0
0 0 0 0
0 0 0 0
390;7 540;2 180;4 60;3
44 16 20 11
30 30 30 30
Intergen51.bacilli. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
483,0 |
123,9 |
3,9 |
4x387:477 |
695 |
|
86,8 |
16,8
|
bsu |
349 |
|
|
349 |
|
|
220,8 |
-117,2
|
lam |
581,0 |
96,2 |
6,0 |
513 |
649 |
|
-11,2 |
114,8
|
lbu |
485,0 |
167,8 |
2,9 |
295 |
547:613 |
|
84,8 |
18,8
|
lmo |
|
|
|
|
|
|
|
|
pmq |
575,0 |
200,3 |
2,9 |
399 |
533:534 |
|
-5,2 |
108,8
|
ppm |
591,0 |
29,7 |
19,9 |
570 |
612 |
|
-21,2 |
124,8
|
ppmp |
|
|
|
|
|
|
|
|
total |
518,0 |
135,3 |
3,8 |
|
|
|
569,8 |
466,2
|
|
CDS16sc. continu
CDS16sc |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
270,2 |
65,0 |
4,2 |
3x218-241 |
295:373 |
|
159,0 |
-80,9
|
bsu |
298,3 |
44,3 |
6,7 |
243 |
291:309 |
350 |
130,9 |
-52,9
|
lam |
653,0 |
128,7 |
5,1 |
562 |
744 |
|
-223,9 |
301,9
|
lbu |
422,7 |
115,2 |
3,7 |
258:298 |
451 |
3x501-518 |
6,5 |
71,5
|
lmo |
378,6 |
69,1 |
5,5 |
289 |
344:354 |
445:451 |
50,6 |
27,5
|
pmq |
364,5 |
128,3 |
2,8 |
230:272 |
7x299-377 |
533:673 |
64,6 |
13,4
|
ppm |
443,4 |
85,8 |
5,2 |
6x323:422 |
4x445:536 |
607 |
-14,2 |
92,2
|
ppmp |
|
|
|
|
|
|
|
|
total |
390,1 |
123,2 |
3,2 |
|
|
|
429,2 |
351,1
|
|
Intergen51. Bacilli. Les diagrammes 5s-CDS
modifier
- Lien aux données intercalaires.
- Comparaison avec les tRNA-CDS
- - Les équations des polynômes de d°3
- fct f(X) = 5.93E-07 x3 –4.32E-04 x2 + 8.03E-02 x – 7.27E-02
- fxt f(x) = 1.63E-06 x3 – 1.11E-03 x2 + 1.98E-01 x – 2.83
- - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
bacilli ftc ftx 5sCDSc 5sCDSx
R2 0,662 0,427 - -
xs 121,9 125,2 232,9 146,9
plage 60-230 50-280 60-480 30-300
total-p 118 85 19 11
% 72 79 95 100
queue 35 19 1 0
% 21 18 5 0
tête 9 4 0 0
% 6 3 0 0
max 130;13 90;9 180;4 60;3
total7 163 108 20 11
freq 10 10 30 30
Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
- Lien tableur: Intergen51.bacilli. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
- Légende:
- - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
- - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
- - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
- + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
- + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
- + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
- + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
- + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
- - Les colonnes ft*-f* représentent la différence entre les 2 moyennes.
- - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
- Note: Sommes des différences ft*-f*, positives et négatives, dans les tableaux correspondants
ftc-fc 145,5
ftc-fc -42,1
ftx-fx 75,9
ftx-fx -271,8
Intergen51.bacilli Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
ban |
269,0 |
101,3 |
2,65 |
0 |
0 |
-68,3 |
104,8
|
bsu |
147,0 |
87,6 |
1,68 |
0 |
1 |
53,7 |
-17,2
|
lam |
119,6 |
56,2 |
2,13 |
1 |
0 |
81,1 |
-44,6
|
lbu |
175,0 |
120,1 |
1,46 |
1 |
1 |
25,7 |
10,8
|
lmo |
138,1 |
124,9 |
1,11 |
0 |
1 |
62,6 |
-26,1
|
pmq |
237,5 |
112,1 |
2,12 |
0 |
0 |
-36,7 |
73,2
|
ppm |
229,9 |
112,5 |
2,04 |
0 |
0 |
-29,2 |
65,7
|
ppmp |
99,8 |
11,7 |
8,50 |
2 |
1 |
101,0 |
-64,5
|
total |
182,5 |
111,1 |
1,64 |
|
++ |
200,7 |
164,2
|
|
5sCDSx. 5s-CDS discontinu
5sCDSx |
moyenne |
écart |
m/e |
intercalaires |
-
|
ban |
78,0 |
29,7 |
2,6 |
*'14:34 |
57:99 |
|
|
bsu |
36 |
|
|
*36 |
|
|
|
lam |
|
|
|
|
|
|
|
lbu |
242,5 |
48,8 |
5,0 |
208 |
277 |
|
|
lmo |
|
|
|
|
|
|
|
pmq |
296 |
|
|
296 |
|
|
|
ppm |
198,3 |
32,8 |
6,0 |
176:183 |
236 |
|
|
ppmp |
|
|
|
|
|
|
|
total |
191,5 |
82,3 |
2,3 |
++ |
210,7 |
172,4 |
-
|
|
ftc. tRNA-CDS continu
ftc |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
ban |
220,6 |
141,1 |
1,56 |
0 |
0 |
-23,1 |
59,0
|
bsu |
179,8 |
84,3 |
2,13 |
0 |
0 |
17,7 |
18,2
|
lam |
138,3 |
72,7 |
1,90 |
1 |
0 |
59,2 |
-23,3
|
lbu |
175,2 |
126,3 |
1,39 |
1 |
0 |
22,3 |
13,6
|
lmo |
172,6 |
112,2 |
1,54 |
1 |
0 |
24,8 |
11,1
|
pmq |
202,3 |
131,3 |
1,54 |
1 |
0 |
-4,9 |
40,8
|
ppm |
150,3 |
69,6 |
2,16 |
0 |
4 |
47,2 |
-11,3
|
ppmp |
231,7 |
156,4 |
1,48 |
2 |
1 |
-34,2 |
70,1
|
total |
179,5 |
115,3 |
1,56 |
|
++ |
197,5 |
161,6
|
|
5sCDSc. 5s-CDS continu
5sCDSc |
moyenne |
écart |
m/e |
intercalaires |
-
|
ban |
198,0 |
11,3 |
17,5 |
190 |
206 |
|
|
bsu |
393 |
325,4 |
1,2 |
175:237 |
767 |
|
|
lam |
|
|
|
|
|
|
|
lbu |
212,3 |
108,6 |
2,0 |
87 |
156 |
298:308 |
|
lmo |
139,0 |
12,7 |
10,9 |
130 |
148 |
|
|
pmq |
288,5 |
163,2 |
1,8 |
123:178 |
393:460 |
|
|
ppm |
267,4 |
92,0 |
2,9 |
163 |
216:232 |
343:383 |
|
ppmp |
|
|
|
|
|
|
|
total |
259,7 |
156,3 |
1,7 |
++ |
285,6 |
233,7 |
-
|
|
fx. CDS-CDS discontinu
fx |
moyenne |
écart |
m/e |
ftx-fx |
Sup 700 |
haut |
bas
|
ban |
205,6 |
138,6 |
1,5 |
63,4 |
25 |
18,7 |
22,1
|
bsu |
180,7 |
117,1 |
1,5 |
-33,7 |
4 |
43,6 |
-2,9
|
lam |
164,5 |
116,4 |
1,4 |
-44,8 |
2 |
59,8 |
-19,
|
lbu |
172,4 |
127,9 |
1,3 |
2,6 |
4 |
51,9 |
-11,1
|
lmo |
180,5 |
131,1 |
1,4 |
-42,4 |
4 |
43,8 |
-3,1
|
pmq |
227,6 |
129,1 |
1,8 |
9,9 |
72 |
-3,3 |
44,0
|
ppm |
212,2 |
133,2 |
1,6 |
17,8 |
26 |
12,1 |
28,6
|
ppmp |
250,7 |
160,8 |
1,6 |
-150,9 |
6 |
-26,4 |
67,1
|
total |
203,9 |
132,0 |
1,5 |
-21,4 |
++ |
224,3 |
183,5
|
|
fc. CDS-CDS continu
fc |
moyenne |
écart |
m/e |
ftc-fc |
Sup 700 |
haut |
bas
|
ban |
181,4 |
123,6 |
1,5 |
39,2 |
18 |
11,0 |
23,9
|
bsu |
141,8 |
94,4 |
1,5 |
37,9 |
7 |
50,6 |
-15,6
|
lam |
148,3 |
103,9 |
1,4 |
-10,0 |
3 |
44,2 |
-9,2
|
lbu |
166,8 |
117,2 |
1,4 |
8,3 |
9 |
25,6 |
9,4
|
lmo |
156,2 |
104,3 |
1,5 |
16,5 |
12 |
36,3 |
-1,3
|
pmq |
192,7 |
131,4 |
1,5 |
9,7 |
85 |
-0,2 |
35,2
|
ppm |
182,4 |
123,0 |
1,5 |
-32,1 |
57 |
10,0 |
25,0
|
ppmp |
197,8 |
138,7 |
1,4 |
33,9 |
19 |
-5,4 |
40,3
|
total |
174,9 |
121,1 |
1,4 |
4,6 |
++ |
192,4 |
157,4
|
|
Intergen51. Bacilli. Les CDS-rRNA rares
modifier
Intergen51. Bacilli. Les diagrammes RNA-RNA
modifier
Intergen51. Bacilli. Les diagrammes rRNA-rRNA
modifier
bacilli 16s23s 16stRNA tRNA23s 23s5s
R2 0,312 - - 0,845
xs 183,7 117,6 123,9 77,1
plage 140-300 100-140 80-200 40-180
total-p 48 14 16 66
% 94 100 100 100
queue 3 0 0 0
% 6 0 0 0
tête 0 0 0 0
% 0 0 0 0
max 280;13 140;6 140;7 80;26
total7 51 14 16 66
freq 20 20 20 20
Intergen51. Bacilli. Les diagrammes tRNA-rRNA
modifier
Intergen51.bacilli. Moyennes rRNA-RNA
16s23s.
16s23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
150,7 |
10,7 |
14,1 |
7x144-147 |
158:177 |
|
96,9 |
-51,9
|
bsu |
165,1 |
1,6 |
106,4 |
5x 164 |
3x 167 |
|
82,5 |
-37,5
|
lam |
203 |
|
|
2x 203 |
|
|
44,6 |
0,4
|
lbu |
217,3 |
0,5 |
434,5 |
3x 217 |
218 |
|
30,4 |
14,7
|
lmo |
244 |
|
|
4x 244 |
|
|
3,6 |
41,4
|
pmq |
269,4 |
5,6 |
48,4 |
259:263 |
10x266-272 |
2x280 |
-21,8 |
66,8
|
ppm |
278,0 |
82,5 |
3,4 |
6x217-231 |
290:353 |
2x410 |
-30,4 |
75,4
|
ppmp |
|
|
|
|
|
|
|
|
total |
225,1 |
63,2 |
3,6 |
|
|
|
247,6 |
202,6
|
|
23s5s.
23s5s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
66,5 |
24,5 |
2,7 |
7x48-50 |
86 |
2x100-101 |
27,8 |
-10,6
|
bsu |
68,4 |
28,7 |
2,4 |
8x 55 |
111 |
133 |
25,9 |
-8,8
|
lam |
69 |
|
|
4x 69 |
|
|
25,3 |
-8,2
|
lbu |
70,3 |
0,5 |
140,7 |
6x 70 |
3x 71 |
|
24,0 |
-6,8
|
lmo |
80,3 |
0,5 |
155,6 |
4x 80 |
2x 81 |
|
14,0 |
3,2
|
pmq |
122,9 |
34,9 |
3,5 |
8x96-97 |
113 |
5x161-170 |
-28,6 |
45,8
|
ppm |
94,2 |
30,5 |
3,1 |
9x77-78 |
3x144-145 |
|
0,1 |
17,0
|
ppmp |
|
|
|
|
|
|
|
|
total |
85,7 |
32,9 |
2,6 |
|
|
|
94,3 |
77,2
|
|
16stRNA.
16stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
132 |
|
|
2x 132 |
|
|
-2,7 |
26,2
|
bsu |
99 |
|
|
2x 99 |
|
|
30,3 |
-6,8
|
lam |
133 |
|
|
2x 133 |
|
|
-3,7 |
27,2
|
lbu |
113,2 |
0,4 |
253,1 |
4x 113 |
114 |
|
16,1 |
7,4
|
lmo |
127 |
|
|
2x 127 |
|
|
2,3 |
21,2
|
pmq |
|
|
|
|
|
|
|
|
ppm |
98 |
|
|
98 |
|
|
31,3 |
-7,8
|
ppmp |
|
|
|
|
|
|
|
|
total |
117,6 |
13,1 |
9,0 |
|
|
|
129,3 |
105,8
|
|
tRNA23s.
tRNA23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
79,5 |
0,7 |
112,4 |
79 |
80 |
|
56,8 |
-32,0
|
bsu |
81 |
|
|
2x 81 |
|
|
55,3 |
-30,5
|
lam |
118 |
|
|
2x 118 |
|
|
18,3 |
6,5
|
lbu |
127,2 |
0,4 |
284,4 |
4x 127 |
128 |
|
9,1 |
15,7
|
lmo |
172 |
|
|
2x 172 |
|
|
-35,7 |
60,5
|
pmq |
|
|
|
|
|
|
|
|
ppm |
148,3 |
32,6 |
4,5 |
129:130 |
186 |
|
-12,1 |
36,8
|
ppmp |
|
|
|
|
|
|
|
|
total |
123,9 |
33,0 |
3,8 |
|
|
|
136,3 |
111,5
|
|
Intergen51. Bacilli. Les diagrammes tRNA-tRNA
modifier
type c S40 % R2 diag total reste x+ restes 5stRNA hors contig HC HC
hors 145 86 0,901 145 169 4 151 82 157 138 101 157
contig 360 92 0,973 115 391 3 - 230 158 109 261
in 14 58 - 70 24 0 - 261 265 125 297
5stRNA 29 81 0,315 55 36 1 - 297 131
HC 115 87 0,959 95 132 7 -
Les pourcentages des tRNA-tRNA hors blocs
modifier
tRNA h bsu pmq ppm ppmp lmo lam lbu ban total %
20 8 14 12 5 4 12 33 3 91 68.4
40 4 1 5 1 5 11 1 28 21.1
60 0 1 2 1 4 3.0
80 1 1 0.8
100 1 1 2 1.5
120 0 2 1 3 2.3
140 0
160 1 1 0.8
240 1 1 0.8
260 1 1 0.8
restes 1 1 0.8
total 14 18 18 5 6 19 48 5 133 100
repete 0 2 0 0 0 1 1 0 4 11
séquence 0 0 0 0 0 0 1 0 1 3
sans 4 4 4 1 3 5 4 3 28 80
éclaté 0 0 0 1 0 0 1 0 2 6
clusters 4 6 4 2 3 6 7 3 35 100
5 4 1 4 2 1 4 16 1 33 24
10 2 6 7 3 2 7 7 0 34 25
15 2 2 1 0 1 1 8 2 17 12
20 0 5 0 0 0 0 2 0 7 5
Les pourcentages des tRNA-tRNA contigus aux blocs
modifier
tRNA cont bsu pmq ppm ppmp lmo lam lbu ban total %
20 35 108 13 26 25 13 9 72 301 77.4
40 11 12 3 1 11 3 3 8 52 13.4
60 3 4 1 6 5 19 4.9
80 1 1 2 4 1.0
100 2 2 4 1.0
120 2 2 4 1.0
140 2 1 3 0.8
160 1 1 0.3
180 0
200 0
220 0
240 0
260 0
restes 1 1 0.3
total 50 128 16 35 42 16 13 89 389 100
repete 0 0 0 0 0 0 0 0 0 0
séquence 0 0 0 0 0 0 0 0 0 0
sans 6 6 4 1 4 2 3 3 29 78
éclaté 0 3 1 1 0 0 0 3 8 22
clusters 6 9 5 2 4 2 3 6 37 100
5 10 29 5 14 7 5 6 26 102 26
10 13 29 4 10 9 4 2 22 93 24
15 9 30 3 2 6 3 0 8 61 16
20 3 20 1 0 3 1 1 16 45 12
Les moyennes des tRNA-tRNA par génome
modifier
Intergen51.bacilli. Moyennes tRNA-tRNA
5stRNA
5stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
7,6 |
3,5 |
2,2 |
2x4 |
2x9 |
12 |
17,7 |
-13,1
|
bsu |
21,6 |
14,4 |
1,5 |
9:13 |
2x20 |
46 |
3,7 |
0,9
|
lam |
10,8 |
4,5 |
2,4 |
4 |
3x13 |
|
14,5 |
-9,9
|
lbu |
16,7 |
16,7 |
1,0 |
2x7 |
36 |
|
8,6 |
-4,0
|
lmo |
13,5 |
0,6 |
23,4 |
2x13 |
2x14 |
|
11,8 |
-7,2
|
pmq |
33,9 |
21,8 |
1,6 |
3x9-15 |
31 |
5x43-55 |
-8,6 |
13,2
|
ppm |
38,2 |
23,8 |
1,6 |
2x18 |
3x34-39 |
82 |
-12,9 |
17,5
|
ppmp |
|
|
|
|
|
|
|
|
total |
23,0 |
18,2 |
1,3 |
|
|
|
25,3 |
20,7
|
|
tRNA contigu
tRNA cont |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
ban |
16,1 |
17,7 |
0,9 |
88 |
95 |
1 |
2,0 |
1,3
|
bsu |
16,8 |
14,0 |
1,2 |
50 |
98 |
|
1,3 |
2,0
|
lam |
11,6 |
8,6 |
1,3 |
16 |
100 |
|
6,6 |
-3,3
|
lbu |
12,1 |
13,1 |
0,9 |
13 |
92 |
1 |
6,0 |
-2,7
|
lmo |
18,8 |
13,6 |
1,4 |
42 |
100 |
|
-0,7 |
4,0
|
pmq |
15,4 |
15,8 |
1,0 |
128 |
97 |
1 |
2,7 |
0,6
|
ppm |
17,1 |
17,6 |
1,0 |
63 |
97 |
|
1,0 |
2,3
|
ppmp |
20,7 |
31,0 |
0,7 |
35 |
80 |
2 |
-2,5 |
5,8
|
total |
16,5 |
17,4 |
0,9 |
435 |
96 |
5 |
18,1 |
14,8
|
|
tRNA intra cluster
tRNA in |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
ban |
8 |
|
|
2x8 |
atc |
|
37,4 |
-29,1
|
bsu |
11 |
|
|
2x11 |
atc |
|
34,4 |
-26,1
|
lam |
52 |
|
|
2x52 |
atc |
|
-6,6 |
14,9
|
lbu |
69 |
|
|
5x69 |
atc |
|
-23,6 |
31,9
|
lmo |
46 |
|
|
2x46 |
atc |
|
-0,6 |
8,9
|
pmq |
|
|
|
|
|
|
|
|
ppm |
20 |
|
|
2x20 |
atc |
|
25,4 |
-17,1
|
ppmp |
|
|
|
|
|
|
|
|
total |
41,3 |
25,5 |
1,6 |
|
|
|
45,4 |
37,1
|
|
tRNA hors cluster
tRNA hors |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
ban |
17,8 |
14,8 |
1,2 |
6 |
83 |
1 |
2,2 |
1,4
|
bsu |
23,4 |
26,3 |
0,9 |
14 |
86 |
|
-3,4 |
7,1
|
lam |
24,6 |
33,0 |
0,7 |
19 |
89 |
|
-4,6 |
8,3
|
lbu |
16,4 |
18,3 |
0,9 |
48 |
96 |
1 |
3,6 |
0,0
|
lmo |
11,2 |
9,3 |
1,2 |
6 |
83 |
1 |
8,8 |
-5,2
|
pmq |
15,8 |
12,2 |
1,3 |
18 |
89 |
2 |
4,2 |
-0,6
|
ppm |
19,6 |
21,4 |
0,9 |
18 |
94 |
|
0,4 |
3,2
|
ppmp |
5,8 |
1,9 |
3,0 |
5 |
100 |
|
14,2 |
-10,6
|
total |
18,2 |
21,2 |
0,9 |
134 |
92 |
5 |
20,0 |
16,4
|
|
Intergen51. Bacilli. Les RNA-RNA rares
modifier