En raison de limitations techniques, la typographie souhaitable du titre, «
Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia », n'a pu être restituée correctement ci-dessus.
Tanger le 3.11.19
Paeniclostridium sordellii AM370
modifier
- Liens: gtRNAdb, NCBI [1], génome [2]
- Lien tableur: psor opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
- Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
- - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
C1 Paeniclostridium sordellii AM370
27.3%GC |
8.8.19 Paris |
112 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
9847..10620 |
CDS |
|
205 |
205 |
|
|
258 |
|
|
10826..12332 |
16s |
|
196 |
|
|
|
|
|
|
12529..15445 |
23s |
|
78 |
|
|
|
|
|
|
15524..15640 |
5s |
|
85 |
85 |
|
|
|
85
|
|
15726..15947 |
CDS |
|
|
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
18845..19297 |
CDS |
|
3 |
3 |
|
|
151 |
3
|
|
19301..19393 |
tcc |
|
27 |
|
|
|
|
|
|
19421..19685 |
ncRNA |
|
152 |
152 |
|
|
|
|
|
19838..21478 |
CDS |
|
|
|
|
|
*547 |
|
|
|
|
|
|
|
|
|
|
|
24343..24570 |
CDS |
|
309 |
309 |
|
|
76 |
|
|
24880..26386 |
16s |
|
196 |
|
|
|
|
|
|
26583..29499 |
23s |
|
122 |
|
|
|
|
|
|
29622..29738 |
5s |
|
5 |
|
|
5 |
|
|
|
29744..29832 |
tta |
+ |
13 |
|
|
13 |
|
|
|
29846..29921 |
atgf |
3 aaa |
15 |
|
|
15 |
|
|
|
29937..30011 |
gaa |
6 atg |
9 |
|
|
9 |
|
|
|
30021..30094 |
gga |
3 gta |
6 |
|
|
6 |
|
|
|
30101..30176 |
gta |
1 cgt |
5 |
|
|
5 |
|
|
|
30182..30258 |
gac |
1 ggc |
16 |
|
|
16 |
|
|
|
30275..30350 |
aac |
2 fois suite |
4 |
|
|
4 |
|
|
|
30355..30429 |
aca |
aac aca aga |
4 |
|
|
4 |
|
|
|
30434..30518 |
tac |
caa cac cca |
15 |
|
|
15 |
|
|
|
30534..30617 |
cta |
cta gaa gac |
14 |
|
|
14 |
|
|
|
30632..30708 |
aga |
gga tac tca |
7 |
|
|
7 |
|
|
|
30716..30791 |
caa |
tgc tta ttc |
11 |
|
|
11 |
|
|
|
30803..30878 |
aaa |
|
6 |
|
|
6 |
|
|
|
30885..30973 |
tca |
|
3 |
|
|
3 |
|
|
|
30977..31052 |
ttc |
|
9 |
|
|
9 |
|
|
|
31062..31138 |
atgj |
|
8 |
|
|
8 |
|
|
|
31147..31223 |
atgi |
|
21 |
|
|
21 |
|
|
|
31245..31321 |
cca |
|
6 |
|
|
6 |
|
|
|
31328..31404 |
cac |
|
4 |
|
|
4 |
|
|
|
31409..31482 |
tgc |
|
25 |
|
|
25 |
|
|
|
31508..31596 |
tta |
|
13 |
|
|
13 |
|
|
|
31610..31685 |
atgf |
|
15 |
|
|
15 |
|
|
|
31701..31775 |
gaa |
|
9 |
|
|
9 |
|
|
|
31785..31858 |
gga |
|
6 |
|
|
6 |
|
|
|
31865..31940 |
gta |
|
5 |
|
|
5 |
|
|
|
31946..32022 |
gac |
|
16 |
|
|
16 |
|
|
|
32039..32114 |
aac |
|
4 |
|
|
4 |
|
|
|
32119..32193 |
aca |
|
4 |
|
|
4 |
|
|
|
32198..32282 |
tac |
|
15 |
|
|
15 |
|
|
|
32298..32381 |
cta |
|
11 |
|
|
11 |
|
|
|
32393..32467 |
ggc |
|
13 |
|
|
13 |
|
|
|
32481..32557 |
aga |
|
7 |
|
|
7 |
|
|
|
32565..32640 |
caa |
|
11 |
|
|
11 |
|
|
|
32652..32727 |
aaa |
|
6 |
|
|
6 |
|
|
|
32734..32822 |
tca |
|
3 |
|
|
3 |
|
|
|
32826..32901 |
ttc |
|
9 |
|
|
9 |
|
|
|
32911..32987 |
atgj |
|
8 |
|
|
8 |
|
|
|
32996..33072 |
atgi |
|
21 |
|
|
21 |
|
|
|
33094..33170 |
cca |
|
6 |
|
|
6 |
|
|
|
33177..33253 |
cac |
|
9 |
|
|
9 |
|
|
|
33263..33338 |
aaa |
|
21 |
|
|
21 |
|
|
|
33360..33433 |
tgc |
|
6 |
|
|
6 |
|
|
|
33440..33516 |
cgt |
|
10 |
|
|
|
|
|
|
33527..33602 |
gta |
|
162 |
162 |
|
|
|
162
|
|
33765..34016 |
CDS |
|
|
|
|
|
84 |
|
|
|
|
|
|
|
|
|
|
|
34042..34455 |
CDS |
|
249 |
249 |
|
|
138 |
|
|
34705..36211 |
16s |
|
196 |
|
|
|
|
|
|
36408..39324 |
23s |
|
78 |
|
|
|
|
|
|
39403..39519 |
5s |
|
402 |
*402 |
|
|
|
|
comp |
39922..40113 |
CDS |
|
348 |
348 |
|
|
64 |
|
|
40462..41968 |
16s |
|
196 |
|
|
|
|
|
|
42165..45081 |
23s |
|
78 |
|
|
|
|
|
|
45160..45276 |
5s |
|
180 |
180 |
|
|
|
*180
|
|
45457..47394 |
CDS |
|
|
|
|
|
*646 |
|
|
|
|
|
|
|
|
|
|
|
101428..102144 |
CDS |
|
276 |
276 |
|
|
239 |
|
|
102421..103927 |
16s |
|
54 |
|
|
|
|
|
|
103982..104057 |
gca |
|
114 |
|
|
|
|
|
|
104172..107096 |
23s |
|
41 |
|
|
|
|
|
|
107138..107211 |
gga |
|
11 |
|
|
|
|
|
|
107223..107339 |
5s |
|
99 |
99 |
|
|
|
99
|
comp |
107439..108617 |
CDS |
|
|
|
|
|
393 |
|
|
|
|
|
|
|
|
|
|
|
111345..111884 |
CDS |
|
431 |
*431 |
|
|
180 |
|
|
112316..113822 |
16s |
|
54 |
|
|
|
|
|
|
113877..113952 |
gca |
|
114 |
|
|
|
|
|
|
114067..116982 |
23s |
|
193 |
|
|
|
|
|
|
117176..117292 |
5s |
|
5 |
|
|
|
|
|
|
117298..117386 |
tta |
|
9 |
|
|
9 |
|
|
|
117396..117472 |
atgi |
|
123 |
|
|
|
|
|
|
117596..119102 |
16s |
|
54 |
|
|
|
|
|
|
119157..119232 |
gca |
|
114 |
|
|
|
|
|
|
119347..122263 |
23s |
|
193 |
|
|
|
|
|
|
122457..122573 |
5s |
|
5 |
|
|
|
|
|
|
122579..122667 |
tta |
|
9 |
|
|
9 |
|
|
|
122677..122753 |
atgi |
|
123 |
|
|
|
|
|
|
122877..124383 |
16s |
|
54 |
|
|
|
|
|
|
124438..124513 |
gca |
|
114 |
|
|
|
|
|
|
124628..127549 |
23s |
|
78 |
|
|
|
|
|
|
127628..127744 |
5s |
|
100 |
100 |
|
|
|
100
|
|
127845..129260 |
CDS |
|
|
|
|
|
472 |
|
|
|
|
|
|
|
|
|
|
|
215388..216260 |
CDS |
|
264 |
264 |
|
|
291 |
|
|
216525..218030 |
16s |
|
123 |
|
|
|
|
|
|
218154..218229 |
gca |
|
152 |
|
|
|
|
|
|
218382..221296 |
23s |
|
50 |
|
|
|
|
|
|
221347..221420 |
gga |
|
12 |
|
|
|
|
|
|
221433..221549 |
5s |
|
109 |
109 |
|
|
|
109
|
|
221659..221940 |
CDS |
|
525 |
*525 |
|
|
94 |
|
|
222466..223972 |
16s |
|
196 |
|
|
|
|
|
|
224169..227083 |
23s |
|
144 |
|
|
|
|
|
|
227228..227344 |
5s |
|
228 |
228 |
|
|
|
*228
|
|
227573..227989 |
CDS |
|
|
|
|
|
139 |
|
|
|
|
|
|
|
|
|
|
|
449964..450266 |
CDS |
|
253 |
253 |
|
|
101 |
|
|
450520..452026 |
16s |
|
196 |
|
|
|
|
|
|
452223..455139 |
23s |
|
144 |
|
|
|
|
|
|
455284..455400 |
5s |
|
112 |
112 |
|
|
|
112
|
comp |
455513..456616 |
CDS |
|
|
|
|
|
368 |
|
|
|
|
|
|
|
|
|
|
|
498418..499074 |
CDS |
|
189 |
189 |
|
|
219 |
|
|
499264..500770 |
16s |
|
118 |
|
|
|
|
|
|
500889..500964 |
gca |
|
95 |
|
|
|
|
|
|
501060..503976 |
23s |
|
144 |
|
|
|
|
|
|
504121..504237 |
5s |
|
131 |
131 |
|
|
|
131
|
|
504369..504551 |
CDS |
|
|
|
|
|
61 |
|
|
|
|
|
|
|
|
|
|
|
546886..550416 |
CDS |
|
41 |
41 |
|
|
*1177 |
*41
|
comp |
550458..550544 |
ttg |
|
138 |
138 |
|
|
|
|
|
550683..553325 |
CDS |
|
|
|
|
|
*881 |
|
|
|
|
|
|
|
|
|
|
|
608009..608683 |
CDS |
|
195 |
195 |
|
|
225 |
|
|
608879..608975 |
tga |
|
37 |
37 |
|
|
|
37
|
comp |
609013..609732 |
CDS |
|
|
|
|
|
240 |
|
|
|
|
|
|
|
|
|
|
|
815939..816655 |
CDS |
|
71 |
71 |
|
|
239 |
71
|
|
816727..816800 |
tgc |
|
12 |
|
12 |
|
|
|
|
816813..816888 |
aac |
|
3 |
|
3 |
|
|
|
|
816892..816966 |
aca |
|
285 |
285 |
|
|
|
|
|
817252..818727 |
CDS |
|
|
|
|
|
492 |
|
|
|
|
|
|
|
|
|
|
|
1284870..1288097 |
CDS |
|
111 |
111 |
|
|
*1076 |
*111
|
|
1288209..1288297 |
cta |
|
426 |
*426 |
|
|
|
|
|
1288724..1290853 |
CDS |
|
|
|
|
|
*710 |
|
|
|
|
|
|
|
|
|
|
|
1445161..1445664 |
CDS |
|
135 |
135 |
|
|
168 |
135
|
|
1445800..1445868 |
other |
@1 |
258 |
258 |
|
|
|
|
|
1446127..1446813 |
CDS |
|
|
|
|
|
229 |
|
|
|
|
|
|
|
|
|
|
|
2267513..2267698 |
CDS |
@2 |
306 |
306 |
|
|
62 |
*306
|
comp |
2268005..2268088 |
cta |
|
404 |
*404 |
|
|
|
|
|
2268493..2269758 |
CDS |
|
|
|
|
|
422 |
|
|
|
|
|
|
|
|
|
|
|
3094098..3094784 |
CDS |
|
40 |
40 |
|
|
229 |
40
|
comp |
3094825..3094941 |
5s |
|
78 |
|
|
|
|
|
comp |
3095020..3097936 |
23s |
|
194 |
|
|
|
|
|
comp |
3098131..3099637 |
16s |
|
276 |
276 |
|
|
|
|
comp |
3099914..3101161 |
CDS |
|
|
|
|
|
416 |
|
|
|
|
|
|
|
|
|
|
|
3159922..3160827 |
CDS |
|
37 |
37 |
|
|
302 |
37
|
comp |
3160865..3160956 |
agc |
|
120 |
120 |
|
|
|
|
comp |
3161077..3161376 |
CDS |
|
|
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
comp |
3274188..3274733 |
CDS |
|
245 |
245 |
|
|
182 |
*245
|
comp |
3274979..3275095 |
5s |
@3 |
12 |
|
|
|
|
|
comp |
3275108..3275181 |
gga |
|
107 |
|
|
|
|
|
comp |
3275289..3278214 |
23s |
|
137 |
|
|
|
|
|
comp |
3278352..3279858 |
16s |
|
253 |
253 |
|
|
|
|
comp |
3280112..3280690 |
CDS |
|
|
|
|
|
193 |
|
|
|
|
|
|
|
|
|
|
comp |
3303104..3304150 |
CDS |
|
124 |
124 |
|
|
349 |
124
|
comp |
3304275..3304459 |
riboswitch |
@4 |
96 |
|
|
|
|
|
comp |
3304556..3304672 |
5s |
|
11 |
|
|
|
|
|
comp |
3304684..3304758 |
aca |
|
116 |
|
|
|
|
|
comp |
3304875..3307789 |
23s |
|
196 |
|
|
|
|
|
comp |
3307986..3309492 |
16s |
|
364 |
*364 |
|
|
|
|
|
3309857..3310504 |
CDS |
|
|
|
|
|
216 |
|
|
|
|
|
|
|
|
|
|
comp |
3438683..3439531 |
CDS |
|
142 |
142 |
|
|
283 |
142
|
comp |
3439674..3439750 |
aga |
|
7 |
|
|
7 |
|
|
comp |
3439758..3439832 |
ggc |
|
9 |
|
|
9 |
|
|
comp |
3439842..3439918 |
gac |
|
5 |
|
|
5 |
|
|
comp |
3439924..3439999 |
gta |
|
8 |
|
|
8 |
|
|
comp |
3440008..3440082 |
gaa |
|
5 |
|
|
|
|
|
comp |
3440088..3440204 |
5s |
|
40 |
|
|
|
|
|
comp |
3440245..3443168 |
23s |
|
112 |
|
|
|
|
|
comp |
3443281..3443356 |
gca |
|
109 |
|
|
|
|
|
comp |
3443466..3444972 |
16s |
|
138 |
|
|
|
|
|
comp |
3445111..3445187 |
atgj |
+ |
13 |
|
|
13 |
|
|
comp |
3445201..3445276 |
ttc |
3 atg |
6 |
|
|
6 |
|
|
comp |
3445283..3445359 |
atc |
2 cca |
6 |
|
|
6 |
|
|
comp |
3445366..3445442 |
cca |
2 gga |
31 |
|
|
31 |
|
|
comp |
3445474..3445549 |
tgg |
2 aac |
11 |
|
|
11 |
|
|
comp |
3445561..3445637 |
atgi |
|
6 |
|
|
6 |
|
|
comp |
3445644..3445720 |
cca |
|
6 |
|
|
6 |
|
|
comp |
3445727..3445817 |
agc |
|
11 |
|
|
11 |
|
|
comp |
3445829..3445917 |
tca |
|
6 |
|
|
6 |
|
|
comp |
3445924..3445999 |
aaa |
|
12 |
|
|
12 |
|
|
comp |
3446012..3446087 |
caa |
|
6 |
|
|
6 |
|
|
comp |
3446094..3446170 |
aga |
|
19 |
|
|
19 |
|
|
comp |
3446190..3446263 |
gga |
|
11 |
|
|
11 |
|
|
comp |
3446275..3446359 |
tac |
|
4 |
|
|
4 |
|
|
comp |
3446364..3446438 |
aca |
|
4 |
|
|
4 |
|
|
comp |
3446443..3446518 |
aac |
|
31 |
|
|
31 |
|
|
comp |
3446550..3446625 |
aac |
|
16 |
|
|
16 |
|
|
comp |
3446642..3446718 |
gac |
|
5 |
|
|
5 |
|
|
comp |
3446724..3446799 |
gta |
|
6 |
|
|
6 |
|
|
comp |
3446806..3446879 |
gga |
|
9 |
|
|
9 |
|
|
comp |
3446889..3446963 |
gaa |
|
15 |
|
|
15 |
|
|
comp |
3446979..3447054 |
atgf |
|
13 |
|
|
13 |
|
|
comp |
3447068..3447156 |
tta |
|
5 |
|
|
|
|
|
comp |
3447162..3447278 |
5s |
|
213 |
|
|
|
|
|
comp |
3447492..3450406 |
23s |
|
196 |
|
|
|
|
|
comp |
3450603..3452109 |
16s |
|
239 |
239 |
|
|
|
|
comp |
3452349..3452552 |
CDS |
|
|
|
|
|
68 |
|
|
|
|
|
|
|
|
|
|
comp |
3523330..3524046 |
CDS |
|
129 |
129 |
|
|
239 |
129
|
comp |
3524176..3524251 |
gta |
+ |
8 |
|
8 |
|
|
|
comp |
3524260..3524334 |
gaa |
2 fois |
20 |
|
20 |
|
|
|
comp |
3524355..3524430 |
aaa |
gta gaa aaa |
10 |
|
10 |
|
|
|
comp |
3524441..3524515 |
aca |
|
10 |
|
10 |
|
|
|
comp |
3524526..3524602 |
gac |
|
7 |
|
7 |
|
|
|
comp |
3524610..3524685 |
gta |
|
9 |
|
9 |
|
|
|
comp |
3524695..3524769 |
gaa |
|
5 |
|
5 |
|
|
|
comp |
3524775..3524850 |
aaa |
|
289 |
289 |
|
|
|
|
|
3525140..3526039 |
CDS |
|
|
|
|
|
300 |
|
cumuls. Paeniclostridium sordellii AM370
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
17 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
100 |
9
|
|
16 23 5s 0 |
6 |
20 |
9 |
65 |
50 |
5 |
20 |
1 |
200 |
8
|
|
16 atc gca |
0 |
40 |
0 |
6 |
100 |
4 |
40 |
3 |
300 |
13
|
|
16 23 5s a |
2 |
60 |
0 |
0 |
150 |
10 |
60 |
1 |
400 |
4
|
|
max a |
44 |
80 |
0 |
0 |
200 |
5 |
80 |
1 |
500 |
4
|
|
a doubles |
2 |
100 |
0 |
0 |
250 |
5 |
100 |
3 |
600 |
1
|
|
autres |
9 |
120 |
0 |
0 |
300 |
8 |
120 |
3 |
700 |
1
|
|
total aas |
87 |
140 |
0 |
0 |
350 |
3 |
140 |
4 |
800 |
1
|
sans |
opérons |
8 |
160 |
0 |
0 |
400 |
1 |
160 |
1 |
900 |
1
|
|
1 aa |
6 |
180 |
0 |
0 |
450 |
4 |
180 |
2 |
1000 |
0
|
|
max a |
8 |
200 |
0 |
0 |
500 |
0 |
200 |
0 |
1100 |
1
|
|
a doubles |
1 |
|
0 |
0 |
|
1 |
|
3 |
|
1
|
|
total aas |
17 |
|
9 |
71 |
|
46 |
|
22 |
|
44
|
total aas |
|
104 |
|
|
|
|
|
|
|
|
|
remarques |
|
4 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
9 |
10 |
|
206 |
|
119 |
|
304
|
|
|
|
variance |
5 |
6 |
|
121 |
|
73 |
|
257
|
sans jaune |
|
|
moyenne |
|
|
|
173 |
|
95 |
|
220
|
|
|
|
variance |
|
|
|
90 |
|
45 |
|
121
|
- Note: intercalaires prélevés de la colonne cds de psor opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
psor 89 44 44 89
deb fin deb fin grand petit grand petit
3 27 3 27 27 3 27 3
37 120 195 37 120 37 120 37
41 138 37 120 138 41 195 37
71 285 41 138 195 37 138 41
111 426 135 258 258 135 285 71
129 289 71 285 285 71 426 111
135 258 129 289 289 129 289 129
195 37 306 404 404 306 258 135
306 404 111 426 426 111 404 306
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
psor 3,368 18 12 4 2 8 4 4 8
‰ 667 222 111 889 444 444 889
- Lien tableur: psor blocs
- Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
- Légende:
- - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
- - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
- - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
- Notes:
- - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
- - 10 blocs 16s23s contre 7 blocs 16sgca23s
- - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
- - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
- - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
- - Des intercalaires très faibles inter blocs
- - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
- - note du 25.3.21, 348' pour complement à cheval sur 2 adresses 348' et souligné pour dire que le cds est partagé entre 2 blocs.
intercalaire Total
16s-23s 9*196 137 10
23s-5s 5*78 4*144 3*193 40 13
16s-gca 4*54 3*120 7
gca-23s 5*114 95 152 7
5s-aas 4*5 (tta) 5 (gaa) 5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I |
|
I2 |
I3 |
I4 |
|
|
II |
|
III |
|
IV |
IV1 |
IV2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CDS |
124 |
|
|
|
|
|
|
|
|
|
|
CDS |
245 |
ribosw |
96 |
|
|
|
CDS |
205 |
249 |
348' |
525 |
253 |
40' |
5s |
12 |
5s |
11 |
CDS |
309 |
5
|
16s |
196 |
196 |
196 |
196 |
196 |
78 |
gga |
107 |
aca |
116 |
16s |
196 |
213
|
23s |
78 |
78 |
78 |
144 |
144 |
194 |
23s |
137 |
23s |
196 |
23s |
122 |
196
|
5s |
85 |
402' |
180 |
228 |
112' |
276 |
16s |
253 |
16s |
364' |
5s |
5 |
239
|
CDS |
|
|
|
|
|
|
CDS |
|
CDS |
|
tta |
|
|
V |
|
V2 |
VI |
VI1 |
VII |
VII1 |
VIII |
VIII1 |
IX |
|
X |
X1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CDS |
276 |
264 |
CDS |
431 |
|
|
|
|
CDS |
189 |
gaa |
5 |
|
16s |
54 |
123 |
16s |
54 |
16s |
54 |
16s |
54 |
16s |
118 |
5s |
40 |
|
gca |
114 |
152 |
gca |
114 |
gca |
114 |
gca |
114 |
gca |
95 |
23s |
112 |
|
23s |
41 |
50 |
23s |
193 |
23s |
193 |
23s |
78 |
23s |
144 |
gca |
109 |
|
gga |
11 |
12 |
5s |
5 |
5s |
5 |
5s |
100 |
5s |
131 |
16s |
138 |
|
5s |
99' |
109 |
tta |
9 |
tta |
9 |
CDS |
|
CDS |
|
atgj |
|
|
CDS |
|
|
atgi |
123 |
atgi |
123 |
|
|
|
|
|
|
|
groupe1 |
groupe2 |
groupe3 |
groupe4 |
|
|
|
CDS |
431 |
|
CDS |
309 |
|
CDS |
142 |
|
CDS |
264 |
|
|
VI1 |
16s |
54 |
IV1 |
16s |
196 |
|
**4aas |
8 |
V2 |
16s |
123 |
|
|
|
gca |
114 |
|
23s |
122 |
|
gaa |
5 |
|
gca |
152 |
|
|
|
23s |
193 |
|
5s |
5 |
|
5s |
40 |
|
23s |
50 |
|
|
|
5s |
5 |
|
tta |
13 |
|
23s |
112 |
|
gga |
12 |
|
|
|
tta |
9 |
|
**42aas |
10 |
|
gca |
109 |
|
5s |
109 |
|
|
|
atgi |
123 |
|
gta |
162 |
X1 |
16s |
138 |
|
CDS |
525 |
|
|
VII1 |
16s |
54 |
|
CDS |
25 |
|
atgj |
13 |
I4 |
16s |
196 |
|
|
|
gca |
114 |
|
CDS |
249 |
|
**21aas |
13 |
|
23s |
144 |
|
|
|
23s |
193 |
I2 |
16s |
196 |
|
tta |
5 |
|
5s |
228 |
|
|
|
5s |
5 |
|
23s |
78 |
|
5s |
213 |
|
CDS |
|
|
|
|
tta |
9 |
|
5s |
402 |
|
23s |
196 |
|
|
|
|
|
|
atgi |
123 |
|
CDS |
348 |
IV2 |
16s |
239 |
|
|
|
|
|
VIII1 |
16s |
54 |
I3 |
16s |
196 |
|
CDS |
|
|
|
|
|
|
|
gca |
114 |
|
23s |
78 |
|
|
|
|
|
|
|
|
|
23s |
78 |
|
5s |
180 |
|
|
|
|
|
|
|
|
|
5s |
100 |
|
CDS |
|
|
|
|
|
|
|
|
|
|
CDS |
|
|
|
|
|
|
|
|
|
|
|
|
- Lien tableur: psor remarques
- Nombre de gènes protéines: 3327 (NCBI)
- Rmarques @:
- - Un tRNA nommé other, non déterminé
- - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
- - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
- - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
- Configuration des blocs: voir psor blocs.
- Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
- - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
- - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
- - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
- - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca agc cca atg tgg cca atc ttc atg
44aas tta atg gaa gga gta gac aac aca tac cta aga caa aaa tca ttc atg atg cca cac - - - -
- Lien tableur: psor distribution
- Notes: tableau Cl12 blocs à de 3 tRNAs sauf
- - -5s: 3 gga et aca
- - 1-3 aas: 2 tta et 2 atgi
Cl1 psor, Paeniclostridium sordellii AM370. clostridia.
Cl11 psor. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
1
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
1 |
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
1
|
j ata |
|
k aca |
2 |
aaa |
2 |
aga |
|
k cta |
2 |
g cca |
|
caa |
|
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
psor |
12 |
5* |
|
|
|
|
17
|
|
Cl12 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
5 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
4 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
5 |
c tca |
3 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
4 |
aga |
4
|
k cta |
2 |
g cca |
4 |
caa |
4 |
cga |
|
l gta |
5 |
o gca |
7 |
gaa |
4 |
gga |
7
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
psor |
|
|
4* |
76* |
|
7 |
87
|
|
- psor Le prélèvement: Aclostridia
- Le nom et le lien NCBI: psor, Paeniclostridium sordellii strain AM370 chromosome, NCBI [3], date 8.1.18.
- psor La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
psor 450,598 3,550,458 12.7
Intergen51. psor. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. psor les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 psor les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,327 |
235 |
23 |
2,585 |
3.7 |
133 |
18 |
151
|
x |
692 |
3 |
1 |
696 |
|
0 |
7 |
7
|
t |
3,019 |
238 |
24 |
3,281 |
|
133 |
25 |
158
|
% |
92.0 |
7.3 |
0.7 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
12 |
0 |
0 |
12 |
1.7 |
tRNA-CDS |
19 |
8
|
x |
7 |
0 |
0 |
7 |
|
RNA-RNA |
133 |
59
|
t |
19 |
0 |
0 |
19 |
|
CDS-rRNA |
25 |
11
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
49 |
22
|
- |
|
|
|
|
|
total |
226 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
5.6 |
8.3 |
0.4 |
32.0 |
8.3 |
33 |
0.9 |
0.0
|
x |
9.1 |
14.3 |
33.3 |
9.5 |
0.0 |
33 |
0.1 |
0.0
|
|
Intergen51. psor. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: psor données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées psor fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. psor fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 psor
R2 x3 x2 x c Inflexion poly3 x c
0.515 5.62E-07 -4.32E-04 -9.67E-03 39.1 fx1 abscisse 210.1 219.5
0.718 -5.50E-06 4.12E-03 -1.07E+00 103.0 fc1 ordonnée 22.1 16.3
0.636 -1.22E-06 7.69E-04 -2.40E-01 49.9 fx41
0.926 3.28E-06 -2.16E-03 3.12E-01 17.2 fc41
- Le rfin après 400 est de 131 sur un total de 2350. Jusqu'à 1% les freq10 sont en continu jusqu'à 740, reste 23. L'indice i.rfin1 = 108/340 = 0.318.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données psor calculs poly3 psor
effect 2350 R2.21 851 abscis 400
xm 45 pte 4,01 flexa 216
ym 3,99 cste 1,88 flexo 1,62
x1m 219 r400l 181 xm 45
y1m 1 restp 170,21 sup4 192,3
rfin 55,74 %sd 50,40 sup4t 448,9
bornf 180 lond 174 % 42,8
supd 227,4 %sf 51,45 long 171
supdt 451,1 lonf 135 R2 621
xmp 378,72 sf/lf 1,47
r400 114,47 sr/lr 0,75
supf 197,9 sd/ld 1,31
supft 384,7 i.r400 0,63
Intergen51. psor. Les CDS-CDS négatifs
modifier
Sous-totaux psor totale
fréquence x- c- x- c-
- 1 0 52 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 1 23 717 10938
- 5 0 3 5 19
sp6 2 157 1642 8424
total 3 235 2,456 23,544
reste 1 1 264 420
s6 0 0 361 41
s7 0 27 321 1438
s8 1 129 696 6525
rappot s1-5
4/2/1 - 0.4 8.4 2.6
% / sp6
s6/sp6 0.0 0.0 22.0 0.5
s7/sp6 0.0 17.2 19.5 17.1
s8/sp6 50.0 82.2 42.4 77.5
reste/sp6 50.0 0.6 16.1 5.0
total s1-5 1 78 814 15120
% / total
%s1-5 33.3 33.2 33.1 64.2
%sp6 66.7 66.8 66.9 35.8
Intergen51. psor. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 13 CDS 16s 11 3
16s 23s 10 5s CDS 7 4
16s tRNA 7 16 CDS
tRNA 23s 7 CDS 5s
5s tRNA 5 23s CDS
tRNA in 2 CDS 23s
tRNA contig 69 5s 16s
tRNA hors 9 16s16s
tRNA 16s 3
23s tRNA 4
tRNA 5s 4
16s 5s
5s 23s
5s 5s
total 133 0 total 18 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 psor. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3 |
|
|
cont4
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
13 |
tta |
|
9 |
gaa |
|
7 |
aga |
|
4 |
aca
|
15 |
atgf |
|
6 |
gga |
|
9 |
ggc |
|
31 |
aac
|
9 |
gaa |
|
5 |
gta |
|
5 |
gac |
|
16 |
aac
|
6 |
gga |
|
16 |
gac |
|
8 |
gta |
|
5 |
gac
|
5 |
gta |
|
4 |
aac |
|
** |
gaa |
|
6 |
gta
|
16 |
gac |
|
4 |
aca |
|
13 |
atgj |
|
9 |
gga
|
4 |
aac |
|
15 |
tac |
|
6 |
ttc |
|
15 |
gaa
|
4 |
aca |
|
11 |
cta |
|
6 |
atc |
|
13 |
atgf
|
15 |
tac |
|
13 |
ggc |
|
31 |
cca |
|
** |
tta
|
14 |
cta |
|
7 |
aga |
|
11 |
tgg |
|
|
|
7 |
aga |
|
11 |
caa |
|
6 |
atgi |
|
|
hors
|
11 |
caa |
|
6 |
aaa |
|
6 |
cca |
|
12 |
tgc
|
6 |
aaa |
|
3 |
tca |
|
11 |
agc |
|
3 |
aac
|
3 |
tca |
|
9 |
ttc |
|
6 |
tca |
|
** |
aca
|
9 |
ttc |
|
8 |
atgj |
|
12 |
aaa |
|
8 |
gta
|
8 |
atgj |
|
21 |
atgi |
|
6 |
caa |
|
20 |
gaa
|
21 |
atgi |
|
6 |
cca |
|
19 |
aga |
|
10 |
aaa
|
6 |
cca |
|
9 |
cac |
|
11 |
gga |
|
10 |
aca
|
4 |
cac |
|
21 |
aaa |
|
4 |
tac |
|
7 |
gac
|
25 |
tgc |
|
6 |
tgc |
|
|
|
|
9 |
gta
|
13 |
tta |
|
10 |
cgt |
|
|
|
|
5 |
gaa
|
15 |
atgf |
|
** |
gta |
|
|
|
|
** |
aaa
|
- |
|
|
|
|
|
|
|
|
|
|
Peptoclostridium difficile CD196
modifier
- Liens: gtRNAdb [4], NCBI [5], génome [orgn]
- Lien tableur: cdc opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC |
11.9.19 Paris |
83 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
dir |
9857..10630 |
cds |
|
179 |
179 |
|
|
258 |
|
SigB/SigF/SigG family RNA polymerase sigma factor
|
dir |
10810..12317 |
16s |
|
52 |
|
|
|
|
|
|
dir |
12370..12445 |
gca |
|
249 |
|
|
|
|
|
|
dir |
12695..15596 |
23s |
|
111 |
|
|
|
|
|
|
dir |
15708..15824 |
5s |
|
126 |
126 |
|
|
|
126 |
|
dir |
15951..16460 |
cds |
|
|
|
|
|
170 |
|
transcription repressor NadR
|
|
|
|
|
|
|
|
|
|
|
|
dir |
19402..19857 |
cds |
|
0 |
0 |
|
|
152 |
0 |
nucleoside deaminase
|
dir |
19858..19949 |
tcc |
|
37 |
|
|
|
|
|
|
dir |
19987..20251 |
ncRNA |
@1 |
76 |
76 |
|
|
|
|
|
dir |
20328..21965 |
cds |
|
|
|
|
|
546 |
|
DNA polymerase III subunit gamma/tau
|
|
|
|
|
|
|
|
|
|
|
|
comp |
23419..24624 |
cds |
|
505 |
*505 |
|
|
402 |
|
glycosyl transferase
|
dir |
25130..26637 |
16s |
|
279 |
|
|
|
|
|
|
dir |
26917..29816 |
23s |
+ |
180 |
|
|
|
|
|
|
dir |
29997..30113 |
5s |
3 aaa |
6 |
|
|
|
|
|
|
dir |
30120..30194 |
aac |
3 gta |
6 |
|
|
6 |
|
|
|
dir |
30201..30286 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
30302..30377 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
30385..30459 |
gaa |
|
9 |
|
|
9 |
|
|
|
dir |
30469..30542 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
30548..30623 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
30629..30705 |
gac |
|
9 |
|
|
9 |
|
|
|
dir |
30715..30789 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
30804..30888 |
tac |
|
8 |
|
|
8 |
|
|
|
dir |
30897..30980 |
cta |
|
29 |
|
|
29 |
|
|
|
dir |
31010..31086 |
aga |
|
7 |
|
|
7 |
|
|
|
dir |
31094..31169 |
caa |
|
88 |
|
|
88 |
|
|
|
dir |
31258..31346 |
tca |
|
3 |
|
|
3 |
|
|
|
dir |
31350..31425 |
ttc |
|
6 |
|
|
6 |
|
|
|
dir |
31432..31508 |
atgj |
|
11 |
|
|
11 |
|
|
|
dir |
31520..31596 |
atgi |
|
23 |
|
|
23 |
|
|
|
dir |
31620..31696 |
cca |
|
7 |
|
|
7 |
|
|
|
dir |
31704..31780 |
cac |
|
8 |
|
|
8 |
|
|
|
dir |
31789..31864 |
aaa |
|
7 |
|
|
7 |
|
|
|
dir |
31872..31945 |
tgc |
|
6 |
|
|
6 |
|
|
|
dir |
31952..32026 |
aac |
|
5 |
|
|
5 |
|
|
|
dir |
32032..32117 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
32133..32208 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
32216..32290 |
gaa |
|
9 |
|
|
9 |
|
|
|
dir |
32300..32373 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
32379..32454 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
32460..32536 |
gac |
|
9 |
|
|
9 |
|
|
|
dir |
32546..32620 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
32635..32719 |
tac |
|
9 |
|
|
9 |
|
|
|
dir |
32729..32812 |
cta |
|
23 |
|
|
23 |
|
|
|
dir |
32836..32910 |
ggc |
|
24 |
|
|
24 |
|
|
|
dir |
32935..33011 |
aga |
|
9 |
|
|
9 |
|
|
|
dir |
33021..33096 |
caa |
|
8 |
|
|
8 |
|
|
|
dir |
33105..33180 |
aaa |
|
2 |
|
|
2 |
|
|
|
dir |
33183..33271 |
tca |
|
3 |
|
|
3 |
|
|
|
dir |
33275..33350 |
ttc |
|
6 |
|
|
6 |
|
|
|
dir |
33357..33433 |
atgj |
|
11 |
|
|
11 |
|
|
|
dir |
33445..33521 |
atgi |
|
17 |
|
|
17 |
|
|
|
dir |
33539..33615 |
cac |
|
8 |
|
|
8 |
|
|
|
dir |
33624..33699 |
aaa |
|
7 |
|
|
7 |
|
|
|
dir |
33707..33780 |
tgc |
|
7 |
|
|
7 |
|
|
|
dir |
33788..33864 |
cgt |
|
12 |
|
|
12 |
|
|
|
dir |
33877..33952 |
gta |
|
75 |
75 |
|
|
|
75 |
|
dir |
34028..34441 |
cds |
|
308 |
308 |
|
|
138 |
|
hp
|
dir |
34750..38181 |
cds |
|
|
|
|
|
1144 |
|
pyruvate carboxylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
127011..127715 |
cds |
|
281 |
281 |
|
|
235 |
|
N-acetylmuramoyl-L-alanine amidase CwlD
|
dir |
127997..129505 |
16s |
|
279 |
|
|
|
|
|
|
dir |
129785..132685 |
23s |
+ |
131 |
|
|
|
|
|
|
dir |
132817..132933 |
5s |
2 cca |
6 |
|
|
|
|
|
|
dir |
132940..133014 |
aac |
|
4 |
|
|
4 |
|
|
|
dir |
133019..133093 |
gaa |
|
5 |
|
|
5 |
|
|
|
dir |
133099..133174 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
133180..133256 |
gac |
|
10 |
|
|
10 |
|
|
|
dir |
133267..133341 |
aca |
|
14 |
|
|
14 |
|
|
|
dir |
133356..133440 |
tac |
|
9 |
|
|
9 |
|
|
|
dir |
133450..133523 |
gga |
|
10 |
|
|
10 |
|
|
|
dir |
133534..133610 |
aga |
|
9 |
|
|
9 |
|
|
|
dir |
133620..133695 |
caa |
|
11 |
|
|
11 |
|
|
|
dir |
133707..133782 |
aaa |
|
2 |
|
|
2 |
|
|
|
dir |
133785..133873 |
tca |
|
17 |
|
|
17 |
|
|
|
dir |
133891..133981 |
agc |
|
8 |
|
|
8 |
|
|
|
dir |
133990..134066 |
cca |
|
85 |
|
|
85 |
|
|
|
dir |
134152..134227 |
tgg |
|
60 |
|
|
60 |
|
|
|
dir |
134288..134364 |
cca |
|
6 |
|
|
6 |
|
|
|
dir |
134371..134447 |
atc |
|
3 |
|
|
3 |
|
|
|
dir |
134451..134526 |
ttc |
|
7 |
|
|
7 |
|
|
|
dir |
134534..134610 |
atgj |
|
114 |
|
|
|
|
|
|
dir |
134725..136115 |
16s |
|
68 |
|
|
|
|
|
|
dir |
136184..136259 |
gca |
|
271 |
|
|
|
|
|
|
dir |
136531..139430 |
23s |
|
126 |
|
|
|
|
|
|
dir |
139557..139673 |
5s |
|
213 |
213 |
|
|
|
213 |
|
comp |
139887..141071 |
cds |
|
372 |
*372 |
|
|
395 |
|
pyridoxal phosphate-dependent aminotransferase
|
dir |
141444..143795 |
cds |
|
21 |
21 |
|
|
784 |
|
anaerobic ribonucleoside triphosphate reductase
|
dir |
143817..144356 |
cds |
|
776 |
*776 |
|
|
180 |
|
anaerobic ribonucleoside-triphosphate reductase activating protein
|
dir |
145133..146640 |
16s |
|
52 |
|
|
|
|
|
|
dir |
146693..146768 |
gca |
|
373 |
|
|
|
|
|
|
dir |
147142..150041 |
23s |
|
126 |
|
|
|
|
|
|
dir |
150168..150284 |
5s |
|
7 |
|
|
7 |
|
|
|
dir |
150292..150366 |
aac |
|
5 |
|
|
5 |
|
|
|
dir |
150372..150457 |
tta |
|
15 |
|
|
15 |
|
|
|
dir |
150473..150548 |
atgf |
|
7 |
|
|
7 |
|
|
|
dir |
150556..150630 |
gaa |
|
14 |
|
|
14 |
|
|
|
dir |
150645..150718 |
gga |
|
5 |
|
|
5 |
|
|
|
dir |
150724..150799 |
gta |
|
5 |
|
|
5 |
|
|
|
dir |
150805..150881 |
gac |
|
10 |
|
|
10 |
|
|
|
dir |
150892..150966 |
ggc |
|
9 |
|
|
9 |
|
|
|
dir |
150976..151049 |
aga |
|
975 |
*975 |
|
|
|
|
|
dir |
152025..152864 |
cds |
|
|
|
|
|
280 |
|
TIGR00159 family protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
378341..380728 |
cds |
|
583 |
*583 |
|
|
796 |
|
cadmium-translocating P-type ATPase
|
dir |
381312..382819 |
16s |
|
311 |
|
|
|
|
|
|
dir |
383131..386030 |
23s |
|
126 |
|
|
|
|
|
|
dir |
386157..386273 |
5s |
|
177 |
177 |
|
|
|
177 |
|
dir |
386451..387059 |
cds |
|
|
|
|
|
203 |
|
DedA family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
833130..833894 |
cds |
|
258 |
258 |
|
|
255 |
|
DeoR/GlpR transcriptional regulator
|
dir |
834153..834243 |
agc |
|
87 |
87 |
|
|
|
87 |
|
dir |
834331..835119 |
cds |
|
|
|
|
|
263 |
|
flagellar motor protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1089165..1090139 |
cds |
|
239 |
239 |
|
|
325 |
239 |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
dir |
1090379..1091886 |
16s |
|
320 |
|
|
|
|
|
|
dir |
1092207..1095106 |
23s |
|
91 |
|
|
|
|
|
|
dir |
1095198..1095271 |
gga |
@2 |
8 |
|
|
|
|
|
|
dir |
1095280..1095396 |
5s |
|
273 |
273 |
|
|
|
|
|
dir |
1095670..1097688 |
cds |
|
|
|
|
|
673 |
|
N-acetylmuramoyl-L-alanine amidase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1181549..1182958 |
cds |
|
1374 |
*1374 |
|
|
470 |
|
MBOAT family protein
|
comp |
1184333..1184415 |
ttg |
|
318 |
318 |
|
|
|
318 |
|
dir |
1184734..1187382 |
cds |
|
|
|
|
|
883 |
|
DNA polymerase I
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1835768..1837498 |
cds |
|
109 |
109 |
|
|
577 |
109 |
Na+/H+ antiporter NhaC family protein
|
dir |
1837608..1837688 |
cta |
|
231 |
231 |
|
|
|
|
|
<dir |
1837920..1838093 |
cds |
|
|
|
|
|
58 |
|
HXXEE domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
2981767..2982444 |
cds |
|
159 |
159 |
|
|
226 |
159 |
sortase SrtB
|
comp |
2982604..2982678 |
aca |
@3 |
94 |
|
|
|
|
|
|
comp |
2982773..2985672 |
23s |
|
184 |
|
|
|
|
|
|
comp |
2985857..2987364 |
16s |
|
340 |
340 |
|
|
|
|
|
dir |
2987705..2988643 |
cds |
|
|
|
|
|
313 |
|
delta-lactam-biosynthetic de-N-acetylase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3787361..3788431 |
cds |
|
454 |
*454 |
|
|
357 |
|
ABC transporter ATP-binding protein
|
comp |
3788886..3789002 |
5s |
|
126 |
|
|
|
|
|
|
comp |
3789129..3792028 |
23s |
|
281 |
|
|
|
|
|
|
comp |
3792310..3793817 |
16s |
|
191 |
191 |
|
|
|
191 |
|
comp |
3794009..3794587 |
cds |
|
|
|
|
|
193 |
|
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3944262..3944453 |
cds |
|
119 |
119 |
|
|
64 |
119 |
DUF378 domain-containing protein
|
comp |
3944573..3944689 |
5s |
|
126 |
|
|
|
|
|
|
comp |
3944816..3947715 |
23s |
|
217 |
|
|
|
|
|
|
comp |
3947933..3949440 |
16s |
|
282 |
282 |
|
|
|
|
|
comp |
3949723..3950004 |
cds |
|
221 |
221 |
|
|
94 |
|
hp
|
comp |
3950226..3951755 |
cds |
|
|
|
|
|
510 |
|
lysine--tRNA ligase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4084445..4085437 |
cds |
|
382 |
*382 |
|
|
331 |
|
DNA replication protein DnaC
|
comp |
4085820..4085894 |
aca |
|
|
|
33 |
|
|
|
|
comp |
4085928..4086003 |
gta |
|
|
|
4 |
|
|
|
|
comp |
4086008..4086082 |
gaa |
|
|
|
6 |
|
|
|
|
comp |
4086089..4086164 |
aaa |
|
326 |
326 |
|
|
|
326 |
|
comp |
4086491..4087780 |
cds |
|
|
|
|
|
430 |
|
adenylosuccinate synthase
|
cumuls. Peptoclostridium difficile CD196
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
10 |
1 |
|
0 |
1 |
1 |
1 |
1 |
100 |
3
|
|
16 23 5s 0 |
3 |
20 |
2 |
61 |
50 |
1 |
20 |
0 |
200 |
5
|
|
16 gca 235 |
3 |
40 |
1 |
4 |
100 |
3 |
40 |
0 |
300 |
7
|
|
16 23 5s a |
2 |
60 |
|
1 |
150 |
3 |
60 |
0 |
400 |
5
|
|
max a |
43 |
80 |
|
0 |
200 |
4 |
80 |
1 |
500 |
3
|
|
a doubles |
2 |
100 |
|
2 |
250 |
4 |
100 |
1 |
600 |
3
|
|
autres |
2 |
120 |
|
0 |
300 |
4 |
120 |
2 |
700 |
1
|
|
total aas |
75 |
140 |
|
0 |
350 |
4 |
140 |
1 |
800 |
2
|
sans |
opérons |
5 |
160 |
|
0 |
400 |
2 |
160 |
1 |
900 |
1
|
|
1 aa |
4 |
180 |
|
0 |
450 |
0 |
180 |
1 |
1000 |
0
|
|
max a |
4 |
200 |
|
0 |
500 |
1 |
200 |
1 |
1100 |
0
|
|
a doubles |
0 |
|
|
0 |
|
5 |
|
4 |
|
1
|
|
total aas |
8 |
|
3 |
68 |
|
32 |
|
13 |
|
31
|
total aas |
|
83 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
14 |
12 |
|
313 |
|
165 |
|
378
|
|
|
|
variance |
|
15 |
|
283 |
|
94 |
|
259
|
sans jaune |
|
|
moyenne |
|
9 |
|
206 |
|
|
|
286
|
|
|
|
variance |
|
5 |
|
107 |
|
|
|
144
|
- Note: intercalaires prélevés de la colonne cds de cdc opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc 40 40 20 60
deb fin deb fin grand petit grand petit
0 37 0 37 37 0 37 0
109 231 258 87 231 109 258 87
258 87 109 231 258 87 231 109
382 326 1374 318 382 326 1374 318
1374 318 382 326 1374 318 382 326
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
cdc 3,614 10 4 4 1 1 2 2 1 3
cdc ‰ 400 400 100 100 400 400 200 600
- Lien tableur: cdc blocs
- Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
- Légende: voir psor blocs.
- Notes:
- - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
|
groupes |
|
types |
|
|
|
absents |
|
|
|
|
|
|
|
|
cds |
281 |
I |
|
|
|
|
II |
|
III |
|
IV |
IV1 |
IV2
|
IV2 |
16s |
279 |
|
|
|
|
|
|
|
|
|
|
|
|
|
23s |
131 |
CDS |
583 |
454 |
119 |
|
cds |
239 |
|
|
|
|
|
|
5s |
6 |
16s |
311 |
126 |
126 |
|
16s |
320 |
cds |
159 |
cds |
505 |
281
|
|
aac |
4 |
23s |
126 |
281 |
217 |
|
23s |
91 |
aca |
94 |
16s |
279 |
279
|
|
**16aas |
3 |
5s |
177 |
191 |
282 |
|
gga |
8 |
23s |
184 |
23s |
180 |
131
|
|
ttc |
7 |
CDS |
|
|
|
|
5s |
273 |
16s |
340 |
5s |
6 |
6
|
|
atgj |
114 |
|
|
|
|
|
cds |
|
cds |
|
aac |
6 |
4
|
VIII1 |
16s |
68 |
|
|
|
|
|
|
|
|
|
|
|
|
|
gca |
271 |
|
|
|
|
|
V |
|
V2 |
VI |
VI1 |
VII |
VII1
|
|
23s |
126 |
|
|
|
|
|
|
|
|
|
|
|
|
|
5s |
213 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
372 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
21 |
|
|
|
|
|
VIII |
VIII1 |
IX |
|
X |
X1 |
|
|
cds |
776 |
|
|
|
|
|
|
|
|
|
cds |
21 |
|
X1 |
16s |
52 |
|
|
|
|
|
atgj |
114 |
cds |
179 |
cds |
776 |
|
|
gca |
373 |
|
|
|
|
|
16s |
68 |
16s |
52 |
16s |
52 |
|
|
23s |
126 |
|
|
|
|
|
gca |
271 |
gca |
249 |
gca |
373 |
|
|
5s |
7 |
|
|
|
|
|
23s |
126 |
23s |
111 |
23s |
126 |
|
|
aac |
5 |
|
|
|
|
|
5s |
213 |
5s |
126 |
5s |
7 |
|
|
**7aas |
9 |
|
|
|
|
|
cds |
372 |
cds |
|
aac |
5 |
|
|
aga |
975 |
|
|
|
|
|
|
|
|
|
|
|
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
|
|
- Lien tableur: cdc psor
- Comparaison bsu-lmo: Les séquences, les cumuls.
- Légende:
- - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
- - Le bleu pour des intercalaires exceptionnels.
- - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
- - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
- - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
- Notes:
- - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
- - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
- - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc |
intercal |
psor |
intercal |
diff
|
cds |
505 |
cds |
309 |
|
16s |
279 |
16s |
196 |
|
23s |
180 |
23s |
122 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
|
tta |
15 |
atg |
15 |
-2
|
atgf |
7 |
gaa |
9 |
8
|
gaa |
9 |
gga |
6 |
0
|
gga |
5 |
gta |
5 |
1
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
8 |
tac |
15 |
7
|
cta |
29 |
cta |
14 |
-15
|
aga |
7 |
aga |
7 |
0
|
caa |
88 |
caa |
11 |
|
tca |
3 |
aaa |
6 |
|
ttc |
6 |
tca |
3 |
0
|
atgj |
11 |
ttc |
9 |
3
|
atgi |
23 |
atg |
8 |
-3
|
cca |
7 |
atg |
21 |
-2
|
cac |
8 |
cca |
6 |
-1
|
aaa |
7 |
cac |
4 |
|
tgc |
6 |
tgc |
25 |
|
aac |
5 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
9 |
tac |
15 |
6
|
cta |
23 |
cta |
11 |
-12
|
ggc |
24 |
ggc |
13 |
-11
|
aga |
9 |
aga |
7 |
-2
|
caa |
8 |
caa |
11 |
3
|
aaa |
2 |
aaa |
6 |
4
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
9 |
3
|
atgj |
11 |
atg |
8 |
-3
|
atgi |
17 |
atg |
21 |
|
cac |
8 |
cca |
6 |
|
aaa |
7 |
cac |
9 |
1
|
tgc |
7 |
aaa |
21 |
14
|
cgt |
12 |
tgc |
6 |
-1
|
gta |
75 |
cgt |
10 |
-2
|
cds |
|
gta |
162 |
|
|
|
cds |
|
|
|
|
|
|
|
cds |
776 |
|
|
|
16s |
52 |
|
|
|
gca |
373 |
|
|
|
23s |
126 |
|
|
|
5s |
7 |
atg |
138 |
|
aac |
5 |
16s |
109 |
|
tta |
15 |
gca |
112 |
|
atgf |
7 |
23s |
40 |
|
gaa |
14 |
5s |
5 |
|
gga |
5 |
gaa |
8 |
|
gta |
5 |
gta |
5 |
0
|
gac |
10 |
gac |
9 |
-1
|
ggc |
9 |
ggc |
7 |
-2
|
aga |
975 |
aga |
142 |
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
281 |
cds |
239 |
|
16s |
279 |
16s |
196 |
|
23s |
131 |
23s |
213 |
|
5s |
6 |
5s |
5 |
|
aac |
4 |
tta |
13 |
|
gaa |
5 |
atg |
15 |
|
gta |
5 |
gaa |
9 |
|
gac |
10 |
gga |
6 |
|
aca |
14 |
gta |
5 |
|
tac |
9 |
gac |
16 |
|
gga |
10 |
aac |
31 |
|
aga |
9 |
aac |
4 |
|
caa |
11 |
aca |
4 |
-10
|
aaa |
2 |
tac |
11 |
2
|
tca |
17 |
gga |
19 |
9
|
agc |
8 |
aga |
6 |
-3
|
cca |
85 |
caa |
12 |
1
|
tgg |
60 |
aaa |
6 |
4
|
cca |
6 |
tca |
11 |
-6
|
atc |
3 |
agc |
6 |
-2
|
ttc |
7 |
cca |
6 |
|
atgj |
114 |
atg |
11 |
|
16s |
|
tgg |
31 |
-29
|
|
|
cca |
6 |
0
|
|
|
atc |
6 |
3
|
|
|
ttc |
13 |
6
|
|
|
atg |
138 |
|
|
|
16s |
|
|
|
|
|
|
|
|
|
cds |
129 |
|
|
|
gta |
8 |
|
|
|
gaa |
20 |
|
|
|
aaa |
10 |
|
cds |
382 |
aca |
10 |
|
aca |
33 |
gac |
7 |
|
gta |
4 |
gta |
9 |
5
|
gaa |
6 |
gaa |
5 |
-1
|
aaa |
326 |
aaa |
289 |
|
cds |
|
cds |
|
|
|
C22. Comparaisons internes
cdc |
intercal |
cdc |
intercal |
diff
|
cds |
505 |
cds |
281 |
|
16s |
279 |
16s |
279 |
|
23s |
180 |
23s |
131 |
|
5s |
6 |
5s |
6 |
|
aac |
6 |
aac |
4 |
|
tta |
15 |
gaa |
5 |
|
atgf |
7 |
gta |
5 |
|
gaa |
9 |
gac |
10 |
|
gga |
5 |
aca |
14 |
|
gta |
5 |
tac |
9 |
0
|
gac |
9 |
gga |
10 |
1
|
aca |
14 |
aga |
9 |
0
|
tac |
8 |
caa |
11 |
|
cta |
29 |
aaa |
2 |
|
aga |
7 |
tca |
17 |
2
|
caa |
88 |
agc |
8 |
|
tca |
3 |
cca |
85 |
|
ttc |
6 |
tgg |
60 |
|
atgj |
11 |
cca |
6 |
|
atgi |
23 |
atc |
3 |
|
cca |
7 |
ttc |
7 |
|
cac |
8 |
atgj |
114 |
|
aaa |
7 |
16s |
|
|
tgc |
6 |
cds |
776 |
|
aac |
5 |
16s |
52 |
|
tta |
15 |
gca |
373 |
|
atgf |
7 |
23s |
126 |
|
gaa |
9 |
5s |
7 |
|
gga |
5 |
aac |
5 |
|
gta |
5 |
tta |
15 |
0
|
gac |
9 |
atgf |
7 |
1
|
aca |
14 |
gaa |
14 |
0
|
tac |
9 |
gga |
5 |
|
cta |
23 |
gta |
5 |
|
ggc |
24 |
gac |
10 |
|
aga |
9 |
ggc |
9 |
0
|
caa |
8 |
aga |
975 |
3
|
aaa |
2 |
cds |
|
0
|
tca |
3 |
|
|
|
ttc |
6 |
|
|
|
atgj |
11 |
|
|
|
atgi |
17 |
|
|
|
cac |
8 |
|
|
|
aaa |
7 |
|
|
|
tgc |
7 |
|
|
|
cgt |
12 |
|
|
|
gta |
75 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
psor |
|
psor |
intercal |
diff
|
cds |
309 |
cds |
239 |
|
16s |
196 |
16s |
196 |
|
23s |
122 |
23s |
213 |
|
5s |
5 |
5s |
5 |
|
tta |
13 |
tta |
13 |
0
|
atg |
15 |
atg |
15 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
6 |
gga |
6 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
16 |
gac |
16 |
0
|
aac |
4 |
aac |
31 |
|
aca |
4 |
aac |
4 |
|
tac |
15 |
aca |
4 |
0
|
cta |
14 |
tac |
11 |
-4
|
aga |
7 |
cta |
19 |
5
|
caa |
11 |
aga |
6 |
-1
|
aaa |
6 |
caa |
12 |
1
|
tca |
3 |
aaa |
6 |
0
|
ttc |
9 |
tca |
11 |
|
atg |
8 |
agc |
6 |
|
atg |
21 |
cca |
6 |
|
cca |
6 |
atg |
11 |
|
cac |
4 |
tgg |
31 |
|
tgc |
25 |
cca |
6 |
|
tta |
13 |
atc |
6 |
0
|
atg |
15 |
ttc |
13 |
0
|
gaa |
9 |
atg |
138 |
0
|
gga |
6 |
16s |
|
0
|
gta |
5 |
atg |
138 |
0
|
gac |
16 |
16s |
109 |
0
|
aac |
4 |
gca |
112 |
|
aca |
4 |
23s |
40 |
0
|
tac |
15 |
5s |
5 |
|
cta |
11 |
gaa |
8 |
|
ggc |
13 |
gta |
5 |
|
aga |
7 |
gac |
9 |
-1
|
caa |
11 |
ggc |
7 |
1
|
aaa |
6 |
aga |
142 |
0
|
tca |
3 |
cds |
|
|
ttc |
9 |
|
|
|
atg |
8 |
|
|
|
atg |
21 |
|
|
|
cca |
6 |
|
|
|
cac |
9 |
|
|
|
aaa |
21 |
|
|
|
tgc |
6 |
|
|
|
cgt |
10 |
|
|
|
gta |
162 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C23. Conservation des cds
cdc |
intercal |
psor |
intercal |
protéines
|
cds |
0 |
cds |
3 |
151 – 152
|
tcc |
37 |
tcc |
27 |
|
ncRNA |
76 |
ncRNA |
152 |
547 – 546
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
1374 |
cds |
41 |
470 – 1177
|
ttg |
318 |
ttg |
138 |
883 – 881
|
cds |
|
cds |
|
|
|
|
|
|
|
cds |
109 |
cds |
111 |
577 – 1076
|
cta |
231 |
cta |
426 |
|
cds |
|
cds |
|
58 – 577
|
|
|
|
|
|
cds |
258 |
cds |
37 |
255 – 302
|
agc |
87 |
agc |
120 |
|
cds |
|
cds |
|
263 – 100
|
|
|
|
|
|
|
|
cds |
306 |
62
|
|
|
cta |
404 |
|
|
|
cds |
|
422
|
|
|
|
|
|
|
|
cds |
135 |
|
|
|
other |
258 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
cds |
195 |
|
|
|
tga |
37 |
|
|
|
cds |
|
|
|
|
|
|
|
|
|
cds |
71 |
|
|
|
tgc |
12 |
|
|
|
aac |
3 |
|
|
|
aca |
285 |
|
|
|
cds |
|
|
|
C24. Fréquence des différences des intercalaires
|
gamme |
fréquence |
|
|
|
-15 |
2 |
|
|
|
-14 |
|
|
|
|
-13 |
|
|
|
|
-12 |
1 |
|
|
|
-11 |
1 |
|
|
|
-10 |
3 |
|
|
|
-9 |
|
|
|
|
-8 |
|
|
|
|
-7 |
|
|
|
|
-6 |
1 |
|
|
|
-5 |
|
|
|
|
-4 |
|
|
|
|
-3 |
3 |
|
|
|
-2 |
7 |
|
|
|
-1 |
4 |
|
|
|
0 |
8 |
|
|
|
1 |
4 |
|
|
|
2 |
1 |
|
|
|
3 |
4 |
|
|
|
4 |
2 |
|
|
|
5 |
1 |
|
|
|
6 |
2 |
|
|
|
7 |
1 |
|
|
|
8 |
2 |
|
|
|
9 |
1 |
|
|
|
10 |
|
|
|
|
11 |
|
|
|
|
12 |
|
|
|
|
13 |
|
|
|
|
14 |
1 |
|
|
|
15 |
|
|
|
|
|
|
|
|
|
total |
49 |
|
|
|
sous t. -2+2 |
24 |
|
|
|
- Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
- Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
- Rmarques @: On retrouve une partie des remarques de psor
- - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
- - Une configuration rare 23s-gga-5s complète au lieu de 3.
- - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
- Comparaison cdc-psor
- Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
- Les séquences longues:
- Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
- Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
- Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
- - Seuls les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
- Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.
Cl2 cdc, Peptoclostridium difficile CD196. clostridia.
Cl21 cdc. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
|
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
|
caa |
|
cga |
|
l gta |
1 |
o gca |
|
gaa |
1 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc |
4 |
4* |
|
|
|
|
8
|
|
Cl22 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
|
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
2 |
aac |
2 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
3 |
c tca |
3 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
4 |
aga |
4
|
k cta |
2 |
g cca |
3 |
caa |
3 |
cga |
|
l gta |
5 |
o gca |
3 |
gaa |
4 |
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc |
|
|
2* |
70 |
|
3 |
75
|
|
- cdc Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cdc, Clostridioides difficile CD196, NCBI [6], date 6.2.22.
- cdc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cdc 636,447 4,110,554 15.5
Intergen51. cdc. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cdc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cdc les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,552 |
296 |
37 |
2,885 |
4.5 |
98 |
12 |
110
|
x |
640 |
2 |
0 |
642 |
|
0 |
3 |
3
|
t |
3,192 |
298 |
37 |
3,527 |
|
98 |
15 |
113
|
% |
90.5 |
8.4 |
1.0 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
8 |
0 |
1 |
9 |
2.3 |
tRNA-CDS |
13 |
5
|
x |
4 |
0 |
0 |
4 |
|
RNA-RNA |
98 |
35
|
t |
12 |
0 |
1 |
13 |
|
CDS-rRNA |
15 |
5
|
% |
92.3 |
0.0 |
7.7 |
|
|
non RNA |
156 |
55
|
- |
|
|
|
|
|
total |
282 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
9.5 |
22.2 |
1.7 |
29.5 |
0.0 |
35 |
1.3 |
11.1
|
x |
19.5 |
0.0 |
50.0 |
0.5 |
0.0 |
50 |
0.0 |
0.0
|
|
Intergen51. cdc. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cdc données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cdc fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cdc
R2 x3 x2 x c Inflexion poly3 x c
0.718 2.24E-06 -2.16E-03 5.54E-01 11.8 fx1 abscisse 286.2 430.8
0.844 -6.73E-06 5.06E-03 -1.22E+00 105.0 fc1 ordonnée 21.4 4.3
0.670 3.89E-06 -3.34E-03 8.06E-01 -26.9 fx41
0.903 -2.77E-07 3.58E-04 -1.86E-01 40.1 fc41
- Le rfin après 400 est de 246 sur un total de 2589 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 25 . L'indice i.rfin1 = 221/510=0.433.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cdc calculs poly3 cdc
effect 2589 R2.21 860 abscis 250
xm 45 pte 11,42 flexa 138
ym 8 cste 3,60 flexo 2,06
x1m 228 r400l 172 xm 45
y1m 1 restp 241,41 sup4 70,1
rfin 95,02 %sd 18,48 sup4t 248,7
bornf 137 lond 183 % 28,2
supd 71,2 %sf 16,90 long 93
supdt 385,5 lonf 92 R2 347
xmp 373,12 sf/lf 0,45
r400 146,39 sr/lr 0,33
supf 41,6 sd/ld 0,39
supft 246,0 i.r400 0,85
Intergen51. cdc. Les CDS-CDS négatifs
modifier
Sous-totaux cdc totale
fréquence x- c- x- c-
- 1 0 59 4 4140
- 2 0 0 85 11
- 3 0 1 3 12
- 4 1 44 717 10938
- 5 0 0 5 19
sp6 1 192 1642 8424
total 2 296 2,456 23,544
reste 1 5 264 420
s6 0 1 361 41
s7 0 32 321 1438
s8 0 154 696 6525
rappot s1-5
4/2/1 - 0.7 8.4 2.6
% / sp6
s6/sp6 0.0 0.5 22.0 0.5
s7/sp6 0.0 16.7 19.5 17.1
s8/sp6 0.0 80.2 42.4 77.5
reste/sp6 100.0 2.6 16.1 5.0
total s1-5 1 104 814 15120
% / total
%s1-5 50.0 35.1 33.1 64.2
%sp6 50.0 64.9 66.9 35.8
Intergen51. cdc. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 8 CDS 16s 7 2
16s 23s 7 5s CDS 5 1
16s tRNA 3 16 CDS
tRNA 23s 3 CDS 5s
5s tRNA 3 23s CDS
tRNA in CDS 23s
tRNA contig 67 5s 16s
tRNA hors 3 16s16s
tRNA 16s 1
23s tRNA 2
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 98 0 total 12 3
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cdc. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3 |
|
|
cont5
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
6 |
aac |
|
5 |
aac |
|
8 |
cac |
|
6 |
cca
|
15 |
tta |
|
15 |
tta |
|
7 |
aaa |
|
3 |
atc
|
7 |
atgf |
|
7 |
atgf |
|
7 |
tgc |
|
7 |
ttc
|
9 |
gaa |
|
9 |
gaa |
|
12 |
cgt |
|
** |
atgj
|
5 |
gga |
|
5 |
gga |
|
** |
gta |
|
5 |
aac
|
5 |
gta |
|
5 |
gta |
|
|
cont4 |
|
15 |
tta
|
9 |
gac |
|
9 |
gac |
|
4 |
aac |
|
7 |
atgf
|
14 |
aca |
|
14 |
aca |
|
5 |
gaa |
|
14 |
gaa
|
8 |
tac |
|
9 |
tac |
|
5 |
gta |
|
5 |
gga
|
29 |
cta |
|
23 |
cta |
|
10 |
gac |
|
5 |
gta
|
7 |
aga |
|
24 |
ggc |
|
14 |
aca |
|
10 |
gac
|
88 |
caa |
|
9 |
aga |
|
9 |
tac |
|
9 |
ggc
|
3 |
tca |
|
8 |
caa |
|
10 |
gga |
|
** |
aga
|
6 |
ttc |
|
2 |
aaa |
|
9 |
aga |
|
|
|
14 |
atgj |
|
3 |
tca |
|
11 |
caa |
|
|
|
23 |
atgi |
|
6 |
ttc |
|
2 |
aaa |
|
|
hors
|
7 |
cca |
|
14 |
atgj |
|
17 |
tca |
|
33 |
aca
|
8 |
cac |
|
17 |
atgi |
|
8 |
agc |
|
4 |
gta
|
7 |
aaa |
|
|
|
|
85 |
cca |
|
6 |
gaa
|
6 |
tgc |
|
|
|
|
60 |
tgg |
|
** |
aaa
|
- |
|
|
|
|
|
|
|
|
|
|
- Liens data bases: gtRNAdb [7], NCBI [8], génome [9]
- Lien tableur: cdc8 opérons
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
- Liens internes: noms abrégés cdc8 remarques cdc8 cumuls
- Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: tRNA dupliqué dans le cluster 43aas (4306341).
- - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
- - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC |
11.9.19 Paris |
110 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd |
protéines
|
dir |
4299490..4300134 |
cds |
|
214 |
214 |
|
|
645 |
|
tyrosine-type recombinase/integrase
|
dir |
4300349..4300807 |
cds |
@1 |
554 |
554 |
|
|
459 |
|
helix-turn-helix domain-containing protein
|
dir |
4301362..4303101 |
cds |
|
0 |
0 |
|
|
1740 |
|
hypothetical protein
|
dir |
4303102..4303305 |
cds |
|
167 |
167 |
|
|
204 |
|
hp
|
dir |
4303473..4304299 |
23s° |
|
132 |
|
|
|
827 |
|
|
dir |
4304432..4304548 |
5s |
+ |
6 |
|
|
|
117 |
|
|
dir |
4304555..4304629 |
aac |
|
4 |
|
|
4 |
75 |
|
|
dir |
4304634..4304708 |
gaa |
2 cca |
5 |
|
|
5 |
75 |
|
|
dir |
4304714..4304789 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
4304795..4304871 |
gac |
|
11 |
|
|
11 |
77 |
|
|
dir |
4304883..4304957 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
4304972..4305056 |
tac |
|
9 |
|
|
9 |
85 |
|
|
dir |
4305066..4305139 |
gga |
|
10 |
|
|
10 |
74 |
|
|
dir |
4305150..4305226 |
aga |
|
9 |
|
|
9 |
77 |
|
|
dir |
4305236..4305311 |
caa |
|
11 |
|
|
11 |
76 |
|
|
dir |
4305323..4305398 |
aaa |
|
2 |
|
|
2 |
76 |
|
|
dir |
4305401..4305489 |
tca |
|
18 |
|
|
18 |
89 |
|
|
dir |
4305508..4305598 |
agc |
|
8 |
|
|
8 |
91 |
|
|
dir |
4305607..4305683 |
cca |
|
85 |
|
|
85 |
77 |
|
|
dir |
4305769..4305844 |
tgg |
|
60 |
|
|
60 |
76 |
|
|
dir |
4305905..4305981 |
cca |
|
5 |
|
|
5 |
77 |
|
|
dir |
4305987..4306063 |
atc |
|
3 |
|
|
3 |
77 |
|
|
dir |
4306067..4306142 |
ttc |
|
7 |
|
|
7 |
76 |
|
|
dir |
4306150..4306226 |
atgj |
|
114 |
|
|
|
77 |
|
|
dir |
4306341..4307538 |
16s |
|
0 |
0 |
|
|
1198 |
0 |
|
dir |
4307539..4308225 |
cds |
|
100 |
100 |
|
|
687 |
|
xylose isomerase
|
dir |
1..796 |
23s° |
|
181 |
|
|
|
796 |
|
|
dir |
978..1094 |
5s |
|
6 |
|
|
|
117 |
|
|
dir |
1101..1175 |
aac |
+ |
6 |
|
|
6 |
75 |
|
|
dir |
1182..1267 |
tta |
3 aaa |
15 |
|
|
15 |
86 |
|
|
dir |
1283..1358 |
atgf |
3 gta |
7 |
|
|
7 |
76 |
|
|
dir |
1366..1440 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
1450..1523 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
1529..1604 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
1610..1686 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
1696..1770 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
1785..1869 |
tac |
|
10 |
|
|
10 |
85 |
|
|
dir |
1880..1963 |
cta |
|
28 |
|
|
28 |
84 |
|
|
dir |
1992..2068 |
aga |
|
7 |
|
|
7 |
77 |
|
|
dir |
2076..2151 |
caa |
|
89 |
|
|
89 |
76 |
|
|
dir |
2241..2329 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
2333..2408 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
2415..2491 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
2503..2579 |
atgi |
|
29 |
|
|
29 |
77 |
|
|
dir |
2609..2685 |
cca |
|
7 |
|
|
7 |
77 |
|
|
dir |
2693..2769 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
2778..2853 |
aaa |
|
7 |
|
|
7 |
76 |
|
|
dir |
2861..2934 |
tgc |
|
6 |
|
|
6 |
74 |
|
|
dir |
2941..3015 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
3022..3107 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
3123..3198 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
3206..3280 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
3290..3363 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
3369..3444 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
3450..3526 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
3536..3610 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
3625..3709 |
tac |
|
9 |
|
|
9 |
85 |
|
|
dir |
3719..3802 |
cta |
|
24 |
|
|
24 |
84 |
|
|
dir |
3827..3901 |
ggc |
|
24 |
|
|
24 |
75 |
|
|
dir |
3926..4002 |
aga |
|
9 |
|
|
9 |
77 |
|
|
dir |
4012..4087 |
caa |
|
8 |
|
|
8 |
76 |
|
|
dir |
4096..4171 |
aaa |
|
2 |
|
|
2 |
76 |
|
|
dir |
4174..4262 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
4266..4341 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
4348..4424 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
4436..4512 |
atgi |
|
17 |
|
|
17 |
77 |
|
|
dir |
4530..4606 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
4615..4690 |
aaa |
|
7 |
|
|
7 |
76 |
|
|
dir |
4698..4771 |
tgc |
|
7 |
|
|
7 |
74 |
|
|
dir |
4779..4855 |
cgt |
|
12 |
|
|
12 |
77 |
|
|
dir |
4868..4943 |
gta |
|
75 |
75 |
|
|
76 |
75 |
|
dir |
5019..5432 |
cds |
|
308 |
308 |
|
|
414 |
|
hp
|
dir |
5741..9172 |
cds |
|
|
|
|
|
3432 |
|
pyruvate carboxylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
94032..94736 |
cds |
|
281 |
281 |
|
|
705 |
281 |
N-acetylmuramoyl-L-alanine amidase CwlD
|
dir |
95018..95994 |
16s° |
|
100 |
|
|
|
977 |
|
|
dir |
96095..97613 |
23s° |
|
126 |
|
|
|
1519 |
|
|
dir |
97740..97856 |
5s |
|
7 |
|
|
|
117 |
|
|
dir |
97864..97938 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
97945..98030 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
98046..98121 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
98129..98203 |
gaa |
|
8 |
|
|
8 |
75 |
|
|
dir |
98212..98285 |
gga |
|
4 |
|
|
4 |
74 |
|
|
dir |
98290..98365 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
98371..98447 |
gac |
|
10 |
|
|
10 |
77 |
|
|
dir |
98458..98532 |
ggc |
|
9 |
|
|
9 |
75 |
|
|
dir |
98542..98615 |
aga |
|
954 |
954 |
|
|
74 |
|
|
dir |
99570..100409 |
cds |
|
|
|
|
|
840 |
|
TIGR00159 family protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
306829..309216 |
cds |
|
733 |
733 |
|
|
2388 |
|
cadmium-translocating P-type ATPase
|
<> comp |
309950..310076 |
cds |
|
1 |
1 |
|
|
127 |
1 |
glycine/sarcosine/betaine reductase complex selenoprotein A
|
dir |
310078..311313 |
23s° |
|
126 |
|
|
|
1236 |
|
|
dir |
311440..311556 |
5s |
|
177 |
177 |
|
|
117 |
|
|
dir |
311734..312342 |
cds |
|
|
|
|
|
609 |
|
DedA family protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
|
258 |
258 |
|
|
765 |
|
DeoR/GlpR transcriptional regulator
|
dir |
862879..862969 |
agc |
|
87 |
87 |
|
|
91 |
87 |
|
dir |
863057..863845 |
cds |
|
|
|
|
|
789 |
|
flagellar motor protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
|
238 |
238 |
|
|
975 |
238 |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
dir |
1107690..1109197 |
16s |
@2 |
320 |
|
|
|
1508 |
|
|
dir |
1109518..1112416 |
23s |
|
91 |
|
|
|
2899 |
|
|
dir |
1112508..1112581 |
gga |
|
8 |
|
|
|
74 |
|
|
dir |
1112590..1112706 |
5s |
|
273 |
273 |
|
|
117 |
|
|
dir |
1112980..1114998 |
cds |
|
|
|
|
|
2019 |
|
N-acetylmuramoyl-L-alanine amidase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
|
1378 |
1378 |
|
|
1410 |
|
MBOAT family protein
|
comp |
1199592..1199674 |
ttg |
|
318 |
318 |
|
|
83 |
318 |
|
dir |
1199993..1202641 |
cds |
|
|
|
|
|
2649 |
|
DNA polymerase I
|
|
|
|
|
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
|
109 |
109 |
|
|
1731 |
109 |
Na+/H+ antiporter NhaC family protein
|
dir |
1852736..1852816 |
cta |
|
334 |
334 |
|
|
81 |
|
|
dir |
1853151..1853666 |
cds |
|
|
|
|
|
516 |
|
HXXEE domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
|
150 |
150 |
|
|
678 |
150 |
sortase SrtB
|
comp |
3024866..3024940 |
aca |
@3 |
93 |
|
|
|
75 |
|
|
comp |
3025034..3027933 |
23s |
|
184 |
|
|
|
2900 |
|
|
comp |
3028118..3029625 |
16s |
|
374 |
374 |
|
|
1508 |
|
|
dir |
3030000..3030938 |
cds |
|
|
|
|
|
939 |
|
delta-lactam-biosynthetic de-N-acetylase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
3805298..3806743 |
cds |
|
208 |
208 |
|
|
1446 |
|
tyrosine-type recombinase/integrase
|
comp |
3806952..3807028 |
agg |
|
61 |
61 |
|
|
77 |
61 |
|
<comp |
3807090..3808790 |
cds |
|
|
|
|
|
1701 |
|
formate dehydrogenase subunit alpha
|
|
|
|
|
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
|
452 |
452 |
|
|
1071 |
|
ABC transporter ATP-binding protein
|
comp |
3877339..3877455 |
5s |
|
125 |
|
|
|
117 |
|
|
comp |
3877581..3880480 |
23s |
|
261 |
|
|
|
2900 |
|
|
comp |
3880742..3882249 |
16s |
|
190 |
190 |
|
|
1508 |
190 |
|
comp |
3882440..3883018 |
cds |
|
|
|
|
|
579 |
|
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
|
118 |
118 |
|
|
192 |
118 |
DUF378 domain-containing protein
|
comp |
4017833..4017949 |
5s |
|
126 |
|
|
|
117 |
|
|
comp |
4018076..4020975 |
23s |
|
321 |
|
|
|
2900 |
|
|
comp |
4021297..4022804 |
16s |
|
292 |
292 |
|
|
1508 |
|
|
comp |
4023097..4023378 |
cds |
|
221 |
221 |
|
|
282 |
|
hp
|
comp |
4023600..4025129 |
cds |
|
|
|
|
|
1530 |
|
lysine--tRNA ligase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
|
383 |
383 |
|
|
993 |
|
DNA replication protein DnaC
|
comp |
4137257..4137331 |
aca |
|
33 |
|
33 |
|
75 |
|
|
comp |
4137365..4137440 |
gta |
|
4 |
|
4 |
|
76 |
|
|
comp |
4137445..4137519 |
gaa |
|
6 |
|
6 |
|
75 |
|
|
comp |
4137526..4137601 |
aaa |
|
331 |
331 |
|
|
76 |
331 |
|
comp |
4137933..4139222 |
cds |
|
|
|
|
|
1290 |
|
adenylosuccinate synthase
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4178197..4178970 |
cds |
|
179 |
179 |
|
|
774 |
|
SigB/SigF/SigG family RNA polymerase sigma factor
|
dir |
4179150..4180587 |
16s |
|
161 |
|
|
|
1438 |
|
|
comp |
4180749..4180865 |
5s |
|
201 |
|
|
|
117 |
|
|
comp |
4181067..4183959 |
23s |
|
217 |
|
|
|
2893 |
|
|
comp |
4184177..4185684 |
16s |
|
108 |
|
|
|
1508 |
|
|
comp |
4185793..4185869 |
atgi |
|
11 |
|
|
11 |
77 |
|
|
comp |
4185881..4185969 |
tta |
|
5 |
|
|
|
89 |
|
|
comp |
4185975..4186091 |
5s |
|
201 |
|
|
|
117 |
|
|
comp |
4186293..4189192 |
23s |
|
375 |
|
|
|
2900 |
|
|
comp |
4189568..4189643 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4189696..4190959 |
16s’ |
@4 |
100 |
|
|
|
1264 |
|
|
dir |
4191060..4192225 |
16s’ |
|
52 |
|
|
|
1166 |
|
|
dir |
4192278..4192353 |
gca |
|
248 |
|
|
|
76 |
|
|
dir |
4192602..4193197 |
23s° |
|
100 |
|
|
|
596 |
|
|
dir |
4193298..4193874 |
16s° |
|
321 |
|
|
|
577 |
|
|
dir |
4194196..4196423 |
23s’ |
|
100 |
|
|
|
2228 |
|
|
dir |
4196524..4197091 |
16s° |
|
320 |
|
|
|
568 |
|
|
dir |
4197412..4199044 |
23s° |
|
100 |
|
|
|
1633 |
|
|
dir |
4199145..4201593 |
23s’ |
|
126 |
|
|
|
2449 |
|
|
dir |
4201720..4201836 |
5s |
|
127 |
127 |
|
|
117 |
127 |
|
dir |
4201964..4202473 |
cds |
|
|
|
|
|
510 |
|
transcription repressor NadR
|
|
|
|
|
|
|
|
|
|
|
|
dir |
4205417..4205872 |
cds |
|
0 |
0 |
|
|
456 |
0 |
nucleoside deaminase
|
dir |
4205873..4205964 |
tcc |
@5 |
37 |
|
|
|
92 |
|
|
dir |
4206002..4206266 |
ncRNA |
|
76 |
76 |
|
|
265 |
|
|
dir |
4206343..4207980 |
cds |
|
|
|
|
|
1638 |
|
DNA polymerase III subunit gamma/tau
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4209435..4210639 |
cds |
|
496 |
496 |
|
|
1205 |
|
glycosyl transferase
|
|
4211136..4212643 |
16s |
|
321 |
|
|
|
1508 |
|
|
|
4212965..4213127 |
23s° |
|
100 |
100 |
|
|
163 |
100 |
|
<>comp |
4213228..4213849 |
cds |
|
111 |
|
|
|
622 |
|
CHAP domain-containing protein
|
|
|
|
|
|
|
|
|
|
|
|
comp |
4213961..4214620 |
cds |
|
228 |
228 |
|
|
660 |
228 |
type A-1 chloramphenicol O-acetyltransferase
|
dir |
4214849..4216199 |
16s |
|
321 |
|
|
|
1351 |
|
|
dir |
4216521..4217008 |
23s° |
|
101 |
|
|
|
488 |
|
|
comp |
4217110..4218529 |
23s° |
|
250 |
|
|
|
1420 |
|
|
comp |
4218780..4218855 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4218908..4219471 |
16s° |
|
100 |
|
|
|
564 |
|
|
comp |
4219572..4219856 |
23s° |
|
217 |
|
|
|
285 |
|
|
comp |
4220074..4221581 |
16s |
|
179 |
179 |
|
|
1508 |
179 |
|
>comp |
4221761..4222206 |
cds |
|
386 |
386 |
|
|
446 |
386 |
B/F/G family RNA polymerase sigma-70 factor
|
dir |
4222593..4224100 |
16s |
|
321 |
|
|
|
1508 |
|
|
dir |
4224422..4227321 |
23s |
|
181 |
|
|
|
2900 |
|
|
dir |
4227503..4227619 |
5s |
|
6 |
|
|
|
117 |
|
|
dir |
4227626..4227700 |
aac |
|
6 |
|
|
6 |
75 |
|
|
dir |
4227707..4227792 |
tta |
|
15 |
|
|
15 |
86 |
|
|
dir |
4227808..4227883 |
atgf |
|
7 |
|
|
7 |
76 |
|
|
dir |
4227891..4227965 |
gaa |
|
9 |
|
|
9 |
75 |
|
|
dir |
4227975..4228048 |
gga |
|
5 |
|
|
5 |
74 |
|
|
dir |
4228054..4228129 |
gta |
|
5 |
|
|
5 |
76 |
|
|
dir |
4228135..4228211 |
gac |
|
9 |
|
|
9 |
77 |
|
|
dir |
4228221..4228295 |
aca |
|
14 |
|
|
14 |
75 |
|
|
dir |
4228310..4228394 |
tac |
|
10 |
|
|
10 |
85 |
|
|
dir |
4228405..4228488 |
cta |
|
28 |
|
|
28 |
84 |
|
|
dir |
4228517..4228593 |
aga |
|
7 |
|
|
7 |
77 |
|
|
dir |
4228601..4228676 |
caa |
|
89 |
|
|
89 |
76 |
|
|
dir |
4228766..4228854 |
tca |
|
3 |
|
|
3 |
89 |
|
|
dir |
4228858..4228933 |
ttc |
|
6 |
|
|
6 |
76 |
|
|
dir |
4228940..4229016 |
atgj |
|
11 |
|
|
11 |
77 |
|
|
dir |
4229028..4229104 |
atgi |
|
29 |
|
|
29 |
77 |
|
|
dir |
4229134..4229210 |
cca |
|
7 |
|
|
7 |
77 |
|
|
dir |
4229218..4229294 |
cac |
|
8 |
|
|
8 |
77 |
|
|
dir |
4229303..4229378 |
aaa |
|
353 |
|
|
|
76 |
|
|
comp |
4229732..4229848 |
5s |
|
126 |
|
|
|
117 |
|
|
comp |
4229975..4232010 |
23s' |
|
582 |
|
|
|
2036 |
|
|
dir |
4232593..4234098 |
16s |
@6 |
217 |
|
|
|
1506 |
|
|
dir |
4234316..4237215 |
23s |
|
126 |
|
|
|
2900 |
|
|
dir |
4237342..4237458 |
5s |
|
216 |
216 |
|
|
117 |
216 |
|
comp |
4237675..4238859 |
cds |
|
372 |
372 |
|
|
1185 |
|
pyridoxal phosphate-dependent aminotransferase
|
dir |
4239232..4241583 |
cds |
|
21 |
21 |
|
|
2352 |
|
anaerobic ribonucleoside triphosphate reductase
|
dir |
4241605..4242144 |
cds |
|
778 |
778 |
|
|
540 |
|
anaerobic ribonucleoside-triphosphate reductase activating protein
|
dir |
4242923..4244459 |
16s |
@7 |
261 |
|
|
|
1537 |
|
|
dir |
4244721..4247619 |
23s |
|
201 |
|
|
|
2899 |
|
|
dir |
4247821..4247937 |
5s |
|
5 |
|
|
|
117 |
|
|
dir |
4247943..4248031 |
tta |
|
11 |
|
|
11 |
89 |
|
|
dir |
4248043..4248119 |
atgi |
|
108 |
|
|
|
77 |
|
|
dir |
4248228..4249735 |
16s |
|
184 |
|
|
|
1508 |
|
|
dir |
4249920..4250564 |
23s° |
|
100 |
100 |
|
|
645 |
100 |
|
<dir |
4250665..4250923 |
cds |
|
112 |
112 |
|
|
259 |
112 |
hp
|
comp |
4251036..4253145 |
23s’ |
|
375 |
|
|
|
2110 |
|
|
comp |
4253521..4253596 |
gca |
|
52 |
|
|
|
76 |
|
|
comp |
4253649..4254226 |
16s° |
|
282 |
282 |
|
|
578 |
|
|
dir |
4254509..4254712 |
cds |
|
12 |
12 |
|
|
204 |
|
hp
|
dir |
4254725..4256002 |
cds |
|
|
|
|
|
1278 |
|
phage portal protein
|
- Lien tableur: cdc8 cumuls
- Liens internes: cdc8 opérons
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
- - 1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
21 |
1 |
|
0 |
1 |
4 |
1 |
3 |
100 |
6
|
|
16 23 5s 0 |
4 |
20 |
2 |
77 |
50 |
2 |
20 |
0 |
200 |
8
|
|
16 gca 235 |
2 |
40 |
1 |
6 |
100 |
7 |
40 |
0 |
300 |
11
|
|
16 23 5s a |
5 |
60 |
|
0 |
150 |
5 |
60 |
0 |
400 |
5
|
|
max a |
43 |
80 |
|
1 |
200 |
5 |
80 |
2 |
500 |
5
|
|
a doubles |
2 |
100 |
|
3 |
250 |
6 |
100 |
3 |
600 |
5
|
|
autres |
10 |
120 |
|
0 |
300 |
5 |
120 |
3 |
700 |
1
|
|
total aas |
98 |
140 |
|
0 |
350 |
4 |
140 |
1 |
800 |
1
|
sans |
opérons |
6 |
160 |
|
0 |
400 |
4 |
160 |
1 |
900 |
1
|
|
1 aa |
5 |
180 |
|
0 |
450 |
0 |
180 |
1 |
1000 |
0
|
|
max a |
4 |
200 |
|
0 |
500 |
2 |
200 |
1 |
1100 |
0
|
|
a doubles |
0 |
|
|
0 |
|
4 |
|
7 |
|
1
|
|
total aas |
9 |
|
3 |
87 |
|
48 |
|
22 |
|
44
|
total aas |
|
108 |
|
|
|
|
|
|
|
|
|
remarques |
|
7 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
14 |
13 |
|
256 |
|
155 |
|
330
|
|
|
|
variance |
|
16 |
|
252 |
|
109 |
|
234
|
sans jaune |
|
|
moyenne |
|
10 |
|
182 |
|
|
|
208
|
|
|
|
variance |
|
6 |
|
117 |
|
|
|
97
|
- Note: intercalaires prélevés de la colonne cds de cdc8 opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc8 33 50 17 67
deb fin deb fin grand petit grand petit
0 37 0 37 37 0 37 0
109 334 208 61 208 61 208 61
208 61 258 87 258 87 258 87
258 87 1378 318 334 109 334 109
383 331 383 331 383 331 1378 318
1378 318 109 334 1378 318 383 331
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
cdc8 3,831 12 5 5 1 1 2 3 1 4
‰ 417 417 83 83 333 500 167 667
- Lien tableur: cdc8 blocs
- Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: remarques @2 et @3.
- Notes:
- - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
- - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
- Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
- Le groupe à 2 blocs, IV1 et IV2 bien typés.
- Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
- Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
- Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc type |
groupes |
intercal |
Bloc type |
groupes |
intercal |
Bloc type |
groupe |
intercal
|
|
cds |
554 |
|
cds |
150 |
|
cds |
496
|
|
cds |
0 |
|
aca |
93 |
|
16s |
321
|
|
cds |
167 |
|
23s |
184 |
|
23s° |
100
|
|
23s° |
132 |
III |
16s |
374 |
|
cds |
111
|
IV2 |
5s |
6 |
|
cds |
|
|
cds |
228
|
|
aac |
4 |
|
|
|
|
16s |
321
|
|
**16aas |
7 |
|
cds |
452 |
|
23s° |
101
|
|
atgj |
114 |
|
5s |
125 |
|
23s° |
250
|
IV1 |
16s |
0 |
|
23s |
261 |
|
gca |
52
|
|
cds |
100 |
I2 |
16s |
190 |
|
16s° |
100
|
|
23s° |
181 |
|
cds |
|
|
23s° |
217
|
|
5s |
6 |
|
|
|
|
16s |
179
|
|
aac |
6 |
|
cds |
118 |
|
cds |
386
|
|
**41aas |
12 |
|
5s |
126 |
IV3 |
16s |
321
|
|
gta |
75 |
|
23s |
321 |
|
23s |
181
|
|
cds |
308 |
I3 |
16s |
292 |
|
5s |
6
|
|
cds |
|
|
cds |
|
|
aac |
6
|
|
|
|
|
|
|
|
**17aas |
8
|
|
cds |
281 |
|
cds |
179 |
|
aaa |
353
|
|
16s° |
100 |
|
16s |
161 |
|
5s |
126
|
|
23s° |
126 |
|
5s |
201 |
|
23s' |
582
|
X1 |
5s |
7 |
I1 |
23s |
217 |
I4 |
16s |
217
|
|
aac |
6 |
|
16s |
108 |
|
23s |
126
|
|
**7aas |
9 |
|
atgi |
11 |
|
5s |
216
|
|
aga |
954 |
|
tta |
5 |
|
cds |
372
|
|
cds |
|
|
5s |
201 |
|
cds |
21
|
|
|
|
|
23s |
375 |
|
cds |
778
|
|
cds |
733 |
VII1 |
gca |
52 |
IV4 |
16s |
261
|
|
cds |
1 |
|
16s’ |
100 |
|
23s |
201
|
|
23s° |
126 |
|
16s’ |
52 |
|
5s |
5
|
|
5s |
177 |
|
gca |
248 |
|
tta |
11
|
|
cds |
|
|
23s° |
100 |
|
atgi |
108
|
|
|
|
|
16s° |
321 |
|
16s |
184
|
|
cds |
238 |
|
23s' |
100 |
|
23s° |
100
|
II |
16s |
320 |
|
16s° |
320 |
|
cds |
112
|
|
23s |
91 |
|
23s° |
100 |
|
23s’ |
375
|
|
gga |
8 |
|
23s’ |
126 |
|
gca |
52
|
|
5s |
273 |
|
5s |
127 |
|
16s° |
282
|
|
cds |
|
|
cds |
|
|
cds |
|
- Lien tableur: cdc8 cdc psor 43
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
- - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 |
43aas |
cdc |
43aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
1 |
|
|
|
cds |
100 |
16s |
279 |
|
23s° |
181 |
23s |
180 |
-1
|
5s |
6 |
5s |
6 |
0
|
aac |
6 |
aac |
6 |
0
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
5 |
gga |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
9 |
0
|
aca |
14 |
aca |
14 |
0
|
tac |
10 |
tac |
8 |
-2
|
cta |
28 |
cta |
29 |
1
|
aga |
7 |
aga |
7 |
0
|
caa |
89 |
caa |
88 |
-1
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
6 |
0
|
atgj |
11 |
atgj |
11 |
0
|
atgi |
29 |
atgi |
23 |
-6
|
cca |
7 |
cca |
7 |
0
|
cac |
8 |
cac |
8 |
0
|
aaa |
7 |
aaa |
7 |
0
|
tgc |
6 |
tgc |
6 |
0
|
aac |
6 |
aac |
5 |
-1
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
9 |
gaa |
9 |
0
|
gga |
5 |
gga |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
9 |
0
|
aca |
14 |
aca |
14 |
0
|
tac |
9 |
tac |
9 |
0
|
cta |
24 |
cta |
23 |
-1
|
ggc |
24 |
ggc |
24 |
0
|
aga |
9 |
aga |
9 |
0
|
caa |
8 |
caa |
8 |
0
|
aaa |
2 |
aaa |
2 |
0
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
6 |
0
|
atgj |
11 |
atgj |
11 |
0
|
atgi |
17 |
atgi |
17 |
0
|
cac |
8 |
cac |
8 |
0
|
aaa |
7 |
aaa |
7 |
0
|
tgc |
7 |
tgc |
7 |
0
|
cgt |
12 |
cgt |
12 |
0
|
gta |
75 |
gta |
75 |
0
|
cds |
|
cds |
|
|
|
|
|
|
|
|
C32. Comparaison cdc8-psor 43
cdc8 |
43aas |
psor |
44aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
1 |
|
|
|
cds |
100 |
16s |
196 |
|
23s° |
181 |
23s |
122 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
10 |
tac |
15 |
5
|
cta |
28 |
cta |
14 |
-14
|
aga |
7 |
aga |
7 |
0
|
caa |
89 |
caa |
11 |
|
tca |
3 |
aaa |
6 |
|
ttc |
6 |
tca |
3 |
0
|
atgj |
11 |
ttc |
9 |
3
|
atgi |
29 |
atg |
8 |
-3
|
cca |
7 |
atg |
21 |
-8
|
cac |
8 |
cca |
6 |
-1
|
aaa |
7 |
cac |
4 |
|
tgc |
6 |
tgc |
25 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
4 |
|
aca |
14 |
aca |
4 |
-10
|
tac |
9 |
tac |
15 |
6
|
cta |
24 |
cta |
11 |
-13
|
ggc |
24 |
ggc |
13 |
-11
|
aga |
9 |
aga |
7 |
-2
|
caa |
8 |
caa |
11 |
3
|
aaa |
2 |
aaa |
6 |
4
|
tca |
3 |
tca |
3 |
0
|
ttc |
6 |
ttc |
9 |
3
|
atgj |
11 |
atg |
8 |
-3
|
atgi |
17 |
atg |
21 |
|
cac |
8 |
cca |
6 |
|
aaa |
7 |
cac |
9 |
1
|
tgc |
7 |
aaa |
21 |
14
|
cgt |
12 |
tgc |
6 |
-1
|
gta |
75 |
cgt |
10 |
-2
|
cds |
|
gta |
162 |
|
|
|
cds |
|
|
|
- Lien tableur: cdc8 cdc psor 18
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
- - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
- - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
- - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 |
18aas |
cdc |
18aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
|
|
|
cds |
167 |
16s |
279 |
|
23s° |
132 |
23s |
131 |
-1
|
5s |
6 |
5s |
6 |
0
|
aac |
4 |
aac |
4 |
0
|
gaa |
5 |
gaa |
5 |
0
|
gta |
5 |
gta |
5 |
0
|
gac |
11 |
gac |
10 |
-1
|
aca |
14 |
aca |
14 |
0
|
tac |
9 |
tac |
9 |
0
|
gga |
10 |
gga |
10 |
0
|
aga |
9 |
aga |
9 |
0
|
caa |
11 |
caa |
11 |
0
|
aaa |
2 |
aaa |
2 |
0
|
tca |
18 |
tca |
17 |
-1
|
agc |
8 |
agc |
8 |
0
|
cca |
85 |
cca |
85 |
0
|
tgg |
60 |
tgg |
60 |
0
|
cca |
5 |
cca |
6 |
1
|
atc |
3 |
atc |
3 |
0
|
ttc |
7 |
ttc |
7 |
0
|
atgj |
114 |
atgj |
114 |
0
|
|
|
|
|
|
|
|
|
|
|
cdc8 |
18aas |
psor |
23aas |
|
gène |
intercal |
gène |
intercal |
diff
|
|
|
16s |
196 |
|
|
|
23s |
213 |
|
cds |
214 |
5s |
5 |
|
cds |
554 |
tta |
13 |
|
cds |
0 |
atg |
15 |
|
cds |
167 |
gaa |
9 |
|
23s° |
132 |
gga |
6 |
|
5s |
6 |
gta |
5 |
0
|
aac |
4 |
gac |
16 |
|
gaa |
5 |
aac |
31 |
|
gta |
5 |
aac |
4 |
|
gac |
11 |
aca |
4 |
-10
|
aca |
14 |
tac |
11 |
2
|
tac |
9 |
gga |
19 |
9
|
gga |
10 |
aga |
6 |
-3
|
aga |
9 |
caa |
12 |
1
|
caa |
11 |
aaa |
6 |
4
|
aaa |
2 |
tca |
11 |
-7
|
tca |
18 |
agc |
6 |
-2
|
agc |
8 |
cca |
6 |
|
cca |
85 |
atg |
11 |
|
tgg |
60 |
tgg |
31 |
-29
|
cca |
5 |
cca |
6 |
1
|
atc |
3 |
atc |
6 |
3
|
ttc |
7 |
ttc |
13 |
6
|
atgj |
114 |
atg |
138 |
24
|
|
C34. Comparaison cdc8-cdc-psor 19
cdc8 |
19aas |
psor |
23aas |
|
gene |
intercal |
gene |
intercal |
diff
|
16s |
321 |
16s |
196 |
|
23s |
181 |
23s |
213 |
|
5s |
6 |
5s |
5 |
|
aac |
6 |
tta |
13 |
-2
|
tta |
15 |
atg |
15 |
8
|
atgf |
7 |
gaa |
9 |
0
|
gaa |
9 |
gga |
6 |
1
|
gga |
5 |
gta |
5 |
0
|
gta |
5 |
gac |
16 |
|
gac |
9 |
aac |
31 |
|
aca |
14 |
aac |
4 |
|
tac |
10 |
aca |
4 |
-10
|
cta |
28 |
tac |
11 |
|
aga |
7 |
gga |
19 |
|
caa |
89 |
aga |
6 |
-1
|
tca |
3 |
caa |
12 |
|
ttc |
6 |
aaa |
6 |
|
atgj |
11 |
tca |
11 |
|
atgi |
29 |
agc |
6 |
|
cca |
7 |
cca |
6 |
|
cac |
8 |
atg |
11 |
|
aaa |
353 |
tgg |
31 |
|
|
|
cca |
6 |
|
|
|
atc |
6 |
|
|
|
ttc |
13 |
|
|
|
atg |
138 |
|
cdc8 |
19aas |
cdc8 |
18aas |
|
gène |
intercal |
gène |
intercal |
diff
|
|
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
|
16s |
321 |
cds |
167 |
|
23s |
181 |
23s° |
132 |
|
5s |
6 |
5s |
6 |
|
aac |
6 |
aac |
4 |
|
tta |
15 |
gaa |
5 |
|
atgf |
7 |
gta |
5 |
0
|
gaa |
9 |
gac |
11 |
2
|
gga |
5 |
aca |
14 |
0
|
gta |
5 |
tac |
9 |
|
gac |
9 |
gga |
10 |
|
aca |
14 |
aga |
9 |
2
|
tac |
10 |
caa |
11 |
|
cta |
28 |
aaa |
2 |
|
aga |
7 |
tca |
18 |
|
caa |
89 |
agc |
8 |
|
tca |
3 |
cca |
85 |
|
ttc |
6 |
tgg |
60 |
|
atgj |
11 |
cca |
5 |
|
atgi |
29 |
atc |
3 |
|
cca |
7 |
ttc |
7 |
|
cac |
8 |
atgj |
114 |
|
aaa |
353 |
|
|
|
|
|
|
|
|
|
- Lien tableur: cdc8 cdc psor 9
- Lien cdc psor: le tableau de comparaison cdc-psor
- Légende
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - cca: marque les tRNAs différents entre les 2 génomes.
- - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
- - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
- Notes:
- - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
- - cdc8 9aas et cdc 9aas sont identiques
- - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
- - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
- - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca 5s-tta tta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 |
18aas |
cdc8 |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
214 |
|
|
|
cds |
554 |
|
|
|
cds |
0 |
cds |
281 |
|
cds |
167 |
16s° |
100 |
|
23s° |
132 |
23s° |
126 |
|
5s |
6 |
5s |
7 |
|
aac |
4 |
aac |
6 |
|
gaa |
5 |
tta |
15 |
|
gta |
5 |
atgf |
7 |
|
gac |
11 |
gaa |
8 |
|
aca |
14 |
gga |
4 |
|
tac |
9 |
gta |
5 |
0
|
gga |
10 |
gac |
10 |
|
aga |
9 |
ggc |
9 |
|
caa |
11 |
aga |
954 |
|
aaa |
2 |
cds |
|
|
tca |
18 |
|
|
|
agc |
8 |
|
|
|
cca |
85 |
|
|
|
tgg |
60 |
|
|
|
cca |
5 |
|
|
|
atc |
3 |
|
|
|
ttc |
7 |
|
|
|
atgj |
114 |
|
|
|
cdc8 |
19aas |
cdc8 |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
|
|
cds |
281 |
|
16s |
321 |
16s° |
100 |
|
23s |
181 |
23s° |
126 |
|
5s |
6 |
5s |
7 |
|
aac |
6 |
aac |
6 |
0
|
tta |
15 |
tta |
15 |
9
|
atgf |
7 |
atgf |
7 |
-8
|
gaa |
9 |
gaa |
8 |
1
|
gga |
5 |
gga |
4 |
-5
|
gta |
5 |
gta |
5 |
0
|
gac |
9 |
gac |
10 |
|
aca |
14 |
ggc |
9 |
|
tac |
10 |
aga |
954 |
|
cta |
28 |
cds |
|
|
aga |
7 |
|
|
|
caa |
89 |
|
|
|
tca |
3 |
|
|
|
ttc |
6 |
|
|
|
atgj |
11 |
|
|
|
atgi |
29 |
|
|
|
cca |
7 |
|
|
|
cac |
8 |
|
|
|
aaa |
353 |
|
|
|
|
|
|
|
|
|
C36. Comparaison cdc8-cdc-psor groupe
cdc8 |
9aas |
cdc |
9aas |
|
gene |
intercal |
gene |
intercal |
diff
|
cds |
281 |
16s |
52 |
|
16s° |
100 |
gca |
373 |
|
23s° |
126 |
23s |
126 |
|
5s |
7 |
5s |
7 |
|
aac |
6 |
aac |
5 |
-1
|
tta |
15 |
tta |
15 |
0
|
atgf |
7 |
atgf |
7 |
0
|
gaa |
8 |
gaa |
14 |
6
|
gga |
4 |
gga |
5 |
1
|
gta |
5 |
gta |
5 |
0
|
gac |
10 |
gac |
10 |
0
|
ggc |
9 |
ggc |
9 |
0
|
aga |
954 |
aga |
975 |
21
|
cds |
|
cds |
|
|
cdc8 |
I4 |
cdc |
VIII1 |
|
gene |
intercal |
gene |
intercal |
diff
|
|
|
16s |
68 |
|
16s |
217 |
gca |
271 |
|
23s |
126 |
23s |
126 |
0
|
5s |
216 |
5s |
213 |
-3
|
cds |
372 |
cds |
372 |
0
|
cds |
21 |
cds |
21 |
0
|
cds |
778 |
cds |
776 |
-2
|
16s |
261 |
16s |
52 |
|
23s |
201 |
gca |
373 |
|
5s |
5 |
23s |
126 |
-75
|
|
|
5s |
7 |
2
|
psor |
VII1 |
cdc8 |
VII1 |
|
gene |
intercal |
gene |
intercal |
diff
|
CDS |
431 |
cds |
179 |
|
16s |
54 |
16s |
161 |
|
gca |
114 |
5s |
201 |
|
23s |
193 |
23s |
217 |
|
5s |
5 |
16s |
108 |
|
tta |
9 |
atgi |
11 |
2
|
atg |
123 |
tta |
5 |
0
|
16s |
54 |
5s |
201 |
8
|
gca |
114 |
23s |
375 |
261
|
23s |
193 |
gca |
52 |
-2
|
5s |
5 |
16s’ |
100 |
-23
|
tta |
9 |
16s’ |
52 |
|
atg |
123 |
gca |
248 |
|
16s |
54 |
23s° |
100 |
-2
|
gca |
114 |
16s° |
321 |
134
|
23s |
78 |
23s' |
100 |
|
5s |
100 |
16s° |
320 |
|
CDS |
|
23s° |
100 |
|
|
|
23s’ |
126 |
|
|
|
5s |
127 |
|
|
|
cds |
|
|
|
- Notes:
- - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.
- Lien tableur: Alignement sur cdc
- Lien noms abrégés
- Légende: abrégé pour noms abrégés des protéines.
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
- Notes:
- - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
- - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
- - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
- - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre |
sens |
adresse |
gene |
intercal |
pbs |
abrégé
|
0 |
dir |
9857..10630 |
cds |
179 |
774 |
SigB
|
|
dir |
10810..12317 |
16s |
52 |
1508 |
|
|
dir |
12370..12445 |
gca |
249 |
76 |
|
1 |
dir |
12695..15596 |
23s |
111 |
2902 |
|
|
dir |
15708..15824 |
5s |
126 |
117 |
|
|
dir |
15951..16460 |
cds |
11 |
510 |
NadR
|
|
dir |
16472..17353 |
cds |
457 |
882 |
mecano
|
|
dir |
17811..19082 |
cds |
319 |
1272 |
S-ligase
|
|
dir |
19402..19857 |
cds |
0 |
456 |
Nuc-de
|
|
dir |
19858..19949 |
tcc |
37 |
92 |
|
2 |
dir |
19987..20251 |
ncRNA |
76 |
265 |
|
|
dir |
20328..21965 |
cds |
|
1638 |
III-tau
|
|
|
|
|
|
|
|
|
comp |
23419..24624 |
cds |
505 |
1206 |
Glyco-tr
|
|
dir |
25130..26637 |
16s |
279 |
1508 |
|
|
dir |
26917..29816 |
23s |
180 |
2900 |
|
|
dir |
29997..30113 |
5s |
6 |
117 |
|
3 |
dir |
30120..30194 |
aac |
6 |
75 |
|
|
dir |
|
**41aas |
12 |
|
|
|
dir |
33877..33952 |
gta |
75 |
76 |
|
|
dir |
34028..34441 |
cds |
308 |
414 |
hp-414
|
|
dir |
34750..38181 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dir |
127011..127715 |
cds |
281 |
705 |
CwlD
|
|
dir |
127997..129505 |
16s |
279 |
1509 |
|
|
dir |
129785..132685 |
23s |
131 |
2901 |
|
|
dir |
132817..132933 |
5s |
6 |
117 |
|
4 |
dir |
132940..133014 |
aac |
4 |
75 |
|
|
dir |
|
**16aas |
8 |
|
|
|
dir |
134534..134610 |
atgj |
114 |
77 |
|
|
dir |
134725..136115 |
16s |
68 |
1391 |
|
|
dir |
136184..136259 |
gca |
271 |
76 |
|
|
dir |
136531..139430 |
23s |
126 |
2900 |
|
|
dir |
139557..139673 |
5s |
213 |
117 |
|
|
comp |
139887..141071 |
cds |
372 |
1185 |
B6
|
5 |
dir |
141444..143795 |
cds |
21 |
2352 |
Art-red
|
|
dir |
143817..144356 |
cds |
776 |
540 |
Art-reda
|
|
dir |
145133..146640 |
16s |
52 |
1508 |
|
|
dir |
146693..146768 |
gca |
373 |
76 |
|
|
dir |
147142..150041 |
23s |
126 |
2900 |
|
|
dir |
150168..150284 |
5s |
7 |
117 |
|
6 |
dir |
150292..150366 |
aac |
5 |
75 |
|
|
dir |
|
**7aas |
6 |
|
|
|
dir |
150976..151049 |
aga |
975 |
74 |
|
|
dir |
152025..152864 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
|
|
dir |
378341..380728 |
cds |
583 |
2388 |
cad
|
|
dir |
381312..382819 |
16s |
311 |
1508 |
|
|
dir |
383131..386030 |
23s |
126 |
2900 |
|
7 |
dir |
386157..386273 |
5s |
177 |
117 |
|
|
dir |
386451..387059 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
|
|
comp |
833130..833894 |
cds |
258 |
765 |
DeoR
|
8 |
dir |
834153..834243 |
agc |
87 |
91 |
|
|
dir |
834331..835119 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
|
|
dir |
1089165..1090139 |
cds |
239 |
975 |
Mannosyl
|
|
dir |
1090379..1091886 |
16s |
320 |
1508 |
|
|
dir |
1092207..1095106 |
23s |
91 |
2900 |
|
|
dir |
1095198..1095271 |
gga |
8 |
74 |
|
9 |
dir |
1095280..1095396 |
5s |
273 |
117 |
|
|
dir |
1095670..1097688 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
|
|
comp |
1181549..1182958 |
cds |
1374 |
1410 |
MBOAT
|
10 |
comp |
1184333..1184415 |
ttg |
318 |
83 |
|
|
dir |
1184734..1187382 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
|
|
dir |
1835768..1837498 |
cds |
109 |
1731 |
NhaC
|
11 |
dir |
1837608..1837688 |
cta |
231 |
81 |
|
|
<dir |
1837920..1838093 |
cds |
|
174 |
HXXEE
|
|
|
|
|
|
|
|
|
dir |
2981767..2982444 |
cds |
159 |
678 |
SrtB
|
|
comp |
2982604..2982678 |
aca |
94 |
75 |
|
|
comp |
2982773..2985672 |
23s |
184 |
2900 |
|
12 |
comp |
2985857..2987364 |
16s |
340 |
1508 |
|
|
dir |
2987705..2988643 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
|
|
comp |
3787361..3788431 |
cds |
454 |
1071 |
ABC
|
|
comp |
3788886..3789002 |
5s |
126 |
117 |
|
13 |
comp |
3789129..3792028 |
23s |
281 |
2900 |
|
|
comp |
3792310..3793817 |
16s |
191 |
1508 |
|
|
comp |
3794009..3794587 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
|
|
comp |
3944262..3944453 |
cds |
119 |
192 |
DUF378
|
|
comp |
3944573..3944689 |
5s |
126 |
117 |
|
14 |
comp |
3944816..3947715 |
23s |
217 |
2900 |
|
|
comp |
3947933..3949440 |
16s |
282 |
1508 |
|
|
comp |
3949723..3950004 |
cds |
221 |
282 |
hp-282
|
|
comp |
3950226..3951755 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
|
|
dir |
4084445..4085437 |
cds |
382 |
993 |
DnaC
|
|
comp |
4085820..4085894 |
aca |
33 |
75 |
|
15 |
comp |
4085928..4086003 |
gta |
4 |
76 |
|
|
comp |
4086008..4086082 |
gaa |
6 |
75 |
|
|
comp |
4086089..4086164 |
aaa |
326 |
76 |
|
|
comp |
4086491..4087780 |
cds |
|
1290 |
succinate
|
|
C38. cdc8 protéines
sens |
adresse |
gene |
intercal |
pbs |
abrégé
|
dir |
4194196..4196423 |
23s’ |
100 |
2228 |
|
dir |
4196524..4197091 |
16s° |
320 |
568 |
|
dir |
4197412..4199044 |
23s° |
100 |
1633 |
|
dir |
4199145..4201593 |
23s’ |
126 |
2449 |
|
dir |
4201720..4201836 |
5s |
127 |
117 |
|
dir |
4201964..4202473 |
cds |
11 |
510 |
NadR
|
dir |
4202485..4203366 |
cds |
458 |
882 |
mecano
|
dir |
4203825..4205096 |
cds |
320 |
1272 |
S-ligase
|
dir |
4205417..4205872 |
cds |
0 |
456 |
Nuc-de
|
dir |
4205873..4205964 |
tcc |
37 |
92 |
|
dir |
4206002..4206266 |
ncRNA |
76 |
265 |
|
dir |
4206343..4207980 |
cds |
|
1638 |
III-tau
|
|
|
|
|
|
|
dir |
4306341..4307538 |
16s |
0 |
1198 |
|
dir |
4307539..4308225 |
cds |
100 |
687 |
xylose
|
dir |
1..796 |
23s° |
181 |
796 |
|
dir |
978..1094 |
5s |
6 |
117 |
|
dir |
1101..1175 |
aac |
6 |
75 |
|
dir |
|
**41aas |
12 |
|
|
dir |
4868..4943 |
gta |
75 |
76 |
|
dir |
5019..5432 |
cds |
308 |
414 |
hp-414
|
dir |
5741..9172 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204
|
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
dir |
4304432..4304548 |
5s |
6 |
117 |
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
dir |
|
**16aas |
8 |
|
|
dir |
4306150..4306226 |
atgj |
114 |
77 |
|
|
|
|
|
|
|
dir |
4232593..4234098 |
16s |
217 |
1506 |
|
dir |
4234316..4237215 |
23s |
126 |
2900 |
|
dir |
4237342..4237458 |
5s |
216 |
117 |
|
comp |
4237675..4238859 |
cds |
372 |
1185 |
B6
|
dir |
4239232..4241583 |
cds |
21 |
2352 |
Art-red
|
dir |
4241605..4242144 |
cds |
778 |
540 |
Art-reda
|
dir |
94032..94736 |
cds |
281 |
705 |
CwlD
|
dir |
95018..95994 |
16s° |
100 |
977 |
|
dir |
96095..97613 |
23s° |
126 |
1519 |
|
dir |
97740..97856 |
5s |
7 |
117 |
|
dir |
97864..97938 |
aac |
6 |
75 |
|
dir |
|
**7aas |
6 |
|
|
dir |
98542..98615 |
aga |
954 |
74 |
|
dir |
99570..100409 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
dir |
306829..309216 |
cds |
733 |
2388 |
cad
|
<>comp |
309950..310076 |
cds |
1 |
127 |
seleno
|
dir |
310078..311313 |
23s° |
126 |
1236 |
|
dir |
311440..311556 |
5s |
177 |
117 |
|
dir |
311734..312342 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
258 |
765 |
DeoR
|
dir |
862879..862969 |
agc |
87 |
91 |
|
dir |
863057..863845 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
238 |
975 |
Mannosyl
|
dir |
1107690..1109197 |
16s |
320 |
1508 |
|
dir |
1109518..1112416 |
23s |
91 |
2899 |
|
dir |
1112508..1112581 |
gga |
8 |
74 |
|
dir |
1112590..1112706 |
5s |
273 |
117 |
|
dir |
1112980..1114998 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
1378 |
1410 |
MBOAT
|
comp |
1199592..1199674 |
ttg |
318 |
83 |
|
dir |
1199993..1202641 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
109 |
1731 |
NhaC
|
dir |
1852736..1852816 |
cta |
334 |
81 |
|
dir |
1853151..1853666 |
cds |
|
516 |
HXXEE
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
150 |
678 |
SrtB
|
comp |
3024866..3024940 |
aca |
93 |
75 |
|
comp |
3025034..3027933 |
23s |
184 |
2900 |
|
comp |
3028118..3029625 |
16s |
374 |
1508 |
|
dir |
3030000..3030938 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
452 |
1071 |
ABC
|
comp |
3877339..3877455 |
5s |
125 |
117 |
|
comp |
3877581..3880480 |
23s |
261 |
2900 |
|
comp |
3880742..3882249 |
16s |
190 |
1508 |
|
comp |
3882440..3883018 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
118 |
192 |
DUF378
|
comp |
4017833..4017949 |
5s |
126 |
117 |
|
comp |
4018076..4020975 |
23s |
321 |
2900 |
|
comp |
4021297..4022804 |
16s |
292 |
1508 |
|
comp |
4023097..4023378 |
cds |
221 |
282 |
hp-282
|
comp |
4023600..4025129 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
383 |
993 |
DnaC
|
comp |
4137257..4137331 |
aca |
33 |
75 |
|
comp |
4137365..4137440 |
gta |
4 |
76 |
|
comp |
4137445..4137519 |
gaa |
6 |
75 |
|
comp |
4137526..4137601 |
aaa |
331 |
76 |
|
comp |
4137933..4139222 |
cds |
|
1290 |
succinate
|
|
- Lien tableur: Alignement sur cdc8
- Lien noms abrégés
- Légende:
- - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
- - 23s°: 23S ribosomal RNA rRNA prediction is too short
- - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
- Notes:
- - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
- - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
- - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
- - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8 |
|
|
|
|
|
|
ordre cdc |
sens |
adresse |
gène |
intercal |
pbs |
abrégé
|
insert |
dir |
4299490..4300134 |
cds |
214 |
645 |
Y-r1
|
insert |
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix
|
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740
|
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204
|
|
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
4 |
dir |
4304432..4304548 |
5s |
6 |
117 |
|
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
|
dir |
4304634..4304708 |
gaa |
5 |
75 |
|
|
dir |
4304555..4304629 |
aac |
4 |
75 |
|
|
dir |
|
**16aas |
8 |
|
|
|
dir |
4306150..4306226 |
atgj |
114 |
77 |
|
|
dir |
4306341..4307538 |
16s |
0 |
1198 |
|
|
dir |
4307539..4308225 |
cds |
100 |
687 |
xylose
|
|
dir |
1..796 |
23s° |
181 |
796 |
|
3 |
dir |
978..1094 |
5s |
6 |
117 |
|
|
dir |
1101..1175 |
aac |
6 |
75 |
|
|
dir |
|
**41aas |
12 |
|
|
|
dir |
4868..4943 |
gta |
75 |
76 |
|
|
dir |
5019..5432 |
cds |
308 |
414 |
hp-414
|
|
dir |
5741..9172 |
cds |
|
3432 |
pyruvate
|
|
|
|
|
|
|
|
|
dir |
94032..94736 |
cds |
281 |
705 |
CwlD
|
|
dir |
95018..95994 |
16s° |
100 |
977 |
|
|
dir |
96095..97613 |
23s° |
126 |
1519 |
|
6 |
dir |
97740..97856 |
5s |
7 |
117 |
|
|
dir |
97864..97938 |
aac |
6 |
75 |
|
|
dir |
|
**7aas |
6 |
|
|
|
dir |
98542..98615 |
aga |
954 |
74 |
|
|
dir |
99570..100409 |
cds |
|
840 |
TIGR
|
|
|
|
|
|
|
|
|
<> cp |
309950..310076 |
cds |
1 |
127 |
seleno
|
|
dir |
310078..311313 |
23s° |
126 |
1236 |
|
7 |
dir |
311440..311556 |
5s |
177 |
117 |
|
|
dir |
311734..312342 |
cds |
|
609 |
DedA
|
|
|
|
|
|
|
|
|
comp |
861856..862620 |
cds |
258 |
765 |
DeoR
|
8 |
dir |
862879..862969 |
agc |
87 |
91 |
|
|
dir |
863057..863845 |
cds |
|
789 |
flagellar
|
|
|
|
|
|
|
|
|
dir |
1106477..1107451 |
cds |
238 |
975 |
Mannosyl
|
|
dir |
1107690..1109197 |
16s |
320 |
1508 |
|
|
dir |
1109518..1112416 |
23s |
91 |
2899 |
|
|
dir |
1112508..1112581 |
gga |
8 |
74 |
|
9 |
dir |
1112590..1112706 |
5s |
273 |
117 |
|
|
dir |
1112980..1114998 |
cds |
|
2019 |
Ala amid
|
|
|
|
|
|
|
|
|
comp |
1196804..1198213 |
cds |
1378 |
1410 |
MBOAT
|
10 |
comp |
1199592..1199674 |
ttg |
318 |
83 |
|
|
dir |
1199993..1202641 |
cds |
|
2649 |
PolyI
|
|
|
|
|
|
|
|
|
dir |
1850896..1852626 |
cds |
109 |
1731 |
NhaC
|
11 |
dir |
1852736..1852816 |
cta |
334 |
81 |
|
|
dir |
1853151..1853666 |
cds |
|
516 |
HXXEE
|
|
|
|
|
|
|
|
|
dir |
3024038..3024715 |
cds |
150 |
678 |
SrtB
|
|
comp |
3024866..3024940 |
aca |
93 |
75 |
|
12 |
comp |
3025034..3027933 |
23s |
184 |
2900 |
|
|
comp |
3028118..3029625 |
16s |
374 |
1508 |
|
|
dir |
3030000..3030938 |
cds |
|
939 |
lactam
|
|
|
|
|
|
|
|
insert |
dir |
3805298..3806743 |
cds |
208 |
1446 |
Y-r2
|
insert |
comp |
3806952..3807028 |
agg |
61 |
77 |
|
insert |
<comp |
3807090..3808790 |
cds |
|
1701 |
fdHa
|
|
|
|
|
|
|
|
|
comp |
3875816..3876886 |
cds |
452 |
1071 |
ABC
|
|
comp |
3877339..3877455 |
5s |
125 |
117 |
|
13 |
comp |
3877581..3880480 |
23s |
261 |
2900 |
|
|
comp |
3880742..3882249 |
16s |
190 |
1508 |
|
|
comp |
3882440..3883018 |
cds |
|
579 |
precorrin
|
|
|
|
|
|
|
|
|
comp |
4017523..4017714 |
cds |
118 |
192 |
DUF378
|
|
comp |
4017833..4017949 |
5s |
126 |
117 |
|
14 |
comp |
4018076..4020975 |
23s |
321 |
2900 |
|
|
comp |
4021297..4022804 |
16s |
292 |
1508 |
|
|
comp |
4023097..4023378 |
cds |
221 |
282 |
hp-282
|
|
comp |
4023600..4025129 |
cds |
|
1530 |
K-ligase
|
|
|
|
|
|
|
|
|
dir |
4135881..4136873 |
cds |
383 |
993 |
DnaC
|
|
comp |
4137257..4137331 |
aca |
33 |
75 |
|
15 |
comp |
4137365..4137440 |
gta |
4 |
76 |
|
|
comp |
4137445..4137519 |
gaa |
6 |
75 |
|
|
comp |
4137526..4137601 |
aaa |
331 |
76 |
|
|
comp |
4137933..4139222 |
cds |
|
1290 |
succinate
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C40. cdc8 suite
cdc8 |
|
|
|
|
|
|
psor |
|
|
|
|
ordre cdc |
sens |
adresse |
gène |
intercal |
pbs |
abrégé |
adresse |
gène |
intercal |
pbs |
abrégé
|
0 |
dir |
4178197..4178970 |
cds |
179 |
774 |
SigB |
127845..129260 |
CDS |
100 |
1416 |
R-deca
|
insert |
dir |
4179150..4180587 |
16s |
161 |
1438 |
|
127628..127744 |
5s |
78 |
|
|
insert |
comp |
4180749..4180865 |
5s |
201 |
117 |
|
124628..127549 |
23s |
114 |
|
|
insert |
comp |
4181067..4183959 |
23s |
217 |
2893 |
|
124438..124513 |
gca |
54 |
|
|
insert |
comp |
4184177..4185684 |
16s |
108 |
1508 |
|
122877..124383 |
16s |
123 |
|
|
insert |
comp |
4185793..4185869 |
atgi |
11 |
77 |
|
122677..122753 |
atg |
9 |
|
|
insert |
comp |
4185881..4185969 |
tta |
5 |
89 |
|
122579..122667 |
tta |
5 |
|
|
insert |
comp |
4185975..4186091 |
5s |
201 |
117 |
|
122457..122573 |
5s |
193 |
|
|
insert |
comp |
4186293..4189192 |
23s |
375 |
2900 |
|
119347..122263 |
23s |
114 |
|
|
insert |
comp |
4189568..4189643 |
gca |
52 |
76 |
|
119157..119232 |
gca |
54 |
|
|
insert |
comp |
4189696..4190959 |
16s’ |
100 |
1264 |
|
117596..119102 |
16s |
123 |
|
|
insert |
dir |
4191060..4192225 |
16s’ |
52 |
1166 |
|
117396..117472 |
atg |
9 |
|
|
insert |
dir |
4192278..4192353 |
gca |
248 |
76 |
|
117298..117386 |
tta |
5 |
|
|
insert |
dir |
4192602..4193197 |
23s° |
100 |
596 |
|
117176..117292 |
5s |
193 |
|
|
insert |
dir |
4193298..4193874 |
16s° |
321 |
577 |
|
114067..116982 |
23s |
114 |
|
|
insert |
dir |
4194196..4196423 |
23s’ |
100 |
2228 |
|
113877..113952 |
gca |
54 |
|
|
|
dir |
4196524..4197091 |
16s° |
320 |
568 |
|
112316..113822 |
16s |
431 |
|
|
1 |
dir |
4197412..4199044 |
23s° |
100 |
1633 |
|
111345..111884 |
CDS |
|
540 |
Art-reda
|
|
dir |
4199145..4201593 |
23s’ |
126 |
2449 |
|
|
|
|
|
|
|
dir |
4201720..4201836 |
5s |
127 |
117 |
|
|
|
|
|
|
|
dir |
4201964..4202473 |
cds |
11 |
510 |
NadR |
|
|
|
|
|
|
dir |
4202485..4203366 |
cds |
458 |
882 |
mecano |
|
|
|
|
|
|
dir |
4203825..4205096 |
cds |
320 |
1272 |
S-ligase |
|
|
|
|
|
|
dir |
4205417..4205872 |
cds |
0 |
456 |
Nuc-de |
|
|
|
|
|
|
dir |
4205873..4205964 |
tcc |
37 |
92 |
|
|
|
|
|
|
2 |
dir |
4206002..4206266 |
ncRNA |
76 |
265 |
|
|
|
|
|
|
|
dir |
4206343..4207980 |
cds |
|
1638 |
III-tau |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
insert |
comp |
4209435..4210639 |
cds |
496 |
1205 |
Glyco-tr |
|
|
|
|
|
insert |
|
4211136..4212643 |
16s |
321 |
1508 |
|
|
|
|
|
|
insert |
|
4212965..4213127 |
23s° |
100 |
163 |
|
|
|
|
|
|
insert |
<>comp |
4213228..4213849 |
cds |
|
622 |
CHAP |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
insert |
comp |
4213961..4214620 |
cds |
228 |
660 |
A-1chlor |
|
|
|
|
|
insert |
dir |
4214849..4216199 |
16s |
321 |
1351 |
|
|
|
|
|
|
insert |
dir |
4216521..4217008 |
23s° |
101 |
488 |
|
|
|
|
|
|
insert |
comp |
4217110..4218529 |
23s° |
250 |
1420 |
|
|
|
|
|
|
insert |
comp |
4218780..4218855 |
gca |
52 |
76 |
|
|
|
|
|
|
insert |
comp |
4218908..4219471 |
16s° |
100 |
564 |
|
|
|
|
|
|
insert |
comp |
4219572..4219856 |
23s° |
217 |
285 |
|
|
|
|
|
|
insert |
comp |
4220074..4221581 |
16s |
179 |
1508 |
|
|
|
|
|
|
insert |
>comp |
4221761..4222206 |
cds |
386 |
446 |
SigB2 |
3452349..3452552 |
CDS |
239 |
204 |
hp-204
|
insert |
dir |
4222593..4224100 |
16s |
321 |
1508 |
|
3450603..3452109 |
16s |
196 |
|
|
insert |
dir |
4224422..4227321 |
23s |
181 |
2900 |
|
3447492..3450406 |
23s |
213 |
|
|
insert |
dir |
4227503..4227619 |
5s |
6 |
117 |
|
3447162..3447278 |
5s |
5 |
|
|
insert |
dir |
4227626..4227700 |
aac |
6 |
75 |
|
3447068..3447156 |
tta |
13 |
|
|
insert |
dir |
4227707..4227792 |
tta |
15 |
86 |
|
3446979..3447054 |
atg |
15 |
|
|
insert |
dir |
4227808..4227883 |
atgf |
7 |
76 |
|
3446889..3446963 |
gaa |
9 |
|
|
insert |
dir |
4227891..4227965 |
gaa |
9 |
75 |
|
3446806..3446879 |
gga |
6 |
|
|
insert |
dir |
4227975..4228048 |
gga |
5 |
74 |
|
3446724..3446799 |
gta |
5 |
|
|
insert |
dir |
4228054..4228129 |
gta |
5 |
76 |
|
3446642..3446718 |
gac |
16 |
|
|
insert |
dir |
4228135..4228211 |
gac |
9 |
77 |
|
3446550..3446625 |
aac |
31 |
|
|
insert |
dir |
4228221..4228295 |
aca |
14 |
75 |
|
3446443..3446518 |
aac |
4 |
|
|
insert |
dir |
4228310..4228394 |
tac |
10 |
85 |
|
3446364..3446438 |
aca |
4 |
|
|
insert |
dir |
4228405..4228488 |
cta |
28 |
84 |
|
3446275..3446359 |
tac |
11 |
|
|
insert |
dir |
4228517..4228593 |
aga |
7 |
77 |
|
3446190..3446263 |
gga |
19 |
|
|
insert |
dir |
4228601..4228676 |
caa |
89 |
76 |
|
3446094..3446170 |
aga |
6 |
|
|
insert |
dir |
4228766..4228854 |
tca |
3 |
89 |
|
3446012..3446087 |
caa |
12 |
|
|
insert |
dir |
4228858..4228933 |
ttc |
6 |
76 |
|
3445924..3445999 |
aaa |
6 |
|
|
insert |
dir |
4228940..4229016 |
atgj |
11 |
77 |
|
3445829..3445917 |
tca |
11 |
|
|
insert |
dir |
4229028..4229104 |
atgi |
29 |
77 |
|
3445727..3445817 |
agc |
6 |
|
|
insert |
dir |
4229134..4229210 |
cca |
7 |
77 |
|
3445644..3445720 |
cca |
6 |
|
|
insert |
dir |
4229218..4229294 |
cac |
8 |
77 |
|
3445561..3445637 |
atg |
11 |
|
|
insert |
dir |
4229303..4229378 |
aaa |
353 |
76 |
|
3445474..3445549 |
tgg |
31 |
|
|
insert |
comp |
4229732..4229848 |
5s |
126 |
117 |
|
3445366..3445442 |
cca |
6 |
|
|
insert |
comp |
4229975..4232010 |
23s’ |
582 |
2036 |
|
3445283..3445359 |
atc |
6 |
|
|
|
dir |
4232593..4234098 |
16s |
217 |
1506 |
|
3445201..3445276 |
ttc |
13 |
|
|
|
dir |
4234316..4237215 |
23s |
126 |
2900 |
|
3445111..3445187 |
atg |
|
|
|
|
dir |
4237342..4237458 |
5s |
216 |
117 |
|
|
|
|
|
|
|
comp |
4237675..4238859 |
cds |
372 |
1185 |
B6 |
|
|
|
|
|
5 |
dir |
4239232..4241583 |
cds |
21 |
2352 |
Art-red |
|
|
|
|
|
|
dir |
4241605..4242144 |
cds |
778 |
540 |
Art-reda |
|
|
|
|
|
insert |
dir |
4242923..4244459 |
16s |
261 |
1537 |
|
|
|
|
|
|
insert |
dir |
4244721..4247619 |
23s |
201 |
2899 |
|
|
|
|
|
|
insert |
dir |
4247821..4247937 |
5s |
5 |
117 |
|
111345..111884 |
CDS |
431 |
540 |
Art-reda
|
insert |
dir |
4247943..4248031 |
tta |
11 |
89 |
|
112316..113822 |
16s |
54 |
|
|
insert |
dir |
4248043..4248119 |
atgi |
108 |
77 |
|
113877..113952 |
gca |
114 |
|
|
insert |
dir |
4248228..4249735 |
16s |
184 |
1508 |
|
114067..116982 |
23s |
193 |
|
|
insert |
dir |
4249920..4250564 |
23s° |
100 |
645 |
|
117176..117292 |
5s |
5 |
|
|
insert |
<dir |
4250665..4250923 |
cds |
112 |
259 |
hp-259 |
117298..117386 |
tta |
9 |
|
|
insert |
comp |
4251036..4253145 |
23s’ |
375 |
2110 |
|
117396..117472 |
atg |
123 |
|
|
insert |
comp |
4253521..4253596 |
gca |
52 |
76 |
|
117596..119102 |
16s |
54 |
|
|
insert |
comp |
4253649..4254226 |
16s° |
282 |
578 |
|
119157..119232 |
gca |
114 |
|
|
insert |
dir |
4254509..4254712 |
cds |
12 |
204 |
hp-204 |
119347..122263 |
23s |
193 |
|
|
insert |
dir |
4254725..4256002 |
cds |
|
1278 |
phagePP |
122457..122573 |
5s |
5 |
|
|
|
|
|
|
|
|
|
122579..122667 |
tta |
9 |
|
|
début |
début |
début |
début |
début |
début |
début |
122677..122753 |
atg |
123 |
|
|
insert |
dir |
4299490..4300134 |
cds |
214 |
645 |
Y-r1 |
122877..124383 |
16s |
54 |
|
|
insert |
dir |
4300349..4300807 |
cds |
554 |
459 |
Helix |
124438..124513 |
gca |
114 |
|
|
|
dir |
4301362..4303101 |
cds |
0 |
1740 |
hp-1740 |
124628..127549 |
23s |
78 |
|
|
|
dir |
4303102..4303305 |
cds |
167 |
204 |
hp-204 |
127628..127744 |
5s |
100 |
|
|
4 |
dir |
4303473..4304299 |
23s° |
132 |
827 |
|
127845..129260 |
CDS |
|
1416 |
R-deca
|
|
- Lien tableur: cdc8 cdc création de cds
- Lien abrégé
- Notes:
- - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
- - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
- - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
- - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
- - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
- - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
- Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
- - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégé |
cdc8 |
pbs |
cdc |
pbs |
psor |
pbs
|
seleno A |
309950..310076 |
127 |
0 |
|
- |
|
Y-r |
457663..457878 |
216 |
457207..457422 |
216 |
- |
|
|
1237414..1237986 |
573 |
1223841..1224413 |
573 |
|
|
|
1291413..1292327 |
915 |
1277836..1278750 |
915 |
|
|
|
1418672..1419580 |
909 |
1405262..1406170 |
909 |
|
|
|
2120221..2121348 |
1128 |
|
|
|
|
|
2785863..2786042 |
180 |
|
|
|
|
|
3564835..3565434 |
600 |
|
|
|
|
Y-r2 |
3805298..3806743 |
1446 |
|
|
|
|
Y-r1 |
4299490..4300134 |
645 |
|
|
|
|
Helix |
351106..351336 |
231 |
391813..392001 |
189 |
- |
|
|
379952..380503 |
552 |
429510..430061 |
552 |
|
|
|
456588..456776 |
189 |
461727..462398 |
672 |
|
|
|
1187185..1187736 |
552 |
1169984..1170535 |
552 |
|
|
|
1466364..1466783 |
420 |
1292255..1292926 |
672 |
|
|
|
1467749..1468147 |
399 |
1454375..1454773 |
399 |
|
|
|
1605760..1606344 |
585 |
1517855..1518619 |
765 |
|
|
|
1694358..1694750 |
393 |
1592306..1592890 |
585 |
|
|
|
1936722..1937267 |
546 |
1682266..1682658 |
393 |
|
|
|
2105662..2106711 |
1050 |
1695592..1696284 |
693 |
|
|
|
2196549..2198204 |
1656 |
1916424..1916630 |
207 |
|
|
|
2342487..2342690 |
204 |
1922813..1923358 |
546 |
|
|
|
2353934..2354578 |
645 |
2164151..2165806 |
1656 |
|
|
|
2378761..2379891 |
1131 |
2308386..2308589 |
204 |
|
|
|
2721795..2722316 |
522 |
2319833..2320477 |
645 |
|
|
|
3485137..3486024 |
888 |
2344477..2345607 |
1131 |
|
|
|
3570953..3571183 |
231 |
2501260..2501931 |
672 |
|
|
|
3571660..3571878 |
219 |
2688255..2688776 |
522 |
|
|
|
3804379..3804627 |
249 |
3459701..3460588 |
888 |
|
|
|
3804878..3805279 |
402 |
3475449..3475589 |
141 |
|
|
|
4286854..4287222 |
369 |
|
|
|
|
|
4288799..4289518 |
720 |
|
|
|
|
|
4300349..4300807 |
459 |
|
|
|
|
xylose |
3383443..3384780 |
1338 |
3349843..3351180 |
1338 |
0 |
|
|
<4307539..4308225 |
687 |
|
|
|
|
CHAP |
<4213228..>4213849 |
622 |
0 |
|
- |
|
A-1chlor |
4213961..4214620 |
660 |
0 |
|
0 |
|
SigB2 |
4221761..4222206 |
446 |
0 |
|
0 |
|
fdHa |
4221761..4222206 |
1701 |
3711229..3713373 |
2145 |
- |
|
R-deca |
0 |
|
0 |
|
127845..129260 |
1416
|
|
|
|
|
|
876023..877522 |
1500
|
phagePP |
1448919..1449983 |
1065 |
1435547..1436611 |
1065 |
1489507..1490769 |
1263
|
|
1450539..1450985 |
447 |
1437167..1437613 |
447 |
|
|
|
1709611..1711050 |
1440 |
1697521..1698963 |
1443 |
|
|
|
1718404..1718844 |
441 |
1708192..1708632 |
441 |
|
|
|
3560756..3561910 |
1155 |
3841162..3842367 |
1206 |
|
|
|
4254725..4256002 |
1278 |
|
|
|
|
|
4260531..4261586 |
1056 |
|
|
|
|
|
4262058..4262474 |
417 |
|
|
|
|
hp-204 |
4254509..4254712 |
204 |
|
|
|
|
phagePP |
4254725..4256002 |
1278 |
|
|
|
|
phageHM |
4255980..4256741 |
762 |
|
|
|
|
hp-543 |
|
|
3840525..3841067 |
543 |
|
|
phagePP |
|
|
3841162..3842367 |
1206 |
|
|
hydrolase |
|
|
3842345..3842512 |
168 |
|
|
terminase |
|
|
|
|
1487770..1489491 |
1722
|
phagePP |
|
|
|
|
1489507..1490769 |
1263
|
Clp |
|
|
|
|
1490762..1491607 |
846
|
- Lien tableur: cdc8 cdc abrégé protéines
- Légende:
- - Helix: spécifique cdc8
- - R-deca: spécifique psor
- - SigB: délocalisé dans cdc8
C3. C39 abrégé des protéines
abrégé |
nom protéine
|
A-1chlor |
type A-1 chloramphenicol O-acetyltransferase
|
ABC |
ABC transporter ATP-binding protein
|
Ala amid |
N-acetylmuramoyl-L-alanine amidase
|
Art-red |
anaerobic ribonucleoside triphosphate reductase
|
Art-reda |
anaerobic ribonucleoside-triphosphate reductase activating protein
|
B6 |
pyridoxal phosphate-dependent aminotransferase
|
cad |
cadmium-translocating P-type ATPase
|
CHAP |
CHAP domain-containing protein
|
CwlD |
N-acetylmuramoyl-L-alanine amidase CwlD
|
DedA |
DedA family protein
|
DeoR |
DeoR/GlpR transcriptional regulator
|
DnaC |
DNA replication protein DnaC
|
DUF378 |
DUF378 domain-containing protein
|
fdHa |
formate dehydrogenase subunit alpha
|
flagellar |
flagellar motor protein
|
Glyco-tr |
glycosyl transferase
|
Helix |
helix-turn-helix domain-containing protein
|
hp-1740 |
hp-1740
|
hp-204 |
hp-204
|
hp-282 |
hp-282
|
hp-414 |
hp-414
|
HXXEE |
HXXEE domain-containing protein
|
III-tau |
DNA polymerase III subunit gamma/tau
|
K-ligase |
lysine--tRNA ligase
|
lactam |
delta-lactam-biosynthetic de-N-acetylase
|
Mannosyl |
Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
|
MBOAT |
MBOAT family protein
|
mecano |
mechanosensitive ion channel
|
NadR |
transcription repressor NadR
|
NhaC |
Na+/H+ antiporter NhaC family protein
|
Nuc-de |
nucleoside deaminase
|
phagePP |
phage portal protein
|
PolyI |
DNA polymerase I
|
precorrin |
bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
|
pyruvate |
pyruvate carboxylase
|
R-deca |
arginine decarboxylase
|
seleno |
glycine/sarcosine/betaine reductase complex selenoprotein A
|
SigB |
SigB/SigF/SigG family RNA polymerase sigma factor
|
SigB2 |
B/F/G family RNA polymerase sigma-70 factor
|
S-ligase |
serine--tRNA ligase
|
SrtB |
sortase SrtB
|
succinate |
adenylosuccinate synthase
|
TIGR |
TIGR00159 family protein
|
xylose |
xylose isomerase
|
Y-r1 |
tyrosine-type recombinase/integrase – 1
|
Y-r2 |
tyrosine-type recombinase/integrase – 2
|
C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19 |
cdc8 |
cdc |
psor
|
date |
15-MAR-2017 |
18-MAY-2017 |
08-JAN-2018
|
DNA circulaire |
4 308 325 |
4 110 554 |
3 550 458
|
Genes (total) |
4 025 |
3 807 |
3 528
|
CDS (total) |
3 870 |
3 691 |
3 368
|
Genes (coding) |
3 763 |
3 615 |
3 327
|
CDS (coding) |
3 763 |
3 615 |
3 327
|
Genes (RNA) |
155 |
116 |
160
|
RRNAs (5S, 16S, 23S) |
14, 16, 13 |
9, 10, 10 |
17, 17, 17
|
complete rRNAs |
14, 16, 13 |
9, 10, 10 |
17, 17, 17
|
tRNAs |
108 |
83 |
105
|
ncRNAs |
4 |
4 |
4
|
Pseudo Genes (total) |
107 |
76 |
41
|
Pseudo Genes (ambiguous residues) |
0 of 107 |
0 of 76 |
0 of 41
|
Pseudo Genes (frameshifted) |
60 of 107 |
42 of 76 |
4 of 41
|
Pseudo Genes (incomplete) |
35 of 107 |
30 of 76 |
18 of 41
|
Pseudo Genes (internal stop) |
31 of 107 |
18 of 76 |
22 of 41
|
Pseudo Genes (multiple problems) |
18 of 107 |
12 of 76 |
3 of 41
|
CRISPR Arrays |
4 |
9 |
-
|
|
|
|
Décompte du 19.11.19 |
|
|
|
hypothetical protein |
609 |
523 |
1 256
|
hp / cds (total) |
0,16 |
0,14 |
0,37
|
- Lien noms abrégés
- Liens pour ce chapitre: noms abrégés opérons cumuls blocs cdc8 cdc psor 43 cdc8 cdc psor 18 cdc8 cdc psor 9 Alignement sur cdc Alignement sur cdc8.
- Remarques des 7 @ dans opérons :
- @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
- - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
- - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
- - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
- - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
- - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
- @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
- @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
- @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
- - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
- - De même pour VIII1, 248 contre 114.
- @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
- @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
- @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
- Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs
16s 14
16s’ 2
16s° 5
23s 9
23s’ 4
23s° 11
5s 14
taille d’un bloc normal
16s 16 1508 soit 10/14
23s 13 2900 soit 9/9
5s 14 117 soit 14/14
- Notes:
- - Les autres cds créés création de cds
- - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
- - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
- - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
- - Hypothèse de la création des gènes [10]
- Lien tableur: cdc8 distribution
- Notes: Tableau Cl32
- - -5s: gga et aca
- - 1-3: 2 tta et 2 atgi
Cl3 cdc8, Peptoclostridium difficile M68. clostridia.
Cl31 cdc. La distribution des tRNAs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
|
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
|
k cta |
1 |
g cca |
|
caa |
|
cga |
|
l gta |
1 |
o gca |
|
gaa |
1 |
gga |
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc8 |
4 |
5* |
|
|
|
|
9
|
|
Cl32 psor. La distribution des tRNAs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
5 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
4 |
b tcc |
|
tac |
4 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
5 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
3 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
5 |
ggc |
2
|
i tta |
6 |
c tca |
4 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
5
|
k cta |
3 |
g cca |
4 |
caa |
4 |
cga |
|
l gta |
6 |
o gca |
4 |
gaa |
5 |
gga |
6
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
4 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cdc8 |
|
|
2* |
93* |
|
4 |
99
|
|
- cdc8 Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cdc8, Clostridioides difficile M68, NCBI [11], date 6.2.22.
- cdc8 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cdc8 663,874 4,308,325 15.4
Intergen51. cdc8. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cdc8 les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cdc8 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,688 |
326 |
39 |
3,053 |
4.4 |
120 |
13 |
133
|
x |
686 |
4 |
0 |
690 |
|
1 |
7 |
8
|
t |
3,374 |
330 |
39 |
3,743 |
|
121 |
20 |
141
|
% |
90.1 |
8.8 |
1.0 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
10 |
0 |
1 |
11 |
2.2 |
tRNA-CDS |
16 |
5
|
x |
5 |
0 |
0 |
5 |
|
RNA-RNA |
121 |
35
|
t |
15 |
0 |
1 |
16 |
|
CDS-rRNA |
20 |
6
|
% |
93.8 |
0.0 |
6.3 |
|
|
non RNA |
191 |
55
|
- |
|
|
|
|
|
total |
348 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
8.9 |
18.2 |
1.5 |
30.0 |
0.0 |
38 |
1.3 |
9.1
|
x |
20.1 |
0.0 |
0.0 |
1.7 |
0.0 |
25 |
0.0 |
0.0
|
|
Intergen51. cdc8. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cdc8 données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cdc8 fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc8 fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cdc8
R2 x3 x2 x c Inflexion poly3 x c
0.680 1.93E-06 -1.89E-03 4.85E-01 -7.46 fx1 abscisse 284.3 551.3
0.829 -6.53E-06 4.96E-03 -1.21E+00 105.0 fc1 ordonnée 21.5 4.4
0.663 3.67E-06 -3.13E-03 7.51E-01 -23.4 fx41
0.905 -2.11E-07 3.49E-04 -1.96E-01 41.7 fc41
- Le rfin après 400 est de 242 sur un total de 2727 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 27 . L'indice i.rfin1 = 215/510=0,422.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cdc8 calculs poly3 cdc8
effect 2727 R2.21 864 abscis 250
xm 45 pte 12,50 flexa 138
ym 9 cste 3,86 flexo 2,08
x1m 229 r400l 171 xm 45
y1m 1 restp 231,39 sup4 71,9
rfin 88,74 %sd 15,67 sup4t 251,6
bornf 137 lond 184 % 28,6
supd 61,0 %sf 14,01 long 93
supdt 389,4 lonf 92 R2 361
xmp 379,17 sf/lf 0,38
r400 142,65 sr/lr 0,28
supf 34,9 sd/ld 0,33
supft 249,0 i.r400 0,83
Intergen51. cdc8. Les CDS-CDS négatifs
modifier
Sous-totaux cdc8 totale
fréquence x- c- x- c-
- 1 0 71 4 4140
- 2 0 0 85 11
- 3 0 1 3 12
- 4 1 51 717 10938
- 5 0 0 5 19
sp6 3 203 1642 8424
total 4 326 2,456 23,544
reste 0 5 264 420
s6 0 1 361 41
s7 1 30 321 1438
s8 2 167 696 6525
rappot s1-5
4/2/1 - 0.7 8.4 2.6
% / sp6
s6/sp6 0.0 0.5 22.0 0.5
s7/sp6 33.3 14.8 19.5 17.1
s8/sp6 66.7 82.3 42.4 77.5
reste/sp6 0.0 2.5 16.1 5.0
total s1-5 1 123 814 15120
% / total
%s1-5 25.0 37.7 33.1 64.2
%sp6 75.0 62.3 66.9 35.8
Intergen51. cdc8. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 7 CDS 16s 6 4
16s 23s 8 5s CDS 5 1
16s tRNA 1 16 CDS 2
tRNA 23s 2 CDS 5s
5s tRNA 6 1 23s CDS 1
tRNA in 2 CDS 23s
tRNA contig 85 5s 16s 1
tRNA hors 3 16s16s
tRNA 16s 3
23s tRNA 2
tRNA 5s 1
16s 5s
5s 23s
5s 5s
total 120 1 total 13 7
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cdc8. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
cont3 |
|
|
cont5 |
|
|
cont6
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
6 |
aac |
|
7 |
atgf |
|
6 |
aac |
|
89 |
caa |
|
4 |
aac
|
15 |
tta |
|
9 |
gaa |
|
15 |
tta |
|
3 |
tca |
|
5 |
gaa
|
7 |
atgf |
|
5 |
gga |
|
7 |
atgf |
|
6 |
ttc |
|
5 |
gta
|
9 |
gaa |
|
5 |
gta |
|
8 |
gaa |
|
14 |
atgj |
|
11 |
gac
|
5 |
gga |
|
9 |
gac |
|
4 |
gga |
|
29 |
atgi |
|
14 |
aca
|
5 |
gta |
|
14 |
aca |
|
5 |
gta |
|
7 |
cca |
|
9 |
tac
|
9 |
gac |
|
9 |
tac |
|
10 |
gac |
|
8 |
cac |
|
10 |
gga
|
14 |
aca |
|
24 |
cta |
|
9 |
ggc |
|
** |
aaa |
|
9 |
aga
|
10 |
tac |
|
24 |
ggc |
|
** |
aga |
|
|
|
|
11 |
caa
|
28 |
cta |
|
9 |
aga |
|
|
cont4 |
|
|
|
|
2 |
aaa
|
7 |
aga |
|
8 |
caa |
|
6 |
aac |
|
|
|
|
18 |
tca
|
89 |
caa |
|
2 |
aaa |
|
15 |
tta |
|
|
|
|
8 |
agc
|
3 |
tca |
|
3 |
tca |
|
7 |
atgf |
|
|
|
|
85 |
cca
|
6 |
ttc |
|
6 |
ttc |
|
9 |
gaa |
|
|
|
|
60 |
tgg
|
14 |
atgj |
|
14 |
atgj |
|
5 |
gga |
|
|
|
|
5 |
cca
|
29 |
atgi |
|
17 |
atgi |
|
5 |
gta |
|
|
|
|
3 |
atc
|
7 |
cca |
|
8 |
cac |
|
9 |
gac |
|
|
hors |
|
7 |
ttc
|
8 |
cac |
|
7 |
aaa |
|
14 |
aca |
|
33 |
aca |
|
** |
atgj
|
7 |
aaa |
|
7 |
tgc |
|
10 |
tac |
|
4 |
gta |
|
|
|
6 |
tgc |
|
12 |
cgt |
|
28 |
cta |
|
6 |
gaa |
|
|
|
6 |
aac |
|
** |
gta |
|
7 |
aga |
|
** |
aaa |
|
|
|
15 |
tta |
|
|
|
|
|
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
- Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.
- Lien tableur: cbc* opérons
- Liens: gtRNAdb [12], NCBI [13], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
- - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC |
30.6.19 Paris |
52 |
doubles |
intercal |
aa |
avec aa
|
comp |
1309334..1309408 |
gag |
|
|
|
|
|
|
|
|
|
|
|
comp |
1385938..1386012 |
aac |
|
8 |
|
|
comp |
1386021..1386134 |
5s |
|
108 |
|
|
comp |
1386243..1389140 |
23s |
|
228 |
|
|
comp |
1389369..1390866 |
16s |
@1 |
|
|
|
|
|
|
|
|
|
|
comp |
1392997..1393072 |
ttc |
|
7 |
|
|
comp |
1393080..1393193 |
5s |
|
108 |
|
|
comp |
1393302..1396199 |
23s |
|
228 |
|
|
comp |
1396428..1397925 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
1408673..1408762 |
tcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
1412183..1412259 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
1415464..1415540 |
cgt |
|
84 |
84 |
|
comp |
1415625..1415715 |
agc |
+ |
20 |
20 |
|
comp |
1415736..1415826 |
tca |
2 agc |
306 |
306 |
|
comp |
1416133..1416223 |
agc |
2 tca |
20 |
20 |
|
comp |
1416244..1416334 |
tca |
@4 |
|
|
|
|
|
|
|
|
|
|
comp |
1425969..1426044 |
gca |
|
3 |
|
3
|
comp |
1426048..1426124 |
atgi |
|
8 |
|
|
comp |
1426133..1426246 |
5s |
|
79 |
|
|
comp |
1426326..1427823 |
16s |
@2 |
117 |
|
|
comp |
1427941..1428051 |
cds |
|
|
|
|
|
|
|
|
|
|
|
|
1694943..1695017 |
cag |
|
|
|
|
|
|
|
|
|
|
|
comp |
1722580..1722664 |
tac |
|
5 |
5 |
|
comp |
1722670..1722745 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
1841437..1841510 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
comp |
1842698..1842811 |
5s |
|
108 |
|
|
comp |
1842920..1845817 |
23s |
|
228 |
|
|
comp |
1846046..1847543 |
16s |
|
|
|
|
|
|
|
|
|
|
|
|
1890534..1890608 |
gaa |
+ |
17 |
17 |
|
|
1890626..1890701 |
gta |
3 gaa |
9 |
9 |
|
|
1890711..1890787 |
gac |
3 gta |
4 |
4 |
|
|
1890792..1890867 |
aca |
3 gac |
5 |
5 |
|
|
1890873..1890947 |
gaa |
2 aca |
18 |
18 |
|
|
1890966..1891041 |
gta |
|
7 |
7 |
|
|
1891049..1891125 |
gac |
|
57 |
57 |
|
|
1891183..1891257 |
gaa |
|
17 |
17 |
|
|
1891275..1891350 |
gta |
|
9 |
9 |
|
|
1891360..1891436 |
gac |
|
4 |
4 |
|
|
1891441..1891516 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
1948153..1948228 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
1969157..1969245 |
tta |
|
4 |
4 |
|
|
1969250..1969325 |
atgf |
+ |
53 |
53 |
|
|
1969379..1969454 |
atgf |
2 atgf |
10 |
10 |
|
|
1969465..1969541 |
atg |
|
|
|
|
|
|
|
|
|
|
|
|
1987541..1989040 |
16s |
@3 |
226 |
|
|
|
1989267..1992166 |
23s |
|
93 |
|
|
|
1992260..1992375 |
5s |
|
7 |
|
|
|
1992383..1992457 |
aac |
+ |
27 |
|
27
|
|
1992485..1992559 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
2013239..2013313 |
ggg |
|
18 |
18 |
|
|
2013332..2013407 |
acc |
|
|
|
|
|
|
|
|
|
|
|
|
2222515..2222590 |
tgg |
|
|
|
|
|
|
|
|
|
|
|
|
2294767..2294842 |
cca |
+ |
7 |
7 |
|
|
2294850..2294923 |
gga |
2 cca |
6 |
6 |
|
|
2294930..2295006 |
aga |
2 gga |
5 |
5 |
|
|
2295012..2295087 |
aag |
|
26 |
26 |
|
|
2295114..2295189 |
cca |
|
29 |
29 |
|
|
2295219..2295292 |
gga |
|
24 |
24 |
|
|
2295317..2295393 |
cga |
|
|
|
|
|
|
|
|
|
|
|
|
2402556..2402631 |
gta |
|
5 |
5 |
|
|
2402637..2402713 |
gac |
|
3 |
3 |
|
|
2402717..2402792 |
ttc |
|
4 |
4 |
|
|
2402797..2402871 |
ggc |
|
9 |
9 |
|
|
2402881..2402954 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
|
2517305..2517391 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
2548708..2548792 |
ctc |
|
|
|
|
|
|
|
|
|
|
|
|
2583298..2583388 |
tga |
|
|
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbc. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbc cumuls opérons effectif
avec rRNA opérons 5
16 23 5s 0 1
16 atc gca 0
16 23 5s a 3
max a 2
a doubles 1
spéciaux 1
total aas 6
sans opérons 17
1 aa 10
max a 11
a doubles 4
total aas 46
total aas 52
remarques 4
C4. Clostridium botulinum CDC_297, cbc* blocs
aac |
8 |
7 |
- |
|
5s |
108 |
108 |
108 |
226
|
23s |
228 |
228 |
228 |
93
|
16s |
|
|
- |
7
|
|
|
|
|
|
gca |
3 |
|
|
|
atgi |
8 |
|
|
|
5s |
79 |
|
|
|
16s |
|
|
|
|
@1 Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
@2 C’est 1 bloc 16.23.5.aa qui a perdu 23s.
- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
- Est-ce qu'elle appartient à l'opéron?
@3 C’est 1 bloc 16.23.5.aa de @1 avec 1 aa double.
- L'intercalaire 23-5 est très faible, 14% de moins par rapport à @1, 15/108.
@4 Dépassement de la règle des intercalaires, 210 bases, 306.
- Il se trouve entre 2 séquences de 2 aas.
- Est-ce 2 opérons?
Séquences des doubles :
- 1 opéron à 1 doublet.
- 2 opérons à 2 séquences de 2 aas chacun.
- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.
- Lien tableur: cbc distribution
- Notes:
- - 1-3aas: gca atgi aac ttc aac2
- - >1aa: atgf2
Cl4 cbc. Clostridium botulinum CDC_297 . clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
3 |
agc |
2
|
g ctc |
1 |
f ccc |
|
cac |
|
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
1
|
i tta |
1 |
c tca |
2 |
taa |
|
tga |
1
|
j ata |
|
k aca |
3 |
aaa |
|
aga |
1
|
k cta |
|
g cca |
3 |
caa |
|
cga |
1
|
l gta |
4 |
o gca |
1 |
gaa |
3 |
gga |
2
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
1 |
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbc* |
36 |
10 |
|
6* |
|
|
52
|
- cbc Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cbc, Clostridium botulinum CDC_297, NCBI [14], date 14.4.15.
- cbc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cbc 696,513 3,892,029 17.9
Intergen51. cbc. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cbc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbc les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,548 |
288 |
24 |
2,860 |
3.9 |
44 |
6 |
50
|
x |
718 |
7 |
1 |
726 |
|
0 |
0 |
0
|
t |
3,266 |
295 |
25 |
3,586 |
|
44 |
6 |
50
|
% |
91.1 |
8.2 |
0.7 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
30 |
0 |
0 |
30 |
3.8 |
tRNA-CDS |
38 |
43
|
x |
8 |
0 |
0 |
8 |
|
RNA-RNA |
44 |
50
|
t |
38 |
0 |
0 |
38 |
|
CDS-rRNA |
6 |
7
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
0 |
0
|
- |
|
|
|
|
|
total |
88 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
12.7 |
20.0 |
1.4 |
25.5 |
0.0 |
45 |
0.8 |
0.0
|
x |
23.9 |
25.0 |
14.3 |
2.5 |
12.5 |
43 |
0.1 |
0.0
|
|
Intergen51. cbc. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cbc données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbc fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbc fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbc fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbc
R2 x3 x2 x c Inflexion poly3 x c
0.481 1.11E-06 -1.01E-03 2.51E-01 4.94 fx1 abscisse 309.3 164.9
0.782 -5.00E-06 3.83E-03 -9.48E-01 87.8 fc1 ordonnée 18.6 19.2
0.365 1.11E-06 -1.03E-03 2.60E-01 3.84 fx41
0.885 8.29E-07 -4.10E-04 -2.04E-02 30.0 fc41
- Le rfin après 400 est de 376 sur un total de 2572 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 25 . L'indice i.rfin1 = 301/520=0,579.
- Le reste après 920 est de 25 sur un total de 2572 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1040 , reste 10 . L'indice i.rf2 = 15/120=0,125.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cbc calculs poly3 cbc
effect 2572 R2.21 836 abscis 400
xm 45 pte 6,80 flexa 154
ym 6 cste 2,64 flexo 1,98
x1m 241 r400l 159 xm 45
y1m 1 restp 274,49 sup4 75,3
rfin 126,75 %sd 28,28 sup4t 272,2
bornf 185 lond 196 % 27,7
supd 115,2 %sf 27,47 long 109
supdt 407,5 lonf 140 R2 410
xmp 318,04 sf/lf 0,64
r400 147,74 sr/lr 0,46
supf 89,5 sd/ld 0,59
supft 325,8 i.r400 0,93
Intergen51. cbc. Les CDS-CDS négatifs
modifier
Sous-totaux cbc totale
fréquence x- c- x- c-
- 1 0 72 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 3 58 717 10938
- 5 0 0 5 19
sp6 4 158 1642 8424
total 7 288 2,456 23,544
reste 1 4 264 420
s6 1 0 361 41
s7 1 28 321 1438
s8 1 126 696 6525
rappot s1-5
4/2/1 - 0.8 8.4 2.6
% / sp6
s6/sp6 25.0 0.0 22.0 0.5
s7/sp6 25.0 17.7 19.5 17.1
s8/sp6 25.0 79.7 42.4 77.5
reste/sp6 25.0 2.5 16.1 5.0
total s1-5 3 130 814 15120
% / total
%s1-5 42.9 45.1 33.1 64.2
%sp6 57.1 54.9 66.9 35.8
Intergen51. cbc. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 4 CDS 16s 5
16s 23s 4 5s CDS 1
16s tRNA 16 CDS
tRNA 23s CDS 5s
5s tRNA 4 23s CDS
tRNA in CDS 23s
tRNA contig 2 5s 16s
tRNA hors 29 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s 1
5s 23s
5s 5s
total 44 0 total 6 0
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cbc. Les intercalaires tRNA-tRNA extra blocs
|
hors1 |
|
|
hors2
|
inter |
aa |
|
inter |
aa
|
84 |
cgt |
|
18 |
ggg
|
20 |
agc |
|
** |
acc
|
306 |
tca |
|
7 |
cca
|
20 |
agc |
|
6 |
gga
|
** |
tca |
|
5 |
aga
|
5 |
tac |
|
26 |
aag
|
** |
aca |
|
29 |
cca
|
17 |
gaa |
|
24 |
gga
|
9 |
gta |
|
** |
cga
|
4 |
gac |
|
5 |
gta
|
5 |
aca |
|
3 |
gac
|
18 |
gaa |
|
4 |
ttc
|
7 |
gta |
|
9 |
ggc
|
57 |
gac |
|
** |
tgc
|
17 |
gaa |
|
|
|
9 |
gta |
|
|
|
4 |
gac |
|
|
|
** |
aca |
|
|
cont
|
4 |
tta |
|
3 |
gca
|
53 |
atgf |
|
** |
atgi
|
10 |
atgf |
|
27 |
aac
|
** |
atgj |
|
** |
aac
|
- |
|
|
|
|
Clostridium botulinum BKT015925
modifier
- Lien tableur: cbn opérons
- Liens: gtRNAdb [15], NCBI [16], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC |
30.6.19 Paris |
86 |
doubles |
intercal |
aa |
avec aa
|
|
20666..20741 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
36413..36487 |
gaa |
+ |
12 |
12 |
|
|
36500..36575 |
gta |
2 gaa |
13 |
13 |
|
|
36589..36665 |
gac |
2 gta |
5 |
5 |
|
|
36671..36746 |
aca |
2 gac |
18 |
18 |
|
|
36765..36839 |
gaa |
2 aca |
12 |
12 |
|
|
36852..36927 |
gta |
|
13 |
13 |
|
|
36941..37017 |
gac |
|
5 |
5 |
|
|
37023..37098 |
aca |
|
|
|
|
|
|
|
|
|
|
|
|
137366..137441 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
161964..162052 |
tta |
+ |
5 |
5 |
|
|
162058..162133 |
atgf |
3 tta |
5 |
5 |
|
|
162139..162215 |
atgj |
3 atgf |
46 |
46 |
|
|
162262..162350 |
tta |
2 atgj |
5 |
5 |
|
|
162356..162431 |
atgf |
|
30 |
30 |
|
|
162462..162538 |
atgj |
|
46 |
46 |
|
|
162585..162673 |
tta |
|
5 |
5 |
|
|
162679..162754 |
atgf |
|
|
|
|
|
|
|
|
|
|
|
|
76258..176332 |
aac |
|
|
|
|
|
|
|
|
|
|
|
|
180177..181695 |
16s |
@5 |
233 |
|
|
|
181929..184836 |
23s |
|
45 |
|
|
|
184882..184956 |
aac |
+ |
14 |
|
|
|
184971..185087 |
5s |
|
7 |
|
|
|
185095..185169 |
aac |
2 aac |
|
|
|
|
|
|
|
|
|
|
|
222409..222484 |
acc |
|
|
|
|
|
|
|
|
|
|
|
comp |
578417..578492 |
cag |
|
|
|
|
|
|
|
|
|
|
|
comp |
944747..944833 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
955546..955630 |
ctt |
|
|
|
|
|
|
|
|
|
|
|
|
1026946..1027021 |
gta |
|
17 |
17 |
17
|
|
1027039..1027115 |
gac |
|
14 |
14 |
14
|
|
1027130..1027205 |
ttc |
|
4 |
4 |
4
|
|
1027210..1027284 |
ggc |
|
8 |
8 |
8
|
|
1027293..1027367 |
tgc |
+ |
57 |
57 |
57
|
|
1027425..1027499 |
tgc |
2 tgc |
|
|
|
|
|
|
|
|
|
|
comp |
2030816..2030890 |
aac |
|
45 |
|
|
comp |
2030936..2033842 |
23s |
|
96 |
|
|
comp |
2033939..2034015 |
atc |
|
7 |
|
7
|
comp |
2034023..2034098 |
gca |
|
121 |
|
|
comp |
2034220..2035734 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2283768..2283884 |
5s |
|
95 |
|
|
comp |
2283980..2286886 |
23s |
|
233 |
|
|
comp |
2287120..2288638 |
16s |
@3 |
464 |
|
|
comp |
2289103..2289176 |
gga |
|
15 |
|
15
|
comp |
2289192..2289268 |
atc |
|
7 |
|
7
|
comp |
2289276..2289351 |
gca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2350598..2350674 |
cga |
+ |
21 |
21 |
|
comp |
2350696..2350769 |
gga |
4 gga |
28 |
28 |
|
comp |
2350798..2350873 |
aaa |
2 aaa |
4 |
4 |
|
comp |
2350878..2350952 |
caa |
2 caa |
4 |
4 |
|
comp |
2350957..2351032 |
cac |
2 cac |
5 |
5 |
|
comp |
2351038..2351112 |
aag |
3 aag |
3 |
3 |
|
comp |
2351116..2351192 |
aga |
3 aga |
6 |
6 |
|
comp |
2351199..2351272 |
gga |
2 cca |
4 |
4 |
|
comp |
2351277..2351352 |
cca |
2 ggc |
21 |
21 |
|
comp |
2351374..2351449 |
aag |
|
5 |
5 |
|
comp |
2351455..2351531 |
aga |
|
5 |
5 |
|
comp |
2351537..2351610 |
gga |
|
5 |
5 |
|
comp |
2351616..2351690 |
ggc |
|
3 |
3 |
|
comp |
2351694..2351777 |
cta |
|
22 |
22 |
|
comp |
2351800..2351875 |
aaa |
|
4 |
4 |
|
comp |
2351880..2351954 |
caa |
|
4 |
4 |
|
comp |
2351959..2352034 |
cac |
|
5 |
5 |
|
comp |
2352040..2352115 |
aag |
|
5 |
5 |
|
comp |
2352121..2352197 |
aga |
|
5 |
5 |
|
comp |
2352203..2352276 |
gga |
|
5 |
5 |
|
comp |
2352282..2352356 |
ggc |
|
6 |
6 |
|
comp |
2352363..2352438 |
cca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2432784..2432859 |
tgg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2454880..2454964 |
tac |
+ |
39 |
39 |
|
comp |
2455004..2455079 |
gta |
2 tac |
8 |
8 |
|
comp |
2455088..2455172 |
tac |
|
4 |
4 |
|
comp |
2455177..2455252 |
aca |
|
|
|
|
|
|
|
|
|
|
|
comp |
2697795..2697911 |
5s |
@1 |
31 |
|
|
comp |
2697943..2700847 |
23s |
|
233 |
|
|
comp |
2701081..2702599 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2703946..2704021 |
aaa |
|
311 |
|
311
|
comp |
2704333..2704408 |
ttc |
|
5 |
|
|
comp |
2704414..2704530 |
5s |
|
336 |
|
|
comp |
2704867..2704942 |
ttc |
|
5 |
|
|
comp |
2704948..2705064 |
5s |
|
97 |
|
|
comp |
2705162..2708066 |
23s |
|
233 |
|
|
comp |
2708300..2709814 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2721253..2721328 |
aaa |
@2 |
5 |
|
|
comp |
2721334..2721450 |
5s |
|
95 |
|
|
comp |
2721546..2724452 |
23s |
|
233 |
|
|
comp |
2724686..2726203 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2731902..2731976 |
gag |
|
61 |
|
61
|
comp |
2732038..2732112 |
caa |
|
6 |
|
6
|
comp |
2732119..2732195 |
aga |
|
4 |
|
4
|
comp |
2732200..2732273 |
gga |
|
19 |
|
19
|
comp |
2732293..2732376 |
cta |
|
16 |
|
16
|
comp |
2732393..2732467 |
gaa |
|
4 |
|
|
comp |
2732472..2732588 |
5s |
|
97 |
|
|
comp |
2732686..2735592 |
23s |
@4 |
94 |
|
|
comp |
2735687..2735763 |
atc |
|
3 |
|
|
comp |
2735767..2735842 |
gca |
|
74 |
|
|
comp |
2735917..2737435 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2742262..2742351 |
tcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
2743220..2743312 |
tcg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2743891..2743967 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2748534..2748610 |
cgt |
|
144 |
144 |
|
comp |
2748755..2748845 |
agc |
|
23 |
23 |
|
comp |
2748869..2748959 |
tca |
+ |
69 |
69 |
|
comp |
2749029..2749119 |
tca |
2 tca |
|
|
|
|
|
|
|
|
|
|
comp |
2758688..2758763 |
gca |
|
4 |
|
4
|
comp |
2758768..2758844 |
atgi |
|
3 |
|
|
comp |
2758848..2758964 |
5s |
|
73 |
|
|
comp |
2759038..2761942 |
23s |
|
233 |
|
|
comp |
2762176..2763694 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2150504..2150620 |
5s |
|
31 |
|
|
comp |
2150652..2153560 |
23s |
|
233 |
|
|
comp |
2153794..2155308 |
16s |
|
|
|
|
|
|
|
|
|
|
|
comp |
2169525..2169641 |
5s |
|
32 |
|
|
comp |
2169674..2172579 |
23s |
|
233 |
|
|
comp |
2172813..2174331 |
16s |
|
|
|
|
|
|
|
|
|
|
|
sur plasmide |
|
tgg |
|
|
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbn cumuls opérons effectif
avec rRNA opérons 10
16 23 5s 0 3
16 gca atc 2
16 23 5s a 4
max a 8
a doubles 1
spéciaux 1
total aas 22
sans opérons 18
1 aa 12
max a 22
a doubles 6
total aas 64
total aas 86
remarques 5
C5. Clostridium botulinum BKT015925, cbn blocs
5s |
31 |
31 |
32 |
|
|
|
23s |
233 |
233 |
233 |
|
|
|
16s |
|
|
|
|
|
|
|
|
|
|
|
ttc |
5
|
|
|
|
|
|
5s |
336
|
aaa |
5 |
3 |
|
|
ttc |
5
|
5s |
95 |
73 |
5s |
95 |
5s |
97
|
23s |
233 |
233 |
23s |
233 |
23s |
233
|
16s |
aaa |
atgi |
16s |
464 |
16s |
|
|
|
|
gga |
15 |
|
|
16s |
233 |
|
|
|
|
|
23s |
45 |
|
|
|
|
|
aac |
14 |
|
|
|
|
|
5s |
7 |
|
|
|
|
|
aac |
|
|
|
|
|
|
gaa |
4 |
|
|
|
|
|
5s |
97 |
aac |
45 |
|
|
|
23s |
94 |
23s |
96 |
|
|
|
atc |
3 |
atc |
7 |
|
|
|
gca |
74 |
gca |
121 |
|
|
|
16s |
|
16s |
|
|
|
|
*Remarques
@1 Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
@2 Les 4 opérons 16-23-5s -aa ont tous à peu près les mêmes intercalaires 233-95-5.
- Mais ils sont tous différents:
+ 1 seul opéron répond au critère des intercalaires, il a 1aa.
+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
Élevé, 464.
+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
+ L'opéron à 3aas répondant aux critères a un 5s en plus.
@3 Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve
dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
@4 C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
@5 Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
- Ils ont aussi, à peu près, les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
*Séquences des doubles : tous les opérons à plus de 3aas ont des doubles, 6/6.
- Les répétitions vont de 5 à 2.
- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
- On peut repérer dans cet opéron d'autres séquences de 3 aas.
- Ces séquences sont séparées par 1 ou 2 aas différents.
- Lien tableur: cbn distribution
- Notes:
- - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
- - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
Cl5 cbn, Clostridium botulinum BKT015925. clostridia.
Cl51 cbc. 1aa -16s 1-3aas. clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
1 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
|
tgc |
|
f atc |
1 |
j acc |
1 |
aac |
2 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
2 |
aga |
|
k cta |
|
g cca |
1 |
caa |
|
cga |
|
l gta |
|
o gca |
2 |
gaa |
|
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
2
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbn |
|
12 |
|
7* |
3* |
|
22
|
|
Cl52 cbn. >1aa -5s 4-8aas +16s.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
|
tac |
2 |
tgc |
2
|
f atc |
2 |
j acc |
|
aac |
2 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
2 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
3
|
i tta |
3 |
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
4
|
k cta |
2 |
g cca |
2 |
caa |
3 |
cga |
1
|
l gta |
4 |
o gca |
2 |
gaa |
3 |
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
2 |
l acg |
|
aag |
3 |
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbn |
52 |
|
2* |
6* |
|
4 |
64
|
|
- cbn Le prélèvement: Acbn
- Le nom et le lien NCBI: cbn, Clostridium botulinum BKT015925, NCBI [17], date 31.01.14.
- cbn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cbn 330,729 2,773,157 11.9
Intergen51. cbn. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cbn les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbn les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,765 |
167 |
10 |
1,942 |
3.5 |
87 |
10 |
97
|
x |
539 |
9 |
1 |
549 |
|
0 |
4 |
4
|
t |
2,304 |
176 |
11 |
2,491 |
|
87 |
14 |
101
|
% |
92.5 |
7.1 |
0.4 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
31 |
0 |
0 |
31 |
2.8 |
tRNA-CDS |
42 |
29
|
x |
11 |
0 |
0 |
11 |
|
RNA-RNA |
87 |
59
|
t |
42 |
0 |
0 |
42 |
|
CDS-rRNA |
14 |
10
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
4 |
3
|
- |
|
|
|
|
|
total |
147 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
3.5 |
3.2 |
0.0 |
29.9 |
0.0 |
37 |
0.5 |
0.0
|
x |
9.6 |
18.2 |
0.0 |
5.9 |
0.0 |
0 |
0.2 |
0.0
|
|
Intergen51. cbn. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cbn données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbn fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbn fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbn
R2 x3 x2 x c Inflexion poly3 x c
0.450 1.33E-06 -9.44E-04 1.11E-01 29.70 fx1 abscisse 243.0 186.3
0.856 -3.49E-06 2.27E-03 -7.66E-01 85.6 fc1 ordonnée 19.3 20.5
0.692 -4.02E-06 2.93E-03 -7.31E-01 81.60 fx41
0.941 1.70E-06 -9.50E-04 2.68E-02 37.5 fc41
- Le rfin après 400 est de 62 sur un total de 1775 . Jusqu'à 1% les freq10 sont en continu jusqu'à 540 , reste 18 . L'indice i.rfin1 = 44/140=0,314.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cbn calculs poly3 cbn
effect 1775 R2.21 845 abscis 400
xm 45 pte 12,14 flexa 176
ym 6 cste 3,93 flexo 2,13
x1m 241 r400l 159 xm 45
y1m 1 restp 121,69 sup4 145,4
rfin 34,93 %sd 26,14 sup4t 401,7
bornf 180 lond 196 % 36,2
supd 133,3 %sf 24,97 long 131
supdt 509,9 lonf 135 R2 595
xmp 368,45 sf/lf 0,76
r400 86,76 sr/lr 0,51
supf 102,1 sd/ld 0,68
supft 409,0 i.r400 0,55
Intergen51. cbn. Les CDS-CDS négatifs
modifier
Sous-totaux cbn totale
fréquence x- c- x- c-
- 1 0 34 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 0 28 717 10938
- 5 0 0 5 19
sp6 9 105 1642 8424
total 9 167 2,456 23,544
reste 0 0 264 420
s6 5 0 361 41
s7 0 23 321 1438
s8 4 82 696 6525
rappot s1-5
4/2/1 - 0.8 8.4 2.6
% / sp6
s6/sp6 55.6 0.0 22.0 0.5
s7/sp6 0.0 21.9 19.5 17.1
s8/sp6 44.4 78.1 42.4 77.5
reste/sp6 0.0 0.0 16.1 5.0
total s1-5 0 62 814 15120
% / total
%s1-5 0.0 37.1 33.1 64.2
%sp6 100.0 62.9 66.9 35.8
Intergen51. cbn. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 8 CDS 16s 8 2
16s 23s 8 5s CDS 2 2
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 6 23s CDS
tRNA in 2 CDS 23s
tRNA contig 7 5s 16s
tRNA hors 48 16s16s
tRNA 16s
23s tRNA 2
tRNA 5s 2
16s 5s
5s 23s
5s 5s
total 87 0 total 10 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cbn. Les intercalaires tRNA-tRNA extra blocs
|
hors1 |
|
|
hors2 |
|
|
hors3
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
12 |
gaa |
|
21 |
cga |
|
39 |
tac
|
13 |
gta |
|
28 |
gga |
|
8 |
gta
|
5 |
gac |
|
4 |
aaa |
|
4 |
tac
|
18 |
aca |
|
4 |
caa |
|
** |
aca
|
12 |
gaa |
|
5 |
cac |
|
144 |
cgt
|
13 |
gta |
|
3 |
aag |
|
23 |
agc
|
5 |
gac |
|
6 |
aga |
|
69 |
tca
|
** |
aca |
|
4 |
gga |
|
** |
tca
|
5 |
tta |
|
21 |
cca |
|
|
|
5 |
atgf |
|
5 |
aag |
|
|
|
46 |
atgj |
|
5 |
aga |
|
|
|
5 |
tta |
|
5 |
gga |
|
|
cont
|
30 |
atgf |
|
3 |
ggc |
|
311 |
aaa
|
46 |
atgj |
|
22 |
cta |
|
** |
ttc
|
5 |
tta |
|
4 |
aaa |
|
61 |
gag
|
** |
atgf |
|
4 |
caa |
|
6 |
caa
|
17 |
gta |
|
5 |
cac |
|
4 |
aga
|
14 |
gac |
|
5 |
aag |
|
19 |
gga
|
4 |
ttc |
|
5 |
aga |
|
16 |
cta
|
8 |
ggc |
|
5 |
gga |
|
** |
gaa
|
57 |
tgc |
|
6 |
ggc |
|
4 |
gca
|
** |
tgc |
|
** |
cca |
|
** |
atgi
|
15 |
gga |
|
|
|
|
|
|
7 |
atc |
|
|
|
|
|
|
** |
gca |
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
- Lien NCBI [18]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
cbn. Sx+ Sc+ Les diagrammes 400
cbn |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
15 |
-107 |
126 |
33 |
450 |
238 |
max50 |
-50 |
394 |
-1048 |
106 |
855 |
263 |
min50
|
31 à 400 |
|
|
|
|
|
|
2 parties |
8.8 |
-32 |
-123 |
49 |
932 |
121 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
86 |
43 |
- |
424 |
dte |
26 |
tf |
184 |
63 |
- |
652 |
poly |
203 |
SF
|
31 à 400 |
|
|
- |
|
|
|
|
120 |
45 |
- |
891 |
dte |
41 |
tf
|
- Légende du tableau corrélations et fréquences faibles
cbn. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
scc |
min10 |
416 |
961 |
1377 |
748 |
440 |
530 |
90 |
-88 |
49 |
367
|
cbn |
min20 |
489 |
1701 |
2190 |
731 |
543 |
505 |
-38 |
-222 |
-114 |
271
|
eco |
min20 |
1003 |
2130 |
3133 |
735 |
296 |
440 |
144 |
-178 |
-64 |
287
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
118 |
353 |
0.33 |
485 |
1320 |
4 |
5 |
58 |
242 |
60 |
389 |
-177
|
65 |
312 |
0.21 |
553 |
1940 |
2 |
5 |
17 |
86 |
56 |
620 |
-382
|
63 |
348 |
0.18 |
1169 |
2855 |
11 |
6 |
80 |
226 |
126 |
821 |
-119
|
- Diagrammes 400: cbn cvi, diagramme 1-40: c+ cbn c+ cvi x+ cvi total, texte: cvi.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - cbn ressemble beaucoup à cvi comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible (R2’ 26 30). Il diffère principalement par la corrélation sur 41-250 de 505 contre 891 et une courbe c+ 31-400 de forme tilde moyenne tm (41) contre un tilde fort tF (107) pour cvi. Le total des effectifs est 50% plus faible que cvi, 2190 contre 3328.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour cbn et 70 pour cvi. Quand j’enlève les fréquences faibles pour ne laisser que la pyramide, 3 pour cbn et 4 pour cvi, les 2 courbes deviennent de S forts, SF, avec R2’ de 76 pour cbn contre 68 pour cvi. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi.
- + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec cvi. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 200.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec le même R2’ de 203 et des 2 points d’inflexion normaux, 263 pour cbn et 282 pour cvi.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles, soit 1-30 pour cbn et 1-40 pour cvi, voir le paragraphe x+ 1-400 ci-dessus.
- c+ 31-400: C’est la différence entre ces courbes qui va impacter le plus la corrélation sur 41-250 qui passe de 505 chez cbn à 891 chez cvi. En effet la courbe de cbn est un tilde faible à moyen avec un R2’ de 41 alors que cvi arbore un tilde fort avec un R2’ de 107. Les 2 points d’inflexions sont faibles en valeur absolue, mais celui de cbn est positif, 121, alors que celui de cvi est négatif, -137.
- - Les corrélations:
- Sur les plages 41-n: La grande différence entre les 2 génomes c’est une corrélation moyenne pour cbn avec 505 et la 2ème plus forte des 21 génomes de cvi avec 891 après 940 de ase. Dans les 2 génomes elle se maintient légèrement sur 41-200, avec une amélioration pour cbn, différence de -38 (diff), et un recul de 33 pour cvi. Avec cbn c’est la seule amélioration constatée chez les 21 génomes étudiés.
- Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
- + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -222 pour 1 -200 et -114 pour 1 -250.
- + Chez cvi les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n, certes fortement diminuées mais sont positives et seulement moitié que sur 41-n, 434/858 pour 1-200 et 549/891 pour 1-250.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Entre cbn et cvi il passe de 0.21 à 0.37. Les zéros sont identiques et font 7‰, alors que le taux des négatifs fait le triple de cbn chez cvi, 103‰ contre 280‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Avec 130 pour cvi sa courbe a été étudiée dans cvi.
- Lien tableur: cbn autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- Totaux: il y a 2 pseudo gene
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ x- c+ x+ c- c+ x+ c-
43 13 87 2 2 147
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Clostridium lentocellum DSM 5427
modifier
- Lien tableur: cle opérons
- Liens: gtRNAdb, NCBI [19], génome
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
- Légende:
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
C6. Clostridium lentocellum DSM 5427
34.3%GC |
30.6.19 Paris |
104 |
doubles |
intercal |
aa |
avec aa
|
|
10157..10246 |
agc |
@1 |
202 |
|
|
|
10449..11981 |
16s |
|
72 |
|
|
|
12054..12171 |
5s |
|
4 |
|
|
|
12176..12248 |
gca |
|
262 |
|
|
|
12511..15414 |
23s |
|
55 |
|
|
|
15470..15543 |
gac |
|
61 |
|
61
|
|
15605..15677 |
gta |
|
7 |
|
7
|
|
15685..15757 |
aca |
|
34 |
|
34
|
|
15792..15872 |
tac |
|
12 |
|
12
|
|
15885..15961 |
atgj |
|
3 |
|
3
|
|
15965..16040 |
ttc |
|
3 |
|
3
|
|
16044..16116 |
aaa |
|
|
|
|
|
|
|
|
30118 |
|
|
|
46235..47767 |
16s |
@3 |
21284 |
|
|
|
|
|
|
|
|
|
|
69052..71964 |
23s |
|
|
|
|
|
|
|
|
4873 |
|
|
|
76838..78371 |
16s |
|
72 |
|
|
|
78444..78561 |
5s |
|
5 |
|
|
|
78567..78639 |
gca |
|
282 |
|
|
|
78922..81829 |
23s |
|
|
|
|
|
|
|
|
904 |
|
|
|
82734..82851 |
5s |
|
4 |
|
|
|
82856..82928 |
ggc |
|
|
|
|
|
|
|
|
1463 |
|
|
|
84392..85929 |
16s |
|
72 |
|
|
|
86002..86119 |
5s |
|
4 |
|
|
|
86124..86196 |
gca |
|
280 |
|
|
|
86477..89386 |
23s |
|
|
|
|
|
|
|
|
7380 |
|
|
|
96767..96884 |
5s |
|
89 |
|
|
|
96974..97047 |
ggc |
|
|
|
|
|
|
|
|
5082 |
|
|
|
102130..102204 |
cag |
|
|
|
|
|
|
|
|
|
|
|
|
104716..104799 |
tta |
|
13 |
13 |
|
|
104813..104898 |
tca |
|
|
|
|
|
|
|
|
|
|
|
|
141499..143034 |
16s |
|
138 |
|
|
|
143173..143290 |
5s |
|
7 |
|
|
|
143298..143374 |
atc |
|
258 |
|
|
|
143633..146538 |
23s |
|
|
|
|
|
|
|
|
|
|
|
|
150968..151085 |
5s |
@4 |
4 |
|
|
|
151090..151161 |
gaa |
|
457 |
|
|
|
151619..153160 |
16s |
|
605 |
|
|
|
153766..156671 |
23s |
|
475 |
|
|
|
157147..157219 |
aaa |
|
9 |
|
9
|
|
157229..157299 |
gga |
|
6 |
|
6
|
|
157306..157379 |
aga |
|
|
|
|
|
|
|
|
4223 |
|
|
|
161603..161720 |
5s |
|
4 |
|
|
|
161725..161797 |
ggc |
|
|
|
|
|
|
|
|
11104 |
|
|
|
172902..172973 |
gaa |
|
23 |
23 |
|
|
172997..173071 |
cca |
|
45 |
45 |
|
|
173117..173189 |
aaa |
|
11 |
11 |
|
|
173201..173274 |
gac |
|
56 |
56 |
|
|
173331..173403 |
gta |
|
7 |
7 |
|
|
173411..173494 |
tta |
|
187 |
187 |
|
|
173682..173754 |
aca |
|
26 |
26 |
|
|
173781..173861 |
tac |
|
10 |
10 |
|
|
173872..173948 |
atgj |
|
31 |
31 |
|
|
173980..174052 |
ttc |
|
|
|
|
|
|
|
|
248498 |
|
|
|
422551..424086 |
16s |
|
|
|
|
|
|
|
|
113898 |
|
|
|
537985..540890 |
23s |
|
|
|
|
|
|
|
|
25153 |
|
|
|
566044..566117 |
cac |
|
23 |
23 |
|
|
566141..566212 |
caa |
|
32 |
32 |
|
|
566245..566330 |
tca |
|
|
|
|
|
|
|
|
|
|
|
|
571984..573519 |
16s |
|
72 |
|
|
|
573592..573709 |
5s |
|
4 |
|
|
|
573714..573786 |
gca |
|
282 |
|
|
|
574069..576975 |
23s |
|
|
|
|
|
|
|
|
25302 |
|
|
|
602278..603812 |
16s |
|
137 |
|
|
|
603950..604067 |
5s |
|
|
|
|
|
|
|
|
11014 |
|
|
|
615082..617987 |
23s |
|
|
|
|
|
|
|
|
21159 |
|
|
|
639147..639362 |
16s° |
@5 |
|
|
|
|
|
|
|
98139 |
|
|
|
737502..737619 |
5s |
|
4 |
|
|
|
737624..737696 |
ggc |
|
|
|
|
|
|
|
|
3291 |
|
|
|
740988..741058 |
gga |
|
|
|
|
|
|
|
|
|
|
|
|
759839..759920 |
cta |
|
|
|
|
|
|
|
|
|
|
|
|
911999..912083 |
ctt |
+ |
148 |
148 |
|
|
912232..912316 |
ctt |
2 ctt |
|
|
|
|
|
|
|
|
|
|
|
1035192..1035265 |
cga |
|
|
|
|
|
|
|
|
|
|
|
|
1061152..1061225 |
agg |
|
|
|
|
|
|
|
|
|
|
|
comp |
1136376..1136448 |
ccc |
|
|
|
|
|
|
|
|
|
|
|
|
1229184..1230718 |
16s |
@2 |
72 |
|
|
|
1230791..1230908 |
5s |
|
7 |
|
|
|
1230916..1230989 |
atc |
|
53 |
|
53
|
|
1231043..1231115 |
gca |
|
261 |
|
|
|
1231377..1234282 |
23s |
|
110 |
|
|
|
1234393..1234464 |
aac |
+ |
9 |
|
9
|
|
1234474..1234545 |
gaa |
2 tgc |
6 |
|
6
|
|
1234552..1234622 |
tgc |
2 aac |
23 |
|
23
|
|
1234646..1234717 |
aac |
|
58 |
|
58
|
|
1234776..1234846 |
tgc |
|
|
|
|
|
|
|
|
|
|
|
|
1280211..1280283 |
atgf |
|
|
|
|
|
|
|
|
|
|
|
|
1283250..1283320 |
gga |
+ |
5 |
5 |
|
|
1283326..1283399 |
aga |
2 gga |
5 |
5 |
|
|
1283405..1283478 |
cac |
2 aga |
31 |
31 |
|
|
1283510..1283581 |
caa |
2 caa |
23 |
23 |
|
|
1283605..1283677 |
aaa |
|
30 |
30 |
|
|
1283708..1283792 |
cta |
|
23 |
23 |
|
|
1283816..1283886 |
gga |
|
5 |
5 |
|
|
1283892..1283965 |
aga |
|
6 |
6 |
|
|
1283972..1284043 |
caa |
|
|
|
|
|
|
|
|
|
|
|
|
1299560..1299632 |
ggc |
|
4 |
4 |
|
|
1299637..1299711 |
cca |
|
|
|
|
|
|
|
|
|
|
|
|
1346208..1346290 |
ctg |
|
|
|
|
|
|
|
|
|
|
|
|
1363346..1363428 |
ctg |
|
|
|
|
|
|
|
|
|
|
|
|
1515234..1515305 |
gaa |
|
62 |
62 |
|
|
1515368..1515442 |
cca |
|
22 |
22 |
|
|
1515465..1515537 |
aaa |
|
|
|
|
|
|
|
|
|
|
|
|
1597292..1597364 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
1611976..1612042 |
acg |
|
|
|
|
|
|
|
|
|
|
|
|
2065352..2065425 |
ata |
|
|
|
|
|
|
|
|
|
|
|
comp |
2090478..2090550 |
acc |
|
|
|
|
|
|
|
|
|
|
|
|
2394421..2394501 |
tac |
|
3 |
3 |
|
|
2394505..2394577 |
ttc |
|
|
|
|
|
|
|
|
|
|
|
|
2592342..2592422 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
|
2606024..2606104 |
ttg |
|
|
|
|
|
|
|
|
|
|
|
comp |
2737232..2737304 |
gcc |
|
|
|
|
|
|
|
|
|
|
|
comp |
2798802..2798874 |
aag |
|
|
|
|
|
|
|
|
|
|
|
comp |
2881571..2881642 |
gag |
|
|
|
|
|
|
|
|
|
|
|
comp |
3215471..3215545 |
cca |
|
|
|
|
|
|
|
|
|
|
|
comp |
3252582..3252655 |
atgj |
|
7 |
7 |
|
comp |
3252663..3252735 |
gta |
|
4 |
4 |
|
comp |
3252740..3252813 |
gac |
|
10 |
10 |
|
comp |
3252824..3252896 |
tgg |
|
20 |
20 |
|
comp |
3252917..3252988 |
aac |
|
|
|
|
|
|
|
|
683 |
|
|
comp |
3253672..3253748 |
atgj |
|
7 |
|
7
|
comp |
3253756..3253828 |
gta |
|
9 |
|
9
|
comp |
3253838..3253910 |
tgg |
|
18 |
|
18
|
comp |
3253929..3254000 |
aac |
|
60 |
|
|
comp |
3254061..3256967 |
23s |
|
|
|
|
|
|
|
|
362637 |
|
|
comp |
3619605..3619677 |
aca |
+ |
4 |
|
4
|
comp |
3619682..3619755 |
cgt |
2 cgt |
50 |
|
50
|
comp |
3619806..3619879 |
cgt |
2 aca |
27 |
|
27
|
comp |
3619907..3619990 |
tta |
|
3 |
|
3
|
comp |
3619994..3620069 |
gta |
|
47 |
|
47
|
comp |
3620117..3620190 |
gac |
|
22 |
|
22
|
comp |
3620213..3620289 |
atgi |
|
23 |
|
23
|
comp |
3620313..3620385 |
aca |
|
14 |
|
14
|
comp |
3620400..3620471 |
gaa |
|
9 |
|
9
|
comp |
3620481..3620552 |
aac |
|
110 |
|
|
comp |
3620663..3623568 |
23s |
|
261 |
|
|
comp |
3623830..3623902 |
gca |
|
53 |
|
53
|
comp |
3623956..3624029 |
atc |
|
7 |
|
|
comp |
3624037..3624154 |
5s |
|
72 |
|
|
comp |
3624227..3625761 |
16s |
|
149 |
|
|
comp |
3625911..3625999 |
tcc |
|
33 |
|
33
|
comp |
3626033..3626118 |
tca |
|
|
|
|
|
|
|
|
|
|
|
comp |
3714637..3714709 |
gta |
|
1 |
1 |
|
comp |
3714711..3714787 |
atgj |
|
|
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cle. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cle cumuls opérons effectif
avec rRNA opérons 19
16 5 aa 23 5
16 5 atc gca 2
solo 11
max a 14
a doubles 2
indéterminé 1
total aas 46
sans opérons 29
1 aa 19
max a 10
a doubles 2
total aas 59
total aas 105
remarques 5
C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires |
|
|
|
16s |
*2 |
16s° |
@5
|
|
|
|
|
23s |
*3 |
|
|
|
|
|
|
5s |
3*4 |
89 |
|
ggc |
|
|
|
|
|
|
|
aac |
60 |
|
|
23s |
|
|
|
|
|
|
|
16s |
137 |
|
|
5s |
|
|
|
|
|
|
|
16s |
72 |
72 |
72
|
5s |
5 |
4 |
4
|
gca |
282 |
280 |
282
|
23s |
|
|
|
|
|
|
|
|
|
agc |
202
|
16s |
138 |
16s |
72
|
5s |
7 |
5s |
4
|
atc |
258 |
gca |
262
|
23s |
|
23s |
55
|
|
|
gac |
61
|
|
|
|
|
|
|
aac |
110
|
16s |
72 |
23s |
261
|
5s |
7 |
gca |
53
|
atc |
53 |
atc |
7
|
gca |
261 |
5s |
72
|
23s |
110 |
16s |
149
|
aac |
9 |
tcc |
33
|
|
|
|
|
|
|
|
|
5s |
4 |
|
@4
|
gaa |
457 |
|
|
16s |
605 |
|
|
23s |
475 |
|
|
aaa |
9 |
|
|
Remarques : Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
@1 5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas.
- Le bloc à 9aas a un aa avant le 16s, compatible.
- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
@2 2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
@3 Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
- 23s, il y en a 4 dont 1 seul avec 4aas
- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
@4 Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux
autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
@5 16s°: 16S ribosomal RNA rRNA prediction is too short
Séquences des doubles : très peu de doublons.
- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
- 4 doublons pour chaque type d'opérons.
- 1 seule paire répétée chez les opérons sans rRNAs.
- Lien tableur: cle distribution
- Notes:
- - Tableau Cl61: ctt2 en gras, très rare
- - Tableau Cl62
- 1-3aas: aaa aga gga
- -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
- Blocs à rRNA: ils ont la forme 16s5saa23s
- cgt2 double en gras
Cl6 cle, Clostridium lentocellum DSM 5427. clostridia.
Cl61 cle. Distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
|
tac |
2 |
tgc |
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
|
g ctc |
|
f ccc |
1 |
cac |
2 |
cgt |
|
h gtc |
|
n gcc |
1 |
gac |
2 |
ggc |
1
|
i tta |
2 |
c tca |
2 |
taa |
|
tga |
|
j ata |
1 |
k aca |
1 |
aaa |
3 |
aga |
2
|
k cta |
2 |
g cca |
4 |
caa |
3 |
cga |
1
|
l gta |
3 |
o gca |
|
gaa |
2 |
œ |
3
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
3 |
l acg |
2 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cle |
40 |
19 |
|
|
|
|
59
|
|
Cl62 cle. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
3 |
j acc |
|
aac |
4 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
2 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
2 |
aga |
1
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
3 |
o gca |
6 |
gaa |
3 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cle |
|
|
|
34* |
3 |
9 |
64
|
|
- cle Le prélèvement: Aclostridia
- Le nom et le lien NCBI: cle, Cellulosilyticum lentocellum DSM 5427, NCBI [20], date 19.3.21.
- cle La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cle 615,068 4,714,237 13.0
Intergen51. cle. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cle les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cle les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
2,865 |
441 |
35 |
3,341 |
4.2 |
93 |
19 |
112
|
x |
779 |
21 |
0 |
800 |
|
0 |
8 |
8
|
t |
3,644 |
462 |
35 |
4,141 |
|
93 |
27 |
120
|
% |
88.0 |
11.2 |
0.8 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
46 |
0 |
0 |
46 |
2.0 |
tRNA-CDS |
69 |
25
|
x |
23 |
0 |
0 |
23 |
|
RNA-RNA |
93 |
34
|
t |
69 |
0 |
0 |
69 |
|
CDS-rRNA |
27 |
10
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
84 |
31
|
- |
|
|
|
|
|
total |
273 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
6.4 |
13.0 |
2.3 |
30.3 |
2.2 |
42 |
1.0 |
0.0
|
x |
10.7 |
30.4 |
0.0 |
2.6 |
0.0 |
38 |
0.0 |
0.0
|
|
Intergen51. cle. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cle données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cle fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cle fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cle
R2 x3 x2 x c Inflexion poly3 x c
0.708 3.88E-06 -2.96E-03 5.83E-01 1.51 fx1 abscisse 259.1 181.0
0.810 -6.21E-06 4.68E-03 -1.15E+00 105.0 fc1 ordonnée 21.5 19.5
0.727 2.29E-06 -1.78E-03 3.17E-01 19.00 fx41
0.948 8.86E-07 -4.81E-04 -2.70E-02 34.9 fc41
- Le rfin après 400 est de 185 sur un total de 2900 . Jusqu'à 1% les freq10 sont en continu jusqu'à 870 , reste 28 . L'indice i.rfin1 = 157/470=0,334.
- Le reste après 870 est de 28 sur un total de 2572 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1270 , reste 7 . L'indice i.rf2 = 21/400=0,053.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cle calculs poly3 cle
effect 2900 R2.21 841 abscis 300
xm 45 pte 9,45 flexa 152
ym 8 cste 3,18 flexo 2,22
x1m 231 r400l 169 xm 45
y1m 1 restp 184,83 sup4 86,0
rfin 63,79 %sd 26,97 sup4t 372,4
bornf 173 lond 186 % 23,1
supd 119,4 %sf 26,22 long 107
supdt 442,8 lonf 128 R2 488
xmp 372,41 sf/lf 0,72
r400 121,03 sr/lr 0,47
supf 92,4 sd/ld 0,64
supft 352,4 i.r400 0,72
Intergen51. cle. Les CDS-CDS négatifs
modifier
Sous-totaux cle totale
fréquence x- c- x- c-
- 1 0 78 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 8 107 717 10938
- 5 0 1 5 19
sp6 13 255 1642 8424
total 21 441 2,456 23,544
reste 0 10 264 420
s6 2 0 361 41
s7 3 37 321 1438
s8 8 208 696 6525
rappot s1-5
4/2/1 - 1.4 8.4 2.6
% / sp6
s6/sp6 15.4 0.0 22.0 0.5
s7/sp6 23.1 14.5 19.5 17.1
s8/sp6 61.5 81.6 42.4 77.5
reste/sp6 0.0 3.9 16.1 5.0
total s1-5 8 186 814 15120
% / total
%s1-5 38.1 42.2 33.1 64.2
%sp6 61.9 57.8 66.9 35.8
Intergen51. cle. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s CDS 16s 7 1
16s 23s 1 5s CDS 1
16s tRNA 16 CDS 1 1
tRNA 23s 7 CDS 5s 1 4
5s tRNA 12 23s CDS 6 2
tRNA in 2 CDS 23s 3
tRNA contig 25 5s 16s
tRNA hors 30 16s16s
tRNA 16s 3
23s tRNA 5
tRNA 5s
16s 5s 8
5s 23s
5s 5s
total 93 0 total 19 8
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cle. Les intercalaires tRNA-tRNA extra blocs
|
hors1 |
|
|
hors2 |
|
|
cont1 |
|
|
cont2
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
13 |
tta |
|
5 |
gga |
|
61 |
gac |
|
7 |
atgj
|
** |
tca |
|
5 |
aga |
|
7 |
gta |
|
9 |
gta
|
23 |
gaa |
|
31 |
cac |
|
34 |
aca |
|
18 |
tgg
|
45 |
cca |
|
23 |
caa |
|
12 |
tac |
|
** |
aac
|
11 |
aaa |
|
30 |
aaa |
|
3 |
atgj |
|
4 |
aca
|
56 |
gac |
|
26 |
cta |
|
3 |
ttc |
|
50 |
cgt
|
7 |
gta |
|
5 |
gga |
|
** |
aaa |
|
27 |
cgt
|
187 |
tta |
|
6 |
aga |
|
9 |
aaa |
|
6 |
tta
|
26 |
aca |
|
** |
caa |
|
6 |
gga |
|
47 |
gta
|
10 |
tac |
|
4 |
ggc |
|
** |
aga |
|
25 |
gac
|
31 |
atgj |
|
** |
cca |
|
9 |
aac |
|
23 |
atgi
|
** |
ttc |
|
62 |
gaa |
|
6 |
gaa |
|
14 |
aca
|
23 |
cac |
|
22 |
cca |
|
23 |
tgc |
|
9 |
gaa
|
32 |
caa |
|
** |
aaa |
|
58 |
aac |
|
** |
aac
|
** |
tca |
|
3 |
tac |
|
** |
tgc |
|
33 |
tcc
|
148 |
ctt |
|
** |
ttc |
|
|
|
|
** |
tca
|
** |
ctt |
|
7 |
atgj |
|
|
|
|
|
|
|
|
|
4 |
gta |
|
|
|
|
|
|
|
|
|
10 |
gac |
|
|
|
|
|
|
|
|
|
20 |
tgg |
|
|
|
|
|
|
|
|
|
** |
aac |
|
|
|
|
|
|
|
|
|
4 |
gta |
|
|
|
|
|
|
|
|
|
** |
atgj |
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
Heliobacterium modesticaldum Ice1 ATCC 51547
modifier
- Lien tableur: hmo opérons
- Liens: gtRNAdb [21], NCBI [22], génome [23]
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cds : cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC |
24.7.19 Paris |
109 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
103699..104088 |
CDS |
|
380 |
|
|
|
130 |
|
|
|
|
|
|
|
|
|
|
|
|
104469..105695 |
CDS |
|
186 |
186 |
|
|
409 |
186
|
comp |
105882..105956 |
ggc |
|
1 |
|
1 |
|
|
|
comp |
105958..106044 |
ctg |
|
321 |
321 |
|
|
|
|
comp |
106366..106929 |
CDS |
@1 |
241 |
241 |
|
|
188 |
241
|
comp |
107171..107246 |
aca |
|
202 |
202 |
|
|
|
202
|
comp |
107449..108183 |
CDS |
|
111772 |
|
|
|
245 |
|
|
|
|
|
|
|
|
|
|
|
comp |
219956..220483 |
CDS |
|
260 |
260 |
|
|
176 |
260
|
comp |
220744..220820 |
gac |
|
5 |
|
|
5 |
|
|
comp |
220826..220901 |
gta |
|
10 |
|
|
10 |
|
|
comp |
220912..220987 |
gaa |
|
4 |
|
|
4 |
|
|
comp |
220992..221067 |
aaa |
|
18 |
|
|
18 |
|
|
comp |
221086..221160 |
caa |
|
103 |
|
|
|
|
|
comp |
221264..224182 |
23s |
|
237 |
|
|
|
|
|
comp |
224420..224495 |
gcc |
|
64 |
|
|
|
|
|
comp |
224560..224676 |
5s |
@2 |
328 |
|
|
|
|
|
comp |
225005..226536 |
16s |
|
651 |
651 |
|
|
|
|
comp |
227188..228162 |
CDS |
|
98792 |
|
|
|
325 |
|
|
|
|
|
|
|
|
|
|
|
comp |
326955..328340 |
CDS |
|
178 |
178 |
|
|
462 |
178
|
comp |
328519..328601 |
cta |
|
65 |
|
65 |
|
|
|
comp |
328667..328743 |
aga |
|
60 |
|
60 |
|
|
|
comp |
328804..328880 |
cca |
|
568 |
568 |
|
|
|
|
comp |
329449..330090 |
CDS |
|
57730 |
|
|
|
214 |
|
|
|
|
|
|
|
|
|
|
|
comp |
387821..388105 |
CDS |
|
135 |
135 |
|
|
95 |
|
|
388241..388317 |
ccc |
|
7 |
|
7 |
|
|
|
|
388325..388410 |
tac |
|
47 |
47 |
|
|
|
47
|
comp |
388458..388742 |
CDS |
|
588493 |
|
|
|
95 |
|
|
|
|
|
|
|
|
|
|
|
comp |
977236..978504 |
CDS |
|
439 |
439 |
|
|
423 |
|
comp |
978944..981860 |
23s |
|
237 |
|
|
|
|
|
comp |
982098..982173 |
gcc |
|
64 |
|
|
|
|
|
comp |
982238..982354 |
5s |
|
328 |
|
|
|
|
|
comp |
982683..984208 |
16s |
|
460 |
|
|
|
|
|
comp |
984669..984744 |
tgg |
@3 |
5 |
|
|
5 |
|
|
comp |
984750..984824 |
cgg |
|
207 |
207 |
|
|
|
207
|
comp |
985032..987656 |
CDS |
|
26258 |
|
|
|
875 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1013915..1014760 |
CDS |
|
105 |
105 |
|
|
282 |
105
|
comp |
1014866..1014942 |
gac |
|
75 |
|
75 |
|
|
|
comp |
1015018..1015093 |
gaa |
|
265 |
265 |
|
|
|
|
comp |
1015359..1016642 |
CDS |
|
40115 |
|
|
|
428 |
|
|
|
|
|
|
|
|
|
|
|
|
1056758..1058014 |
CDS |
|
121 |
121 |
|
|
419 |
121
|
comp |
1058136..1058233 |
tga |
|
173 |
173 |
|
|
|
|
|
1058407..1058733 |
CDS |
|
62951 |
|
|
|
109 |
|
|
|
|
|
|
|
|
|
|
|
|
1121685..1122878 |
CDS |
|
588 |
588 |
|
|
398 |
|
|
1123467..1124998 |
16s |
|
328 |
|
|
|
|
|
|
1125327..1125443 |
5s |
|
64 |
|
|
|
|
|
|
1125508..1125583 |
gcc |
|
233 |
|
|
|
|
|
|
1125817..1128734 |
23s |
|
337 |
337 |
|
|
|
337
|
> |
1129072..1129785 |
CDS |
|
24938 |
|
|
|
238 |
|
|
|
|
|
|
|
|
|
|
|
|
1154724..1155224 |
CDS |
|
99 |
99 |
|
|
167 |
|
|
1155324..1155413 |
tca |
|
56 |
56 |
|
|
|
56
|
comp |
1155470..1156627 |
CDS |
|
13350 |
|
|
|
386 |
|
|
|
|
|
|
|
|
|
|
|
|
1169978..1171828 |
CDS |
|
129 |
129 |
|
|
617 |
129
|
|
1171958..1172034 |
cgt |
|
85 |
|
85 |
|
|
|
|
1172120..1172196 |
agg |
|
181 |
181 |
|
|
|
|
|
1172378..1172812 |
CDS |
|
62 |
62 |
|
|
145 |
62
|
|
1172875..1172966 |
tcg |
|
548 |
548 |
|
|
|
|
|
1173515..1174330 |
CDS |
|
6655 |
|
|
|
272 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1180986..1182974 |
CDS |
|
444 |
444 |
|
|
663 |
|
|
1183419..1183512 |
tcc |
|
39 |
39 |
|
|
|
39
|
|
1183552..1183817 |
ncRNA |
|
11908 |
|
|
|
89 |
|
|
|
|
|
|
|
|
|
|
|
|
1195726..1195998 |
CDS |
|
181 |
181 |
|
|
91 |
|
|
1196180..1196255 |
gcg |
|
151 |
151 |
|
|
|
151
|
|
1196407..1197051 |
CDS |
|
86894 |
|
|
|
215 |
|
|
|
|
|
|
|
|
|
|
|
comp |
1283946..1285331 |
CDS |
|
177 |
177 |
|
|
462 |
177
|
|
1285509..1285584 |
atgf |
|
5 |
|
5 |
|
|
|
|
1285590..1285667 |
atgj |
|
7 |
|
7 |
|
|
|
|
1285675..1285750 |
gaa |
|
542 |
542 |
|
|
|
|
|
1286293..1287630 |
CDS |
|
63447 |
|
|
|
446 |
|
|
|
|
|
|
|
|
|
|
|
|
1351078..1352549 |
CDS |
|
704 |
704 |
|
|
491 |
|
|
1353254..1354786 |
16s |
|
252 |
|
|
|
|
|
|
1355039..1355155 |
5s |
|
64 |
|
|
|
|
|
|
1355220..1355296 |
atc |
|
194 |
|
|
|
|
|
|
1355491..1358408 |
23s |
|
112 |
|
|
|
|
|
|
1358521..1358595 |
aac |
|
109 |
109 |
|
|
|
109
|
comp |
1358705..1358926 |
CDS |
|
139555 |
|
|
|
74 |
|
|
|
|
|
|
|
|
|
|
|
|
1498482..1498898 |
CDS |
|
535 |
535 |
|
|
139 |
|
comp |
1499434..1499509 |
acg |
|
238 |
238 |
|
|
|
238
|
|
1499748..1500836 |
CDS |
|
262182 |
|
|
|
363 |
|
|
|
|
|
|
|
|
|
|
|
|
1763019..1763858 |
CDS |
|
68 |
68 |
|
|
280 |
68
|
|
1763927..1764003 |
gac |
|
4 |
|
4 |
|
|
|
|
1764008..1764083 |
ttc |
|
3 |
|
3 |
|
|
|
|
1764087..1764161 |
ggc |
|
92 |
92 |
|
|
|
|
comp |
1764254..1764493 |
CDS |
|
72 |
72 |
|
|
80 |
72
|
|
1764566..1764641 |
tgc |
|
18 |
|
18 |
|
|
|
|
1764660..1764746 |
tta |
|
253 |
253 |
|
|
|
|
comp |
1765000..1765467 |
CDS |
|
52131 |
|
|
|
156 |
|
|
|
|
|
|
|
|
|
|
|
|
1817599..1818318 |
CDS |
|
487 |
487 |
|
|
240 |
|
|
1818806..1820337 |
16s |
|
252 |
|
|
|
|
|
|
1820590..1820706 |
5s |
|
64 |
|
|
|
|
|
|
1820771..1820847 |
atc |
|
6 |
|
|
6 |
|
|
|
1820854..1820929 |
gca |
|
229 |
|
|
|
|
|
|
1821159..1824076 |
23s |
|
112 |
|
|
|
|
|
|
1824189..1824263 |
aac |
|
6 |
|
|
6 |
|
|
|
1824270..1824345 |
atgf |
|
243 |
243 |
|
|
|
243
|
|
1824589..1825014 |
CDS |
|
168198 |
|
|
|
142 |
|
|
|
|
|
|
|
|
|
|
|
|
1993213..1994328 |
CDS |
|
99 |
99 |
|
|
372 |
|
|
1994428..1994502 |
atgi |
|
41 |
41 |
|
|
|
41
|
|
1994544..1995368 |
CDS |
|
284281 |
|
|
|
275 |
|
|
|
|
|
|
|
|
|
|
|
|
2279650..2279997 |
CDS |
|
541 |
541 |
|
|
116 |
|
|
2280539..2282070 |
16s |
|
253 |
|
|
|
|
|
|
2282324..2282440 |
5s |
|
64 |
|
|
|
|
|
|
2282505..2282580 |
gcc |
|
234 |
|
|
|
|
|
|
2282815..2285735 |
23s |
|
119 |
|
|
|
|
|
|
2285855..2285948 |
tcc |
|
6 |
|
|
6 |
|
|
|
2285955..2286031 |
ccg |
|
10 |
|
|
10 |
|
|
|
2286042..2286115 |
gga |
|
14 |
|
|
14 |
|
|
|
2286130..2286205 |
cac |
|
1 |
|
|
1 |
|
|
|
2286207..2286281 |
tgc |
|
9 |
|
|
9 |
|
|
|
2286291..2286367 |
gtc |
|
3 |
|
|
3 |
|
|
|
2286371..2286446 |
ttc |
|
6 |
|
|
6 |
|
|
|
2286453..2286537 |
tac |
|
4 |
|
|
4 |
|
|
|
2286542..2286616 |
caa |
|
17 |
|
|
17 |
|
|
|
2286634..2286709 |
aaa |
|
4 |
|
|
4 |
|
|
|
2286714..2286789 |
gaa |
|
5 |
|
|
5 |
|
|
|
2286795..2286870 |
gta |
|
5 |
|
|
5 |
|
|
|
2286876..2286952 |
gac |
|
7 |
|
|
7 |
|
|
|
2286960..2287050 |
agc |
|
43 |
|
|
43 |
|
|
|
2287094..2287170 |
ccc |
|
30 |
|
|
30 |
|
|
|
2287201..2287287 |
ctg |
|
3 |
|
|
3 |
|
|
|
2287291..2287365 |
ggc |
|
4 |
|
|
4 |
|
|
|
2287370..2287446 |
cgt |
|
4 |
|
|
4 |
|
|
|
2287451..2287526 |
acc |
|
352 |
352 |
|
|
|
352
|
|
2287879..2288343 |
CDS |
|
33184 |
|
|
|
155 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2321528..2322544 |
CDS |
|
268 |
268 |
|
|
339 |
|
comp |
2322813..2322889 |
gtc |
|
9 |
|
9 |
|
|
|
comp |
2322899..2322973 |
cgg |
|
81 |
81 |
|
|
|
81
|
comp |
2323055..2323243 |
CDS |
|
3375 |
|
|
|
63 |
|
|
|
|
|
|
|
|
|
|
|
|
2326619..2327947 |
CDS |
|
464 |
464 |
|
|
443 |
464
|
|
2328412..2329943 |
16s |
|
327 |
|
|
|
|
|
|
2330271..2330387 |
5s |
|
226 |
|
|
|
|
|
|
2330614..2333532 |
23s |
|
98 |
|
|
|
|
|
|
2333631..2333706 |
aaa |
|
4 |
|
|
4 |
|
|
|
2333711..2333786 |
acc |
|
8 |
|
|
8 |
|
|
|
2333795..2333877 |
ctc |
|
89 |
89 |
|
|
|
89
|
comp |
2333967..2334704 |
CDS |
|
7389 |
|
|
|
246 |
|
|
|
|
|
|
|
|
|
|
|
|
2342094..2342804 |
CDS |
|
155 |
155 |
|
|
237 |
155
|
comp |
2342960..2343030 |
ttc |
|
213 |
213 |
|
|
|
|
|
2343244..2343936 |
CDS |
|
563 |
563 |
|
|
231 |
|
|
2344500..2346025 |
16s |
|
252 |
|
|
|
|
|
|
2346278..2346394 |
5s |
|
64 |
|
|
|
|
|
|
2346459..2346535 |
atc |
|
141 |
|
|
|
|
|
|
2346677..2349594 |
23s |
|
100 |
|
|
|
|
|
|
2349695..2349769 |
aac |
|
6 |
|
|
6 |
|
|
|
2349776..2349851 |
atgf |
|
102 |
102 |
|
|
|
102
|
|
2349954..2350976 |
CDS |
|
113601 |
|
|
|
341 |
|
|
|
|
|
|
|
|
|
|
|
|
2464578..2465114 |
CDS |
|
271 |
271 |
|
|
179 |
271
|
comp |
2465386..2465461 |
aca |
|
432 |
432 |
|
|
|
|
|
2465894..2466226 |
CDS |
|
4722 |
|
|
|
111 |
|
|
|
|
|
|
|
|
|
|
|
|
2470949..2471977 |
CDS |
|
69 |
69 |
|
|
343 |
69
|
|
2472047..2472133 |
ctg |
|
678 |
678 |
|
|
|
|
|
2472812..2473192 |
CDS |
|
22232 |
|
|
|
127 |
|
|
|
|
|
|
|
|
|
|
|
|
2495425..2496048 |
CDS |
|
402 |
402 |
|
|
208 |
|
comp |
2496451..2496527 |
gtc |
|
4 |
|
4 |
|
|
|
comp |
2496532..2496609 |
atgj |
|
175 |
175 |
|
|
|
175
|
|
2496785..2497120 |
CDS |
|
217 |
217 |
|
|
112 |
|
comp |
2497338..2497420 |
ctc |
|
7 |
|
7 |
|
|
|
comp |
2497428..2497503 |
acc |
|
18 |
|
18 |
|
|
|
comp |
2497522..2497596 |
tgg |
|
14 |
|
14 |
|
|
|
comp |
2497611..2497684 |
ggg |
|
19 |
|
19 |
|
|
|
comp |
2497704..2497778 |
ggc |
|
7 |
|
7 |
|
|
|
comp |
2497786..2497873 |
ttg |
|
8 |
|
8 |
|
|
|
comp |
2497882..2497958 |
gtg |
|
-10 |
-10 |
|
|
|
-10
|
comp |
2497949..2498185 |
CDS |
|
66 |
66 |
|
|
79 |
66
|
|
2498252..2498328 |
ccg |
|
314 |
314 |
|
|
|
|
comp |
2498643..2499506 |
CDS |
|
55292 |
|
|
|
288 |
|
|
|
|
|
|
|
|
|
|
|
|
2554799..2554984 |
CDS |
|
109 |
109 |
|
|
62 |
109
|
|
2555094..2555169 |
gaa |
|
2 |
|
2 |
|
|
|
|
2555172..2555247 |
ttc |
|
6 |
|
6 |
|
|
|
|
2555254..2555338 |
tac |
|
4 |
|
4 |
|
|
|
|
2555343..2555417 |
caa |
|
18 |
|
18 |
|
|
|
|
2555436..2555511 |
aaa |
|
4 |
|
4 |
|
|
|
|
2555516..2555590 |
ggc |
|
9 |
|
9 |
|
|
|
|
2555600..2555675 |
cac |
|
117 |
117 |
|
|
|
|
comp |
2555793..2557049 |
CDS |
|
235940 |
|
|
|
419 |
|
|
|
|
|
|
|
|
|
|
|
comp |
2792990..2793442 |
CDS |
|
219 |
219 |
|
|
151 |
219
|
comp |
2793662..2796583 |
23s |
|
236 |
|
|
|
|
|
comp |
2796820..2796895 |
gca |
|
6 |
|
|
6 |
|
|
comp |
2796902..2796978 |
atc |
|
64 |
|
|
|
|
|
comp |
2797043..2797159 |
5s |
|
328 |
|
|
|
|
|
comp |
2797488..2799019 |
16s |
|
505 |
|
|
|
|
|
comp |
2799525..2799599 |
ggc |
+ |
1 |
|
|
1 |
|
|
comp |
2799601..2799687 |
ctg |
2 ggc |
32 |
|
|
32 |
|
|
comp |
2799720..2799796 |
ccc |
|
42 |
|
|
42 |
|
|
comp |
2799839..2799915 |
cgt |
|
4 |
|
|
4 |
|
|
comp |
2799920..2799994 |
ggc |
|
120 |
|
|
120 |
|
|
comp |
2800115..2800192 |
atgj |
|
42 |
|
|
42 |
|
|
comp |
2800235..2800325 |
agc |
|
16 |
|
|
16 |
|
|
comp |
2800342..2800417 |
atgf |
|
6 |
|
|
6 |
|
|
comp |
2800424..2800498 |
aac |
|
7 |
|
|
7 |
|
|
comp |
2800506..2800581 |
gaa |
|
4 |
|
|
4 |
|
|
comp |
2800586..2800661 |
aaa |
|
18 |
|
|
18 |
|
|
comp |
2800680..2800754 |
caa |
|
4 |
|
|
4 |
|
|
comp |
2800759..2800843 |
tac |
|
91 |
|
|
91 |
|
|
comp |
2800935..2801011 |
gtc |
|
7 |
|
|
7 |
|
|
comp |
2801019..2801093 |
tgc |
|
325 |
325 |
|
|
|
|
|
2801419..2801724 |
CDS |
|
230813 |
|
|
|
102 |
|
|
|
|
|
|
|
|
|
|
|
|
3032538..3032729 |
CDS |
|
109 |
109 |
|
|
64 |
109
|
comp |
3032839..3035757 |
23s |
|
233 |
|
|
|
|
|
comp |
3035991..3036066 |
gcc |
|
64 |
|
|
|
|
|
comp |
3036131..3036247 |
5s |
|
253 |
|
|
|
|
|
comp |
3036501..3038026 |
16s |
|
779 |
779 |
|
|
|
|
comp |
3038806..3040017 |
CDS |
|
232 |
|
|
|
404 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3040250..3042013 |
CDS |
|
|
|
|
|
588 |
|
- Lien tableur: hmo cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
10 |
1 |
1 |
2 |
1 |
1 |
40 |
1 |
100 |
10
|
|
16 5s gcc 23 |
5 |
20 |
20 |
34 |
50 |
3 |
80 |
8 |
200 |
16
|
|
16 5s atc 23 |
2 |
40 |
0 |
2 |
100 |
11 |
120 |
7 |
300 |
14
|
|
16 5 23s a |
1 |
60 |
1 |
3 |
150 |
9 |
160 |
4 |
400 |
8
|
|
max a |
20 |
80 |
2 |
0 |
200 |
9 |
200 |
4 |
500 |
11
|
|
a doubles |
1 |
100 |
1 |
1 |
250 |
8 |
240 |
4 |
600 |
0
|
|
16 5s atc gca |
2 |
120 |
0 |
1 |
300 |
5 |
280 |
4 |
700 |
2
|
|
total aas |
60 |
140 |
0 |
0 |
350 |
4 |
320 |
0 |
800 |
0
|
sans |
opérons |
24 |
160 |
0 |
0 |
400 |
1 |
360 |
2 |
900 |
1
|
|
1 aa |
12 |
180 |
0 |
0 |
450 |
4 |
400 |
0 |
1000 |
0
|
|
max a |
7 |
200 |
0 |
0 |
500 |
2 |
440 |
0 |
1100 |
0
|
|
a doubles |
0 |
|
0 |
0 |
|
11 |
|
1 |
|
0
|
|
total aas |
49 |
|
21 |
38 |
|
56 |
|
32 |
|
59
|
total aas |
|
109 |
|
|
|
|
|
|
|
|
|
remarques |
|
3 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
|
|
|
|
|
|
|
|
|
|
variance |
|
|
|
|
|
|
|
|
sans jaune |
|
|
moyenne |
8 |
8 |
|
196 |
|
137 |
|
230
|
|
|
|
variance |
6 |
7 |
|
120 |
|
71 |
|
128
|
- Note: intercalaires prélevés de la colonne cds de hmo opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
hmo 70 52 35 87
deb fin deb fin grand petit grand petit
62 548 217 -10 92 68 217 -10
66 314 444 39 99 41 444 39
68 92 99 41 99 56 99 41
69 678 135 47 117 109 135 47
72 253 99 56 135 47 99 56
99 56 268 81 173 121 548 62
99 41 68 92 181 151 314 66
105 265 109 117 181 129 92 68
109 117 181 151 217 -10 678 69
121 173 121 173 241 202 253 72
129 181 402 175 253 72 268 81
135 47 129 181 265 105 265 105
177 542 241 202 268 81 117 109
178 568 535 238 314 66 173 121
181 151 72 253 321 186 181 129
186 321 105 265 402 175 181 151
217 -10 66 314 432 271 402 175
241 202 186 321 444 39 542 177
268 81 271 432 535 238 568 178
271 432 177 542 542 177 321 186
402 175 62 548 548 62 241 202
444 39 178 568 568 178 535 238
535 238 69 678 678 69 432 271
- Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia cds total total <0 0-200 201-370 371-600 >600 deb fin grand petit
hmo 2,707 46 1 27 10 7 1 16 11 8 19
‰ 22 587 217 152 22 696 478 348 826
- Lien tableur: hmo blocs
- Légende:
- - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
- Notes:
- - Les spécificités gcc atc atc-gca et tRNA avant 16s
- - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
|
|
|
|
|
tgg
|
CDS |
541 |
651 |
588 |
779 |
460
|
16s |
253 |
328 |
328 |
253 |
328
|
5s |
64 |
64 |
64 |
64 |
64
|
gcc |
234 |
237 |
233 |
233 |
237
|
23s |
119 |
103 |
337 |
109 |
439
|
tcc |
tcc |
caa |
cds |
cds |
cds
|
|
|
|
|
|
|
CDS |
704 |
563 |
|
CDS |
464
|
16s |
252 |
252 |
|
16s |
327
|
5s |
64 |
64 |
|
5s |
226
|
atc |
194 |
141 |
|
23s |
98
|
23s |
112 |
100 |
|
aaa |
|
aac |
aac |
aac |
|
|
|
|
|
|
|
|
|
|
|
ggc |
|
|
|
CDS |
487 |
505 |
|
|
|
16s |
252 |
328 |
|
|
|
5s |
64 |
64 |
|
|
|
atc |
6 |
6 |
|
|
|
gca |
229 |
236 |
|
|
|
23s |
112 |
219 |
|
|
|
aac |
aac |
cds |
|
|
|
- Remarques des 3 @ dans opérons :
- @ Les cds en vert.
- - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants : 321-241 181-62 92-72 213-563* 175-217 -10-66.
- - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
- - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
- @ Voir hmo blocs.
- - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
- - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
- @ tRNAs avant 16s
- - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
- - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
- Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
- Notes:
- - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
- - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
- - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.
- Lien tableur: hmo distribution
- Notes: Tableau Cl72,
- - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
- - Les blocs à rRNA sont de la forme 16s5saa23s
Cl7 hmo, Heliobacterium modesticaldum Ice1 ATCC 51547. clostridia.
Cl71 hmo. Distribution des blocs sans rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
1 |
tac |
2 |
tgc |
1
|
f atc |
|
j acc |
1 |
aac |
|
agc |
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
2 |
n gcc |
|
gac |
2 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
1
|
j ata |
|
k aca |
2 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
|
o gca |
|
gaa |
3 |
gga |
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
2 |
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
hmo |
37 |
12 |
|
|
|
|
49
|
|
Cl72 hmo. Distribution des blocs avec rRNA.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
2 |
tgc |
2
|
f atc |
4 |
j acc |
2 |
aac |
4 |
agc |
2
|
g ctc |
1 |
f ccc |
2 |
cac |
1 |
cgt |
2
|
h gtc |
2 |
n gcc |
5 |
gac |
2 |
ggc |
3
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
4 |
aga |
|
k cta |
|
g cca |
|
caa |
3 |
cga |
|
l gta |
2 |
o gca |
2 |
gaa |
3 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
|
agg |
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
hmo |
|
|
|
49 |
|
11 |
60
|
|
- hmo Le prélèvement: Aclostridia
- Le nom et le lien NCBI: hmo, Heliomicrobium modesticaldum Ice1, NCBI [24], date 6.3.22.
- hmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
hmo 396,940 3,075,407 12.9
Intergen51. hmo. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. hmo les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 hmo les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,850 |
332 |
17 |
2,199 |
4.7 |
103 |
13 |
116
|
x |
460 |
11 |
0 |
471 |
|
1 |
1 |
2
|
t |
2,310 |
343 |
17 |
2,670 |
|
104 |
14 |
118
|
% |
86.5 |
12.8 |
0.6 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
31 |
0 |
0 |
31 |
1.3 |
tRNA-CDS |
54 |
24
|
x |
23 |
0 |
0 |
23 |
|
RNA-RNA |
104 |
47
|
t |
54 |
0 |
0 |
54 |
|
CDS-rRNA |
14 |
6
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
51 |
23
|
- |
|
|
|
|
|
total |
223 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
5.8 |
12.9 |
0.0 |
24.6 |
0.0 |
60 |
0.8 |
0.0
|
x |
12.6 |
17.4 |
18.2 |
5.0 |
0.0 |
36 |
0.0 |
0.0
|
|
Intergen51. hmo. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: hmo données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées hmo fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. hmo fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 hmo
R2 x3 x2 x c Inflexion poly3 x c
0.427 2.46E-06 -1.95E-03 3.93E-01 8.01 fx1 abscisse 257.3 151.9
0.885 -3.49E-06 2.27E-03 -7.66E-01 85.6 fc1 ordonnée 21.3 25.7
0.449 3.20E-06 -2.47E-03 4.97E-01 2.46 fx41
0.959 9.96E-07 -4.54E-04 -7.46E-02 44.0 fc41
- Le rfin après 400 est de 108 sur un total de 1867 . Jusqu'à 1% les freq10 sont en continu jusqu'à 660 , reste 19 . L'indice i.rfin1 = 89/260=0,342.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données hmo calculs poly3 hmo
effect 1867 R2.21 757 abscis 300
xm 43 pte 9,34 flexa 155
ym 5,6 cste 3,40 flexo 2,46
x1m 257 r400l 143 xm 47
y1m 1 restp 153,72 sup4 112,2
rfin 57,85 %sd 29,68 sup4t 316,0
bornf 117 lond 214 % 35,5
supd 161,9 %sf 30,67 long 108
supdt 545,3 lonf 74 R2 492
xmp 301,02 sf/lf 1,13
r400 95,88 sr/lr 0,56
supf 83,3 sd/ld 0,76
supft 271,6 i.r400 0,67
Intergen51. hmo. Les CDS-CDS négatifs
modifier
Sous-totaux hmo totale
fréquence x- c- x- c-
- 1 0 36 4 4140
- 2 1 0 85 11
- 3 0 0 3 12
- 4 3 149 717 10938
- 5 0 0 5 19
sp6 7 132 1642 8424
total 11 332 2,456 23,544
reste 2 0 264 420
s6 1 1 361 41
s7 3 41 321 1438
s8 1 90 696 6525
rappot s1-5
4/2/1 3.0 4.1 8.4 2.6
% / sp6
s6/sp6 14.3 0.8 22.0 0.5
s7/sp6 42.9 31.1 19.5 17.1
s8/sp6 14.3 68.2 42.4 77.5
reste/sp6 28.6 0.0 16.1 5.0
total s1-5 4 185 814 15120
% / total
%s1-5 36.4 55.7 33.1 64.2
%sp6 63.6 44.3 66.9 35.8
Intergen51. hmo. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s CDS 16s 10
16s 23s 5s CDS
16s tRNA 16 CDS
tRNA 23s 9 CDS 5s
5s tRNA 9 23s CDS 3 1
tRNA in 2 CDS 23s
tRNA contig 40 5s 16s
tRNA hors 26 1 16s16s
tRNA 16s
23s tRNA 6
tRNA 5s
16s 5s 10
5s 23s 1
5s 5s
total 103 1 total 13 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 hmo. Les intercalaires tRNA-tRNA extra blocs
|
cont1 |
|
|
cont2 |
|
|
hors1 |
|
|
hors2
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
5 |
gac |
|
4 |
aaa |
|
1 |
ggc |
|
18 |
tgc
|
10 |
gta |
|
8 |
acc |
|
** |
ctg |
|
** |
tta
|
4 |
gaa |
|
** |
ctc |
|
65 |
cta |
|
9 |
gtc
|
18 |
aaa |
|
6 |
aac |
|
60 |
aga |
|
** |
cgg
|
** |
caa |
|
** |
atgf |
|
** |
cca |
|
4 |
gtc
|
6 |
aac |
|
1 |
ggc |
|
7 |
ccc |
|
** |
atgj
|
** |
atgf |
|
32 |
ctg |
|
** |
tac |
|
7 |
ctc
|
6 |
tcc |
|
42 |
ccc |
|
5 |
tgg |
|
18 |
acc
|
10 |
ccg |
|
4 |
cgt |
|
** |
cgg |
|
14 |
tgg
|
14 |
gga |
|
120 |
ggc |
|
75 |
gac |
|
19 |
ggg
|
1 |
cac |
|
42 |
atgj |
|
** |
gaa |
|
7 |
ggc
|
9 |
tgc |
|
16 |
agc |
|
85 |
cgt |
|
8 |
ttg
|
3 |
gtc |
|
6 |
atgf |
|
** |
agg |
|
x293 |
gtg
|
6 |
ttc |
|
7 |
aac |
|
5 |
atgf |
|
** |
ccg
|
4 |
tac |
|
4 |
gaa |
|
7 |
atgj |
|
2 |
gaa
|
17 |
caa |
|
18 |
aaa |
|
** |
gaa |
|
6 |
ttc
|
4 |
aaa |
|
4 |
caa |
|
4 |
gac |
|
4 |
tac
|
5 |
gaa |
|
91 |
tac |
|
3 |
ttc |
|
18 |
caa
|
5 |
gta |
|
7 |
gtc |
|
** |
ggc |
|
4 |
aaa
|
7 |
gac |
|
** |
tgc |
|
|
|
|
9 |
ggc
|
43 |
agc |
|
|
|
|
|
|
|
** |
cac
|
30 |
ccc |
|
|
|
|
|
|
|
|
|
3 |
ctg |
|
|
|
|
|
|
|
|
|
4 |
ggc |
|
|
|
|
|
|
|
|
|
4 |
cgt |
|
|
|
|
|
|
|
|
|
** |
acc |
|
|
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
Clostridium beijerinckii strain NCIMB 14988
modifier
- Lien tableur: cbei opérons
- Liens: gtRNAdb [], NCBI [25], génome []
- Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
- Légende: cdsa: cds aas, cdsd: cds dirigé
- - cyan pour les doubles signalés par le signe + dans la colonne doubles.
- - @ voir le chapitre remarques de ce génome.
- Notes:
- - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC |
29.7.19 Paris |
93 |
doubles |
intercal |
cds |
aa |
avec aa |
cdsa |
cdsd
|
|
6477551..6480031 |
CDS |
|
496 |
496 |
|
|
827 |
|
|
6480528..6482044 |
16s |
|
213 |
|
|
|
|
|
|
6482258..6485171 |
23s |
|
108 |
|
|
|
|
|
|
6485280..6485394 |
5s |
|
14 |
|
|
|
|
|
|
15..91 |
atgi |
|
1 |
|
|
1 |
|
|
|
93..168 |
gca |
|
85 |
85 |
|
|
|
85
|
|
254..769 |
CDS |
|
1940 |
|
|
|
172 |
|
|
|
|
|
|
|
|
|
|
|
|
2710..2937 |
CDS |
|
119 |
119 |
|
|
76 |
119
|
|
3057..3147 |
tca |
+ |
30 |
|
30 |
|
|
|
|
3178..3268 |
agc |
2 tca |
241 |
|
241 |
|
|
|
|
3510..3600 |
tca |
2 agc |
18 |
|
18 |
|
|
|
|
3619..3709 |
agc |
|
125 |
125 |
|
|
|
|
|
3835..4350 |
CDS |
|
9470 |
|
|
|
172 |
|
|
|
|
|
|
|
|
|
|
|
|
13821..14726 |
CDS |
|
187 |
187 |
|
|
302 |
|
|
14914..14988 |
cgt |
|
34 |
34 |
|
|
|
34
|
comp |
15023..15913 |
CDS |
|
109014 |
|
|
|
297 |
|
|
|
|
|
|
|
|
|
|
|
|
124928..125338 |
CDS |
|
275 |
275 |
|
|
137 |
275
|
|
125614..125702 |
tta |
+ |
20 |
|
20 |
|
|
|
|
125723..125798 |
atgf |
4 tta |
7 |
|
7 |
|
|
|
|
125806..125882 |
atgj |
4 atgf |
6 |
|
6 |
|
|
|
|
125889..125977 |
tta |
2 atgj |
22 |
|
22 |
|
|
|
|
126000..126075 |
atgf |
|
7 |
|
7 |
|
|
|
|
126083..126159 |
atgj |
|
6 |
|
6 |
|
|
|
|
126166..126254 |
tta |
|
21 |
|
21 |
|
|
|
|
126276..126351 |
atgf |
|
70 |
|
70 |
|
|
|
|
126422..126510 |
tta |
|
21 |
|
21 |
|
|
|
|
126532..126607 |
atgf |
|
664 |
664 |
|
|
|
|
|
127272..129683 |
CDS |
|
8954 |
|
|
|
804 |
|
|
|
|
|
|
|
|
|
|
|
|
138638..140143 |
CDS |
|
307 |
307 |
|
|
502 |
|
|
140451..140525 |
aac |
+ |
234 |
|
234 |
|
|
|
|
140760..140834 |
aac |
3 aac |
439 |
|
439 |
|
|
|
|
141274..141348 |
aac |
@6 |
299 |
299 |
|
|
|
299
|
|
141648..143039 |
CDS |
|
1587 |
|
|
|
464 |
|
|
|
|
|
|
|
|
|
|
|
comp |
144627..145649 |
CDS |
|
543 |
543 |
|
|
341 |
|
|
146193..147709 |
16s |
|
140 |
|
|
|
|
|
|
147850..147925 |
gca |
|
3 |
|
|
3 |
|
|
|
147929..148005 |
atc |
|
111 |
|
|
|
|
|
|
148117..151030 |
23s |
|
70 |
|
|
|
|
|
|
151101..151217 |
5s |
|
5 |
|
|
5 |
|
|
|
151223..151298 |
ttc |
|
4 |
|
|
|
|
|
|
151303..151377 |
tgc |
|
167 |
167 |
|
|
|
167
|
|
151545..151841 |
CDS |
|
25608 |
|
|
|
99 |
|
|
|
|
|
|
|
|
|
|
|
|
177450..178097 |
CDS |
|
76 |
76 |
|
|
216 |
|
|
178174..178249 |
acc |
|
65 |
65 |
|
|
|
65
|
|
178315..179508 |
CDS |
|
134221 |
|
|
|
398 |
|
|
|
|
|
|
|
|
|
|
|
|
313730..316207 |
CDS |
|
90 |
90 |
|
|
826 |
90
|
|
316298..316382 |
cta |
|
4 |
|
4 |
|
|
|
|
316387..316461 |
ggg |
|
120 |
120 |
|
|
|
|
comp |
316582..316986 |
CDS |
|
85487 |
|
|
|
135 |
|
|
|
|
|
|
|
|
|
|
|
|
402474..402953 |
CDS |
|
125 |
125 |
|
|
160 |
125
|
|
403079..403154 |
cca |
+ |
17 |
|
17 |
|
|
|
|
403172..403245 |
gga |
2* |
149 |
|
149 |
|
|
|
|
403395..403471 |
aga |
cca gga aga |
6 |
|
6 |
|
|
|
|
403478..403553 |
cca |
|
16 |
|
16 |
|
|
|
|
403570..403643 |
gga |
|
35 |
|
35 |
|
|
|
|
403679..403755 |
aga |
|
5 |
|
5 |
|
|
|
|
403761..403836 |
cac |
|
3 |
|
3 |
|
|
|
|
403840..403914 |
caa |
2* |
7 |
|
7 |
|
|
|
|
403922..403997 |
aaa |
caa aaa cta |
18 |
|
18 |
|
|
|
|
404016..404100 |
cta |
ggc gga |
5 |
|
5 |
|
|
|
|
404106..404180 |
ggc |
|
25 |
|
25 |
|
|
|
|
404206..404279 |
gga |
|
5 |
|
5 |
|
|
|
|
404285..404360 |
aag |
|
57 |
|
57 |
|
|
|
|
404418..404492 |
caa |
|
7 |
|
7 |
|
|
|
|
404500..404575 |
aaa |
|
18 |
|
18 |
|
|
|
|
404594..404678 |
cta |
|
5 |
|
5 |
|
|
|
|
404684..404758 |
ggc |
|
25 |
|
25 |
|
|
|
|
404784..404857 |
gga |
|
46 |
|
46 |
|
|
|
|
404904..404980 |
cga |
|
325 |
325 |
|
|
|
|
< |
405306..405467 |
CDS |
|
8393 |
|
|
|
54 |
|
|
|
|
|
|
|
|
|
|
|
|
413861..415921 |
CDS |
|
385 |
385 |
|
|
687 |
|
|
416307..417823 |
16s |
@5 |
132 |
|
|
|
|
|
|
417956..418032 |
atc |
|
84 |
|
|
|
|
|
|
418117..421031 |
23s |
|
71 |
|
|
|
|
|
|
421103..421177 |
aac |
|
345 |
345 |
|
|
|
345
|
|
421523..422449 |
CDS |
|
63814 |
|
|
|
309 |
|
|
|
|
|
|
|
|
|
|
|
|
486264..486668 |
CDS |
|
159 |
159 |
|
|
135 |
159
|
|
486828..486912 |
tac |
+ |
9 |
|
9 |
|
|
|
|
486922..486997 |
gta |
3 tac |
27 |
|
27 |
|
|
|
|
487025..487099 |
aca |
2 gta |
12 |
|
12 |
|
|
|
|
487112..487196 |
tac |
2 aca |
9 |
|
9 |
|
|
|
|
487206..487281 |
gta |
|
30 |
|
30 |
|
|
|
|
487312..487386 |
aca |
|
12 |
|
12 |
|
|
|
|
487399..487483 |
tac |
|
451 |
451 |
|
|
|
|
|
487935..489110 |
CDS |
|
50956 |
|
|
|
392 |
|
|
|
|
|
|
|
|
|
|
|
|
540067..540969 |
CDS |
|
187 |
187 |
|
|
301 |
187
|
|
541157..541231 |
tgg |
|
208 |
208 |
|
|
|
|
|
541440..541820 |
CDS |
|
97 |
|
|
|
127 |
|
|
|
|
|
|
|
|
|
|
|
comp |
541918..542985 |
CDS |
|
252 |
252 |
|
|
356 |
252
|
|
543238..543312 |
tgg |
|
354 |
354 |
|
|
|
|
|
543667..544683 |
CDS |
|
347735 |
|
|
|
339 |
|
|
|
|
|
|
|
|
|
|
|
|
892419..893339 |
CDS |
|
560 |
560 |
|
|
307 |
|
|
893900..895416 |
16s |
|
137 |
|
|
|
|
|
|
895554..895629 |
gca |
|
118 |
|
|
|
|
|
|
895748..898661 |
23s |
|
204 |
|
|
|
|
|
|
898866..898982 |
5s |
|
552 |
552 |
|
|
|
552
|
|
899535..900446 |
CDS |
|
351 |
|
|
|
304 |
|
|
|
|
|
|
|
|
|
|
|
|
900798..902048 |
CDS |
|
704 |
704 |
|
|
417 |
|
|
902753..904269 |
16s |
|
339 |
|
|
|
|
|
|
904609..907522 |
23s |
|
273 |
|
|
|
|
|
|
907796..907912 |
5s |
|
69 |
69 |
|
|
|
69
|
comp |
907982..908449 |
CDS |
|
43545 |
|
|
|
156 |
|
|
|
|
|
|
|
|
|
|
|
|
951995..952630 |
CDS |
|
97 |
97 |
|
|
212 |
97
|
|
952728..952813 |
ctc |
|
396 |
396 |
|
|
|
|
|
953210..954919 |
CDS |
|
784414 |
|
|
|
570 |
|
|
|
|
|
|
|
|
|
|
|
|
1739334..1739933 |
CDS |
|
380 |
380 |
|
|
200 |
380
|
|
1740314..1740389 |
cac |
|
3 |
|
3 |
|
|
|
|
1740393..1740467 |
cag |
|
5 |
|
5 |
|
|
|
|
1740473..1740548 |
aaa |
|
443 |
443 |
|
|
|
|
comp |
1740992..1742350 |
CDS |
|
151829 |
|
|
|
453 |
|
|
|
|
|
|
|
|
|
|
|
|
1894180..1895406 |
CDS |
|
34 |
34 |
|
|
409 |
34
|
comp |
1895441..1895527 |
ttg |
|
574 |
574 |
|
|
|
|
|
1896102..1896794 |
CDS |
|
200701 |
|
|
|
231 |
|
|
|
|
|
|
|
|
|
|
|
|
2097496..2097915 |
CDS |
|
722 |
722 |
|
|
140 |
|
|
2098638..2100154 |
16s |
|
502 |
|
|
|
|
|
|
2100657..2103569 |
23s |
|
205 |
|
|
|
|
|
|
2103775..2103891 |
5s |
|
315 |
315 |
|
|
|
315
|
|
2104207..2104905 |
CDS |
|
234313 |
|
|
|
233 |
|
|
|
|
|
|
|
|
|
|
|
|
2339219..2340322 |
CDS |
|
662 |
662 |
|
|
368 |
|
|
2340985..2342501 |
16s |
|
338 |
|
|
|
|
|
|
2342840..2345755 |
23s |
|
140 |
|
|
|
|
|
|
2345896..2345970 |
aac |
|
3 |
|
|
|
|
|
|
2345974..2346090 |
5s |
|
429 |
429 |
|
|
|
429
|
|
2346520..2348088 |
CDS |
|
3574 |
|
|
|
523 |
|
|
|
|
|
|
|
|
|
|
|
|
2351663..2352139 |
CDS |
|
568 |
568 |
|
|
159 |
|
|
2352708..2354224 |
16s |
|
338 |
|
|
|
|
|
|
2354563..2357477 |
23s |
|
140 |
|
|
|
|
|
|
2357618..2357692 |
aac |
|
3 |
|
|
|
|
|
|
2357696..2357812 |
5s |
|
90 |
90 |
|
|
|
90
|
|
2357903..2358316 |
CDS |
|
406783 |
|
|
|
138 |
|
|
|
|
|
|
|
|
|
|
|
|
2765100..2765525 |
CDS |
|
625 |
625 |
|
|
142 |
|
|
2766151..2767667 |
16s |
|
503 |
|
|
|
|
|
|
2768171..2771082 |
23s |
|
202 |
|
|
|
|
|
|
2771285..2771401 |
5s |
|
5 |
|
|
|
|
|
|
2771407..2771482 |
ttc |
|
6 |
|
|
6 |
|
|
|
2771489..2771565 |
gac |
|
25 |
|
|
25 |
|
|
|
2771591..2771665 |
gaa |
|
448 |
448 |
|
|
|
448
|
|
2772114..2774864 |
CDS |
|
781818 |
|
|
|
917 |
|
|
|
|
|
|
|
|
|
|
|
|
3556683..3557051 |
CDS |
|
565 |
565 |
|
|
123 |
565
|
|
3557617..3557691 |
gag |
|
925 |
925 |
|
|
|
|
comp |
3558617..3559759 |
CDS |
|
192275 |
|
|
|
381 |
|
|
|
|
|
|
|
|
|
|
|
comp |
3752035..3752652 |
CDS |
|
245 |
245 |
|
|
206 |
245
|
comp |
3752898..3752985 |
agt |
@1 |
711 |
711 |
|
|
|
|
comp |
3753697..3755112 |
CDS |
|
501326 |
|
|
|
472 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4256439..4258403 |
CDS |
|
267 |
267 |
|
|
655 |
267
|
comp |
4258671..4258746 |
aaa |
|
79 |
|
79 |
|
|
|
comp |
4258826..4258901 |
cac |
|
7 |
|
7 |
|
|
|
comp |
4258909..4258985 |
aga |
|
35 |
|
35 |
|
|
|
comp |
4259021..4259094 |
gga |
|
752 |
752 |
|
|
|
|
|
4259847..4260392 |
CDS |
|
619853 |
|
|
|
182 |
|
|
|
|
|
|
|
|
|
|
|
comp |
4880246..4880488 |
CDS |
|
508 |
508 |
|
|
81 |
508
|
comp |
4880997..4881113 |
5s |
|
274 |
|
|
|
|
|
comp |
4881388..4884300 |
23s |
|
578 |
|
|
|
|
|
comp |
4884879..4886395 |
16s |
|
703 |
703 |
|
|
|
|
comp |
4887099..4888034 |
CDS |
|
1272704 |
|
|
|
312 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6160739..6161977 |
CDS |
|
343 |
343 |
|
|
413 |
|
|
6162321..6162396 |
cca |
|
242 |
242 |
|
|
|
242
|
|
6162639..6163283 |
CDS |
|
2040 |
|
|
|
215 |
|
|
|
|
|
|
|
|
|
|
|
|
6165324..6165734 |
CDS |
|
222 |
222 |
|
|
137 |
|
comp |
6165957..6166032 |
ttc |
|
5 |
|
|
|
|
|
comp |
6166038..6166154 |
5s |
@2 |
188 |
188 |
|
|
|
188
|
|
6166343..6167074 |
CDS |
|
8085 |
|
|
|
244 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6175160..6175597 |
CDS |
|
249 |
249 |
|
|
146 |
249
|
comp |
6175847..6175922 |
gca |
|
1 |
|
|
1 |
|
|
comp |
6175924..6176000 |
atgi |
|
44 |
|
|
|
|
|
comp |
6176045..6176161 |
5s |
|
138 |
|
|
|
|
|
comp |
6176300..6179216 |
23s |
|
339 |
|
|
|
|
|
comp |
6179556..6181072 |
16s |
|
567 |
567 |
|
|
|
|
comp |
6181640..6182446 |
CDS |
|
223 |
|
|
|
269 |
|
|
|
|
|
|
|
|
|
|
|
|
6182670..6183419 |
CDS |
|
190 |
190 |
|
|
250 |
190
|
comp |
6183610..6183685 |
aaa |
+ |
5 |
|
|
|
|
|
comp |
6183691..6183807 |
5s |
2 aaa |
159 |
159 |
|
|
|
159
|
comp |
6183967..6184914 |
CDS |
@3 |
294 |
294 |
|
|
316 |
294
|
comp |
6185209..6185284 |
aaa |
|
7 |
|
|
|
|
|
comp |
6185292..6185408 |
5s |
|
138 |
|
|
|
|
|
comp |
6185547..6188463 |
23s |
|
339 |
|
|
|
|
|
comp |
6188803..6190319 |
16s |
|
771 |
771 |
|
|
|
|
comp |
6191091..6192203 |
CDS |
|
7306 |
|
|
|
371 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6199510..6202059 |
CDS |
|
661 |
661 |
|
|
850 |
|
comp |
6202721..6202837 |
5s |
@4 |
139 |
|
|
|
|
|
comp |
6202977..6205893 |
23s |
|
339 |
|
|
|
|
|
comp |
6206233..6207749 |
16s |
|
1102 |
|
|
|
|
|
comp |
6208852..6208968 |
5s |
|
138 |
|
|
|
|
|
comp |
6209107..6212023 |
23s |
|
339 |
|
|
|
|
|
comp |
6212363..6213879 |
16s |
|
502 |
502 |
|
|
|
502
|
comp |
6214382..6215329 |
CDS |
|
90019 |
|
|
|
316 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6305349..6306314 |
CDS |
|
123 |
123 |
|
|
322 |
123
|
comp |
6306438..6306527 |
tcc |
|
281 |
281 |
|
|
|
|
comp |
6306809..6307984 |
CDS |
|
66527 |
|
|
|
392 |
|
|
|
|
|
|
|
|
|
|
|
|
6374512..6375684 |
CDS |
|
125 |
125 |
|
|
391 |
125
|
comp |
6375810..6375884 |
agg |
|
303 |
303 |
|
|
|
|
comp |
6376188..6378578 |
CDS |
|
13398 |
|
|
|
797 |
|
|
|
|
|
|
|
|
|
|
|
comp |
6391977..6392753 |
CDS |
|
114 |
114 |
|
|
259 |
114
|
comp |
6392868..6392984 |
5s |
|
134 |
|
|
|
|
|
comp |
6393119..6396033 |
23s |
|
214 |
|
|
|
|
|
comp |
6396248..6397764 |
16s |
|
1120 |
|
|
|
|
|
comp |
6398885..6399001 |
5s |
|
139 |
|
|
|
|
|
comp |
6399141..6402055 |
23s |
|
214 |
|
|
|
|
|
comp |
6402270..6403786 |
16s |
|
748 |
748 |
|
|
|
|
comp |
6404535..6405107 |
CDS |
|
31702 |
|
|
|
191 |
|
|
|
|
|
|
|
|
|
|
|
|
6436810..6437790 |
CDS |
|
192 |
192 |
|
|
327 |
|
comp |
6437983..6438059 |
gac |
+ |
6 |
|
6 |
|
|
|
comp |
6438066..6438141 |
gta |
3* |
14 |
|
14 |
|
|
|
comp |
6438156..6438230 |
gaa |
gac gta |
29 |
|
29 |
|
|
|
comp |
6438260..6438334 |
aca |
gaa aca – 1 |
10 |
|
10 |
|
|
|
comp |
6438345..6438421 |
gac |
|
6 |
|
6 |
|
|
|
comp |
6438428..6438503 |
gta |
|
16 |
|
16 |
|
|
|
comp |
6438520..6438594 |
gaa |
|
29 |
|
29 |
|
|
|
comp |
6438624..6438698 |
aca |
|
10 |
|
10 |
|
|
|
comp |
6438709..6438785 |
gac |
|
6 |
|
6 |
|
|
|
comp |
6438792..6438867 |
gta |
|
14 |
|
14 |
|
|
|
comp |
6438882..6438956 |
gaa |
|
162 |
162 |
|
|
|
162
|
comp |
6439119..6439685 |
CDS |
|
37865 |
|
|
|
189 |
|
- Lien tableur: cbei cumuls
- Légende:
- - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
- - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
- - cdsa, longueur du cds en aas ici.
- - 1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
- Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opérons |
Fréquences intercalaires tRNAs |
Fréquences intercalaires cds |
Fréquences aas cds
|
|
|
effectif |
gammes |
sans rRNAs |
avec rRNAs |
gammes |
cds |
gammes |
cdsd |
gammes |
cdsa
|
avec rRNA |
opérons |
17 |
1 |
0 |
2 |
1 |
0 |
1 |
0 |
100 |
4
|
|
16 23 5s 0 |
7 |
20 |
34 |
3 |
50 |
2 |
50 |
2 |
200 |
19
|
|
16 atc gca |
1 |
40 |
12 |
1 |
100 |
7 |
100 |
6 |
300 |
11
|
|
16 23 5s a |
4 |
60 |
2 |
0 |
150 |
7 |
150 |
5 |
400 |
20
|
|
max a |
4 |
80 |
2 |
0 |
200 |
9 |
200 |
7 |
500 |
6
|
|
a doubles |
1 |
100 |
0 |
0 |
250 |
5 |
250 |
3 |
600 |
3
|
|
autres |
6 |
120 |
0 |
0 |
300 |
6 |
300 |
5 |
700 |
2
|
|
total aas |
19 |
140 |
0 |
0 |
350 |
6 |
350 |
2 |
800 |
1
|
sans |
opérons |
20 |
160 |
1 |
0 |
400 |
4 |
400 |
1 |
900 |
4
|
|
1 aa |
11 |
180 |
0 |
0 |
450 |
3 |
450 |
2 |
1000 |
1
|
|
max a |
19 |
200 |
0 |
0 |
500 |
2 |
500 |
0 |
1100 |
0
|
|
a doubles |
5 |
|
3 |
0 |
|
21 |
|
4 |
|
0
|
|
total aas |
74 |
|
54 |
6 |
|
72 |
|
37 |
|
71
|
total aas |
|
93 |
|
|
|
|
|
|
|
|
|
remarques |
|
6 |
|
|
|
|
|
|
|
|
|
avec jaune |
|
|
moyenne |
|
|
|
|
|
|
|
|
|
|
|
variance |
|
|
|
|
|
|
|
|
sans jaune |
|
|
moyenne |
18 |
7 |
|
350 |
|
195 |
|
328
|
|
|
|
variance |
17 |
9 |
|
225 |
|
111 |
|
206
|
C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s |
213 |
503 |
339 |
|
23s |
108 |
202 |
138 |
|
5s |
14 |
5 |
44 |
|
atgi |
atgi |
ttc |
atgi |
|
|
|
|
|
|
16s |
339 |
502 |
578 |
|
23s |
273 |
205 |
274 |
|
5s |
|
|
|
|
|
|
|
|
|
aaa |
5 |
|
|
|
5s |
159 |
5s |
139 |
134
|
cds |
294 |
23s |
339 |
214
|
aaa |
7 |
16s |
1102 |
1120
|
5s |
138 |
5s |
138 |
139
|
23s |
339 |
23s |
339 |
214
|
16s |
|
16s |
|
|
|
|
|
|
|
16s |
338 |
338 |
16s |
140
|
23s |
140 |
140 |
gca |
3
|
aac |
3 |
3 |
atc |
111
|
5s |
aac |
aac |
23s |
70
|
|
|
|
5s |
5
|
|
|
|
ttc |
|
|
|
|
|
|
16s |
137 |
|
16s |
132
|
gca |
118 |
|
atc |
84
|
23s |
204 |
|
23s |
71
|
5s |
|
|
aac |
|
|
|
|
|
|
ttc |
5 |
|
|
|
5s |
|
|
|
|
- Remarques des 6 @ de cbei opérons
- @ Un tRNA très rare même chez les eucaryotes, agt.
- @ Un 5s isolé avec un tRNA.
- @ Les cds candidats à la création
- - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
- - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
- le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
- le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
- le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
- @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
- @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
- @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
- Séquence des doubles
- - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
- - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
- - Les longueurs des séquences dupliquées sont: 2*2 4*3 1*4 1*5
- Notes
- - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
- 11 clusters complets sans tRNAs internes
- 2 clusters peu courants avec un tRNA entre 23s et 5s,
- 3 clusters avec tRNAs internes gcaatc gca atc voir la fiche des firmicutes.
- - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
- - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
- - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
- d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
- et des longueurs de séquences dupliquées variables: 2*2 4*3 1*4 1*5.
- Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.
- Lien tableur: cbei distribution
- Notes:
- - Tous les +5s sont des 1-3aas
- - aaa es composé de 2 +5s et 4 >1aa
- - gca de 2 +16s, 2 +5s
- - aac de 3 -5s et de 3 >1aa
Cl8 cbei, Clostridium beijerinckii strain NCIMB 14988. clostridia.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
2 |
a tct |
|
tat |
|
atgf |
4
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
3 |
b tcc |
1 |
tac |
3 |
tgc |
1
|
f atc |
2 |
j acc |
1 |
aac |
6 |
agc |
2
|
g ctc |
1 |
f ccc |
|
cac |
3 |
cgt |
1
|
h gtc |
|
n gcc |
|
gac |
4 |
ggc |
2
|
i tta |
4 |
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
4 |
aaa |
6 |
aga |
3
|
k cta |
3 |
g cca |
3 |
caa |
2 |
cga |
1
|
l gta |
5 |
o gca |
4 |
gaa |
4 |
gga |
5
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
2 |
l acg |
|
aag |
1 |
agg |
1
|
o ctg |
|
h ccg |
|
cag |
1 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
1
|
clos |
>1aa |
=1aa |
-5s |
+5s |
-16s |
+16s |
total
|
cbei |
63 |
11 |
3 |
12* |
|
4 |
93
|
- cbei Le prélèvement: Acbei
- Le nom et le lien NCBI: cbei, Clostridium beijerinckii strain NCIMB 14988, NCBI [26], date 31.07.20.
- cbei La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
cbei 1,199,672 6,485,394 18.5
Intergen51. cbei. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. cbei les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbei les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
3,991 |
390 |
19 |
4,400 |
3.6 |
104 |
22 |
126
|
x |
1,212 |
10 |
0 |
1,222 |
|
0 |
4 |
4
|
t |
5,203 |
400 |
19 |
5,622 |
|
104 |
26 |
130
|
% |
92.5 |
7.1 |
0.3 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
35 |
0 |
0 |
35 |
2.7 |
tRNA-CDS |
48 |
25
|
x |
13 |
0 |
0 |
13 |
|
RNA-RNA |
104 |
54
|
t |
48 |
0 |
0 |
48 |
|
CDS-rRNA |
26 |
14
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
14 |
7
|
- |
|
|
|
|
|
total |
192 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
14.9 |
14.3 |
1.0 |
20.6 |
2.9 |
39 |
0.4 |
0.0
|
x |
21.6 |
30.8 |
10.0 |
2.1 |
0.0 |
30 |
0.0 |
0.0
|
|
Intergen51. cbei. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: cbei données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbei fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbei fx1
- - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbei fc1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 cbei
R2 x3 x2 x c Inflexion poly3 x c
0.723 2.51E-06 -2.02E-03 4.47E-01 -2.49 fx1 abscisse 262.1 392,5
0.780 -3.89E-06 2.87E-03 -6.97E-01 70.6 fc1 ordonnée 21.0 7,3
0.642 3.04E-06 -2.39E-03 5.24E-01 -6.94 fx41
0.937 -1,17E-07 1,37E-04 -1,04E-01 34.2 fc31
- Le rfin après 400 est de 596 sur un total de 4010 . Jusqu'à 1% les freq10 sont en continu jusqu'à 990 , reste 41 . L'indice i.rfin1 = 555/590=0,941.
- Le reste après 990 est de 41 sur un total de 4010 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1240 , reste 9 . L'indice i.rf2 = 32/250=0,128.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données cbei calculs poly3 cbei
effect 4010 R2.21 818 abscis 300
xm 37 pte 6,92 flexa 247
ym 11 cste 3,00 flexo 1,52
x1m 289 r400l 111 xm 35
y1m 1 restp 252,12 sup4 157,6
rfin 148,63 %sd 17,85 sup4t 462,6
bornf 207 lond 252 % 34,1
supd 92,4 %sf 15,53 long 212
supdt 517,7 lonf 170 R2 357
xmp 230,17 sf/lf 0,36
r400 103,49 sr/lr 0,38
supf 61,5 sd/ld 0,37
supft 396,0 i.r400 0,93
Intergen51. cbei. Les CDS-CDS négatifs
modifier
Sous-totaux cbei totale
fréquence x- c- x- c-
- 1 0 71 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 2 83 717 10938
- 5 1 0 5 19
sp6 7 236 1642 8424
total 10 390 2,456 23,544
reste 1 4 264 420
s6 1 0 361 41
s7 2 32 321 1438
s8 3 200 696 6525
rappot s1-5
4/2/1 - 1.2 8.4 2.6
% / sp6
s6/sp6 14.3 0.0 22.0 0.5
s7/sp6 28.6 13.6 19.5 17.1
s8/sp6 42.9 84.7 42.4 77.5
reste/sp6 14.3 1.7 16.1 5.0
total s1-5 3 154 814 15120
% / total
%s1-5 30.0 39.5 33.1 64.2
%sp6 70.0 60.5 66.9 35.8
Intergen51. cbei. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 13 CDS 16s 13 1
16s 23s 13 5s CDS 7 3
16s tRNA 3 16 CDS
tRNA 23s 3 CDS 5s
5s tRNA 7 23s CDS
tRNA in 1 CDS 23s
tRNA contig 5 5s 16s 2
tRNA hors 54 16s16s
tRNA 16s
23s tRNA 3
tRNA 5s 2
16s 5s
5s 23s
5s 5s
total 104 0 total 22 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Int51.31 cbei. Les intercalaires tRNA-tRNA extra blocs
|
hors1 |
|
|
hors2 |
|
|
hors3 |
|
|
hors3
|
inter |
aa |
|
inter |
aa |
|
inter |
aa |
|
inter |
aa
|
30 |
tca |
|
17 |
cca |
|
9 |
tac |
|
6 |
gac
|
241 |
agc |
|
149 |
gga |
|
27 |
gta |
|
14 |
gta
|
18 |
tca |
|
6 |
aga |
|
12 |
aca |
|
29 |
gaa
|
** |
agc |
|
16 |
cca |
|
9 |
tac |
|
10 |
aca
|
20 |
tta |
|
35 |
gga |
|
30 |
gta |
|
6 |
gac
|
7 |
atgf |
|
5 |
aga |
|
12 |
aca |
|
16 |
gta
|
6 |
atgj |
|
3 |
cac |
|
** |
tac |
|
29 |
gaa
|
22 |
tta |
|
7 |
caa |
|
3 |
cac |
|
10 |
aca
|
7 |
atgf |
|
18 |
aaa |
|
5 |
cag |
|
6 |
gac
|
6 |
atgj |
|
5 |
cta |
|
** |
aaa |
|
14 |
gta
|
21 |
tta |
|
25 |
ggc |
|
79 |
aaa |
|
** |
gaa
|
70 |
atgf |
|
5 |
gga |
|
7 |
cac |
|
|
cont
|
21 |
tta |
|
57 |
aag |
|
35 |
aga |
|
1 |
atgi
|
** |
atgf |
|
7 |
caa |
|
** |
gga |
|
** |
gca
|
234 |
aac |
|
18 |
aaa |
|
|
|
|
4 |
ttc
|
439 |
aac |
|
5 |
cta |
|
|
|
|
** |
tgc
|
** |
aac |
|
25 |
ggc |
|
|
|
|
6 |
ttc
|
4 |
cta |
|
46 |
gga |
|
|
|
|
25 |
gac
|
** |
ggg |
|
** |
cga |
|
|
|
|
** |
gaa
|
|
|
|
|
|
|
|
|
|
1 |
gca
|
|
|
|
|
|
|
|
|
|
** |
atgi
|
- |
|
|
|
|
|
|
|
|
|
|
- Lien NCBI [27]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
cbei. Sx+ Sc+ Les diagrammes 400
cbei |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
32 |
-258 |
569 |
-3.0 |
712 |
269 |
max160 |
-46 |
338 |
-822 |
83 |
779 |
245 |
min50
|
31 à 400 |
12.7 |
-134 |
357 |
3.5 |
790 |
352 |
* |
-1.4 |
16 |
-123 |
40 |
937 |
391 |
1 partie
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
5 |
26 |
- |
4 |
poly |
708 |
tF |
123 |
50 |
- |
566 |
poly |
213 |
SF
|
31 à 400 |
36 |
30 |
- |
345 |
poly |
445 |
tF * |
75 |
37 |
- |
929 |
dte |
8 |
Sf
|
- Légende du tableau des corrélations et des faibles fréquences
cbei. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
mba |
min10 |
705 |
1651 |
2356 |
154 |
-330 |
-221 |
109 |
-512 |
-477 |
-223
|
cbei |
min10 |
950 |
3395 |
4345 |
402 |
-509 |
-375 |
134 |
-649 |
-648 |
-290
|
pmq |
min10 |
1613 |
4170 |
5783 |
455 |
-834 |
-652 |
182 |
-867 |
-826 |
-61
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
45 |
214 |
0.21 |
1255 |
2688 |
1 |
8 |
18 |
114 |
51 |
428 |
-74
|
26 |
244 |
0.11 |
1212 |
4400 |
0 |
4 |
8 |
89 |
35 |
954 |
272
|
32 |
217 |
0.15 |
1926 |
5302 |
3 |
5 |
22 |
142 |
68 |
1155 |
-203
|
- Diagrammes 400: cbei cbei 600 afn, diagramme 1-40: c+ cbei c+ afn total, texte: afn.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - cbei / afn: Malgré la différence de forme, sur x+ 1-400, entre afn, tilde avec pyramides, et cbei, tilde régulier, les génomes ont en commun le tilde fort, 183 contre 708, le minimum10 et une corrélation très faible et négative sur 41-250. Certes cbei et pmq sont très semblables mais la comparaison avec un génome d’un autre groupe à corrélation faible permet de faire le lien entre groupes. J’aurais pu comparer cbei à blo puisqu’ils ont la régularité du tilde mais ses taux aux fréquences 10 20 sont très élevés par rapport au trio cbei mba pmq, 19‰ pour cbei contre 56‰, soit 3 fois plus et les corrélations sont très différentes 537 contre -377.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 46‰ pour afn à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 183 (R2 486 303). Les R2 montrent bien la régularité de cbei par rapport à afn, 712 contre 486.
- + Les points d’inflexion sont normaux et presque égaux 269 pour cbei contre 261.
- c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 213 pour cbei contre 297 et des 2 points d’inflexion normaux, 245 pour cbei et 250 pour afn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26 pour cbei contre 46.
- c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont différentes, il n’y a pas corrélation entre x+ et c+ pour afn, mais cbei a une corrélation négative, c’est à dire x+ et c+ s’opposent entre elles. Mais leur comportement sont les mêmes quand on passe d’une palge de fréquences à l’autre, les 2 génomes chutent pareil en passant à 41-200, différence (diff) de 133 pour cbei cntre 125. De même en passant à 1-250, cbei devient -646 contre -407, c’est à dire que les 2 génomes sont complètement décorrélés.
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et afn ils sont très faibles et égaux à 0.11. Les zéros sont à 4‰ pour cbei et 11‰ pour afn, alors que le taux des négatifs fait le double de cbei chez afn, 191‰ contre 97‰.
- - Les courbes 1-40:
- c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
- x+ 1-40: Avec un effectif de 35 pour chacun, la courbe ne peut être significative.
- - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
- cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
- mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.
- Lien tableur: cbei autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- - misc_f, pour misc_feature
- - misc_R, pour misc_RNA
- - gene, c'est un pseudo sans cds
- Totaux: il y a une erreur dans les couleurs et il y a un pseudo gene
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ x- c+ x+ c- c+ x+ c-
57 15 106 10 3 1 192
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
Acidaminococcus fermentans DSM 20731
modifier
- Lien tableur: afn opérons
- Liens: gtRNAdb [28], NCBI [29], génome []
- Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC |
30.6.19 Paris |
60 |
doubles |
intercalaire
|
|
24678..26242 |
16s |
@1 |
359
|
|
26602..29507 |
23s |
|
228
|
|
29736..29852 |
5s |
|
|
|
|
|
|
|
|
36819..36894 |
acg |
|
|
|
|
|
|
|
|
57713..59277 |
16s |
|
359
|
|
59637..62543 |
23s |
|
228
|
|
62772..62888 |
5s |
|
|
|
|
|
|
|
|
169459..169534 |
gcc |
|
|
|
|
|
|
|
|
249791..249867 |
agg |
|
|
|
|
|
|
|
comp |
274627..274703 |
cgt |
|
|
|
|
|
|
|
|
311123..311198 |
aca |
|
22
|
|
311221..311305 |
tac |
|
5
|
|
311311..311386 |
atg |
|
3
|
|
311390..311465 |
acc |
|
6
|
|
311472..311548 |
atgf |
|
|
|
|
|
|
|
|
380482..382046 |
16s |
|
251
|
|
382298..385204 |
23s |
|
229
|
|
385434..385550 |
5s |
|
|
|
|
|
|
|
|
461553..461627 |
aac |
|
3
|
|
461631..461705 |
gaa |
|
8
|
|
461714..461789 |
gta |
|
50
|
|
461840..461916 |
cca |
|
11
|
|
461928..462001 |
gga |
|
8
|
|
462010..462086 |
aga |
|
|
|
|
|
|
|
|
526984..527070 |
ctg |
+ |
30
|
|
527101..527186 |
ctc |
2 ctg |
52
|
|
527239..527325 |
ctg |
|
|
|
|
|
|
|
|
578049..578123 |
ggc |
|
|
|
|
|
|
|
|
636984..638548 |
16s |
@2 |
94
|
|
638643..638719 |
atc |
|
66
|
|
638786..638861 |
gca |
|
273
|
|
639135..642040 |
23s |
|
139
|
|
642180..642296 |
5s |
|
|
|
|
|
|
|
|
712229..712304 |
cac |
|
18
|
|
712323..712398 |
caa |
|
3
|
|
712402..712477 |
aaa |
|
16
|
|
712494..712577 |
cta |
|
|
|
|
|
|
|
comp |
724421..724497 |
gtc |
|
|
|
|
|
|
|
|
774880..774956 |
gac |
|
4
|
|
774961..775036 |
ttc |
|
8
|
|
775045..775119 |
ggc |
|
9
|
|
775129..775202 |
tgc |
|
13
|
|
775216..775304 |
tta |
|
|
|
|
|
|
|
|
796654..796728 |
cgg |
|
|
|
|
|
|
|
|
842393..842469 |
gac |
|
2
|
|
842472..842547 |
ttc |
|
8
|
|
842556..842630 |
ggc |
|
9
|
|
842640..842713 |
tgc |
|
|
|
|
|
|
|
|
889670..889746 |
ccc |
|
|
|
|
|
|
|
|
906136..906210 |
aac |
|
|
|
|
|
|
|
|
1022783..1022859 |
gac |
|
2
|
|
1022862..1022936 |
ggc |
|
1
|
|
1022938..1023011 |
tgg |
|
|
|
|
|
|
|
|
1555201..1555277 |
ccg |
|
|
|
|
|
|
|
comp |
1567911..1567999 |
tca |
|
|
|
|
|
|
|
comp |
1613773..1613863 |
agc |
|
|
|
|
|
|
|
|
1702659..1702744 |
ttg |
|
|
|
|
|
|
|
comp |
1711770..1711886 |
5s |
|
228
|
comp |
1712115..1715021 |
23s |
|
359
|
comp |
1715381..1716945 |
16s |
|
|
|
|
|
|
|
comp |
1823852..1823927 |
gta |
|
6
|
comp |
1823934..1824008 |
gaa |
|
8
|
comp |
1824017..1824092 |
aag |
|
|
|
|
|
|
|
|
1909446..1909536 |
tcc |
|
|
|
|
|
|
|
comp |
1911342..1911429 |
tcg |
|
|
|
|
|
|
|
comp |
1974984..1975058 |
atgi |
|
|
|
|
|
|
|
comp |
1984782..1984856 |
gag |
|
12
|
comp |
1984869..1984942 |
cag |
+ |
111
|
comp |
1985054..1985127 |
cag |
2 cag |
|
|
|
|
|
|
comp |
2072279..2072395 |
5s |
|
228
|
comp |
2072624..2075529 |
23s |
|
298
|
comp |
2075828..2075903 |
gca |
|
66
|
comp |
2075970..2076046 |
atc |
|
94
|
comp |
2076141..2077705 |
16s |
|
|
|
|
|
|
|
|
2148343..2148418 |
gcg |
|
|
|
|
|
|
|
comp |
2287117..2287192 |
aaa |
|
|
|
|
|
|
|
comp |
2303018..2303094 |
gtg |
|
|
|
|
|
|
|
comp |
2323563..2323636 |
ggg |
|
|
- Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.afn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
afn cumuls opérons effectif
avec rRNA opérons 6
16 23 5s 0 4
16 atc gca 2
16 23 5s a 0
max a 2
a doubles 0
spéciaux 0
total aas 4
sans opérons 29
1 aa 20
max a 6
a doubles 2
total aas 56
total aas 60
remarques 2
N1. afn blocs
16s |
359 |
1565 |
359 |
1565 |
251 |
1565
|
23s |
228 |
2906 |
228 |
2907 |
229 |
2907
|
5s |
|
117 |
|
117 |
|
117
|
|
|
|
|
|
|
|
16s |
94 |
1565 |
|
5s |
228 |
117
|
atc |
66 |
|
|
23s |
298 |
2906
|
gca |
273 |
|
|
gca |
66 |
|
23s |
139 |
2906 |
|
atc |
94 |
|
5s |
|
117 |
|
16s |
|
1565
|
|
|
|
|
|
|
|
5s |
228 |
117 |
|
|
|
|
23s |
359 |
2907 |
|
|
|
|
16s |
|
1565 |
|
|
|
|
- Lien tableur: afn remarques
- Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
- @ 4 blocs 16-23-5s sans aas .
- - 3 opérons ont leurs intercalaires identiques, 359 228.
- - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
- @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
- - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
- Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
- - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.
- Lien tableur: afn distribution
- Notes:
- - cag2 est un double, en gras
- - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
Cl9 afn, Acidaminococcus fermentans DSM 20731. Negativicutes.
Cl91 distribution du total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
2 |
tac |
1 |
tgc |
2
|
f atc |
2 |
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
2 |
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
clos |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
afn |
36 |
20 |
|
|
|
4 |
60
|
|
Cl92 afn, distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
1 |
tac |
|
tgc |
|
f atc |
|
j acc |
|
aac |
1 |
agc |
1
|
g ctc |
|
f ccc |
1 |
cac |
|
cgc |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
|
ggc |
1
|
i tta |
|
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
1 |
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
|
gaa |
|
gga |
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
1
|
o ctg |
|
h ccg |
1 |
cag |
|
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
|
ggg |
1
|
afn |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
|
20 |
|
|
|
|
20
|
|
Cl93 afn, distribution des >1aa et duplicata
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
1 |
agc |
|
g ctc |
1 |
f ccc |
|
cac |
1 |
cgc |
|
h gtc |
|
n gcc |
|
gac |
3 |
ggc |
3
|
i tta |
1 |
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
1 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
1
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
|
aag |
1 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
2 |
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
ade |
>1aa |
dupli |
-5s |
+5s |
-16s |
+16s |
total
|
type |
34 |
2 |
|
|
|
|
36
|
|
- afn Le prélèvement: Artb
- Le nom et le lien NCBI: afn, Acidaminococcus fermentans DSM 20731, NCBI [30], date 30.08.20.
- afn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en %
afn 242,270 2,329,769 10.4
Intergen51. afn. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. afn les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étafn ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étafn le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étafn le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 afn les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
1,376 |
303 |
9 |
1,688 |
4.8 |
43 |
8 |
51
|
x |
344 |
4 |
2 |
350 |
|
0 |
4 |
4
|
t |
1,720 |
307 |
11 |
2,038 |
|
43 |
12 |
55
|
% |
84.4 |
15.1 |
0.5 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
45 |
0 |
0 |
45 |
3.8 |
tRNA-CDS |
57 |
37
|
x |
12 |
0 |
0 |
12 |
|
RNA-RNA |
43 |
28
|
t |
57 |
0 |
0 |
57 |
|
CDS-rRNA |
12 |
8
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
42 |
27
|
- |
|
|
|
|
|
total |
154 |
100
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
c |
45 |
0 |
0 |
45 |
3.8 |
tRNA-CDS |
57 |
37
|
x |
12 |
0 |
0 |
12 |
|
RNA-RNA |
43 |
28
|
t |
57 |
0 |
0 |
57 |
|
CDS-rRNA |
12 |
8
|
% |
100.0 |
0.0 |
0.0 |
|
|
non RNA |
42 |
27
|
- |
|
|
|
|
|
total |
154 |
100
|
|
Intergen51. afn. Les diagrammes CDS-CDS positifs
modifier
- Lien tableur: afn données intercalaires
- Diagrammes:
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées afn fc40
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. afn fx1
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 afn
R2 x3 x2 x c Inflexion poly3 x c
0.471 2.75E-06 -2.14E-03 3.98E-01 14.50 fx1 abscisse 276.0 164.2
0.722 -9.09E-06 6.80E-03 -1.62E+00 131.0 fc1 ordonnée 1.0 19.8
0.537 1.92E-06 -1.59E-03 2.95E-01 19.0 fx41
0.893 1.06E-06 -5.22E-04 -3.39E-02 34.7 fc41
- Le rfin après 400 est de 54 sur un total de 1385 . Jusqu'à 1% les freq10 sont en continu jusqu'à 670 , reste 14 . L'indice i.rfin1 = 40/270=0,148.
- Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données afn calculs poly3 afn
effect 1385 R2.21 799 abscis 400
xm 40 pte 13,20 flexa 151
ym 4 cste 3,42 flexo 2,08
x1m 183 r400l 217 xm 44
y1m 1 restp 210,83 sup4 102,4
rfin 38,99 %sd 34,18 sup4t 299,6
bornf 140 lond 143 % 34,2
supd 125,1 %sf 31,96 long 107
supdt 366,1 lonf 100 R2 437
xmp 423,10 sf/lf 0,92
r400 171,84 sr/lr 0,77
supf 92,1 sd/ld 0,87
supft 288,1 i.r400 0,79
Intergen51. afn. Les CDS-CDS négatifs
modifier
Sous-totaux afn totale
fréquence x- c- x- c-
- 1 0 38 4 4140
- 2 0 0 85 11
- 3 0 0 3 12
- 4 1 129 717 10938
- 5 0 0 5 19
sp6 3 136 1642 8424
total 4 303 2,456 23,544
reste 1 9 264 420
s6 1 2 361 41
s7 1 20 321 1438
s8 0 105 696 6525
rapport s1-5
4/2/1 - 3.4 8.4 2.6
% / sp6
s6/sp6 33.3 1.5 22.0 0.5
s7/sp6 33.3 14.7 19.5 17.1
s8/sp6 0.0 77.2 42.4 77.5
reste/sp6 33.3 6.6 16.1 5.0
total s1-5 1 167 814 15120
% / total
%s1-5 25.0 55.1 33.1 64.2
%sp6 75.0 44.9 66.9 35.8
Intergen51. afn. Les intercalaires des blocs
modifier
RNA-RNA c x CDS-RNA c x
23s 5s 6 CDS 16s 6
16s 23s 4 5s CDS 2 4
16s tRNA 2 16 CDS
tRNA 23s 2 CDS 5s
5s tRNA 23s CDS
tRNA in 2 CDS 23s
tRNA contig 5s 16s
tRNA hors 27 16s16s
tRNA 16s
23s tRNA
tRNA 5s
16s 5s
5s 23s
5s 5s
total 43 0 total 8 4
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clafn et dans l'étude.
Int51.31 afn. Les intercalaires tRNA-tRNA hors blocs
inter |
aa |
|
|
inter |
aa
|
22 |
aca |
|
|
4 |
gac
|
5 |
tac |
|
|
8 |
ttc
|
3 |
atgj |
|
|
9 |
ggc
|
6 |
acc |
|
|
13 |
tgc
|
** |
atgf |
|
|
** |
tta
|
3 |
aac |
|
|
2 |
gac
|
8 |
gaa |
|
|
8 |
ttc
|
50 |
gta |
|
|
9 |
ggc
|
11 |
cca |
|
|
** |
tgc
|
8 |
gga |
|
|
2 |
gac
|
** |
aga |
|
|
1 |
ggc
|
30 |
ctg |
|
|
** |
tgg
|
52 |
ctc |
|
|
6 |
gta
|
** |
ctg |
|
|
8 |
gaa
|
18 |
cac |
|
|
** |
aag
|
3 |
caa |
|
|
12 |
gag
|
16 |
aaa |
|
|
111 |
cag
|
** |
cta |
|
|
** |
cag
|
- Lien NCBI [31]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
afn. Sx+ Sc+ Les diagrammes 400
afn |
Sx+ |
Sc+
|
Poly3 |
-7 |
-5 |
-3 |
1 |
R2 |
flex x+ |
comment. |
-7 |
-5 |
-3 |
1 |
R2 |
flex c+ |
comment.
|
1 à 400 |
29 |
-227 |
419 |
16 |
486 |
261 |
max40,140 |
-95 |
712 |
-1690 |
137 |
722 |
250 |
min50
|
31 à 400 |
|
|
|
|
|
|
2 parties |
9.5 |
-42 |
-63 |
38 |
904 |
147 |
2 parties
|
droite |
-a |
cste |
- |
R2 |
note |
R2’ |
|
-a |
cste |
- |
R2 |
note |
R2’ |
|
1 à 400 |
75 |
40 |
- |
303 |
poly |
183 |
tF |
197 |
65 |
|
425 |
poly |
297 |
SF
|
31 à 400 |
|
|
|
|
|
|
|
92 |
36 |
- |
859 |
dte |
45 |
tm
|
- Légende du tableau corrélations et fréquences faibles
afn. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
|
|
effectifs diagramme |
corrélation x+ c+, 41-n |
corrélation x+ c+, 1-n
|
gen |
minima |
x+ |
c+ |
total |
400 |
200 |
250 |
diff |
200 |
250 |
400
|
rtb |
min30 |
118 |
402 |
520 |
536 |
-105 |
148 |
253 |
-277 |
-165 |
202
|
afn |
min10 |
328 |
1322 |
1650 |
607 |
-17 |
108 |
125 |
-467 |
-407 |
-8
|
mba |
min10 |
705 |
1651 |
2356 |
154 |
-330 |
-221 |
109 |
-512 |
-477 |
-223
|
1-30 ‰ |
effectifs |
0 ‰ |
<0 ‰ |
effectifs 1-40 |
corel
|
1-30 x+ |
1-30 c+ |
x+/c+ |
x |
c |
x |
c |
x- |
c- |
x+ |
c+ |
x+/c+
|
51 |
294 |
0.17 |
189 |
604 |
5 |
7 |
21 |
162 |
8 |
131 |
-81
|
46 |
402 |
0.11 |
350 |
1688 |
6 |
5 |
11 |
180 |
36 |
580 |
-369
|
45 |
214 |
0.21 |
1255 |
2688 |
1 |
8 |
18 |
114 |
51 |
428 |
-74
|
- Diagrammes 400: afn rtb, diagramme 1-40: c+ afn c+ rtb total, texte: rtb.
- Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
- Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
- Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
- Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
- - afn est un génome bien particulier. Dans les diagrammes x+ 1-400, il appartient au groupe à pyramide et à tilde fort, tF, donc un tilde non régulier et possède un minimum local à la fréquence 10 comme tout le groupe à pyramide qui a ce minimum entre 10 et 40. Mais il possède 2 pyramides à 40 et 140 alternant avec 2 creux profonds à 70 et 180, au lieu d’une seule pyramide pour les autres. Avec sa faible corrélation de 101 sur 41-250, il ressemble plus, dans son groupe, à rtb avec une corrélation de 148, plutôt qu’à spl ou abra avec respectivement 797 et 784.
- - Les diagrammes 400
- x+ 1-400:
- + Les 2 génomes se différencient avant tout par leurs pyramides, rtb en a une seule à 5 fréquences avec un maximum à 80 et afn en a 2 à 3 et 4 fréquences avec des maxima À 40 et 140 respectivement, alternant avec 2 creux profonds avec des minima à 70 et 180.
- + Les fréquences faibles 1-30 sont en opposition avec celles des c+1-400 pour les 2 génomes. Cette différence va impacter fortement leurs corrélations 1-n qu’on verra plus loin.
- + Les points d’inflexion sont normaux, 246 pour rtb contre 261 pour afn.
- c+ 1-400: Ce sont 2 courbes semblables de forme S, moyenne pour rtb avec un R2’ de 82 et forte pour afn avec un R2’ de 297. Les 2 points d’inflexion sont normaux, 258 pour rtb et 250 pour afn. Les fréquences faibles sont concentrées aux fréquences 10 et 20 pour les 2 génomes et les minima locaux sont à la fréquence 50 pour tout les 2. La différence des effectifs, 402 pour rtb et 1323 pour afn explique la différence de forme avec des R2 très différents, 569 pour rtb et 722 pour afn.
- x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30. Quand j’enlève ces fréquences il y a un changement dans la forme de afn qui passe de tF 183 (R2 486 et 303) à Sf 12 (R2 541 et 529) alors que rtb passe de la forme tF 191 (R2 496 et 304) à la forme tm 41 (R2 515 et 474). Ce sont de faibles changement par rapport à leurs faibles totaux en effectif, 118 pour rtb contre 328 pour afn.
- c+ 31-400: Les 2 formes sont 2 tildes très différents , tF pour rtb, avec un R2’ de 190 (788 598) et moyen pour afn, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est normal pour rtb à la fréquence 228 et plus faible pour afn à 147. Les effectifs de ces diagrammes sont de 284 pour rtb et 790 pour afn.
- - Les corrélations:
- Sur les plages 41-n: Les 2 corrélations sur 41-250 sont du même ordre de grandeur, 148 pour rtb contre 101 pour afn. Par contre rtb chute fortement sur 41-200, avec une différence de 253, alors que afn le fait moins avec une différence de 127.
- Sur les plages 1-n: les 2 génomes chutent fortement, -165 pour rtb et -407 pour afn
- - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici rtb et afn se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.17 et 0.11, les zéros font 12‰ et 11‰ et les négatifs 183‰ et 190‰.
- - Les courbes 1-40:
- c+ 1-40: La courbe afn est semblable et très proche de celle du total des c+ 1-40; celle de rtb le devient aussi en omettant les fréquences 6 et 10.
- x+ 1-40: Avec un effectif de 8 pour rtb et 51 pour afn les courbes ne peuvent pas être significatives.
tRNA-cds tRNA-tRNA autres-cds total
c+ x+ c- c+ x+ c- c+ x+ nc-tRNA
51 16 43 37 6 1 154
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
afn par rapport au groupe de référence
modifier
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
afn |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
11 |
3 |
2 |
|
|
|
16
|
16 |
moyen |
5 |
12 |
|
|
|
4 |
21
|
14 |
fort |
4 |
19 |
|
|
|
|
23
|
|
|
20 |
34 |
2 |
|
|
4 |
60
|
10 |
g+cga |
6 |
2 |
2 |
|
|
|
10
|
2 |
agg+cgg |
2 |
|
|
|
|
|
2
|
4 |
carre ccc |
3 |
1 |
|
|
|
|
4
|
5 |
autres |
|
|
|
|
|
|
|
|
|
11 |
3 |
2 |
|
|
|
16
|
|
|
total tRNAs ‰ |
|
|
|
|
|
afn |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
afn ‰ |
ref.‰
|
21 |
faible |
183 |
50 |
33 |
|
|
|
267 |
26
|
16 |
moyen |
83 |
200 |
0 |
|
|
67 |
350 |
324
|
14 |
fort |
67 |
317 |
0 |
|
|
|
383 |
650
|
|
|
333 |
567 |
33 |
|
|
67 |
60 |
729
|
10 |
g+cgg |
100 |
33 |
33 |
|
|
|
167 |
10
|
2 |
agg+cga |
33 |
|
|
|
|
|
33 |
|
4 |
carre ccc |
50 |
17 |
|
|
|
|
67 |
16
|
5 |
autres |
|
|
|
|
|
|
|
|
|
|
183 |
50 |
33 |
|
|
|
267 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
afn |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
196 |
54 |
36 |
286 |
26 |
55 |
9
|
16 |
moyen |
89 |
214 |
|
304 |
324 |
25 |
35
|
14 |
fort |
71 |
339 |
|
411 |
650 |
20 |
56
|
|
|
357 |
607 |
36 |
56 |
729 |
20 |
34
|
10 |
g+cgg |
107 |
36 |
36 |
179 |
10 |
55 |
|
2 |
agg+cga |
36 |
|
|
36 |
|
18 |
|
4 |
carre ccc |
54 |
18 |
|
71 |
16 |
27 |
|
5 |
autres |
|
|
|
|
|
|
|
|
|
196 |
54 |
36 |
286 |
|
11 |
|
- Lien tableur: negativicutes distribution
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
- Notes: attention tableau neg4, atc est négatif et n'est pas contenu dans le total de 423. Le tableau neg4 est égal à neg1-neg2-neg3. Dans neg2 le rouge est totalement +16s.
neg Negativicutes 9 génomes
neg1 total du 22.1.21 de gtRNAdb
g1 |
|
t1 |
|
|
|
|
|
a atgi |
8 |
a tct |
|
tat |
|
atgf |
15
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
17 |
b tcc |
10 |
tac |
16 |
tgc |
13
|
f atc |
17 |
j acc |
11 |
aac |
26 |
agc |
11
|
g ctc |
11 |
f ccc |
7 |
cac |
10 |
cgt |
16
|
h gtc |
8 |
n gcc |
7 |
gac |
24 |
ggc |
33
|
i tta |
11 |
c tca |
10 |
taa |
|
tga |
1
|
j ata |
|
k aca |
13 |
aaa |
20 |
aga |
9
|
k cta |
9 |
g cca |
11 |
caa |
13 |
cga |
2
|
l gta |
24 |
o gca |
21 |
gaa |
25 |
gga |
10
|
m ttg |
11 |
d tcg |
9 |
tag |
|
tgg |
13
|
n atgj |
12 |
l acg |
9 |
aag |
10 |
agg |
9
|
o ctg |
10 |
h ccg |
7 |
cag |
11 |
cgg |
9
|
p gtg |
4 |
p gcg |
5 |
gag |
5 |
ggg |
8
|
9-23aas |
inter |
|
max |
|
min |
|
total
|
|
186 |
|
263 |
|
122 |
|
571
|
|
neg2 distribution des 1-3aas
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
1 |
tgc |
|
f atc |
18 |
j acc |
|
aac |
6 |
agc |
1
|
g ctc |
|
f ccc |
|
cac |
|
cgt |
2
|
h gtc |
|
n gcc |
|
gac |
|
ggc |
|
i tta |
|
c tca |
|
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
1 |
cga |
|
l gta |
|
o gca |
21 |
gaa |
1 |
gga |
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
4
|
n atgj |
|
l acg |
1 |
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
1-3aas |
inter |
|
max |
|
min |
|
total
|
|
7 |
|
11 |
|
1 |
|
19
|
|
neg3 distribution des 9-23aas
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
2 |
tac |
3 |
tgc |
2
|
f atc |
1 |
j acc |
|
aac |
5 |
agc |
2
|
g ctc |
2 |
f ccc |
|
cac |
3 |
cgt |
4
|
h gtc |
|
n gcc |
|
gac |
7 |
ggc |
3
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
|
k cta |
1 |
g cca |
2 |
caa |
5 |
cga |
|
l gta |
7 |
o gca |
|
gaa |
5 |
gga |
4
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
1 |
l acg |
|
aag |
2 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
9-23aas |
inter |
|
max |
|
min |
|
total
|
|
24 |
|
64 |
|
4 |
|
92
|
|
neg4 distribution des -rRNA
g1 |
|
t1 |
|
|
|
|
|
a atgi |
7 |
a tct |
|
tat |
|
atgf |
12
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
11 |
b tcc |
8 |
tac |
12 |
tgc |
11
|
f atc |
-2 |
j acc |
11 |
aac |
15 |
agc |
8
|
g ctc |
9 |
f ccc |
7 |
cac |
5 |
cgt |
10
|
h gtc |
8 |
n gcc |
7 |
gac |
17 |
ggc |
30
|
i tta |
7 |
c tca |
9 |
taa |
|
tga |
1
|
j ata |
|
k aca |
8 |
aaa |
15 |
aga |
9
|
k cta |
8 |
g cca |
9 |
caa |
7 |
cga |
2
|
l gta |
17 |
o gca |
0 |
gaa |
19 |
gga |
6
|
m ttg |
9 |
d tcg |
9 |
tag |
|
tgg |
7
|
n atgj |
11 |
l acg |
8 |
aag |
8 |
agg |
9
|
o ctg |
8 |
h ccg |
7 |
cag |
11 |
cgg |
9
|
p gtg |
4 |
p gcg |
5 |
gag |
5 |
ggg |
8
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
118 |
|
188 |
|
117 |
|
423
|
|
- Discussion
- - La comparaison avec le classement des tRNAs montre que les effectifs élevés des -rRNAs correspondraient à des duplications. Il faut tenir compte aussi des doubles qui ne sont pas des duplications comme dans le génome afn avec le bloc ctg ctc ctg.
- - pour les 1-3aas aac est élevé alors que atgf est absent.
- - Les tRNAs faibles (cyan) seraient plutôt des 1aa.
- - La méthode de comparaison, ici, sans passer par les indices, c'est-à-dire une fiche de la totalité des génomes, montre qu'il y a des différences entre le décompte total et la fiche des +rRNAs. Notamment pour le +16s atc avec une valeur négative dans la différence. Pour les comparaions avec indices, pour les autres clades, il faut que ces valeurs négatives soient les plus petites possible en valeur absolue. Sinon il faut vérifier les calculs et les relevés. Voir la comparaison du clade avec le tRNA afn.
negativicutes, estimation des -rRNAs
modifier
- Lien tableur: negativicutes, estimation des -rRNAs
- Liens fiche: 1-3aas 9-23aas
- Légende: prélèvement de la base gtRNAdb le 22.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
negativicutes, calcul des -rRNAs
modifier
neg Negativicutes 9 génomes
neg1 cumul des +rRNAs de la fiche négativicutes pour 9 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
3
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
2 |
tac |
4 |
tgc |
2
|
f atc |
18 |
j acc |
|
aac |
11 |
agc |
3
|
g ctc |
2 |
f ccc |
|
cac |
5 |
cgt |
6
|
h gtc |
|
n gcc |
|
gac |
7 |
ggc |
3
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
5 |
aaa |
5 |
aga |
|
k cta |
1 |
g cca |
2 |
caa |
6 |
cga |
|
l gta |
7 |
o gca |
21 |
gaa |
6 |
gga |
4
|
m ttg |
2 |
d tcg |
|
tag |
|
tgg |
6
|
n atgj |
1 |
l acg |
1 |
aag |
2 |
agg |
|
o ctg |
2 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
nega9 |
inter |
|
max |
|
min |
|
total
|
|
69 |
|
75 |
|
5 |
|
149
|
|
neg2 indices du clade negativicutes du 22.1.21 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
89 |
a tct |
|
tat |
|
atgf |
167
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
189 |
b tcc |
111 |
tac |
178 |
tgc |
144
|
f atc |
189 |
j acc |
122 |
aac |
289 |
agc |
122
|
g ctc |
122 |
f ccc |
78 |
cac |
111 |
cgt |
178
|
h gtc |
89 |
n gcc |
78 |
gac |
267 |
ggc |
367
|
i tta |
122 |
c tca |
111 |
taa |
|
tga |
11
|
j ata |
|
k aca |
144 |
aaa |
222 |
aga |
100
|
k cta |
100 |
g cca |
122 |
caa |
144 |
cga |
22
|
l gta |
267 |
o gca |
233 |
gaa |
278 |
gga |
111
|
m ttg |
122 |
d tcg |
100 |
tag |
|
tgg |
144
|
n atgj |
133 |
l acg |
100 |
aag |
111 |
agg |
100
|
o ctg |
111 |
h ccg |
78 |
cag |
122 |
cgg |
100
|
p gtg |
44 |
p gcg |
56 |
gag |
56 |
ggg |
89
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2667 |
|
2922 |
|
1356 |
|
6344
|
|
neg3 cumul des -rRNAs de l'annexe afn pour 1 génome
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
2 |
b tcc |
1 |
tac |
1 |
tgc |
2
|
f atc |
|
j acc |
1 |
aac |
2 |
agc |
1
|
g ctc |
1 |
f ccc |
1 |
cac |
1 |
cgt |
1
|
h gtc |
1 |
n gcc |
1 |
gac |
3 |
ggc |
4
|
i tta |
1 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
1 |
aaa |
2 |
aga |
1
|
k cta |
1 |
g cca |
1 |
caa |
1 |
cga |
|
l gta |
2 |
o gca |
|
gaa |
2 |
gga |
1
|
m ttg |
1 |
d tcg |
1 |
tag |
|
tgg |
1
|
n atgj |
1 |
l acg |
1 |
aag |
1 |
agg |
1
|
o ctg |
2 |
h ccg |
1 |
cag |
2 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
1 |
ggg |
1
|
afn |
inter |
|
max |
|
min |
|
total
|
|
16 |
|
24 |
|
16 |
|
56
|
|
neg4 indices des +rRNAs de la fiche negativicutes pour 100 génomes
g1 |
|
t1 |
|
|
|
0 |
0
|
a atgi |
11 |
a tct |
|
tat |
|
atgf |
33
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
67 |
b tcc |
22 |
tac |
44 |
tgc |
22
|
f atc |
200 |
j acc |
|
aac |
122 |
agc |
33
|
g ctc |
22 |
f ccc |
|
cac |
56 |
cgt |
67
|
h gtc |
|
n gcc |
|
gac |
78 |
ggc |
33
|
i tta |
44 |
c tca |
11 |
taa |
|
tga |
|
j ata |
|
k aca |
56 |
aaa |
56 |
aga |
1
|
k cta |
11 |
g cca |
22 |
caa |
67 |
cga |
|
l gta |
78 |
o gca |
233 |
gaa |
67 |
gga |
44
|
m ttg |
22 |
d tcg |
|
tag |
|
tgg |
67
|
n atgj |
11 |
l acg |
11 |
aag |
22 |
agg |
1
|
o ctg |
22 |
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
1
|
nega9 |
inter |
|
max |
|
min |
|
total
|
|
767 |
|
833 |
|
56 |
|
1656
|
|
neg5 estimation des -rRNA du clade negativicutes pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
78 |
a tct |
|
tat |
|
atgf |
133
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
122 |
b tcc |
89 |
tac |
133 |
tgc |
122
|
f atc |
-11 |
j acc |
122 |
aac |
167 |
agc |
89
|
g ctc |
100 |
f ccc |
78 |
cac |
56 |
cgt |
111
|
h gtc |
89 |
n gcc |
78 |
gac |
189 |
ggc |
333
|
i tta |
78 |
c tca |
100 |
taa |
|
tga |
11
|
j ata |
|
k aca |
89 |
aaa |
167 |
aga |
100
|
k cta |
89 |
g cca |
100 |
caa |
78 |
cga |
22
|
l gta |
189 |
o gca |
0 |
gaa |
211 |
gga |
67
|
m ttg |
100 |
d tcg |
100 |
tag |
|
tgg |
78
|
n atgj |
122 |
l acg |
89 |
aag |
89 |
agg |
100
|
o ctg |
89 |
h ccg |
78 |
cag |
122 |
cgg |
100
|
p gtg |
44 |
p gcg |
56 |
gag |
56 |
ggg |
89
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1300 |
|
2089 |
|
1300 |
|
4689
|
|
neg6 indices des -rRNAs de l'annexe afn pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
100 |
a tct |
|
tat |
|
atgf |
100
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
200 |
b tcc |
100 |
tac |
100 |
tgc |
200
|
f atc |
|
j acc |
100 |
aac |
200 |
agc |
100
|
g ctc |
100 |
f ccc |
100 |
cac |
100 |
cgt |
100
|
h gtc |
100 |
n gcc |
100 |
gac |
300 |
ggc |
400
|
i tta |
100 |
c tca |
100 |
taa |
|
tga |
|
j ata |
|
k aca |
100 |
aaa |
200 |
aga |
100
|
k cta |
100 |
g cca |
100 |
caa |
100 |
cga |
|
l gta |
200 |
o gca |
|
gaa |
200 |
gga |
100
|
m ttg |
100 |
d tcg |
100 |
tag |
|
tgg |
100
|
n atgj |
100 |
l acg |
100 |
aag |
100 |
agg |
100
|
o ctg |
200 |
h ccg |
100 |
cag |
200 |
cgg |
100
|
p gtg |
100 |
p gcg |
100 |
gag |
100 |
ggg |
100
|
afn |
inter |
|
max |
|
min |
|
total
|
|
1600 |
|
2400 |
|
1600 |
|
5600
|
|
negativicutes, comparaison clade-annexe des -rRNAs
modifier
- Lien tableur: negativicutes, comparaison clade-annexe des -rRNAs
- Légende
- - neg7. diff, somme des couleurs de neg7. La différence entre tRNAs est faite entre neg5 et neg6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - neg8. rap, rapport des sommes couleurs neg5/neg2. Le rapport -rRNA/total est celui du tRNA de neg5 sur celui de neg2.
- Fréquences des différences en % du tableau neg7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 2 11 13 9 5 3 2 0 0 0 3 0 48
tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des negativicutes.
tRNAs fiche annexe
sans 456 56
avec 152 4
genomes 9 1
indice % 51 56
neg Negativicutes 9 génomes
neg7 negativicutes, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
22 |
a tct |
|
tat |
|
atgf |
25
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
39 |
b tcc |
11 |
tac |
25 |
tgc |
39
|
f atc |
100 |
j acc |
18 |
aac |
17 |
agc |
11
|
g ctc |
0 |
f ccc |
22 |
cac |
44 |
cgt |
10
|
h gtc |
11 |
n gcc |
22 |
gac |
37 |
ggc |
17
|
i tta |
22 |
c tca |
0 |
taa |
|
tga |
100
|
j ata |
|
k aca |
11 |
aaa |
17 |
aga |
0
|
k cta |
11 |
g cca |
0 |
caa |
22 |
cga |
100
|
l gta |
6 |
o gca |
|
gaa |
5 |
gga |
33
|
m ttg |
0 |
d tcg |
0 |
tag |
|
tgg |
22
|
n atgj |
18 |
l acg |
11 |
aag |
11 |
agg |
0
|
o ctg |
56 |
h ccg |
22 |
cag |
39 |
cgg |
0
|
p gtg |
56 |
p gcg |
44 |
gag |
44 |
ggg |
11
|
diff |
inter |
|
max |
|
min |
|
total
|
|
275 |
|
263 |
|
294 |
|
833
|
|
neg8 negativicutes, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
88 |
a tct |
|
tat |
|
atgf |
80
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
65 |
b tcc |
80 |
tac |
75 |
tgc |
85
|
f atc |
-6 |
j acc |
|
aac |
58 |
agc |
73
|
g ctc |
82 |
f ccc |
|
cac |
50 |
cgt |
62
|
h gtc |
|
n gcc |
|
gac |
71 |
ggc |
91
|
i tta |
64 |
c tca |
90 |
taa |
|
tga |
|
j ata |
|
k aca |
62 |
aaa |
75 |
aga |
|
k cta |
89 |
g cca |
82 |
caa |
54 |
cga |
|
l gta |
71 |
o gca |
0 |
gaa |
76 |
gga |
60
|
m ttg |
82 |
d tcg |
|
tag |
|
tgg |
54
|
n atgj |
92 |
l acg |
89 |
aag |
80 |
agg |
|
o ctg |
80 |
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
rap |
inter |
|
max |
|
min |
|
total
|
|
63 |
|
71 |
|
96 |
|
74
|
|
clostridia distribution par génome
modifier
clostridia distribution par génome
baci |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
duplica |
1-3aas |
total
|
psor |
12 |
5 |
4 |
72 |
|
7 |
|
4 |
104
|
cdc |
4 |
4 |
2 |
70 |
|
3 |
|
|
83
|
cdc8 |
4 |
5 |
2 |
89 |
|
4 |
|
4 |
108
|
cbc* |
34 |
10 |
|
0 |
|
0 |
2 |
6 |
54
|
cbn |
48 |
12 |
2 |
6 |
3 |
4 |
4 |
7 |
90
|
cle |
38 |
19 |
|
26 |
3 |
9 |
2 |
8 |
107
|
hmo |
37 |
12 |
|
39 |
|
11 |
|
10 |
109
|
cbei |
63 |
11 |
3 |
0 |
|
4 |
|
12 |
93
|
total |
240 |
78 |
13 |
302 |
6 |
42 |
8 |
51 |
748
|
clostridia distribution du total
modifier
- Lien tableur: clostridia distribution du total
- Légende:
- - Couleurs du 1er tableau: voir la distribution des bacilli
- - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
- - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
- - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Clostridia. Distribution du total.
clostridia. Distribution du total: >1aa 1aa +5s >3.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
10 |
a tct |
|
tat |
|
atgf |
32
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
3 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
19 |
b tcc |
7 |
tac |
23 |
tgc |
16
|
f atc |
3 |
j acc |
9 |
aac |
22 |
agc |
13
|
g ctc |
3 |
f ccc |
4 |
cac |
16 |
cgc |
11
|
h gtc |
4 |
n gcc |
1 |
gac |
32 |
ggc |
20
|
i tta |
22 |
c tca |
19 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
30 |
aaa |
31 |
aga |
24
|
k cta |
19 |
g cca |
25 |
caa |
22 |
cga |
4
|
l gta |
41 |
o gca |
|
gaa |
36 |
gga |
29
|
m ttg |
9 |
d tcg |
2 |
tag |
|
tgg |
11
|
n atgj |
23 |
l acg |
4 |
aag |
6 |
agg |
6
|
o ctg |
6 |
h ccg |
2 |
cag |
4 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
4 |
ggg |
3
|
clos8 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
248 |
78 |
|
302 |
|
|
628
|
|
clostridia. Distribution du total. -16s +5s <4
g1 |
|
t1 |
|
|
|
|
|
a atgi |
8 |
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
1 |
tac |
|
tgc |
1
|
f atc |
1 |
j acc |
1 |
aac |
7 |
agc |
1
|
g ctc |
1 |
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
|
gac |
1 |
ggc |
4
|
i tta |
4 |
c tca |
1 |
taa |
|
tga |
|
j ata |
|
k aca |
|
aaa |
6 |
aga |
1
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
5 |
gaa |
2 |
gga |
2
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
1
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
1
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos8 |
>1aa |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
|
|
|
51 |
6 |
|
57
|
|
clostridia. Distribution du total. duplica -5s +16s
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
2
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
2 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
|
b tcc |
|
tac |
|
tgc |
2
|
f atc |
11 |
j acc |
|
aac |
5 |
agc |
|
g ctc |
|
f ccc |
|
cac |
|
cgc |
|
h gtc |
|
n gcc |
5 |
gac |
|
ggc |
|
i tta |
|
c tca |
2 |
taa |
|
tga |
|
j ata |
|
k aca |
3 |
aaa |
|
aga |
|
k cta |
|
g cca |
|
caa |
|
cga |
|
l gta |
|
o gca |
26 |
gaa |
|
gga |
5
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
|
n atgj |
|
l acg |
|
aag |
|
agg |
|
o ctg |
|
h ccg |
|
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
|
ggg |
|
clos8 |
dupli |
1aa |
-5s |
+5s |
-16s |
+16s |
total
|
type |
8 |
|
13 |
|
|
42 |
55
|
|
clostridia. indices du 27.5.20 174 génomes
g1 |
|
t1 |
|
618 |
11144 |
4,0 |
0,6
|
a atgi |
159 |
a tct |
1,1 |
tat |
|
atgf |
187
|
b att |
1,1 |
i act |
|
aat |
|
agt |
0,6
|
c ctt |
15,5 |
e cct |
2,3 |
cat |
|
cgc |
|
d gtt |
0,6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
206 |
b tcc |
103 |
tac |
187 |
tgc |
151
|
f atc |
152 |
j acc |
102 |
aac |
248 |
agc |
133
|
g ctc |
81 |
f ccc |
62 |
cac |
140 |
cgt |
116
|
h gtc |
53 |
n gcc |
61 |
gac |
242 |
ggc |
220
|
i tta |
172 |
c tca |
142 |
taa |
1,1 |
tga |
55
|
j ata |
2,9 |
k aca |
218 |
aaa |
271 |
aga |
174
|
k cta |
148 |
g cca |
163 |
caa |
156 |
cga |
48
|
l gta |
286 |
o gca |
219 |
gaa |
239 |
gga |
243
|
m ttg |
108 |
d tcg |
83 |
tag |
2,3 |
tgg |
120
|
n atgj |
132 |
l acg |
77 |
aag |
120 |
agg |
96
|
o ctg |
76 |
h ccg |
64 |
cag |
77 |
cgg |
60
|
p gtg |
34 |
p gcg |
35 |
gag |
83 |
ggg |
70
|
|
inter |
|
max |
|
min |
|
total
|
|
|
|
|
|
|
|
|
|
clostridia distribution par type
modifier
Clostridia. Distribution par type.
clostridia. distribution des solitaires
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
1
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
1 |
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
1 |
b tcc |
6 |
tac |
|
tgc |
1
|
f atc |
|
j acc |
3 |
aac |
1 |
agc |
3
|
g ctc |
2 |
f ccc |
1 |
cac |
|
cgc |
1
|
h gtc |
|
n gcc |
1 |
gac |
|
ggc |
|
i tta |
|
c tca |
1 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
2 |
aaa |
|
aga |
|
k cta |
5 |
g cca |
4 |
caa |
|
cga |
1
|
l gta |
|
o gca |
|
gaa |
|
gga |
1
|
m ttg |
8 |
d tcg |
2 |
tag |
|
tgg |
5
|
n atgj |
|
l acg |
4 |
aag |
1 |
agg |
5
|
o ctg |
3 |
h ccg |
1 |
cag |
3 |
cgg |
|
p gtg |
|
p gcg |
1 |
gag |
3 |
ggg |
|
clos8 |
1aa |
78 |
|
|
|
|
|
|
clostridia. distribution du type >1aa sans duplicata.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
|
a tct |
|
tat |
|
atgf |
8
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
6 |
b tcc |
|
tac |
10 |
tgc |
3
|
f atc |
|
j acc |
3 |
aac |
5 |
agc |
5
|
g ctc |
1 |
f ccc |
1 |
cac |
8 |
cgc |
3
|
h gtc |
2 |
n gcc |
|
gac |
15 |
ggc |
11
|
i tta |
11 |
c tca |
6 |
taa |
|
tga |
|
j ata |
|
k aca |
15 |
aaa |
14 |
aga |
10
|
k cta |
6 |
g cca |
10 |
caa |
8 |
cga |
3
|
l gta |
20 |
o gca |
|
gaa |
17 |
gga |
13
|
m ttg |
1 |
d tcg |
|
tag |
|
tgg |
2
|
n atgj |
10 |
l acg |
|
aag |
5 |
agg |
1
|
o ctg |
1 |
h ccg |
|
cag |
1 |
cgg |
1
|
p gtg |
1 |
p gcg |
|
gag |
|
ggg |
3
|
clos8 |
>1aa |
240 |
|
|
|
|
|
|
clostridia. distribution du type +5s >3.
g1 |
|
t1 |
|
|
|
|
|
a atgi |
9 |
a tct |
|
tat |
|
atgf |
11
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgt |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
12 |
b tcc |
1 |
tac |
13 |
tgc |
10
|
f atc |
3 |
j acc |
3 |
aac |
16 |
agc |
5
|
g ctc |
|
f ccc |
2 |
cac |
8 |
cgc |
7
|
h gtc |
2 |
n gcc |
|
gac |
17 |
ggc |
9
|
i tta |
11 |
c tca |
10 |
taa |
|
tga |
|
j ata |
|
k aca |
13 |
aaa |
17 |
aga |
14
|
k cta |
8 |
g cca |
11 |
caa |
14 |
cga |
|
l gta |
21 |
o gca |
|
gaa |
19 |
gga |
15
|
m ttg |
|
d tcg |
|
tag |
|
tgg |
4
|
n atgj |
13 |
l acg |
|
aag |
|
agg |
|
o ctg |
2 |
h ccg |
1 |
cag |
|
cgg |
|
p gtg |
|
p gcg |
|
gag |
1 |
ggg |
|
clos8 |
+5s |
302 |
|
|
|
|
|
|
clostridia par rapport au groupe de référence
modifier
Comparaison avec la référence
tRNAs |
|
blocs tRNAs |
blocs rRNAs |
|
|
clos8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
total |
|
21 |
faible |
31 |
19 |
2 |
6 |
2 |
5 |
65 |
|
16 |
moyen |
36 |
66 |
4 |
101 |
20 |
42 |
269 |
|
14 |
fort |
11 |
155 |
2 |
195 |
29 |
14 |
406 |
|
|
|
78 |
240 |
8 |
302 |
51 |
61 |
740 |
|
10 |
g+cga |
16 |
13 |
|
2 |
|
|
31 |
|
2 |
agg+cgg |
5 |
2 |
|
|
1 |
|
8 |
|
4 |
carre ccc |
4 |
4 |
|
4 |
1 |
5 |
13 |
|
5 |
autres |
6 |
|
2 |
|
|
|
8 |
|
|
|
31 |
19 |
2 |
6 |
2 |
5 |
65 |
|
|
|
total tRNAs ‰ |
|
|
|
|
|
clos8 |
1aa |
>1aa |
dup |
+5s |
1-3aas |
autres |
clos ‰ |
ref.‰
|
21 |
faible |
42 |
26 |
3 |
8 |
3 |
7 |
88 |
26
|
16 |
moyen |
49 |
89 |
5 |
136 |
27 |
57 |
364 |
324
|
14 |
fort |
15 |
209 |
3 |
264 |
39 |
19 |
549 |
650
|
|
|
105 |
324 |
11 |
408 |
69 |
82 |
740 |
729
|
10 |
g+cga |
22 |
18 |
|
3 |
|
|
42 |
10
|
2 |
agg+cgg |
7 |
3 |
|
|
1 |
|
11 |
|
4 |
carre ccc |
5 |
5 |
|
5 |
1 |
7 |
18 |
16
|
5 |
autres |
8 |
0 |
3 |
0 |
|
|
11 |
|
|
|
42 |
26 |
3 |
8 |
3 |
7 |
88 |
|
|
|
blocs tRNAs ‰ |
|
total colonne %
|
|
clos8 |
1aa |
>1aa |
dup |
total |
ref.‰ |
1aa |
>1aa |
dup
|
21 |
faible |
95 |
58 |
6 |
160 |
26 |
40 |
8 |
|
16 |
moyen |
110 |
202 |
12 |
325 |
324 |
46 |
28 |
|
14 |
fort |
34 |
475 |
6 |
515 |
650 |
14 |
65 |
|
|
|
239 |
736 |
25 |
326 |
729 |
78 |
240 |
|
10 |
g+cga |
49 |
40 |
|
89 |
10 |
52 |
|
|
2 |
agg+cgg |
15 |
6 |
|
21 |
|
16 |
|
|
4 |
carre ccc |
12 |
12 |
|
25 |
16 |
13 |
|
|
5 |
autres |
18 |
|
6 |
25 |
|
19 |
|
|
|
|
95 |
58 |
6 |
160 |
|
31 |
|
|
clostridia, estimation des -rRNAs
modifier
- Lien tableur: clostridia, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 27.5.20
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
clo clostridia 63 génomes
clo1 cumul des +rRNAs de la fiche clostridia pour 43 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
29 |
a tct |
|
tat |
|
atgf |
30
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
44 |
b tcc |
1 |
tac |
26 |
tgc |
16
|
f atc |
72 |
j acc |
10 |
aac |
64 |
agc |
11
|
g ctc |
2 |
f ccc |
3 |
cac |
12 |
cgt |
8
|
h gtc |
4 |
n gcc |
12 |
gac |
40 |
ggc |
23
|
i tta |
19 |
c tca |
13 |
taa |
|
tga |
|
j ata |
|
k aca |
29 |
aaa |
48 |
aga |
21
|
k cta |
18 |
g cca |
17 |
caa |
25 |
cga |
1
|
l gta |
38 |
o gca |
92 |
gaa |
45 |
gga |
31
|
m ttg |
|
d tcg |
1 |
tag |
|
tgg |
9
|
n atgj |
18 |
l acg |
3 |
aag |
2 |
agg |
1
|
o ctg |
5 |
h ccg |
2 |
cag |
1 |
cgg |
3
|
p gtg |
1 |
p gcg |
|
gag |
4 |
ggg |
2
|
clos43 |
inter |
|
max |
|
min |
|
total
|
|
346 |
|
468 |
|
42 |
|
856
|
|
clo2 indices du clade clostridia du 27.5.20 de gtRNAdb pour 100 génomes
g1 |
|
t1 |
|
|
174 |
4.0 |
0.6
|
a atgi |
159 |
a tct |
1.1 |
tat |
|
atgf |
187
|
b att |
1.1 |
i act |
|
aat |
|
agt |
0.6
|
c ctt |
16 |
e cct |
2.3 |
cat |
|
cgc |
|
d gtt |
0.6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
206 |
b tcc |
103 |
tac |
187 |
tgc |
151
|
f atc |
152 |
j acc |
102 |
aac |
248 |
agc |
133
|
g ctc |
81 |
f ccc |
62 |
cac |
140 |
cgt |
116
|
h gtc |
53 |
n gcc |
61 |
gac |
242 |
ggc |
220
|
i tta |
172 |
c tca |
142 |
taa |
1.1 |
tga |
55
|
j ata |
2.9 |
k aca |
218 |
aaa |
271 |
aga |
174
|
k cta |
148 |
g cca |
163 |
caa |
156 |
cga |
48
|
l gta |
286 |
o gca |
219 |
gaa |
239 |
gga |
243
|
m ttg |
108 |
d tcg |
83 |
tag |
2.3 |
tgg |
120
|
n atgj |
132 |
l acg |
77 |
aag |
120 |
agg |
96
|
o ctg |
76 |
h ccg |
64 |
cag |
77 |
cgg |
60
|
p gtg |
34 |
p gcg |
35 |
gag |
83 |
ggg |
70
|
gtRNA |
inter |
|
max |
|
min |
|
total
|
|
2231 |
|
2982 |
|
1177 |
|
6390
|
|
clo3 cumul des -rRNAs de l'annexe archeo 8 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
1 |
a tct |
|
tat |
|
atgf |
11
|
b att |
|
i act |
|
aat |
|
agt |
1
|
c ctt |
3 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
7 |
b tcc |
6 |
tac |
10 |
tgc |
6
|
f atc |
|
j acc |
6 |
aac |
6 |
agc |
8
|
g ctc |
3 |
f ccc |
2 |
cac |
8 |
cgt |
4
|
h gtc |
2 |
n gcc |
1 |
gac |
15 |
ggc |
11
|
i tta |
11 |
c tca |
9 |
taa |
|
tga |
3
|
j ata |
1 |
k aca |
17 |
aaa |
14 |
aga |
10
|
k cta |
11 |
g cca |
14 |
caa |
8 |
cga |
4
|
l gta |
20 |
o gca |
|
gaa |
17 |
gga |
14
|
m ttg |
9 |
d tcg |
2 |
tag |
|
tgg |
7
|
n atgj |
10 |
l acg |
4 |
aag |
6 |
agg |
6
|
o ctg |
4 |
h ccg |
1 |
cag |
4 |
cgg |
1
|
p gtg |
1 |
p gcg |
1 |
gag |
3 |
ggg |
3
|
clos8 |
inter |
|
max |
|
min |
|
total
|
|
107 |
|
168 |
|
51 |
|
326
|
|
clo4 indices des +rRNAs de la fiche clostridia pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
67 |
a tct |
|
tat |
|
atgf |
70
|
b att |
|
i act |
|
aat |
|
agt |
|
c ctt |
|
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
102 |
b tcc |
2.3 |
tac |
60 |
tgc |
37
|
f atc |
167 |
j acc |
23 |
aac |
149 |
agc |
26
|
g ctc |
4.7 |
f ccc |
7 |
cac |
28 |
cgt |
19
|
h gtc |
9.3 |
n gcc |
28 |
gac |
93 |
ggc |
53
|
i tta |
44 |
c tca |
30 |
taa |
|
tga |
3.0
|
j ata |
|
k aca |
67 |
aaa |
112 |
aga |
49
|
k cta |
42 |
g cca |
40 |
caa |
58 |
cga |
2.3
|
l gta |
88 |
o gca |
214 |
gaa |
105 |
gga |
72
|
m ttg |
|
d tcg |
2.3 |
tag |
|
tgg |
21
|
n atgj |
42 |
l acg |
7.0 |
aag |
4.7 |
agg |
2.3
|
o ctg |
12 |
h ccg |
4.7 |
cag |
2.3 |
cgg |
7.0
|
p gtg |
2.3 |
p gcg |
|
gag |
9.3 |
ggg |
4.7
|
clos43 |
inter |
|
max |
|
min |
|
total
|
|
805 |
|
1088 |
|
98 |
|
1991
|
|
clo5 estimation des -rRNA du clade clostridia pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
92 |
a tct |
1.1 |
tat |
|
atgf |
117
|
b att |
1.1 |
i act |
|
aat |
|
agt |
0.6
|
c ctt |
16 |
e cct |
2.3 |
cat |
|
cgc |
|
d gtt |
0.6 |
m gct |
|
gat |
|
ggt |
|
e ttc |
104 |
b tcc |
101 |
tac |
127 |
tgc |
114
|
f atc |
-15 |
j acc |
79 |
aac |
99 |
agc |
107
|
g ctc |
76 |
f ccc |
55 |
cac |
112 |
cgt |
97
|
h gtc |
44 |
n gcc |
33 |
gac |
149 |
ggc |
167
|
i tta |
128 |
c tca |
112 |
taa |
1.1 |
tga |
55
|
j ata |
2.9 |
k aca |
151 |
aaa |
159 |
aga |
125
|
k cta |
106 |
g cca |
123 |
caa |
98 |
cga |
46
|
l gta |
198 |
o gca |
5 |
gaa |
134 |
gga |
171
|
m ttg |
108 |
d tcg |
81 |
tag |
2.3 |
tgg |
99
|
n atgj |
90 |
l acg |
70 |
aag |
115 |
agg |
94
|
o ctg |
64 |
h ccg |
59 |
cag |
75 |
cgg |
53
|
p gtg |
32 |
p gcg |
35 |
gag |
74 |
ggg |
65
|
-rRNA |
inter |
|
max |
|
min |
|
total
|
|
1426 |
|
1894 |
|
1080 |
|
4400
|
|
clo6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1 |
|
t1 |
|
|
|
|
|
a atgi |
13 |
a tct |
|
tat |
|
atgf |
138
|
b att |
|
i act |
|
aat |
|
agt |
13
|
c ctt |
38 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
88 |
b tcc |
75 |
tac |
125 |
tgc |
75
|
f atc |
|
j acc |
75 |
aac |
75 |
agc |
100
|
g ctc |
38 |
f ccc |
25 |
cac |
100 |
cgt |
50
|
h gtc |
25 |
n gcc |
13 |
gac |
188 |
ggc |
138
|
i tta |
138 |
c tca |
113 |
taa |
|
tga |
38
|
j ata |
13 |
k aca |
213 |
aaa |
175 |
aga |
125
|
k cta |
138 |
g cca |
175 |
caa |
100 |
cga |
50
|
l gta |
250 |
o gca |
|
gaa |
213 |
gga |
175
|
m ttg |
113 |
d tcg |
25 |
tag |
|
tgg |
88
|
n atgj |
125 |
l acg |
50 |
aag |
75 |
agg |
75
|
o ctg |
50 |
h ccg |
13 |
cag |
50 |
cgg |
13
|
p gtg |
13 |
p gcg |
13 |
gag |
38 |
ggg |
38
|
clos8 |
inter |
|
max |
|
min |
|
total
|
|
1325 |
|
2100 |
|
638 |
|
4063
|
|
clostridia, comparaison clade-annexe des -rRNAs
modifier
- Lien tableur: clostridia, comparaison clade-annexe des -rRNAs
- Légende
- - clo7. diff, somme des couleurs de clo7. La différence entre tRNAs est faite entre clo5 et clo6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - clo8. rap, rapport des sommes couleurs clo5/clo2. Le rapport -rRNA/total est celui du tRNA de clo5 sur celui de clo2.
- Fréquences des différences en % du tableau clo7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total
fréquence 0 11 6 10 5 4 3 4 3 1 2 0 49
tot ≤ 50 41
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 15% en dessous de celle de la fiche des clostridia.
tRNAs fiche annexe
sans 2050 326
avec 888 752
genomes 43 8
indice % 48 41
clo clostridia 63 génomes
clo7 clostridia, différence clade-annexe des -rRNAs
g1 |
|
t1 |
|
|
|
|
|
a atgi |
86 |
a tct |
100 |
tat |
|
atgf |
15
|
b att |
100 |
i act |
|
aat |
|
agt |
95
|
c ctt |
59 |
e cct |
100 |
cat |
|
cgc |
|
d gtt |
100 |
m gct |
|
gat |
|
ggt |
|
e ttc |
16 |
b tcc |
26 |
tac |
1 |
tgc |
34
|
f atc |
100 |
j acc |
5 |
aac |
24 |
agc |
7
|
g ctc |
51 |
f ccc |
55 |
cac |
11 |
cgt |
49
|
h gtc |
43 |
n gcc |
62 |
gac |
21 |
ggc |
17
|
i tta |
7 |
c tca |
1 |
taa |
100 |
tga |
32
|
j ata |
77 |
k aca |
29 |
aaa |
9 |
aga |
0
|
k cta |
23 |
g cca |
29 |
caa |
2 |
cga |
9
|
l gta |
21 |
o gca |
100 |
gaa |
37 |
gga |
2
|
m ttg |
4 |
d tcg |
69 |
tag |
100 |
tgg |
12
|
n atgj |
28 |
l acg |
29 |
aag |
35 |
agg |
20
|
o ctg |
22 |
h ccg |
79 |
cag |
33 |
cgg |
76
|
p gtg |
61 |
p gcg |
64 |
gag |
49 |
ggg |
43
|
diff |
inter |
|
max |
|
min |
|
total
|
|
265 |
|
272 |
|
944 |
|
1481
|
|
clo8 clostridia, rapports -rRNA/total
g1 |
|
t1 |
|
|
|
|
|
a atgi |
58 |
a tct |
|
tat |
|
atgf |
63
|
b att |
|
i act |
|
aat |
|
agt |
95
|
c ctt |
100 |
e cct |
|
cat |
|
cgc |
|
d gtt |
|
m gct |
|
gat |
|
ggt |
|
e ttc |
50 |
b tcc |
98 |
tac |
68 |
tgc |
75
|
f atc |
-10 |
j acc |
77 |
aac |
40 |
agc |
81
|
g ctc |
94 |
f ccc |
89 |
cac |
80 |
cgt |
84
|
h gtc |
82 |
n gcc |
54 |
gac |
62 |
ggc |
76
|
i tta |
74 |
c tca |
79 |
taa |
|
tga |
100
|
j ata |
100 |
k aca |
69 |
aaa |
59 |
aga |
72
|
k cta |
72 |
g cca |
75.7 |
caa |
63 |
cga |
95
|
l gta |
69 |
o gca |
2 |
gaa |
56 |
gga |
70
|
m ttg |
100 |
d tcg |
97 |
tag |
|
tgg |
83
|
n atgj |
68 |
l acg |
91 |
aag |
96 |
agg |
98
|
o ctg |
85 |
h ccg |
93 |
cag |
97 |
cgg |
88
|
p gtg |
93 |
p gcg |
100 |
gag |
89 |
ggg |
93
|
rap |
inter |
|
max |
|
min |
|
total
|
|
64 |
|
64 |
|
92 |
|
69
|
|
Intergen51. Clostridia. Introduction
modifier
Intergen51. Clostridia. Historique des pré-études
modifier
clostridia données intercalaires
modifier
total max1 reste max2 un
psor 2350 888 12 1537 2038
cbc 2572 1013 13 2050 2620
cbn 1775 582 9 759 777
cbei 4010 1072 20 1881 2121
cdc 2589 1023 13 1588 1907
cdc8 2727 1048 14 1554 1856
cle 2900 1057 15 2271 3106
hmo 1867 738 9 1316 1644
afn 1385 736 7 1154 2261
clostridia données intercalaires 200
modifier
Intergen51. Clostridia. Vue de l'ensemble
modifier
Intergen51. Clostridia. La longueur totale des intercalaires d'un génome
modifier
- Note: Les taux de ces clostridia est plutôt élevé mais 6 sur 8 ont un taux médian de 12% trouvé pour les 51 génomes de cette étude. Deux génomes, avec 18% se trouve à l'extérieur de la plage du taux médian, mais ils en restent proche notamment de cdc avec 15.5%.
Nom intercalaires génome taux en %
clostridia
cbc 696,513 3,892,029 17.9
cbei 1,199,672 6,485,394 18.5
cbn 330,729 2,773,157 11.9
cdc 636,447 4,110,554 15.5
cdc8 663,874 4,308,325 15.4
cle 615,068 4,714,237 13.0
hmo 396,940 3,075,407 12.9
psor 450,598 3,550,458 12.7
Intergen51. Clostridia. Les différents types d'intercalaires
modifier
- Lien au tableur: Intergen51. Clostridia les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
- Note: Les R- sont absents.
Int51.2 Clostridia les différents types d'intercalaires entre gène de 8 génomes
Int51.21 Les différents types
intercalaires CDS-CDS |
* autres intercalaires
|
continu |
S+ |
S- |
S0 |
total |
c/x |
RNA-RNA |
CDS-rRNA |
total
|
c |
20 586 |
2 475 |
204 |
23 265 |
4,0 |
784 |
111 |
895
|
x |
5 726 |
67 |
3 |
5 796 |
|
3 |
33 |
36
|
t |
26 312 |
2 542 |
207 |
29 061 |
|
787 |
144 |
931
|
% |
90,5 |
8,7 |
0,7 |
|
|
|
|
|
|
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS |
récapitulatif des * autres intercalaires
|
continu |
R+ |
R- |
R0 |
total |
c/x |
* autres |
total |
%
|
c |
203 |
0 |
2 |
205 |
2,2 |
tRNA-CDS |
299 |
21
|
x |
94 |
0 |
0 |
94 |
|
RNA-RNA |
787 |
54
|
t |
297 |
0 |
2 |
299 |
|
CDS-rRNA |
144 |
10
|
% |
99,3 |
0,0 |
0,7 |
|
|
non RNA |
549 |
38
|
|
Int51.23 Les taux remarquables
taux |
%reste |
%t30 |
%t5 |
%0
|
type |
S+ |
R+ |
S- |
S+ |
R+ |
S- |
S+ |
R+
|
gamme |
400 |
400 |
6-50 |
- |
- |
- |
- |
-
|
c |
9,1 |
13,2 |
1,8 |
27,3 |
1,5 |
41 |
0,9 |
1,0
|
x |
16,6 |
21,3 |
9,0 |
3,5 |
1,1 |
31 |
0,1 |
0,0
|
|
Intergen51. Clostridia. Détail des intercalaires RNA-RNA et CDS-rRNA
modifier
- Voir données intercalaires
RNA-RNA c x CDS-RNA c x
23s5s 53 CDS 16s 67 28
16s23s 51 5s CDS 13 11
16stRNA 16 16 CDS 3 1
tRNA23s 33 CDS 5s 1 4
5stRNA 52 1 23s CDS 9 4
tRNAin 11 CDS 23s 3
tRNAcontig 300 5s 16s 2 1
tRNAhors 202 1 16s16s
tRNA16s 10
23stRNA 24
tRNA5s 10
16s5s 19
5s23s 1
5s5s
total 782 2 total 98 49
Intergen51. Clostridia. Les intercalaires rares
modifier
type gen c x type gen c x
R0 cdc 1 CDS23s cle 531
- cdc8 1 - cle 563
5s23s hmo 230 - cle 407
5stRNA cdc8 - 353 23sCDS cdc8 - 87
tRNAhors hmo - 293 - cle 188 188
5s16s cbei 1107 - cle 223 260
- cbei 1125 - cle 237
- cdc8 - 161 - cle 299
16sCDS cdc8 2 - cle 313
- cdc8 294 - cle 322
- cle 695 228 - hmo 336 109
CDS5s cle 335 184 - hmo 357
- cle - 228 - hmo 463
- cle - 301
- cle - 343
Intergen51. Clostridia. Les diagrammes de la totale
modifier
Intergen51. Clostridia. Les diagrammes CDS-CDS et tRNA-CDS
modifier
Intergen51. Clostridia. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
- Lien aux données intercalaires.
- Diagrammes des clostridia: tcl présente 4 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 et autres R2 des f.1
R2 x3 x2 x c Inflexion poly3 x c
0,897 2,07E-06 -1,72E-03 3,66E-01 6,27 fx1 abscisse 283,2 127,4
0,822 -5,27E-06 4,01E-03 -9,98E-01 93,9 fc1 ordonnée 18,9 24,7
poly3/droite 18,4 24,2
0,896 1,86E-06 -1,58E-03 3,38E-01 7,70 fx41
0,985 5,31E-07 -2,03E-04 -8,26E-02 37,4 fc41 R2 f.1 x c
Poly 3 897 822
0,707 -0,059 35,1 fx41 Poly 6 908 902
0,951 -0,082 34,6 fc41 Poly 9 921 941
0,220 -0,029 26,8 fx1
0,573 -0,146 52,4 fc1
Intergen51. Clostridia. Les diagrammes CDS-CDS négatifs
modifier
Intergen51. Clostridia. comparaison avec la totale
modifier
- Lien aux données intercalaires.
- Chez les clostridia le 4/1 est inverse de la totale, 0.9 (sans hmo, 394/437) contre 2.6 pour la totale.
Sous-totaux clostridia totale
fréquence x- c- x- c-
-1 0 473 4 4140
-2 1 0 85 11
-3 0 2 3 12
-4 19 543 717 10938
-5 1 4 5 19
sp6 46 1453 1642 8424
total 67 2475 2456 23544
reste 6 44 264 420
s6 10 3 361 41
s7 10 250 321 1438
s8 20 1156 696 6525
rappot s1-5
4/2/1 19,0 1,1 8,4 2,6
% / sp6
s6/sp6 21,7 0,2 22,0 0,5
s7/sp6 21,7 17,2 19,5 17,1
s8/sp6 43,5 79,6 42,4 77,5
reste/sp6 13,0 3,0 16,1 5,0
total s1-5 21 1022 814 15120
% / total
%s1-5 31,3 41,3 33,1 64,2
%sp6 68,7 58,7 66,9 35,8
Intergen51. Clostridia. Homogénéité des génomes
modifier
- Lien aux données intercalaires des génomes
- L'homogénéité est bonne sauf pour le 4/1 de hmo et afn.
négatifs x cbc cbei cbn cdc cdc8 cle hmo psor total afn
total 7 10 9 2 4 21 11 3 67 4
s1-5 3 3 0 1 1 8 4 1 21 1
sp6 4 7 9 1 3 13 7 2 46 3
rapport s1-5
4/2 - - - - - - 3.0 - 19.0 -
% / sp6
s6 25 14 56 0 0 15 14 0 22 33
s7 25 29 0 0 33 23 43 0 22 33
s8 25 43 44 0 67 62 14 50 43 0
reste 25 14 0 100 0 0 29 50 13 33
% / total
s1-5 43 30 0 50 25 38 36 33 31 25
sp6 57 70 100 50 75 62 64 67 69 75
négatifs c cbc cbei cbn cdc cdc8 cle hmo psor total afn
total 288 390 167 296 326 441 332 235 2475 303
s1-5 130 154 62 104 123 186 185 78 1022 167
sp6 158 236 105 192 203 255 147 157 1453 136
rapport s1-5
4/1 0.8 1.2 0.8 0.7 0.7 1.4 4.1 0.4 1.1 3.4
% / sp6
s6 0 0 0 1 0 0 1 0 0 1
s7 18 14 22 17 15 15 31 17 17 15
s8 80 85 78 80 82 82 68 82 80 77
reste 3 2 0 3 2 4 0 1 3 7
% / total
s1-5 45 39 37 35 38 42 56 33 41 55
sp6 55 61 63 65 62 58 44 67 59 45
Intergen51. Clostridia. Les grands négatifs inférieurs à -120
modifier
Intergen51. Clostridia. Les diagrammes CDS-rRNA
modifier
Intergen51. Clostridia. Les diagrammes CDS-16s
modifier
clostridia CDS16sc CDS16sx 5sCDSc 5sCDSx
R2 0,264 - - -
xs 324,2 329,6 223,3 132,8
plage 210-780 270-570 90-510 60-240
total-p 65 10 26 8
% 97 77 93 80
queue 1 0 2 2
% 1 0 7 20
tête 2 3 0 0
% 3 23 0 0
max 210;7 360;3 150;5 120;3
total8 67 13 28 10
freq 30 30 30 30
Intergen51.clostridia. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
|
|
|
|
|
|
|
|
cbei |
548 |
|
|
548 |
|
|
-185,4 |
251,3
|
cbn |
111 |
|
|
2x111 |
|
|
251,6 |
-185,7
|
cdc |
424,5 |
116,7 |
3,6 |
342 |
507 |
|
-61,9 |
127,8
|
cdc8 |
335,8 |
178,5 |
1,9 |
81 |
376:388 |
498 |
26,8 |
39,1
|
cle |
347 |
|
|
347 |
|
|
15,6 |
50,3
|
hmo |
|
|
|
|
|
|
|
|
psor |
325,3 |
53,7 |
6,1 |
264 |
348 |
364 |
37,2 |
28,7
|
total |
329,6 |
151,9 |
2,2 |
|
|
|
362,6 |
296,7
|
|
CDS16sc. continu
CDS16sc |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
570,5 |
239,5 |
2,4 |
*117 |
3x387-570 |
909 |
-78,6 |
168,1
|
cbei |
594,2 |
148,2 |
4,0 |
282:390 |
5x501-573 |
6x667-776 |
-102,4 |
191,8
|
cbn |
404,1 |
34,3 |
11,8 |
346:369 |
5x393-424 |
453 |
87,7 |
1,7
|
cdc |
363,6 |
227,7 |
1,6 |
181:193 |
3x241-284 |
585:778 |
128,3 |
-38,9
|
cdc8 |
311,3 |
233,8 |
1,3 |
3x181-192 |
240:294 |
780 |
180,5 |
-91,1
|
cle |
423,3 |
143,4 |
3,0 |
4x302-331 |
402 |
602:643 |
68,6 |
20,9
|
hmo |
582,6 |
105,7 |
5,5 |
*20 |
6x459-559 |
3x652-774 |
-90,7 |
180,1
|
psor |
291,4 |
100,1 |
2,9 |
8x189-276 |
309 |
431:525 |
200,5 |
-111,1
|
total |
447,1 |
189,3 |
2,4 |
|
|
|
491,9 |
402,4
|
|
Intergen51. Clostridia. Les diagrammes 5s-CDS
modifier
clostridia 5sCDSc 5sCDSx ftx ftc
R2 - - 0,277 0,401
xs 223,3 132,8 146,6 134,6
plage 90-510 60-240 50-280 60-330
total-p 26 8 60 161
% 93 80 64 79
queue 2 2 33 38
% 7 20 35 19
tête 0 0 1 4
% 0 0 1 2
max 150;5 120;3 260;5 70;13
total8 28 10 94 205
freq 30 30 10 10
Intergen51.clostridia. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
ftc-fc 94,7
ftc-fc -105,3
ftx-fx 189,3
ftx-fx -4,4
Intergen51.Clostridia Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
cbc |
269,8 |
197,0 |
1,37 |
2 |
0 |
5,7 |
44,4
|
cbei |
296,6 |
161,4 |
1,84 |
2 |
1 |
-21,1 |
71,2
|
cbn |
231,6 |
144,4 |
1,60 |
0 |
0 |
43,9 |
6,2
|
cdc |
279,3 |
94,8 |
2,95 |
0 |
0 |
-3,7 |
53,8
|
cdc8 |
263,4 |
91,2 |
2,89 |
0 |
0 |
12,1 |
38,0
|
cle |
254,9 |
158,0 |
1,61 |
0 |
0 |
20,7 |
29,4
|
hmo |
225,5 |
130,3 |
1,73 |
0 |
0 |
50,1 |
0,0
|
psor |
235,6 |
144,5 |
1,63 |
2 |
0 |
39,9 |
10,2
|
total |
250,5 |
42,7 |
1,76 |
|
++ |
275,5 |
225,4
|
|
5sCDSx. 5s-CDS discontinu
5sCDSx |
moyenne |
écart |
m/e |
intercalaires |
-
|
cbc |
|
|
|
|
|
|
|
cbei |
123,7 |
60,1 |
2,1 |
69 |
114 |
188 |
|
cbn |
367,0 |
315,4 |
1,2 |
144 |
590 |
|
|
cdc |
213 |
|
|
213 |
|
|
|
cdc8 |
216 |
|
|
216 |
|
|
|
cle |
|
|
|
|
|
|
|
hmo |
|
|
|
|
|
|
|
psor |
204,3 |
171,3 |
1,2 |
*40 |
99:112 |
402 |
|
total |
214,7 |
162,3 |
1,3 |
++ |
236,2 |
193,2 |
-
|
|
ftc. tRNA-CDS continu
ftc |
moyenne |
écart |
m/e |
Inf 40 |
Sup 700 |
haut |
bas
|
cbc |
199,3 |
134,9 |
1,48 |
0 |
4 |
28,7 |
12,8
|
cbei |
270,4 |
158,2 |
1,71 |
1 |
0 |
-42,4 |
83,8
|
cbn |
164,8 |
100,9 |
1,63 |
0 |
0 |
63,3 |
-21,8
|
cdc |
164,8 |
99,4 |
1,66 |
0 |
2 |
63,2 |
-21,8
|
cdc8 |
177,1 |
114,6 |
1,55 |
0 |
2 |
50,9 |
-9,5
|
cle |
207,7 |
126,3 |
1,64 |
1 |
1 |
20,4 |
21,1
|
hmo |
210,9 |
127,8 |
1,65 |
0 |
1 |
17,1 |
24,3
|
psor |
184,9 |
102,1 |
1,81 |
1 |
0 |
43,1 |
-1,7
|
total |
207,3 |
130,3 |
1,59 |
|
++ |
228,0 |
186,6
|
|
5sCDSc. 5s-CDS continu
5sCDSc |
moyenne |
écart |
m/e |
intercalaires |
-
|
cbc |
363 |
|
|
363 |
|
|
|
cbei |
387,7 |
209,8 |
1,8 |
90:159 |
315:429 |
3x508-661 |
|
cbn |
133,0 |
7,1 |
18,8 |
128 |
138 |
|
|
cdc |
229,8 |
139,6 |
1,6 |
119:126 |
177:273 |
454 |
|
cdc8 |
229,4 |
138,8 |
1,7 |
118:127 |
177:273 |
452 |
|
cle |
301 |
|
|
301 |
|
|
|
hmo |
|
|
|
|
|
|
|
psor |
154,0 |
64,1 |
2,4 |
3x85-109 |
131:180 |
228:245 |
|
total |
250,6 |
159,6 |
1,6 |
++ |
275,7 |
225,6 |
-
|
|
fx. CDS-CDS discontinu
fx |
moyenne |
écart |
m/e |
ftx-fx |
Sup 700 |
haut |
bas
|
cbc |
274,2 |
152,6 |
1,80 |
-4,4 |
40 |
-12,4 |
60,0
|
cbei |
262,3 |
151,8 |
1,73 |
34,3 |
50 |
-0,4 |
48,0
|
cbn |
200,8 |
134,4 |
1,49 |
30,9 |
12 |
61,1 |
-13,5
|
cdc |
254,9 |
143,3 |
1,78 |
24,4 |
32 |
7,0 |
40,6
|
cdc8 |
253,9 |
141,8 |
1,79 |
9,5 |
36 |
7,9 |
39,7
|
cle |
207,2 |
128,1 |
1,62 |
47,7 |
17 |
54,7 |
-7,0
|
hmo |
224,6 |
136,9 |
1,64 |
0,9 |
13 |
37,3 |
10,4
|
psor |
193,9 |
124,0 |
1,56 |
41,7 |
14 |
67,9 |
-20,3
|
total |
238,1 |
143,7 |
1,66 |
12,4 |
++ |
261,9 |
214,3
|
|
fc. CDS-CDS continu
fc |
moyenne |
écart |
m/e |
ftc-fc |
Sup 700 |
haut |
bas
|
cbc |
228,0 |
154,5 |
1,48 |
-28,7 |
66 |
-3,6 |
44,4
|
cbei |
234,5 |
154,8 |
1,51 |
35,9 |
127 |
-10,1 |
50,9
|
cbn |
167,3 |
110,9 |
1,51 |
-2,5 |
7 |
57,1 |
-16,3
|
cdc |
210,5 |
147,2 |
1,43 |
-45,6 |
55 |
13,9 |
26,9
|
cdc8 |
205,6 |
143,5 |
1,43 |
-28,4 |
56 |
18,8 |
22,0
|
cle |
184,2 |
126,7 |
1,45 |
23,5 |
55 |
40,2 |
0,6
|
hmo |
180,8 |
125,3 |
1,44 |
30,1 |
12 |
43,6 |
-2,8
|
psor |
179,7 |
122,1 |
1,47 |
5,2 |
26 |
44,7 |
-3,9
|
total |
204,0 |
141,5 |
1,44 |
3,3 |
++ |
224,4 |
183,6
|
|
Intergen51. Clostridia. Les CDS-rRNA rares
modifier
Intergen51. Clostridia. Les diagrammes RNA-RNA
modifier
Intergen51. Clostridia. Les diagrammes rRNA-rRNA
modifier
clostridia 16s23s 16stRNA tRNA23s 23s5s
R2 0,215 - - 0,286
xs 201,6 106,9 191,7 117,4
plage 200-340 60-140 100-300 80-220
total-p 46 16 30 47
% 90 100 91 89
queue 4 0 3 2
% 8 0 9 4
tête 1 0 0 4
% 2 0 0 8
max 240;15 60;8 120;7 140;16
total8 51 16 33 53
freq 20 20 20 20
Intergen51. Clostridia. Les diagrammes tRNA-rRNA
modifier
Intergen51.clostridia. Moyennes rRNA-RNA
16s23s.
16s23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
227,5 |
1,0 |
227,5 |
226 |
3x 228 |
|
73,3 |
-18,6
|
cbei |
353,5 |
113,6 |
3,1 |
3x213-214 |
7x338-339 |
3x502-578 |
-52,7 |
107,4
|
cbn |
237 |
|
|
8x 237 |
|
|
63,8 |
-9,1
|
cdc |
271,3 |
49,4 |
5,5 |
188:221 |
3x283-285 |
315:324 |
29,5 |
25,2
|
cdc8 |
266,8 |
54,1 |
4,9 |
3x188-221 |
2x 265 |
3x324-325 |
34,0 |
20,6
|
cle |
613 |
|
|
613 |
|
|
-312,2 |
366,9
|
hmo |
189,9 |
18,6 |
10,2 |
137 |
194 |
8x 196 |
110,9 |
-56,2
|
psor |
|
|
|
|
|
|
|
|
total |
273,5 |
98,1 |
2,8 |
|
|
|
300,8 |
246,1
|
|
23s5s.
23s5s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
104,3 |
7,5 |
13,9 |
93 |
3x 108 |
|
40,3 |
-14,1
|
cbei |
166,3 |
61,1 |
2,7 |
70:108 |
6x134-139 |
5x202-274 |
-21,7 |
48,0
|
cbn |
71,9 |
32,1 |
2,2 |
3x34-35 |
76 |
4x98-100 |
72,7 |
-46,4
|
cdc |
132,8 |
20,2 |
6,6 |
114 |
6x127x132 |
181 |
11,8 |
14,4
|
cdc8 |
166,9 |
38,3 |
4,4 |
|
3x126-127 |
4x182-202 |
-22,3 |
48,5
|
cle |
|
|
|
|
|
|
|
|
hmo |
|
|
|
|
|
|
|
|
psor |
121,8 |
54,9 |
2,2 |
6x40-78 |
4x122-144 |
3x193-213 |
22,8 |
3,5
|
total |
131,5 |
55,0 |
2,4 |
|
|
|
144,6 |
118,3
|
|
16stRNA.
16stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
|
|
|
|
|
|
|
|
cbei |
136,3 |
4,0 |
33,7 |
140 |
132 |
137 |
-40,4 |
57,8
|
cbn |
100,5 |
33,2 |
3,0 |
124 |
77 |
|
-4,5 |
22,0
|
cdc |
55 |
|
|
3x 55 |
|
|
41,0 |
-23,5
|
cdc8 |
55 |
|
|
55 |
|
|
41,0 |
-23,5
|
cle |
|
|
|
|
|
|
|
|
hmo |
|
|
|
|
|
|
|
|
psor |
80,9 |
33,7 |
2,4 |
4x 54 |
109 |
118:123 |
15,1 |
2,3
|
total |
87,3 |
36,5 |
2,4 |
|
|
|
96,0 |
78,5
|
|
tRNA23s.
tRNA23s |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
|
|
|
|
|
|
|
|
cbei |
104,3 |
18,0 |
5,8 |
84 |
111 |
118 |
125,3 |
-83,5
|
cbn |
96,0 |
1,4 |
67,9 |
95 |
97 |
|
133,6 |
-91,9
|
cdc |
298,7 |
66,2 |
4,5 |
250 |
272 |
374 |
-69,1 |
110,8
|
cdc8 |
383,0 |
9,9 |
38,7 |
376 |
390 |
|
-153,4 |
195,1
|
cle |
271,3 |
11,3 |
24,1 |
4x262-263 |
3x283-284 |
|
-41,7 |
83,4
|
hmo |
223,3 |
32,3 |
6,9 |
145:198 |
7x233-241 |
|
6,3 |
35,5
|
psor |
116,0 |
17,3 |
6,7 |
6x95-114 |
152 |
|
113,6 |
-71,9
|
total |
208,7 |
88,9 |
2,3 |
|
|
|
229,6 |
187,9
|
|
Intergen51. Clostridia. Les diagrammes tRNA-tRNA
modifier
type c S40 % R2 diag total reste x+ restes tRNA 5s contig hors hors HC
hors 176 87 0,922 100 202 8 293 336 120 144 241 144
contig 282 94 0,790 100 300 2 - 311 148 306 149
in 9 82 - 90 11 - 149 439 187
5stRNA 41 79 - 60 52 353 187 241
tRNA 5s 9 90 - 20 10 1 234 306
HC 147 89 0,904 100 165 5 -
Les pourcentages des tRNA-tRNA hors blocs
modifier
tRNA h cbc cbei cbn cdc cdc8 cle hmo psor total %
20 22 34 36 2 2 15 22 9 142 70.3
40 3 12 7 1 1 10 0 34 16.8
60 2 2 3 2 1 10 5.0
80 2 1 1 2 6 3.0
100 1 1 2 1.0
120 0 0.0
140 0 0.0
160 1 1 1 3 1.5
180 0 0.0
200 1 1 0.5
220 0 0.0
240 1 1 0.5
260 1 1 0.5
restes 1 1 2 1.0
total 29 54 48 3 3 30 26 9 202 100
repete 1 1 3 0 0 1 0 0 6 12
sequence 1 5 3 0 0 1 0 1 11 22
sans 5 3 1 1 1 8 13 1 33 66
clusters 7 9 7 1 1 10 13 2 50 100
5 9 8 23 1 1 7 9 2 60 30
10 7 15 5 1 1 5 8 5 47 23
15 0 4 6 2 1 1 14 7
20 6 7 2 1 4 1 21 10
Les pourcentages des tRNA-tRNA contigus aux blocs
modifier
tRNA cont cbc cbei cbn cdc cdc8 cle hmo psor total %
20 1 4 5 60 75 15 33 63 256 85.3
40 1 1 4 6 6 2 6 26 8.7
60 1 1 3 3 8 2.7
80 1 0 0 1 0 2 0.7
100 2 3 1 6 2.0
120 1 1 0.3
restes 1 1 0.3
total 2 5 7 67 85 25 40 69 300 100
repete 1 0 0 0 0 0 0 0 1 3
séquence 0 0 0 1 1 0 0 1 3 10
sans 1 4 3 1 2 4 6 1 22 71
eclaté 0 0 0 1 1 2 0 1 5 16
clusters 2 4 3 3 4 6 6 3 31 100
5 1 3 2 16 18 3 16 13 72 24
10 1 1 31 41 9 12 28 123 41
15 11 14 2 1 18 46 15
20 2 2 2 1 4 4 15 5
Les moyennes des tRNA-tRNA par génome
modifier
Intergen51.clostridia. Moyennes tRNA-tRNA
5stRNA
5stRNA |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
7,5 |
0,6 |
13,0 |
2x7 |
2x8 |
|
12,5 |
-8,9
|
cbei |
11,3 |
13,6 |
0,8 |
4x5 |
7 |
14:44 |
8,8 |
-5,1
|
cbn |
7,8 |
5,0 |
1,6 |
4x3-7 |
13 |
15 |
12,2 |
-8,6
|
cdc |
6,3 |
0,6 |
11,0 |
2x6 |
7 |
|
13,7 |
-10,1
|
cdc8 |
5,8 |
0,8 |
7,7 |
2x5 |
3x6 |
7 |
14,2 |
-10,6
|
cle |
11,9 |
24,3 |
0,5 |
8x4-5 |
3x7 |
89 |
8,1 |
-4,5
|
hmo |
64 |
|
|
9x64 |
|
|
-44,0 |
47,6
|
psor |
5 |
|
|
5x5 |
|
|
15,0 |
-11,4
|
total |
18,2 |
24,4 |
0,7 |
|
|
|
20,0 |
16,4
|
|
tRNA contigu
tRNA cont |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
cbc |
15,0 |
17,0 |
0,9 |
2 |
100 |
|
-0,5 |
3,1
|
cbei |
7,4 |
10,1 |
0,7 |
5 |
100 |
|
7,1 |
-4,5
|
cbn |
18,3 |
21,9 |
0,8 |
7 |
71 |
1 |
-3,8 |
6,4
|
cdc |
12,4 |
15,4 |
0,8 |
67 |
97 |
|
2,2 |
0,5
|
cdc8 |
13,0 |
16,5 |
0,8 |
85 |
96 |
|
1,5 |
1,1
|
cle |
20,1 |
17,7 |
1,1 |
25 |
96 |
|
-5,6 |
8,2
|
hmo |
15,8 |
23,9 |
0,7 |
40 |
95 |
|
-1,2 |
3,9
|
psor |
10,2 |
6,1 |
1,7 |
69 |
100 |
|
4,3 |
-1,7
|
total |
13,2 |
16,0 |
0,8 |
300 |
97 |
1 |
14,5 |
11,9
|
|
tRNA intra cluster
tRNA in |
moyenne |
écart |
m/e |
intercalaires |
haut |
bas
|
cbc |
|
|
|
|
|
|
|
|
cbei |
3 |
|
|
3 |
atc |
|
17,6 |
-13,8
|
cbn |
5,0 |
2,8 |
1,8 |
3:7 |
atc |
|
15,6 |
-11,8
|
cdc |
|
|
|
|
|
|
|
|
cdc8 |
|
|
|
|
|
|
|
|
cle |
53 |
|
|
2x53 |
atc |
|
-32,4 |
36,2
|
hmo |
6 |
|
|
2x6 |
atc |
|
14,6 |
-10,8
|
psor |
|
|
|
|
|
|
|
|
total |
18,7 |
23,5 |
0,8 |
|
|
|
20,6 |
16,8
|
|
tRNA hors cluster
tRNA hors |
moyenne |
écart |
m/e |
total |
S60% |
sup120 |
haut |
bas
|
cbc |
17,1 |
18,9 |
0,9 |
29 |
93 |
1 |
1,1 |
2,2
|
cbei |
18,0 |
16,5 |
1,1 |
53 |
89 |
4 |
0,2 |
3,1
|
cbn |
13,9 |
15,2 |
0,9 |
48 |
96 |
1 |
4,3 |
-1,0
|
cdc |
14,3 |
16,2 |
0,9 |
3 |
100 |
|
3,9 |
-0,6
|
cdc8 |
14,3 |
16,2 |
0,9 |
3 |
100 |
|
3,9 |
-0,6
|
cle |
19,4 |
15,9 |
1,2 |
30 |
90 |
2 |
-1,2 |
4,5
|
hmo |
17,8 |
24,1 |
0,7 |
26 |
88 |
|
0,4 |
2,9
|
psor |
9,3 |
4,8 |
1,9 |
9 |
100 |
|
8,9 |
-5,6
|
total |
16,6 |
17,3 |
1,0 |
201 |
92 |
8 |
18,2 |
14,9
|
|
Intergen51. Clostridia. Les RNA-RNA rares
modifier