Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia

clostridia
Image logo représentative de la faculté
Annexe 4
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :bacilli
Suivant :actino
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : clostridia
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/clostridia
 », n'a pu être restituée correctement ci-dessus.



  • Annexe en préparation

Tanger le 3.11.19

Paeniclostridium sordellii AM370

modifier

psor opérons

modifier
  • Liens: gtRNAdb, NCBI [1], génome [2]
  • Lien tableur: psor opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Paeniclostridium.
  • Légende: cdsa: cds aas, cdsj: cdsa sans jaune, cdsd: cdsa dirigé
    - @2, cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
    - @4, riboswitch se trouve dans un bloc à rRNA. Concerne cette remarque aussi le RNA non codant, ncRNA, à l'adresse 19421..19685.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de psor.
C1 Paeniclostridium sordellii AM370
27.3%GC 8.8.19 Paris  112   doubles intercal cds aa avec aa cdsa cdsd
9847..10620 CDS 205 205 258
10826..12332 16s 196
12529..15445 23s 78
15524..15640 5s 85 85 85
15726..15947 CDS 74
18845..19297 CDS 3 3 151 3
19301..19393 tcc 27
19421..19685 ncRNA 152 152
19838..21478 CDS *547
24343..24570 CDS 309 309 76
24880..26386 16s 196
26583..29499 23s 122
29622..29738 5s 5 5
29744..29832 tta + 13 13
29846..29921 atgf 3 aaa 15 15
29937..30011 gaa 6 atg 9 9
30021..30094 gga 3 gta 6 6
30101..30176 gta 1 cgt 5 5
30182..30258 gac 1 ggc 16 16
30275..30350 aac 2 fois suite 4 4
30355..30429 aca aac aca aga 4 4
30434..30518 tac caa cac cca 15 15
30534..30617 cta cta gaa gac 14 14
30632..30708 aga gga tac tca 7 7
30716..30791 caa tgc tta ttc 11 11
30803..30878 aaa 6 6
30885..30973 tca 3 3
30977..31052 ttc 9 9
31062..31138 atgj 8 8
31147..31223 atgi 21 21
31245..31321 cca 6 6
31328..31404 cac 4 4
31409..31482 tgc 25 25
31508..31596 tta 13 13
31610..31685 atgf 15 15
31701..31775 gaa 9 9
31785..31858 gga 6 6
31865..31940 gta 5 5
31946..32022 gac 16 16
32039..32114 aac 4 4
32119..32193 aca 4 4
32198..32282 tac 15 15
32298..32381 cta 11 11
32393..32467 ggc 13 13
32481..32557 aga 7 7
32565..32640 caa 11 11
32652..32727 aaa 6 6
32734..32822 tca 3 3
32826..32901 ttc 9 9
32911..32987 atgj 8 8
32996..33072 atgi 21 21
33094..33170 cca 6 6
33177..33253 cac 9 9
33263..33338 aaa 21 21
33360..33433 tgc 6 6
33440..33516 cgt 10
33527..33602 gta 162 162 162
33765..34016 CDS 84
34042..34455 CDS 249 249 138
34705..36211 16s 196
36408..39324 23s 78
39403..39519 5s 402 *402
comp 39922..40113 CDS 348 348 64
40462..41968 16s 196
42165..45081 23s 78
45160..45276 5s 180 180 *180
45457..47394 CDS *646
101428..102144 CDS 276 276 239
102421..103927 16s 54
103982..104057 gca 114
104172..107096 23s 41
107138..107211 gga 11
107223..107339 5s 99 99 99
comp 107439..108617 CDS 393
111345..111884 CDS 431 *431 180
112316..113822 16s 54
113877..113952 gca 114
114067..116982 23s 193
117176..117292 5s 5
117298..117386 tta 9 9
117396..117472 atgi 123
117596..119102 16s 54
119157..119232 gca 114
119347..122263 23s 193
122457..122573 5s 5
122579..122667 tta 9 9
122677..122753 atgi 123
122877..124383 16s 54
124438..124513 gca 114
124628..127549 23s 78
127628..127744 5s 100 100 100
127845..129260 CDS 472
215388..216260 CDS 264 264 291
216525..218030 16s 123
218154..218229 gca 152
218382..221296 23s 50
221347..221420 gga 12
221433..221549 5s 109 109 109
221659..221940 CDS 525 *525 94
222466..223972 16s 196
224169..227083 23s 144
227228..227344 5s 228 228 *228
227573..227989 CDS 139
449964..450266 CDS 253 253 101
450520..452026 16s 196
452223..455139 23s 144
455284..455400 5s 112 112 112
comp 455513..456616 CDS 368
498418..499074 CDS 189 189 219
499264..500770 16s 118
500889..500964 gca 95
501060..503976 23s 144
504121..504237 5s 131 131 131
504369..504551 CDS 61
546886..550416 CDS 41 41 *1177 *41
comp 550458..550544 ttg 138 138
550683..553325 CDS *881
608009..608683 CDS 195 195 225
608879..608975 tga 37 37 37
comp 609013..609732 CDS 240
815939..816655 CDS 71 71 239 71
816727..816800 tgc 12 12
816813..816888 aac 3 3
816892..816966 aca 285 285
817252..818727 CDS 492
1284870..1288097 CDS 111 111 *1076 *111
1288209..1288297 cta 426 *426
1288724..1290853 CDS *710
1445161..1445664 CDS 135 135 168 135
1445800..1445868 other @1 258 258
1446127..1446813 CDS 229
2267513..2267698 CDS @2 306 306 62 *306
comp 2268005..2268088 cta 404 *404
2268493..2269758 CDS 422
3094098..3094784 CDS 40 40 229 40
comp 3094825..3094941 5s 78
comp 3095020..3097936 23s 194
comp 3098131..3099637 16s 276 276
comp 3099914..3101161 CDS 416
3159922..3160827 CDS 37 37 302 37
comp 3160865..3160956 agc 120 120
comp 3161077..3161376 CDS 100
comp 3274188..3274733 CDS 245 245 182 *245
comp 3274979..3275095 5s @3 12
comp 3275108..3275181 gga 107
comp 3275289..3278214 23s 137
comp 3278352..3279858 16s 253 253
comp 3280112..3280690 CDS 193
comp 3303104..3304150 CDS 124 124 349 124
comp 3304275..3304459 riboswitch @4 96
comp 3304556..3304672 5s 11
comp 3304684..3304758 aca 116
comp 3304875..3307789 23s 196
comp 3307986..3309492 16s 364 *364
3309857..3310504 CDS 216
comp 3438683..3439531 CDS 142 142 283 142
comp 3439674..3439750 aga 7 7
comp 3439758..3439832 ggc 9 9
comp 3439842..3439918 gac 5 5
comp 3439924..3439999 gta 8 8
comp 3440008..3440082 gaa 5
comp 3440088..3440204 5s 40
comp 3440245..3443168 23s 112
comp 3443281..3443356 gca 109
comp 3443466..3444972 16s 138
comp 3445111..3445187 atgj + 13 13
comp 3445201..3445276 ttc 3 atg 6 6
comp 3445283..3445359 atc 2 cca 6 6
comp 3445366..3445442 cca 2 gga 31 31
comp 3445474..3445549 tgg 2 aac 11 11
comp 3445561..3445637 atgi 6 6
comp 3445644..3445720 cca 6 6
comp 3445727..3445817 agc 11 11
comp 3445829..3445917 tca 6 6
comp 3445924..3445999 aaa 12 12
comp 3446012..3446087 caa 6 6
comp 3446094..3446170 aga 19 19
comp 3446190..3446263 gga 11 11
comp 3446275..3446359 tac 4 4
comp 3446364..3446438 aca 4 4
comp 3446443..3446518 aac 31 31
comp 3446550..3446625 aac 16 16
comp 3446642..3446718 gac 5 5
comp 3446724..3446799 gta 6 6
comp 3446806..3446879 gga 9 9
comp 3446889..3446963 gaa 15 15
comp 3446979..3447054 atgf 13 13
comp 3447068..3447156 tta 5
comp 3447162..3447278 5s 213
comp 3447492..3450406 23s 196
comp 3450603..3452109 16s 239 239
comp 3452349..3452552 CDS 68
comp 3523330..3524046 CDS 129 129 239 129
comp 3524176..3524251 gta + 8 8
comp 3524260..3524334 gaa 2 fois 20 20
comp 3524355..3524430 aaa gta gaa aaa 10 10
comp 3524441..3524515 aca 10 10
comp 3524526..3524602 gac 7 7
comp 3524610..3524685 gta 9 9
comp 3524695..3524769 gaa 5 5
comp 3524775..3524850 aaa 289 289
3525140..3526039 CDS 300

psor cumuls

modifier
cumuls. Paeniclostridium sordellii AM370
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 0 1 0 1 0 100 9
16 23 5s 0 6 20 9 65 50 5 20 1 200 8
16 atc gca 0 40 0 6 100 4 40 3 300 13
16 23 5s a 2 60 0 0 150 10 60 1 400 4
max a 44 80 0 0 200 5 80 1 500 4
a doubles 2 100 0 0 250 5 100 3 600 1
autres 9 120 0 0 300 8 120 3 700 1
total aas 87 140 0 0 350 3 140 4 800 1
sans opérons 8 160 0 0 400 1 160 1 900 1
1 aa 6 180 0 0 450 4 180 2 1000 0
max a 8 200 0 0 500 0 200 0 1100 1
a doubles 1 0 0 1 3 1
total aas 17 9 71 46 22 44
total aas 104
remarques 4
avec jaune moyenne 9 10 206 119 304
variance 5 6 121 73 257
sans jaune moyenne 173 95 220
variance 90 45 121

psor tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de psor opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
psor	89			44			44			89
deb	fin		deb	fin		grand	petit		grand	petit
3	27		3	27		27	3		27	3
37	120		195	37		120	37		120	37
41	138		37	120		138	41		195	37
71	285		41	138		195	37		138	41
111	426		135	258		258	135		285	71
129	289		71	285		285	71		426	111
135	258		129	289		289	129		289	129
195	37		306	404		404	306		258	135
306	404		111	426		426	111		404	306
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
psor		3,368		18		12	4	2		8	4	4	8
‰						667	222	111		889	444	444	889

psor blocs

modifier
  • Lien tableur: psor blocs
  • Lien cdc blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, en gris dans cdc blocs.
  • Légende:
    - Les blocs sont rangés par type de I à IV pour les blocs 16s23s et de V à X pour les blocs 16sgca23s. Chaque bloc est noté par son type suivi d'un indice.
    - La 1ère partie du tableau représente la totalité des blocs; la 2ème les groupes où les blocs se suivent avec des intercalaires très faibles. Seul l'intercalaire séparant le bloc V2 de I4 est élevé et le plus grand du tableau, 525. Je considère qu'un intercalaire inférieur à 350 est faible relativement aux intercalaires intra bloc. Les intercalaires avec les CDS sont faibles ici puisque seulement 3 sont supérieurs à 350, 402 (I2), 431 (VI1) et 525 (I4). Voir le tableau des cumuls pour tout les intercalaires des cds où seulement 6 sur 46 dépassent 350, avec une moyenne de 173±90.
    - Les couleurs, rouge pour rRNA, vert pour une configuration peu courante, un gène tRNA entre 23s et 5s, et ribosw pour riboswitch. Le cyan pour repérer le même intercalaire par rapport à la direction 16s23s5s quand elle change quand on a des adresses complément.
  • Notes:
    - 3 blocs avec des tRNAs longs, 44 23 5, concentrant les 2/3 des tRNAs avec des blocs 16s23s. 15 tRNAs sont dans des blocs courts ou 16sgca23s. Les tRNAs extra blocs sont 17.
    - 10 blocs 16s23s contre 7 blocs 16sgca23s
    - Le regroupement des blocs par 3 et 2 concerne 10 blocs et restent donc 7 blocs solitaires, 3 sans tRNA et 4 avec 1 ou 2 tRNA.
    - Existence de 4 cds intra groupe de petite taille en aas, 84 138 64 pour le 2èmer groupe, et 94 pour le 4ème groupe.
    - Le 1er groupe de 3 blocs n'a pas de cds internes et est constitué de la duplication d'un même bloc.
    - Des intercalaires très faibles inter blocs
    - Des intercalaires intra blocs qui se répètent beaucoup mais peuvent être divisés ou multipliés par 2.
    - note du 25.3.21, 348' pour complement à cheval sur 2 adresses 348' et souligné pour dire que le cds est partagé entre 2 blocs.
intercalaire				Total
16s-23s	9*196	137			10
23s-5s	5*78	4*144	3*193	40	13
16s-gca	4*54	3*120			7
gca-23s	5*114	95	152		7
5s-aas	4*5 (tta)	5 (gaa)		5
C1. Paeniclostridium sordellii AM370, blocs à rRNA
I I2 I3 I4 II III IV IV1 IV2
CDS 124
CDS 245 ribosw 96
CDS 205 249 348' 525 253 40' 5s 12 5s 11 CDS 309 5
16s 196 196 196 196 196 78 gga 107 aca 116 16s 196 213
23s 78 78 78 144 144 194 23s 137 23s 196 23s 122 196
5s 85 402' 180 228 112' 276 16s 253 16s 364' 5s 5 239
CDS CDS CDS tta
V V2 VI VI1 VII VII1 VIII VIII1 IX X X1
CDS 276 264 CDS 431 CDS 189 gaa 5
16s 54 123 16s 54 16s 54 16s 54 16s 118 5s 40
gca 114 152 gca 114 gca 114 gca 114 gca 95 23s 112
23s 41 50 23s 193 23s 193 23s 78 23s 144 gca 109
gga 11 12 5s 5 5s 5 5s 100 5s 131 16s 138
5s 99' 109 tta 9 tta 9 CDS CDS atgj
CDS atgi 123 atgi 123
groupe1 groupe2 groupe3 groupe4
CDS 431 CDS 309 CDS 142 CDS 264
VI1 16s 54 IV1 16s 196 **4aas 8 V2 16s 123
gca 114 23s 122 gaa 5 gca 152
23s 193 5s 5 5s 40 23s 50
5s 5 tta 13 23s 112 gga 12
tta 9 **42aas 10 gca 109 5s 109
atgi 123 gta 162 X1 16s 138 CDS 525
VII1 16s 54 CDS 25 atgj 13 I4 16s 196
gca 114 CDS 249 **21aas 13 23s 144
23s 193 I2 16s 196 tta 5 5s 228
5s 5 23s 78 5s 213 CDS
tta 9 5s 402 23s 196
atgi 123 CDS 348 IV2 16s 239
VIII1 16s 54 I3 16s 196 CDS
gca 114 23s 78
23s 78 5s 180
5s 100 CDS
CDS

psor remarques

modifier
  • Lien tableur: psor remarques
  • Nombre de gènes protéines: 3327 (NCBI)
  • Rmarques @:
  1. - Un tRNA nommé other, non déterminé
  2. - cds de 62 aas, hp, à allure répétitive susceptible d'être créé par contrainte lors des conversions ou d'autres réparations: MWLFFLFFFLFFFLFFFFFLFFFLFFFFFLFFFFFFPIVVLQTEINFRYGYIYTIHSGIIF
  3. - une configuration rare 23s-aas-5s concerne 3 gga et 1 aca
  4. - Les RNAs non codants: riboswitch dans un bloc à rRNA et ncRNA dans un bloc sans rRNA, adresse 19421..19685.
  • Configuration des blocs: voir psor blocs.
  • Les séquences des doubles: Il y a très peu de doubles mais des duplications de séquences. Le signe + dans psor opérons indique les doubles.
    - séquence 44 aas: voir psor opérons, la couleur cyan pour la duplication de 20 aas et la couleur verte pour les insertions. Je n'ai pas pu distingué les 3 types d'atg dans 6 atg, qui certainement doivent être départagés en 2 atgf 2 atgj 2 atgi. Ce qui laisse 2 doubles aaa et gta.
    - séquence 23 aas: voir ci-dessous l'analogie de séquence entre 23 aas et le début de 44 aas. Seuls 3 aas ont des doubles cca gga aac, aucune séquence n'est dupliquée.
    - séquence 5 aas, c'est une petite séquence simple à la suite du blocs 23aas. Est-ce le fait d'être dans un bloc 416s-gca-23s?
    - séquence 8 aas: voir psor opérons, adresse 3523330..3524046, duplication de 3 aas. Est-ce que ça ne serait pas une séquence détachée d'un bloc 16s23s5s comme les 2 autres longs blocs.
23aas	tta atg gaa gga gta gac aac aac aca tac gga aga caa aaa tca   agc cca atg tgg cca atc   ttc atg
44aas	tta atg gaa gga gta gac aac     aca tac cta aga caa aaa tca                             ttc atg   atg cca cac - - - -

psor distribution

modifier
  • Lien tableur: psor distribution
  • Notes: tableau Cl12 blocs à de 3 tRNAs sauf
    - -5s: 3 gga et aca
    - 1-3 aas: 2 tta et 2 atgi
Cl1 psor, Paeniclostridium sordellii AM370. clostridia.
Cl11 psor. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc 1
atc acc 1 aac 1 agc 1
ctc ccc cac cgt
gtc gcc gac 1 ggc
tta tca taa tga 1
ata aca 2 aaa 2 aga
cta 2 cca caa cga
gta 2 gca gaa 2 gga
ttg 1 tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
psor 12 5* 17
Cl12 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 5 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 3 tgc 2
atc 1 acc aac 4 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 4 ggc 2
tta 5 tca 3 taa tga
ata aca 4 aaa 4 aga 4
cta 2 cca 4 caa 4 cga
gta 5 gca 7 gaa 4 gga 7
ttg tcg tag tgg 1
atgj 3 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
psor 4* 76* 7 87

psor. Intergen51

modifier

Intergen51. psor. Le génome

modifier
  • psor Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: psor, Paeniclostridium sordellii strain AM370 chromosome, NCBI [3], date 8.1.18.
  • psor La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
psor	450,598		3,550,458	12.7
psor données intercalaires
modifier
psor données intercalaires 200
modifier
psor autres intercalaires aas
modifier

Intergen51. psor. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. psor les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 psor les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,327 235 23 2,585 3.7 133 18 151
x 692 3 1 696 0 7 7
t 3,019 238 24 3,281 133 25 158
% 92.0 7.3 0.7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 12 0 0 12 1.7 tRNA-CDS 19 8
x 7 0 0 7 RNA-RNA 133 59
t 19 0 0 19 CDS-rRNA 25 11
% 100.0 0.0 0.0 non RNA 49 22
- total 226 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 5.6 8.3 0.4 32.0 8.3 33 0.9 0.0
x 9.1 14.3 33.3 9.5 0.0 33 0.1 0.0

Intergen51. psor. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: psor données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées psor fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. psor fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	psor
R2	x3		x2		x		c		Inflexion poly3	x	c
0.515	5.62E-07	-4.32E-04	-9.67E-03	39.1	fx1	abscisse	210.1	219.5
0.718	-5.50E-06	4.12E-03	-1.07E+00	103.0	fc1	ordonnée	22.1	16.3
								
0.636	-1.22E-06	7.69E-04	-2.40E-01	49.9	fx41			
0.926	3.28E-06	-2.16E-03	3.12E-01	17.2	fc41
  • Le rfin après 400 est de 131 sur un total de 2350. Jusqu'à 1% les freq10 sont en continu jusqu'à 740, reste 23. L'indice i.rfin1 = 108/340 = 0.318.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	psor		calculs			poly3	psor
effect	2350		R2.21	851		abscis	400
xm	45		pte	4,01		flexa	216
ym	3,99		cste	1,88		flexo	1,62
x1m	219		r400l	181		xm	45
y1m	1		restp	170,21		sup4	192,3
rfin	55,74		%sd	50,40		sup4t	448,9
bornf	180		lond	174		%	42,8
supd	227,4		%sf	51,45		long	171
supdt	451,1		lonf	135		R2	621
xmp	378,72		sf/lf	1,47			
r400	114,47		sr/lr	0,75			
supf	197,9		sd/ld	1,31			
supft	384,7		i.r400	0,63														

Intergen51. psor. Les CDS-CDS négatifs

modifier
Sous-totaux	psor			totale	
fréquence	x-	c-		x-	c-
 - 1		0	52		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		1	23		717	10938
 - 5		0	3		5	19
sp6		2	157		1642	8424
total		3	235		2,456	23,544
reste		1	1		264	420
s6		0	0		361	41
s7		0	27		321	1438
s8		1	129		696	6525
rappot s1-5						
4/2/1		-	0.4		8.4	2.6
% / sp6						
s6/sp6		0.0	0.0		22.0	0.5
s7/sp6		0.0	17.2		19.5	17.1
s8/sp6		50.0	82.2		42.4	77.5
reste/sp6	50.0	0.6		16.1	5.0
						
total s1-5	1	78		814	15120
% / total						
%s1-5		33.3	33.2		33.1	64.2
%sp6		66.7	66.8		66.9	35.8

Intergen51. psor. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		13			CDS 16s		11	3
16s 23s		10			5s CDS		7	4
16s tRNA	7			16 CDS			
tRNA 23s	7			CDS 5s			
5s tRNA		5			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	69			5s 16s			
tRNA hors	9			16s16s			
tRNA 16s	3						
23s tRNA	4						
tRNA 5s		4						
16s 5s								
5s 23s								
5s 5s								
total		133	0		total		18	7
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. psor. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 psor. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3 cont4
inter aa    inter aa    inter aa    inter aa
13 tta 9 gaa 7 aga 4 aca
15 atgf 6 gga 9 ggc 31 aac
9 gaa 5 gta 5 gac 16 aac
6 gga 16 gac 8 gta 5 gac
5 gta 4 aac ** gaa 6 gta
16 gac 4 aca 13 atgj 9 gga
4 aac 15 tac 6 ttc 15 gaa
4 aca 11 cta 6 atc 13 atgf
15 tac 13 ggc 31 cca ** tta
14 cta 7 aga 11 tgg
7 aga 11 caa 6 atgi hors
11 caa 6 aaa 6 cca 12 tgc
6 aaa 3 tca 11 agc 3 aac
3 tca 9 ttc 6 tca ** aca
9 ttc 8 atgj 12 aaa 8 gta
8 atgj 21 atgi 6 caa 20 gaa
21 atgi 6 cca 19 aga 10 aaa
6 cca 9 cac 11 gga 10 aca
4 cac 21 aaa 4 tac 7 gac
25 tgc 6 tgc 9 gta
13 tta 10 cgt 5 gaa
15 atgf ** gta ** aaa
-

Peptoclostridium difficile CD196

modifier

cdc opérons

modifier
  • Liens: gtRNAdb [4], NCBI [5], génome [orgn]
  • Lien tableur: cdc opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
C2 Peptoclostridium difficile CD196
28.6%GC 11.9.19 Paris  83   doubles intercal cds aa avec aa cdsa cdsd protéines
dir 9857..10630 cds 179 179 258 SigB/SigF/SigG family RNA polymerase sigma factor
dir 10810..12317 16s 52
dir 12370..12445 gca 249
dir 12695..15596 23s 111
dir 15708..15824 5s 126 126 126
dir 15951..16460 cds 170 transcription repressor NadR
dir 19402..19857 cds 0 0 152 0 nucleoside deaminase
dir 19858..19949 tcc 37
dir 19987..20251 ncRNA @1 76 76
dir 20328..21965 cds 546 DNA polymerase III subunit gamma/tau
comp 23419..24624 cds 505 *505 402 glycosyl transferase
dir 25130..26637 16s 279
dir 26917..29816 23s + 180
dir 29997..30113 5s 3 aaa 6
dir 30120..30194 aac 3 gta 6 6
dir 30201..30286 tta 15 15
dir 30302..30377 atgf 7 7
dir 30385..30459 gaa 9 9
dir 30469..30542 gga 5 5
dir 30548..30623 gta 5 5
dir 30629..30705 gac 9 9
dir 30715..30789 aca 14 14
dir 30804..30888 tac 8 8
dir 30897..30980 cta 29 29
dir 31010..31086 aga 7 7
dir 31094..31169 caa 88 88
dir 31258..31346 tca 3 3
dir 31350..31425 ttc 6 6
dir 31432..31508 atgj 11 11
dir 31520..31596 atgi 23 23
dir 31620..31696 cca 7 7
dir 31704..31780 cac 8 8
dir 31789..31864 aaa 7 7
dir 31872..31945 tgc 6 6
dir 31952..32026 aac 5 5
dir 32032..32117 tta 15 15
dir 32133..32208 atgf 7 7
dir 32216..32290 gaa 9 9
dir 32300..32373 gga 5 5
dir 32379..32454 gta 5 5
dir 32460..32536 gac 9 9
dir 32546..32620 aca 14 14
dir 32635..32719 tac 9 9
dir 32729..32812 cta 23 23
dir 32836..32910 ggc 24 24
dir 32935..33011 aga 9 9
dir 33021..33096 caa 8 8
dir 33105..33180 aaa 2 2
dir 33183..33271 tca 3 3
dir 33275..33350 ttc 6 6
dir 33357..33433 atgj 11 11
dir 33445..33521 atgi 17 17
dir 33539..33615 cac 8 8
dir 33624..33699 aaa 7 7
dir 33707..33780 tgc 7 7
dir 33788..33864 cgt 12 12
dir 33877..33952 gta 75 75 75
dir 34028..34441 cds 308 308 138 hp
dir 34750..38181 cds 1144 pyruvate carboxylase
dir 127011..127715 cds 281 281 235 N-acetylmuramoyl-L-alanine amidase CwlD
dir 127997..129505 16s 279
dir 129785..132685 23s + 131
dir 132817..132933 5s 2 cca 6
dir 132940..133014 aac 4 4
dir 133019..133093 gaa 5 5
dir 133099..133174 gta 5 5
dir 133180..133256 gac 10 10
dir 133267..133341 aca 14 14
dir 133356..133440 tac 9 9
dir 133450..133523 gga 10 10
dir 133534..133610 aga 9 9
dir 133620..133695 caa 11 11
dir 133707..133782 aaa 2 2
dir 133785..133873 tca 17 17
dir 133891..133981 agc 8 8
dir 133990..134066 cca 85 85
dir 134152..134227 tgg 60 60
dir 134288..134364 cca 6 6
dir 134371..134447 atc 3 3
dir 134451..134526 ttc 7 7
dir 134534..134610 atgj 114
dir 134725..136115 16s 68
dir 136184..136259 gca 271
dir 136531..139430 23s 126
dir 139557..139673 5s 213 213 213
comp 139887..141071 cds 372 *372 395 pyridoxal phosphate-dependent aminotransferase
dir 141444..143795 cds 21 21 784 anaerobic ribonucleoside triphosphate reductase
dir 143817..144356 cds 776 *776 180 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 145133..146640 16s 52
dir 146693..146768 gca 373
dir 147142..150041 23s 126
dir 150168..150284 5s 7 7
dir 150292..150366 aac 5 5
dir 150372..150457 tta 15 15
dir 150473..150548 atgf 7 7
dir 150556..150630 gaa 14 14
dir 150645..150718 gga 5 5
dir 150724..150799 gta 5 5
dir 150805..150881 gac 10 10
dir 150892..150966 ggc 9 9
dir 150976..151049 aga 975 *975
dir 152025..152864 cds 280 TIGR00159 family protein
dir 378341..380728 cds 583 *583 796 cadmium-translocating P-type ATPase
dir 381312..382819 16s 311
dir 383131..386030 23s 126
dir 386157..386273 5s 177 177 177
dir 386451..387059 cds 203 DedA family protein
comp 833130..833894 cds 258 258 255 DeoR/GlpR transcriptional regulator
dir 834153..834243 agc 87 87 87
dir 834331..835119 cds 263 flagellar motor protein
dir 1089165..1090139 cds 239 239 325 239 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1090379..1091886 16s 320
dir 1092207..1095106 23s 91
dir 1095198..1095271 gga @2 8
dir 1095280..1095396 5s 273 273
dir 1095670..1097688 cds 673 N-acetylmuramoyl-L-alanine amidase
comp 1181549..1182958 cds 1374 *1374 470 MBOAT family protein
comp 1184333..1184415 ttg 318 318 318
dir 1184734..1187382 cds 883 DNA polymerase I
dir 1835768..1837498 cds 109 109 577 109 Na+/H+ antiporter NhaC family protein
dir 1837608..1837688 cta 231 231
<dir 1837920..1838093 cds 58 HXXEE domain-containing protein
dir 2981767..2982444 cds 159 159 226 159 sortase SrtB
comp 2982604..2982678 aca @3 94
comp 2982773..2985672 23s 184
comp 2985857..2987364 16s 340 340
dir 2987705..2988643 cds 313 delta-lactam-biosynthetic de-N-acetylase
comp 3787361..3788431 cds 454 *454 357 ABC transporter ATP-binding protein
comp 3788886..3789002 5s 126
comp 3789129..3792028 23s 281
comp 3792310..3793817 16s 191 191 191
comp 3794009..3794587 cds 193 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 3944262..3944453 cds 119 119 64 119 DUF378 domain-containing protein
comp 3944573..3944689 5s 126
comp 3944816..3947715 23s 217
comp 3947933..3949440 16s 282 282
comp 3949723..3950004 cds 221 221 94 hp
comp 3950226..3951755 cds 510 lysine--tRNA ligase
dir 4084445..4085437 cds 382 *382 331 DNA replication protein DnaC
comp 4085820..4085894 aca 33
comp 4085928..4086003 gta 4
comp 4086008..4086082 gaa 6
comp 4086089..4086164 aaa 326 326 326
comp 4086491..4087780 cds 430 adenylosuccinate synthase

cdc cumuls

modifier
cumuls. Peptoclostridium difficile CD196
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 0 1 1 1 1 100 3
16 23 5s 0 3 20 2 61 50 1 20 0 200 5
16 gca 235 3 40 1 4 100 3 40 0 300 7
16 23 5s a 2 60 1 150 3 60 0 400 5
max a 43 80 0 200 4 80 1 500 3
a doubles 2 100 2 250 4 100 1 600 3
autres 2 120 0 300 4 120 2 700 1
total aas 75 140 0 350 4 140 1 800 2
sans opérons 5 160 0 400 2 160 1 900 1
1 aa 4 180 0 450 0 180 1 1000 0
max a 4 200 0 500 1 200 1 1100 0
a doubles 0 0 5 4 1
total aas 8 3 68 32 13 31
total aas 83
remarques 3
avec jaune moyenne 14 12 313 165 378
variance 15 283 94 259
sans jaune moyenne 9 206 286
variance 5 107 144

cdc tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de cdc opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc	40			40			20			60
deb	fin		deb	fin		grand	petit		grand	petit
0	37		0	37		37	0		37	0
109	231		258	87		231	109		258	87
258	87		109	231		258	87		231	109
382	326		1374	318		382	326		1374	318
1374	318		382	326		1374	318		382	326
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
cdc		3,614		10		4	4	1	1	2	2	1	3
cdc ‰						400	400	100	100	400	400	200	600

cdc blocs

modifier
  • Lien tableur: cdc blocs
  • Lien psor blocs: le tabeau de cdc blocs est à comparer à celui de psor pour les types manquants, ici en gris.
  • Légende: voir psor blocs.
  • Notes:
    - cdc a perdu 3 blocs de type I, 16s23s5s sans tRNAs; les 2 blocs de type V, 16s-gca-23sgga5s et les 2 blocs 16s-gca-23s5s-2aas de type VI et VII. Soit la moitié des blocs courts, 7 sur 14, et plus de la moitié des blocs 16s-gca, 4 sur 7. Les 3 blocs longs sont maintenus mais modifiés.
C2. cdc blocs
groupes types absents            
cds 281 I II III IV IV1 IV2
IV2 16s 279
23s 131 CDS 583 454 119 cds 239
5s 6 16s 311 126 126 16s 320 cds 159 cds 505 281
aac 4 23s 126 281 217 23s 91 aca 94 16s 279 279
**16aas 3 5s 177 191 282 gga 8 23s 184 23s 180 131
ttc 7 CDS 5s 273 16s 340 5s 6 6
atgj 114 cds cds aac 6 4
VIII1 16s 68
gca 271 V V2 VI VI1 VII VII1
23s 126
5s 213
cds 372
cds 21 VIII VIII1 IX X X1
cds 776 cds 21
X1 16s 52 atgj 114 cds 179 cds 776
gca 373 16s 68 16s 52 16s 52
23s 126 gca 271 gca 249 gca 373
5s 7 23s 126 23s 111 23s 126
aac 5 5s 213 5s 126 5s 7
**7aas 9 cds 372 cds aac 5
aga 975
cds

cdc psor

modifier
  • Lien tableur: cdc psor
  • Comparaison bsu-lmo: Les séquences, les cumuls.
  • Légende:
    - La couleur cyan pour les différents entre cdc et psor; bois pour les identiques entre les clusters 43aas et 18aas de cdc d'une part et les clusters 44aas et 23aas de psor. Le gène aaa du cluster 18aas de cdc a son identique dans la 2ème partie du cluster 43aas et non dans la 1ère partie, car la duplication n'est pas exacte.
    - Le bleu pour des intercalaires exceptionnels.
    - Les blocs 16s indiquent des rRNAs de bordure, l'équivalent d'un cds.
    - Le jaune pour la conservation des cds: je ne l'ai appliqué ici qu'aux petits clusters sans rRNAs; Comparer les cumuls des intercalaires et protéines des cds de cdc et psor montre clairement que les clusters soit, sont très mobiles ou bien qu'il y a de nombreuses recombinansons entre le cluster et ses cds. Le jaune indique ici des intercalaires et des protéines presque identiques.
    - Les bordures très épaisses noires encadrent les 7 gènes du cluster 9aas identiques dans les duplicata du 43aas, comparaison cdc-cdc. Les bordures très épaisses bleues encadrent les 4 gènes du cluster 9aas de cdc et ceux du 23aas de psor, comparaison cdc-psor.
  • Notes:
    - Les 3 blocs longs de cdc commencent tous par aac. Chez psor 2 blocs longs et 2 courts commencent par tta et 1 bloc long gca commence par gaa.
    - Le jaune encadré montre que le cluster cta conservé dans cdc est celui ayant une protéine identique, 58 contre 62 aas dans psor. Or dans psor ce cluster présente des répétitions caractéristiques des contraintes imposées aux réparations.
    - Les fréquences des différences entre intercalaires (diff) sont reportées dans le dernier tableau C24 et sont établies sur la plage des différences entre intercalaires cdc et psor du tableau C21 pour des couples identiques. 16% des différences sont nulles (8 sur 49) et 50% ne dépassent pas 2 paires de bases. Ces résultats sont à mettre en parallèle avec ceux de la omparaison bsu-lmo, avec les séquences et les cumuls. La faible variabilité des intercalaires cdc-psor par rapport à bsu-lmo est due à leur plus grande filiation, niveau genre contre le niveau famille pour bsu-lmo.
C2. Comparaison cdc-psor
C21. Comparaison cdc-psor
cdc intercal psor intercal diff
cds 505 cds 309
16s 279 16s 196
23s 180 23s 122
5s 6 5s 5
aac 6 tta 13
tta 15 atg 15 -2
atgf 7 gaa 9 8
gaa 9 gga 6 0
gga 5 gta 5 1
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 8 tac 15 7
cta 29 cta 14 -15
aga 7 aga 7 0
caa 88 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 23 atg 8 -3
cca 7 atg 21 -2
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 5 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 23 cta 11 -12
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds
cds 776
16s 52
gca 373
23s 126
5s 7 atg 138
aac 5 16s 109
tta 15 gca 112
atgf 7 23s 40
gaa 14 5s 5
gga 5 gaa 8
gta 5 gta 5 0
gac 10 gac 9 -1
ggc 9 ggc 7 -2
aga 975 aga 142
cds cds
cds 281 cds 239
16s 279 16s 196
23s 131 23s 213
5s 6 5s 5
aac 4 tta 13
gaa 5 atg 15
gta 5 gaa 9
gac 10 gga 6
aca 14 gta 5
tac 9 gac 16
gga 10 aac 31
aga 9 aac 4
caa 11 aca 4 -10
aaa 2 tac 11 2
tca 17 gga 19 9
agc 8 aga 6 -3
cca 85 caa 12 1
tgg 60 aaa 6 4
cca 6 tca 11 -6
atc 3 agc 6 -2
ttc 7 cca 6
atgj 114 atg 11
16s tgg 31 -29
cca 6 0
atc 6 3
ttc 13 6
atg 138
16s
cds 129
gta 8
gaa 20
aaa 10
cds 382 aca 10
aca 33 gac 7
gta 4 gta 9 5
gaa 6 gaa 5 -1
aaa 326 aaa 289
cds cds
C22. Comparaisons internes
cdc intercal cdc intercal diff
cds 505 cds 281
16s 279 16s 279
23s 180 23s 131
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5
gaa 9 gac 10
gga 5 aca 14
gta 5 tac 9 0
gac 9 gga 10 1
aca 14 aga 9 0
tac 8 caa 11
cta 29 aaa 2
aga 7 tca 17 2
caa 88 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 6
atgi 23 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 7 16s
tgc 6 cds 776
aac 5 16s 52
tta 15 gca 373
atgf 7 23s 126
gaa 9 5s 7
gga 5 aac 5
gta 5 tta 15 0
gac 9 atgf 7 1
aca 14 gaa 14 0
tac 9 gga 5
cta 23 gta 5
ggc 24 gac 10
aga 9 ggc 9 0
caa 8 aga 975 3
aaa 2 cds 0
tca 3
ttc 6
atgj 11
atgi 17
cac 8
aaa 7
tgc 7
cgt 12
gta 75
cds
psor psor intercal diff
cds 309 cds 239
16s 196 16s 196
23s 122 23s 213
5s 5 5s 5
tta 13 tta 13 0
atg 15 atg 15 0
gaa 9 gaa 9 0
gga 6 gga 6 0
gta 5 gta 5 0
gac 16 gac 16 0
aac 4 aac 31
aca 4 aac 4
tac 15 aca 4 0
cta 14 tac 11 -4
aga 7 cta 19 5
caa 11 aga 6 -1
aaa 6 caa 12 1
tca 3 aaa 6 0
ttc 9 tca 11
atg 8 agc 6
atg 21 cca 6
cca 6 atg 11
cac 4 tgg 31
tgc 25 cca 6
tta 13 atc 6 0
atg 15 ttc 13 0
gaa 9 atg 138 0
gga 6 16s 0
gta 5 atg 138 0
gac 16 16s 109 0
aac 4 gca 112
aca 4 23s 40 0
tac 15 5s 5
cta 11 gaa 8
ggc 13 gta 5
aga 7 gac 9 -1
caa 11 ggc 7 1
aaa 6 aga 142 0
tca 3 cds
ttc 9
atg 8
atg 21
cca 6
cac 9
aaa 21
tgc 6
cgt 10
gta 162
cds
C23. Conservation des cds
cdc intercal psor intercal protéines
cds 0 cds 3 151 – 152
tcc 37 tcc 27
ncRNA 76 ncRNA 152 547 – 546
cds cds
cds 1374 cds 41 470 – 1177
ttg 318 ttg 138 883 – 881
cds cds
cds 109 cds 111 577 – 1076
cta 231 cta 426
cds cds 58 – 577
cds 258 cds 37 255 – 302
agc 87 agc 120
cds cds 263 – 100
cds 306 62
cta 404
cds 422
cds 135
other 258
cds
cds 195
tga 37
cds
cds 71
tgc 12
aac 3
aca 285
cds
C24. Fréquence des différences des intercalaires
gamme fréquence
-15 2
-14
-13
-12 1
-11 1
-10 3
-9
-8
-7
-6 1
-5
-4
-3 3
-2 7
-1 4
0 8
1 4
2 1
3 4
4 2
5 1
6 2
7 1
8 2
9 1
10
11
12
13
14 1
15
total 49
sous t. -2+2 24

cdc remarques

modifier
  • Nombre de gènes protéines: cdc 3615, psor 3327 (NCBI)
  • Comparaison bsu-lmo: Les séquences, les cumuls. bsu-lmo nouveau
  • Rmarques @: On retrouve une partie des remarques de psor
  1. - Les RNAs non codants: seul le bloc cds-tcc-ncRNA-cds est maintenu.
  2. - Une configuration rare 23s-gga-5s complète au lieu de 3.
  3. - La configuration 16s23s-aca-5s-riboswitch perd 5s-riboswitch et devient 16s23s-aca.
  • Comparaison cdc-psor
    1. Les blocs à rRNAs: Les blocs disparaissent au moment des divisions et ce sont les non protégés par des séquences de tRNAs qui disparaissent en 1er. 7 clusters simples disparaissent et les groupes se défont.
    2. Les séquences longues:
      • Comparaison entre les 2 génomes, cdc-psor: Très peu de modifications, plutôt des mutations que des recombinaisons et encore moins des créations. Le cas de la disparition de aaa qui apparaît dans un intercalaire est emblématique.
      • Comparaisons intra génome, cdc-cdc et psor-psor. Là les remaniements sont légions et puissants: duplication de 20 tRNAs d'un seul coup, recombinaisons par lots ou tRNA par tRNA.
  • Comparaison clostridia-bacilli entre cdc-psor et bsu-lmo: la comparaison est saisissante et on arrive à repérer une recombinaison après division, celle de 16s23s5s en 16s-atcgca-23s5s entre bsu et lmo. La mutation de cta en ctg, entre génome, qui conserve la longueur du tRNA, ainsi que la agc en tcc dans le petit bloc aac-**-gaa en intra.
    - Seuls les clostridia présentent des cds dans les groupes, les bacilli non. Les autres génomes de clostridia (voir fiche) présentent beaucoup de cds dans les clusters alors que les bacilli (fiche) jamais.
  • Conclusion: Tout se passe comme si le processus se déroulait d'un seul coup dans un génome, en dehors de la division. Puis pendant la 1ère division et les divisions suivantes certains clusters disparaissent facilement alors que se produisent quelques rares mutations et recombinaisons. C'est avant tout un processus de création ordonné donnant des séquences qui peuvent se dupliquer et se recombiner. Les séquences de tRNA stabilisent et maintiennent les blocs de rRNAs, un seul cluster à 6 tRNAs disparaît entre bsu et lmo, et aucun entre cdc et psor.

cdc distribution

modifier
Cl2 cdc, Peptoclostridium difficile CD196. clostridia.
Cl21 cdc. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac agc 1
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca caa cga
gta 1 gca gaa 1 gga
ttg 1 tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc 4 4* 8
Cl22 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 2 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 3 tgc 2
atc 1 acc 2 aac 2 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 4 ggc 2
tta 3 tca 3 taa tga
ata aca 4 aaa 4 aga 4
cta 2 cca 3 caa 3 cga
gta 5 gca 3 gaa 4 gga 5
ttg tcg tag tgg 1
atgj 3 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc 2* 70 3 75

cdc. Intergen51

modifier

Intergen51. cdc. Le génome

modifier
  • cdc Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: cdc, Clostridioides difficile CD196, NCBI [6], date 6.2.22.
  • cdc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cdc	636,447		4,110,554	15.5	
cdc données intercalaires
modifier
cdc données intercalaires 200
modifier
cdc autres intercalaires aas
modifier

Intergen51. cdc. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cdc les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cdc les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,552 296 37 2,885 4.5 98 12 110
x 640 2 0 642 0 3 3
t 3,192 298 37 3,527 98 15 113
% 90.5 8.4 1.0
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 8 0 1 9 2.3 tRNA-CDS 13 5
x 4 0 0 4 RNA-RNA 98 35
t 12 0 1 13 CDS-rRNA 15 5
% 92.3 0.0 7.7 non RNA 156 55
- total 282 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 9.5 22.2 1.7 29.5 0.0 35 1.3 11.1
x 19.5 0.0 50.0 0.5 0.0 50 0.0 0.0

Intergen51. cdc. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cdc données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cdc fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cdc
R2	x3		x2		x		c		Inflexion poly3	x	c
0.718	2.24E-06	-2.16E-03	5.54E-01	11.8	fx1	abscisse	286.2	430.8
0.844	-6.73E-06	5.06E-03	-1.22E+00	105.0	fc1	ordonnée	21.4	4.3
								
0.670	3.89E-06	-3.34E-03	8.06E-01	-26.9	fx41			
0.903	-2.77E-07	3.58E-04	-1.86E-01	40.1	fc41
  • Le rfin après 400 est de 246 sur un total de 2589 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 25 . L'indice i.rfin1 = 221/510=0.433.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cdc		calculs			poly3	cdc
effect	2589		R2.21	860		abscis	250
xm	45		pte	11,42		flexa	138
ym	8		cste	3,60		flexo	2,06
x1m	228		r400l	172		xm	45
y1m	1		restp	241,41		sup4	70,1
rfin	95,02		%sd	18,48		sup4t	248,7
bornf	137		lond	183		%	28,2
supd	71,2		%sf	16,90		long	93
supdt	385,5		lonf	92		R2	347
xmp	373,12		sf/lf	0,45			
r400	146,39		sr/lr	0,33			
supf	41,6		sd/ld	0,39			
supft	246,0		i.r400	0,85										

Intergen51. cdc. Les CDS-CDS négatifs

modifier
Sous-totaux	cdc			totale	
fréquence	x-	c-		x-	c-
 - 1		0	59		4	4140
 - 2		0	0		85	11
 - 3		0	1		3	12
 - 4		1	44		717	10938
 - 5		0	0		5	19
sp6		1	192		1642	8424
total		2	296		2,456	23,544
reste		1	5		264	420
s6		0	1		361	41
s7		0	32		321	1438
s8		0	154		696	6525
rappot s1-5						
4/2/1		-	0.7		8.4	2.6
% / sp6						
s6/sp6		0.0	0.5		22.0	0.5
s7/sp6		0.0	16.7		19.5	17.1
s8/sp6		0.0	80.2		42.4	77.5
reste/sp6	100.0	2.6		16.1	5.0
						
total s1-5	1	104		814	15120
% / total						
%s1-5		50.0	35.1		33.1	64.2
%sp6		50.0	64.9		66.9	35.8

Intergen51. cdc. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		8			CDS 16s		7	2
16s 23s		7			5s CDS		5	1
16s tRNA	3			16 CDS			
tRNA 23s	3			CDS 5s			
5s tRNA		3			23s CDS			
tRNA in					CDS 23s			
tRNA contig	67			5s 16s			
tRNA hors	3			16s16s			
tRNA 16s	1						
23s tRNA	2						
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		98	0		total		12	3
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cdc. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cdc. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3 cont5
inter aa    inter aa    inter aa    inter aa
6 aac 5 aac 8 cac 6 cca
15 tta 15 tta 7 aaa 3 atc
7 atgf 7 atgf 7 tgc 7 ttc
9 gaa 9 gaa 12 cgt ** atgj
5 gga 5 gga ** gta 5 aac
5 gta 5 gta cont4 15 tta
9 gac 9 gac 4 aac 7 atgf
14 aca 14 aca 5 gaa 14 gaa
8 tac 9 tac 5 gta 5 gga
29 cta 23 cta 10 gac 5 gta
7 aga 24 ggc 14 aca 10 gac
88 caa 9 aga 9 tac 9 ggc
3 tca 8 caa 10 gga ** aga
6 ttc 2 aaa 9 aga
14 atgj 3 tca 11 caa
23 atgi 6 ttc 2 aaa hors
7 cca 14 atgj 17 tca 33 aca
8 cac 17 atgi 8 agc 4 gta
7 aaa 85 cca 6 gaa
6 tgc 60 tgg ** aaa
-

Peptoclostridium difficile M68

modifier

cdc8 opérons

modifier
  • Liens data bases: gtRNAdb [7], NCBI [8], génome [9]
  • Lien tableur: cdc8 opérons
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales;Peptostreptococcaceae; Clostridioides.
  • Liens internes: noms abrégéscdc8 remarquescdc8 cumuls
  • Légende: voir cdc8 cumuls pour cdsa: cds en pbs, cdsd: cds dirigé; voir cdc8 remarques pour @ et +
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: tRNA dupliqué dans le cluster 43aas (4306341).
    - cca: tRNA non dupliqué dans le cluster 43aas (4306341), ou remarques @2 et @3.
    - 554: voir cdc8 cumuls, veut dire sans jaune, exclu de la moyenne.
C3 Peptoclostridium difficile M68
28.6%GC 11.9.19 Paris  110  doubles intercal cds aa avec aa cdsa cdsd protéines
dir 4299490..4300134 cds 214 214 645 tyrosine-type recombinase/integrase
dir 4300349..4300807 cds @1 554 554 459 helix-turn-helix domain-containing protein
dir 4301362..4303101 cds 0 0 1740 hypothetical protein
dir 4303102..4303305 cds 167 167 204 hp
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s + 6 117
dir 4304555..4304629 aac 4 4 75
dir 4304634..4304708 gaa 2 cca 5 5 75
dir 4304714..4304789 gta 5 5 76
dir 4304795..4304871 gac 11 11 77
dir 4304883..4304957 aca 14 14 75
dir 4304972..4305056 tac 9 9 85
dir 4305066..4305139 gga 10 10 74
dir 4305150..4305226 aga 9 9 77
dir 4305236..4305311 caa 11 11 76
dir 4305323..4305398 aaa 2 2 76
dir 4305401..4305489 tca 18 18 89
dir 4305508..4305598 agc 8 8 91
dir 4305607..4305683 cca 85 85 77
dir 4305769..4305844 tgg 60 60 76
dir 4305905..4305981 cca 5 5 77
dir 4305987..4306063 atc 3 3 77
dir 4306067..4306142 ttc 7 7 76
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 0 1198 0
dir 4307539..4308225 cds 100 100 687 xylose isomerase
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac + 6 6 75
dir 1182..1267 tta 3 aaa 15 15 86
dir 1283..1358 atgf 3 gta 7 7 76
dir 1366..1440 gaa 9 9 75
dir 1450..1523 gga 5 5 74
dir 1529..1604 gta 5 5 76
dir 1610..1686 gac 9 9 77
dir 1696..1770 aca 14 14 75
dir 1785..1869 tac 10 10 85
dir 1880..1963 cta 28 28 84
dir 1992..2068 aga 7 7 77
dir 2076..2151 caa 89 89 76
dir 2241..2329 tca 3 3 89
dir 2333..2408 ttc 6 6 76
dir 2415..2491 atgj 11 11 77
dir 2503..2579 atgi 29 29 77
dir 2609..2685 cca 7 7 77
dir 2693..2769 cac 8 8 77
dir 2778..2853 aaa 7 7 76
dir 2861..2934 tgc 6 6 74
dir 2941..3015 aac 6 6 75
dir 3022..3107 tta 15 15 86
dir 3123..3198 atgf 7 7 76
dir 3206..3280 gaa 9 9 75
dir 3290..3363 gga 5 5 74
dir 3369..3444 gta 5 5 76
dir 3450..3526 gac 9 9 77
dir 3536..3610 aca 14 14 75
dir 3625..3709 tac 9 9 85
dir 3719..3802 cta 24 24 84
dir 3827..3901 ggc 24 24 75
dir 3926..4002 aga 9 9 77
dir 4012..4087 caa 8 8 76
dir 4096..4171 aaa 2 2 76
dir 4174..4262 tca 3 3 89
dir 4266..4341 ttc 6 6 76
dir 4348..4424 atgj 11 11 77
dir 4436..4512 atgi 17 17 77
dir 4530..4606 cac 8 8 77
dir 4615..4690 aaa 7 7 76
dir 4698..4771 tgc 7 7 74
dir 4779..4855 cgt 12 12 77
dir 4868..4943 gta 75 75 76 75
dir 5019..5432 cds 308 308 414 hp
dir 5741..9172 cds 3432 pyruvate carboxylase
dir 94032..94736 cds 281 281 705 281 N-acetylmuramoyl-L-alanine amidase CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 6 75
dir 97945..98030 tta 15 15 86
dir 98046..98121 atgf 7 7 76
dir 98129..98203 gaa 8 8 75
dir 98212..98285 gga 4 4 74
dir 98290..98365 gta 5 5 76
dir 98371..98447 gac 10 10 77
dir 98458..98532 ggc 9 9 75
dir 98542..98615 aga 954 954 74
dir 99570..100409 cds 840 TIGR00159 family protein
dir 306829..309216 cds 733 733 2388 cadmium-translocating P-type ATPase
<> comp 309950..310076 cds 1 1 127 1 glycine/sarcosine/betaine reductase complex selenoprotein A
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 177 117
dir 311734..312342 cds 609 DedA family protein
comp 861856..862620 cds 258 258 765 DeoR/GlpR transcriptional regulator
dir 862879..862969 agc 87 87 91 87
dir 863057..863845 cds 789 flagellar motor protein
dir 1106477..1107451 cds 238 238 975 238 Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
dir 1107690..1109197 16s @2 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 273 117
dir 1112980..1114998 cds 2019 N-acetylmuramoyl-L-alanine amidase
comp 1196804..1198213 cds 1378 1378 1410 MBOAT family protein
comp 1199592..1199674 ttg 318 318 83 318
dir 1199993..1202641 cds 2649 DNA polymerase I
dir 1850896..1852626 cds 109 109 1731 109 Na+/H+ antiporter NhaC family protein
dir 1852736..1852816 cta 334 334 81
dir 1853151..1853666 cds 516 HXXEE domain-containing protein
dir 3024038..3024715 cds 150 150 678 150 sortase SrtB
comp 3024866..3024940 aca @3 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 374 1508
dir 3030000..3030938 cds 939 delta-lactam-biosynthetic de-N-acetylase
dir 3805298..3806743 cds 208 208 1446 tyrosine-type recombinase/integrase
comp 3806952..3807028 agg 61 61 77 61
<comp 3807090..3808790 cds 1701 formate dehydrogenase subunit alpha
comp 3875816..3876886 cds 452 452 1071 ABC transporter ATP-binding protein
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 190 1508 190
comp 3882440..3883018 cds 579 bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
comp 4017523..4017714 cds 118 118 192 118 DUF378 domain-containing protein
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 292 1508
comp 4023097..4023378 cds 221 221 282 hp
comp 4023600..4025129 cds 1530 lysine--tRNA ligase
dir 4135881..4136873 cds 383 383 993 DNA replication protein DnaC
comp 4137257..4137331 aca 33 33 75
comp 4137365..4137440 gta 4 4 76
comp 4137445..4137519 gaa 6 6 75
comp 4137526..4137601 aaa 331 331 76 331
comp 4137933..4139222 cds 1290 adenylosuccinate synthase
dir 4178197..4178970 cds 179 179 774 SigB/SigF/SigG family RNA polymerase sigma factor
dir 4179150..4180587 16s 161 1438
comp 4180749..4180865 5s 201 117
comp 4181067..4183959 23s 217 2893
comp 4184177..4185684 16s 108 1508
comp 4185793..4185869 atgi 11 11 77
comp 4185881..4185969 tta 5 89
comp 4185975..4186091 5s 201 117
comp 4186293..4189192 23s 375 2900
comp 4189568..4189643 gca 52 76
comp 4189696..4190959 16s’ @4 100 1264
dir 4191060..4192225 16s’ 52 1166
dir 4192278..4192353 gca 248 76
dir 4192602..4193197 23s° 100 596
dir 4193298..4193874 16s° 321 577
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 127 117 127
dir 4201964..4202473 cds 510 transcription repressor NadR
dir 4205417..4205872 cds 0 0 456 0 nucleoside deaminase
dir 4205873..4205964 tcc @5 37 92
dir 4206002..4206266 ncRNA 76 76 265
dir 4206343..4207980 cds 1638 DNA polymerase III subunit gamma/tau
comp 4209435..4210639 cds 496 496 1205 glycosyl transferase
4211136..4212643 16s 321 1508
4212965..4213127 23s° 100 100 163 100
<>comp 4213228..4213849 cds 111 622 CHAP domain-containing protein
comp 4213961..4214620 cds 228 228 660 228 type A-1 chloramphenicol O-acetyltransferase
dir 4214849..4216199 16s 321 1351
dir 4216521..4217008 23s° 101 488
comp 4217110..4218529 23s° 250 1420
comp 4218780..4218855 gca 52 76
comp 4218908..4219471 16s° 100 564
comp 4219572..4219856 23s° 217 285
comp 4220074..4221581 16s 179 179 1508 179
>comp 4221761..4222206 cds 386 386 446 386 B/F/G family RNA polymerase sigma-70 factor
dir 4222593..4224100 16s 321 1508
dir 4224422..4227321 23s 181 2900
dir 4227503..4227619 5s 6 117
dir 4227626..4227700 aac 6 6 75
dir 4227707..4227792 tta 15 15 86
dir 4227808..4227883 atgf 7 7 76
dir 4227891..4227965 gaa 9 9 75
dir 4227975..4228048 gga 5 5 74
dir 4228054..4228129 gta 5 5 76
dir 4228135..4228211 gac 9 9 77
dir 4228221..4228295 aca 14 14 75
dir 4228310..4228394 tac 10 10 85
dir 4228405..4228488 cta 28 28 84
dir 4228517..4228593 aga 7 7 77
dir 4228601..4228676 caa 89 89 76
dir 4228766..4228854 tca 3 3 89
dir 4228858..4228933 ttc 6 6 76
dir 4228940..4229016 atgj 11 11 77
dir 4229028..4229104 atgi 29 29 77
dir 4229134..4229210 cca 7 7 77
dir 4229218..4229294 cac 8 8 77
dir 4229303..4229378 aaa 353 76
comp 4229732..4229848 5s 126 117
comp 4229975..4232010 23s' 582 2036
dir 4232593..4234098 16s @6 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 216 117 216
comp 4237675..4238859 cds 372 372 1185 pyridoxal phosphate-dependent aminotransferase
dir 4239232..4241583 cds 21 21 2352 anaerobic ribonucleoside triphosphate reductase
dir 4241605..4242144 cds 778 778 540 anaerobic ribonucleoside-triphosphate reductase activating protein
dir 4242923..4244459 16s @7 261 1537
dir 4244721..4247619 23s 201 2899
dir 4247821..4247937 5s 5 117
dir 4247943..4248031 tta 11 11 89
dir 4248043..4248119 atgi 108 77
dir 4248228..4249735 16s 184 1508
dir 4249920..4250564 23s° 100 100 645 100
<dir 4250665..4250923 cds 112 112 259 112 hp
comp 4251036..4253145 23s’ 375 2110
comp 4253521..4253596 gca 52 76
comp 4253649..4254226 16s° 282 282 578
dir 4254509..4254712 cds 12 12 204 hp
dir 4254725..4256002 cds 1278 phage portal protein

cdc8 cumuls

modifier
  • Lien tableur: cdc8 cumuls
  • Liens internes: cdc8 opérons
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici. C'est le cdsa de cdc8 opérons divisé par 3.
    -  1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cdc8 opérons.
C3. cumuls. Peptoclostridium difficile M68
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 21 1 0 1 4 1 3 100 6
16 23 5s 0 4 20 2 77 50 2 20 0 200 8
16 gca 235 2 40 1 6 100 7 40 0 300 11
16 23 5s a 5 60 0 150 5 60 0 400 5
max a 43 80 1 200 5 80 2 500 5
a doubles 2 100 3 250 6 100 3 600 5
autres 10 120 0 300 5 120 3 700 1
total aas 98 140 0 350 4 140 1 800 1
sans opérons 6 160 0 400 4 160 1 900 1
1 aa 5 180 0 450 0 180 1 1000 0
max a 4 200 0 500 2 200 1 1100 0
a doubles 0 0 4 7 1
total aas 9 3 87 48 22 44
total aas 108
remarques 7
avec jaune moyenne 14 13 256 155 330
variance 16 252 109 234
sans jaune moyenne 10 182 208
variance 6 117 97

cdc8 tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de cdc8 opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
cdc8	33			50			17			67
deb	fin		deb	fin		grand	petit		grand	petit
0	37		0	37		37	0		37	0
109	334		208	61		208	61		208	61
208	61		258	87		258	87		258	87
258	87		1378	318		334	109		334	109
383	331		383	331		383	331		1378	318
1378	318		109	334		1378	318		383	331
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
cdc8		3,831		12		5	5	1	1	2	3	1	4
‰						417	417	83	83	333	500	167	667

cdc8 blocs

modifier
  • Lien tableur: cdc8 blocs
  • Lien cdc blocs: La colonne "Bloc type" de cdc8 blocs correspond aux types définis dans cdc blocs.
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: remarques @2 et @3.
  • Notes:
    - Je définis le type de bloc en comparant avec un bloc de cdc_bloc ayant approximativement les mêmes intercalaires et quand c'est possible les tRNAs identiques qui l'accompagnent. L'identification des tRNAs est faite dans la comparaison entre cdc et cdc 8 dans 43aas, 18aas et 9aas.
    - Les groupes de clusters. Un groupe de cluster à rRNA, et ici avec les débris de rRNA aussi, est un ensemble de rRNAs espacés de tRNAs et de cds par des intercalaires faibles, inférieurs à 778 pbs ici. Les 2 intercalaires des cds terminaux peuvent être très élevés, indiquant que le cds n'est pas sous l'influence de la conversion appliquée au cluster. Au total cdc8 a 9 groupes dont 6 avec un seul bloc, et 3 avec plus de 2 comprenant la quasi totalité des rRNAs, 40/46.
    1. Les solitaires, 6 dont 5 bien typés, I2 I3 II III et X1.
    2. Le groupe à 2 blocs, IV1 et IV2 bien typés.
    3. Le groupe à 15 rRNAs dans lequel je n'ai pu typé que 2 blocs, I1 et VII1.
    4. Le groupe à 23 rRNAs dans lequel je n'ai pu typé que 3 blocs, I4 IV3 IV4.
    5. Le type IV4, 16s23s5s-tta-atgi, n'existe pas dans psor mais est ajouté ici parce qu'il est semblable aux types IV, 16s23s5s suivi de tRNAs. Mais en plus avec tta-atgi il est comparable aussi aux types VII1 et VIII1. Ce point est important quand on considère l'origine de cdc8 comme croisement de cdc et psor. Ce type IV4 va en faveur d'une évolution de cdc vers psor en passant par cdc8.
C3. cdc8 blocs
Bloc type groupes intercal Bloc type groupes intercal Bloc type groupe intercal
cds 554 cds 150 cds 496
cds 0 aca 93 16s 321
cds 167 23s 184 23s° 100
23s° 132 III 16s 374 cds 111
IV2 5s 6 cds cds 228
aac 4 16s 321
**16aas 7 cds 452 23s° 101
atgj 114 5s 125 23s° 250
IV1 16s 0 23s 261 gca 52
cds 100 I2 16s 190 16s° 100
23s° 181 cds 23s° 217
5s 6 16s 179
aac 6 cds 118 cds 386
**41aas 12 5s 126 IV3 16s 321
gta 75 23s 321 23s 181
cds 308 I3 16s 292 5s 6
cds cds aac 6
**17aas 8
cds 281 cds 179 aaa 353
16s° 100 16s 161 5s 126
23s° 126 5s 201 23s' 582
X1 5s 7 I1 23s 217 I4 16s 217
aac 6 16s 108 23s 126
**7aas 9 atgi 11 5s 216
aga 954 tta 5 cds 372
cds 5s 201 cds 21
23s 375 cds 778
cds 733 VII1 gca 52 IV4 16s 261
cds 1 16s’ 100 23s 201
23s° 126 16s’ 52 5s 5
5s 177 gca 248 tta 11
cds 23s° 100 atgi 108
16s° 321 16s 184
cds 238 23s' 100 23s° 100
II 16s 320 16s° 320 cds 112
23s 91 23s° 100 23s’ 375
gga 8 23s’ 126 gca 52
5s 273 5s 127 16s° 282
cds cds cds

cdc8 cdc psor 43

modifier
  • Lien tableur: cdc8 cdc psor 43
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) cdc moins cdc8.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - identité entre cdc et cdc8 avec de rares différences faibles entre les intercalaires.
    - Aussi on retrouve les différences entre cdc et psor dans le tableau de droite.
C3. Comparaison cdc8-cdc-psor 43
C31. Comparaison cdc8-cdc 43
cdc8 43aas cdc 43aas
gene intercal gene intercal diff
16s 1
cds 100 16s 279
23s° 181 23s 180 -1
5s 6 5s 6 0
aac 6 aac 6 0
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 10 tac 8 -2
cta 28 cta 29 1
aga 7 aga 7 0
caa 89 caa 88 -1
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 29 atgi 23 -6
cca 7 cca 7 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 6 tgc 6 0
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 9 gaa 9 0
gga 5 gga 5 0
gta 5 gta 5 0
gac 9 gac 9 0
aca 14 aca 14 0
tac 9 tac 9 0
cta 24 cta 23 -1
ggc 24 ggc 24 0
aga 9 aga 9 0
caa 8 caa 8 0
aaa 2 aaa 2 0
tca 3 tca 3 0
ttc 6 ttc 6 0
atgj 11 atgj 11 0
atgi 17 atgi 17 0
cac 8 cac 8 0
aaa 7 aaa 7 0
tgc 7 tgc 7 0
cgt 12 cgt 12 0
gta 75 gta 75 0
cds cds
C32. Comparaison cdc8-psor 43
cdc8 43aas psor 44aas
gene intercal gene intercal diff
16s 1
cds 100 16s 196
23s° 181 23s 122
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 10 tac 15 5
cta 28 cta 14 -14
aga 7 aga 7 0
caa 89 caa 11
tca 3 aaa 6
ttc 6 tca 3 0
atgj 11 ttc 9 3
atgi 29 atg 8 -3
cca 7 atg 21 -8
cac 8 cca 6 -1
aaa 7 cac 4
tgc 6 tgc 25
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 4
aca 14 aca 4 -10
tac 9 tac 15 6
cta 24 cta 11 -13
ggc 24 ggc 13 -11
aga 9 aga 7 -2
caa 8 caa 11 3
aaa 2 aaa 6 4
tca 3 tca 3 0
ttc 6 ttc 9 3
atgj 11 atg 8 -3
atgi 17 atg 21
cac 8 cca 6
aaa 7 cac 9 1
tgc 7 aaa 21 14
cgt 12 tgc 6 -1
gta 75 cgt 10 -2
cds gta 162
cds

cdc8 cdc psor 18

modifier
  • Lien tableur: cdc8 cdc psor 18
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suite de longueurs équivalentes entre les 3 génomes, 18aas 19aas 23aas,
    - avec 4 comparaisons cdc8 18aas/cdc 18aas, cdc8 19aas/psor 23aas, cdc8 18aas/psor 23aas, cdc8 19aas/cdc8 18aas,
    - cdc8 18aas et cdc 18aas sont identiques alors que, en intra, cdc8 19aas est très différent de cdc8 18aas.
    - cdc8 18aas est quasiment inclus dans psor 23aas: les 14 tRNAs de la fin de cdc8 se trouvent en fin de psor avec une seule insertion dans psor, mais les différences entre intercalaires sont élevées comme entre cdc et psor.
C3. Comparaison cdc8-cdc-psor 18
C33. Comparaison cdc8-cdc-psor 18
cdc8 18aas cdc 18aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0
cds 167 16s 279
23s° 132 23s 131 -1
5s 6 5s 6 0
aac 4 aac 4 0
gaa 5 gaa 5 0
gta 5 gta 5 0
gac 11 gac 10 -1
aca 14 aca 14 0
tac 9 tac 9 0
gga 10 gga 10 0
aga 9 aga 9 0
caa 11 caa 11 0
aaa 2 aaa 2 0
tca 18 tca 17 -1
agc 8 agc 8 0
cca 85 cca 85 0
tgg 60 tgg 60 0
cca 5 cca 6 1
atc 3 atc 3 0
ttc 7 ttc 7 0
atgj 114 atgj 114 0
cdc8 18aas psor 23aas
gène intercal gène intercal diff
16s 196
23s 213
cds 214 5s 5
cds 554 tta 13
cds 0 atg 15
cds 167 gaa 9
23s° 132 gga 6
5s 6 gta 5 0
aac 4 gac 16
gaa 5 aac 31
gta 5 aac 4
gac 11 aca 4 -10
aca 14 tac 11 2
tac 9 gga 19 9
gga 10 aga 6 -3
aga 9 caa 12 1
caa 11 aaa 6 4
aaa 2 tca 11 -7
tca 18 agc 6 -2
agc 8 cca 6
cca 85 atg 11
tgg 60 tgg 31 -29
cca 5 cca 6 1
atc 3 atc 6 3
ttc 7 ttc 13 6
atgj 114 atg 138 24
C34. Comparaison cdc8-cdc-psor 19
cdc8 19aas psor 23aas
gene intercal gene intercal diff
16s 321 16s 196
23s 181 23s 213
5s 6 5s 5
aac 6 tta 13 -2
tta 15 atg 15 8
atgf 7 gaa 9 0
gaa 9 gga 6 1
gga 5 gta 5 0
gta 5 gac 16
gac 9 aac 31
aca 14 aac 4
tac 10 aca 4 -10
cta 28 tac 11
aga 7 gga 19
caa 89 aga 6 -1
tca 3 caa 12
ttc 6 aaa 6
atgj 11 tca 11
atgi 29 agc 6
cca 7 cca 6
cac 8 atg 11
aaa 353 tgg 31
cca 6
atc 6
ttc 13
atg 138
cdc8 19aas cdc8 18aas
gène intercal gène intercal diff
cds 214
cds 554
cds 0
16s 321 cds 167
23s 181 23s° 132
5s 6 5s 6
aac 6 aac 4
tta 15 gaa 5
atgf 7 gta 5 0
gaa 9 gac 11 2
gga 5 aca 14 0
gta 5 tac 9
gac 9 gga 10
aca 14 aga 9 2
tac 10 caa 11
cta 28 aaa 2
aga 7 tca 18
caa 89 agc 8
tca 3 cca 85
ttc 6 tgg 60
atgj 11 cca 5
atgi 29 atc 3
cca 7 ttc 7
cac 8 atgj 114
aaa 353

cdc8 cdc psor 9

modifier
  • Lien tableur: cdc8 cdc psor 9
  • Lien cdc psor: le tableau de comparaison cdc-psor
  • Légende
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - cca: marque les tRNAs différents entre les 2 génomes.
    - diff pour différence entre les intercalaires (intercal) colonne de droite moins colonne de gauche.
    - séquences identiques (bordure épaisse): Une séquence identique entre les 2 génomes est encadrée par 2 tRNAs différents (cyan) dans l'un et par 2 bordures épaisses dans l'autre.
  • Notes:
    - Sont comparés ici des suites courtes, en intra cdc8 18aas/9aas et 19aas/9aas, cdc8 9aas/cdc 9aas et cdc8 VII1/psor VII1.
    - cdc8 9aas et cdc 9aas sont identiques
    - cdc8 9aas se retrouve entièrement (sauf 1 tRNA) dans cdc8 19aas avec cependant des diff élevés, mais il est très différent de cdc8 18aas (4 tRNAs différents).
    - La comparaison cdc8 VII1/psor VII1: le groupe de psor à 3 blocs 16s-gca-23s5s est caractérisé en plus par la séquence courte tta-atg (atg supposé atgi). On retrouve le bloc du milieu, VII1 dans cdc8, à l'envers (compléments) et on retrouve partiellement le bloc de fin VIII1 à l'endroit. Dans cdc8 ces blocs sont partiellement abîmés et se trouvent dans le groupe à 15 rRNAs (voir cdc8_blocs). Attention aux diff qui suivent le changement de sens.
    - 3 intercalaires sont préservés entre cdc8 VII1 et celui de psor, 16s-gca5s-ttatta-atgi. De même pour 16s-gca du bloc VIII1.
C3. Comparaison cdc8-cdc-psor 9
C35. Comparaison cdc8-cdc-psor 9
cdc8 18aas cdc8 9aas
gene intercal gene intercal diff
cds 214
cds 554
cds 0 cds 281
cds 167 16s° 100
23s° 132 23s° 126
5s 6 5s 7
aac 4 aac 6
gaa 5 tta 15
gta 5 atgf 7
gac 11 gaa 8
aca 14 gga 4
tac 9 gta 5 0
gga 10 gac 10
aga 9 ggc 9
caa 11 aga 954
aaa 2 cds
tca 18
agc 8
cca 85
tgg 60
cca 5
atc 3
ttc 7
atgj 114
cdc8 19aas cdc8 9aas
gene intercal gene intercal diff
cds 281
16s 321 16s° 100
23s 181 23s° 126
5s 6 5s 7
aac 6 aac 6 0
tta 15 tta 15 9
atgf 7 atgf 7 -8
gaa 9 gaa 8 1
gga 5 gga 4 -5
gta 5 gta 5 0
gac 9 gac 10
aca 14 ggc 9
tac 10 aga 954
cta 28 cds
aga 7
caa 89
tca 3
ttc 6
atgj 11
atgi 29
cca 7
cac 8
aaa 353
C36. Comparaison cdc8-cdc-psor groupe
cdc8 9aas cdc 9aas
gene intercal gene intercal diff
cds 281 16s 52
16s° 100 gca 373
23s° 126 23s 126
5s 7 5s 7
aac 6 aac 5 -1
tta 15 tta 15 0
atgf 7 atgf 7 0
gaa 8 gaa 14 6
gga 4 gga 5 1
gta 5 gta 5 0
gac 10 gac 10 0
ggc 9 ggc 9 0
aga 954 aga 975 21
cds cds
cdc8 I4 cdc VIII1
gene intercal gene intercal diff
16s 68
16s 217 gca 271
23s 126 23s 126 0
5s 216 5s 213 -3
cds 372 cds 372 0
cds 21 cds 21 0
cds 778 cds 776 -2
16s 261 16s 52
23s 201 gca 373
5s 5 23s 126 -75
5s 7 2
psor VII1 cdc8 VII1
gene intercal gene intercal diff
CDS 431 cds 179
16s 54 16s 161
gca 114 5s 201
23s 193 23s 217
5s 5 16s 108
tta 9 atgi 11 2
atg 123 tta 5 0
16s 54 5s 201 8
gca 114 23s 375 261
23s 193 gca 52 -2
5s 5 16s’ 100 -23
tta 9 16s’ 52
atg 123 gca 248
16s 54 23s° 100 -2
gca 114 16s° 321 134
23s 78 23s' 100
5s 100 16s° 320
CDS 23s° 100
23s’ 126
5s 127
cds

cdc8 cdc protéines

modifier
  • Notes:
    - L'altération poussée des rRNAs dans cdc8 qui saute aux yeux quand on comapre les blocs en tRNAs et intercalaires, m'a poussé à comparer les tailles en pbs ici des rRNAs et des cds qui les entourent avec l'idée que ces cds sont issus de la conversion de ces rRNAs. D'où l'idée de création de gène par conversion à l'instar du processus CRISPR.

Alignement sur cdc

modifier
  • Lien tableur: Alignement sur cdc
  • Lien noms abrégés
  • Légende: abrégé pour noms abrégés des protéines.
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc8, tableau qui suit.
  • Notes:
    - cdc présente 15 clusters avec ou sans rRNAs. 5 clusters sans rRNAs sont reproduits tels quels dans cdc8. Les clusters avec rRNAs se répartissent en 3 16sgca23s et 7 16s23s. Dans cdc8 les 3 16sgca23s sont modifiés ou altérés, 3 16s23s sont altérés et les 4 autres sont reproduits tels quels.
    - Les 3 16sgca23s5s perdent leur gca mais gardent le 5s. Deux sont durement altérés dont un porte une séquence de 9 tRNAs et l'autre rien. La modification du 3ème consiste en la suppression du gca seulement sans tocher le reste. Cependant l'intercalaire 16s-23s de 415 pbs dans cdc est divisé par 2 dans cdc8, 217 pbs.
    - Les 3 16s23s5s altérés le sont fortement, 2 portent des séquences longues de tRNAs, 43 et 18, le 3ème est sans tRNAs.
    - La colonne "ordre dans cdc" servira à repérer les grands remaniement quand je ferai l'alignement sur cdc8. De même pour les protéines en bleu foncé.
C3. cdc-cdc8, alignement des protéines sur cdc
C37. cdc protéines
ordre sens adresse gene intercal pbs abrégé
0 dir 9857..10630 cds 179 774 SigB
dir 10810..12317 16s 52 1508
dir 12370..12445 gca 249 76
1 dir 12695..15596 23s 111 2902
dir 15708..15824 5s 126 117
dir 15951..16460 cds 11 510 NadR
dir 16472..17353 cds 457 882 mecano
dir 17811..19082 cds 319 1272 S-ligase
dir 19402..19857 cds 0 456 Nuc-de
dir 19858..19949 tcc 37 92
2 dir 19987..20251 ncRNA 76 265
dir 20328..21965 cds 1638 III-tau
comp 23419..24624 cds 505 1206 Glyco-tr
dir 25130..26637 16s 279 1508
dir 26917..29816 23s 180 2900
dir 29997..30113 5s 6 117
3 dir 30120..30194 aac 6 75
dir **41aas 12
dir 33877..33952 gta 75 76
dir 34028..34441 cds 308 414 hp-414
dir 34750..38181 cds 3432 pyruvate
dir 127011..127715 cds 281 705 CwlD
dir 127997..129505 16s 279 1509
dir 129785..132685 23s 131 2901
dir 132817..132933 5s 6 117
4 dir 132940..133014 aac 4 75
dir **16aas 8
dir 134534..134610 atgj 114 77
dir 134725..136115 16s 68 1391
dir 136184..136259 gca 271 76
dir 136531..139430 23s 126 2900
dir 139557..139673 5s 213 117
comp 139887..141071 cds 372 1185 B6
5 dir 141444..143795 cds 21 2352 Art-red
dir 143817..144356 cds 776 540 Art-reda
dir 145133..146640 16s 52 1508
dir 146693..146768 gca 373 76
dir 147142..150041 23s 126 2900
dir 150168..150284 5s 7 117
6 dir 150292..150366 aac 5 75
dir **7aas 6
dir 150976..151049 aga 975 74
dir 152025..152864 cds 840 TIGR
dir 378341..380728 cds 583 2388 cad
dir 381312..382819 16s 311 1508
dir 383131..386030 23s 126 2900
7 dir 386157..386273 5s 177 117
dir 386451..387059 cds 609 DedA
comp 833130..833894 cds 258 765 DeoR
8 dir 834153..834243 agc 87 91
dir 834331..835119 cds 789 flagellar
dir 1089165..1090139 cds 239 975 Mannosyl
dir 1090379..1091886 16s 320 1508
dir 1092207..1095106 23s 91 2900
dir 1095198..1095271 gga 8 74
9 dir 1095280..1095396 5s 273 117
dir 1095670..1097688 cds 2019 Ala amid
comp 1181549..1182958 cds 1374 1410 MBOAT
10 comp 1184333..1184415 ttg 318 83
dir 1184734..1187382 cds 2649 PolyI
dir 1835768..1837498 cds 109 1731 NhaC
11 dir 1837608..1837688 cta 231 81
<dir 1837920..1838093 cds 174 HXXEE
dir 2981767..2982444 cds 159 678 SrtB
comp 2982604..2982678 aca 94 75
comp 2982773..2985672 23s 184 2900
12 comp 2985857..2987364 16s 340 1508
dir 2987705..2988643 cds 939 lactam
comp 3787361..3788431 cds 454 1071 ABC
comp 3788886..3789002 5s 126 117
13 comp 3789129..3792028 23s 281 2900
comp 3792310..3793817 16s 191 1508
comp 3794009..3794587 cds 579 precorrin
comp 3944262..3944453 cds 119 192 DUF378
comp 3944573..3944689 5s 126 117
14 comp 3944816..3947715 23s 217 2900
comp 3947933..3949440 16s 282 1508
comp 3949723..3950004 cds 221 282 hp-282
comp 3950226..3951755 cds 1530 K-ligase
dir 4084445..4085437 cds 382 993 DnaC
comp 4085820..4085894 aca 33 75
15 comp 4085928..4086003 gta 4 76
comp 4086008..4086082 gaa 6 75
comp 4086089..4086164 aaa 326 76
comp 4086491..4087780 cds 1290 succinate
C38. cdc8 protéines
sens adresse gene intercal pbs abrégé
dir 4194196..4196423 23s’ 100 2228
dir 4196524..4197091 16s° 320 568
dir 4197412..4199044 23s° 100 1633
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4232593..4234098 16s 217 1506
dir 4234316..4237215 23s 126 2900
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
dir 306829..309216 cds 733 2388 cad
<>comp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate

Alignement sur cdc8

modifier
  • Lien tableur: Alignement sur cdc8
  • Lien noms abrégés
  • Légende:
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 23s°: 23S ribosomal RNA rRNA prediction is too short
    - SigB: Protéine existant dans cdc et cdc8 mais est décalée dans cdc8 par les grands remaniements. Voir alignement sur cdc, tableau précédent.
  • Notes:
    - Ici je n'ai pas fait de parallélisme cdc8/cdc. Il suffit de voir la colonne ordre de cdc décrit dans le tableau précédent (alignement sur cdc) pour se rendre compte des grands remaniements du chromosome. Dans cette colonne j'ai ajouté "insert" pour insertion par rapport à cdc.
    - Pour comparer cdc8 à psor pour certains clusters j'ai du intervertir l'ordre des tableaux, le tableau de gauche doit être la suite de celui de droite.
    - Les insertions accumulent les 2 grands groupes qu'on a vu dans cdc8-blocs, à 15 et 23 rRNAs. Par contre en dehors des insertions on trouve 3 groupes altérés à 1 ou 2 clusters, et tous les groupes non altérés sauf l'ordre 5 de cdc.
    - comparaison avec psor: on devine les types VI VII VIII, mais il y a de nouveau type le IV4 par exemple qu'on a signalé dans cdc8-blocs.
C3. cdc-cdc8, alignement des protéines sur cdc8
C40. cdc8 début
cdc8
ordre cdc sens adresse gène intercal pbs abrégé
insert dir 4299490..4300134 cds 214 645 Y-r1
insert dir 4300349..4300807 cds 554 459 Helix
dir 4301362..4303101 cds 0 1740 hp-1740
dir 4303102..4303305 cds 167 204 hp-204
dir 4303473..4304299 23s° 132 827
4 dir 4304432..4304548 5s 6 117
dir 4304555..4304629 aac 4 75
dir 4304634..4304708 gaa 5 75
dir 4304555..4304629 aac 4 75
dir **16aas 8
dir 4306150..4306226 atgj 114 77
dir 4306341..4307538 16s 0 1198
dir 4307539..4308225 cds 100 687 xylose
dir 1..796 23s° 181 796
3 dir 978..1094 5s 6 117
dir 1101..1175 aac 6 75
dir **41aas 12
dir 4868..4943 gta 75 76
dir 5019..5432 cds 308 414 hp-414
dir 5741..9172 cds 3432 pyruvate
dir 94032..94736 cds 281 705 CwlD
dir 95018..95994 16s° 100 977
dir 96095..97613 23s° 126 1519
6 dir 97740..97856 5s 7 117
dir 97864..97938 aac 6 75
dir **7aas 6
dir 98542..98615 aga 954 74
dir 99570..100409 cds 840 TIGR
<> cp 309950..310076 cds 1 127 seleno
dir 310078..311313 23s° 126 1236
7 dir 311440..311556 5s 177 117
dir 311734..312342 cds 609 DedA
comp 861856..862620 cds 258 765 DeoR
8 dir 862879..862969 agc 87 91
dir 863057..863845 cds 789 flagellar
dir 1106477..1107451 cds 238 975 Mannosyl
dir 1107690..1109197 16s 320 1508
dir 1109518..1112416 23s 91 2899
dir 1112508..1112581 gga 8 74
9 dir 1112590..1112706 5s 273 117
dir 1112980..1114998 cds 2019 Ala amid
comp 1196804..1198213 cds 1378 1410 MBOAT
10 comp 1199592..1199674 ttg 318 83
dir 1199993..1202641 cds 2649 PolyI
dir 1850896..1852626 cds 109 1731 NhaC
11 dir 1852736..1852816 cta 334 81
dir 1853151..1853666 cds 516 HXXEE
dir 3024038..3024715 cds 150 678 SrtB
comp 3024866..3024940 aca 93 75
12 comp 3025034..3027933 23s 184 2900
comp 3028118..3029625 16s 374 1508
dir 3030000..3030938 cds 939 lactam
insert dir 3805298..3806743 cds 208 1446 Y-r2
insert comp 3806952..3807028 agg 61 77
insert <comp 3807090..3808790 cds 1701 fdHa
comp 3875816..3876886 cds 452 1071 ABC
comp 3877339..3877455 5s 125 117
13 comp 3877581..3880480 23s 261 2900
comp 3880742..3882249 16s 190 1508
comp 3882440..3883018 cds 579 precorrin
comp 4017523..4017714 cds 118 192 DUF378
comp 4017833..4017949 5s 126 117
14 comp 4018076..4020975 23s 321 2900
comp 4021297..4022804 16s 292 1508
comp 4023097..4023378 cds 221 282 hp-282
comp 4023600..4025129 cds 1530 K-ligase
dir 4135881..4136873 cds 383 993 DnaC
comp 4137257..4137331 aca 33 75
15 comp 4137365..4137440 gta 4 76
comp 4137445..4137519 gaa 6 75
comp 4137526..4137601 aaa 331 76
comp 4137933..4139222 cds 1290 succinate
C40. cdc8 suite
cdc8 psor
ordre cdc sens adresse gène intercal pbs abrégé adresse gène intercal pbs abrégé 
0 dir 4178197..4178970 cds 179 774 SigB 127845..129260 CDS 100 1416 R-deca
insert dir 4179150..4180587 16s 161 1438 127628..127744 5s 78
insert comp 4180749..4180865 5s 201 117 124628..127549 23s 114
insert comp 4181067..4183959 23s 217 2893 124438..124513 gca 54
insert comp 4184177..4185684 16s 108 1508 122877..124383 16s 123
insert comp 4185793..4185869 atgi 11 77 122677..122753 atg 9
insert comp 4185881..4185969 tta 5 89 122579..122667 tta 5
insert comp 4185975..4186091 5s 201 117 122457..122573 5s 193
insert comp 4186293..4189192 23s 375 2900 119347..122263 23s 114
insert comp 4189568..4189643 gca 52 76 119157..119232 gca 54
insert comp 4189696..4190959 16s’ 100 1264 117596..119102 16s 123
insert dir 4191060..4192225 16s’ 52 1166 117396..117472 atg 9
insert dir 4192278..4192353 gca 248 76 117298..117386 tta 5
insert dir 4192602..4193197 23s° 100 596 117176..117292 5s 193
insert dir 4193298..4193874 16s° 321 577 114067..116982 23s 114
insert dir 4194196..4196423 23s’ 100 2228 113877..113952 gca 54
dir 4196524..4197091 16s° 320 568 112316..113822 16s 431
1 dir 4197412..4199044 23s° 100 1633 111345..111884 CDS 540 Art-reda
dir 4199145..4201593 23s’ 126 2449
dir 4201720..4201836 5s 127 117
dir 4201964..4202473 cds 11 510 NadR
dir 4202485..4203366 cds 458 882 mecano
dir 4203825..4205096 cds 320 1272 S-ligase
dir 4205417..4205872 cds 0 456 Nuc-de
dir 4205873..4205964 tcc 37 92
2 dir 4206002..4206266 ncRNA 76 265
dir 4206343..4207980 cds 1638 III-tau
insert comp 4209435..4210639 cds 496 1205 Glyco-tr
insert 4211136..4212643 16s 321 1508
insert 4212965..4213127 23s° 100 163
insert <>comp 4213228..4213849 cds 622 CHAP
insert comp 4213961..4214620 cds 228 660 A-1chlor
insert dir 4214849..4216199 16s 321 1351
insert dir 4216521..4217008 23s° 101 488
insert comp 4217110..4218529 23s° 250 1420
insert comp 4218780..4218855 gca 52 76
insert comp 4218908..4219471 16s° 100 564
insert comp 4219572..4219856 23s° 217 285
insert comp 4220074..4221581 16s 179 1508
insert >comp 4221761..4222206 cds 386 446 SigB2 3452349..3452552 CDS 239 204 hp-204
insert dir 4222593..4224100 16s 321 1508 3450603..3452109 16s 196
insert dir 4224422..4227321 23s 181 2900 3447492..3450406 23s 213
insert dir 4227503..4227619 5s 6 117 3447162..3447278 5s 5
insert dir 4227626..4227700 aac 6 75 3447068..3447156 tta 13
insert dir 4227707..4227792 tta 15 86 3446979..3447054 atg 15
insert dir 4227808..4227883 atgf 7 76 3446889..3446963 gaa 9
insert dir 4227891..4227965 gaa 9 75 3446806..3446879 gga 6
insert dir 4227975..4228048 gga 5 74 3446724..3446799 gta 5
insert dir 4228054..4228129 gta 5 76 3446642..3446718 gac 16
insert dir 4228135..4228211 gac 9 77 3446550..3446625 aac 31
insert dir 4228221..4228295 aca 14 75 3446443..3446518 aac 4
insert dir 4228310..4228394 tac 10 85 3446364..3446438 aca 4
insert dir 4228405..4228488 cta 28 84 3446275..3446359 tac 11
insert dir 4228517..4228593 aga 7 77 3446190..3446263 gga 19
insert dir 4228601..4228676 caa 89 76 3446094..3446170 aga 6
insert dir 4228766..4228854 tca 3 89 3446012..3446087 caa 12
insert dir 4228858..4228933 ttc 6 76 3445924..3445999 aaa 6
insert dir 4228940..4229016 atgj 11 77 3445829..3445917 tca 11
insert dir 4229028..4229104 atgi 29 77 3445727..3445817 agc 6
insert dir 4229134..4229210 cca 7 77 3445644..3445720 cca 6
insert dir 4229218..4229294 cac 8 77 3445561..3445637 atg 11
insert dir 4229303..4229378 aaa 353 76 3445474..3445549 tgg 31
insert comp 4229732..4229848 5s 126 117 3445366..3445442 cca 6
insert comp 4229975..4232010 23s’ 582 2036 3445283..3445359 atc 6
dir 4232593..4234098 16s 217 1506 3445201..3445276 ttc 13
dir 4234316..4237215 23s 126 2900 3445111..3445187 atg
dir 4237342..4237458 5s 216 117
comp 4237675..4238859 cds 372 1185 B6
5 dir 4239232..4241583 cds 21 2352 Art-red
dir 4241605..4242144 cds 778 540 Art-reda
insert dir 4242923..4244459 16s 261 1537
insert dir 4244721..4247619 23s 201 2899
insert dir 4247821..4247937 5s 5 117 111345..111884 CDS 431 540 Art-reda
insert dir 4247943..4248031 tta 11 89 112316..113822 16s 54
insert dir 4248043..4248119 atgi 108 77 113877..113952 gca 114
insert dir 4248228..4249735 16s 184 1508 114067..116982 23s 193
insert dir 4249920..4250564 23s° 100 645 117176..117292 5s 5
insert <dir 4250665..4250923 cds 112 259 hp-259 117298..117386 tta 9
insert comp 4251036..4253145 23s’ 375 2110 117396..117472 atg 123
insert comp 4253521..4253596 gca 52 76 117596..119102 16s 54
insert comp 4253649..4254226 16s° 282 578 119157..119232 gca 114
insert dir 4254509..4254712 cds 12 204 hp-204 119347..122263 23s 193
insert dir 4254725..4256002 cds 1278 phagePP 122457..122573 5s 5
122579..122667 tta 9
début début début début début début début 122677..122753 atg 123
insert dir 4299490..4300134 cds 214 645 Y-r1 122877..124383 16s 54
insert dir 4300349..4300807 cds 554 459 Helix 124438..124513 gca 114
dir 4301362..4303101 cds 0 1740 hp-1740 124628..127549 23s 78
dir 4303102..4303305 cds 167 204 hp-204 127628..127744 5s 100
4 dir 4303473..4304299 23s° 132 827 127845..129260 CDS 1416 R-deca

cdc8 cdc création de cds

modifier
  • Lien tableur: cdc8 cdc création de cds
  • Lien abrégé
  • Notes:
    - Dans la colonne abrégé sont marqués les cds spécifiques à cdc8, cyan dans Alignement sur cdc8.
    - Certains de ces cds, étant donné leur position dans un bloc de rRNAs dégradés, seraient des candidats de gènes créés de novo lors des conversions qui ont altéré ce bloc. Il est évident qu'on peut toujours rétorquer que ce gène a été copié ou intégré à ce niveau par la conversion. Mais si ce gène ou plusieurs n'existaient pas dans cdc mais seulement dans cdc8, alors l'hypothèse de création de novo serait renforcée.
    - 7 gènes de cdc8, Y-r1 Helix xylose seleno CHAP A-1chlor sigB2, répondent aux critères de la conversion mais n'existent pas dans cdc. Ces cds sont colorés en jaunes et repérés par leur taille en pbs.
    - 4 gènes parmi les 7, seleno CHAP A-1chlor sigB2, n'existent qu'en un seul exemplaire, et ne peuvent donc être extraits à la limite que d'un cds hypothétique, hypothetical protein.
    - Les 3 gènes restants, Y-r1 Helix xylose, ont des cds analogues, c.a.d portant le même nom dans mes recherches et pourraient être extraits de ces analogues d'autant plus qu'ils ont des noms portant la mention type ou domaine.
    - Le gène PhagePP est à la limite du critère de conversion puisqu'il est en fin de bloc mais séparé de 12 pbs du cds hp-204 qui est plus proche de la création de novo puisqu'il est hypothétique. Il appartiendrait au 2ème groupe de gènes ayant des analogues. Cependant j'ai trouvé un gène dans cdc et un gène dans psor qui ont des tailles quasi identiques. Aussi j'ai recherché les cdcs encadrant ces gènes, ils sont tous différents dans les 3 génomes. PhagePP serait analogue donc à Y-r1 Helix xylose.
    Le nom complet du cds Clp est "Clp protéase" et celui de PhageHM est "phage head morphogenesis, SPP1 gp7 family domain protein".
    - J'ai inclue aussi 2 cds appartenant à un cluster sans rRNA, Y-r2 et fdhA. Y-r2 avec sa taille de 1446 se comporte comme Y-r1, il n'existe pas dans cdc. fdhA est le contre exemple de cds qui n'est pas créé de novo, il n'est pas dans une zone altérée par la conversion des rRNA, et il existe dans cdc, mais pas dans psor qui est plus loin phylogénétiquement.
C3. cdc8 cdc création de cds
abrégé cdc8 pbs cdc pbs psor pbs
seleno A 309950..310076 127 0 -
Y-r 457663..457878 216 457207..457422 216 -
1237414..1237986 573 1223841..1224413 573
1291413..1292327 915 1277836..1278750 915
1418672..1419580 909 1405262..1406170 909
2120221..2121348 1128
2785863..2786042 180
3564835..3565434 600
Y-r2 3805298..3806743 1446
Y-r1 4299490..4300134 645
Helix 351106..351336 231 391813..392001 189 -
379952..380503 552 429510..430061 552
456588..456776 189 461727..462398 672
1187185..1187736 552 1169984..1170535 552
1466364..1466783 420 1292255..1292926 672
1467749..1468147 399 1454375..1454773 399
1605760..1606344 585 1517855..1518619 765
1694358..1694750 393 1592306..1592890 585
1936722..1937267 546 1682266..1682658 393
2105662..2106711 1050 1695592..1696284 693
2196549..2198204 1656 1916424..1916630 207
2342487..2342690 204 1922813..1923358 546
2353934..2354578 645 2164151..2165806 1656
2378761..2379891 1131 2308386..2308589 204
2721795..2722316 522 2319833..2320477 645
3485137..3486024 888 2344477..2345607 1131
3570953..3571183 231 2501260..2501931 672
3571660..3571878 219 2688255..2688776 522
3804379..3804627 249 3459701..3460588 888
3804878..3805279 402 3475449..3475589 141
4286854..4287222 369
4288799..4289518 720
4300349..4300807 459
xylose 3383443..3384780 1338 3349843..3351180 1338 0
<4307539..4308225 687
CHAP <4213228..>4213849 622 0 -
A-1chlor 4213961..4214620 660 0 0
SigB2 4221761..4222206 446 0 0
fdHa 4221761..4222206 1701 3711229..3713373 2145 -
R-deca 0 0 127845..129260 1416
876023..877522 1500
phagePP 1448919..1449983 1065 1435547..1436611 1065 1489507..1490769 1263
1450539..1450985 447 1437167..1437613 447
1709611..1711050 1440 1697521..1698963 1443
1718404..1718844 441 1708192..1708632 441
3560756..3561910 1155 3841162..3842367 1206
4254725..4256002 1278
4260531..4261586 1056
4262058..4262474 417
hp-204 4254509..4254712 204
phagePP 4254725..4256002 1278
phageHM 4255980..4256741 762
hp-543 3840525..3841067 543
phagePP 3841162..3842367 1206
hydrolase 3842345..3842512 168
terminase 1487770..1489491 1722
phagePP 1489507..1490769 1263
Clp 1490762..1491607 846

cdc8 cdc abrégé protéines

modifier
C3. C39 abrégé des protéines
abrégé nom protéine
A-1chlor type A-1 chloramphenicol O-acetyltransferase
ABC ABC transporter ATP-binding protein
Ala amid N-acetylmuramoyl-L-alanine amidase
Art-red anaerobic ribonucleoside triphosphate reductase
Art-reda anaerobic ribonucleoside-triphosphate reductase activating protein
B6 pyridoxal phosphate-dependent aminotransferase
cad cadmium-translocating P-type ATPase
CHAP CHAP domain-containing protein
CwlD N-acetylmuramoyl-L-alanine amidase CwlD
DedA DedA family protein
DeoR DeoR/GlpR transcriptional regulator
DnaC DNA replication protein DnaC
DUF378 DUF378 domain-containing protein
fdHa formate dehydrogenase subunit alpha
flagellar flagellar motor protein
Glyco-tr glycosyl transferase
Helix helix-turn-helix domain-containing protein
hp-1740 hp-1740
hp-204 hp-204
hp-282 hp-282
hp-414 hp-414
HXXEE HXXEE domain-containing protein
III-tau DNA polymerase III subunit gamma/tau
K-ligase lysine--tRNA ligase
lactam delta-lactam-biosynthetic de-N-acetylase
Mannosyl Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase
MBOAT MBOAT family protein
mecano mechanosensitive ion channel
NadR transcription repressor NadR
NhaC Na+/H+ antiporter NhaC family protein
Nuc-de nucleoside deaminase
phagePP phage portal protein
PolyI DNA polymerase I
precorrin bifunctional precorrin-2 dehydrogenase/sirohydrochlorin ferrochelatase
pyruvate pyruvate carboxylase
R-deca arginine decarboxylase
seleno glycine/sarcosine/betaine reductase complex selenoprotein A
SigB SigB/SigF/SigG family RNA polymerase sigma factor
SigB2 B/F/G family RNA polymerase sigma-70 factor
S-ligase serine--tRNA ligase
SrtB sortase SrtB
succinate adenylosuccinate synthase
TIGR TIGR00159 family protein
xylose xylose isomerase
Y-r1 tyrosine-type recombinase/integrase – 1
Y-r2 tyrosine-type recombinase/integrase – 2

cdc8 cdc psor stats

modifier
C3 cdc8 cdc psor base NCBI
NCBI du 13.11.19 cdc8 cdc psor
date 15-MAR-2017 18-MAY-2017 08-JAN-2018
DNA circulaire 4 308 325 4 110 554 3 550 458
Genes (total) 4 025 3 807 3 528
CDS (total) 3 870 3 691 3 368
Genes (coding) 3 763 3 615 3 327
CDS (coding) 3 763 3 615 3 327
Genes (RNA) 155 116 160
RRNAs (5S, 16S, 23S) 14, 16, 13 9, 10, 10 17, 17, 17
complete rRNAs 14, 16, 13 9, 10, 10 17, 17, 17
tRNAs 108 83 105
ncRNAs 4 4 4
Pseudo Genes (total) 107 76 41
Pseudo Genes (ambiguous residues) 0 of 107 0 of 76 0 of 41
Pseudo Genes (frameshifted) 60 of 107 42 of 76 4 of 41
Pseudo Genes (incomplete) 35 of 107 30 of 76 18 of 41
Pseudo Genes (internal stop) 31 of 107 18 of 76 22 of 41
Pseudo Genes (multiple problems) 18 of 107 12 of 76 3 of 41
CRISPR Arrays 4 9 -
Décompte du 19.11.19
hypothetical protein 609 523 1 256
hp / cds (total) 0,16 0,14 0,37

cdc8 remarques

modifier
  • Lien noms abrégés
  • Liens pour ce chapitre:  noms abrégésopéronscumulsblocscdc8 cdc psor 43cdc8 cdc psor 18cdc8 cdc psor 9Alignement sur cdcAlignement sur cdc8.
  • Remarques des 7 @ dans opérons :
    1. @ Dans la comparaison cdc8-cdc du bloc à 18aas, les rRNAs 23s et 16s disparaissent. Les 4 cds récupérés et le 23s° (voir opérons pour les noms et les longueurs des cds)
      - correspondraient à la somme des longueurs de 16s (1500 pbs) et 23s (2900 pbs), soit 4400 pbs
      - correspondraient à la longueur totale entre le 1er cds et le 5s, 4304299-4299490 = 4810 pbs
      - la somme des 4 cds récupérés et du 23s° est de 3875 pbs. Les longueurs des cds en aas sont dans l'ordre 215 153 580 68.
      - Le plus intéressant c'est que, si on suppose que les 2 protéines hypothétiques 580 et 68 sont dues aux remaniements,
      - les 2 protéines qui les précèdent sont qualifiées de type intégrase et de protéine contenant un domaine. C'est comme si les remaniements (certainement des conversions géniques) utilisaient une partie d'un gène protéique comme matrice de copie.
    2. @ configuration de bloc peu courante, avec gga: même bloc que cdc et psor.
    3. @ configuration de bloc peu courante, avec aca, et perte de 5s: même bloc que cdc et psor sans 5s.
    4. @ On retrouve le groupe1 de psor, avec 2 gca: VII1 en comp suivi de VIII1 en dir
      - L’intercalaire 23s-gca de VII1 est de 375, beaucoup plus élevé que celui de psor , 114.
      - De même pour VIII1, 248 contre 114.
    5. @ Conservation du bloc tcc-ncRNA dans cdc8 cdc et psor, avec les mêmes intercalaires.
    6. @ Conservation des 3 cds , avec leurs intercalaires, du seul groupe de cdc, mais les gca disparaissent.
    7. @ Nouveau bloc analogue au VI1 et VII1 de psor, sans gca, et qui n’existe pas chez cdc: 16s23s5s-tta-atgi. Avec ces 2 dernières remarques c'est comme si les remaniements des blocs à RNA consistaient à supprimer les gca des blocs 16sgca23s5s, et en le faisant ils laissaient des morceaux de 16s et 23s.
  • Décompte des rRNAs de cdc8 d'après Alignement sur cdc8.
Les RNAs		
16s	14	
16s’	2	
16s°	5	
23s	9	
23s’	4	
23s°	11	
5s	14	
taille d’un bloc normal		
16s	16	1508  soit 10/14
23s	13	2900  soit  9/9
5s	14	117   soit 14/14
  • Notes:
    - Les autres cds créés création de cds
    - Alignement sur cdc8: cdc8 résulte d'une recombinaison d'une clostridia de type cdc et d'une autre de type psor Alignement sur cdc8
    - Orientation des créations stats: soit création en masse par la mobilité et l'insertion des blocs 16s23s5s (cas de psor) puis dégradation de ces blocs dans une étape intermédiaire (cas de cdc8) qui aboutit à un état stable (cas de cdc), soit création par une évolution progressive de cdc vers psor en passant par cdc8. Le 1er cas serait soutenu la proportion très élevée des hp par rapport au total de 37% (voir stats) alors que le 2ème cas serait soutenu par par le type IV4 de cluster dans cdc8 et n'existe ni dans cdc ni dans psor, 16s23s5s-tta-atgi (voir alignement sur cdc8).
    - Les 3 types de création: avec altération des rRNAs (cdc8), dans les blocs 16s23s5s ou 16s-aaas-23s5s (décompte des cds dans un échantillon de clostridia) et après les blocs à la suite des tRNAs ou non (psor opérons).
    - Hypothèse de la création des gènes [10]

cdc8 distribution

modifier
  • Lien tableur: cdc8 distribution
  • Notes: Tableau Cl32
    - -5s: gga et aca
    - 1-3: 2 tta et 2 atgi
Cl3 cdc8, Peptoclostridium difficile M68. clostridia.
Cl31 cdc. La distribution des tRNAs sans rRNA.
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac agc 1
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca 1 aaa 1 aga
cta 1 cca caa cga
gta 1 gca gaa 1 gga
ttg 1 tcg tag tgg
atgj acg aag agg 1
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc8 4 5* 9
Cl32 psor. La distribution des tRNAs avec rRNA.
g1    t1       
atgi 5 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc tac 4 tgc 2
atc 1 acc aac 5 agc 1
ctc ccc cac 3 cgt 1
gtc gcc gac 5 ggc 2
tta 6 tca 4 taa tga
ata aca 5 aaa 5 aga 5
cta 3 cca 4 caa 4 cga
gta 6 gca 4 gaa 5 gga 6
ttg tcg tag tgg 1
atgj 4 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cdc8 2* 93* 4 99

cdc8. Intergen51

modifier

Intergen51. cdc8. Le génome

modifier
  • cdc8 Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: cdc8, Clostridioides difficile M68, NCBI [11], date 6.2.22.
  • cdc8 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cdc8	663,874		4,308,325	15.4	
cdc8 données intercalaires
modifier
cdc8 données intercalaires 200
modifier
cdc8 autres intercalaires aas
modifier

Intergen51. cdc8. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cdc8 les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cdc8 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,688 326 39 3,053 4.4 120 13 133
x 686 4 0 690 1 7 8
t 3,374 330 39 3,743 121 20 141
% 90.1 8.8 1.0
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 10 0 1 11 2.2 tRNA-CDS 16 5
x 5 0 0 5 RNA-RNA 121 35
t 15 0 1 16 CDS-rRNA 20 6
% 93.8 0.0 6.3 non RNA 191 55
- total 348 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 8.9 18.2 1.5 30.0 0.0 38 1.3 9.1
x 20.1 0.0 0.0 1.7 0.0 25 0.0 0.0

Intergen51. cdc8. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cdc8 données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cdc8 fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cdc8 fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cdc8
R2	x3		x2		x		c		Inflexion poly3	x	c
0.680	1.93E-06	-1.89E-03	4.85E-01	-7.46	fx1	abscisse	284.3	551.3
0.829	-6.53E-06	4.96E-03	-1.21E+00	105.0	fc1	ordonnée	21.5	4.4
								
0.663	3.67E-06	-3.13E-03	7.51E-01	-23.4	fx41			
0.905	-2.11E-07	3.49E-04	-1.96E-01	41.7	fc41
  • Le rfin après 400 est de 242 sur un total de 2727 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 27 . L'indice i.rfin1 = 215/510=0,422.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cdc8		calculs			poly3	cdc8
effect	2727		R2.21	864		abscis	250
xm	45		pte	12,50		flexa	138
ym	9		cste	3,86		flexo	2,08
x1m	229		r400l	171		xm	45
y1m	1		restp	231,39		sup4	71,9
rfin	88,74		%sd	15,67		sup4t	251,6
bornf	137		lond	184		%	28,6
supd	61,0		%sf	14,01		long	93
supdt	389,4		lonf	92		R2	361
xmp	379,17		sf/lf	0,38			
r400	142,65		sr/lr	0,28			
supf	34,9		sd/ld	0,33			
supft	249,0		i.r400	0,83								

Intergen51. cdc8. Les CDS-CDS négatifs

modifier
Sous-totaux	cdc8			totale	
fréquence	x-	c-		x-	c-
 - 1		0	71		4	4140
 - 2		0	0		85	11
 - 3		0	1		3	12
 - 4		1	51		717	10938
 - 5		0	0		5	19
sp6		3	203		1642	8424
total		4	326		2,456	23,544
reste		0	5		264	420
s6		0	1		361	41
s7		1	30		321	1438
s8		2	167		696	6525
rappot s1-5						
4/2/1		-	0.7		8.4	2.6
% / sp6						
s6/sp6		0.0	0.5		22.0	0.5
s7/sp6		33.3	14.8		19.5	17.1
s8/sp6		66.7	82.3		42.4	77.5
reste/sp6	0.0	2.5		16.1	5.0
						
total s1-5	1	123		814	15120
% / total						
%s1-5		25.0	37.7		33.1	64.2
%sp6		75.0	62.3		66.9	35.8

Intergen51. cdc8. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		7			CDS 16s		6	4
16s 23s		8			5s CDS		5	1
16s tRNA	1			16 CDS		2	
tRNA 23s	2			CDS 5s			
5s tRNA		6	1		23s CDS			1
tRNA in		2			CDS 23s			
tRNA contig	85			5s 16s			1
tRNA hors	3			16s16s			
tRNA 16s	3						
23s tRNA	2						
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		120	1		total		13	7
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cdc8. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cdc8. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 cont3 cont5 cont6
inter aa    inter aa    inter aa    inter aa    inter aa
6 aac 7 atgf 6 aac 89 caa 4 aac
15 tta 9 gaa 15 tta 3 tca 5 gaa
7 atgf 5 gga 7 atgf 6 ttc 5 gta
9 gaa 5 gta 8 gaa 14 atgj 11 gac
5 gga 9 gac 4 gga 29 atgi 14 aca
5 gta 14 aca 5 gta 7 cca 9 tac
9 gac 9 tac 10 gac 8 cac 10 gga
14 aca 24 cta 9 ggc ** aaa 9 aga
10 tac 24 ggc ** aga 11 caa
28 cta 9 aga cont4 2 aaa
7 aga 8 caa 6 aac 18 tca
89 caa 2 aaa 15 tta 8 agc
3 tca 3 tca 7 atgf 85 cca
6 ttc 6 ttc 9 gaa 60 tgg
14 atgj 14 atgj 5 gga 5 cca
29 atgi 17 atgi 5 gta 3 atc
7 cca 8 cac 9 gac hors 7 ttc
8 cac 7 aaa 14 aca 33 aca ** atgj
7 aaa 7 tgc 10 tac 4 gta
6 tgc 12 cgt 28 cta 6 gaa
6 aac ** gta 7 aga ** aaa
15 tta
-

Clostridium botulinum CDC_297

modifier
  • Notes: Il n'y a pas de code KEGG pour ce génome, je lui ai donné le code cbc*, mais pour les têtes de chapitre je mets cbc.

cbc opérons

modifier
  • Lien tableur: cbc* opérons
  • Liens: gtRNAdb [12], NCBI [13], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - cds, ce cds a la particularité d'être très court et collé au cluster à rRNA. Il fait 108 pbs et sa séquence est,
    MNEGCDRILIVVARWQVSKNKKMLTKIKKRATIIKH.
    - @ voir le chapitre remarques de ce génome.
C4. Clostridium botulinum CDC_297
28%GC 30.6.19 Paris  52  doubles intercal  aa  avec aa
comp 1309334..1309408 gag
comp 1385938..1386012 aac 8
comp 1386021..1386134 5s 108
comp 1386243..1389140 23s 228
comp 1389369..1390866 16s @1
comp 1392997..1393072 ttc 7
comp 1393080..1393193 5s 108
comp 1393302..1396199 23s 228
comp 1396428..1397925 16s
comp 1408673..1408762 tcc
comp 1412183..1412259 agg
comp 1415464..1415540 cgt 84 84
comp 1415625..1415715 agc + 20 20
comp 1415736..1415826 tca 2 agc 306 306
comp 1416133..1416223 agc 2 tca 20 20
comp 1416244..1416334 tca @4
comp 1425969..1426044 gca 3 3
comp 1426048..1426124 atgi 8
comp 1426133..1426246 5s 79
comp 1426326..1427823 16s @2 117
comp 1427941..1428051 cds
1694943..1695017 cag
comp 1722580..1722664 tac 5 5
comp 1722670..1722745 aca
comp 1841437..1841510 tgc
comp 1842698..1842811 5s 108
comp 1842920..1845817 23s 228
comp 1846046..1847543 16s
1890534..1890608 gaa + 17 17
1890626..1890701 gta 3 gaa 9 9
1890711..1890787 gac 3 gta 4 4
1890792..1890867 aca 3 gac 5 5
1890873..1890947 gaa 2 aca 18 18
1890966..1891041 gta 7 7
1891049..1891125 gac 57 57
1891183..1891257 gaa 17 17
1891275..1891350 gta 9 9
1891360..1891436 gac 4 4
1891441..1891516 aca
comp 1948153..1948228 cca
1969157..1969245 tta 4 4
1969250..1969325 atgf + 53 53
1969379..1969454 atgf 2 atgf 10 10
1969465..1969541 atg
1987541..1989040 16s @3 226
1989267..1992166 23s 93
1992260..1992375 5s 7
1992383..1992457 aac + 27 27
1992485..1992559 aac
2013239..2013313 ggg 18 18
2013332..2013407 acc
2222515..2222590 tgg
2294767..2294842 cca + 7 7
2294850..2294923 gga 2 cca 6 6
2294930..2295006 aga 2 gga 5 5
2295012..2295087 aag 26 26
2295114..2295189 cca 29 29
2295219..2295292 gga 24 24
2295317..2295393 cga
2402556..2402631 gta 5 5
2402637..2402713 gac 3 3
2402717..2402792 ttc 4 4
2402797..2402871 ggc 9 9
2402881..2402954 tgc
2517305..2517391 ttg
2548708..2548792 ctc
2583298..2583388 tga

cbc cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbc. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbc cumuls	opérons		effectif
avec rRNA	opérons		5
		16 23 5s 0	1
		16 atc gca	0
		16 23 5s a	3
		max a		2
		a doubles	1
		spéciaux	1
		total aas	6
sans 		opérons		17
		1 aa		10
		max a		11
		a doubles	4
		total aas	46
total aas			52
remarques			4

cbc blocs

modifier
C4. Clostridium botulinum CDC_297, cbc* blocs
aac 8 7 -
5s 108 108 108 226
23s 228 228 228 93
16s - 7
gca 3
atgi 8
5s 79
16s

cbc remarques

modifier
@1	Les 4 blocs 16.23.5.aa ont des intercalaires identiques à 1 base près.
	- 1 a 0aa, 2 ont 1aa et 1 a 2aas (@3.
	
@2	C’est 1 bloc 16.23.5.aa qui a perdu 23s.
	- L'intercalaire 5s-aa est le même que pour les 4 blocs de @1.
	- Il a 2aas dont le 1er est atgi, rare avec les rRNAs.
	- Il est précédé d'une protéine de 36aas avec un intercalaire de 117.
	- Est-ce qu'elle appartient à l'opéron?
	
@3	C’est 1 bloc 16.23.5.aa  de @1 avec 1 aa double.
	- L'intercalaire 23-5  est très faible, 14% de moins par rapport à @1, 15/108.
	
@4	Dépassement de la règle des intercalaires, 210 bases, 306. 
	- Il se trouve entre 2 séquences de 2 aas.
	- Est-ce 2 opérons?
	
Séquences des doubles : 	
	- 1 opéron à 1 doublet.
	- 2 opérons à 2 séquences de 2 aas chacun.
	- 1 opéron de 11 aas avec 4 séquences de 3 aas, moins 1 aa.

cbc distribution

modifier
  • Lien tableur: cbc distribution
  • Notes:
    - 1-3aas: gca atgi aac ttc aac2
    - >1aa: atgf2
Cl4 cbc. Clostridium botulinum CDC_297 . clostridia.
g1    t1       
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc acc 1 aac 3 agc 2
ctc 1 ccc cac cgt 1
gtc gcc gac 4 ggc 1
tta 1 tca 2 taa tga 1
ata aca 3 aaa aga 1
cta cca 3 caa cga 1
gta 4 gca 1 gaa 3 gga 2
ttg 1 tcg tag tgg 1
atgj 1 acg aag 1 agg 1
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
cbc* 36 10 6* 52

cbc. Intergen51

modifier

Intergen51. cbc. Le génome

modifier
  • cbc Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: cbc, Clostridium botulinum CDC_297, NCBI [14], date 14.4.15.
  • cbc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cbc	696,513		3,892,029	17.9	
cbc données intercalaires
modifier
cbc données intercalaires 200
modifier
cbc autres intercalaires aas
modifier

Intergen51. cbc. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cbc les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbc les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,548 288 24 2,860 3.9 44 6 50
x 718 7 1 726 0 0 0
t 3,266 295 25 3,586 44 6 50
% 91.1 8.2 0.7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 30 0 0 30 3.8 tRNA-CDS 38 43
x 8 0 0 8 RNA-RNA 44 50
t 38 0 0 38 CDS-rRNA 6 7
% 100.0 0.0 0.0 non RNA 0 0
- total 88 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 12.7 20.0 1.4 25.5 0.0 45 0.8 0.0
x 23.9 25.0 14.3 2.5 12.5 43 0.1 0.0

Intergen51. cbc. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cbc données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbc fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbc fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbc fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cbc
R2	x3		x2		x		c		Inflexion poly3	x	c
0.481	1.11E-06	-1.01E-03	2.51E-01	4.94	fx1	abscisse	309.3	164.9
0.782	-5.00E-06	3.83E-03	-9.48E-01	87.8	fc1	ordonnée	18.6	19.2
								
0.365	1.11E-06	-1.03E-03	2.60E-01	3.84	fx41			
0.885	8.29E-07	-4.10E-04	-2.04E-02	30.0	fc41
  • Le rfin après 400 est de 376 sur un total de 2572 . Jusqu'à 1% les freq10 sont en continu jusqu'à 910 , reste 25 . L'indice i.rfin1 = 301/520=0,579.
  • Le reste après 920 est de 25 sur un total de 2572 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1040 , reste 10 . L'indice i.rf2 = 15/120=0,125.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cbc		calculs			poly3	cbc
effect	2572		R2.21	836		abscis	400
xm	45		pte	6,80		flexa	154
ym	6		cste	2,64		flexo	1,98
x1m	241		r400l	159		xm	45
y1m	1		restp	274,49		sup4	75,3
rfin	126,75		%sd	28,28		sup4t	272,2
bornf	185		lond	196		%	27,7
supd	115,2		%sf	27,47		long	109
supdt	407,5		lonf	140		R2	410
xmp	318,04		sf/lf	0,64			
r400	147,74		sr/lr	0,46			
supf	89,5		sd/ld	0,59			
supft	325,8		i.r400	0,93									

Intergen51. cbc. Les CDS-CDS négatifs

modifier
Sous-totaux	cbc			totale	
fréquence	x-	c-		x-	c-
 - 1		0	72		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		3	58		717	10938
 - 5		0	0		5	19
sp6		4	158		1642	8424
total		7	288		2,456	23,544
reste		1	4		264	420
s6		1	0		361	41
s7		1	28		321	1438
s8		1	126		696	6525
rappot s1-5						
4/2/1		-	0.8		8.4	2.6
% / sp6						
s6/sp6		25.0	0.0		22.0	0.5
s7/sp6		25.0	17.7		19.5	17.1
s8/sp6		25.0	79.7		42.4	77.5
reste/sp6	25.0	2.5		16.1	5.0
						
total s1-5	3	130		814	15120
% / total						
%s1-5		42.9	45.1		33.1	64.2
%sp6		57.1	54.9		66.9	35.8

Intergen51. cbc. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		4			CDS 16s		5	
16s 23s		4			5s CDS		1	
16s tRNA				16 CDS			
tRNA 23s				CDS 5s			
5s tRNA		4			23s CDS			
tRNA in					CDS 23s			
tRNA contig	2			5s 16s			
tRNA hors	29			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s		1						
5s 23s								
5s 5s								
total		44	0		total		6	0
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cbc. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cbc. Les intercalaires tRNA-tRNA extra blocs
hors1 hors2
inter aa    inter aa
84 cgt 18 ggg
20 agc ** acc
306 tca 7 cca
20 agc 6 gga
** tca 5 aga
5 tac 26 aag
** aca 29 cca
17 gaa 24 gga
9 gta ** cga
4 gac 5 gta
5 aca 3 gac
18 gaa 4 ttc
7 gta 9 ggc
57 gac ** tgc
17 gaa
9 gta
4 gac
** aca cont
4 tta 3 gca
53 atgf ** atgi
10 atgf 27 aac
** atgj ** aac
-

Clostridium botulinum BKT015925

modifier

cbn opérons

modifier
  • Lien tableur: cbn opérons
  • Liens: gtRNAdb [15], NCBI [16], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
C5. Clostridium botulinum BKT015925
28%GC 30.6.19 Paris  86  doubles intercal  aa  avec aa
20666..20741 acg
36413..36487 gaa + 12 12
36500..36575 gta 2 gaa 13 13
36589..36665 gac 2 gta 5 5
36671..36746 aca 2 gac 18 18
36765..36839 gaa 2 aca 12 12
36852..36927 gta 13 13
36941..37017 gac 5 5
37023..37098 aca
137366..137441 cca
161964..162052 tta + 5 5
162058..162133 atgf 3 tta 5 5
162139..162215 atgj 3 atgf 46 46
162262..162350 tta 2 atgj 5 5
162356..162431 atgf 30 30
162462..162538 atgj 46 46
162585..162673 tta 5 5
162679..162754 atgf
76258..176332 aac
180177..181695 16s @5 233
181929..184836 23s 45
184882..184956 aac + 14
184971..185087 5s 7
185095..185169 aac 2 aac
222409..222484 acc
comp 578417..578492 cag
comp 944747..944833 ttg
955546..955630 ctt
1026946..1027021 gta 17 17 17
1027039..1027115 gac 14 14 14
1027130..1027205 ttc 4 4 4
1027210..1027284 ggc 8 8 8
1027293..1027367 tgc + 57 57 57
1027425..1027499 tgc 2 tgc
comp 2030816..2030890 aac 45
comp 2030936..2033842 23s 96
comp 2033939..2034015 atc 7 7
comp 2034023..2034098 gca 121
comp 2034220..2035734 16s
comp 2283768..2283884 5s 95
comp 2283980..2286886 23s 233
comp 2287120..2288638 16s @3 464
comp 2289103..2289176 gga 15 15
comp 2289192..2289268 atc 7 7
comp 2289276..2289351 gca
comp 2350598..2350674 cga + 21 21
comp 2350696..2350769 gga 4 gga 28 28
comp 2350798..2350873 aaa 2 aaa 4 4
comp 2350878..2350952 caa 2 caa 4 4
comp 2350957..2351032 cac 2 cac 5 5
comp 2351038..2351112 aag 3 aag 3 3
comp 2351116..2351192 aga 3 aga 6 6
comp 2351199..2351272 gga 2 cca 4 4
comp 2351277..2351352 cca 2 ggc 21 21
comp 2351374..2351449 aag 5 5
comp 2351455..2351531 aga 5 5
comp 2351537..2351610 gga 5 5
comp 2351616..2351690 ggc 3 3
comp 2351694..2351777 cta 22 22
comp 2351800..2351875 aaa 4 4
comp 2351880..2351954 caa 4 4
comp 2351959..2352034 cac 5 5
comp 2352040..2352115 aag 5 5
comp 2352121..2352197 aga 5 5
comp 2352203..2352276 gga 5 5
comp 2352282..2352356 ggc 6 6
comp 2352363..2352438 cca
comp 2432784..2432859 tgg
comp 2454880..2454964 tac + 39 39
comp 2455004..2455079 gta 2 tac 8 8
comp 2455088..2455172 tac 4 4
comp 2455177..2455252 aca
comp 2697795..2697911 5s @1 31
comp 2697943..2700847 23s 233
comp 2701081..2702599 16s
comp 2703946..2704021 aaa 311 311
comp 2704333..2704408 ttc 5
comp 2704414..2704530 5s 336
comp 2704867..2704942 ttc 5
comp 2704948..2705064 5s 97
comp 2705162..2708066 23s 233
comp 2708300..2709814 16s
comp 2721253..2721328 aaa @2 5
comp 2721334..2721450 5s 95
comp 2721546..2724452 23s 233
comp 2724686..2726203 16s
comp 2731902..2731976 gag 61 61
comp 2732038..2732112 caa 6 6
comp 2732119..2732195 aga 4 4
comp 2732200..2732273 gga 19 19
comp 2732293..2732376 cta 16 16
comp 2732393..2732467 gaa 4
comp 2732472..2732588 5s 97
comp 2732686..2735592 23s @4 94
comp 2735687..2735763 atc 3
comp 2735767..2735842 gca 74
comp 2735917..2737435 16s
comp 2742262..2742351 tcc
comp 2743220..2743312 tcg
comp 2743891..2743967 agg
comp 2748534..2748610 cgt 144 144
comp 2748755..2748845 agc 23 23
comp 2748869..2748959 tca + 69 69
comp 2749029..2749119 tca 2 tca
comp 2758688..2758763 gca 4 4
comp 2758768..2758844 atgi 3
comp 2758848..2758964 5s 73
comp 2759038..2761942 23s 233
comp 2762176..2763694 16s
comp 2150504..2150620 5s 31
comp 2150652..2153560 23s 233
comp 2153794..2155308 16s
comp 2169525..2169641 5s 32
comp 2169674..2172579 23s 233
comp 2172813..2174331 16s
sur plasmide tgg

cbn cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cbn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cbn cumuls	opérons		effectif
avec rRNA	opérons		10
		16 23 5s 0	3
		16 gca atc	2
		16 23 5s a	4
		max a		8
		a doubles	1
		spéciaux	1
		total aas	22
sans 		opérons		18
		1 aa		12
		max a		22
		a doubles	6
		total aas	64
total aas			86
remarques			5

cbn blocs

modifier
C5. Clostridium botulinum BKT015925, cbn blocs
5s 31 31 32
23s 233 233 233
16s
ttc 5
5s 336
aaa 5 3 ttc 5
5s 95 73 5s 95 5s 97
23s 233 233 23s 233 23s 233
16s aaa atgi 16s 464 16s
gga 15
16s 233
23s 45
aac 14
5s 7
aac
gaa 4
5s 97 aac 45
23s 94 23s 96
atc 3 atc 7
gca 74 gca 121
16s 16s

cbn remarques

modifier
*Remarques
@1	Les 3 opérons 16-23-5s ont les mêmes intercalaires, 233-31 bases.
	
@2	Les 4 opérons 16-23-5s -aa  ont tous à peu près les mêmes intercalaires 233-95-5.
	- Mais ils sont tous différents:
	+ 1 seul  opéron répond au critère des intercalaires, il a 1aa.
	+ 1 seul opéron ne répond pas strictement au critère des intercalaires.
	Ses 3aas sont du côté du 16s et l’intercalaire avec le 1er aa est très
	Élevé, 464.
	+ L'opéron à 2aas a l'intercalaire 23-5s très faible de 23% inférieur à 95, 22/95.
	+ L'opéron à 3aas répondant aux critères  a un 5s en plus.
	
@3	Le critère d’un intercalaire entre 2aas, supérieur à 210 bases, se trouve 
	dans le 4ème opéron à rRNA, mais il est accompagné d’un intercalaire très
	élevé entre 5s et le 1er aa, comme pour le 2ème opéron à rRNA.
	
@4	C’est un opéron à rRNA atypique : 2aas double entourant le 5s.
	- Mais coserve l’intercalaire 16-23s de 233 bases comme les 7 opérons de ce type.
	
@5	Les 2 opérons à 16-atc gca présentent, ici, la particularité d’inverser ses 2 aas, gca-atc.
	- Ils ont aussi, à peu près,  les mêmes intercalaires 16-gca-atc-23s, 74 4 94.
	- L'opéron à rRNA présentant le max d'aas, au nombre de 8, est de ce type.
	Il a le même intercalaire 23-5s que tous les autres opérons à rRNA, 97 bases.
	
*Séquences des doubles :  tous les opérons à plus de 3aas ont des doubles, 6/6.	
	- Les répétitions vont de 5 à 2.
	- 3 opérons sur 6 ont des séquences qui se répètent, avec 22aas et 2 avec 8aas.
	- L'opéron contenant le max d'aas, 22, a 2 séquences de 6 aas qui se répètent.
	- On peut repérer dans cet opéron d'autres séquences de 3 aas.
	- Ces séquences sont séparées par 1 ou 2 aas différents.

cbn distribution

modifier
  • Lien tableur: cbn distribution
  • Notes:
    - Tableau Cl51: gca, 1-3aas et -16s. aac, 1aa et 1-3aas.
    - Tableau Cl52: 4-8aas, gag caa aga gga cta gaa. >1aa, tgc2 et tca2 en gras.
Cl5 cbn, Clostridium botulinum BKT015925. clostridia.
Cl51 cbc. 1aa -16s 1-3aas. clostridia.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac tgc
atc 1 acc 1 aac 2 agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa 2 aga
cta cca 1 caa cga
gta gca 2 gaa gga 1
ttg 1 tcg 1 tag tgg 2
atgj acg 1 aag agg 1
ctg ccg cag 1 cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cbn 12 7* 3* 22
Cl52 cbn. >1aa -5s 4-8aas +16s.
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc tac 2 tgc 2
atc 2 acc aac 2 agc 1
ctc ccc cac 2 cgt 1
gtc gcc gac 3 ggc 3
tta 3 tca 2 taa tga
ata aca 3 aaa 2 aga 4
cta 2 cca 2 caa 3 cga 1
gta 4 gca 2 gaa 3 gga 5
ttg tcg tag tgg
atgj 2 acg aag 3 agg
ctg ccg cag cgg
gtg gcg gag 1 ggg
clos >1aa =1aa -5s +5s -16s +16s total
cbn 52 2* 6* 4 64

cbn. Intergen51

modifier

Intergen51. cbn. Le génome

modifier
  • cbn Le prélèvement: Acbn
  • Le nom et le lien NCBI: cbn, Clostridium botulinum BKT015925, NCBI [17], date 31.01.14.
  • cbn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cbn	330,729		2,773,157	11.9	
cbn données intercalaires
modifier
cbn données intercalaires 200
modifier
cbn autres intercalaires aas
modifier

Intergen51. cbn. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cbn les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbn les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,765 167 10 1,942 3.5 87 10 97
x 539 9 1 549 0 4 4
t 2,304 176 11 2,491 87 14 101
% 92.5 7.1 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 31 0 0 31 2.8 tRNA-CDS 42 29
x 11 0 0 11 RNA-RNA 87 59
t 42 0 0 42 CDS-rRNA 14 10
% 100.0 0.0 0.0 non RNA 4 3
- total 147 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 3.5 3.2 0.0 29.9 0.0 37 0.5 0.0
x 9.6 18.2 0.0 5.9 0.0 0 0.2 0.0

Intergen51. cbn. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cbn données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbn fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbn fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cbn
R2	x3		x2		x		c		Inflexion poly3	x	c
0.450	1.33E-06	-9.44E-04	1.11E-01	29.70	fx1	abscisse	243.0	186.3
0.856	-3.49E-06	2.27E-03	-7.66E-01	85.6	fc1	ordonnée	19.3	20.5
								
0.692	-4.02E-06	2.93E-03	-7.31E-01	81.60	fx41			
0.941	1.70E-06	-9.50E-04	2.68E-02	37.5	fc41
  • Le rfin après 400 est de 62 sur un total de 1775 . Jusqu'à 1% les freq10 sont en continu jusqu'à 540 , reste 18 . L'indice i.rfin1 = 44/140=0,314.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cbn		calculs			poly3	cbn
effect	1775		R2.21	845		abscis	400
xm	45		pte	12,14		flexa	176
ym	6		cste	3,93		flexo	2,13
x1m	241		r400l	159		xm	45
y1m	1		restp	121,69		sup4	145,4
rfin	34,93		%sd	26,14		sup4t	401,7
bornf	180		lond	196		%	36,2
supd	133,3		%sf	24,97		long	131
supdt	509,9		lonf	135		R2	595
xmp	368,45		sf/lf	0,76			
r400	86,76		sr/lr	0,51			
supf	102,1		sd/ld	0,68			
supft	409,0		i.r400	0,55										

Intergen51. cbn. Les CDS-CDS négatifs

modifier
Sous-totaux	cbn			totale	
fréquence	x-	c-		x-	c-
 - 1		0	34		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		0	28		717	10938
 - 5		0	0		5	19
sp6		9	105		1642	8424
total		9	167		2,456	23,544
reste		0	0		264	420
s6		5	0		361	41
s7		0	23		321	1438
s8		4	82		696	6525
rappot s1-5						
4/2/1		-	0.8		8.4	2.6
% / sp6						
s6/sp6		55.6	0.0		22.0	0.5
s7/sp6		0.0	21.9		19.5	17.1
s8/sp6		44.4	78.1		42.4	77.5
reste/sp6	0.0	0.0		16.1	5.0
						
total s1-5	0	62		814	15120
% / total						
%s1-5		0.0	37.1		33.1	64.2
%sp6		100.0	62.9		66.9	35.8

Intergen51. cbn. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		8			CDS 16s		8	2
16s 23s		8			5s CDS		2	2
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA		6			23s CDS			
tRNA in		2			CDS 23s			
tRNA contig	7			5s 16s			
tRNA hors	48			16s16s			
tRNA 16s								
23s tRNA	2						
tRNA 5s		2						
16s 5s								
5s 23s								
5s 5s								
total		87	0		total		10	4
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cbn. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cbn. Les intercalaires tRNA-tRNA extra blocs
hors1 hors2 hors3
inter aa    inter aa    inter aa
12 gaa 21 cga 39 tac
13 gta 28 gga 8 gta
5 gac 4 aaa 4 tac
18 aca 4 caa ** aca
12 gaa 5 cac 144 cgt
13 gta 3 aag 23 agc
5 gac 6 aga 69 tca
** aca 4 gga ** tca
5 tta 21 cca
5 atgf 5 aag
46 atgj 5 aga
5 tta 5 gga cont
30 atgf 3 ggc 311 aaa
46 atgj 22 cta ** ttc
5 tta 4 aaa 61 gag
** atgf 4 caa 6 caa
17 gta 5 cac 4 aga
14 gac 5 aag 19 gga
4 ttc 5 aga 16 cta
8 ggc 5 gga ** gaa
57 tgc 6 ggc 4 gca
** tgc ** cca ** atgi
15 gga
7 atc
** gca
-

cbn intercalaires entre cds

modifier
  • Lien NCBI [18]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

cbn intercalaires positifs S+

modifier
cbn. Sx+ Sc+ Les diagrammes 400
cbn Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 15 -107 126 33 450 238 max50 -50 394 -1048 106 855 263 min50
31 à 400 2 parties 8.8 -32 -123 49 932 121 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 86 43 - 424 dte 26 tf 184 63 - 652 poly 203 SF
31 à 400 - 120 45 - 891 dte 41 tf
  • Légende du tableau corrélations et fréquences faibles
cbn. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
scc min10 416 961 1377 748 440 530 90 -88 49 367
cbn min20 489 1701 2190 731 543 505 -38 -222 -114 271
eco min20 1003 2130 3133 735 296 440 144 -178 -64 287
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
118 353 0.33 485 1320 4 5 58 242 60 389 -177
65 312 0.21 553 1940 2 5 17 86 56 620 -382
63 348 0.18 1169 2855 11 6 80 226 126 821 -119
  • Diagrammes 400:  cbn cvi,   diagramme 1-40: c+ cbnc+ cvix+ cvitotal,   texte: cvi.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - cbn ressemble beaucoup à cvi comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible (R2’ 26 30). Il diffère principalement par la corrélation sur 41-250 de 505 contre 891 et une courbe c+ 31-400 de forme tilde moyenne tm (41) contre un tilde fort tF (107) pour cvi. Le total des effectifs est 50% plus faible que cvi, 2190 contre 3328.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50 pour cbn et 70 pour cvi. Quand j’enlève les fréquences faibles pour ne laisser que la pyramide, 3 pour cbn et 4 pour cvi, les 2 courbes deviennent de S forts, SF, avec R2’ de 76 pour cbn contre 68 pour cvi. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi.
      + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec cvi. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
      + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 200.
    • c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec le même R2’ de 203 et des 2 points d’inflexion normaux, 263 pour cbn et 282 pour cvi.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 pour cbn et 112 pour cvi. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles, soit 1-30 pour cbn et 1-40 pour cvi, voir le paragraphe x+ 1-400 ci-dessus.
    • c+ 31-400: C’est la différence entre ces courbes qui va impacter le plus la corrélation sur 41-250 qui passe de 505 chez cbn à 891 chez cvi. En effet la courbe de cbn est un tilde faible à moyen avec un R2’ de 41 alors que cvi arbore un tilde fort avec un R2’ de 107. Les 2 points d’inflexions sont faibles en valeur absolue, mais celui de cbn est positif, 121, alors que celui de cvi est négatif, -137.
    - Les corrélations:
    • Sur les plages 41-n: La grande différence entre les 2 génomes c’est une corrélation moyenne pour cbn avec 505 et la 2ème plus forte des 21 génomes de cvi avec 891 après 940 de ase. Dans les 2 génomes elle se maintient légèrement sur 41-200, avec une amélioration pour cbn, différence de -38 (diff), et un recul de 33 pour cvi. Avec cbn c’est la seule amélioration constatée chez les 21 génomes étudiés.
    • Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
      + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -222 pour 1 -200 et -114 pour 1 -250.
      + Chez cvi les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n, certes fortement diminuées mais sont positives et seulement moitié que sur 41-n, 434/858 pour 1-200 et 549/891 pour 1-250.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Entre cbn et cvi il passe de 0.21 à 0.37. Les zéros sont identiques et font 7‰, alors que le taux des négatifs fait le triple de cbn chez cvi, 103‰ contre 280‰.
    - Les courbes 1-40:
    • c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
    • x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Avec 130 pour cvi sa courbe a été étudiée dans cvi.

cbn autres intercalaires

modifier
  • Lien tableur: cbn autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
  • Totaux: il y a 2 pseudo gene
tRNA-cds		tRNA-tRNA		autres-cds		total
c+	x+	x-	c+	x+	c-	c+	x+	c-	
43	13		87			2	2		147
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Clostridium lentocellum DSM 5427

modifier

cle opérons

modifier
  • Lien tableur: cle opérons
  • Liens: gtRNAdb, NCBI [19], génome
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Lachnospiraceae;Cellulosilyticum.
  • Légende:
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Note: il n'y apas de gtRNAdb. Aussi j'ai comparé (EXACT NB.CAR STXT) les 1ers atgf atgi atgj du génome cdc, avec les atg de cle.
C6. Clostridium lentocellum DSM 5427
34.3%GC 30.6.19 Paris  104  doubles intercal  aa  avec aa
10157..10246 agc @1 202
10449..11981 16s 72
12054..12171 5s 4
12176..12248 gca 262
12511..15414 23s 55
15470..15543 gac 61 61
15605..15677 gta 7 7
15685..15757 aca 34 34
15792..15872 tac 12 12
15885..15961 atgj 3 3
15965..16040 ttc 3 3
16044..16116 aaa
30118
46235..47767 16s @3 21284
69052..71964 23s
4873
76838..78371 16s 72
78444..78561 5s 5
78567..78639 gca 282
78922..81829 23s
904
82734..82851 5s 4
82856..82928 ggc
1463
84392..85929 16s 72
86002..86119 5s 4
86124..86196 gca 280
86477..89386 23s
7380
96767..96884 5s 89
96974..97047 ggc
5082
102130..102204 cag
104716..104799 tta 13 13
104813..104898 tca
141499..143034 16s 138
143173..143290 5s 7
143298..143374 atc 258
143633..146538 23s
150968..151085 5s @4 4
151090..151161 gaa 457
151619..153160 16s 605
153766..156671 23s 475
157147..157219 aaa 9 9
157229..157299 gga 6 6
157306..157379 aga
4223
161603..161720 5s 4
161725..161797 ggc
11104
172902..172973 gaa 23 23
172997..173071 cca 45 45
173117..173189 aaa 11 11
173201..173274 gac 56 56
173331..173403 gta 7 7
173411..173494 tta 187 187
173682..173754 aca 26 26
173781..173861 tac 10 10
173872..173948 atgj 31 31
173980..174052 ttc
248498
422551..424086 16s
113898
537985..540890 23s
25153
566044..566117 cac 23 23
566141..566212 caa 32 32
566245..566330 tca
571984..573519 16s 72
573592..573709 5s 4
573714..573786 gca 282
574069..576975 23s
25302
602278..603812 16s 137
603950..604067 5s
11014
615082..617987 23s
21159
639147..639362 16s° @5
98139
737502..737619 5s 4
737624..737696 ggc
3291
740988..741058 gga
759839..759920 cta
911999..912083 ctt + 148 148
912232..912316 ctt 2 ctt
1035192..1035265 cga
1061152..1061225 agg
comp 1136376..1136448 ccc
1229184..1230718 16s @2 72
1230791..1230908 5s 7
1230916..1230989 atc 53 53
1231043..1231115 gca 261
1231377..1234282 23s 110
1234393..1234464 aac + 9 9
1234474..1234545 gaa 2 tgc 6 6
1234552..1234622 tgc 2 aac 23 23
1234646..1234717 aac 58 58
1234776..1234846 tgc
1280211..1280283 atgf
1283250..1283320 gga + 5 5
1283326..1283399 aga 2 gga 5 5
1283405..1283478 cac 2 aga 31 31
1283510..1283581 caa 2 caa 23 23
1283605..1283677 aaa 30 30
1283708..1283792 cta 23 23
1283816..1283886 gga 5 5
1283892..1283965 aga 6 6
1283972..1284043 caa
1299560..1299632 ggc 4 4
1299637..1299711 cca
1346208..1346290 ctg
1363346..1363428 ctg
1515234..1515305 gaa 62 62
1515368..1515442 cca 22 22
1515465..1515537 aaa
1597292..1597364 acg
1611976..1612042 acg
2065352..2065425 ata
comp 2090478..2090550 acc
2394421..2394501 tac 3 3
2394505..2394577 ttc
2592342..2592422 ttg
2606024..2606104 ttg
comp 2737232..2737304 gcc
comp 2798802..2798874 aag
comp 2881571..2881642 gag
comp 3215471..3215545 cca
comp 3252582..3252655 atgj 7 7
comp 3252663..3252735 gta 4 4
comp 3252740..3252813 gac 10 10
comp 3252824..3252896 tgg 20 20
comp 3252917..3252988 aac
683
comp 3253672..3253748 atgj 7 7
comp 3253756..3253828 gta 9 9
comp 3253838..3253910 tgg 18 18
comp 3253929..3254000 aac 60
comp 3254061..3256967 23s
362637
comp 3619605..3619677 aca + 4 4
comp 3619682..3619755 cgt 2 cgt 50 50
comp 3619806..3619879 cgt 2 aca 27 27
comp 3619907..3619990 tta 3 3
comp 3619994..3620069 gta 47 47
comp 3620117..3620190 gac 22 22
comp 3620213..3620289 atgi 23 23
comp 3620313..3620385 aca 14 14
comp 3620400..3620471 gaa 9 9
comp 3620481..3620552 aac 110
comp 3620663..3623568 23s 261
comp 3623830..3623902 gca 53 53
comp 3623956..3624029 atc 7
comp 3624037..3624154 5s 72
comp 3624227..3625761 16s 149
comp 3625911..3625999 tcc 33 33
comp 3626033..3626118 tca
comp 3714637..3714709 gta 1 1
comp 3714711..3714787 atgj

cle cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.cle. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cle cumuls	opérons		effectif
avec rRNA	opérons		19
		16 5 aa 23	5
		16 5 atc gca	2
		solo		11
		max a		14
		a doubles	2
		indéterminé	1
		total aas	46
sans 		opérons		29
		1 aa		19
		max a		10
		a doubles	2
		total aas	59
total aas			105
remarques			5

cle blocs

modifier
C6. Clostridium lentocellum DSM 5427, cle blocs
Solitaires
16s *2 16s° @5
23s *3
5s 3*4 89
ggc
aac 60
23s
16s 137
5s
16s 72 72 72
5s 5 4 4
gca 282 280 282
23s
agc 202
16s 138 16s 72
5s 7 5s 4
atc 258 gca 262
23s 23s 55
gac 61
aac 110
16s 72 23s 261
5s 7 gca 53
atc 53 atc 7
gca 261 5s 72
23s 110 16s 149
aac 9 tcc 33
5s 4 @4
gaa 457
16s 605
23s 475
aaa 9

cle remarques

modifier
Remarques :	Pas de blocs 16-23-5s ni de séquence 16-atc-gca-23.
	
@1	5 blocs 16-5-aa-23s avec les mêmes intercalaires, à peu près, 72 4 280.
	- 4 blocs avec gca dont 3 à 1aa et 1 avec 9aas. 
	- Le bloc à 9aas a un aa avant le 16s, compatible.
	- 1 bloc avec atc seul et les intercalaires modifiées, 138 7 258.
	
@2	2 blocs 16-5-atc-gca-23s, avec les mêmes intercalaires, 72 7 53 261.
	- Les 2 blocs contiennent des doubles, 2 paires chacun avec 7 et 14aas.
	- Le bloc contenant le max de 14aas a 2aas avant le 16s compatibles.
	
@3	Les solos ne contiennent qu’un seul rRNA avec ou sans aas.
	- 5s-1aa, il y en a 4 et l'intercalaire est équivalente de celle des blocs.
	- 23s, il y en a 4 dont 1 seul avec 4aas
	- 16s, 2 sans aas et 1 du 16s5s avec une intercalaire comme le bloc atc, 137.
	
@4	Apparemment un trio de solos. Les 3 intercalaires supérieures à 450 permettent
	de diviser le groupe en 3 opérons, 5saa avec une intercalaire semblable aux 
	autres 5saa, 23s avec 3aas aux petites intercalaires et 1 16s sasns aas.
	
@5	16s°: 16S ribosomal RNA rRNA prediction is too short
	
Séquences des doubles : très peu de doublons. 	
	- 2 opérons avec rRNAs ont des doublons sur 5 possédant au moins 2 aas.
	- 2 opérons sans rRNAs sur 10 possédant au moins 2 aas.
	- 4 doublons pour chaque type d'opérons.
	- 1 seule paire répétée chez les opérons sans rRNAs.

cle distribution

modifier
  • Lien tableur: cle distribution
  • Notes:
    - Tableau Cl61: ctt2 en gras, très rare
    - Tableau Cl62
    1-3aas: aaa aga gga
    -5s: Ces 5s sont seuls sans 16s ni 23s. Ce sont 4 5s ggc et 1 5s gaa
    Blocs à rRNA: ils ont la forme 16s5saa23s
    cgt2 double en gras
Cl6 cle, Clostridium lentocellum DSM 5427. clostridia.
Cl61 cle. Distribution des blocs sans rRNA.
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc 2 tcc tac 2 tgc
atc acc 1 aac 1 agc
ctc ccc 1 cac 2 cgt
gtc gcc 1 gac 2 ggc 1
tta 2 tca 2 taa tga
ata 1 aca 1 aaa 3 aga 2
cta 2 cca 4 caa 3 cga 1
gta 3 gca gaa 2 œ 3
ttg 2 tcg tag tgg 1
atgj 3 acg 2 aag 1 agg 1
ctg 2 ccg cag 1 cgg
gtg gcg gag 1 ggg
clos >1aa =1aa -5s +5s -16s +16s total
cle 40 19 59
Cl62 cle. Distribution des blocs avec rRNA.
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 3 acc aac 4 agc 1
ctc ccc cac cgt 2
gtc gcc gac 2 ggc 4
tta 1 tca 1 taa tga
ata aca 3 aaa 2 aga 1
cta cca caa cga
gta 3 gca 6 gaa 3 gga 1
ttg tcg tag tgg 1
atgj 2 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
cle 34* 3 9 64

cle. Intergen51

modifier

Intergen51. cle. Le génome

modifier
  • cle Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: cle, Cellulosilyticum lentocellum DSM 5427, NCBI [20], date 19.3.21.
  • cle La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cle	615,068		4,714,237	13.0	
cle données intercalaires
modifier
cle données intercalaires 200
modifier
cle autres intercalaires aas
modifier

Intergen51. cle. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cle les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cle les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,865 441 35 3,341 4.2 93 19 112
x 779 21 0 800 0 8 8
t 3,644 462 35 4,141 93 27 120
% 88.0 11.2 0.8
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 46 0 0 46 2.0 tRNA-CDS 69 25
x 23 0 0 23 RNA-RNA 93 34
t 69 0 0 69 CDS-rRNA 27 10
% 100.0 0.0 0.0 non RNA 84 31
- total 273 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 6.4 13.0 2.3 30.3 2.2 42 1.0 0.0
x 10.7 30.4 0.0 2.6 0.0 38 0.0 0.0

Intergen51. cle. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cle données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cle fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cle fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cle
R2	x3		x2		x		c		Inflexion poly3	x	c
0.708	3.88E-06	-2.96E-03	5.83E-01	1.51	fx1	abscisse	259.1	181.0
0.810	-6.21E-06	4.68E-03	-1.15E+00	105.0	fc1	ordonnée	21.5	19.5
								
0.727	2.29E-06	-1.78E-03	3.17E-01	19.00	fx41			
0.948	8.86E-07	-4.81E-04	-2.70E-02	34.9	fc41
  • Le rfin après 400 est de 185 sur un total de 2900 . Jusqu'à 1% les freq10 sont en continu jusqu'à 870 , reste 28 . L'indice i.rfin1 = 157/470=0,334.
  • Le reste après 870 est de 28 sur un total de 2572 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1270 , reste 7 . L'indice i.rf2 = 21/400=0,053.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cle		calculs			poly3	cle
effect	2900		R2.21	841		abscis	300
xm	45		pte	9,45		flexa	152
ym	8		cste	3,18		flexo	2,22
x1m	231		r400l	169		xm	45
y1m	1		restp	184,83		sup4	86,0
rfin	63,79		%sd	26,97		sup4t	372,4
bornf	173		lond	186		%	23,1
supd	119,4		%sf	26,22		long	107
supdt	442,8		lonf	128		R2	488
xmp	372,41		sf/lf	0,72			
r400	121,03		sr/lr	0,47			
supf	92,4		sd/ld	0,64			
supft	352,4		i.r400	0,72										

Intergen51. cle. Les CDS-CDS négatifs

modifier
Sous-totaux	cle			totale	
fréquence	x-	c-		x-	c-
 - 1		0	78		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		8	107		717	10938
 - 5		0	1		5	19
sp6		13	255		1642	8424
total		21	441		2,456	23,544
reste		0	10		264	420
s6		2	0		361	41
s7		3	37		321	1438
s8		8	208		696	6525
rappot s1-5						
4/2/1		-	1.4		8.4	2.6
% / sp6						
s6/sp6		15.4	0.0		22.0	0.5
s7/sp6		23.1	14.5		19.5	17.1
s8/sp6		61.5	81.6		42.4	77.5
reste/sp6	0.0	3.9		16.1	5.0
						
total s1-5	8	186		814	15120
% / total						
%s1-5		38.1	42.2		33.1	64.2
%sp6		61.9	57.8		66.9	35.8

Intergen51. cle. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s					CDS 16s		7	1
16s 23s		1			5s CDS		1	
16s tRNA				16 CDS		1	1
tRNA 23s	7			CDS 5s		1	4
5s tRNA		12			23s CDS		6	2
tRNA in		2			CDS 23s		3	
tRNA contig	25			5s 16s			
tRNA hors	30			16s16s			
tRNA 16s	3						
23s tRNA	5						
tRNA 5s								
16s 5s		8						
5s 23s								
5s 5s								
total		93	0		total		19	8
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cle. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cle. Les intercalaires tRNA-tRNA extra blocs
hors1 hors2 cont1 cont2
inter aa    inter aa    inter aa    inter aa
13 tta 5 gga 61 gac 7 atgj
** tca 5 aga 7 gta 9 gta
23 gaa 31 cac 34 aca 18 tgg
45 cca 23 caa 12 tac ** aac
11 aaa 30 aaa 3 atgj 4 aca
56 gac 26 cta 3 ttc 50 cgt
7 gta 5 gga ** aaa 27 cgt
187 tta 6 aga 9 aaa 6 tta
26 aca ** caa 6 gga 47 gta
10 tac 4 ggc ** aga 25 gac
31 atgj ** cca 9 aac 23 atgi
** ttc 62 gaa 6 gaa 14 aca
23 cac 22 cca 23 tgc 9 gaa
32 caa ** aaa 58 aac ** aac
** tca 3 tac ** tgc 33 tcc
148 ctt ** ttc ** tca
** ctt 7 atgj
4 gta
10 gac
20 tgg
** aac
4 gta
** atgj
-

Heliobacterium modesticaldum Ice1 ATCC 51547

modifier

hmo opérons

modifier
  • Lien tableur: hmo opérons
  • Liens: gtRNAdb [21], NCBI [22], génome [23]
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Heliobacteriaceae;Heliobacterium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    -  cds : cds inséré dans un cluster avec ou sans rRNA.
C7. Heliobacterium modesticaldum Ice1 ATCC 51547
57%GC 24.7.19 Paris  109 doubles intercal  cds   aa  avec aa cdsa cdsd
103699..104088 CDS 380 130
104469..105695 CDS 186 186 409 186
comp 105882..105956 ggc 1 1
comp 105958..106044 ctg 321 321
comp 106366..106929 CDS @1 241 241 188 241
comp 107171..107246 aca 202 202 202
comp 107449..108183 CDS 111772 245
comp 219956..220483 CDS 260 260 176 260
comp 220744..220820 gac 5 5
comp 220826..220901 gta 10 10
comp 220912..220987 gaa 4 4
comp 220992..221067 aaa 18 18
comp 221086..221160 caa 103
comp 221264..224182 23s 237
comp 224420..224495 gcc 64
comp 224560..224676 5s @2 328
comp 225005..226536 16s 651 651
comp 227188..228162 CDS 98792 325
comp 326955..328340 CDS 178 178 462 178
comp 328519..328601 cta 65 65
comp 328667..328743 aga 60 60
comp 328804..328880 cca 568 568
comp 329449..330090 CDS 57730 214
comp 387821..388105 CDS 135 135 95
388241..388317 ccc 7 7
388325..388410 tac 47 47 47
comp 388458..388742 CDS 588493 95
comp 977236..978504 CDS 439 439 423
comp 978944..981860 23s 237
comp 982098..982173 gcc 64
comp 982238..982354 5s 328
comp 982683..984208 16s 460
comp 984669..984744 tgg @3 5 5
comp 984750..984824 cgg 207 207 207
comp 985032..987656 CDS 26258 875
comp 1013915..1014760 CDS 105 105 282 105
comp 1014866..1014942 gac 75 75
comp 1015018..1015093 gaa 265 265
comp 1015359..1016642 CDS 40115 428
1056758..1058014 CDS 121 121 419 121
comp 1058136..1058233 tga 173 173
1058407..1058733 CDS 62951 109
1121685..1122878 CDS 588 588 398
1123467..1124998 16s 328
1125327..1125443 5s 64
1125508..1125583 gcc 233
1125817..1128734 23s 337 337 337
> 1129072..1129785 CDS 24938 238
1154724..1155224 CDS 99 99 167
1155324..1155413 tca 56 56 56
comp 1155470..1156627 CDS 13350 386
1169978..1171828 CDS 129 129 617 129
1171958..1172034 cgt 85 85
1172120..1172196 agg 181 181
1172378..1172812 CDS 62 62 145 62
1172875..1172966 tcg 548 548
1173515..1174330 CDS 6655 272
comp 1180986..1182974 CDS 444 444 663
1183419..1183512 tcc 39 39 39
1183552..1183817 ncRNA 11908 89
1195726..1195998 CDS 181 181 91
1196180..1196255 gcg 151 151 151
1196407..1197051 CDS 86894 215
comp 1283946..1285331 CDS 177 177 462 177
1285509..1285584 atgf 5 5
1285590..1285667 atgj 7 7
1285675..1285750 gaa 542 542
1286293..1287630 CDS 63447 446
1351078..1352549 CDS 704 704 491
1353254..1354786 16s 252
1355039..1355155 5s 64
1355220..1355296 atc 194
1355491..1358408 23s 112
1358521..1358595 aac 109 109 109
comp 1358705..1358926 CDS 139555 74
1498482..1498898 CDS 535 535 139
comp 1499434..1499509 acg 238 238 238
1499748..1500836 CDS 262182 363
1763019..1763858 CDS 68 68 280 68
1763927..1764003 gac 4 4
1764008..1764083 ttc 3 3
1764087..1764161 ggc 92 92
comp 1764254..1764493 CDS 72 72 80 72
1764566..1764641 tgc 18 18
1764660..1764746 tta 253 253
comp 1765000..1765467 CDS 52131 156
1817599..1818318 CDS 487 487 240
1818806..1820337 16s 252
1820590..1820706 5s 64
1820771..1820847 atc 6 6
1820854..1820929 gca 229
1821159..1824076 23s 112
1824189..1824263 aac 6 6
1824270..1824345 atgf 243 243 243
1824589..1825014 CDS 168198 142
1993213..1994328 CDS 99 99 372
1994428..1994502 atgi 41 41 41
1994544..1995368 CDS 284281 275
2279650..2279997 CDS 541 541 116
2280539..2282070 16s 253
2282324..2282440 5s 64
2282505..2282580 gcc 234
2282815..2285735 23s 119
2285855..2285948 tcc 6 6
2285955..2286031 ccg 10 10
2286042..2286115 gga 14 14
2286130..2286205 cac 1 1
2286207..2286281 tgc 9 9
2286291..2286367 gtc 3 3
2286371..2286446 ttc 6 6
2286453..2286537 tac 4 4
2286542..2286616 caa 17 17
2286634..2286709 aaa 4 4
2286714..2286789 gaa 5 5
2286795..2286870 gta 5 5
2286876..2286952 gac 7 7
2286960..2287050 agc 43 43
2287094..2287170 ccc 30 30
2287201..2287287 ctg 3 3
2287291..2287365 ggc 4 4
2287370..2287446 cgt 4 4
2287451..2287526 acc 352 352 352
2287879..2288343 CDS 33184 155
comp 2321528..2322544 CDS 268 268 339
comp 2322813..2322889 gtc 9 9
comp 2322899..2322973 cgg 81 81 81
comp 2323055..2323243 CDS 3375 63
2326619..2327947 CDS 464 464 443 464
2328412..2329943 16s 327
2330271..2330387 5s 226
2330614..2333532 23s 98
2333631..2333706 aaa 4 4
2333711..2333786 acc 8 8
2333795..2333877 ctc 89 89 89
comp 2333967..2334704 CDS 7389 246
2342094..2342804 CDS 155 155 237 155
comp 2342960..2343030 ttc 213 213
2343244..2343936 CDS 563 563 231
2344500..2346025 16s 252
2346278..2346394 5s 64
2346459..2346535 atc 141
2346677..2349594 23s 100
2349695..2349769 aac 6 6
2349776..2349851 atgf 102 102 102
2349954..2350976 CDS 113601 341
2464578..2465114 CDS 271 271 179 271
comp 2465386..2465461 aca 432 432
2465894..2466226 CDS 4722 111
2470949..2471977 CDS 69 69 343 69
2472047..2472133 ctg 678 678
2472812..2473192 CDS 22232 127
2495425..2496048 CDS 402 402 208
comp 2496451..2496527 gtc 4 4
comp 2496532..2496609 atgj 175 175 175
2496785..2497120 CDS 217 217 112
comp 2497338..2497420 ctc 7 7
comp 2497428..2497503 acc 18 18
comp 2497522..2497596 tgg 14 14
comp 2497611..2497684 ggg 19 19
comp 2497704..2497778 ggc 7 7
comp 2497786..2497873 ttg 8 8
comp 2497882..2497958 gtg -10 -10 -10
comp 2497949..2498185 CDS 66 66 79 66
2498252..2498328 ccg 314 314
comp 2498643..2499506 CDS 55292 288
2554799..2554984 CDS 109 109 62 109
2555094..2555169 gaa 2 2
2555172..2555247 ttc 6 6
2555254..2555338 tac 4 4
2555343..2555417 caa 18 18
2555436..2555511 aaa 4 4
2555516..2555590 ggc 9 9
2555600..2555675 cac 117 117
comp 2555793..2557049 CDS 235940 419
comp 2792990..2793442 CDS 219 219 151 219
comp 2793662..2796583 23s 236
comp 2796820..2796895 gca 6 6
comp 2796902..2796978 atc 64
comp 2797043..2797159 5s 328
comp 2797488..2799019 16s 505
comp 2799525..2799599 ggc + 1 1
comp 2799601..2799687 ctg 2 ggc 32 32
comp 2799720..2799796 ccc 42 42
comp 2799839..2799915 cgt 4 4
comp 2799920..2799994 ggc 120 120
comp 2800115..2800192 atgj 42 42
comp 2800235..2800325 agc 16 16
comp 2800342..2800417 atgf 6 6
comp 2800424..2800498 aac 7 7
comp 2800506..2800581 gaa 4 4
comp 2800586..2800661 aaa 18 18
comp 2800680..2800754 caa 4 4
comp 2800759..2800843 tac 91 91
comp 2800935..2801011 gtc 7 7
comp 2801019..2801093 tgc 325 325
2801419..2801724 CDS 230813 102
3032538..3032729 CDS 109 109 64 109
comp 3032839..3035757 23s 233
comp 3035991..3036066 gcc 64
comp 3036131..3036247 5s 253
comp 3036501..3038026 16s 779 779
comp 3038806..3040017 CDS 232 404
comp 3040250..3042013 CDS 588

hmo cumuls

modifier
  • Lien tableur: hmo cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de hmo opérons.
C7. cumuls. Heliobacterium modesticaldum Ice1 ATCC 51547
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 1 2 1 1 40 1 100 10
16 5s gcc 23 5 20 20 34 50 3 80 8 200 16
16 5s atc 23 2 40 0 2 100 11 120 7 300 14
16 5 23s a 1 60 1 3 150 9 160 4 400 8
max a 20 80 2 0 200 9 200 4 500 11
a doubles 1 100 1 1 250 8 240 4 600 0
16 5s atc gca 2 120 0 1 300 5 280 4 700 2
total aas 60 140 0 0 350 4 320 0 800 0
sans opérons 24 160 0 0 400 1 360 2 900 1
1 aa 12 180 0 0 450 4 400 0 1000 0
max a 7 200 0 0 500 2 440 0 1100 0
a doubles 0 0 0 11 1 0
total aas 49 21 38 56 32 59
total aas 109
remarques 3
avec jaune moyenne
variance
sans jaune moyenne 8 8 196 137 230
variance 6 7 120 71 128

hmo tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de hmo opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
hmo	70			52			35			87
deb	fin		deb	fin		grand	petit		grand	petit
62	548		217	-10		92	68		217	-10
66	314		444	39		99	41		444	39
68	92		99	41		99	56		99	41
69	678		135	47		117	109		135	47
72	253		99	56		135	47		99	56
99	56		268	81		173	121		548	62
99	41		68	92		181	151		314	66
105	265		109	117		181	129		92	68
109	117		181	151		217	-10		678	69
121	173		121	173		241	202		253	72
129	181		402	175		253	72		268	81
135	47		129	181		265	105		265	105
177	542		241	202		268	81		117	109
178	568		535	238		314	66		173	121
181	151		72	253		321	186		181	129
186	321		105	265		402	175		181	151
217	-10		66	314		432	271		402	175
241	202		186	321		444	39		542	177
268	81		271	432		535	238		568	178
271	432		177	542		542	177		321	186
402	175		62	548		548	62		241	202
444	39		178	568		568	178		535	238
535	238		69	678		678	69		432	271
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
clostridia	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
hmo		2,707		46	1	27	10	7	1	16	11	8	19
‰					22	587	217	152	22	696	478	348	826

hmo blocs

modifier
  • Lien tableur: hmo blocs
  • Légende:
    - tgg: L'intercalaire, en jaune aussi, est entre tgg et 16s.
  • Notes:
    - Les spécificités gcc atc atc-gca et tRNA avant 16s
    - Homogénéité des intercalaires intra bloc
C7. Heliobacterium modesticaldum Ice1 ATCC 51547, hmo blocs.
tgg
CDS 541 651 588 779 460
16s 253 328 328 253 328
5s 64 64 64 64 64
gcc 234 237 233 233 237
23s 119 103 337 109 439
tcc tcc caa cds cds cds
CDS 704 563 CDS 464
16s 252 252 16s 327
5s 64 64 5s 226
atc 194 141 23s 98
23s 112 100 aaa
aac aac aac
ggc
CDS 487 505
16s 252 328
5s 64 64
atc 6 6
gca 229 236
23s 112 219
aac aac cds

hmo remarques

modifier
  • Remarques des 3 @ dans opérons :
    1. @ Les cds en vert.
      - Ces cds sont insérés dans un cluster avec ou sans rRNA. Ce sont des candidats pour la création. Plus les 2 intercalaires avec les voisins sont petits plus ils sont intéressants. Il y en a 6 dont un seul, *, est accolé à un 16s. Un intercalaire est même négatif, c’est-à-dire que le cds démarre dans le tRNA, adresse 2497949. Dansl’ordre des adresses croissantes les intercalaires sont les suivants :  321-241   181-62   92-72   213-563*   175-217   -10-66.
      - Voir hmo cumuls : 9 intercalaires entre tRNAs dans un cluster ont plus de 40 pbs et 1 fait 120 pbs (adresse 2799920).
      - Dans hmo_opérons j'ai ajouté l'intercalaire entre 2 clusters, qui contient plusieurs autres gènes, pour faire ressortir la proximité des cds intra cluster avec les rRNAs et les tRNAs.
    2. @ Voir hmo blocs.
      - Il y a 10 blocs avec rRNA et tous sont complets. Cependant le 5s est anormalement positionné entre 16s et 23s au lieu d’être en 3ème position. Ce type de génome est rare, voir les statistiques des blocs à rRNAs.
      - Il n'y a qu'un seul bloc sans aas, adresse 2328412, mais ce génome a 5 blocs sur 10 qui est rare dans cette position, gcc, au lieu de gca, plus courant. Les 4 autres blocs arborent des aas courants dans cette position, 2 atc-gca et 2 atc.
    3. @ tRNAs avant 16s
      - Des tRNAs se trouvent avant le 16s, adresses 982683 et 2797488, le 1er avec 2 et le 2ème avec 15 tRNAs.
      - Les 2 intercalaires aa-16s sont du même de grandeur général qu'un cds-16s, 460 et 505 pbs ici.
  • Séquences des doubles: Voir hmo cumuls :beaucoup de séquences longues et à peine un double dans la séquence 15aas-16s5s-gcc-23s.
  • Notes:
    - Les 5 cds, candidats à la création, sont insérés dans des clusters sans rRNAs et 1 seul est collé à 16s.
    - Le 5s est positionné anormalement en 16s5s23s, dans les 10 blocs que possède le génome.
    - Un tRNA intra bloc très rare, gcc au lieu de gca, dans 5 cas sur 10. 4 autres sont courants, 2 atc et 2 atc-gca.

hmo distribution

modifier
  • Lien tableur: hmo distribution
  • Notes: Tableau Cl72,
    - les 1-3aas sont au nombre de 10 et sont soulignés, aac est composé de 1 >3aas et 3 1-3aas alors que aaa est composé respectivement de 3 et 1, et atgf de 2 et 1 respectivement.
    - Les blocs à rRNA sont de la forme 16s5saa23s
Cl7 hmo, Heliobacterium modesticaldum Ice1 ATCC 51547. clostridia.
Cl71 hmo. Distribution des blocs sans rRNA.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 1 tac 2 tgc 1
atc acc 1 aac agc
ctc 1 ccc 1 cac 1 cgt 1
gtc 2 gcc gac 2 ggc 4
tta 1 tca 1 taa tga 1
ata aca 2 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta gca gaa 3 gga
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag agg 1
ctg 2 ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
hmo 37 12 49
Cl72 hmo. Distribution des blocs avec rRNA.
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 2 tgc 2
atc 4 acc 2 aac 4 agc 2
ctc 1 ccc 2 cac 1 cgt 2
gtc 2 gcc 5 gac 2 ggc 3
tta tca taa tga
ata aca aaa 4 aga
cta cca caa 3 cga
gta 2 gca 2 gaa 3 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag agg
ctg 2 ccg 1 cag cgg 1
gtg gcg gag ggg
clos >1aa =1aa -5s +5s -16s +16s total
hmo 49 11 60

hmo. Intergen51

modifier

Intergen51. hmo. Le génome

modifier
  • hmo Le prélèvement: Aclostridia
  • Le nom et le lien NCBI: hmo, Heliomicrobium modesticaldum Ice1, NCBI [24], date 6.3.22.
  • hmo La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
hmo	396,940		3,075,407	12.9	
hmo données intercalaires
modifier
hmo données intercalaires 200
modifier
hmo autres intercalaires aas
modifier

Intergen51. hmo. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. hmo les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 hmo les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,850 332 17 2,199 4.7 103 13 116
x 460 11 0 471 1 1 2
t 2,310 343 17 2,670 104 14 118
% 86.5 12.8 0.6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 31 0 0 31 1.3 tRNA-CDS 54 24
x 23 0 0 23 RNA-RNA 104 47
t 54 0 0 54 CDS-rRNA 14 6
% 100.0 0.0 0.0 non RNA 51 23
- total 223 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 5.8 12.9 0.0 24.6 0.0 60 0.8 0.0
x 12.6 17.4 18.2 5.0 0.0 36 0.0 0.0

Intergen51. hmo. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: hmo données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées hmo fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. hmo fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	hmo
R2	x3		x2		x		c		Inflexion poly3	x	c
0.427	2.46E-06	-1.95E-03	3.93E-01	8.01	fx1	abscisse	257.3	151.9
0.885	-3.49E-06	2.27E-03	-7.66E-01	85.6	fc1	ordonnée	21.3	25.7
								
0.449	3.20E-06	-2.47E-03	4.97E-01	2.46	fx41			
0.959	9.96E-07	-4.54E-04	-7.46E-02	44.0	fc41
  • Le rfin après 400 est de 108 sur un total de 1867 . Jusqu'à 1% les freq10 sont en continu jusqu'à 660 , reste 19 . L'indice i.rfin1 = 89/260=0,342.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	hmo		calculs			poly3	hmo
effect	1867		R2.21	757		abscis	300
xm	43		pte	9,34		flexa	155
ym	5,6		cste	3,40		flexo	2,46
x1m	257		r400l	143		xm	47
y1m	1		restp	153,72		sup4	112,2
rfin	57,85		%sd	29,68		sup4t	316,0
bornf	117		lond	214		%	35,5
supd	161,9		%sf	30,67		long	108
supdt	545,3		lonf	74		R2	492
xmp	301,02		sf/lf	1,13			
r400	95,88		sr/lr	0,56			
supf	83,3		sd/ld	0,76			
supft	271,6		i.r400	0,67										

Intergen51. hmo. Les CDS-CDS négatifs

modifier
Sous-totaux	hmo			totale	
fréquence	x-	c-		x-	c-
 - 1		0	36		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		3	149		717	10938
 - 5		0	0		5	19
sp6		7	132		1642	8424
total		11	332		2,456	23,544
reste		2	0		264	420
s6		1	1		361	41
s7		3	41		321	1438
s8		1	90		696	6525
rappot s1-5						
4/2/1		3.0	4.1		8.4	2.6
% / sp6						
s6/sp6		14.3	0.8		22.0	0.5
s7/sp6		42.9	31.1		19.5	17.1
s8/sp6		14.3	68.2		42.4	77.5
reste/sp6	28.6	0.0		16.1	5.0
						
total s1-5	4	185		814	15120
% / total						
%s1-5		36.4	55.7		33.1	64.2
%sp6		63.6	44.3		66.9	35.8

Intergen51. hmo. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s					CDS 16s		10	
16s 23s					5s CDS			
16s tRNA				16 CDS			
tRNA 23s	9			CDS 5s			
5s tRNA		9			23s CDS		3	1
tRNA in		2			CDS 23s			
tRNA contig	40			5s 16s			
tRNA hors	26	1		16s16s			
tRNA 16s								
23s tRNA	6						
tRNA 5s								
16s 5s		10						
5s 23s		1						
5s 5s								
total		103	1		total		13	1
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. hmo. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 hmo. Les intercalaires tRNA-tRNA extra blocs
cont1 cont2 hors1 hors2
inter aa    inter aa    inter aa    inter aa
5 gac 4 aaa 1 ggc 18 tgc
10 gta 8 acc ** ctg ** tta
4 gaa ** ctc 65 cta 9 gtc
18 aaa 6 aac 60 aga ** cgg
** caa ** atgf ** cca 4 gtc
6 aac 1 ggc 7 ccc ** atgj
** atgf 32 ctg ** tac 7 ctc
6 tcc 42 ccc 5 tgg 18 acc
10 ccg 4 cgt ** cgg 14 tgg
14 gga 120 ggc 75 gac 19 ggg
1 cac 42 atgj ** gaa 7 ggc
9 tgc 16 agc 85 cgt 8 ttg
3 gtc 6 atgf ** agg x293 gtg
6 ttc 7 aac 5 atgf ** ccg
4 tac 4 gaa 7 atgj 2 gaa
17 caa 18 aaa ** gaa 6 ttc
4 aaa 4 caa 4 gac 4 tac
5 gaa 91 tac 3 ttc 18 caa
5 gta 7 gtc ** ggc 4 aaa
7 gac ** tgc 9 ggc
43 agc ** cac
30 ccc
3 ctg
4 ggc
4 cgt
** acc
-

Clostridium beijerinckii strain NCIMB 14988

modifier

cbei opérons

modifier
  • Lien tableur: cbei opérons
  • Liens: gtRNAdb [], NCBI [25], génome []
  • Phylogénie: Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae;Clostridium.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
    - cyan pour les doubles signalés par le signe + dans la colonne doubles.
    - @ voir le chapitre remarques de ce génome.
  • Notes:
    - Les atg ont été résolus en comparant avec ceux de cdc avec stxt. A faire pour psor aussi.
C8. Clostridium beijerinckii strain NCIMB 14988
29.65%GC 29.7.19 Paris  93 doubles intercal  cds   aa  avec aa cdsa cdsd
6477551..6480031 CDS 496 496 827
6480528..6482044 16s 213
6482258..6485171 23s 108
6485280..6485394 5s 14
15..91 atgi 1 1
93..168 gca 85 85 85
254..769 CDS 1940 172
2710..2937 CDS 119 119 76 119
3057..3147 tca + 30 30
3178..3268 agc 2 tca 241 241
3510..3600 tca 2 agc 18 18
3619..3709 agc 125 125
3835..4350 CDS 9470 172
13821..14726 CDS 187 187 302
14914..14988 cgt 34 34 34
comp 15023..15913 CDS 109014 297
124928..125338 CDS 275 275 137 275
125614..125702 tta + 20 20
125723..125798 atgf 4 tta 7 7
125806..125882 atgj 4 atgf 6 6
125889..125977 tta 2 atgj 22 22
126000..126075 atgf 7 7
126083..126159 atgj 6 6
126166..126254 tta 21 21
126276..126351 atgf 70 70
126422..126510 tta 21 21
126532..126607 atgf 664 664
127272..129683 CDS 8954 804
138638..140143 CDS 307 307 502
140451..140525 aac + 234 234
140760..140834 aac 3 aac 439 439
141274..141348 aac @6 299 299 299
141648..143039 CDS 1587 464
comp 144627..145649 CDS 543 543 341
146193..147709 16s 140
147850..147925 gca 3 3
147929..148005 atc 111
148117..151030 23s 70
151101..151217 5s 5 5
151223..151298 ttc 4
151303..151377 tgc 167 167 167
151545..151841 CDS 25608 99
177450..178097 CDS 76 76 216
178174..178249 acc 65 65 65
178315..179508 CDS 134221 398
313730..316207 CDS 90 90 826 90
316298..316382 cta 4 4
316387..316461 ggg 120 120
comp 316582..316986 CDS 85487 135
402474..402953 CDS 125 125 160 125
403079..403154 cca + 17 17
403172..403245 gga 2* 149 149
403395..403471 aga cca gga aga 6 6
403478..403553 cca 16 16
403570..403643 gga 35 35
403679..403755 aga 5 5
403761..403836 cac 3 3
403840..403914 caa 2* 7 7
403922..403997 aaa caa aaa cta 18 18
404016..404100 cta ggc gga 5 5
404106..404180 ggc 25 25
404206..404279 gga 5 5
404285..404360 aag 57 57
404418..404492 caa 7 7
404500..404575 aaa 18 18
404594..404678 cta 5 5
404684..404758 ggc 25 25
404784..404857 gga 46 46
404904..404980 cga 325 325
< 405306..405467 CDS 8393 54
413861..415921 CDS 385 385 687
416307..417823 16s @5 132
417956..418032 atc 84
418117..421031 23s 71
421103..421177 aac 345 345 345
421523..422449 CDS 63814 309
486264..486668 CDS 159 159 135 159
486828..486912 tac + 9 9
486922..486997 gta 3 tac 27 27
487025..487099 aca 2 gta 12 12
487112..487196 tac 2 aca 9 9
487206..487281 gta 30 30
487312..487386 aca 12 12
487399..487483 tac 451 451
487935..489110 CDS 50956 392
540067..540969 CDS 187 187 301 187
541157..541231 tgg 208 208
541440..541820 CDS 97 127
comp 541918..542985 CDS 252 252 356 252
543238..543312 tgg 354 354
543667..544683 CDS 347735 339
892419..893339 CDS 560 560 307
893900..895416 16s 137
895554..895629 gca 118
895748..898661 23s 204
898866..898982 5s 552 552 552
899535..900446 CDS 351 304
900798..902048 CDS 704 704 417
902753..904269 16s 339
904609..907522 23s 273
907796..907912 5s 69 69 69
comp 907982..908449 CDS 43545 156
951995..952630 CDS 97 97 212 97
952728..952813 ctc 396 396
953210..954919 CDS 784414 570
1739334..1739933 CDS 380 380 200 380
1740314..1740389 cac 3 3
1740393..1740467 cag 5 5
1740473..1740548 aaa 443 443
comp 1740992..1742350 CDS 151829 453
1894180..1895406 CDS 34 34 409 34
comp 1895441..1895527 ttg 574 574
1896102..1896794 CDS 200701 231
2097496..2097915 CDS 722 722 140
2098638..2100154 16s 502
2100657..2103569 23s 205
2103775..2103891 5s 315 315 315
2104207..2104905 CDS 234313 233
2339219..2340322 CDS 662 662 368
2340985..2342501 16s 338
2342840..2345755 23s 140
2345896..2345970 aac 3
2345974..2346090 5s 429 429 429
2346520..2348088 CDS 3574 523
2351663..2352139 CDS 568 568 159
2352708..2354224 16s 338
2354563..2357477 23s 140
2357618..2357692 aac 3
2357696..2357812 5s 90 90 90
2357903..2358316 CDS 406783 138
2765100..2765525 CDS 625 625 142
2766151..2767667 16s 503
2768171..2771082 23s 202
2771285..2771401 5s 5
2771407..2771482 ttc 6 6
2771489..2771565 gac 25 25
2771591..2771665 gaa 448 448 448
2772114..2774864 CDS 781818 917
3556683..3557051 CDS 565 565 123 565
3557617..3557691 gag 925 925
comp 3558617..3559759 CDS 192275 381
comp 3752035..3752652 CDS 245 245 206 245
comp 3752898..3752985 agt @1 711 711
comp 3753697..3755112 CDS 501326 472
comp 4256439..4258403 CDS 267 267 655 267
comp 4258671..4258746 aaa 79 79
comp 4258826..4258901 cac 7 7
comp 4258909..4258985 aga 35 35
comp 4259021..4259094 gga 752 752
4259847..4260392 CDS 619853 182
comp 4880246..4880488 CDS 508 508 81 508
comp 4880997..4881113 5s 274
comp 4881388..4884300 23s 578
comp 4884879..4886395 16s 703 703
comp 4887099..4888034 CDS 1272704 312
comp 6160739..6161977 CDS 343 343 413
6162321..6162396 cca 242 242 242
6162639..6163283 CDS 2040 215
6165324..6165734 CDS 222 222 137
comp 6165957..6166032 ttc 5
comp 6166038..6166154 5s @2 188 188 188
6166343..6167074 CDS 8085 244
comp 6175160..6175597 CDS 249 249 146 249
comp 6175847..6175922 gca 1 1
comp 6175924..6176000 atgi 44
comp 6176045..6176161 5s 138
comp 6176300..6179216 23s 339
comp 6179556..6181072 16s 567 567
comp 6181640..6182446 CDS 223 269
6182670..6183419 CDS 190 190 250 190
comp 6183610..6183685 aaa + 5
comp 6183691..6183807 5s 2 aaa 159 159 159
comp 6183967..6184914 CDS @3 294 294 316 294
comp 6185209..6185284 aaa 7
comp 6185292..6185408 5s 138
comp 6185547..6188463 23s 339
comp 6188803..6190319 16s 771 771
comp 6191091..6192203 CDS 7306 371
comp 6199510..6202059 CDS 661 661 850
comp 6202721..6202837 5s @4 139
comp 6202977..6205893 23s 339
comp 6206233..6207749 16s 1102
comp 6208852..6208968 5s 138
comp 6209107..6212023 23s 339
comp 6212363..6213879 16s 502 502 502
comp 6214382..6215329 CDS 90019 316
comp 6305349..6306314 CDS 123 123 322 123
comp 6306438..6306527 tcc 281 281
comp 6306809..6307984 CDS 66527 392
6374512..6375684 CDS 125 125 391 125
comp 6375810..6375884 agg 303 303
comp 6376188..6378578 CDS 13398 797
comp 6391977..6392753 CDS 114 114 259 114
comp 6392868..6392984 5s 134
comp 6393119..6396033 23s 214
comp 6396248..6397764 16s 1120
comp 6398885..6399001 5s 139
comp 6399141..6402055 23s 214
comp 6402270..6403786 16s 748 748
comp 6404535..6405107 CDS 31702 191
6436810..6437790 CDS 192 192 327
comp 6437983..6438059 gac + 6 6
comp 6438066..6438141 gta 3* 14 14
comp 6438156..6438230 gaa gac gta 29 29
comp 6438260..6438334 aca gaa aca – 1 10 10
comp 6438345..6438421 gac 6 6
comp 6438428..6438503 gta 16 16
comp 6438520..6438594 gaa 29 29
comp 6438624..6438698 aca 10 10
comp 6438709..6438785 gac 6 6
comp 6438792..6438867 gta 14 14
comp 6438882..6438956 gaa 162 162 162
comp 6439119..6439685 CDS 37865 189

cbei cumuls

modifier
  • Lien tableur: cbei cumuls
  • Légende:
    - avec et sans rRNA, fréquences des intercalaires dans les clusters avec rRNA ou sans rRNA.
    - cdsd, je ne choisis que le cds avec l'intercalaire le plus faible d'un cluster donné, en supposant que ce cds a été créé par le cluster lors des conversions.
    - cdsa, longueur du cds en aas ici.
    -  1 : occurrences exclues de la moyenne. Sont exclus de la moyenne les jaunes 554 de cbei opérons.
  • Notes:
C8. cumuls. Clostridium beijerinckii strain NCIMB 14988
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 17 1 0 2 1 0 1 0 100 4
16 23 5s 0 7 20 34 3 50 2 50 2 200 19
16 atc gca 1 40 12 1 100 7 100 6 300 11
16 23 5s a 4 60 2 0 150 7 150 5 400 20
max a 4 80 2 0 200 9 200 7 500 6
a doubles 1 100 0 0 250 5 250 3 600 3
autres 6 120 0 0 300 6 300 5 700 2
total aas 19 140 0 0 350 6 350 2 800 1
sans opérons 20 160 1 0 400 4 400 1 900 4
1 aa 11 180 0 0 450 3 450 2 1000 1
max a 19 200 0 0 500 2 500 0 1100 0
a doubles 5 3 0 21 4 0
total aas 74 54 6 72 37 71
total aas 93
remarques 6
avec jaune moyenne
variance
sans jaune moyenne 18 7 350 195 328
variance 17 9 225 111 206

cbei blocs

modifier
C8. Clostridium beijerinckii strain NCIMB 14988, cbei blocs.
16s 213 503 339
23s 108 202 138
5s 14 5 44
atgi atgi ttc atgi
16s 339 502 578
23s 273 205 274
5s
aaa 5
5s 159 5s 139 134
cds 294 23s 339 214
aaa 7 16s 1102 1120
5s 138 5s 138 139
23s 339 23s 339 214
16s 16s
16s 338 338 16s 140
23s 140 140 gca 3
aac 3 3 atc 111
5s aac aac 23s 70
5s 5
ttc
16s 137 16s 132
gca 118 atc 84
23s 204 23s 71
5s aac
ttc 5
5s

cbei remarques

modifier
  • Remarques des 6 @ de cbei opérons
    1. @ Un tRNA très rare même chez les eucaryotes, agt.
    2. @ Un 5s isolé avec un tRNA.
    3. @ Les cds candidats à la création
      - Un cds inséré dans un cluster, candidat pour la création. Ses 2 intercalaires sont faibles, 159 et 294, se trouvent dans les 36 1ers sur un total de 72 ( voir cbei cumuls ). C’est une protéine moyenne de 316 aas.
      - Les groupes de 2 clusters réunis par 2 cds. Ces cds sont colorés en vert comme candidats à la création:
      • le groupe contenant @3, adresse 6181640, intercalaires des cds 567 223 190, taille en aas 269 250 ;
      • le groupe d’ adresse 541440 contient 2 tgg, intercalaires des cds 208 97 252, taille en aas 127 356 ;
      • le groupe d’ adresse 899535, intercalaires des cds 552 351 704, taille en aas 304 417 ;
    4. @ Un cluster à 2 blocs complets en rRNAs, séparés par un intercalaire de 1102 pbs pouvant contenir un protéine moyenne comme @3. Adresse 6202721. Et le même cluster se retrouve à l’adresse 6392868 avec le même intercalaire 1120. Les 2 clusters se différencient, en intra, uniquement par l’intercalaire 23s-5s qui est le même pour les 2 blocs du premier, 339, et pour le deuxième, 214. Ce qui prouve que ce n’est pas une simple copie.
    5. @ Les blocs 16s-atc-23s5s sont relativement nombreux quand les 16s-atcgca-23s5s existent. Voir la fiche des clostridia. Ici le 5s est remplacé par un tRNA aac ce qui renforce l’hypothèse de 5s comme modèle.
    6. @ Un rare triplet pour un firmicutes et en plus les 2 intercalaires sont de la même longueur que les 2 intercalaires avec les 2 cds du cluster, 307 234 439 299, alors que la moyenne des intercalaires entre aas, sans rRNA, et sans jaunes n’est que de 18 (écart 17), celle des cds 350 (écart 225), voir cbei cumuls.
  • Séquence des doubles
    - Les doubles ne se trouvent que dans les clusters sans rRNAs puisqu’ils totalisent 74 tRNAs sur 93 et les tRNAs des clusters avec rRNA se trouvent à l’intérieur.
    - A part le triplet de @6 les clusters avec des doubles, signalés par le signe +, totalisent 5 sur 8 contenant plus d’un tRNA. Ce ne sont uniquement que des duplications de séquences colorées en cyan ou séparées par une bordure épaisse.
    - Les longueurs des séquences dupliquées sont:  2*2  4*3  1*4  1*5
  • Notes
    - Les blocs à rRNAs, voir cbei blocs. Ils sont caractérisés par très peu de tRNAs internes ou externes et par 5 groupes de 2 clusters chacun (@3), totalisant 10 blocs sur 16 . La distribution est la suivante :
    • 11 clusters complets sans tRNAs internes
    • 2 clusters peu courants avec un tRNA entre 23s et 5s,
    • 3 clusters avec tRNAs internes   gcaatc   gca   atc   voir la fiche des firmicutes.
    - 7 cds insérés dans les groupes à 2 clusters, candidats à la création .
    - Le 5s perçu comme un modèle dans @5, 16s-atc-23s-aac
    - Beaucoup de duplications dans les clusters sans rRNAs, caractéristique des firmicutes renforcée par la présence
    • d’un cluster avec un triplet aux intercalaires de type cds plutôt que tRNAs.
    • et des longueurs de séquences dupliquées variables:  2*2  4*3  1*4  1*5.
    • Ces longs clusters sans rRNAs seraient alors issus des clusters longs à rRNAs , qui , quand ils existent dans les autres génomes étudiés des firmicutes, présentent des duplications analogues.

cbei distribution

modifier
  • Lien tableur: cbei distribution
  • Notes:
    - Tous les +5s sont des 1-3aas
    - aaa es composé de 2 +5s et 4 >1aa
    - gca de 2 +16s, 2 +5s
    - aac de 3 -5s et de 3 >1aa
Cl8 cbei, Clostridium beijerinckii strain NCIMB 14988. clostridia.
g1    t1       
atgi 2 tct tat atgf 4
att act aat agt 1
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 1 tac 3 tgc 1
atc 2 acc 1 aac 6 agc 2
ctc 1 ccc cac 3 cgt 1
gtc gcc gac 4 ggc 2
tta 4 tca 2 taa tga
ata aca 4 aaa 6 aga 3
cta 3 cca 3 caa 2 cga 1
gta 5 gca 4 gaa 4 gga 5
ttg 1 tcg tag tgg 2
atgj 2 acg aag 1 agg 1
ctg ccg cag 1 cgg
gtg gcg gag 1 ggg 1
clos >1aa =1aa -5s +5s -16s +16s total
cbei 63 11 3 12* 4 93

cbei. Intergen51

modifier

Intergen51. cbei. Le génome

modifier
  • cbei Le prélèvement: Acbei
  • Le nom et le lien NCBI: cbei, Clostridium beijerinckii strain NCIMB 14988, NCBI [26], date 31.07.20.
  • cbei La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
cbei	1,199,672	6,485,394	18.5	
cbei données intercalaires
modifier
cbei données intercalaires 200
modifier
cbei autres intercalaires aas
modifier

Intergen51. cbei. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. cbei les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 cbei les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,991 390 19 4,400 3.6 104 22 126
x 1,212 10 0 1,222 0 4 4
t 5,203 400 19 5,622 104 26 130
% 92.5 7.1 0.3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 35 0 0 35 2.7 tRNA-CDS 48 25
x 13 0 0 13 RNA-RNA 104 54
t 48 0 0 48 CDS-rRNA 26 14
% 100.0 0.0 0.0 non RNA 14 7
- total 192 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 14.9 14.3 1.0 20.6 2.9 39 0.4 0.0
x 21.6 30.8 10.0 2.1 0.0 30 0.0 0.0

Intergen51. cbei. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: cbei données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées cbei fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbei fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. cbei fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	cbei
R2	x3		x2		x		c		Inflexion poly3	x	c
0.723	2.51E-06	-2.02E-03	4.47E-01	-2.49	fx1	abscisse	262.1	392,5	
0.780	-3.89E-06	2.87E-03	-6.97E-01	70.6	fc1	ordonnée	21.0	7,3
								
0.642	3.04E-06	-2.39E-03	5.24E-01	-6.94	fx41		
0.937	-1,17E-07	1,37E-04	-1,04E-01	34.2	fc31
  • Le rfin après 400 est de 596 sur un total de 4010 . Jusqu'à 1% les freq10 sont en continu jusqu'à 990 , reste 41 . L'indice i.rfin1 = 555/590=0,941.
  • Le reste après 990 est de 41 sur un total de 4010 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1240 , reste 9 . L'indice i.rf2 = 32/250=0,128.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	cbei		calculs			poly3	cbei
effect	4010		R2.21	818		abscis	300
xm	37		pte	6,92		flexa	247
ym	11		cste	3,00		flexo	1,52
x1m	289		r400l	111		xm	35
y1m	1		restp	252,12		sup4	157,6
rfin	148,63		%sd	17,85		sup4t	462,6
bornf	207		lond	252		%	34,1
supd	92,4		%sf	15,53		long	212
supdt	517,7		lonf	170		R2	357
xmp	230,17		sf/lf	0,36			
r400	103,49		sr/lr	0,38			
supf	61,5		sd/ld	0,37			
supft	396,0		i.r400	0,93							

Intergen51. cbei. Les CDS-CDS négatifs

modifier
Sous-totaux	cbei			totale	
fréquence	x-	c-		x-	c-
 - 1		0	71		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		2	83		717	10938
 - 5		1	0		5	19
sp6		7	236		1642	8424
total		10	390		2,456	23,544
reste		1	4		264	420
s6		1	0		361	41
s7		2	32		321	1438
s8		3	200		696	6525
rappot s1-5						
4/2/1		-	1.2		8.4	2.6
% / sp6						
s6/sp6		14.3	0.0		22.0	0.5
s7/sp6		28.6	13.6		19.5	17.1
s8/sp6		42.9	84.7		42.4	77.5
reste/sp6	14.3	1.7		16.1	5.0
						
total s1-5	3	154		814	15120
% / total						
%s1-5		30.0	39.5		33.1	64.2
%sp6		70.0	60.5		66.9	35.8

Intergen51. cbei. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		13			CDS 16s		13	1
16s 23s		13			5s CDS		7	3
16s tRNA	3			16 CDS			
tRNA 23s	3			CDS 5s			
5s tRNA		7			23s CDS			
tRNA in		1			CDS 23s			
tRNA contig	5			5s 16s		2	
tRNA hors	54			16s16s			
tRNA 16s								
23s tRNA	3						
tRNA 5s		2						
16s 5s								
5s 23s								
5s 5s								
total		104	0		total		22	4
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. cbei. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cbei. Les intercalaires tRNA-tRNA extra blocs
hors1 hors2 hors3 hors3
inter aa    inter aa    inter aa    inter aa
30 tca 17 cca 9 tac 6 gac
241 agc 149 gga 27 gta 14 gta
18 tca 6 aga 12 aca 29 gaa
** agc 16 cca 9 tac 10 aca
20 tta 35 gga 30 gta 6 gac
7 atgf 5 aga 12 aca 16 gta
6 atgj 3 cac ** tac 29 gaa
22 tta 7 caa 3 cac 10 aca
7 atgf 18 aaa 5 cag 6 gac
6 atgj 5 cta ** aaa 14 gta
21 tta 25 ggc 79 aaa ** gaa
70 atgf 5 gga 7 cac cont
21 tta 57 aag 35 aga 1 atgi
** atgf 7 caa ** gga ** gca
234 aac 18 aaa 4 ttc
439 aac 5 cta ** tgc
** aac 25 ggc 6 ttc
4 cta 46 gga 25 gac
** ggg ** cga ** gaa
1 gca
** atgi
-

cbei intercalaires entre cds

modifier
  • Lien NCBI [27]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

cbei intercalaires positifs S+

modifier
cbei. Sx+ Sc+ Les diagrammes 400
cbei Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 32 -258 569 -3.0 712 269 max160 -46 338 -822 83 779 245 min50
31 à 400 12.7 -134 357 3.5 790 352 * -1.4 16 -123 40 937 391 1 partie
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 5 26 - 4 poly 708 tF 123 50 - 566 poly 213 SF
31 à 400 36 30 - 345 poly 445 tF * 75 37 - 929 dte 8 Sf
  • Légende du tableau des corrélations et des faibles fréquences
cbei. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
mba min10 705 1651 2356 154 -330 -221 109 -512 -477 -223
cbei min10 950 3395 4345 402 -509 -375 134 -649 -648 -290
pmq min10 1613 4170 5783 455 -834 -652 182 -867 -826 -61
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
45 214 0.21 1255 2688 1 8 18 114 51 428 -74
26 244 0.11 1212 4400 0 4 8 89 35 954 272
32 217 0.15 1926 5302 3 5 22 142 68 1155 -203
  • Diagrammes 400:  cbeicbei 600afn,   diagramme 1-40: c+ cbeic+ afntotal,   texte: afn.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - cbei / afn: Malgré la différence de forme, sur x+ 1-400, entre afn, tilde avec pyramides, et cbei, tilde régulier, les génomes ont en commun le tilde fort, 183 contre 708, le minimum10 et une corrélation très faible et négative sur 41-250. Certes cbei et pmq sont très semblables mais la comparaison avec un génome d’un autre groupe à corrélation faible permet de faire le lien entre groupes. J’aurais pu comparer cbei à blo puisqu’ils ont la régularité du tilde mais ses taux aux fréquences 10 20 sont très élevés par rapport au trio cbei mba pmq, 19‰ pour cbei contre 56‰, soit 3 fois plus et les corrélations sont très différentes 537 contre -377.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 courbes ont des taux peu élevés des fréquences faibles, 26‰ pour cbei et 46‰ pour afn à comparer à 89‰ de blo. Ensuite leur tilde est fort, 708 (R2 712 4) pour cbei contre 183 (R2 486 303). Les R2 montrent bien la régularité de cbei par rapport à afn, 712 contre 486.
      + Les points d’inflexion sont normaux et presque égaux 269 pour cbei contre 261.
    • c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 213 pour cbei contre 297 et des 2 points d’inflexion normaux, 245 pour cbei et 250 pour afn.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 26 pour cbei contre 46.
    • c+ 31-400: La courbe cbei présente le plus faible R2’ des 21 génomes avec 8, ce qui la rend quasiment une droite et je n’arrive pas à distinguer une première partie en bosse comme pour les autres génomes, c’est pour ça que j’ai indiqué 1 partie en commentaire. La courbe de afn est un tilde moyen, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est faible pour afn à 147 et très faible pour cbei à 38.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont différentes, il n’y a pas corrélation entre x+ et c+ pour afn, mais cbei a une corrélation négative, c’est à dire x+ et c+ s’opposent entre elles. Mais leur comportement sont les mêmes quand on passe d’une palge de fréquences à l’autre, les 2 génomes chutent pareil en passant à 41-200, différence (diff) de 133 pour cbei cntre 125. De même en passant à 1-250, cbei devient -646 contre -407, c’est à dire que les 2 génomes sont complètement décorrélés.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour cbei et afn ils sont très faibles et égaux à 0.11. Les zéros sont à 4‰ pour cbei et 11‰ pour afn, alors que le taux des négatifs fait le double de cbei chez afn, 191‰ contre 97‰.
    - Les courbes 1-40:
    • c+ 1-40: Les 2 courbes sont semblales et très proche de celle du total des c+ 1-40.
    • x+ 1-40: Avec un effectif de 35 pour chacun, la courbe ne peut être significative.
    - Les diagrammes x+ 1-600: Ces diagrammes affinent la forme des courbes x+ 1-400 en la prolongeant à 600 à cause de nombreux restes (reste) non intégrés pour les 2 génomes, pour mba 705 sont représentés contre 527 en reste et pour cbei 946 contre 262.
    • cbei x+ 1-600: Le tilde se renforce avec R2p R2d R2’ qui passent respectivement de 712 4 708 à 783 344 439. Le R2 de la droite, R2d, devient conséquent à 344 contre 4. La corrélation 41-400 de 395 passe à 651, elle reste faible pour la longueur de la plage 41-600.
    • mba x+ 1-600: La forme devient clairement tilde et se renforce en passant de 350 1 349 à 465 156 309. Le R2 de la droite devient conséquent à 156 contre 1. La variabilité entre cbei et mba est maintenue et passe, en faisant la différence des R2 des tildes cbei-mba, de 712-349 = 363 à 783-465= 318 avec des effectifs qui passent de 946 à 1126 (reste 82 non pris en compte) pour cbei et de 705 à 937 (reste 295 non pris en compte) pour mba. La corrélation 41-400 de 154 passe à 435, elle reste faible pour la longueur de la plage 41-600.

cbei autres intercalaires

modifier
  • Lien tableur: cbei autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - misc_R, pour misc_RNA
    - gene, c'est un pseudo sans cds
  • Totaux: il y a une erreur dans les couleurs et il y a un pseudo gene
tRNA-cds		tRNA-tRNA		autres-cds		total
c+	x+	x-	c+	x+	c-	c+	x+	c-	
57	15		106			10	3	1	192
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Negativicutes

modifier

Acidaminococcus fermentans DSM 20731

modifier

afn opérons

modifier
  • Lien tableur: afn opérons
  • Liens: gtRNAdb [28], NCBI [29], génome []
  • Phylogénie: Bacteria; Firmicutes; Negativicutes; Acidaminococcales; Acidaminococcaceae; Acidaminococcus.
N1. Acidaminococcus fermentans DSM 20731
56%GC 30.6.19 Paris   60  doubles intercalaire
24678..26242 16s @1 359
26602..29507 23s 228
29736..29852 5s
36819..36894 acg
57713..59277 16s 359
59637..62543 23s 228
62772..62888 5s
169459..169534 gcc
249791..249867 agg
comp 274627..274703 cgt
311123..311198 aca 22
311221..311305 tac 5
311311..311386 atg 3
311390..311465 acc 6
311472..311548 atgf
380482..382046 16s 251
382298..385204 23s 229
385434..385550 5s
461553..461627 aac 3
461631..461705 gaa 8
461714..461789 gta 50
461840..461916 cca 11
461928..462001 gga 8
462010..462086 aga
526984..527070 ctg + 30
527101..527186 ctc 2 ctg 52
527239..527325 ctg
578049..578123 ggc
636984..638548 16s @2 94
638643..638719 atc 66
638786..638861 gca 273
639135..642040 23s 139
642180..642296 5s
712229..712304 cac 18
712323..712398 caa 3
712402..712477 aaa 16
712494..712577 cta
comp 724421..724497 gtc
774880..774956 gac 4
774961..775036 ttc 8
775045..775119 ggc 9
775129..775202 tgc 13
775216..775304 tta
796654..796728 cgg
842393..842469 gac 2
842472..842547 ttc 8
842556..842630 ggc 9
842640..842713 tgc
889670..889746 ccc
906136..906210 aac
1022783..1022859 gac 2
1022862..1022936 ggc 1
1022938..1023011 tgg
1555201..1555277 ccg
comp 1567911..1567999 tca
comp 1613773..1613863 agc
1702659..1702744 ttg
comp 1711770..1711886 5s 228
comp 1712115..1715021 23s 359
comp 1715381..1716945 16s
comp 1823852..1823927 gta 6
comp 1823934..1824008 gaa 8
comp 1824017..1824092 aag
1909446..1909536 tcc
comp 1911342..1911429 tcg
comp 1974984..1975058 atgi
comp 1984782..1984856 gag 12
comp 1984869..1984942 cag + 111
comp 1985054..1985127 cag 2 cag
comp 2072279..2072395 5s 228
comp 2072624..2075529 23s 298
comp 2075828..2075903 gca 66
comp 2075970..2076046 atc 94
comp 2076141..2077705 16s
2148343..2148418 gcg
comp 2287117..2287192 aaa
comp 2303018..2303094 gtg
comp 2323563..2323636 ggg

afn cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.afn. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
afn cumuls	opérons		effectif
avec rRNA	opérons		6
		16 23 5s 0	4
		16 atc gca	2
		16 23 5s a	0
		max a		2
		a doubles	0
		spéciaux	0
		total aas	4
sans 		opérons		29
		1 aa		20
		max a		6
		a doubles	2
		total aas	56
total aas			60
remarques			2

afn blocs

modifier
N1. afn blocs
16s 359 1565 359 1565 251 1565
23s 228 2906 228 2907 229 2907
5s 117 117 117
16s 94 1565 5s 228 117
atc 66 23s 298 2906
gca 273 gca 66
23s 139 2906 atc 94
5s 117 16s 1565
5s 228 117
23s 359 2907
16s 1565

afn remarques

modifier
  • Lien tableur: afn remarques
  • Remarques : 4 blocs 16-23-5s sans aas et très peu de doubles. Très simple.
    1. @ 4 blocs 16-23-5s sans aas .
      - 3 opérons ont leurs intercalaires identiques, 359 228.
      - 1 opéron a son intercalaire 16s-23s diminué de 30%, 108/359, l’autre intercalaire est commune aux 4 opérons.
    2. @ 2 blocs 16-atc gca 23s-5s, classiques mais sans aas en plus.
      - 3 intercallaires sont identiques et celui entre 23s-5s varie du simple au double, 94 66 298 228 et 94 66 273 139.
  • Séquences des doubles : Très peu de doubles, 2 opérons à 2aas et plus sur 11 ont des doubles.
    - 2 doublets au total: opéron ctc + 2ctg et opéron gag + 2cag.

afn distribution

modifier
  • Lien tableur: afn distribution
  • Notes:
    - cag2 est un double, en gras
    - ggc est composé de 1 1aa et 3 >1aa, les autres soulignés contiennent 1 et 1 respectivement.
Cl9 afn, Acidaminococcus fermentans DSM 20731. Negativicutes.
Cl91 distribution du total
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 2 tac 1 tgc 2
atc 2 acc 1 aac 2 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca 2 gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg 1 cag 2 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
clos >1aa 1aa -5s +5s -16s +16s total
afn 36 20 4 60
Cl92 afn, distribution des solitaires
g1    t1       
atgi 1 tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc 1 tac tgc
atc acc aac 1 agc 1
ctc ccc 1 cac cgc 1
gtc 1 gcc 1 gac ggc 1
tta tca 1 taa tga
ata aca aaa 1 aga
cta cca caa cga
gta gca gaa gga
ttg 1 tcg 1 tag tgg
atgj acg 1 aag agg 1
ctg ccg 1 cag cgg 1
gtg 1 gcg 1 gag ggg 1
afn >1aa 1aa -5s +5s -16s +16s total
type 20 20
Cl93 afn, distribution des >1aa et duplicata
g1    t1       
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc acc 1 aac 1 agc
ctc 1 ccc cac 1 cgc
gtc gcc gac 3 ggc 3
tta 1 tca taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca gaa 2 gga 1
ttg tcg tag tgg 1
atgj 1 acg aag 1 agg
ctg 2 ccg cag 2 cgg
gtg gcg gag 1 ggg
ade >1aa dupli -5s +5s -16s +16s total
type 34 2 36

afn. Intergen51

modifier

Intergen51. afn. Le génome

modifier
  • afn Le prélèvement: Artb
  • Le nom et le lien NCBI: afn, Acidaminococcus fermentans DSM 20731, NCBI [30], date 30.08.20.
  • afn La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
afn	242,270		2,329,769	10.4	
afn données intercalaires
modifier
afn données intercalaires 200
modifier
afn autres intercalaires aas
modifier

Intergen51. afn. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. afn les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étafn ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étafn le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étafn le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 afn les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,376 303 9 1,688 4.8 43 8 51
x 344 4 2 350 0 4 4
t 1,720 307 11 2,038 43 12 55
% 84.4 15.1 0.5
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 45 0 0 45 3.8 tRNA-CDS 57 37
x 12 0 0 12 RNA-RNA 43 28
t 57 0 0 57 CDS-rRNA 12 8
% 100.0 0.0 0.0 non RNA 42 27
- total 154 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 45 0 0 45 3.8 tRNA-CDS 57 37
x 12 0 0 12 RNA-RNA 43 28
t 57 0 0 57 CDS-rRNA 12 8
% 100.0 0.0 0.0 non RNA 42 27
- total 154 100

Intergen51. afn. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: afn données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées afn fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. afn fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	afn
R2	x3		x2		x		c		Inflexion poly3	x	c
0.471	2.75E-06	-2.14E-03	3.98E-01	14.50	fx1	abscisse	276.0	164.2
0.722	-9.09E-06	6.80E-03	-1.62E+00	131.0	fc1	ordonnée	1.0	19.8
								
0.537	1.92E-06	-1.59E-03	2.95E-01	19.0	fx41			
0.893	1.06E-06	-5.22E-04	-3.39E-02	34.7	fc41
  • Le rfin après 400 est de 54 sur un total de 1385 . Jusqu'à 1% les freq10 sont en continu jusqu'à 670 , reste 14 . L'indice i.rfin1 = 40/270=0,148.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	afn		calculs			poly3	afn
effect	1385		R2.21	799		abscis	400
xm	40		pte	13,20		flexa	151
ym	4		cste	3,42		flexo	2,08
x1m	183		r400l	217		xm	44
y1m	1		restp	210,83		sup4	102,4
rfin	38,99		%sd	34,18		sup4t	299,6
bornf	140		lond	143		%	34,2
supd	125,1		%sf	31,96		long	107
supdt	366,1		lonf	100		R2	437
xmp	423,10		sf/lf	0,92			
r400	171,84		sr/lr	0,77			
supf	92,1		sd/ld	0,87			
supft	288,1		i.r400	0,79									

Intergen51. afn. Les CDS-CDS négatifs

modifier
Sous-totaux	afn			totale	
fréquence	x-	c-		x-	c-
 - 1		0	38		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		1	129		717	10938
 - 5		0	0		5	19
sp6		3	136		1642	8424
total		4	303		2,456	23,544
reste		1	9		264	420
s6		1	2		361	41
s7		1	20		321	1438
s8		0	105		696	6525
rapport s1-5						
4/2/1		-	3.4		8.4	2.6
% / sp6						
s6/sp6		33.3	1.5		22.0	0.5
s7/sp6		33.3	14.7		19.5	17.1
s8/sp6		0.0	77.2		42.4	77.5
reste/sp6	33.3	6.6		16.1	5.0
						
total s1-5	1	167		814	15120
% / total						
%s1-5		25.0	55.1		33.1	64.2
%sp6		75.0	44.9		66.9	35.8

Intergen51. afn. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		6			CDS 16s		6	
16s 23s		4			5s CDS		2	4
16s tRNA	2			16 CDS			
tRNA 23s	2			CDS 5s			
5s tRNA					23s CDS			
tRNA in		2			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	27			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		43	0		total		8	4
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clafn et dans l'étude.

Intergen51. afn. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 afn. Les intercalaires tRNA-tRNA hors blocs
inter aa       inter aa
22 aca 4 gac
5 tac 8 ttc
3 atgj 9 ggc
6 acc 13 tgc
** atgf ** tta
3 aac 2 gac
8 gaa 8 ttc
50 gta 9 ggc
11 cca ** tgc
8 gga 2 gac
** aga 1 ggc
30 ctg ** tgg
52 ctc 6 gta
** ctg 8 gaa
18 cac ** aag
3 caa 12 gag
16 aaa 111 cag
** cta ** cag

afn intercalaires entre cds

modifier
  • Lien NCBI [31]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

afn intercalaires positifs S+

modifier
afn. Sx+ Sc+ Les diagrammes 400
afn Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 29 -227 419 16 486 261 max40,140 -95 712 -1690 137 722 250 min50
31 à 400 2 parties 9.5 -42 -63 38 904 147 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 75 40 - 303 poly 183 tF 197 65 425 poly 297 SF
31 à 400 92 36 - 859 dte 45 tm
  • Légende du tableau corrélations et fréquences faibles
afn. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
rtb min30 118 402 520 536 -105 148 253 -277 -165 202
afn min10 328 1322 1650 607 -17 108 125 -467 -407 -8
mba min10 705 1651 2356 154 -330 -221 109 -512 -477 -223
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
51 294 0.17 189 604 5 7 21 162 8 131 -81
46 402 0.11 350 1688 6 5 11 180 36 580 -369
45 214 0.21 1255 2688 1 8 18 114 51 428 -74
  • Diagrammes 400:  afn rtb,   diagramme 1-40: c+ afnc+ rtbtotal,   texte: rtb.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - afn est un génome bien particulier. Dans les diagrammes x+ 1-400, il appartient au groupe à pyramide et à tilde fort, tF, donc un tilde non régulier et possède un minimum local à la fréquence 10 comme tout le groupe à pyramide qui a ce minimum entre 10 et 40. Mais il possède 2 pyramides à 40 et 140 alternant avec 2 creux profonds à 70 et 180, au lieu d’une seule pyramide pour les autres. Avec sa faible corrélation de 101 sur 41-250, il ressemble plus, dans son groupe, à rtb avec une corrélation de 148, plutôt qu’à spl ou abra avec respectivement 797 et 784.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 génomes se différencient avant tout par leurs pyramides, rtb en a une seule à 5 fréquences avec un maximum à 80 et afn en a 2 à 3 et 4 fréquences avec des maxima À 40 et 140 respectivement, alternant avec 2 creux profonds avec des minima à 70 et 180.
      + Les fréquences faibles 1-30 sont en opposition avec celles des c+1-400 pour les 2 génomes. Cette différence va impacter fortement leurs corrélations 1-n qu’on verra plus loin.
      + Les points d’inflexion sont normaux, 246 pour rtb contre 261 pour afn.
    • c+ 1-400: Ce sont 2 courbes semblables de forme S, moyenne pour rtb avec un R2’ de 82 et forte pour afn avec un R2’ de 297. Les 2 points d’inflexion sont normaux, 258 pour rtb et 250 pour afn. Les fréquences faibles sont concentrées aux fréquences 10 et 20 pour les 2 génomes et les minima locaux sont à la fréquence 50 pour tout les 2. La différence des effectifs, 402 pour rtb et 1323 pour afn explique la différence de forme avec des R2 très différents, 569 pour rtb et 722 pour afn.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30. Quand j’enlève ces fréquences il y a un changement dans la forme de afn qui passe de tF 183 (R2 486 et 303) à Sf 12 (R2 541 et 529) alors que rtb passe de la forme tF 191 (R2 496 et 304) à la forme tm 41 (R2 515 et 474). Ce sont de faibles changement par rapport à leurs faibles totaux en effectif, 118 pour rtb contre 328 pour afn.
    • c+ 31-400: Les 2 formes sont 2 tildes très différents , tF pour rtb, avec un R2’ de 190 (788 598) et moyen pour afn, tm, R2’ de 45 (904 859). Les points d’inflexion sont aussi différents, il est normal pour rtb à la fréquence 228 et plus faible pour afn à 147. Les effectifs de ces diagrammes sont de 284 pour rtb et 790 pour afn.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont du même ordre de grandeur, 148 pour rtb contre 101 pour afn. Par contre rtb chute fortement sur 41-200, avec une différence de 253, alors que afn le fait moins avec une différence de 127.
    • Sur les plages 1-n: les 2 génomes chutent fortement, -165 pour rtb et -407 pour afn
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Ici rtb et afn se comportent de la même façon, respectivement, le rapport x+/c+ fait 0.17 et 0.11, les zéros font 12‰ et 11‰ et les négatifs 183‰ et 190‰.
    - Les courbes 1-40:
    • c+ 1-40: La courbe afn est semblable et très proche de celle du total des c+ 1-40; celle de rtb le devient aussi en omettant les fréquences 6 et 10.
    • x+ 1-40: Avec un effectif de 8 pour rtb et 51 pour afn les courbes ne peuvent pas être significatives.

afn autres intercalaires

modifier
tRNA-cds		tRNA-tRNA		autres-cds		total
c+	x+	c-	c+	x+	c-	c+	x+	nc-tRNA	
51	16		43			37	6	1	154

  • - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

afn par rapport au groupe de référence

modifier
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
afn 1aa >1aa dup +5s 1-3aas autres total
21 faible 11 3 2 16
16 moyen 5 12 4 21
14 fort 4 19 23
20 34 2 4 60
10 g+cga 6 2 2 10
2 agg+cgg 2 2
4 carre ccc 3 1 4
5 autres
11 3 2 16
total tRNAs ‰
afn 1aa >1aa dup +5s 1-3aas autres afn ‰ ref.‰
21 faible 183 50 33 267 26
16 moyen 83 200 0 67 350 324
14 fort 67 317 0 383 650
333 567 33 67 60 729
10 g+cgg 100 33 33 167 10
2 agg+cga 33 33
4 carre ccc 50 17 67 16
5 autres
183 50 33 267
blocs tRNAs ‰ total colonne %
afn 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 196 54 36 286 26 55 9
16 moyen 89 214 304 324 25 35
14 fort 71 339 411 650 20 56
357 607 36 56 729 20 34
10 g+cgg 107 36 36 179 10 55
2 agg+cga 36 36 18
4 carre ccc 54 18 71 16 27
5 autres
196 54 36 286 11

negativicutes distribution

modifier
  • Lien tableur: negativicutes distribution
  • Liens fiche:   1-3aas9-23aas
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs
  • Notes: attention tableau neg4, atc est négatif et n'est pas contenu dans le total de 423. Le tableau neg4 est égal à neg1-neg2-neg3. Dans neg2 le rouge est totalement +16s.
neg Negativicutes 9 génomes
neg1 total du 22.1.21 de gtRNAdb
g1    t1       
atgi 8 tct tat atgf 15
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 17 tcc 10 tac 16 tgc 13
atc 17 acc 11 aac 26 agc 11
ctc 11 ccc 7 cac 10 cgt 16
gtc 8 gcc 7 gac 24 ggc 33
tta 11 tca 10 taa tga 1
ata aca 13 aaa 20 aga 9
cta 9 cca 11 caa 13 cga 2
gta 24 gca 21 gaa 25 gga 10
ttg 11 tcg 9 tag tgg 13
atgj 12 acg 9 aag 10 agg 9
ctg 10 ccg 7 cag 11 cgg 9
gtg 4 gcg 5 gag 5 ggg 8
9-23aas inter max min total
186 263 122 571
neg2 distribution des 1-3aas
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc
atc 18 acc aac 6 agc 1
ctc ccc cac cgt 2
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa 1 cga
gta gca 21 gaa 1 gga
ttg tcg tag tgg 4
atgj acg 1 aag agg
ctg ccg cag cgg
gtg gcg gag ggg
1-3aas inter max min total
7 11 1 19
neg3 distribution des 9-23aas
g1    t1       
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 6 tcc 2 tac 3 tgc 2
atc 1 acc aac 5 agc 2
ctc 2 ccc cac 3 cgt 4
gtc gcc gac 7 ggc 3
tta 4 tca 1 taa tga
ata aca 5 aaa 5 aga
cta 1 cca 2 caa 5 cga
gta 7 gca gaa 5 gga 4
ttg 2 tcg tag tgg 2
atgj 1 acg aag 2 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
9-23aas inter max min total
24 64 4 92
neg4 distribution des -rRNA
g1    t1       
atgi 7 tct tat atgf 12
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 11 tcc 8 tac 12 tgc 11
atc -2 acc 11 aac 15 agc 8
ctc 9 ccc 7 cac 5 cgt 10
gtc 8 gcc 7 gac 17 ggc 30
tta 7 tca 9 taa tga 1
ata aca 8 aaa 15 aga 9
cta 8 cca 9 caa 7 cga 2
gta 17 gca 0 gaa 19 gga 6
ttg 9 tcg 9 tag tgg 7
atgj 11 acg 8 aag 8 agg 9
ctg 8 ccg 7 cag 11 cgg 9
gtg 4 gcg 5 gag 5 ggg 8
-rRNA inter max min total
118 188 117 423
  • Discussion
    - La comparaison avec le classement des tRNAs montre que les effectifs élevés des -rRNAs correspondraient à des duplications. Il faut tenir compte aussi des doubles qui ne sont pas des duplications comme dans le génome afn avec le bloc ctg ctc ctg.
    - pour les 1-3aas aac est élevé alors que atgf est absent.
    - Les tRNAs faibles (cyan) seraient plutôt des 1aa.
    - La méthode de comparaison, ici, sans passer par les indices, c'est-à-dire une fiche de la totalité des génomes, montre qu'il y a des différences entre le décompte total et la fiche des +rRNAs. Notamment pour le +16s atc avec une valeur négative dans la différence. Pour les comparaions avec indices, pour les autres clades, il faut que ces valeurs négatives soient les plus petites possible en valeur absolue. Sinon il faut vérifier les calculs et les relevés. Voir la comparaison du clade avec le tRNA afn.

negativicutes, estimation des -rRNAs

modifier
  • Lien tableur: negativicutes, estimation des -rRNAs
  • Liens fiche:   1-3aas9-23aas
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

negativicutes, calcul des -rRNAs

modifier
neg Negativicutes 9 génomes
neg1 cumul des +rRNAs de la fiche négativicutes pour 9 génomes
g1    t1        0  0
atgi 1 tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 6 tcc 2 tac 4 tgc 2
atc 18 acc aac 11 agc 3
ctc 2 ccc cac 5 cgt 6
gtc gcc gac 7 ggc 3
tta 4 tca 1 taa tga
ata aca 5 aaa 5 aga
cta 1 cca 2 caa 6 cga
gta 7 gca 21 gaa 6 gga 4
ttg 2 tcg tag tgg 6
atgj 1 acg 1 aag 2 agg
ctg 2 ccg cag cgg
gtg gcg gag ggg
nega9 inter max min total
69 75 5 149
neg2 indices du clade negativicutes du 22.1.21 de gtRNAdb pour 100 génomes
g1    t1        0  0
atgi 89 tct tat atgf 167
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 189 tcc 111 tac 178 tgc 144
atc 189 acc 122 aac 289 agc 122
ctc 122 ccc 78 cac 111 cgt 178
gtc 89 gcc 78 gac 267 ggc 367
tta 122 tca 111 taa tga 11
ata aca 144 aaa 222 aga 100
cta 100 cca 122 caa 144 cga 22
gta 267 gca 233 gaa 278 gga 111
ttg 122 tcg 100 tag tgg 144
atgj 133 acg 100 aag 111 agg 100
ctg 111 ccg 78 cag 122 cgg 100
gtg 44 gcg 56 gag 56 ggg 89
gtRNA inter max min total
2667 2922 1356 6344
neg3 cumul des -rRNAs de l'annexe afn pour 1 génome
g1    t1        0  0
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc acc 1 aac 2 agc 1
ctc 1 ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 3 ggc 4
tta 1 tca 1 taa tga
ata aca 1 aaa 2 aga 1
cta 1 cca 1 caa 1 cga
gta 2 gca gaa 2 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 2 ccg 1 cag 2 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
afn inter max min total
16 24 16 56
neg4 indices des +rRNAs de la fiche negativicutes pour 100 génomes
g1    t1        0  0
atgi 11 tct tat atgf 33
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 67 tcc 22 tac 44 tgc 22
atc 200 acc aac 122 agc 33
ctc 22 ccc cac 56 cgt 67
gtc gcc gac 78 ggc 33
tta 44 tca 11 taa tga
ata aca 56 aaa 56 aga 1
cta 11 cca 22 caa 67 cga
gta 78 gca 233 gaa 67 gga 44
ttg 22 tcg tag tgg 67
atgj 11 acg 11 aag 22 agg 1
ctg 22 ccg cag cgg 1
gtg gcg gag ggg 1
nega9 inter max min total
767 833 56 1656
neg5 estimation des -rRNA du clade negativicutes pour 100 génomes
g1    t1       
atgi 78 tct tat atgf 133
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 122 tcc 89 tac 133 tgc 122
atc -11 acc 122 aac 167 agc 89
ctc 100 ccc 78 cac 56 cgt 111
gtc 89 gcc 78 gac 189 ggc 333
tta 78 tca 100 taa tga 11
ata aca 89 aaa 167 aga 100
cta 89 cca 100 caa 78 cga 22
gta 189 gca 0 gaa 211 gga 67
ttg 100 tcg 100 tag tgg 78
atgj 122 acg 89 aag 89 agg 100
ctg 89 ccg 78 cag 122 cgg 100
gtg 44 gcg 56 gag 56 ggg 89
-rRNA inter max min total
1300 2089 1300 4689
neg6 indices des -rRNAs de l'annexe afn pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 100
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 200 tcc 100 tac 100 tgc 200
atc acc 100 aac 200 agc 100
ctc 100 ccc 100 cac 100 cgt 100
gtc 100 gcc 100 gac 300 ggc 400
tta 100 tca 100 taa tga
ata aca 100 aaa 200 aga 100
cta 100 cca 100 caa 100 cga
gta 200 gca gaa 200 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 100 acg 100 aag 100 agg 100
ctg 200 ccg 100 cag 200 cgg 100
gtg 100 gcg 100 gag 100 ggg 100
afn inter max min total
1600 2400 1600 5600

negativicutes, comparaison clade-annexe des -rRNAs

modifier
  • Lien tableur: negativicutes, comparaison clade-annexe des -rRNAs
  • Légende
    - neg7. diff, somme des couleurs de neg7. La différence entre tRNAs est faite entre neg5 et neg6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - neg8. rap, rapport des sommes couleurs neg5/neg2. Le rapport -rRNA/total est celui du tRNA de neg5 sur celui de neg2.
  • Fréquences des différences en % du tableau neg7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence		2	11	13	9	5	3	2	0	0	0	3	0	48
tot ≤ 50							41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 10% au dessus de celle de la fiche des negativicutes.
tRNAs		fiche		annexe
sans		456		56
avec		152		4
genomes		9		1
indice %	51		56
neg Negativicutes 9 génomes
neg7 negativicutes, différence clade-annexe des -rRNAs
g1    t1       
atgi 22 tct tat atgf 25
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 39 tcc 11 tac 25 tgc 39
atc 100 acc 18 aac 17 agc 11
ctc 0 ccc 22 cac 44 cgt 10
gtc 11 gcc 22 gac 37 ggc 17
tta 22 tca 0 taa tga 100
ata aca 11 aaa 17 aga 0
cta 11 cca 0 caa 22 cga 100
gta 6 gca gaa 5 gga 33
ttg 0 tcg 0 tag tgg 22
atgj 18 acg 11 aag 11 agg 0
ctg 56 ccg 22 cag 39 cgg 0
gtg 56 gcg 44 gag 44 ggg 11
diff inter max min total
275 263 294 833
neg8 negativicutes, rapports -rRNA/total
g1    t1       
atgi 88 tct tat atgf 80
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 65 tcc 80 tac 75 tgc 85
atc -6 acc aac 58 agc 73
ctc 82 ccc cac 50 cgt 62
gtc gcc gac 71 ggc 91
tta 64 tca 90 taa tga
ata aca 62 aaa 75 aga
cta 89 cca 82 caa 54 cga
gta 71 gca 0 gaa 76 gga 60
ttg 82 tcg tag tgg 54
atgj 92 acg 89 aag 80 agg
ctg 80 ccg cag cgg
gtg gcg gag ggg
rap inter max min total
63 71 96 74

clostridia synthèse

modifier

clostridia distribution par génome

modifier
clostridia distribution par génome
baci >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
psor 12 5 4 72 7 4 104
cdc 4 4 2 70 3 83
cdc8 4 5 2 89 4 4 108
cbc* 34 10 0 0 2 6 54
cbn 48 12 2 6 3 4 4 7 90
cle 38 19 26 3 9 2 8 107
hmo 37 12 39 11 10 109
cbei 63 11 3 0 4 12 93
total 240 78 13 302 6 42 8 51 748

clostridia distribution du total

modifier
  • Lien tableur: clostridia distribution du total
  • Légende:
    - Couleurs du 1er tableau: voir la distribution des bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
    - Couleurs du 3ème tableau: comme le tableau 2. Cependant les duplicata ne sont pas comptés dans le total de 55 mais dans le total des >1aa du 1er tableau.
    - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Clostridia. Distribution du total.
clostridia. Distribution du total: >1aa 1aa +5s >3.
g1    t1       
atgi 10 tct tat atgf 32
att act aat agt
ctt 3 cct cat cgt
gtt gct gat ggt
ttc 19 tcc 7 tac 23 tgc 16
atc 3 acc 9 aac 22 agc 13
ctc 3 ccc 4 cac 16 cgc 11
gtc 4 gcc 1 gac 32 ggc 20
tta 22 tca 19 taa tga 3
ata 1 aca 30 aaa 31 aga 24
cta 19 cca 25 caa 22 cga 4
gta 41 gca gaa 36 gga 29
ttg 9 tcg 2 tag tgg 11
atgj 23 acg 4 aag 6 agg 6
ctg 6 ccg 2 cag 4 cgg 1
gtg 1 gcg 1 gag 4 ggg 3
clos8 >1aa 1aa -5s +5s -16s +16s total
type 248 78 302 628
clostridia. Distribution du total. -16s +5s <4
g1    t1       
atgi 8 tct tat atgf 2
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc 1 tac tgc 1
atc 1 acc 1 aac 7 agc 1
ctc 1 ccc cac cgc
gtc gcc gac 1 ggc 4
tta 4 tca 1 taa tga
ata aca aaa 6 aga 1
cta cca caa cga
gta gca 5 gaa 2 gga 2
ttg tcg tag tgg 1
atgj acg aag agg
ctg ccg cag cgg 1
gtg gcg gag ggg
clos8 >1aa 1aa -5s +5s -16s +16s total
type 51 6 57
clostridia. Distribution du total. duplica -5s +16s
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt 2 cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc 2
atc 11 acc aac 5 agc
ctc ccc cac cgc
gtc gcc 5 gac ggc
tta tca 2 taa tga
ata aca 3 aaa aga
cta cca caa cga
gta gca 26 gaa gga 5
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
clos8 dupli 1aa -5s +5s -16s +16s total
type 8 13 42 55
clostridia. indices du 27.5.20 174 génomes
g1 t1 618 11144 4,0  0,6
atgi 159 tct 1,1 tat atgf 187
att 1,1 act aat agt 0,6
ctt 15,5 cct 2,3 cat cgc
gtt 0,6 gct gat ggt
ttc 206 tcc 103 tac 187 tgc 151
atc 152 acc 102 aac 248 agc 133
ctc 81 ccc 62 cac 140 cgt 116
gtc 53 gcc 61 gac 242 ggc 220
tta 172 tca 142 taa 1,1 tga 55
ata 2,9 aca 218 aaa 271 aga 174
cta 148 cca 163 caa 156 cga 48
gta 286 gca 219 gaa 239 gga 243
ttg 108 tcg 83 tag 2,3 tgg 120
atgj 132 acg 77 aag 120 agg 96
ctg 76 ccg 64 cag 77 cgg 60
gtg 34 gcg 35 gag 83 ggg 70
inter max min total

clostridia distribution par type

modifier
Clostridia. Distribution par type.
clostridia. distribution des solitaires
g1    t1          
atgi 1 tct tat atgf 1
att act aat agt 1
ctt 1 cct cat cgt
gtt gct gat ggt
ttc 1 tcc 6 tac tgc 1
atc acc 3 aac 1 agc 3
ctc 2 ccc 1 cac cgc 1
gtc gcc 1 gac ggc
tta tca 1 taa tga 3
ata 1 aca 2 aaa aga
cta 5 cca 4 caa cga 1
gta gca gaa gga 1
ttg 8 tcg 2 tag tgg 5
atgj acg 4 aag 1 agg 5
ctg 3 ccg 1 cag 3 cgg
gtg gcg 1 gag 3 ggg
clos8 1aa 78
clostridia. distribution du type >1aa sans duplicata.
g1    t1          
atgi tct tat atgf 8
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 6 tcc tac 10 tgc 3
atc acc 3 aac 5 agc 5
ctc 1 ccc 1 cac 8 cgc 3
gtc 2 gcc gac 15 ggc 11
tta 11 tca 6 taa tga
ata aca 15 aaa 14 aga 10
cta 6 cca 10 caa 8 cga 3
gta 20 gca gaa 17 gga 13
ttg 1 tcg tag tgg 2
atgj 10 acg aag 5 agg 1
ctg 1 ccg cag 1 cgg 1
gtg 1 gcg gag ggg 3
clos8 >1aa 240
clostridia. distribution du type +5s >3.
g1    t1          
atgi 9 tct tat atgf 11
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 12 tcc 1 tac 13 tgc 10
atc 3 acc 3 aac 16 agc 5
ctc ccc 2 cac 8 cgc 7
gtc 2 gcc gac 17 ggc 9
tta 11 tca 10 taa tga
ata aca 13 aaa 17 aga 14
cta 8 cca 11 caa 14 cga
gta 21 gca gaa 19 gga 15
ttg tcg tag tgg 4
atgj 13 acg aag agg
ctg 2 ccg 1 cag cgg
gtg gcg gag 1 ggg
clos8 +5s 302

clostridia par rapport au groupe de référence

modifier
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
clos8 1aa >1aa dup +5s 1-3aas autres total
21 faible 31 19 2 6 2 5 65
16 moyen 36 66 4 101 20 42 269
14 fort 11 155 2 195 29 14 406
78 240 8 302 51 61 740
10 g+cga 16 13 2 31
2 agg+cgg 5 2 1 8
4 carre ccc 4 4 4 1 5 13
5 autres 6 2 8
31 19 2 6 2 5 65
total tRNAs ‰
clos8 1aa >1aa dup +5s 1-3aas autres clos ‰ ref.‰
21 faible 42 26 3 8 3 7 88 26
16 moyen 49 89 5 136 27 57 364 324
14 fort 15 209 3 264 39 19 549 650
105 324 11 408 69 82 740 729
10 g+cga 22 18 3 42 10
2 agg+cgg 7 3 1 11
4 carre ccc 5 5 5 1 7 18 16
5 autres 8 0 3 0 11
42 26 3 8 3 7 88
blocs tRNAs ‰ total colonne %
clos8 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 95 58 6 160 26 40 8
16 moyen 110 202 12 325 324 46 28
14 fort 34 475 6 515 650 14 65
239 736 25 326 729 78 240
10 g+cga 49 40 89 10 52
2 agg+cgg 15 6 21 16
4 carre ccc 12 12 25 16 13
5 autres 18 6 25 19
95 58 6 160 31

clostridia, estimation des -rRNAs

modifier
  • Lien tableur: clostridia, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 27.5.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

clostridia, calcul des -rRNAs

modifier
clo clostridia 63 génomes
clo1 cumul des +rRNAs de la fiche clostridia pour 43 génomes
g1    t1       
atgi 29 tct tat atgf 30
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 44 tcc 1 tac 26 tgc 16
atc 72 acc 10 aac 64 agc 11
ctc 2 ccc 3 cac 12 cgt 8
gtc 4 gcc 12 gac 40 ggc 23
tta 19 tca 13 taa tga
ata aca 29 aaa 48 aga 21
cta 18 cca 17 caa 25 cga 1
gta 38 gca 92 gaa 45 gga 31
ttg tcg 1 tag tgg 9
atgj 18 acg 3 aag 2 agg 1
ctg 5 ccg 2 cag 1 cgg 3
gtg 1 gcg gag 4 ggg 2
clos43 inter max min total
346 468 42 856
clo2 indices du clade clostridia du 27.5.20 de gtRNAdb pour 100 génomes
g1    t1      174 4.0  0.6
atgi 159 tct 1.1 tat atgf 187
att 1.1 act aat agt 0.6
ctt 16 cct 2.3 cat cgc
gtt 0.6 gct gat ggt
ttc 206 tcc 103 tac 187 tgc 151
atc 152 acc 102 aac 248 agc 133
ctc 81 ccc 62 cac 140 cgt 116
gtc 53 gcc 61 gac 242 ggc 220
tta 172 tca 142 taa 1.1 tga 55
ata 2.9 aca 218 aaa 271 aga 174
cta 148 cca 163 caa 156 cga 48
gta 286 gca 219 gaa 239 gga 243
ttg 108 tcg 83 tag 2.3 tgg 120
atgj 132 acg 77 aag 120 agg 96
ctg 76 ccg 64 cag 77 cgg 60
gtg 34 gcg 35 gag 83 ggg 70
gtRNA inter max min total
2231 2982 1177 6390
clo3 cumul des -rRNAs de l'annexe archeo 8 génomes
g1    t1       
atgi 1 tct tat atgf 11
att act aat agt 1
ctt 3 cct cat cgc
gtt gct gat ggt
ttc 7 tcc 6 tac 10 tgc 6
atc acc 6 aac 6 agc 8
ctc 3 ccc 2 cac 8 cgt 4
gtc 2 gcc 1 gac 15 ggc 11
tta 11 tca 9 taa tga 3
ata 1 aca 17 aaa 14 aga 10
cta 11 cca 14 caa 8 cga 4
gta 20 gca gaa 17 gga 14
ttg 9 tcg 2 tag tgg 7
atgj 10 acg 4 aag 6 agg 6
ctg 4 ccg 1 cag 4 cgg 1
gtg 1 gcg 1 gag 3 ggg 3
clos8 inter max min total
107 168 51 326
clo4 indices des +rRNAs de la fiche clostridia pour 100 génomes
g1    t1       
atgi 67 tct tat atgf 70
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 102 tcc 2.3 tac 60 tgc 37
atc 167 acc 23 aac 149 agc 26
ctc 4.7 ccc 7 cac 28 cgt 19
gtc 9.3 gcc 28 gac 93 ggc 53
tta 44 tca 30 taa tga 3.0
ata aca 67 aaa 112 aga 49
cta 42 cca 40 caa 58 cga 2.3
gta 88 gca 214 gaa 105 gga 72
ttg tcg 2.3 tag tgg 21
atgj 42 acg 7.0 aag 4.7 agg 2.3
ctg 12 ccg 4.7 cag 2.3 cgg 7.0
gtg 2.3 gcg gag 9.3 ggg 4.7
clos43 inter max min total
805 1088 98 1991
clo5 estimation des -rRNA du clade clostridia pour 100 génomes
g1    t1       
atgi 92 tct 1.1 tat atgf 117
att 1.1 act aat agt 0.6
ctt 16 cct 2.3 cat cgc
gtt 0.6 gct gat ggt
ttc 104 tcc 101 tac 127 tgc 114
atc -15 acc 79 aac 99 agc 107
ctc 76 ccc 55 cac 112 cgt 97
gtc 44 gcc 33 gac 149 ggc 167
tta 128 tca 112 taa 1.1 tga 55
ata 2.9 aca 151 aaa 159 aga 125
cta 106 cca 123 caa 98 cga 46
gta 198 gca 5 gaa 134 gga 171
ttg 108 tcg 81 tag 2.3 tgg 99
atgj 90 acg 70 aag 115 agg 94
ctg 64 ccg 59 cag 75 cgg 53
gtg 32 gcg 35 gag 74 ggg 65
-rRNA inter max min total
1426 1894 1080 4400
clo6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 13 tct tat atgf 138
att act aat agt 13
ctt 38 cct cat cgc
gtt gct gat ggt
ttc 88 tcc 75 tac 125 tgc 75
atc acc 75 aac 75 agc 100
ctc 38 ccc 25 cac 100 cgt 50
gtc 25 gcc 13 gac 188 ggc 138
tta 138 tca 113 taa tga 38
ata 13 aca 213 aaa 175 aga 125
cta 138 cca 175 caa 100 cga 50
gta 250 gca gaa 213 gga 175
ttg 113 tcg 25 tag tgg 88
atgj 125 acg 50 aag 75 agg 75
ctg 50 ccg 13 cag 50 cgg 13
gtg 13 gcg 13 gag 38 ggg 38
clos8 inter max min total
1325 2100 638 4063

clostridia, comparaison clade-annexe des -rRNAs

modifier
  • Lien tableur: clostridia, comparaison clade-annexe des -rRNAs
  • Légende
    - clo7. diff, somme des couleurs de clo7. La différence entre tRNAs est faite entre clo5 et clo6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - clo8. rap, rapport des sommes couleurs clo5/clo2. Le rapport -rRNA/total est celui du tRNA de clo5 sur celui de clo2.
  • Fréquences des différences en % du tableau clo7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	11	6	10	5	4	3	4	3	1	2	0	49
tot ≤ 50						41							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 15% en dessous de celle de la fiche des clostridia.
tRNAs		fiche		annexe
sans		2050		326
avec		888		752
genomes		43		8
indice %	48		41
clo clostridia 63 génomes
clo7 clostridia, différence clade-annexe des -rRNAs
g1    t1       
atgi 86 tct 100 tat atgf 15
att 100 act aat agt 95
ctt 59 cct 100 cat cgc
gtt 100 gct gat ggt
ttc 16 tcc 26 tac 1 tgc 34
atc 100 acc 5 aac 24 agc 7
ctc 51 ccc 55 cac 11 cgt 49
gtc 43 gcc 62 gac 21 ggc 17
tta 7 tca 1 taa 100 tga 32
ata 77 aca 29 aaa 9 aga 0
cta 23 cca 29 caa 2 cga 9
gta 21 gca 100 gaa 37 gga 2
ttg 4 tcg 69 tag 100 tgg 12
atgj 28 acg 29 aag 35 agg 20
ctg 22 ccg 79 cag 33 cgg 76
gtg 61 gcg 64 gag 49 ggg 43
diff inter max min total
265 272 944 1481
clo8 clostridia, rapports -rRNA/total
g1    t1       
atgi 58 tct tat atgf 63
att act aat agt 95
ctt 100 cct cat cgc
gtt gct gat ggt
ttc 50 tcc 98 tac 68 tgc 75
atc -10 acc 77 aac 40 agc 81
ctc 94 ccc 89 cac 80 cgt 84
gtc 82 gcc 54 gac 62 ggc 76
tta 74 tca 79 taa tga 100
ata 100 aca 69 aaa 59 aga 72
cta 72 cca 75.7 caa 63 cga 95
gta 69 gca 2 gaa 56 gga 70
ttg 100 tcg 97 tag tgg 83
atgj 68 acg 91 aag 96 agg 98
ctg 85 ccg 93 cag 97 cgg 88
gtg 93 gcg 100 gag 89 ggg 93
rap inter max min total
64 64 92 69

Clostridia. Intergen51

modifier

Intergen51. Clostridia. Introduction

modifier

Intergen51. Clostridia. Historique des pré-études

modifier

Intergen51. Clostridia. Formatage des résultats pour 51 génomes

modifier
  • Lien au tableur:

clostridia données intercalaires

modifier
	total	max1	reste	max2	un
psor	2350	888	12	1537	2038
cbc	2572	1013	13	2050	2620
cbn	1775	582	9	759	777
cbei	4010	1072	20	1881	2121
cdc	2589	1023	13	1588	1907
cdc8	2727	1048	14	1554	1856
cle	2900	1057	15	2271	3106
hmo	1867	738	9	1316	1644
					
afn	1385	736	7	1154	2261

clostridia données intercalaires 200

modifier

Intergen51. Clostridia. Vue de l'ensemble

modifier

Intergen51. Clostridia. La longueur totale des intercalaires d'un génome

modifier
  • Note: Les taux de ces clostridia est plutôt élevé mais 6 sur 8 ont un taux médian de 12% trouvé pour les 51 génomes de cette étude. Deux génomes, avec 18% se trouve à l'extérieur de la plage du taux médian, mais ils en restent proche notamment de cdc avec 15.5%.
Nom	intercalaires	génome		taux en %
clostridia							
cbc	696,513		3,892,029	17.9
cbei	1,199,672	6,485,394	18.5		
cbn	330,729		2,773,157	11.9		
cdc	636,447		4,110,554	15.5		
cdc8	663,874		4,308,325	15.4		
cle	615,068		4,714,237	13.0		
hmo	396,940		3,075,407	12.9		
psor	450,598		3,550,458	12.7		

Intergen51. Clostridia. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. Clostridia les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
  • Note: Les R- sont absents.
Int51.2 Clostridia les différents types d'intercalaires entre gène de 8 génomes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 20 586 2 475 204 23 265 4,0 784 111 895
x 5 726 67 3 5 796 3 33 36
t 26 312 2 542 207 29 061 787 144 931
% 90,5 8,7 0,7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 203 0 2 205 2,2 tRNA-CDS 299 21
x 94 0 0 94 RNA-RNA 787 54
t 297 0 2 299 CDS-rRNA 144 10
% 99,3 0,0 0,7 non RNA 549 38
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
c 9,1 13,2 1,8 27,3 1,5 41 0,9 1,0
x 16,6 21,3 9,0 3,5 1,1 31 0,1 0,0

Intergen51. Clostridia. Détail des intercalaires RNA-RNA et CDS-rRNA

modifier
  • Voir données intercalaires
RNA-RNA		c	x		CDS-RNA		c	x
23s5s		53			CDS 16s		67	28
16s23s		51			5s CDS		13	11
16stRNA		16			16 CDS		3	1
tRNA23s		33			CDS 5s		1	4
5stRNA		52	1		23s CDS		9	4
tRNAin		11			CDS 23s		3	
tRNAcontig	300			5s 16s		2	1
tRNAhors	202	1		16s16s			
tRNA16s		10						
23stRNA		24						
tRNA5s		10						
16s5s		19						
5s23s		1						
5s5s								
total		782	2		total		98	49

Intergen51. Clostridia. Les intercalaires rares

modifier
  • Note:
type		gen		c	x		type		gen		c	x
R0		cdc		1			CDS23s		cle		531	
-		cdc8		1			-		cle		563	
5s23s		hmo		230			-		cle		407	
5stRNA 		cdc8		-	353		23sCDS		cdc8		-	87
tRNAhors 	hmo		-	293		-		cle		188	188
5s16s		cbei		1107			-		cle		223	260
-		cbei		1125			-		cle		237	
-		cdc8		-	161		-		cle		299	
16sCDS		cdc8		2			-		cle		313	
-		cdc8		294			-		cle		322	
-		cle		695	228		-		hmo		336	109
CDS5s		cle		335	184		-		hmo		357	
-		cle		-	228		-		hmo		463	
-		cle		-	301							
-		cle		-	343							

Intergen51. Clostridia. Les diagrammes de la totale

modifier

Intergen51. Clostridia. Les diagrammes CDS-CDS et tRNA-CDS

modifier
Intergen51. Clostridia. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
  • Lien aux données intercalaires.
  • Diagrammes des clostridia:  tcl présente 4 diagrammes
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
    - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
    - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000				Calculs des f.41 et autres R2 des f.1		
R2	x3		x2		x		c			Inflexion poly3	x	c
0,897	2,07E-06	-1,72E-03	3,66E-01	6,27	fx1		abscisse	283,2	127,4
0,822	-5,27E-06	4,01E-03	-9,98E-01	93,9	fc1		ordonnée	18,9	24,7
										poly3/droite	18,4	24,2
0,896	1,86E-06	-1,58E-03	3,38E-01	7,70	fx41				
0,985	5,31E-07	-2,03E-04	-8,26E-02	37,4	fc41		R2 f.1	x	c
										Poly 3	897	822
0,707						-0,059	35,1	fx41		Poly 6	908	902
0,951						-0,082	34,6	fc41		Poly 9	921	941
0,220						-0,029	26,8	fx1				
0,573						-0,146	52,4	fc1				
Intergen51. Clostridia. Les diagrammes CDS-CDS négatifs
modifier
Intergen51. Clostridia. comparaison avec la totale
modifier
  • Lien aux données intercalaires.
  • Chez les clostridia le 4/1 est inverse de la totale, 0.9 (sans hmo, 394/437) contre 2.6 pour la totale.
Sous-totaux	clostridia		totale	
fréquence	x-	c-		x-	c-
-1		0	473		4	4140
-2		1	0		85	11
-3		0	2		3	12
-4		19	543		717	10938
-5		1	4		5	19
sp6		46	1453		1642	8424
total		67	2475		2456	23544
reste		6	44		264	420
s6		10	3		361	41
s7		10	250		321	1438
s8		20	1156		696	6525
rappot s1-5						
4/2/1		19,0	1,1		8,4	2,6
% / sp6						
s6/sp6		21,7	0,2		22,0	0,5
s7/sp6		21,7	17,2		19,5	17,1
s8/sp6		43,5	79,6		42,4	77,5
reste/sp6	13,0	3,0		16,1	5,0
						
total s1-5	21	1022		814	15120
% / total						
%s1-5		31,3	41,3		33,1	64,2
%sp6		68,7	58,7		66,9	35,8
Intergen51. Clostridia. Homogénéité des génomes
modifier
  • Lien aux données intercalaires des génomes
  • L'homogénéité est bonne sauf pour le 4/1 de hmo et afn.
négatifs x	cbc	cbei	cbn	cdc	cdc8	cle	hmo	psor	total		afn
total		7	10	9	2	4	21	11	3	67		4
s1-5		3	3	0	1	1	8	4	1	21		1
sp6		4	7	9	1	3	13	7	2	46		3
rapport s1-5												
4/2		-	-	-	-	-	-	3.0	-	19.0		-
% / sp6												
s6		25	14	56	0	0	15	14	0	22		33
s7		25	29	0	0	33	23	43	0	22		33
s8		25	43	44	0	67	62	14	50	43		0
reste		25	14	0	100	0	0	29	50	13		33
% / total												
s1-5		43	30	0	50	25	38	36	33	31		25
sp6		57	70	100	50	75	62	64	67	69		75
												
												
négatifs c	cbc	cbei	cbn	cdc	cdc8	cle	hmo	psor	total		afn	
total		288	390	167	296	326	441	332	235	2475		303
s1-5		130	154	62	104	123	186	185	78	1022		167
sp6		158	236	105	192	203	255	147	157	1453		136
rapport s1-5												
4/1		0.8	1.2	0.8	0.7	0.7	1.4	4.1	0.4	1.1		3.4
% / sp6												
s6		0	0	0	1	0	0	1	0	0		1
s7		18	14	22	17	15	15	31	17	17		15
s8		80	85	78	80	82	82	68	82	80		77
reste		3	2	0	3	2	4	0	1	3		7
% / total												
s1-5		45	39	37	35	38	42	56	33	41		55
sp6		55	61	63	65	62	58	44	67	59		45
Intergen51. Clostridia. Les grands négatifs inférieurs à -120
modifier

Intergen51. Clostridia. Les diagrammes CDS-rRNA

modifier
Intergen51. Clostridia. Les diagrammes CDS-16s
modifier
clostridia	CDS16sc		CDS16sx		5sCDSc		5sCDSx
R2		0,264		-		-		-
xs		324,2		329,6		223,3		132,8
plage		210-780		270-570		90-510		60-240
total-p		65		10		26		8
%		97		77		93		80
queue		1		0		2		2
%		1		0		7		20
tête		2		3		0		0
%		3		23		0		0
max		210;7		360;3		150;5		120;3
total8		67		13		28		10
freq		30		30		30		30
  • Les moyennes par génome
Intergen51.clostridia. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx moyenne écart m/e intercalaires haut bas
cbc
cbei 548 548 -185,4 251,3
cbn 111 2x111 251,6 -185,7
cdc 424,5 116,7 3,6 342 507 -61,9 127,8
cdc8 335,8 178,5 1,9 81 376:388 498 26,8 39,1
cle 347 347 15,6 50,3
hmo
psor 325,3 53,7 6,1 264 348 364 37,2 28,7
total 329,6 151,9 2,2 362,6 296,7
CDS16sc. continu
CDS16sc moyenne écart m/e intercalaires haut bas
cbc 570,5 239,5 2,4 *117 3x387-570 909 -78,6 168,1
cbei 594,2 148,2 4,0 282:390 5x501-573 6x667-776 -102,4 191,8
cbn 404,1 34,3 11,8 346:369 5x393-424 453 87,7 1,7
cdc 363,6 227,7 1,6 181:193 3x241-284 585:778 128,3 -38,9
cdc8 311,3 233,8 1,3 3x181-192 240:294 780 180,5 -91,1
cle 423,3 143,4 3,0 4x302-331 402 602:643 68,6 20,9
hmo 582,6 105,7 5,5 *20 6x459-559 3x652-774 -90,7 180,1
psor 291,4 100,1 2,9 8x189-276 309 431:525 200,5 -111,1
total 447,1 189,3 2,4 491,9 402,4
Intergen51. Clostridia. Les diagrammes 5s-CDS
modifier
  • Lien au tableur:
clostridia	5sCDSc		5sCDSx		ftx		ftc
R2		-		-		0,277		0,401
xs		223,3		132,8		146,6		134,6
plage		90-510		60-240		50-280		60-330
total-p		26		8		60		161
%		93		80		64		79
queue		2		2		33		38
%		7		20		35		19
tête		0		0		1		4
%		0		0		1		2
max		150;5		120;3		260;5		70;13
total8		28		10		94		205
freq		30		30		10		10
Intergen51.clostridia. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
ftc-fc	94,7
ftc-fc	-105,3
	
ftx-fx	189,3 
ftx-fx	-4,4
Intergen51.Clostridia Comparaison 5s-CDS tRNA-CDS CDS-CDS
ftx. tRNA-CDS discontinu
ftx moyenne écart m/e Inf 40 Sup 700 haut bas
cbc 269,8 197,0 1,37 2 0 5,7 44,4
cbei 296,6 161,4 1,84 2 1 -21,1 71,2
cbn 231,6 144,4 1,60 0 0 43,9 6,2
cdc 279,3 94,8 2,95 0 0 -3,7 53,8
cdc8 263,4 91,2 2,89 0 0 12,1 38,0
cle 254,9 158,0 1,61 0 0 20,7 29,4
hmo 225,5 130,3 1,73 0 0 50,1 0,0
psor 235,6 144,5 1,63 2 0 39,9 10,2
total 250,5 42,7 1,76 ++ 275,5 225,4
5sCDSx. 5s-CDS discontinu
5sCDSx moyenne écart m/e intercalaires  -
cbc
cbei 123,7 60,1 2,1 69 114 188
cbn 367,0 315,4 1,2 144 590
cdc 213 213
cdc8 216 216
cle
hmo
psor 204,3 171,3 1,2 *40 99:112 402
total 214,7 162,3 1,3 ++ 236,2 193,2 -
ftc. tRNA-CDS continu
ftc moyenne écart m/e Inf 40 Sup 700 haut bas
cbc 199,3 134,9 1,48 0 4 28,7 12,8
cbei 270,4 158,2 1,71 1 0 -42,4 83,8
cbn 164,8 100,9 1,63 0 0 63,3 -21,8
cdc 164,8 99,4 1,66 0 2 63,2 -21,8
cdc8 177,1 114,6 1,55 0 2 50,9 -9,5
cle 207,7 126,3 1,64 1 1 20,4 21,1
hmo 210,9 127,8 1,65 0 1 17,1 24,3
psor 184,9 102,1 1,81 1 0 43,1 -1,7
total 207,3 130,3 1,59 ++ 228,0 186,6
5sCDSc. 5s-CDS continu
5sCDSc moyenne écart m/e intercalaires  -
cbc 363 363
cbei 387,7 209,8 1,8 90:159 315:429 3x508-661
cbn 133,0 7,1 18,8 128 138
cdc 229,8 139,6 1,6 119:126 177:273 454
cdc8 229,4 138,8 1,7 118:127 177:273 452
cle 301 301
hmo
psor 154,0 64,1 2,4 3x85-109 131:180 228:245
total 250,6 159,6 1,6 ++ 275,7 225,6 -
fx. CDS-CDS discontinu
fx moyenne écart m/e ftx-fx Sup 700 haut bas
cbc 274,2 152,6 1,80 -4,4 40 -12,4 60,0
cbei 262,3 151,8 1,73 34,3 50 -0,4 48,0
cbn 200,8 134,4 1,49 30,9 12 61,1 -13,5
cdc 254,9 143,3 1,78 24,4 32 7,0 40,6
cdc8 253,9 141,8 1,79 9,5 36 7,9 39,7
cle 207,2 128,1 1,62 47,7 17 54,7 -7,0
hmo 224,6 136,9 1,64 0,9 13 37,3 10,4
psor 193,9 124,0 1,56 41,7 14 67,9 -20,3
total 238,1 143,7 1,66 12,4 ++ 261,9 214,3
fc. CDS-CDS continu
fc moyenne écart m/e ftc-fc Sup 700 haut bas
cbc 228,0 154,5 1,48 -28,7 66 -3,6 44,4
cbei 234,5 154,8 1,51 35,9 127 -10,1 50,9
cbn 167,3 110,9 1,51 -2,5 7 57,1 -16,3
cdc 210,5 147,2 1,43 -45,6 55 13,9 26,9
cdc8 205,6 143,5 1,43 -28,4 56 18,8 22,0
cle 184,2 126,7 1,45 23,5 55 40,2 0,6
hmo 180,8 125,3 1,44 30,1 12 43,6 -2,8
psor 179,7 122,1 1,47 5,2 26 44,7 -3,9
total 204,0 141,5 1,44 3,3 ++ 224,4 183,6
Intergen51. Clostridia. Les CDS-rRNA rares
modifier

Intergen51. Clostridia. Les diagrammes RNA-RNA

modifier
Intergen51. Clostridia. Les diagrammes rRNA-rRNA
modifier
clostridia	16s23s		16stRNA		tRNA23s		23s5s
R2		0,215		-		-		0,286
xs		201,6		106,9		191,7		117,4
plage		200-340		60-140		100-300		80-220
total-p		46		16		30		47
%		90		100		91		89
queue		4		0		3		2
%		8		0		9		4
tête		1		0		0		4
%		2		0		0		8
max		240;15		60;8		120;7		140;16
total8		51		16		33		53
freq		20		20		20		20
Intergen51. Clostridia. Les diagrammes tRNA-rRNA
modifier
Intergen51.clostridia. Moyennes rRNA-RNA
16s23s.
16s23s moyenne écart m/e intercalaires haut bas
cbc 227,5 1,0 227,5 226 3x 228 73,3 -18,6
cbei 353,5 113,6 3,1 3x213-214 7x338-339 3x502-578 -52,7 107,4
cbn 237 8x 237 63,8 -9,1
cdc 271,3 49,4 5,5 188:221 3x283-285 315:324 29,5 25,2
cdc8 266,8 54,1 4,9 3x188-221 2x 265 3x324-325 34,0 20,6
cle 613 613 -312,2 366,9
hmo 189,9 18,6 10,2 137 194 8x 196 110,9 -56,2
psor
total 273,5 98,1 2,8 300,8 246,1
23s5s.
23s5s moyenne écart m/e intercalaires haut bas
cbc 104,3 7,5 13,9 93 3x 108 40,3 -14,1
cbei 166,3 61,1 2,7 70:108 6x134-139 5x202-274 -21,7 48,0
cbn 71,9 32,1 2,2 3x34-35 76 4x98-100 72,7 -46,4
cdc 132,8 20,2 6,6 114 6x127x132 181 11,8 14,4
cdc8 166,9 38,3 4,4 3x126-127 4x182-202 -22,3 48,5
cle
hmo
psor 121,8 54,9 2,2 6x40-78 4x122-144 3x193-213 22,8 3,5
total 131,5 55,0 2,4 144,6 118,3
16stRNA.
16stRNA moyenne écart m/e intercalaires haut bas
cbc
cbei 136,3 4,0 33,7 140 132 137 -40,4 57,8
cbn 100,5 33,2 3,0 124 77 -4,5 22,0
cdc 55 3x 55 41,0 -23,5
cdc8 55 55 41,0 -23,5
cle
hmo
psor 80,9 33,7 2,4 4x 54 109 118:123 15,1 2,3
total 87,3 36,5 2,4 96,0 78,5
tRNA23s.
tRNA23s moyenne écart m/e intercalaires haut bas
cbc
cbei 104,3 18,0 5,8 84 111 118 125,3 -83,5
cbn 96,0 1,4 67,9 95 97 133,6 -91,9
cdc 298,7 66,2 4,5 250 272 374 -69,1 110,8
cdc8 383,0 9,9 38,7 376 390 -153,4 195,1
cle 271,3 11,3 24,1 4x262-263 3x283-284 -41,7 83,4
hmo 223,3 32,3 6,9 145:198 7x233-241 6,3 35,5
psor 116,0 17,3 6,7 6x95-114 152 113,6 -71,9
total 208,7 88,9 2,3 229,6 187,9
Intergen51. Clostridia. Les diagrammes tRNA-tRNA
modifier
Les diagrammes des tRNA-tRNA
modifier
type c		S40	%	R2	diag	total	reste	x+	restes	tRNA 5s	contig	hors	hors	HC
hors		176	87	0,922	100	202	8	293		336	120	144	241	144
contig		282	94	0,790	100	300	2	-			311	148	306	149
in		9	82	-	90	11		-				149	439	187
5stRNA		41	79	-	60	52		353				187		241
tRNA 5s		9	90	-	20	10	1					234		306
HC		147	89	0,904	100	165	5	-						
Les pourcentages des tRNA-tRNA hors blocs
modifier
tRNA h 		cbc	cbei	cbn	cdc	cdc8	cle	hmo	psor	total	%
20		22	34	36	2	2	15	22	9	142	70.3
40		3	12	7	1	1	10	0		34	16.8
60		2	2	3			2	1		10	5.0
80			2	1			1	2		6	3.0
100		1						1		2	1.0
120										0	0.0
140										0	0.0
160			1	1			1			3	1.5
180										0	0.0
200							1			1	0.5
220										0	0.0
240			1							1	0.5
260			1							1	0.5
restes		1	1							2	1.0
total		29	54	48	3	3	30	26	9	202	100
											
repete		1	1	3	0	0	1	0	0	6	12
sequence	1	5	3	0	0	1	0	1	11	22
sans		5	3	1	1	1	8	13	1	33	66
clusters	7	9	7	1	1	10	13	2	50	100
											
5		9	8	23	1	1	7	9	2	60	30
10		7	15	5	1	1	5	8	5	47	23
15		0	4	6			2	1	1	14	7
20		6	7	2			1	4	1	21	10
Les pourcentages des tRNA-tRNA contigus aux blocs
modifier
tRNA cont 	cbc	cbei	cbn	cdc	cdc8	cle	hmo	psor	total	%
20		1	4	5	60	75	15	33	63	256	85.3
40		1	1		4	6	6	2	6	26	8.7
60					1	1	3	3		8	2.7
80				1	0	0	1	0		2	0.7
100					2	3		1		6	2.0
120								1		1	0.3
restes				1						1	0.3
total		2	5	7	67	85	25	40	69	300	100
											
repete		1	0	0	0	0	0	0	0	1	3
séquence	0	0	0	1	1	0	0	1	3	10
sans		1	4	3	1	2	4	6	1	22	71
eclaté		0	0	0	1	1	2	0	1	5	16
clusters	2	4	3	3	4	6	6	3	31	100
											
5		1	3	2	16	18	3	16	13	72	24
10			1	1	31	41	9	12	28	123	41
15					11	14	2	1	18	46	15
20				2	2	2	1	4	4	15	5
Les moyennes des tRNA-tRNA par génome
modifier
Intergen51.clostridia. Moyennes tRNA-tRNA
5stRNA
5stRNA moyenne écart m/e intercalaires haut bas
cbc 7,5 0,6 13,0 2x7 2x8 12,5 -8,9
cbei 11,3 13,6 0,8 4x5 7 14:44 8,8 -5,1
cbn 7,8 5,0 1,6 4x3-7 13 15 12,2 -8,6
cdc 6,3 0,6 11,0 2x6 7 13,7 -10,1
cdc8 5,8 0,8 7,7 2x5 3x6 7 14,2 -10,6
cle 11,9 24,3 0,5 8x4-5 3x7 89 8,1 -4,5
hmo 64 9x64 -44,0 47,6
psor 5 5x5 15,0 -11,4
total 18,2 24,4 0,7 20,0 16,4
tRNA contigu
tRNA cont moyenne écart m/e total S60% sup120 haut bas
cbc 15,0 17,0 0,9 2 100 -0,5 3,1
cbei 7,4 10,1 0,7 5 100 7,1 -4,5
cbn 18,3 21,9 0,8 7 71 1 -3,8 6,4
cdc 12,4 15,4 0,8 67 97 2,2 0,5
cdc8 13,0 16,5 0,8 85 96 1,5 1,1
cle 20,1 17,7 1,1 25 96 -5,6 8,2
hmo 15,8 23,9 0,7 40 95 -1,2 3,9
psor 10,2 6,1 1,7 69 100 4,3 -1,7
total 13,2 16,0 0,8 300 97 1 14,5 11,9
tRNA intra cluster
tRNA in moyenne écart m/e intercalaires haut bas
cbc
cbei 3 3 atc    17,6 -13,8
cbn 5,0 2,8 1,8 3:7 atc 15,6 -11,8
cdc
cdc8
cle 53 2x53 atc -32,4 36,2
hmo 6 2x6 atc 14,6 -10,8
psor
total 18,7 23,5 0,8 20,6 16,8
tRNA hors cluster
tRNA hors moyenne écart m/e total S60% sup120 haut bas
cbc 17,1 18,9 0,9 29 93 1 1,1 2,2
cbei 18,0 16,5 1,1 53 89 4 0,2 3,1
cbn 13,9 15,2 0,9 48 96 1 4,3 -1,0
cdc 14,3 16,2 0,9 3 100 3,9 -0,6
cdc8 14,3 16,2 0,9 3 100 3,9 -0,6
cle 19,4 15,9 1,2 30 90 2 -1,2 4,5
hmo 17,8 24,1 0,7 26 88 0,4 2,9
psor 9,3 4,8 1,9 9 100 8,9 -5,6
total 16,6 17,3 1,0 201 92 8 18,2 14,9
Intergen51. Clostridia. Les RNA-RNA rares
modifier