Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/cyano

cyano
Image logo représentative de la faculté
Annexe 7
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :bacteroide
Suivant :tenericutes
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : cyano
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/cyano
 », n'a pu être restituée correctement ci-dessus.



Nostoc punctiforme PCC 73102 ATCC 29133

modifier

npu opérons

modifier
  • Lien tableur: npu opérons
  • Liens: gtRNAdb [1], NCBI [2], génome [orgn]
  • Phylogénie: Bacteria; Cyanobacteria; Nostocales; Nostocaceae; Nostoc.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Cy1. npu opérons, Nostoc punctiforme PCC 73102 ATCC 29133
41.4%GC 12.8.19 Paris  79   doubles intercal cds aa avec aa cdsa cdsd protéines
199270..199464 CDS 237 237 65
comp 199702..199775 agg 33 33
comp 199809..200906 CDS 366
comp 352653..353060 CDS 690 690 136
comp 353751..353822 ggc 147 147
comp 353970..354548 CDS 193
503259..503606 CDS 145 145 116
503752..503827 atgj + -1 -1
503827..503901 atgj 2 atg 397 397
504299..505384 CDS @1 362
comp 777899..778429 CDS 34 34 177
778464..778537 cgt 38 38
comp 778576..779829 CDS 418
878016..878609 CDS 384 384 198
878994..879064 tgc 205 205
879270..879491 CDS 74
comp 951559..952671 CDS 53 53 371
952725..952796 acc 310 310
comp 953107..953340 CDS 78
comp 954493..955170 CDS 72 72 226
comp 955243..955315 aga 356 356
955672..956331 CDS 220
1054005..1054811 CDS 290 290 269
comp 1055102..1055172 gga 50 50
comp 1055223..1056383 CDS 387
comp 1175326..1175523 CDS 247 247 66
comp 1175771..1175844 ccg 138 138
1175983..1176855 CDS 291
1380042..1380593 CDS 226 226 184
comp 1380820..1380904 tcc 107 107
1381012..1381380 CDS 123
1442145..1442867 CDS 32 32 241
1442900..1442974 ttc 362 362
1443337..1444770 CDS 478
comp 1650791..1652236 CDS 133 133 482
comp 1652370..1652443 gac 111 111
comp 1652555..1653088 CDS 178
comp 2020233..2021171 CDS 317 317 313
2021489..2022985 16s 123 1497
2023109..2023185 atc 79 79
2023265..2023340 gca 249
2023590..2026486 23s 59 2897
2026546..2026663 5s 230 230 118
> comp 2026894..2027373 CDS 160
comp 2303766..2304149 CDS 124 124 128
2304274..2304349 cac 1362 1362
2305712..2308132 CDS 807
comp 3372671..3373291 CDS 143 143 207
3373435..3373507 gta 415 415
3373923..3374555 CDS 211
comp 3434121..3435443 CDS 204 204 441
comp 3435648..3435739 agc 141 141
comp 3435881..3436813 CDS 311
3439846..3440202 CDS @2 -19 -19 119
comp 3440184..3440257 gca 48 48
comp 3440306..3440378 aca + 8 8
comp 3440387..3440462 atgf 2 aca 11 11
comp 3440474..3440546 cta 4 4
comp 3440551..3440623 ccg 6 6
comp 3440630..3440706 ctc 2 2
comp 3440709..3440785 ctg 3 3
comp 3440789..3440861 cca 1 1
comp 3440863..3440940 tta 6 6
comp 3440947..3441023 ttg 6 6
comp 3441030..3441105 caa 3 3
comp 3441109..3441181 cag 5 5
comp 3441187..3441261 aac 6 6
comp 3441268..3441365 aca 81 81
comp 3441447..3441521 cgt 4 4
comp 3441526..3441615 agc 113 113
comp 3441729..3441800 gaa 58 58
comp 3441859..3441933 tgg 88 88
comp 3442022..3442095 tgc 132 132
comp 3442228..3442301 gac 118 118
comp 3442420..3442614 CDS 65
3448311..3448919 CDS 80 80 203
comp 3449000..3449072 gaa 120 120
3449193..3449375 CDS 61
4538041..4538745 CDS 151 151 235
4538897..4538981 tcg 194 194
4539176..4540357 CDS 394
comp 4869164..4869988 CDS 584 584 275
comp 4870573..4870646 cca 298 298
comp 4870945..4871493 CDS 183
comp 5426384..5427841 CDS 100 100 486
comp 5427942..5428018 atgf 46 46
comp 5428065..5429018 CDS 318
comp 5480844..5481563 CDS 407 407 240
comp 5481971..5482043 gcc 94 94
comp 5482138..5482332 CDS 65
5510568..5511620 CDS 319 319 351
comp 5511940..5512057 5s 59 118
comp 5512117..5515016 23s 249 2900
comp 5515266..5515341 gca 82 82
comp 5515424..5515497 atc 123
comp 5515621..5517117 16s 682 682 1497
comp 5517800..5519035 CDS 412
comp 5572068..5572769 CDS 290 290 234
5573060..5573132 atgi 153 153
comp 5573286..5573720 CDS 145
5573827..5574450 CDS 93 93 208
comp 5574544..5574615 aca 345 345
5574961..5575881 CDS 307
< comp 5655591..5655800 CDS 21 21 70
comp 5655822..5655893 aac 144 144
comp 5656038..5656589 CDS 184
5688669..5689538 CDS 75 75 290
5689614..5689689 ttc 663 663
comp 5690353..5692080 CDS 576
5756596..5757801 CDS 66 66 402
5757868..5757940 cgg 400 400
comp 5758341..5759045 CDS 235
comp 6075820..6077016 CDS 175 175 399
comp 6077192..6077263 ggg 171 171
comp 6077435..6078052 CDS 206
comp 6083633..6084493 CDS 676 676 287
6085170..6086666 16s 123 1497
6086790..6086866 atc 79 79
6086946..6087021 gca 249
6087271..6090169 23s 59 2899
6090229..6090346 5s 176 176 118
comp 6090523..6090720 CDS 66
comp 6498176..6499135 CDS 149 149 320
comp 6499285..6499402 5s 59 118
comp 6499462..6502360 23s 249 2899
comp 6502610..6502685 gca 79 79
comp 6502765..6502841 atc 123
comp 6502965..6504461 16s 315 315 1497
6504777..6505643 CDS 289
6889916..6890785 CDS 61 61 290
6890847..6890918 aaa 294 294
comp 6891213..6892148 CDS 312
6948457..6949644 CDS 162 162 396
6949807..6949888 cta 400 400
6950289..6950609 CDS 107
comp 6980662..6982233 CDS 171 171 524
6982405..6982478 gtc 1521 1521
comp 6984000..6985919 CDS 640
7066111..7067829 CDS 232 232 573
comp 7068062..7068133 caa 270 270
comp 7068404..7069606 CDS 401
comp 7071719..7071991 CDS 39 39 91
comp 7072031..7072114 ttg 109 109
comp 7072224..7073345 CDS 374
comp 7074644..7076011 CDS 409 409 456
7076421..7076502 ctg 95 95
7076598..7077374 CDS 259
7130044..7131132 CDS 131 131 363
comp 7131264..7131335 acg 33 33
7131369..7131662 CDS 98
7224805..7225167 CDS 146 146 121
7225314..7225386 tgg 378 378
7225765..7225986 CDS 74
comp 7346902..7348245 CDS 396 396 448
7348642..7348724 ctc 127 127
7348852..7349475 CDS 208
7506243..7506593 CDS 747 747 117
comp 7507341..7507414 ccc 50 50
comp 7507465..7507830 CDS 122
7517008..7519347 CDS 167 167 780
7519515..7519588 atgj 213 213
<> comp 7519802..7520109 CDS 103
comp 7571389..7571706 CDS 895 895 106
comp 7572602..7572676 aag 63 63
comp 7572740..7574992 CDS 751
comp 7610323..7610769 CDS 481 481 149
comp 7611251..7611323 gca 71 71
7611395..7612312 CDS 306
7936008..7936736 CDS 65 65 243
7936802..7936874 gcg 437 437
7937312..7938874 CDS 521
7972961..7973239 CDS 313 313 93
comp 7973553..7973624 acc 88 88
comp 7973713..7973798 tac 124 124
comp 7973923..7974897 CDS 325
7975047..7975976 CDS 100 100 310
7976077..7976161 tca 374 374
7976536..7978545 CDS 670

npu cumuls

modifier
cumuls. npu.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 4 1 2 1 1 1 100 13 30 0
16 23 5s 0 0 20 12 50 10 40 200 21 60 0
16 atc gca 4 40 0 100 14 80 300 22 90 10
16 23 5s a 0 60 2 150 18 120 400 19 120 9
max a 2 80 0 3 200 9 160 500 10 150 7
a doubles 0 100 3 1 250 8 200 600 4 180 3
autres 0 120 1 300 5 240 700 2 210 10
total aas 8 140 1 350 6 280 800 2 240 7
sans opérons 43 160 0 400 9 320 900 1 270 4
1 aa 40 180 0 450 4 360 1000 0 300 6
max a 20 200 0 500 1 400 1100 0 330 9
a doubles 2 0 9 0 29
total aas 64 16 4 79 0 85 65
total aas 72
remarques 2
avec jaune moyenne 32 79 254 279
variance 43 0 254 171
sans jaune moyenne 11 176 240 188
variance 17 111 122 85

npu tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de npu opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
npu	60			56			23			93
deb	fin		deb	fin		grand	petit		grand	petit
-19	118		131	33		38	34		118	-19
21	144		237	33		100	46		144	21
32	362		34	38		109	39		362	32
34	38		100	46		118	-19		131	33
39	109		290	50		120	80		237	33
53	310		747	50		131	33		38	34
61	294		895	63		133	111		109	39
65	437		481	71		144	21		100	46
66	400		407	94		175	171		290	50
72	356		409	95		194	151		747	50
75	663		226	107		204	141		310	53
80	120		39	109		213	167		294	61
93	345		133	111		226	107		895	63
100	46		-19	118		237	33		437	65
100	374		80	120		247	138		400	66
124	1362		313	124		270	232		481	71
131	33		396	127		290	50		356	72
133	111		247	138		290	153		663	75
143	415		204	141		294	61		120	80
145	397		21	144		310	53		345	93
146	378		690	147		313	124		407	94
151	194		290	153		345	93		409	95
162	400		175	171		356	72		374	100
167	213		151	194		362	32		226	107
171	1521		384	205		374	100		133	111
175	171		167	213		378	146		313	124
204	141		232	270		384	205		1362	124
226	107		61	294		396	127		396	127
232	270		584	298		397	145		247	138
237	33		53	310		400	66		204	141
247	138		93	345		400	162		415	143
290	50		72	356		407	94		397	145
290	153		32	362		409	95		378	146
313	124		100	374		415	143		690	147
384	205		146	378		437	65		194	151
396	127		145	397		481	71		290	153
407	94		66	400		584	298		400	162
409	95		162	400		663	75		213	167
481	71		143	415		690	147		175	171
584	298		65	437		747	50		1521	171
690	147		75	663		895	63		384	205
747	50		124	1362		1362	124		270	232
895	63		171	1521		1521	171		584	298
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est à dire la moitié du total des tRNA-cds.
cyano	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
npu	7,484		86	1	49	17	13	6	25	24	10	39
 ‰				12	570	198	151	70	581	558	233	907

npu blocs

modifier
Cy1. npu blocs, Nostoc punctiforme
CDS 317 313 676 287
16s 123 1497 123 1497
atc 79 79
gca 249 249
23s 59 2897 59 2897
5s 230 118 176 118
CDS 160 66
CDS 319 351 149 320
5s 59 118 59 118
23s 249 2900 249 2899
gca 82 79
atc 123 123
16s 682 1497 315 1497
CDS 412 289

npu remarques

modifier
  • Remarques
    1. @ un intercalaire entre 2 aas négatif d’une pb.
    2. @ un cds négatif de 19 qui empiète de 25% sur le tRNA gca.
      - une séquence de tRNAs de 20, semblable à celles des bacilli, avec des intercalaires très faibles, 13 sur 21 de 1 à 11.
      - Cette séquence présente un intercalaire de tête de 48 et une queue avec 5 intercalaires élevés de 48 à 132 pbs.
    3. Les protéines des cds sont aussi très petites comme npu avec une moyenne de 188 (170) aas pour 65 (45) cds sur 94 (69).
    4. 4 blocs à rRNA du type le plus courant atcgca avec des intercalaires classiques, surtout gca-23s à 256 pbs. Par contre atc-gca est très élevé par rapport à celui de npu, 79 contre 12.
  • Séquence des doubles: très peu de doubles comme npu, à peine 2 doublets. Par contre le code génétique montre un doublement quasi généralisé des tRNAs avec apparition de ata et les multiplicités de atc et gca sont dues aux blocs à rRNAs. Le doublement généralisé est du à la longue séquence 20 aas. Les tRNAs ordinairement faibles sont gtg gag cga. Par contre d’autres faibles sont doubles, ccc ccg aag ctg.
  • Multiples, sup1: blocs sans rRNA ayant 2 aas ou plus, sans les 4 atcgca des blocs à rRNAs. Tous les simples, 40, (blocs à un seul aa) n'ont qu'une occurrence sauf ttc. Voir code génétique ci-dessous.
gca	ctc	caa	agc	*
aca	ctg	cag	gaa	atgj2
atgf	cca	aac	tgg	*
cta	tta	aca	tgc	acc
ccg	ttg	cgt	gac	tac
  • Code génétique de npu:
    Lien tableur: npu remarques
    Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
    • - totaux en en-tête, 79 total de gtRNAdb [3] contenant des pseudo et inconnus; 72 total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Cy1. npu, Nostoc punctiforme PCC 73102
Cy11. décompte gtRNAdb
g1    t1       79  72
atgi 2 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 2 tgc 2
atc 4 acc 1 aac 2 agc 2
ctc 2 ccc 2 cac 2 cgt 2
gtc 1 gcc 1 gac 2 ggc 1
tta 1 tca 2 taa tga
ata 1 aca 2 aaa 2 aga 1
cta 2 cca 2 caa 2 cga
gta 1 gca 6 gaa 2 gga 1
ttg 3 tcg 1 tag tgg 2
atgj 3 acg 1 aag 2 agg 1
ctg 2 ccg 2 cag 1 cgg 1
gtg gcg 1 gag ggg 1
Cy12. cumuls, 72 tRNAs
           
atgi 1 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 1 tac 1 tgc 2
atc 4 acc 2 aac 2 agc 2
ctc 2 ccc 1 cac 1 cgt 2
gtc 1 gcc 1 gac 2 ggc 1
tta 1 tca 1 taa tga
ata aca 3 aaa 1 aga 1
cta 2 cca 2 caa 2 cga
gta 1 gca 6 gaa 2 gga 1
ttg 2 tcg 1 tag tgg 2
atgj 3 acg 1 aag 1 agg 1
ctg 2 ccg 2 cag 1 cgg 1
gtg gcg 1 gag ggg 1
Cy13. sup1, 24 tRNAs
           
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 1 tgc 1
atc acc 1 aac 1 agc 1
ctc 1 ccc cac cgt 1
gtc gcc gac 1 ggc
tta 1 tca taa tga
ata aca 2 aaa aga
cta 1 cca 1 caa 1 cga
gta gca 1 gaa 1 gga
ttg 1 tcg tag tgg 1
atgj 2 acg aag agg
ctg 1 ccg 1 cag 1 cgg
gtg gcg gag ggg

npu distribution

modifier
  • Lien tableur: npu distribution
  • Légende: couleur orange clair, contient 1 tRNA du bloc de 20 aas sans rRNA, sauf pour aca qui en compte 2 séparés.
  • Notes:
    - atgj2, un seul double, en gras.
    - gca: compte 4 +16s, 1 >1aa appartenant au bloc à 20 aas et 1 =1aa.
Cy1 npu. La distribution des tRNAs. Nostoc punctiforme PCC 73102 ATCC 29133. Cyanobacteria.
g1    t1       
atgi 2 tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 2
atc 4 acc 2 aac 2 agc 2
ctc 2 ccc 1 cac 1 cgt 2
gtc 1 gcc 1 gac 2 ggc 1
tta 1 tca 1 taa tga
ata aca 3 aaa 1 aga 1
cta 2 cca 2 caa 2 cga
gta 1 gca 6 gaa 2 gga 1
ttg 2 tcg 1 tag tgg 2
atgj 3 acg 1 aag 1 agg 1
ctg 2 ccg 2 cag 1 cgg 1
gtg gcg 1 gag ggg 1
tenr >1aa =1aa -5s +5s -16s +16s total
npu 25 * 39 * 8 72

npu. Intergen51

modifier

Intergen51. npu. Le génome

modifier
  • npu Le prélèvement: Aapal
  • Le nom et le lien NCBI: npu, Nostoc punctiforme PCC 73102, NCBI [4], date 6.2.22.
  • npu La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
npu	1,547,626	8,234,322	18.8
npu données intercalaires
modifier
npu données intercalaires 200
modifier
npu autres intercalaires aas
modifier

Intergen51. npu. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. npu les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 npu les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 3,984 402 15 4,401 1.9 44 1 45
x 2,303 67 4 2,374 0 7 7
t 6,287 469 19 6,775 44 8 52
% 92.8 6.9 0.3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 62 0 0 62 1.8 tRNA-CDS 96 62
x 34 0 0 34 RNA-RNA 44 28
t 96 0 0 96 CDS-rRNA 8 5
% 100.0 0.0 0.0 non RNA 8 5
- total 156 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 14.7 17.7 5.5 11.9 3.2 47 0.3 0.0
x 23.2 17.6 17.9 6.3 0.0 33 0.2 0.0

Intergen51. npu. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: npu données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées npu fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. npu fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. npu fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	npu
R2	x3		x2		x		c		Inflexion poly3	x	c
0.790	1.86E-06	-1.26E-03	1.95E-01	18.40	fx1	abscisse	227.5	169.8
0.917	6.55E-07	-3.08E-04	-6.51E-02	40.6	fc1	ordonnée	-3.1	24.2
								
0.803	1.48E-06	-1.01E-03	1.39E-01	22.2	fx41			
0.913	8.52E-07	-4.34E-04	-4.34E-02	39.9	fc41			
  • Le rfin après 400 est de 586 sur un total de 3999 . Jusqu'à 1% les freq10 sont en continu jusqu'à 1060 , reste 41 . L'indice i.rfin1 = 545/660=0,826.
  • Le reste après 1060 est de 41 sur un total de 3999 . Jusqu'à 2‰ les freq10 sont en continu jusqu'à 1590 , reste 9 . L'indice i.rf2 = 32/530=0,060.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	npu		calculs			poly3	npu
effect	3999		R2.21	716		abscis	400
xm	25		pte	7,78		flexa	180
ym	11,99		cste	3,19		flexo	2,26
x1m	282		r400l	118		xm	25
y1m	1		restp	252,81		sup4	149,5
rfin	146,54		%sd	25,27		sup4t	486,6
bornf	124		lond	257		%	30,7
supd	163,8		%sf	27,07		long	155
supdt	648,2		lonf	99		R2	662
xmp	99,02		sf/lf	0,94			
r400	106,28		sr/lr	0,45			
supf	93,3		sd/ld	0,64			
supft	344,6		i.r400	0,90										

Intergen51. npu. Les CDS-CDS négatifs

modifier
Sous-totaux	npu			totale	
fréquence	x-	c-		x-	c-
 - 1		0	54		4	4140
 - 2		6	0		85	11
 - 3		0	1		3	12
 - 4		15	135		717	10938
 - 5		1	0		5	19
sp6		45	212		1642	8424
total		67	402		2,456	23,544
reste		12	22		264	420
s6		11	1		361	41
s7		7	47		321	1438
s8		15	142		696	6525
rapport s1-5						
4/2/1		2.5	2.5		8.4	2.6
% / sp6						
s6/sp6		24.4	0.5		22.0	0.5
s7/sp6		15.6	22.2		19.5	17.1
s8/sp6		33.3	67.0		42.4	77.5
reste/sp6	26.7	10.4		16.1	5.0
						
total s1-5	22	190		814	15120
% / total						
%s1-5		32.8	47.3		33.1	64.2
%sp6		67.2	52.7		66.9	35.8

Intergen51. npu. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		4			CDS 16s			4
16s 23s					5s CDS		1	3
16s tRNA	4			16 CDS			
tRNA 23s	4			CDS 5s			
5s tRNA					23s CDS			
tRNA in		4			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	28			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		44	0		total		1	7
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. npu. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 cyanobactéries. Les intercalaires tRNA-tRNA extra blocs
npu hors1 npu hors2 pmg hors
inter aa    inter aa    inter aa
-1 atgj 6 ttg 10 acc
** atgj 3 caa ** tac
44 other 5 cag
** other 6 aac
156 aaa 81 aca
7 other 4 cgt
6 cac 4 agc
48 gca 7 tac
8 aca 62 gaa
10 atgf 3 tgg
4 cta 11 atgi
6 ccg 3 tgc
5 ctc 4 other
3 ctg ** gac
1 cca 88 acc
6 tta ** tac
-

Prochlorococcus marinus str. MIT 9301

modifier

pmg opérons

modifier
  • Lien tableur: pmg opérons
  • Liens: gtRNAdb [5], NCBI [6], génome [orgn]
  • Phylogénie: Bacteria; Cyanobacteria; Synechococcales; Prochloraceae; Prochlorococcus.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
Cy2. pmg opérons, Prochlorococcus marinus str. MIT 9301
31.3%GC 13.8.19 Paris  37   doubles intercal cds aa avec aa cdsa cdsd protéines
comp 74235..75521 CDS 4 4 429
comp 75526..75607 ctt 259 259
75867..77216 CDS 450
132034..132708 CDS 49 49 225
132758..132829 aac 566 566
133396..133845 CDS 150
comp 239249..240268 CDS 170 170 340
comp 240439..240520 cta 71 71
240592..241041 CDS 150
comp 257573..258844 CDS 77 77 424
comp 258922..258995 cgt 86 86
259082..259333 CDS 84
comp 272771..274039 CDS 18 18 423
comp 274058..274130 atgi 141 141
274272..274832 CDS 187
305431..305850 CDS 84 84 140
comp 305935..306010 ttc 91 91
comp 306102..307331 CDS 410
313891..314472 CDS 178 178 194
comp 314651..314722 aca 65 65
comp 314788..315120 CDS 111
comp 320549..321988 CDS 603 603 480
322592..324074 16s 125
324200..324273 atc 12 12
324286..324358 gca 256
324615..327496 23s 60
327557..327673 5s 43 43
comp 327717..328595 CDS 293
comp 354976..355167 CDS 88 88 64
comp 355256..355327 acc 10 10
comp 355338..355419 tac 102 102
355522..355962 CDS 147
comp 434230..435660 CDS 17 17 477
comp 435678..435751 gac 149 149
comp 435901..436095 CDS 35 35 65
comp 436131..436203 tgg 53 53
comp 436257..436727 CDS 157
521448..522497 CDS 99 99 350
522597..522682 tta 78 78
522761..522994 CDS 78
comp 609397..609897 CDS 249 249 167
comp 610147..610233 tca 404 404
610638..611399 CDS 254
774440..775240 CDS 210 210 267
comp 775451..775524 ccc 27 27
comp 775552..776280 CDS 243
comp 828018..828392 CDS 49 49 125
828442..828528 tcc 214 214
828743..830740 CDS 666
868731..869213 CDS 29 29 161
869243..869316 atgj 67 67
869384..869671 CDS 96
909742..910707 CDS 45 45 322
910753..910829 atgf 591 591
911421..911810 CDS 130
996073..996609 CDS 16 16 179
comp 996626..996698 gaa 41 41
comp 996740..997858 CDS 373
comp 1040019..1040135 CDS 177 177 39
1040313..1040384 aaa 512 512
1040897..1041004 CDS 36
1044863..1045423 CDS 276 276 187
1045700..1045773 cca 188 188
comp 1045962..1046666 CDS 235
1134197..1134427 CDS 251 251 77
comp 1134679..1134763 tcg 63 63
comp 1134827..1135849 CDS 341
comp 1163424..1164092 CDS 138 138 223
1164231..1164304 aga 27 27
1164332..1165600 CDS 423
1212124..1212894 CDS 58 58 257
comp 1212953..1213025 gcc 129 129
comp 1213155..1214180 CDS 342
1253753..1255123 CDS 525 525 457
1255649..1255730 ttg 5 5
1255736..1256911 CDS 392
comp 1259549..1260784 CDS 131 131 412
1260916..1260988 cac 72 72
1261061..1262455 CDS 465
1275239..1277272 CDS 0 0 678
comp 1277273..1277343 gga 112 112
1277456..1278802 CDS 449
1308006..1308797 CDS 50 50 264
1308848..1308919 gtc 67 67
1308987..1309604 CDS 206
comp 1419657..1419893 CDS 54 54 79
1419948..1420019 acg 100 100
1420120..1420440 CDS 107
1453287..1454075 CDS 35 35 263
comp 1454111..1454199 agc 61 61
comp 1454261..1455460 CDS 400
1472925..1473932 CDS 94 94 336
1474027..1474098 caa 16 16
1474115..1474891 CDS 259
comp 1485558..1486649 CDS 77 77 364
1486727..1486800 cgg 11 11
comp 1486812..1487258 CDS 149
comp 1500099..1501325 CDS 42 42 409
1501368..1501438 tgc @1 364 364
comp 1501803..1502447 CDS 215
comp 1517796..1518128 CDS 78 78 111
comp 1518207..1518280 agg 38 38
1518319..1518700 ncRNA 21 21
1518722..1519471 CDS 250
comp 1554202..1554633 CDS 45 45 144
comp 1554679..1554750 ggc 61 61
comp 1554812..1555288 CDS 159
comp 1600898..1601284 CDS @2 -30 -30 129
comp 1601255..1601326 gta 98 98
1601425..1602279 CDS 285

pmg cumuls

modifier
  • Lien tableur: pmg cumuls
  • Légende:
  • Notes: l'opéron à 2 aas sans rRNA est tac-acc
cumuls. pmg.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds chromosome
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 1 1 1 2 1 100 9 30 0
16 23 5s 0 0 20 1 1 50 22 40 200 20 60 2
16 atc gca 1 40 100 23 80 300 15 90 6
16 23 5s a 0 60 150 7 120 400 10 120 4
max a 2 80 200 4 160 500 13 150 9
a doubles 0 100 250 3 200 600 0 180 5
autres 0 120 300 3 240 700 2 210 4
total aas 2 140 350 0 280 800 0 240 4
sans opérons 34 160 400 1 320 900 0 270 8
1 aa 33 180 450 1 360 1000 0 300 2
max a 2 200 500 0 400 1100 0 330 1
a doubles 0 5 0 24
total aas 35 1 1 63 0 67 45
total aas 37
remarques 2
avec jaune moyenne 10 12 127 260
variance 0 0 146 147
sans jaune moyenne 93 248 170
variance 76 130 74

pmg blocs

modifier
Cy2. pmg blocs, Prochlorococcus marinus str. MIT 9301
CDS 603 480
16s 125 1483
atc 12
gca 256
23s 60 2882
5s 43 117
CDS 293

pmg remarques

modifier
  • Lien tableur: pmg remarques
  • Légende:
  • Remarques
    1. @ Un cds négatif de 30 qui empiète de 40% sur le tRNA gta, et un cds nul qui côtoie gga.
    2. @ Ensuite une moyenne générale des intercalaires des cds très faible, et 64 tRNAs sur 71 ne dépassant pas 300 pbs avec une moyenne de 93.
    3. Les protéines des cds sont aussi très petites avec une moyenne de 170 aas pour 45 cds sur 69.
    4. Un seul bloc à rRNA du type le plus courant atcgca avec des intercalaires classiques, surtout gca-23s à 256 pbs.
  • Séquence des doubles: néant, même pas séparés. Le tableau du code génétique le montre bien. Et les tRNAs qui manquent sont ceux se terminant par g, ctg gtg ccg gcg aag cag gag ggg cga (à la place de cgg) en dehors des obligatoires, tgg agg ttg atg cgg, il n’y a que tcg acg ccc.
  • Code génétique de pmg:
    Légende: prélèvement de la base gtRNAdb le 19/1/20 Paris
    • - totaux en en-tête, 37 total de gtRNAdb contenant des pseudo et inconnus est égal au total du cumul.
    • - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    • - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    • - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Metf Met.
    • - Voir la légende des tris et couleurs, g1 t1.
Cy2. pmg, Prochlorococcus marinus
g1    t1        37
atgi 1 tct tat atgf 1
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg

pmg distribution

modifier
Cy2 pmg. La distribution des tRNAs. Prochlorococcus marinus str. MIT 9301. Cyanobacteria.
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc ccc 1 cac 1 cgt 1
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga
gta 1 gca 1 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
tenr >1aa =1aa -5s +5s -16s +16s total
pmg 2 33 2 37

pmg. Intergen51

modifier

Intergen51. pmg. Le génome

modifier
  • pmg Le prélèvement: Artb
  • Le nom et le lien NCBI: pmg, Prochlorococcus marinus str. MIT 9301, NCBI [7], date 08.02.21.
  • pmg La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
pmg	149,500		1,641,879	9.1
pmg données intercalaires
modifier
pmg données intercalaires 200
modifier
pmg autres intercalaires aas
modifier

Intergen51. pmg. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. pmg les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 pmg les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 914 157 34 1,105 1.6 5 0 5
x 588 96 11 695 0 2 2
t 1,502 253 45 1,800 5 2 7
% 83.4 14.1 2.5
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 40 1 0 41 1.6 tRNA-CDS 67 80
x 25 0 1 26 RNA-RNA 5 6
t 65 1 1 67 CDS-rRNA 2 2
% 97.0 1.5 1.5 non RNA 10 12
- total 84 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 2.2 9.8 1.3 40.7 17.1 66 3.1 0.0
x 4.5 3.8 2.1 30.2 7.7 43 1.6 3.8

Intergen51. pmg. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: pmg données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées pmg fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmg fx1
    - fc%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. pmg fc1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	pmg
R2	x3		x2		x		c		Inflexion poly3	x	c
0.612	-6.28E-06	4.80E-03	-1.20E+00	110.0	fx1	abscisse	-67.8	318.2
0.866	-1.01E-05	7.98E-03	-1.99E+00	161.0	fc1	ordonnée	15.9	1.5
								
0.822	4.27E-07	8.69E-05	-2.34E-01	56.2	fx41			
0.963	-3.09E-06	2.95E-03	-9.32E-01	98.9	fc41			
  • Le rfin après 400 est de 21 sur un total de 948 . Jusqu'à 1% les freq10 sont en continu jusqu'à 450 , reste 10 . L'indice i.rfin1 = 11/50=0,220.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	pmg		calculs			poly3	pmg
effect	948		R2.21	850		abscis	150
xm	46		pte	56,24		flexa	102
ym	5		cste	7,86		flexo	3,17
x1m	122		r400l	278		xm	44
y1m	1		restp	155,06		sup4	108,6
rfin	22,15		%sd	32,59		sup4t	272,2
bornf	89		lond	76		%	39,9
supd	100,7		%sf	27,96		long	58
supdt	309,1		lonf	43		R2	410
xmp	535,86		sf/lf	1,41			
r400	132,91		sr/lr	1,22			
supf	60,5		sd/ld	1,33			
supft	216,2		i.r400	0,48											

Intergen51. pmg. Les CDS-CDS négatifs

modifier
Sous-totaux	pmg			totale	
fréquence	x-	c-		x-	c-
 - 1		1	35		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		40	69		717	10938
 - 5		0	0		5	19
sp6		55	53		1642	8424
total		96	157		2,456	23,544
reste		2	2		264	420
s6		16	0		361	41
s7		7	10		321	1438
s8		30	41		696	6525
rapport s1-5						
4/2/1		-	2.0		8.4	2.6
% / sp6						
s6/sp6		29.1	0.0		22.0	0.5
s7/sp6		12.7	18.9		19.5	17.1
s8/sp6		54.5	77.4		42.4	77.5
reste/sp6	3.6	3.8		16.1	5.0
						
total s1-5	41	104		814	15120
% / total						
%s1-5		42.7	66.2		33.1	64.2
%sp6		57.3	33.8		66.9	35.8

Intergen51. pmg. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		1			CDS 16s			1
16s 23s		1			5s CDS			1
16s tRNA	1			16 CDS			
tRNA 23s				CDS 5s			
5s tRNA					23s CDS			
tRNA in		1			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	1			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		5	0		total		0	2
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. pmg. Les intercalaires tRNA-tRNA extra bloc

modifier

voir npu

pmg intercalaires entre cds

modifier
  • Lien NCBI [8]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

pmg intercalaires positifs S+

modifier
pmg. Sx+ Sc+ Les diagrammes 400
pmg Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 -67 515 -1295 119 607 256 min40 -107 844 -2106 170 869 263 min60
31 à 400 23 -124 47 41 774 180 2 parties -35 327 -1017 107 973 311 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 194 65 - 428 poly 179 SF 78 69 501 poly 368 SF
31 à 400 122 45 - 726 dte 48 tm 153 49 - 687 poly 286 SF
  • Légende du tableau corrélations et fréquences faibles: correction du 25.1.22 faite
pmg. Sx+ Sc+ Les diagrammes 400. Corrélations et fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
pub min20 218 537 755 908 857 883 26 866 852 840
pmg min40 559 895 1454 856 728 802 74 904 915 928
ade min50 1229 2242 3471 867 624 758 134 879 897 903
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
317 628 0.50 327 980 40 59 281 389 88 367 715
326 430 0.76 692 1108 16 31 137 143 196 449 703
221 335 0.66 1412 3052 8 6 72 234 304 876 459
  • Diagrammes 400:  pmg pub,   diagramme 1-40: c+ pmgc+ pubx+ pmgtotal,   texte: pub.
  • Résumé
    - Comparaison avec pub
    • Très forte ressemblance avec le génome pub:
      + ressemblances entre les courbes
      1. Les 2 courbes d’origine, 1-400, et la courbe c+ 31-400 sont de forme S forte, SF. Chez pub les 4 courbes n-400 le sont.
      2. Les corrélations x+ c+ sont fortes, 0.802 sur 41-250 et plus de 0.900 sur 1-n. Chez pub les corrélations sont supérieures partout à 0.850.
      3. Les faibles fréquences, de 1 à 30, sont concentrées sur les abscisses 10 et 20 avec 279‰ pour x+ et 351‰ pour c+. Pour pub elles sont concentrées sur le 10 seulement avec respectivement 179‰ et 477‰.
      4. Diagramme 40: D’après le fort coefficient de corrélation des 1-40, de 0.703, les 2 courbes seraient semblables comme pour pub avec un coefficient de 0.715.
      + ressemblances dans les différences entre les courbes
      1. La différence entre x+ et c+ est portée par les faibles fréquences de 1 à 30 et surtout de 1 à 20, à peu près à égalité, x+/c+ égale 0.76. Ce rapport est de 0.50 chez pub.
      2. Elle se répercute sur le coefficient de détermination R2 des courbes x+ et c+, plages 1-400, avec respectivement 0.607 et 0.869 mais pas dans la courbe c+ 31-400 avec 0.973; et pour pub on a respectivement 0.559 et 0.856.
      3. Cette différence ressort aussi dans les taux des intercalaires nuls ( qui ne sont pas inclus dans les diagrammes) avec respectivement 16‰ et 31‰ contre 40 et 59 pour pub.
    • Différences entre pgm et pub
      + En dehors des exceptions passées sous silence dans les ressemblances, la différence entre x+ et c+ pour les faibles fréquences est beaucoup plus accentuée et différencie déjà les 2 génomes:
      1. c’est ainsi que les faibles fréquences sont concentrées dans les fréquences de 1 à 10 pour pub et de 1 à 20 pour pmg, le rapport x+/c+ passe de 0.50 à 0.76 et
      2. les intercalaires nuls passent de 16‰ à 40‰ chez x+, soit plus du double, et de 31‰ à 59‰ chez c+, soit le double.
      3. Les différences notables entre les 2 génomes sont dues aux nouveaux comportements des courbes et non aux effectifs doubles de pmg (1454) par rapport à ceux de pub (755).
      + Les minima des fréquences faibles: L’importance des fréquences faibles apparaît nettement dans les courbes 1-400. Chez pmg le minimum local de c+1-400 est fort et net comme pour tous les c+1-400 des autres génomes et se situe à la fréquence 60 comme x+1-400 qui se situe à 40. Par contre les minima correspondant de pub se situent tous les 2 à la fréquence 20. Il y a ressemblance entre les 2 courbes du même génome mais une nette différence entre les 2 génomes.
      + Les courbes c+1-40: Les 2 génomes ont le même comportement des courbes c+n-400, les 4 courbes ont une forme SF et les fréquences faibles de 1 à 40 sont du même niveau 449 pour pmg contre 367 pour pub, mais les 2 courbes c+1-40 sont très différentes: sans les comparer au modèle des diagrammes c+1-40, la différence est nette en mettant en parallèle les sommes des taux des 3 tranches de fréquences correspondant aux régions du modèle, 1-7 8-18 19-40. Pour pmg j’obtiens respectivement en ‰ 325 332 343 et pour pub 608 204 188. Maintenant si je compare les courbes de détermination du polynome de 15 °, pub a un R2 de 981 mais la tranche 8-18 est en creux, alors que pmg a un R2 de 776 avec 2 collines dans la même tranche. Et en corrigeant le diagramme de pmg pour la seule fréquence 6, le R2 devient 796 et sa courbe prend la forme du modèle (voir le diagramme corrigé en rouge sur le même lien) .
      + Corrélation c+/x+ 1-40 de pmg: La corrélation entre les 2 colonnes de 1-40, de c+ et x+ de pmg est très forte. Elle est aussi forte que celle de pub, 0.703 contre 0.715, largement devant les autres génomes, autour de 0.550 pour les plus élevées ant cvi mja ( voir tableau récapitulatif). Ceci laisserait penser que les 2 courbes pmg seraient semblables au modèle fc40. Si avec pub je n’ai pas pu décrire la forme de la courbe x+1-40 à cause du faible effectif de 88, avec pmg et son effectif double de 196 sa courbe ressemble plus à la courbe pub c+1-40 qu’à la courbe du modèle. En effet avec des effectifs comparables, 196 pour pmg x+1-40 et 367 pour pub c+1-40, les 2 courbes présentent une colline à la fréquence 6 et un creux à la fréquence 11 bien que les R2 du polynome d°15 soient très élevés, respectivement 0.916 et 0.981. Les 2 courbes ont ensuite des formes qui expliquent leur corrélation avec leurs courbes complémentaires, c+ pour pmg et x+ pour pub, c’est à dire 2 collines pour pmg et un méplat pour pub.
      + Corrélation c+/x+ 1-400 de pmg: La corrélation entre les 2 colonnes de 1-400, de c+ et x+ de pmg est très forte. Elle est aussi forte que celle de pub, 0.802 contre 0.883. Mais alors que les corrélations de pub restent constantes, autour de 0.850, dans 41-200 1-200 et 1-250, celle de pmg 41-200 chute drastiquement à 0.728 proche de 0.611 (rru), la plus élevés des faibles corrélations des 41-250. Par contre les corrélations de pmg 1-200 et 1-250 augmentent symétriquement beaucoup, elles passent à 0.915 contre 0.802 pour 41-250. Ceci montre la plus grande importance des fréquences faibles chez pmg que chez pub. La chute de la corrélation 41-200 de pmg impacte directement la forme de sa courbe x+31-400, qui est un tilde moyen, tm, contrairement à celle de pub qui est SF.
      + Le tilde de la courbe pmg x+31-400: La forme en tilde de cette courbe illustre bien la chute drastique de la corrélation sur la tranche 41-200 par rapport à la tranche 41-250 que j’ai mise en évidence au paragraphe précédent. Elle définit les 2 parties de la courbe de part et d’autre du point d’inflexion ( flex pour abscisse du point d’inflexion) dont l’abscisse est la fréquence 180. La tranche 31-180 de la 1ère partie correspond à celle de la corrélation 41-200.
    - Les 2 parties
    • Quand j’ai étudié les intercalaires positifs, avant de séparer les continus des discontinus, je me suis restreint à la tranche de 1 à 600 suggérée par l’étendue du génome pub.
    • Et pour classer les génome je n’ai considéré que la partie centrale des diagrammes qui me paraissait spécifique à chacun. Ce sont les diagrammes de 26 à 370 avec des pas de 5 fréquences.
    • Ils m’ont permis de montrer que la pente de la droite de détermination était proportionnelle au total des intercalaires cds-cds pour 18 génomes sans pmq cbei mba.
    • Cette partie centrale, correspondant au renflement des diagrammes s+1-600, se retrouve dans les diagrammes c+1-400 avec des pas de 10 fréquences. Aussi j’ai séparé ce renflement du début, à la fréquence 30 correspondant en général à un minimum local, pour le représenter dans les diagrammes c+31-400 à peu près équivalents aux diagrammes s+26-370.
    • C’est en cherchant à séparer ce renflement de la queue du diagramme qui représente la suite de la fonction puissance que j’ai choisi le polynome de d° 3 comme courbe de détermination pour tous les diagrammes s+n-400. La 1ère partie de ces diagrammes s+31-400 en tilde correspond au renflement spécifique à chaque génome et ne serait pas seulement fonction de la longueur des intercalaires, comme le renflement des diagrammes c+1-40 représenterait des séquences de controle. Les diagrammes c+31-400 de forme S sont plutot des fonctions puissances.
    • En séparant les fréquences faibles de 1 à 30 les diagrammes x+31-400 présentent la plupart du temps un renflement de type controle.
    • C’est là l’origine de la dénomination de “2 parties” pour les diagrammes s+31-400. Il faut noter que ce renflement est différent des diagrammes c+1-40 puisqu’il peut comportement plusieurs renflements aux fréquences unitaires.

pmg autres intercalaires

modifier
  • Lien tableur: pmg autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux: 3 ncRNA 1 regulatory 1 tmRNA
tRNA-cds		tRNA-tRNA		autres-cds		total	
c+	x+	c-	c+	x+	c-	c+	x+	c-		
40	28	1	5			5	4		83	1 ax+
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

cyano synthèse

modifier

cyano données intercalaires

modifier

cyano distribution par génome

modifier
cyano distribution par génome
cyano2 >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
npu 21 39 8 4 72
pmg 2 33 2 37
total 23 72 10 4 109

cyano distribution du total

modifier
  • Lien tableur: cyano distribution du total
  • Légende:
    - Couleurs du 1er tableau: voir bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau. Cependant les duplicata ne sont pas comptés dans ce tableau mais dans les >1aa du 1er.
    - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Cyano. Distribution du total.
cyano. Distribution du total: sans +16s.
g1    t1       
atgi 3 tct tat atgf 3
att act aat agt
ctt 1 cct cat cgt
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 3
atc acc 3 aac 3 agc 3
ctc 2 ccc 2 cac 2 cgc 3
gtc 2 gcc 2 gac 3 ggc 2
tta 2 tca 2 taa tga
ata aca 4 aaa 2 aga 2
cta 3 cca 3 caa 3 cga
gta 2 gca 2 gaa 3 gga 2
ttg 3 tcg 2 tag tgg 3
atgj 4 acg 2 aag 1 agg 2
ctg 2 ccg 2 cag 1 cgg 2
gtg gcg 1 gag ggg 1
cyano2 >1aa 1aa -5s +5s -16s +16s total
type 27 72 99
cyano. Distribution du total: +16s duplicata
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 5 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca 2 aaa aga
cta cca caa cga
gta gca 5 gaa gga
ttg tcg tag tgg
atgj 2 acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
cyano2 dupli 1aa -5s +5s -16s +16s total
type 4 10 10
cyano. indices du 25.11.20 84 génomes
g1 t1 84 3959 3,6  0
atgi 105 tct tat atgf 98
att 7.1 act 2.4 aat 3.6 agt
ctt 17 cct 2.4 cat 2.4 cgc 1.2
gtt gct 1.2 gat ggt
ttc 123 tcc 102 tac 118 tgc 113
atc 195 acc 106 aac 117 agc 114
ctc 94 ccc 101 cac 110 cgt 111
gtc 102 gcc 108 gac 119 ggc 108
tta 83 tca 114 taa 2.4 tga
ata 9.5 aca 114 aaa 115 aga 114
cta 118 cca 130 caa 114 cga 2.4
gta 111 gca 193 gaa 118 gga 111
ttg 119 tcg 113 tag 2.4 tgg 110
atgj 118 acg 102 aag 38 agg 77
ctg 92 ccg 85 cag 13 cgg 100
gtg 43 gcg 82 gag 8.3 ggg 76
inter max min total

cyano distribution par type

modifier
Cyano. Distribution par type.
cyano. distribution des solitaires
g1    t1          
atgi 3 tct tat atgf 2
att act aat agt
ctt 1 cct cat cgt
gtt gct gat ggt
ttc 2 tcc 2 tac tgc 2
atc acc 1 aac 2 agc 2
ctc 1 ccc 2 cac 2 cgc 2
gtc 2 gcc 1 gac 2 ggc 2
tta 1 tca 2 taa tga
ata aca 2 aaa 2 aga 2
cta 2 cca 2 caa 2 cga
gta 2 gca 1 gaa 2 gga 2
ttg 2 tcg 2 tag tgg 2
atgj 2 acg 2 aag 1 agg 2
ctg 1 ccg 1 cag cgg 2
gtg gcg 1 gag ggg 1
cyano2 1aa 72
cyano. distribution du type >1aa sans duplicata.
g1    t1          
atgi tct tat atgf 1
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac 2 tgc 1
atc acc 2 aac 1 agc 1
ctc 1 ccc cac cgc 1
gtc gcc 1 gac 1 ggc
tta 1 tca taa tga
ata aca aaa aga
cta 1 cca 1 caa 1 cga
gta gca 1 gaa 1 gga
ttg 1 tcg tag tgg 1
atgj acg aag agg
ctg 1 ccg 1 cag 1 cgg
gtg gcg gag ggg
cyano2 >1aa 23

cyano par rapport au groupe de référence

modifier
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
cyano2 1aa >1aa dup +5s 1-3aas autres total
21 faible 19 4 23
16 moyen 27 10 2 10 49
14 fort 26 9 2 37
72 23 4 10 109
10 g+cga 8 2 10
2 agg+cgg 4 4
4 carre ccc 6 2 8
5 autres 1 1
19 4 23
total tRNAs ‰
cyano2 1aa >1aa dup +5s 1-3aas autres cyano ‰ ref.‰
21 faible 174 37 211 26
16 moyen 248 92 18 92 450 324
14 fort 239 83 18 339 650
661 211 37 92 109 729
10 g+cgg 73 18 92 10
2 agg+cga 37 37
4 carre ccc 55 18 73 16
5 autres 9 9
174 37 211
blocs tRNAs ‰ total colonne %
cyano2 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 192 40 232 26 26 17
16 moyen 273 101 20 394 324 38 43
14 fort 263 91 20 374 650 36 39
727 232 40 99 729 72 23
10 g+cgg 81 20 101 10 42
2 agg+cga 40 40 21
4 carre ccc 61 20 81 16 32
5 autres 10 10 5
192 40 232 19

cyano, estimation des -rRNAs

modifier
  • Lien tableur: cyano, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 25.11.20
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

cyano, calcul des -rRNAs

modifier
cya cyano 31 génomes
cya1 cumul des +rRNAs de la fiche cyano pour 31 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 58 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 45 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
cyan31 inter max min total
103 0 0 103
cya2 indices du clade cyano du 25.11.20 de gtRNAdb pour 100 génomes
g1    t1        3.6   0
atgi 105 tct tat atgf 98
att 7.1 act 2.4 aat 3.6 agt
ctt 17 cct 2.4 cat 2.4 cgc 1.2
gtt gct 1.2 gat ggt
ttc 123 tcc 102 tac 118 tgc 113
atc 195 acc 106 aac 117 agc 114
ctc 94 ccc 101 cac 110 cgt 111
gtc 102 gcc 108 gac 119 ggc 108
tta 83 tca 114 taa tga
ata 9.5 aca 114 aaa 115 aga 114
cta 118 cca 130 caa 114 cga 2.4
gta 111 gca 193 gaa 118 gga 111
ttg 119 tcg 113 tag tgg 110
atgj 118 acg 102 aag 38 agg 77
ctg 92 ccg 85 cag 13 cgg 100
gtg 43 gcg 82 gag 8.3 ggg 76
gtRNA inter max min total
1906 1607 1171 4684
cya3 cumul des -rRNAs de l'annexe archeo 2 génomes
g1    t1       
atgi 3 tct tat atgf 3
att act aat agt
ctt 1 cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 2 tgc 3
atc acc 3 aac 3 agc 3
ctc 2 ccc 2 cac 2 cgt 3
gtc 2 gcc 2 gac 3 ggc 2
tta 2 tca 2 taa tga
ata aca 4 aaa 2 aga 2
cta 3 cca 3 caa 3 cga
gta 2 gca 2 gaa 3 gga 2
ttg 3 tcg 2 tag tgg 3
atgj 4 acg 2 aag 1 agg 2
ctg 2 ccg 2 cag 1 cgg 2
gtg gcg 1 gag ggg 1
cyan2 inter max min total
39 37 23 99
cya4 indices des +rRNAs de la fiche cyano pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 187 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 145 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
cyan31 inter max min total
332 0 0 332
cya5 estimation des -rRNA du clade cyano pour 100 génomes
g1    t1        3.6  0
atgi 105 tct 0.2 tat atgf 98
att act 0.7 aat agt 0.2
ctt 0.9 cct 0.5 cat 0.9 cgc 1.4
gtt 0.2 gct 0.2 gat 0.9 ggt 0.2
ttc 123 tcc 102 tac 118 tgc 113
atc 8 acc 106 aac 117 agc 114
ctc 94 ccc 101 cac 110 cgt 111
gtc 102 gcc 108 gac 119 ggc 108
tta 83 tca 114 taa tga 0
ata 9.5 aca 114 aaa 115 aga 114
cta 118 cca 130 caa 114 cga 2
gta 111 gca 48 gaa 118 gga 111
ttg 119 tcg 113 tag tgg 110
atgj 118 acg 102 aag 38 agg 77
ctg 92 ccg 85 cag 13 cgg 100
gtg 43 gcg 82 gag 8 ggg 76
-rRNA inter max min total
1574 1607 1156 4337
cya6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 150 tct tat atgf 150
att act aat agt
ctt 50 cct cat cgc
gtt gct gat ggt
ttc 100 tcc 100 tac 100 tgc 150
atc acc 150 aac 150 agc 150
ctc 100 ccc 100 cac 100 cgt 150
gtc 100 gcc 100 gac 150 ggc 100
tta 100 tca 100 taa tga
ata aca 200 aaa 100 aga 100
cta 150 cca 150 caa 150 cga
gta 100 gca 100 gaa 150 gga 100
ttg 150 tcg 100 tag tgg 150
atgj 200 acg 100 aag 50 agg 100
ctg 100 ccg 100 cag 50 cgg 100
gtg gcg 50 gag ggg 50
cyan2 inter max min total
1950 1850 1150 4950

cyano, comparaison clade-annexe des -rRNAs

modifier
  • Lien tableur: cyano, comparaison clade-annexe des -rRNAs
  • Légende
    - cya7. diff, somme des couleurs de cya7. La différence entre tRNAs est faite entre cya5 et cya6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - cya8. rap, rapport des sommes couleurs cya5/cya2. Le rapport -rRNA/total est celui du tRNA de cya5 sur celui de cya2.
  • Fréquences des différences en % du tableau cya7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	1	12	9	14	3	2	1	0	1	0	5	0	48
tot ≤ 50						40							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 2% au dessus de celle de la fiche des cyano.
tRNAs		fiche		annexe
sans		1505		99
avec		119		10
genomes		31		2
indice %	49		50
cya cyano 63 génomes
cya7 cyano, différence clade-annexe des -rRNAs
g1    t1       
atgi 30 tct 100 tat atgf 35
att act 100 aat agt 100
ctt 98 cct 100 cat 100 cgc 100
gtt 100 gct 100 gat 100 ggt 100
ttc 19 tcc 2 tac 15 tgc 25
atc 100 acc 29 aac 22 agc 24
ctc 6 ccc 1 cac 9 cgt 26
gtc 2 gcc 7 gac 21 ggc 7
tta 17 tca 12 taa tga
ata 100 aca 43 aaa 13 aga 12
cta 21 cca 13 caa 24 cga 100
gta 10 gca 52 gaa 21 gga 10
ttg 21 tcg 12 tag tgg 27
atgj 41 acg 2 aag 24 agg 23
ctg 8 ccg 15 cag 74 cgg 0
gtg 100 gcg 39 gag 100 ggg 34
diff inter max min total
330 279 337 946
cya8 cyano, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act 29 aat agt
ctt 5 cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 4 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 25 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
83 100 99 93