Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro

spiro
Image logo représentative de la faculté
Annexe 9
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :cyano
Suivant :archeo
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : spiro
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro
 », n'a pu être restituée correctement ci-dessus.



Spirochetes

modifier

Sphaerochaeta coccoides DSM 17374

modifier

scc opérons

modifier
  • Lien tableur: scc opérons
  • Liens: gtRNAdb [1], NCBI [2], génome [orgn]
  • Phylogénie: Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Sphaerochaeta.
  • Légende:
Sp1. scc opérons, Sphaerochaeta coccoides DSM 17374.
50.6%GC 12.1.21 Paris 3.16s doubles intercal cds aa  avec.aa cdsa cdsd protéines
comp 215073..215231 cds 1194 1194 53 hp
comp 216426..216498 gcg @1 369 369 369
comp 216868..217047 cds 60 hp
243358..244170 cds @2 812 812 271 HAD-IIB family hydrolase
244983..246519 16s 132 132
246652..246725 atc 79 79
246805..249778 23s 72
249851..249962 5s 175 175 175
250138..250947 cds 270 metal ABC transporter permease
300128..301798 cds 669 669 557 formate--tetrahydrofolate ligase
302468..302539 ggg 452 452 452
302992..304032 cds 347 ABC transporter substrate-binding protein
comp 316296..317216 cds 152 152 307 152 phosphatase PAP2 family protein
317369..317442 gac 176 176
317619..318692 cds 358 tRNA 2-thiouridine(34) synthase MnmA
330207..331004 cds 16 16 266 16 class I SAM-dependent methyltransferase
comp 331021..331104 ttg 251 251
331356..333446 cds 697 patatin-like phospholipase family protein
comp 345290..346216 cds 228 228 309 hp
comp 346445..346517 ccg 182 182 182
comp 346700..347059 cds 120 hp
422975..424363 cds 71 71 463 71 sulfatase-like hydrolase/transferase
comp 424435..424506 gtc 252 252
424759..426600 cds 614 hp
436852..438168 cds 237 237 439 MFS transporter
comp 438406..438477 gtg 202 202 202
438680..440152 cds 491 hp
comp 481186..482484 cds 180 180 433 HD domain-containing protein
482665..482737 atgj 82 82 82
482820..483494 cds 225 hp
530805..532313 cds 82 82 503 82 IMP dehydrogenase
532396..532467 gta 310 310
532778..533485 cds 236 YggS family pyridoxal phosphate-dependent enzyme
568939..569700 cds 102 102 254 102 NAD-dependent deacetylase
569803..569874 gga 412 412
570287..570952 cds 222 hp
636017..636391 cds 52 52 125 52 chorismate mutase
636444..636517 aca 334 334
comp 636852..637013 cds 54 hp
comp 717326..717772 cds 66 66 149 66 YkgJ family cysteine cluster protein
comp 717839..717920 tac 230 230
718151..719386 cds 412 aminopeptidase
comp 721419..723056 cds @3 67 67 546 67 ATP-binding cassette domain-containing protein
comp 723124..723195 gag 10 10
comp 723206..723276 cag 104 104
comp 723381..723911 cds 177 adenine phosphoribosyltransferase
comp 724974..725225 cds 236 236 84 hp
comp 725462..725533 acg 124 124 124
comp 725658..728366 cds 903 pyruvate, phosphate dikinase
comp 767509..768549 cds 350 350 347 350 DegT/DnrJ/EryC1/StrS aminotransferase family protein
comp 768900..769011 5s 72
comp 769084..772057 23s 40 40
comp 772098..772171 gca 137 137
comp 772309..773845 16s 535 535
774381..774947 cds 189 peroxiredoxin
783089..784627 cds 273 273 513 glycoside hydrolase family 43 protein
comp 784901..784972 gaa 43 43
comp 785016..785088 aaa 223 223 223
785312..787483 cds 724 cadmium-translocating P-type ATPase
comp 877367..879202 cds 447 447 612 447 translational GTPase TypA
comp 879650..879761 5s 72
comp 879834..882807 23s 40 40
comp 882848..882921 gca 137 137
comp 883059..884595 16s 648 648
885244..885867 cds 208 GNAT family N-acetyltransferase
900855..901490 cds 73 73 212 73 Fic family protein
comp 901564..901637 ccc 214 214
901852..903519 cds 556 Alpha-glucosidase
928254..930545 cds 138 138 764 138 AAA family ATPase
930684..930755 cac 32 32
930788..930861 cga 38 38
930900..930972 aag 37 37
931010..931091 cta 36 36
931128..931199 ggc 423 423
931623..932981 cds 453 trigger factor
937885..939693 cds 171 171 603 171 oligoendopeptidase F
939865..939938 aga 437 437
940376..940579 cds 68 helix-turn-helix domain-containing protein
comp 974079..974468 cds @4 223 223 130 tyrosine-type recombinase/integrase
comp 974692..974775 ctc 153 153 153
comp 974929..975384 cds 112 112 152 VOC family protein
comp 975497..975569 cca 95 95 95
975665..976339 cds 225 endonuclease III
1069506..1069922 cds 81 81 139 hp
comp 1070004..1070087 tta 78 78 78
1070166..1070981 cds 272 TatD family hydrolase
comp 1113338..1113928 cds 247 247 197 247 NAD(P)H-dependent oxidoreductase
1114176..1114248 aac 247 247
comp 1114496..1117318 cds 941 5'-nucleotidase C-terminal domain-containing protein
comp 1126672..1127604 cds 173 173 311 173 DUF362 domain-containing protein
1127778..1127850 caa 193 193
comp 1128044..1128334 cds 97 septation regulator SpoVG
comp 1257969..1258763 cds 140 140 265 nucleotidyltransferase domain-containing protein
1258904..1258977 agg 79 79 79
1259057..1259779 cds 241 nitroreductase family protein
comp 1273039..1273944 cds 217 217 302 DNA-protecting protein DprA
1274162..1274234 ttc 103 103 103
comp 1274338..1274865 cds 176 cysteine hydrolase
comp 1363097..1364389 cds 432 432 431 H(+)-transporting two-sector ATPase
1364822..1364894 atgf 213 213 213
1365108..1366457 cds 450 Trk system potassium transporter TrkA
comp 1478531..1479448 cds 196 196 306 196 hp
1479645..1479718 cgg 256 256
comp 1479975..1481738 cds 588 ABC transporter ATP-binding protein
comp 1522454..1523143 cds 86 86 230 hp
1523230..1523301 tgc 34 34 34
comp 1523336..1523890 cds 185 hp
comp 1540671..1541807 cds 186 186 379 186 DUF2974 domain-containing protein
comp 1541994..1542066 gcc 351 351
1542418..1544223 cds 602 IS1634 family transposase
1691238..1692578 cds 189 189 447 189 sn-glycerol-1-phosphate dehydrogenase
1692768..1692851 ctg 564 564
1693416..1693646 cds 77 helix-turn-helix domain-containing protein
comp 1760709..1761905 cds 185 185 399 185 hp
1762091..1762164 atgi 316 316
comp 1762481..1765135 cds 885 valine--tRNA ligase
comp 2034849..2035028 cds @4 32 32 60 preprotein translocase subunit SecE
comp 2035061..2035134 tgg 26 26 26
comp 2035161..2035337 cds 64 64 59 64 50S ribosomal protein L33
comp 2035402..2035474 acc 246 246
2035721..2036506 cds 262 HAD family hydrolase
2185380..2186171 cds @5 84 84 264 84 16S rRNA (uracil(1498)-N(3))-methyltransferase
2186256..2186340 tca 40 40
2186381..2186467 agc 25 25
2186493..2186566 cgc 16 16
2186583..2186669 tcg 40 40
2186710..2186795 tcc 13
2186809..2186906 ncRNA 133 133 33
comp 2187040..2188236 cds 399 transposase

scc cumuls

modifier
cumuls. scc.
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 3 1 0 1 0 1 0 100 9 - -
16 23 5s 0 20 2 50 4 20 1 200 11
16 atc23s5s 1 40 7 2 100 14 40 2 300 16
16gca23s5s 2 60 1 0 150 8 60 1 400 11
max a 1 80 1 200 13 80 7 500 9
a doubles 100 0 250 13 100 4 600 6
autres 120 0 300 4 120 2 700 5
total aas 3 140 3 350 4 140 2 800 2
sans opérons 34 160 400 2 160 2 900 1
1 aa 30 180 450 5 180 3 1000 2
max a 5 200 500 1 200 5 1100
a doubles 0 6 4
total aas 44 10 6 74 33 72
total aas 47
remarques 5
avec jaune moyenne 32 94 236 154 343
variance 11 47 196 108 215
sans jaune moyenne 188 124 299
variance 110 64 164

scc blocs

modifier
Sp1. Sphaerochaeta coccoides
cds 812    cds 350 447
16s 132 5s 72 72
atc 79 23s 40 40
23s 72 gca 137 137
5s 175 16s 535 648
cds cds

scc remarques

modifier
  • Lien tableur: scc remarques
  • Remarques : Ce génome se distingue par ses 3 blocs à rRNA avec 1 seul aa et le grand nombre de solitaires.
    1. @ Sur les 30 solitaires 9 sont rares dont ccc. Deux autres rares sont dans un blocs de 2 aas. Les 2 blocs de 5aas contiennent chacun un rare, tcg aag.
    2. @ Il n’y a pas plus d’un aa entre 16s et 23s et qui sont les plus communs, atc et gca comme les archées qui n’ont que gca. Les intercalaires, à par les cds, sont identiques sauf pour l’intercalaire aa-23s qui est différent entre atc et gca, du double, 40/79.
    3. @ Les 2 rares ne sont pas solitaires comme les 9 autres. Ils appartiennent à la même colonne, xag qui est plus fréquentes que la colonne xcg.
    4. @ 2 blocs avec 2 opérons solitaires séparés par un petit cds de 152 et 59 aas. Les intercalaires sont moyens pour le 1er (120 pbs) et faibles (30 pbs) pour le second.
    5. @ 2 blocs de 5 aas. Le dernier contient un aa rare et cgc au lieu de cgt.
  • Séquences des doubles: pas de doubles.

scc distribution

modifier
sp1 scc, Sphaerochaeta coccoides DSM 17374. spirochète.
sp11 scc, distribution par type
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 0
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
spiro >1aa =1aa -5s +5s -16s +16s total
scc 14 30 3 47
sp12 scc, distribution sur référence
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc 1 acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt 0
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca 2 gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
inter max min total
17 13 17 47
spiro2. indices du 11.1.21 73 génomes
g1 t1 73 2823 0  0
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc 90
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 100 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 114 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
inter max min total

scc. Intergen51

modifier

Intergen51. scc. Le génome

modifier
  • scc Le prélèvement: Artb
  • Le nom et le lien NCBI: scc, Sphaerochaeta coccoides DSM 17374, NCBI [3], date 16.07.20.
  • scc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
scc	214,658		2,227,296	9.6	
scc données intercalaires
modifier
scc données intercalaires 200
modifier
scc autres intercalaires aas
modifier

Intergen51. scc. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. scc les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 scc les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 994 319 6 1,319 2.7 19 5 24
x 456 28 2 486 0 1 1
t 1,450 347 8 1,805 19 6 25
% 80.3 19.2 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 34 0 0 34 1.0 tRNA-CDS 67 64
x 33 0 0 33 RNA-RNA 19 18
t 67 0 0 67 CDS-rRNA 6 6
% 100.0 0.0 0.0 non RNA 12 12
- total 104 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 3.4 20.6 1.9 33.9 2.9 61 0.5 0.0
x 8.5 3.0 3.6 10.7 3.0 11 0.4 0.0

Intergen51. scc. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: scc données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées scc fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. scc fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	scc
R2	x3		x2		x		c		Inflexion poly3	x	c
0.702	2.69E-06	-1.79E-03	2.37E-01	28.30	fx1	abscisse	221.8	321.3
0.829	-8.29E-06	6.33E-03	-1.54E+00	129.0	fc1	ordonnée	-8.7	6.4
								
0.745	2.36E-06	-1.57E-03	1.92E-01	30.5	fx41			
0.938	-1.66E-06	1.60E-03	-5.41E-01	70.1	fc41			
  • Le rfin après 400 est de 34 sur un total de 1000 . Jusqu'à 1% les freq10 sont en continu jusqu'à 570 , reste 10 . L'indice i.rfin1 = 24/170=0,141.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	scc		calculs			poly3	scc
effect	1000		R2.21	815		abscis	170
xm	30		pte	22,56		flexa	110
ym	4		cste	4,68		flexo	2,77
x1m	163		r400l	237		xm	35
y1m	1		restp	236,00		sup4	107,6
rfin	34,00		%sd	33,17		sup4t	290,0
bornf	99		lond	133		%	37,1
supd	139,3		%sf	30,89		long	75
supdt	420,0		lonf	69		R2	308
xmp	344,00		sf/lf	1,24			
r400	202,00		sr/lr	0,84			
supf	85,3		sd/ld	1,05			
supft	276,0		i.r400	0,85							

Intergen51. scc. Les CDS-CDS négatifs

modifier
Sous-totaux	scc			totale	
fréquence	x-	c-		x-	c-
 - 1		0	39		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		2	156		717	10938
 - 5		0	0		5	19
sp6		25	124		1642	8424
total		28	319		2,456	23,544
reste		1	6		264	420
s6		9	1		361	41
s7		3	22		321	1438
s8		12	95		696	6525
rapport s1-5						
4/2/1		2.0	4.0		8.4	2.6
% / sp6						
s6/sp6		36.0	0.8		22.0	0.5
s7/sp6		12.0	17.7		19.5	17.1
s8/sp6		48.0	76.6		42.4	77.5
reste/sp6	4.0	4.8		16.1	5.0
						
total s1-5	3	195		814	15120
% / total						
%s1-5		10.7	61.1		33.1	64.2
%sp6		89.3	38.9		66.9	35.8

Intergen51. scc. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		3			CDS 16s		3	
16s 23s					5s CDS		2	1
16s tRNA	3			16 CDS			
tRNA 23s	3			CDS 5s			
5s tRNA					23s CDS			
tRNA in					CDS 23s			
tRNA contig				5s 16s			
tRNA hors	10			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		19	0		total		5	1
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. scc. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 scc. Les intercalaires tRNA-tRNA hors blocs
inter aa         
10 gag
** cag
43 gaa
** aaa
32 cac
38 cga
37 aag
36 cta
** ggc
40 tca
25 agc
16 cgc
40 tcg
** tcc

scc intercalaires entre cds

modifier
  • Lien NCBI [4]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

scc intercalaires positifs S+

modifier
scc. Sx+ Sc+ Les diagrammes 400
scc Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 30 -200 266 31 690 222 max30 -86 660 -1605 134 830 256 min60
31 à 400 2 parties -7 162 -551 72 949 318 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 104 46 - 619 poly 71 tF 197 65 499 poly 331 SF
31 à 400 114 43 - 787 poly 162 SF
  • Légende du tableau des corrélations et des fréquences faibles
scc. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
blo min20 448 993 1441 820 406 537 131 38 255 669
scc min10 416 961 1377 748 440 530 90 -88 49 367
cbn min20 489 1701 2190 731 543 505 -38 -222 -114 271
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
89 208 0.43 518 1255 4 1 35 167 54 241 -109
118 353 0.33 485 1320 4 5 58 242 60 389 -177
65 312 0.21 553 1940 2 5 17 86 56 620 -382
  • Diagrammes 400:  scc ase,   diagramme 1-40: c+ sccc+ asex+ asetotal,   texte: ase.
  • Résumé: C’est un génome bien particulier, le seul à avoir un maximum à la fréquence 30 pour x+ 1-400. J’ai essayé de le comparer à des génomes similaires avec des taux faibles aux fréquences 1-30 et un maximum plus en amont comme ase cvi myr, et seul ase s’en approche le plus avec un max à 70. On peut le comparer à bsu qui a un maximum à 40 mais x+ 1-400 est un Sf et c+ 31-400 est un tF. Enfin on peut le comparer à pmq mais son max est à 160 et c+ 31-400 est un Sf avec un R2’ de 51 bien plus petit que celui de scc avec 162; en plus avec pmq on aborde les corrélations très négatives, -852 contre 530 pour scc. Scc est donc plus proche de ase avec 2 corrélations positives, une moyenne, 530 de scc, et une maximum, 940 de ase mais qui descend à 725 en 1-250. Donc j’ai choisi ase malgré une grande différence dans les effectifs, 1377 contre 5956 pour ase. Les effectifs de bsu et pmq sont aussi plus élevés que celui de scc, respectivement 2441 et 4170.
    - Les diagrammes 400
    • x+1-400
      + Le génome ase se distingue par un faux départ à la fréquence 10 comme maximum. Son taux 1-30 est de 135 ‰ or les vrais départ à 10 ont un taux supérieur à 169 (rru), ade ant mja pmg pub rru. Son vrai maximum est à 70 au-delà de 30 comme les 15 génomes restant. La forme de la courbe est un tilde faible, tf, due notamment au renflement au niveau du maximum 70 contrairement aux formes S des 6 vrais départs en 10, ade Sf 39, ant SF 71, mja SF 78, pmg SF 179, pub SF 249, rru Sf 20 (forme suivie du R2’).
      + Le génome ssc: en alignant les taux des 5 1ères fréquences, 10 20 30 40 50, j’obtiens 3 groupes de 7 génomes chacun.
      1. Le 1er, les taux décroissent fortement avec un taux à la fréquence 30 entre 38 et 68, ce sont: ade ant ase mja pmg pub rru.
      2. Le 2ème, les taux croissent fortement avec un taux à 30 entre 24 et 68, ce sont: abra afn blo bsu cbn myr scc. Seuls blo et scc ont un maximum en 30 avec respectivement un taux de 33 et 60.
      3. Le 3ème groupe varie peu avec un taux à 30 entre 7 et 18, ce sont: cbei cvi eco mba pmq rtb spl.
      + Malgré que ase et scc soient dans 2 groupes différents leur rapprochement est du au maximum à 70 de ase et à un 2ème maximum à 100 de scc.
      + La forme de la courbe est un tilde franc avec un R2’ de 71 contre 25 pour ase.
      + Le génome blo: j’aurais pu comparer scc à blo à cause de la forte ressemblance des 2 courbes x+ 1-400 (maximum à 30 et forme tF avec des effectifs similaires) mais ses courbes c+ n-400 sont nettement différentes de celles de scc, Sf 41 et tf 36 contre SF 331 et SF 162 (forme suivie du R2’).
    • c+ n-400: ce sont les 4 courbes en commun avec des R2’ élevés pour 1-400 et moins élevés pour 31-400, 331 162 pour scc et 216 149 pour ase. Les points d’inflexion se trouvent à des fréquences moyennes, 256 et 318 pour scc, et 273 et 337 pour ase. Par ailleurs la 1ère partie de chaque courbe c+ 31-400 présente des bosses nettes qui s’éloignent de la courbe de décroissance en fonction de la distance.
    - Les corrélations:
    • ase a la corrélation 41-250 la plus élevée de tous les génomes étudiés et elle se maintient à 41-200, 922 contre 940. Par contre les faibles fréquences 1-30 diminuent fortement la corrélation sur 1-250 à 725.
    • scc va se comporter comme ase avec les faibles fréquences mais avec une corrélation moyenne au départ, de 530 contre 940. Elle diminue fortement sur 41-200 au contraire de ase, la différence entre les 2 plages (diff) est de 90 contre 18 pour ase. Sur la plage 1-250 elle diminue comme ase mais plus fortement, elle devient quasiment nulle (49) alors que ase resiste (725).
    - Les faibles fréquences:
    • Les faibles fréquences 1-30: scc avec 471‰ et largement au-dessus de ase, 135‰, à cause du maximum à la fréquence 30.
    • Les taux des zéros sont à peu près identiques, 9‰ pour scc et 10‰ pour ase
    • De même pour le taux des négatifs 300‰ pour scc contre 280‰ pour ase.
    • Le rapport des faibles fréquences x+/c+ a peu de sens ici car les corrélations x+ 1-40 ci-dessous sont très faibles ou négatives.
    - Les diagrammes 40:
    • Les 2 courbes c+ sont très proches du modèle des c+ 1-40 malgré la faiblesse de l’effectif de scc de 389 contre 1165 d’ase.
    • Les effectifs x+ 1-40 de scc, 60, sont trop faibles pour faire des comparaisons significatives. Chez ase avec un effectif de 389 j’ai pu montrer que la courbe x+ 1-40 est différente du modèle c+ 1-40.
    • Les corrélations x+/c+ 1-40 traduisent les formes des courbes aux faibles fréquences 1-30. Avec une corrélation de 0.346, ase a les taux des fréquences qui décroissent parallèlement en x+ et c+, mais elle reste faible par rapport à pmg, par exemple, avec 0.703. Scc a sa corrélation négative, -0.177, montrant que les 2 courbes ont des pentes opposées à ce niveau.

scc autres intercalaires

modifier
  • Lien tableur: scc autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
  • Totaux: 2 repeat_region 1 regulatory 1 ncRNA 1 tmRNA
tRNA-cds		tRNA-tRNA		autres-cds		total
c+	x+	x-	c+	x+	c-	c+	x+	c-	
38	36		20			9	1		104
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

scc par rapport au groupe de référence

modifier
scc: Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
scc 1aa >1aa dup +5s 1-3aas autres total
21 faible 11 6 17
16 moyen 9 5 3 17
14 fort 10 3 13
30 14 0 0 0 3 47
10 g+cga 5 6 11
2 agg+cgg 2 2
4 carre ccc 4 4
5 autres 0
11 6 0 0 0 0 17
total tRNAs ‰
scc 1aa >1aa dup +5s 1-3aas autres scc ‰ ref.‰
21 faible 234 128 362 26
16 moyen 191 106 64 362 324
14 fort 213 64 277 650
638 298 64 47 729
10 g+cga 106 128 234 10
2 agg+cgg 43 43
4 carre ccc 85 85 16
5 autres
234 128 362
blocs tRNAs ‰ total colonne %
scc 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 250 136 386 26 37 43
16 moyen 205 114 318 324 30 36
14 fort 227 68 295 650 33 21
682 318 44 729 30 14
10 g+cga 114 136 250 10 45 100
2 agg+cgg 45 45 18
4 carre ccc 91 91 16 36
5 autres
250 136 386 11 6

spirochetes, estimation des -rRNAs

modifier
  • Lien tableur: spirochetes, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 11.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

spirochetes, calcul des -rRNAs

modifier
spi spirochetes 13 génomes
spi1 cumul des +rRNAs de la fiche spirochetes pour 13 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 9 acc aac agc
ctc ccc cac cgt
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 12 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
spir13 inter max min total
13 21
spi2 indices du clade spirochetes du 11.1.21 de gtRNAdb pour 100 génomes
g1    t1       
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 100 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 114 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
gtRNA inter max min total
1560 1326 891 3777
spi3 cumul des -rRNAs de l'annexe spiro de 1 génome
g1    t1       
atgi 1 tct tat atgf 1
att act aat agt
ctt cct cat cgc 1
gtt gct gat ggt
ttc 1 tcc 1 tac 1 tgc 1
atc acc 1 aac 1 agc 1
ctc 1 ccc 1 cac 1 cgt
gtc 1 gcc 1 gac 1 ggc 1
tta 1 tca 1 taa tga
ata aca 1 aaa 1 aga 1
cta 1 cca 1 caa 1 cga 1
gta 1 gca gaa 1 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 1 acg 1 aag 1 agg 1
ctg 1 ccg 1 cag 1 cgg 1
gtg 1 gcg 1 gag 1 ggg 1
spir1 inter max min total
14 14 16 44
spi4 indices des +rRNAs de la fiche spirochetes pour 100 génomes
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 69 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 92 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
spir13 inter max min total
162 0 0 162
spi5 estimation des -rRNA du clade spirochetes pour 100 génomes
g1    t1       
atgi 96 tct tat atgf 96
att act aat agt
ctt cct cat cgc 90
gtt gct gat ggt
ttc 125 tcc 100 tac 100 tgc 100
atc 31 acc 100 aac 100 agc 100
ctc 103 ccc 55 cac 100 cgt 12
gtc 55 gcc 59 gac 107 ggc 103
tta 100 tca 100 taa tga 16
ata 1 aca 100 aaa 100 aga 101
cta 100 cca 100 caa 100 cga 92
gta 101 gca 22 gaa 82 gga 100
ttg 100 tcg 41 tag tgg 100
atgj 97 acg 58 aag 78 agg 66
ctg 52 ccg 42 cag 42 cgg 47
gtg 34 gcg 41 gag 40 ggg 21
-rRNA inter max min total
1398 1326 891 3615
spi6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 100 tct tat atgf 100
att act aat agt
ctt cct cat cgc 100
gtt gct gat ggt
ttc 100 tcc 100 tac 100 tgc 100
atc acc 100 aac 100 agc 100
ctc 100 ccc 100 cac 100 cgt
gtc 100 gcc 100 gac 100 ggc 100
tta 100 tca 100 taa tga
ata aca 100 aaa 100 aga 100
cta 100 cca 100 caa 100 cga 100
gta 100 gca gaa 100 gga 100
ttg 100 tcg 100 tag tgg 100
atgj 100 acg 100 aag 100 agg 100
ctg 100 ccg 100 cag 100 cgg 100
gtg 100 gcg 100 gag 100 ggg 100
spir1 inter max min total
1400 1400 1600 4400

spirochetes, comparaison clade-annexe des -rRNAs

modifier
  • Lien tableur: spirochetes, comparaison clade-annexe des -rRNAs
  • Légende
    - spi7. diff, somme des couleurs de spi7. La différence entre tRNAs est faite entre spi5 et spi6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - spi8. rap, rapport des sommes couleurs spi5/spi2. Le rapport -rRNA/total est celui du tRNA de spi5 sur celui de spi2.
  • Fréquences des différences en % du tableau spi7
gamme		0/0	10	20	30	40	50	60	70	80	90	100			total
fréquence		27	2	1	1	5	6	1	1	0	5	0	49
tot ≤ 50							36							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 18% au dessus de celle de la fiche des spirochetes.
tRNAs		fiche		annexe
sans		485		44
avec		22		3
genomes		13		1
indice %	37		44
spi spirochetes 13 génomes
spi7 spirochetes, différence clade-annexe des -rRNAs
g1    t1       
atgi 4 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 20 tcc 0 tac 0 tgc 0
atc 100 acc 0 aac 0 agc 0
ctc 3 ccc 45 cac 0 cgt 100
gtc 45 gcc 41 gac 7 ggc 3
tta 0 tca 0 taa tga 100
ata 100 aca 0 aaa 0 aga 1
cta 0 cca 0 caa 0 cga 8
gta 1 gca 100 gaa 18 gga 0
ttg 0 tcg 59 tag tgg 0
atgj 3 acg 42 aag 22 agg 34
ctg 48 ccg 58 cag 58 cgg 53
gtg 66 gcg 59 gag 60 ggg 79
diff inter max min total
56 62 732 850
spi8 spirochetes, rapports -rRNA/total
g1    t1       
atgi tct tat atgf
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac tgc
atc 31 acc aac agc
ctc ccc cac cgc
gtc gcc gac ggc
tta tca taa tga
ata aca aaa aga
cta cca caa cga
gta gca 19 gaa gga
ttg tcg tag tgg
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
rap inter max min total
50 0 0 50