Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/gamma

gamma
Image logo représentative de la faculté
Annexe 1
Recherche : Les clusters de gènes tRNA et rRNA chez les procaryotes
Précédent :Sommaire
Suivant :alpha
En raison de limitations techniques, la typographie souhaitable du titre, « Annexe : gamma
Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/gamma
 », n'a pu être restituée correctement ci-dessus.



Shewanella

modifier

spl opérons

modifier
S1. Shewanella pealeana
39.1%GC 30.6.19 Paris  147  doubles interca
45136..46685 16s @1 339
47025..49946 23s 112
50059..50174 5s
51490..53039 16s 339
53379..56298 23s 114
56413..56528 5s
182271..183820 16s @2 71
183892..183968 atc 65
184034..184109 gca 364
184474..187395 23s 112
187508..187623 5s 100
187724..187800 gac
191614..191689 aca 8
191698..191782 tac 35
191818..191891 gga
235182..236731 16s 374
237106..240025 23s 114
240140..240255 5s
243631..245180 16s 338
245519..248440 23s 113
248554..248669 5s 68
248738..248813 acc 17
248831..248946 5s
416766..416842 cgg 39
416882..416957 cac 41
416999..417075 cca + 58
417134..417210 cca 2 cca
493711..495260 16s 339
495600..498519 23s 114
498634..498749 5s
641376..641466 tca @3 1172
642639..642729 tca
645847..647396 16s 71
647468..647544 atc 65
647610..647685 gca 329
648015..650937 23s 156
651094..651209 5s
728115..728199 ttg
comp 1168942..1169018 atgi
comp 1339706..1339781 aca + 52
comp 1339834..1339909 ttc 2 ttc 539
comp 1340449..1340524 aca 2 aca 52
comp 1340577..1340652 ttc
comp 1342467..1342542 aca 52
comp 1342595..1342670 ttc
1456724..1456815 agc 21
1456837..1456913 cgt + 30
1456944..1457020 cgt 7 cgt 32
1457053..1457129 cgt 3 agc 30
1457160..1457236 cgt 33
1457270..1457346 cgt 9
1457356..1457447 agc 76
1457524..1457600 cgt 35
1457636..1457712 cgt 9
1457722..1457813 agc
comp 1627363..1627438 agg
comp 1770483..1770558 gta + 37
comp 1770596..1770671 gta 11 gta 37
comp 1770709..1770784 gta 37
comp 1770822..1770897 gta 37
comp 1770935..1771010 gta 37
comp 1771048..1771123 gta 37
comp 1771161..1771236 gta 37
comp 1771274..1771349 gta 37
comp 1771387..1771462 gta 37
comp 1771500..1771575 gta 39
comp 1771615..1771690 gta
1773910..1773985 gcc + 80
1774066..1774141 gaa 13 gaa 102
1774244..1774319 gaa 2 gcc 102
1774422..1774497 gaa 102
1774600..1774675 gaa 102
1774778..1774853 gaa 102
1774956..1775031 gaa 102
1775134..1775209 gaa 102
1775312..1775387 gaa 253
1775641..1775716 gaa 102
1775819..1775894 gaa 102
1775997..1776072 gaa 102
1776175..1776250 gaa 102
1776353..1776428 gaa 47
1776476..1776551 gcc
2081297..2082846 16s 338
2083185..2086104 23s 114
2086219..2086334 5s
comp 2143274..2143350 ccc
comp 2366164..2366240 atgf + 40
comp 2366281..2366357 atgf 4 atgf 40
comp 2366398..2366474 atgf 40
comp 2366515..2366591 atgf
2376218..2376308 tca
2379767..2379842 ggc 13
2379856..2379929 tgc 85
2380015..2380100 tta
2550857..2550932 ggc 13
2550946..2551019 tgc + 95
2551115..2551200 tta 3 tgc 634
2551835..2551908 tgc 3 tta 95
2552004..2552089 tta 479
2552569..2552642 tgc 132
2552775..2552860 tta
2558019..2558109 tca
comp 2717566..2717655 tcc
comp 2759730..2759806 atgf + 189
comp 2759996..2760072 atgf 4 atgf 45
comp 2760118..2760194 gtc 2 gtc 2
comp 2760197..2760273 atgf 35
comp 2760309..2760385 gtc 13
comp 2760399..2760475 atgf
2858823..2858907 tac + 30
2858938..2859022 tac 5 tac 85
2859108..2859192 tac 107
2859300..2859384 tac 107
2859492..2859576 tac
2866268..2866343 aac + 45
2866389..2866464 aac 7aac 41
2866506..2866581 aac 26
2866608..2866683 aac 32
2866716..2866791 aac 33
2866825..2866900 aac 40
2866941..2867016 aac
comp 2929429..2929505 gac + 97
comp 2929603..2929679 gac 4 gac 97
comp 2929777..2929853 gac 83
comp 2929937..2930013 gac
comp 3120289..3120364 aaa + 58
comp 3120423..3120498 aaa 12 aaa 58
comp 3120557..3120632 aaa 58
comp 3120691..3120766 aaa 59
comp 3120826..3120901 aaa 57
comp 3120959..3121034 aaa 58
comp 3121093..3121168 aaa 58
comp 3121227..3121302 aaa 59
comp 3121362..3121437 aaa 58
comp 3121496..3121571 aaa 59
comp 3121631..3121706 aaa 59
comp 3121766..3121841 aaa
comp 3269860..3269935 cac 8
comp 3269944..3270020 aga 63
comp 3270084..3270160 cca
comp 3757983..3758059 atgf
comp 3758163..3758249 ctc
comp 3835257..3835331 caa + 51
comp 3835383..3835467 cta 5 caa 131
comp 3835599..3835673 caa 5 cta 20
comp 3835694..3835778 cta 3 atg 96
comp 3835875..3835949 caa 49
comp 3835999..3836083 cta 211
comp 3836295..3836371 atg 5
comp 3836377..3836451 caa 47
comp 3836499..3836583 cta 55
comp 3836639..3836715 atg 5
comp 3836721..3836795 caa 47
comp 3836843..3836927 cta 55
comp 3836983..3837059 atg
comp 3862885..3862961 tgg + 167
comp 3863129..3863205 tgg 2 tgg
comp 3867049..3867164 5s 114
comp 3867279..3870198 23s 338
comp 3870537..3872086 16s
3882154..3882229 ttc
comp 4331488..4331563 ggc + 130
comp 4331694..4331769 ggc 6 ggc 47
comp 4331817..4331892 ggc 162
comp 4332055..4332130 ggc 16
comp 4332147..4332222 ggc 48
comp 4332271..4332346 ggc
comp 4616881..4616996 5s 112
comp 4617109..4620030 23s 364
comp 4620395..4620470 gca 65
comp 4620536..4620612 atc 71
comp 4620684..4622233 16s
comp 5129770..5129846 gac 100
comp 5129947..5130062 5s 115
comp 5130178..5133097 23s 339
comp 5133437..5134986 16s

spl cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.spl. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
spl cumuls	opérons			effectif
avec rRNA	opérons			11
		16 23 5s 0		6
		16 atc gca		3
		16 23 5s a		2
		max a			3
		a doubles		0
		spéciaux		0
		total aas		9
sans 		opérons			29
		1 aa			8
		max a			15
		a doubles		15
		total aas		133
total aas				142
remarques				3

spl blocs

modifier
S1. Shewanella pealeana, blocs à rRNA.
16s 339 339 374 339 338 338
23s 112 114 114 114 114 114
5s
16s 71 71 71 16s 338 16s 339
atc 65 65 65 23s 113 23s 115
gca 364 329 364 5s 68 5s 100
23s 112 156 112 acc 17 gac
5s 100 5s
gac

spl remarques

modifier
  • Remarques :
    1. @1   8 blocs 16-23-5s. Ils ont tous les mêmes intercalaires, 338 113 68.
        - 6 blocs sont solo avec un dont l'intercalaire 16s-23s fait 11% de plus que le reste, 36/338.
        - 2 blocs avec 1 aa dont un possède en plus un 5s, gac et acc-5s.
    2. @2   Les 2 blocs 16-atc-gca ont les mêmes intercalaires, 71 65 364 112. L’intercalaire 23s-5s est le même que les 6 autres blocs.
        - Les 2 blocs n'ont que 5 aas, soit pour les 8 opérons à rRNA 7 aas au total. Ce qui est quasiment nul.
    3. @3   Les intercalaires élevés ne touchent que 3 opérons sans rRNAs
				
	-		anciens	-		nouveaux	-
	intercalires	n aas	doubles		nv doubles	nv opérons
	1172		2	2			0	2
	539		4	2,2			0	2
	634, 479	6	3,3			0	3
					
	résultats	ancien 	nouveau		
	total opérons	29	33		
	1 aa		8	10		
	max aa		15	15		
	doubles		15	12		
  • Séquences des doubles : Les intercalaires excessives ne changent pas fondamentalement le spectre des doubles et leurs séquences. Ainsi les répétitions suivantes sont caractéristiques de ce génome.
    - opéron à 13 gaa avec 11 intercalalires identiques de 102 bases, soit 11 répétitions d’une séquence de 180 bases environ, longueur de gaa+102.
    - Les répétitions de séquences sont nombreuses. La plus longue est celle de l’opéron à 5 cta 5 caa 3 atg. Ce sont 5 séquences caa-cta avec un intercalaire de 50 interrompues par 2 atg et 2 intercalaires de 100 bases environ.
    - Les 2 autres opérons à séquences répétées sont, 4atgf 2gtc (2*(2atgf-gtc)) et 6 ggc (avec 2 ggc-ggc séparées par des intercalaires longs).
    - Répétitions du même codon avec son intercalaire comme pour le cas de l'opéron à 15 codons,
				
	codon	répétition	intercalaire		
	gaa	13		102		
	gta	11		37		
	tac	5		100		
	aac	7		35		
	gac	4		97		
	aaa	12		58		
	atgf	4		40		

spl distribution

modifier
  • Lien tableur: spl distribution
  • Notes:
    - gta11 tca2 cca2 tac5 aac7 gac4 aaa12 gaa13 atgf4+2 cgt5+2 ggc8 tgg2
    - tca: tca2, 2 1aa
    - gac: 2 5s, gac4
    - Séquences:
    (aca ttc)2
    (tgc tta)3
    (atf gtc)2
    (caa cta atgj)3 ou (caa cta)5
Gm1 spl, Shewanella pealeana. gama
g1    t1       
atgi 1 tct tat atgf 9
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 1 tac 6 tgc 4
atc 3 acc 1 aac 7 agc 3
ctc 1 ccc 1 cac 2 cgt 7
gtc 2 gcc 2 gac 6 ggc 8
tta 4 tca 4 taa tga
ata aca 4 aaa 12 aga 1
cta 5 cca 3 caa 5 cga
gta 11 gca 3 gaa 13 gga 1
ttg 1 tcg tag tgg 2
atgj 3 acg aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
gama >1aa =1aa -5s +5s -16s +16s total
spl 125 8 3 6 140

spl intergen51

modifier

Intergen51. spl. Le génome

modifier
  • spl Le prélèvement: Aspl
  • Le nom et le lien NCBI: spl, Shewanella pealeana ATCC 700345, NCBI [3], date 24.09.20.
  • Note de l'étude préliminaire pour l'étude des intercalaires cds-cds:
    - Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
  • spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
spl	789 212		5 174 581	15,3
spl données intercalaires
modifier
spl données intercalaires 200
modifier
spl autres intercalaires aas
modifier

Intergen51. spl. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. spl les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 spl les différents types d'intercalaires entre gènes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2 482 414 17 2 913 2,2 141 7 148
x 1 305 12 1 1 318 0 11 11
t 3 787 426 18 4 231 141 18 159
% 89,5 10,1 0,4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 39 0 0 39 1,7 tRNA-CDS 62 25
x 22 1 0 23 RNA-RNA 141 56
t 61 1 0 62 CDS-rRNA 18 7
% 98,4 1,6 0,0 non RNA 32 13
- total 253 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 10,2 38,5 1,2 24,1 0,0 63 0,6 0,0
x 17,6 30,4 8,3 3,1 0,0 58 0,1 0,0

Intergen51. spl. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: spl données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées spl fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. spl fx1
  • Équations des courbes de tendance en pour 1000: à partir des colonnes fx fc des données intercalaires.
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	spl
R2	x3		x2		x		c		Inflexion poly3	x	c
0,613	3,91E-06	-2,74E-03	4,89E-01	6,45	fx1	abscisse	220,9	150,6
0,805	-4,24E-06	3,25E-03	-8,35E-01	85,1	fc1	ordonnée	21,5	24,0
					
0,655	1,66E-06	-1,10E-03	1,26E-01	29,4	fx41			
0,909	8,15E-07	-3,68E-04	-6,78E-02	39,8	fc41			
  • Le rfin après 400 est de 253 sur un total de 2482. Jusqu'à 1% les freq10 sont en continu jusqu'à 860, reste 26. L'indice i.rfin1 = 227/460 = 0.493.
  • Moyennes glissantes des fc+400, diagonale. Voir le détail des calculs dans abs.
données	spl		calculs			poly3	spl
effect	2482		R2.21	802		abscis	400
xm	45		pte	8,97		flexa	150
ym	7		cste	3,22		flexo	2,36
x1m	248		r400l	152		xm	42
y1m	1		restp	222,00		sup4	97,4
rfin	101,93		%sd	27,38		sup4t	334,0
bornf	147		lond	203		%	29,2
supd	132,4		%sf	28,56		long	108
supdt	483,5		lonf	102		R2	594
xmp	294,52		sf/lf	0,89			
r400	120,06		sr/lr	0,41			
supf	90,7		sd/ld	0,65			
supft	317,5		i.r400	0,79							

Intergen51. spl. Les CDS-CDS négatifs

modifier
Sous-totaux	spl			totale	
fréquence	x-	c-		x-	c-
-1		0	126		4	4140
-2		2	0		85	11
-3		0	0		3	12
-4		5	136		717	10938
-5		0	0		5	19
sp6		5	152		1642	8424
total		12	414		2 456	23 544
reste		1	5		264	420
s6		1	0		361	41
s7		0	30		321	1438
s8		3	117		696	6525
rappot s1-5						
4/2/1		2,5	1,1		8,4	2,6
% / sp6						
s6/sp6		20,0	0,0		22,0	0,5
s7/sp6		0,0	19,7		19,5	17,1
s8/sp6		60,0	77,0		42,4	77,5
reste/sp6	20,0	3,3		16,1	5,0
						
total s1-5	7	262		814	15120
% / total						
%s1-5		58,3	63,3		33,1	64,2
%sp6		41,7	36,7		66,9	35,8

Intergen51. spl. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		11			CDS 16s		5	5
16s 23s		8			5s CDS		2	6
16s tRNA	3			16 CDS			
tRNA 23s	3			CDS 5s			
5s tRNA		3			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig				5s 16s		1	
tRNA hors	108			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		140	0		total		8	11
  • Les rares voir gamma pour la longueur des intercalaires
type		c	x
tRNA CDS 		-23
tRNA5s-acc	17	
5s16s		1319	
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. spl. Les intercalaires tRNA-tRNA extra bloc

modifier
  • Lien tableur: Intergen51. spl. Les intercalaires tRNA-tRNA extra bloc
  • Les contigus aux blocs: inexistants
  • Les hors blocs: 108 au total avec de fortes répétitions qui donnent un diagramme en dents de scie (tableur). Voir les doubles dans ancien spl et le chapitre distribution qui le suit.
  • Notes: les 12 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
1172	tca	51	caa	80	gcc
**	tca	131	cta	11* 102	gaa
52	aca	20	caa	253	gaa
539	ttc	96	cta	47	gaa
52	aca	49	caa	**	gcc
**	ttc	211	cta	13	ggc
128	cat	5	atgj	95	tgc
128	cat	47	caa	634	tta
189	atgf	55	cta	95	tgc
45	atgf	5	atgj	479	tta
2	gtc	47	caa	132	tgc
35	atgf	55	cta	**	tta
13	gtc	**	atgj		
**	atgf	167	tgg		
		**	tgg		
Int51.31 spl. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa    inter aa
8 aca 9* 37 gta 30 tac 8 cac
35 tac 39 gta 85 tac 63 aga
** gga ** gta 107 tac ** cca
39 cgg 80 gcc 107 tac 103 atgf
41 cac 11* 102 gaa ** tac ** ctc
58 cca 253 gaa 45 aac 51 caa
** cca 47 gaa 41 aac 131 cta
1172 tca ** gcc 26 aac 20 caa
** tca 3* 40 atgf 32 aac 96 cta
52 aca ** atgf 33 aac 49 caa
539 ttc 13 ggc 40 aac 211 cta
52 aca 85 tgc ** aac 5 atgj
** ttc ** tta 97 gac 47 caa
52 aca 13 ggc 97 gac 55 cta
** ttc 95 tgc 83 gac 5 atgj
21 agc 634 tta ** gac 47 caa
30 cgt 95 tgc 58 aaa 55 cta
32 cgt 479 tta 58 aaa ** atgj
30 cgt 132 tgc 58 aaa 167 tgg
33 cgt ** tta 59 aaa ** tgg
9 cgt 128 cat 57 aaa 20 ggc
76 agc 128 cat 58 aaa 13 ggt
35 cgt 189 atgf 58 aaa 47 ggc
9 cgt 45 atgf 59 aaa 47 ggc
** agc 2 gtc 58 aaa 15 ggt
35 atgf 59 aaa 16 ggc
13 gtc 59 aaa 48 ggc
** atgf ** aaa ** ggc

spl intercalaires entre cds

modifier
  • Lien NCBI [4]
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

spl intercalaires positifs S+

modifier
spl. Sx+ Sc+ Les diagrammes 400
spl Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 47 -333 594 7.7 611 236 max80 -47 363 -934 95 806 257 min50
31 à 400 - - - - - - 10.3 -50 -57 43 915 162 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 59 37 - 275 poly 336 tF 158 57 614 poly 192 SF
31 à 400 106 43 - 885 dte 30 tf
  • Légende du tableau corrélations et fréquences faibles
spl. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
myr min20 828 2081 2909 872 649 764 115 -143 41 323
spl min10 1071 2215 3286 884 735 784 49 -353 -202 172
rru min40 874 2056 2930 829 193 611 418 722 792 861
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
71 392 0.18 999 2556 5 5 20 110 97 899 -78
37 270 0.14 1313 2900 1 6 9 143 69 683 -342
169 266 0.64 1037 2749 1 4 71 222 175 630 17
  • Diagrammes 400:  spl myr,   diagramme 1-40: c+ spl myr total,   texte: myr.
  • Résumé: spl ressemble beaucoup à myr. C’est le 3ème génome sans fréquences faibles, 1-30, sur les 13 que j’ai signalés dans ase et cvi. Son minimum x+ est à la fréquence 10, min10. La conséquence, c’est 1 tilde fort du diagramme x+ 31-400. Mais ce génome a la particularité d’avoir une corrélation forte comme ase cvi abra myr dans la plage 41-250, en plus de n’avoir quasiment pas de fréquences faibles.
    - Les courbes des diagrammes 400
    • Je n’ai pas représenté le diagramme x+ 31-400, les fréquences faibles ayant très peu d’effectifs pour modifier notablement la courbe de x+ 1-400.
    • Au minimum local min50 de c+ 1-400, x+ 1-400 présente un maximum local max80, décalé par rapport à celui de myr, max70.
    • Et toujours la courbe du c+ 1-400 est un SF.
    • x+ 1-400 a un tilde très fort, tF, avec un R2’ de 336 comme cbei et pmq, et plus fort que celui de abra et myr , R2’ 96 68.
    • c+ 31-400 a un tilde très faible, tf, avec un R2’ 30 contre 85 86 pour respectivement abra et myr. La courbe est quasiment une droite avec 2 renflements dans la 1ère partie.
    - Les corrélations
    • Le total des effectifs est aussi élevé que celui de myr, 3286 contre 2909 et comme myr sa corrélation 41-250 est forte, 784 contre 764. Par contre sa corrélation se maintient dans la plage de fréquences 41-200, avec une différence (diff) de 49 contre 115 pour myr.
    • A cause des fréquences faibles inexistantes les corrélations 1-n sont très faibles en positif ou en négatif, comme abra, mais au contraire de pmg qui a des taux de fréquences faibles élevés et des corrélations 1-n nettement supérieures à celles du 41-250, autour de 900.
    - Les courbes des diagrammes 1-40
    • Avec un effectif réduit de 69 pour le total des fréquences x+ 1-40, le diagramme et la corrélation c+/x+ sont peu significatifs.
    • Avec un effectif élevé de 683 le diagramme des c+ 1-40 ressemble beaucoup au modèle et à celui de ade avec un effectif de 876, nette mieux que celui de myr avec un effectif de 899.

Vibrio parahaemolyticus

modifier

vpb opérons

modifier
  • Liens: gtRNAdb [5], NCBI chr1 [6], NCBI chr2 [7], génome []
  • Lien tableur: vpb opérons
  • Légende:
    - cds1 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
    - cds2 198 MQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKSYVSSQGSTFSKDFQSRRF
    - cds3 180 MTSHQSCLQFLNMMQTRFCRTQIPRTLECVILVFVIKTNIENFTNNNKLLFCQLSKLLKS
vpb1. Vibrio parahaemolyticus BB22OP
45.3%GC 6.7.19 Paris  126  doubles interca
chr1
33614..35175 16s @4 80
35256..35331 gaa 2
35334..35409 aaa 30
35440..35515 gta 55
comp 35571..35768 cds1 59
35828..38743 23s 73
38817..38932 5s
49997..50073 cgg 32
50106..50181 cac + 72
50254..50330 cca 2 cac 49
50380..50455 cac 2 cca 24
50480..50556 cca
comp 400045..400120 atgi
577971..579532 16s 88
579621..579696 gcc 12
579709..579784 gaa 258
580043..582958 23s 73
583032..583147 5s 30
583178..583254 gac 35
583290..583366 tgg
comp 769649..769733 cta + 29
comp 769763..769847 cta 10 cta 47
comp 769895..769971 atg 4 atg 24
comp 769996..770080 cta 5 caa 52
comp 770133..770207 caa 29
comp 770237..770321 cta 53
comp 770375..770451 atg 24
comp 770476..770560 cta 52
comp 770613..770687 caa 29
comp 770717..770801 cta 54
comp 770856..770930 caa 29
comp 770960..771044 cta 35
comp 771080..771154 caa 48
comp 771203..771287 cta 31
comp 771319..771403 cta 77
comp 771481..771557 atg 77
comp 771635..771709 caa 31
comp 771741..771825 cta 40
comp 771866..771942 atg
786939..787015 cca
comp 802315..802391 agg
910219..910295 aga
comp 982089..982173 tac + 81
comp 982255..982339 tac 4 tac 81
comp 982421..982505 tac 81
comp 982587..982671 tac
1124715..1124802 tcc
1418321..1418397 gtc + 32
1418430..1418506 gtc 2gtc
comp 1988127..1988202 ggc + 10
comp 1988213..1988299 tta 2 ggc 76
comp 1988376..1988451 ggc 20
comp 1988472..1988545 tgc
2164082..2164157 aac
2193593..2193683 tca
comp 2547884..2547960 atgf 56
comp 2548017..2548100 ctc
2652092..2652168 cgt + 56
comp 2652225..2652301 cgt 9 cgt 57
comp 2652359..2652435 cgt 2 agc 57
comp 2652493..2652569 cgt 57
comp 2652627..2652703 cgt 57
comp 2652761..2652837 cgt 56
comp 2652894..2652970 cgt 210
comp 2653181..2653257 cgt 31
comp 2653289..2653380 agc @5 320
comp 2653701..2653777 cgt 31
comp 2653809..2653900 agc
2735697..2735772 ttc + 64
2735837..2735912 aca 3 ttc 7
2735920..2735995 ttc 2 aca 70
2736066..2736141 aac 2 aac 71
2736213..2736288 aca 7
2736296..2736371 ttc 43
2736415..2736490 aac
2738623..2738698 ttc 51
2738750..2738825 aca + 21
2738847..2738922 aac 2 aca 39
2738962..2739037 aca 2 aac 15
2739053..2739128 aac
comp 2741263..2741339 gac 31
comp 2741371..2741487 5s 57
comp 2741545..2741620 acc 100
comp 2741721..2741836 5s 73
comp 2741910..2744825 23s 257
comp 2745083..2745158 gca 41
comp 2745200..2745276 atc 56
comp 2745333..2746894 16s
comp 2755928..2756012 ttg
comp 2847646..2847722 tgg 68
comp 2847791..2847867 gac 30
comp 2847898..2848013 5s 73
comp 2848087..2851002 23s 258
comp 2851261..2851336 gaa 80
comp 2851417..2852978 16s
comp 2987485..2987561 atgf + 56
comp 2987618..2987693 ggc 5 atgf 18
comp 2987712..2987788 atgf 8 ggc 35
comp 2987824..2987899 ggc 50
comp 2987950..2988025 ggc 49
comp 2988075..2988150 ggc 49
comp 2988200..2988275 ggc 30
comp 2988306..2988382 atgf 55
comp 2988438..2988513 ggc 30
comp 2988544..2988620 atgf 39
comp 2988660..2988735 ggc 19
comp 2988755..2988831 atgf 35
comp 2988867..2988942 ggc
comp 3060924..3061000 tgg 68
comp 3061069..3061145 gac 30
comp 3061176..3061291 5s 73
comp 3061365..3064280 23s 257
comp 3064538..3064613 gta 14
comp 3064628..3064703 gca 32
comp 3064736..3064811 aaa 2
comp 3064814..3064889 gaa 80
comp 3064970..3066531 16s @3 319
comp 3066851..3066966 5s 73
comp 3067040..3069955 23s 261
comp 3070217..3071778 16s
comp 3105094..3105169 acc 13
comp 3105183..3105257 gga 35
comp 3105293..3105377 tac 36
comp 3105414..3105489 aca
comp 3111073..3111149 gac 30
comp 3111180..3111295 5s 73
comp 3111369..3114284 23s 261
comp 3114546..3116107 16s @1 317
comp 3116425..3116540 5s 73
comp 3116614..3119529 23s 261
comp 3119791..3121352 16s
comp 3175944..3176034 tca 69
comp 3176104..3176219 5s 73
comp 3176293..3179211 23s 257
comp 3179469..3179544 gca 41
comp 3179586..3179662 atc 56
comp 3179719..3181280 16s @2
comp 3217187..3217263 gac 30
comp 3217294..3217409 5s 73
comp 3217483..3220398 23s 59
3220458..3220655 cds2 55
comp 3220711..3220786 gta 30
comp 3220817..3220892 aaa 2
comp 3220895..3220970 gaa 80
comp 3221051..3222612 16s
chr2
132908..134469 16s 80
134550..134625 gaa 2
134628..134703 aaa 16
134720..134795 gca 14
134810..134885 gta 54
comp 134940..135122 cds3 19
135142..138059 23s 73
138133..138248 5s 69
138318..138408 tca
comp 192886..192969 ctc
comp 591931..592021 tca
comp 1009457..1009530 tgc 73
comp 1009604..1009690 tta
comp 1021568..1021641 tgc 73
comp 1021715..1021801 tta
comp 1029973..1030048 ggc 3
comp 1030052..1030125 tgc
1125193..1125267 gga

vpb cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vpb. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
vpb cumuls	opérons		effectif
avec rRNA	opérons		9
		16 23 5s 0	0
		16 atc gca	2
		16 23 5s a	1
		max a		6
		a doubles	0
		spéciaux	6
		total aas	33
sans 		opérons		25
		1 aa		11
		max a		19
		a doubles	8
		total aas	93
total aas			126
remarques			5

vpb blocs

modifier
vpb1. Vibrio parahaemolyticus BB22OP, blocs à rRNA.
16s 80 16s 80 16s 80
gaa 2 gaa 2 gaa 2
aaa 30 aaa 30 aaa 16
gta 55 gta 55 gca 14
cds 198 59 cds 198 59 gta 54
23s 73 23s 73 cds 180 19
5s 5s 30 23s 73
gac 5s 69
tca
16s 56 16s 56 16s 88 16s 80
atc 41 atc 41 gcc 12 gaa 258
gca 257 gca 257 gaa 258 23s 73
23s 73 23s 73 23s 73 5s 30
5s 100 5s 69 5s 30 gac
acc 57 tca gac
5s 31
gac
16s 261 16s 261
23s 73 23s 73
5s 319 5s 317
16s 80 16s 261
gaa 2 23s 73
aaa 32 5s 30
gca 14 gac
gta 257
23s 73
5s 30
gac

vpb remarques

modifier
  • Remarques : 2 chromosomes circulaires. EFTU et beaucoup de doubles.
    1. @1 Blocs 16-23-5s, il y en a 3 dont 2 sont sur un opéron avec 1 aa. Le 4ème appartient à un opéron spécial.
        - Les 3 ont les mêmes Intercalaires, 73 261. L’intercalaire 23-5s se retrouve dans tout les autres opérons.
        - Les 2 blocs accolés sont séparés du reste par de grands intercalaires, 320 bases.
    2. @2 Les opérons 16-atc-gca sont au nombre de 2 avec 3 aas en plus.
        - 4 de leurs intercalaires, 73 257 41 56, sont identiques et le 5ème est du même ordre de grandeur, 100 69.
        - Un opéron est clasisque et a un aa en plus, le 2ème a la séquence 5s-aa-5s-aa donc 2 aa en +.
    3. @3 Les opérons analogues aux 16-atc-gca sont au nombre de 3 et ont 2 intercalaires en commun avec eux, 257 73 correspondant à aa-23s-5s.
        - Un opéron 16-gcc-gaa-23s-5s avec 2 aas entre les 2 rRNAs. Il a 4 aas.
        - Un opéron 16-gaa-23s-5s avec 1 aa entre les 2 rRNAs. Il a 3 aas.
        - Un opéron 16-gaa-3aas-23s-5s avec 4 aas entre les 2 rRNAs. Il a 6 aas.
    4. @4 Les opérons analogues aux 16-atc-gca avec une protéine sont au nombre de 3 et ont l’intercalaire 73 du 23s-5s comme tous les autres opérons.
      - Différence importante avec lam qui a des opérons analogues, la protéine est dans le brin complémentaire du brin des RNAs. Alors que dans lam protéine et RNAs sont sur le même brin.
      - La séquence est 16s-gaa-aaa-xxx-gta-protéine-23s-5s et les 3 opérons ont en commun les 4 mêmes intercalaires, 16s-80-aaa-2-xxx-gta-55-protéine-23s-73-5s.
      - Deux opérons, sans xxx, sont identiques en aas, intercalaires et protéines mais un a un aa en plus après 5s. Ils ont respectivement 3 et 4 aas.
      - Un opéron a une protéine plus petite, 180 aas au lieu de 198, avec xxx=gca entre les rRNAs plus 1 au-delà du 5s, soit 5 aas au total.
      - Note du 4.10.20: contrôle des cds au 10.2.20 du NCBI, 0 cds.
    5. @5 L’opéron 9cgt 2agc a une intercalaire élevée, 320 bases.
  • Séquences des doubles : beaucoup de doubles et de séquences répétées comme cbn.
      - 8 opérons sur 14 à 2aas et plus sont remarquables :
	opéron			n*séquence
	cgg+4			2*2
	10 cta 5caa 4atg	3*4
	4 tac			4*1
	2 gtc			2*1
	9 cgt 2agc		8*1
	ttc+6			2*3
	ttc+4			2*2
	8 ggc 5atgf		5*2

vpb distribution

modifier
  • Lien tableur: vpb distribution
  • Notes:
    - gtc2 cta2+2 tac4 cgt8 ggc4
    - acc: 5s + >1aa
    - tca: 2 5s + 2 1aa
    - Séquences:
    (cac cca)2
    (cgt agc)2
    ttc (aca aac)2
    ttc (aca ttc aac)2
    cta (cta atgj cta caa)2 (cta caa)2 cta (cta atgj) caa (cta atgj)
    (atgf ggc)2 ggc3 (atgf ggc)3
Gm2 vpb, Vibrio parahaemolyticus BB22OP. gama
g1    t1       
atgi 1 tct tat atgf 6
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 1 tac 5 tgc 4
atc 2 acc 2 aac 5 agc 2
ctc 2 ccc cac 2 cgt 9
gtc 2 gcc 1 gac 6 ggc 11
tta 3 tca 4 taa tga
ata aca 5 aaa 4 aga 1
cta 10 cca 3 caa 5 cga
gta 4 gca 4 gaa 6 gga 2
ttg 1 tcg tag tgg 3
atgj 4 acg aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
gama >1aa =1aa -5s +5s -16s +16s total
vpb 82 11 12 21 126

vpb1. Intergen51

modifier

Intergen51. vpb1. Le génome

modifier
  • vpb1 Le prélèvement: gama
  • Le nom et le lien NCBI: vpb1, Vibrio parahaemolyticus BB22OP chromosome 1, NCBI [8], date 20.02.22.
  • vpb1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
vpb1	403,530		3,297,305	12.2	
vpb1 données intercalaires
modifier
vpb1 données intercalaires 200
modifier
vpb1 autres intercalaires aas
modifier

Intergen51. vpb1. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. vpb1 les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vpb1 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,748 344 9 2,101 2.6 113 8 121
x 781 13 1 795 0 3 3
t 2,529 357 10 2,896 113 11 124
% 87.3 12.3 0.3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 27 0 0 27 1.4 tRNA-CDS 47 23
x 20 0 0 20 RNA-RNA 113 56
t 47 0 0 47 CDS-rRNA 11 5
% 100.0 0.0 0.0 non RNA 32 16
- total 203 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 5.3 14.8 0.0 31.6 11.1 58 0.4 0.0
x 11.5 30.0 7.7 4.2 0.0 15 0.1 0.0

Intergen51. vpb1. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: vpb1 données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vpb1 fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vpb1 fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	vpb1
R2	x3		x2		x		c		Inflexion poly3	x	c
0.539	5.80E-06	-3.66E-03	5.44E-01	16.10	fx1	abscisse	574.0	218.4
0.786	-6.92E-06	5.11E-03	-1.23E+00	110.0	fc1	ordonnée	24.1	16.6
								
0.749	-6.04E-07	1.04E-03	-5.00E-01	82.7	fx41			
0.944	2,00E-06	-1,31E-03	1,48E-01	26.0	fc51			
  • Le rfin après 400 est de 93 sur un total de 1757. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 18. L'indice i.rfin1 = 75/270 = 0.278.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	vpb1		calculs			poly3	vpb1
effect	1757		R2.21	767		abscis	400
xm	41		pte	9,71		flexa	203
ym	5		cste	3,24		flexo	1,78
x1m	231		r400l	169		xm	43
y1m	1		restp	159,36		sup4	178,5
rfin	52,93		%sd	32,70		sup4t	437,1
bornf	185		lond	190		%	40,8
supd	156,1		%sf	32,39		long	160
supdt	477,5		lonf	144		R2	529
xmp	363,12		sf/lf	0,92			
r400	106,43		sr/lr	0,52			
supf	132,4		sd/ld	0,82			
supft	408,7		i.r400	0,63										

Intergen51. vpb1. Les CDS-CDS négatifs

modifier
Sous-totaux	vpb1			totale	
fréquence	x-	c-		x-	c-
 - 1		0	83		4	4140
 - 2		0	0		85	11
 - 3		0	0		3	12
 - 4		2	115		717	10938
 - 5		0	0		5	19
sp6		11	146		1642	8424
total		13	344		2,456	23,544
reste		1	0		264	420
s6		3	0		361	41
s7		1	21		321	1438
s8		6	125		696	6525
rappot s1-5						
4/2/1		-	1.4		8.4	2.6
% / sp6						
s6/sp6		27.3	0.0		22.0	0.5
s7/sp6		9.1	14.4		19.5	17.1
s8/sp6		54.5	85.6		42.4	77.5
reste/sp6	9.1	0.0		16.1	5.0
						
total s1-5	2	198		814	15120
% / total						
%s1-5		15.4	57.6		33.1	64.2
%sp6		84.6	42.4		66.9	35.8

Intergen51. vpb1. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		10			CDS 16s		6	2
16s 23s		3			5s CDS			1
16s tRNA	7			16 CDS			
tRNA 23s	7			CDS 5s			
5s tRNA		8			23s CDS			
tRNA in		10			CDS 23s			
tRNA contig	3			5s 16s		2	
tRNA hors	64			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		113	0		total		8	3
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. vpb1. Les intercalaires tRNA-tRNA extra bloc

modifier
contig	aa
35	gac
**	tgg
68	tgg
**	gac
68	tgg
**	gac
Int51.31 vpb1. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa    inter aa
32 cgg 81 tac 31 cgt 56 atgf
72 cac 81 tac ** agc 18 ggc
49 cac 81 tac 64 ttc 35 atgf
24 cac ** tac 7 aca 50 ggc
** cac 32 gtc 70 ttc 49 ggc
29 cta ** gtc 71 aac 49 ggc
47 cta 10 ggc 7 aca 30 ggc
24 atgj 76 tta 43 ttc 55 atgf
52 cta 20 ggc ** aac 30 ggc
29 caa ** tgc 51 ttc 39 atgf
53 cta 56 atgf 21 aca 19 ggc
24 atgj ** ctc 39 aac 35 atgf
52 cta 56 cgt 15 aca ** ggc
29 caa 57 cgt ** aac 13 acc
54 cta 57 cgt 35 gga
29 caa 57 cgt 36 tac
35 cta 57 cgt ** aca
48 caa 56 cgt
31 cta 210 cgt
77 cta 31 cgt
77 atgj ** agc
31 caa
40 cta
** atgj

vpb2. Intergen51

modifier

Intergen51. vpb2. Le génome

modifier
  • vpb2 Le prélèvement: gama
  • Le nom et le lien NCBI: vpb2, Vibrio parahaemolyticus BB22OP chromosome 2, NCBI [9], date 20.02.22.
  • vpb2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
vpb2	242,529		1,806,219	13.4		
vpb2 données intercalaires
modifier
vpb2 données intercalaires 200
modifier
vpb2 autres intercalaires aas
modifier

Intergen51. vpb2. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. vpb2 les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vpb2 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 817 171 11 999 1.7 10 1 11
x 560 14 1 575 0 0 0
t 1,377 185 12 1,574 10 1 11
% 87.5 11.8 0.8
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 5 0 0 5 0.6 tRNA-CDS 13 41
x 8 0 0 8 RNA-RNA 10 31
t 13 0 0 13 CDS-rRNA 1 3
% 100.0 0.0 0.0 non RNA 8 25
- total 32 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.6 20.0 0.0 28.1 0.0 60 1.1 0.0
x 12.7 50.0 7.1 5.0 12.5 36 0.2 0.0

Intergen51. vpb2. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: vpb2 données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vpb2 fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vpb2 fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	vpb2
R2	x3		x2		x		c		Inflexion poly3	x	c
0.570	5.31E-06	-3.50E-03	5.58E-01	12.10	fx1	abscisse	161.6	185.7
0.735	-6.33E-06	4.65E-03	-1.11E+00	99.2	fc1	ordonnée	29.8	19.8
								
0.672	1.64E-06	-7.95E-04	-4.75E-02	51.3	fx41			
0.764	7.96E-07	-4.44E-04	-2.56E-02	34.7	fc41			
  • Le rfin après 400 est de 63 sur un total de 828. Jusqu'à 1% les freq10 sont en continu jusqu'à 810, reste 8. L'indice i.rfin1 = 55/410 = 0.134.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	vpb2		calculs			poly3	vpb2
effect	828		R2.21	593		abscis	400
xm	45		pte	6,77		flexa	127
ym	2		cste	2,72		flexo	2,54
x1m	254		r400l	146		xm	45
y1m	1		restp	176,33		sup4	77,5
rfin	76,09		%sd	42,21		sup4t	246,4
bornf	192		lond	209		%	31,5
supd	205,9		%sf	42,57		long	82
supdt	487,9		lonf	147		R2	312
xmp	335,75		sf/lf	1,15			
r400	100,24		sr/lr	0,60			
supf	168,6		sd/ld	0,99			
supft	396,1		i.r400	0,69							

Intergen51. vpb2. Les CDS-CDS négatifs

modifier
Sous-totaux	vpb2			totale	
fréquence	x-	c-		x-	c-
 - 1		0	50		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		4	53		717	10938
 - 5		0	0		5	19
sp6		9	68		1642	8424
total		14	171		2,456	23,544
reste		1	0		264	420
s6		3	0		361	41
s7		0	6		321	1438
s8		5	62		696	6525
rappot s1-5						
4/2/1		4	1.1		8.4	2.6
% / sp6						
s6/sp6		33.3	0.0		22.0	0.5
s7/sp6		0.0	8.8		19.5	17.1
s8/sp6		55.6	91.2		42.4	77.5
reste/sp6	11.1	0.0		16.1	5.0
						
total s1-5	5	103		814	15120
% / total						
%s1-5		35.7	60.2		33.1	64.2
%sp6		64.3	39.8		66.9	35.8

Intergen51. vpb2. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		1			CDS 16s		1	
16s 23s					5s CDS			
16s tRNA	1			16 CDS			
tRNA 23s	1			CDS 5s			
5s tRNA		1			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	3			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		10	0		total		1	0
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. vpb2. Les intercalaires tRNA-tRNA extra bloc

modifier
hors b	aa
73	tgc
**	tta
73	tgc
**	tta
3	ggc
**	tgc

Escherichia albertii

modifier

eal opérons

modifier
eal1. Escherichia albertii
49.6%GC 10.3.19 Paris  89  doubles interca
219063..219144 tac + 212
219357..219438 tac 2 tac
413135..413219 tcc
462888..462972 tca
comp 489120..489191 gga 6
comp 489198..489270 aca
615149..615233 tcc
comp 756823..756895 aaa + 5
comp 756901..756973 gta 3 aaa 48
comp 757022..757094 aaa 2 gta 5
comp 757100..757172 gta 48
comp 757221..757293 aaa
834529..834602 atgj + 10
834613..834694 cta 2atgj 26
834721..834792 caa 2caa 37
834830..834901 caa 2 cag 18
834920..834993 atgj 51
835045..835116 cag 35
835152..835223 cag
comp 968958..969031 aga
comp 1192416..1192488 acg
comp 1269526..1269599 gac
comp 1277040..1277113 gac 52
comp 1277166..1277285 5s @1 169
comp 1277455..1280377 23s 186
comp 1280564..1280636 gca 45
comp 1280682..1280755 atc 70
comp 1280826..1282367 16s
1567231..1567314 ctg + 31
1567346..1567429 ctg 3 ctg 35
1567465..1567548 ctg
comp 1657309..1657390 ttg
comp 1765401..1765473 ggc + 159
comp 1765633..1765705 ggc 2 ggc
1795516..1795588 ttc
comp 2006002..2006121 5s 169
comp 2006291..2009214 23s 186
comp 2009401..2009473 gca 45
comp 2009519..2009592 atc 70
comp 2009663..2011202 16s
comp 2042057..2043241 tuf1 CDS 1185pb 117
comp 2043359..2043431 acc 9
comp 2043441..2043512 gga 119
comp 2043632..2043713 tac 11
comp 2043725..2043797 aca @3
comp 2047429..2047548 5s 169
comp 2047718..2050648 23s 186
comp 2050835..2050907 gca 45
comp 2050953..2051026 atc 68
comp 2051095..2052636 16s
comp 2208305..2208424 5s @2 169
comp 2208594..2211517 23s 198
comp 2211716..2211788 gaa 85
comp 2211874..2213418 16s
comp 2267554..2267627 cca 43
comp 2267671..2267754 ctg 23
comp 2267778..2267850 cac 61
comp 2267912..2267985 cgg
comp 2305358..2305430 tgg 11
comp 2305442..2305515 gac 52
comp 2305568..2305687 5s 169
comp 2305857..2308779 23s 198
comp 2308978..2309050 gaa 85
comp 2309136..2310676 16s
comp 2426158..2426248 tga
2556305..2556378 ccg
2810766..2812307 16s 85
2812393..2812465 gaa 198
2812664..2815586 23s 169
2815756..2815875 5s 151
2816027..2816099 acc 40
2816140..2816259 5s
2911129..2911212 ctc
2913088..2913161 atgf
comp 3010332..3010404 atgi
comp 3177717..3177789 ttc
3301617..3301687 ggg
comp 3366868..3366941 atgf + 37
comp 3366979..3367052 atgf 3 atgf 37
comp 3367090..3367163 atgf
3469914..3470003 agc 6
3470010..3470083 cgt + 201
3470285..3470358 cgt 3 cgt 200
3470559..3470632 cgt
3505321..3505393 atgi
3563056..3564598 16s 85
3564684..3564756 gaa 198
3564955..3567876 23s 169
3568046..3568165 5s
comp 3779750..3779822 aaa 7
comp 3779830..3779902 gta + 47
comp 3779950..3780022 gta 2 gta
3782718..3782790 gcc + 42
3782833..3782905 gcc 2 gcc
comp 3810369..3810440 agg
comp 3993500..3993573 ccc
comp 4232176..4232248 aac
4233996..4234068 aac
comp 4242952..4243024 aac
comp 4248342..4248414 aac
4249406..4249492 tcg
4256696..4256768 atgi 100
4256869..4256942 aga
4317980..4318052 ggc 56
4318109..4318179 tgc 14
4318194..4318277 tta
comp 4556753..4556826 gtc + 7
comp 4556834..4556907 gtc 2 gtc

eal cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eal. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eal cumuls	opérons		effectif
avec rRNA	opérons		7
		16 23 5s 0	0
		16 atc gca	3
		16 23 5s a	0
		max a		3
		a doubles	0
		spéciaux	4
		total aas	13
sans 		opérons		38
		1 aa		23
		max a		7
		a doubles	10
		total aas	71
total aas			84
remarques			3

eal blocs

modifier
eal1. Escherichia albertii, blocs à rRNA.
16s 70 70 68
atc 45 45 45
gca 186 186 186
23s 169 169 169
5s 52
gac
16s 85 85 85
gaa 198 198 198
23s 169 169 169
5s 52
gac
16s 85
gaa 198
23s 169
5s 151
acc 40
5s

eal remarques

modifier
  • Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles.
  1. @1 Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
    - Les intercalaires sont les mêmes pour les 3 opérons, 70 45 186 169.
    - Un seul opéron a un aa en plus.
  2. @2 4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s.
    - Les intercalaires sont les mêmes pour les 4 opérons, 85 198 169.
    - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
    - Les aas suplémentaires sont absents pour 2 opérons et sont 2 pour un autre.
    - Le 4ème opéron a 1 aa et 1 5s en supplément.
  3. @3 2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
  • Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
    - 5 opérons à 2 aas répétés
    - 3 opérons à 3 aas répétés
    - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
    - Un opéron à 5 aas a une séquence répétée, aaa + 2*2.
    - 5 opérons sans répétitions
		
		eco			eal
		Opérons sans rRNAs avec doubles		
		2tac			2tac
		2gtc			2gtc
		2gcc			2gcc
		3ctg			3ctg
		3atgf			3atgf
		atg cta 2caa atg 2cag	atg cta 2caa atg 2cag
		Remaniements des répétitions		
		3ggc			2ggc
		aaa 3gta		aaa 2gta
		agc 4cgt		agc 3cgt
		5aaa 2gta		3aaa 2gta
		Opérons sans rRNAs sans doubles		
		tta tgc ggc		tta tgc ggc
		cgg cac ctg cca		cgg cac ctg cca
		aca tac gga acc		aca tac gga acc
		Disparition de 2 opérons chez eco		
		-			atgi aga
		-			gga aca
  • Notes :

eal distribution

modifier
  • Lien tableur: eal distribution
  • Notes:
    - gtc2 gta2 ctg3 gcc2 tac2 caa2 cag2 atgf3 cgt3 ggc2
    - atgi: 2 1aa + 1 >1aa
    - gac: 1aa + 2 5s
    - Séquences:
    aaa (gta aaa)2
Gm3 eal, Escherichia albertii. gama
g1    t1       
atgi 3 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 3 tgc 1
atc 3 acc 2 aac 4 agc 1
ctc 1 ccc 1 cac 1 cgt 3
gtc 2 gcc 2 gac 3 ggc 3
tta 1 tca 1 taa tga 1
ata aca 2 aaa 4 aga 2
cta 1 cca 1 caa 2 cga
gta 4 gca 3 gaa 4 gga 2
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag agg 1
ctg 4 ccg 1 cag 2 cgg 1
gtg gcg gag ggg 1
gama >1aa =1aa -5s +5s -16s +16s total
eal 48 23 4 10 85

eal intergen51

modifier

Intergen51. eal. Le génome

modifier
  • eal Le prélèvement: gama
  • Le nom et le lien NCBI: eal, Escherichia albertii KF1, NCBI [12], date 28.2.14.
  • eal La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
eal	594,081		4,701,875	12.6
eal données intercalaires
modifier
eal données intercalaires 200
modifier
eal autres intercalaires aas
modifier

Intergen51. eal. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. eal les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 eal les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,268 617 18 2,903 2.2 62 5 67
x 1,173 119 12 1,304 0 7 7
t 3,441 736 30 4,207 62 12 74
% 81.8 17.5 0.7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 42 0 0 42 1.2 tRNA-CDS 77 14
x 35 0 0 35 RNA-RNA 62 12
t 77 0 0 77 CDS-rRNA 12 2
% 100.0 0.0 0.0 non RNA 386 72
- total 537 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 6.0 11.9 0.6 31.2 2.4 66 0.6 0.0
x 10.3 8.6 5.9 8.4 2.9 36 0.9 0.0

Intergen51. eal. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: eal données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées eal fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. eal fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	eal
R2	x3		x2		x		c		Inflexion poly3	x	c
0.697	2.04E-06	-1.21E-03	9.15E-02	36.00	fx1	abscisse	348.9	349.1
0.837	-6.99E-06	5.31E-03	-1.31E+00	115.0	fc1	ordonnée	9.0	4.6
								
0.791	-8.80E-07	9.21E-04	-3.75E-01	65.1	fx41			
0.966	-9.74E-07	1.02E-03	-4.00E-01	61.4	fc41
  • Le rfin après 400 est de 138 sur un total de 2286. Jusqu'à 1% les freq10 sont en continu jusqu'à 950, reste 22. L'indice i.rfin1 = 116/550 = 0.211.
  • Moyennes glissantes des fc+400, diagonale. Voir le détail des calculs dans abs.
données	eal		calculs			poly3	eal
effect	2286		R2.21	798		abscis	200
xm	43		pte	15,96		flexa	112
ym	9		cste	4,62		flexo	2,84
x1m	227		r400l	173		xm	35
y1m	1		restp	176,73		sup4	77,2
rfin	60,37		%sd	16,97		sup4t	283,0
bornf	138		lond	184		%	27,3
supd	76,8		%sf	10,41		long	77
supdt	452,3		lonf	95		R2	444
xmp	370,95		sf/lf	0,30			
r400	116,36		sr/lr	0,55			
supf	28,2		sd/ld	0,42			
supft	270,8		i.r400	0,67															

Intergen51. eal. Les CDS-CDS négatifs

modifier
Sous-totaux	eal			totale	
fréquence	x-	c-		x-	c-
 - 1		0	157		4	4140
 - 2		4	0		85	11
 - 3		0	0		3	12
 - 4		39	250		717	10938
 - 5		0	0		5	19
sp6		76	210		1642	8424
total		119	617		2,456	23,544
reste		7	4		264	420
s6		23	0		361	41
s7		16	42		321	1438
s8		30	164		696	6525
rappot s1-5						
4/2/1		9.75	1.6		8.4	2.6
% / sp6						
s6/sp6		30.3	0.0		22.0	0.5
s7/sp6		21.1	20.0		19.5	17.1
s8/sp6		39.5	78.1		42.4	77.5
reste/sp6	9.2	1.9		16.1	5.0
						
total s1-5	43	407		814	15120
% / total						
%s1-5		36.1	66.0		33.1	64.2
%sp6		63.9	34.0		66.9	35.8

Intergen51. eal. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		7			CDS 16s		3	4
16s 23s					5s CDS		2	3
16s tRNA	7			16 CDS			
tRNA 23s	7			CDS 5s			
5s tRNA		3			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig	1			5s 16s			
tRNA hors	33			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		62	0		total		5	7
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. eal. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 eal. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa
212 tac 31 ctg 6 agc
** tac 35 ctg 201 cgt
6 gga ** ctg 200 cgt
** aca 159 ggc ** cgt
5 aaa ** ggc 7 aaa
48 gta 9 acc 47 gta
5 aaa 119 gga ** gta
48 gta 11 tac 42 gcc
** aaa ** aca ** gcc
10 atgj 43 cca 100 atgi
26 cta 23 ctc ** aga
37 caa 61 cac 56 ggc
18 caa ** cgg 14 tgc
51 atgj 37 atgf ** tta
35 cag 37 atgf 7 gtc
** cag ** atgf ** gtc

Escherichia coli

modifier

eco opérons

modifier
eco1. Escherichia coli str. K-12 substr. MG1655
50.6%GC 10.3.19 Paris  89  doubles interca EcoCyc adIP
223771..225312 16s 68 opéron
225381..225457 atc 42 ileV [15]
225500..225575 gca 183 « 
225759..228662 23s 93 « 
228756..228875 5s @1 52 « 
228928..229004 gac aspU [16]
236931..237007 gac
262871..262946 acg
564723..564799 aga
comp 696430..696504 cag + 37 opéron
comp 696542..696616 cag 2 cag 47 glnT [17]
comp 696664..696740 atg 2 atg 15 « 
comp 696756..696830 caa 2 caa 34 « 
comp 696865..696939 caa 23 « 
comp 696963..697047 cta 9 « 
comp 697057..697133 atg
780554..780629 aaa + 135 lysT [18]
780765..780840 gta 5 aaa 2 opéron
780843..780918 aaa 2 gta 149 « 
781068..781143 gta 3 valZ [19]
781147..781222 aaa 146 opéron
781369..781444 aaa 132 lysZ [20]
781577..781652 aaa lysQ [21]
EcoCyc [22]
comp 925884..925971 tcc InfA-serW [23]
comp 1031625..1031712 tca
comp 1097565..1097652 tcc
comp 1287087..1287176 tpr cds 90pb 67 tpr
comp 1287244..1287328 tac + 209 opéron
comp 1287538..1287622 tac 2 tac tyrT [24]
1746435..1746511 gtc + 4 valV [25]
1746516..1746592 gtc 2 gtc opéron
«RNA 67pb
comp 1991815..1991901 tta 12 leuZ [26]
comp 1991914..1991987 tgc 54 « 
comp 1992042..1992117 ggc opéron
comp 2043468..2043557 tcg
2044549..2044624 aac
comp 2058027..2058102 aac
2059851..2059926 aac
2062260..2062335 aac
2286211..2286287 ccc
2466309..2466383 agg
comp 2518041..2518116 gcc + 39 alaX [27]
comp 2518156..2518231 gcc 2 gcc opéron
2520931..2521006 gta + 44 valU [28]
2521051..2521126 gta 3gta 46 opéron
2521173..2521248 gta 4 « 
2521253..2521328 aaa « 
comp 2726069..2726188 5s @2 92 opéron
comp 2726281..2729184 23s 184
comp 2729369..2729444 gaa 171
comp 2729616..2731157 16s
comp 2785762..2785837 atgi
comp 2817784..2817860 cgt + 198 « 
comp 2818059..2818135 cgt 4 cgt 62 « 
comp 2818198..2818274 cgt 198 « 
comp 2818473..2818549 cgt 3 opéron
comp 2818553..2818645 agc serV [29]
2947387..2947463 atgf + 33 opéron
2947497..2947573 atgf 3 atgf 33 metW [30]
2947607..2947683 atgf « 
comp 2998984..2999057 ggg
3110366..3110441 ttc
3215598..3215673 atgi
comp 3318213..3318289 atgf
comp 3322072..3322158 ctc
comp 3423423..3423542 5s 37 « 
comp 3423580..3423655 acc 12 « 
comp 3423668..3423787 5s 92 « 
comp 3423880..3426783 23s 174 « 
comp 3426958..3427033 gca 42 « 
comp 3427076..3427152 atc 68 ileU [31]
comp 3427221..3428762 16s opéron
comp 3708616..3708692 ccg
3836222..3836316 tga
ecoliwiki [32]
3941808..3943349 16s 85 gltU [33]
3943435..3943510 gaa 193 opéron
3943704..3946607 23s 92 « 
3946700..3946819 5s 52 « 
3946872..3946948 gac 8 aspT [34]
3946957..3947032 tgg trpT [35]
3982375..3982451 cgg 57 argX [36]
3982509..3982585 cac 20 opéron
3982606..3982692 ctg 42 « 
3982735..3982811 cca « 
4035531..4037072 16s 68 opéron
4037141..4037217 atc 42 ileT [37]
4037260..4037335 gca 183 « 
4037519..4040423 23s 93 « 
4040517..4040636 5s « 
4166659..4168200 16s 171 opéron
4168372..4168447 gaa 193
4168641..4171544 23s 92
4171637..4171756 5s
4175388..4175463 aca @3 8 thrU [38]
4175472..4175556 tac 116 opéron
4175673..4175747 gga 6 « 
4175754..4175829 acc 114 « 
4175944..4177128 tufb cds 1185 pb « 
4208147..4209688 16s 85 opéron
4209774..4209849 gaa 193
4210043..4212946 23s 93
4213040..4213159 5s
comp 4362551..4362626 ttc
4392360..4392435 ggc + 36 opéron
4392472..4392547 ggc 3 ggc 35 glyX [39]
4392583..4392658 ggc « 
4496405..4496489 ttg
comp 4606079..4606165 ctg + 34 opéron
comp 4606200..4606286 ctg 3 ctg 28 leuV [40]
comp 4606315..4606401 ctg « 

eco cds

modifier
  • Liens: gtRNAdb [41], NCBI [42], génome [orgn]
  • Lien tableur: eco cds
  • Légende
    - protéines1: metY-yhbC-nusA-infB-rbfA-truB-rpsO-pnp
    - protéine2: secG
    - évidence faible1, avec un pseudo.
eco2. les CDS eco pour opérons
cluster 6.8.19 Paris interca cdsa promoteur terminateur notes
222833..223408 cds 362 192 sigma FIS
223771..225312 16s 68
225381..225457 atc 42
225500..225575 gca 183
225759..228662 23s 93
228756..228875 5s 52
228928..229004 gac 162 Terminateur + sigma
229167..229970 cds 268
comp 2724448..2725746 cds 322 433 rien début opéron rien
comp 2726069..2726188 5s 92
comp 2726281..2729184 23s 184
comp 2729369..2729444 gaa 171
comp 2729616..2731157 16s 442 sigma FIS
comp 2731600..2734173 cds 858
3422436..3423194 cds 228 253 Terminateur fin opéron rien
comp 3423423..3423542 5s 37
comp 3423580..3423655 acc 12
comp 3423668..3423787 5s 92
comp 3423880..3426783 23s 174
comp 3426958..3427033 gca 42
comp 3427076..3427152 atc 68
comp 3427221..3428762 16s 473 sigma FIS
3429236..3429790 cds 185
comp 3940635..3941327 cds 480 231 sigma FIS
3941808..3943349 16s 85
3943435..3943510 gaa 193
3943704..3946607 23s 92
3946700..3946819 5s 52
3946872..3946948 gac 8
3946957..3947032 tgg 95 Terminateur fin opéron rien
comp 3947128..3947967 cds 280
4034608..4035153 cds 377 182 Sigma Lrp-leu
4035531..4037072 16s 68
4037141..4037217 atc 42
4037260..4037335 gca 183
4037519..4040423 23s 93
4040517..4040636 5s 228
4040865..4040900 rprg 5 pas de Term fin opéron rien
comp 4040906..4041433 cds 176
4165428..4166285 cds 373 286 Sigma Lrp-leu
4166659..4168200 16s 171
4168372..4168447 gaa 193
4168641..4171544 23s 92
4171637..4171756 5s 300 Terminateur début opéron rien
4172057..4173085 cds 343
comp 4205943..4207532 cds 614 530 sigma FIS
4208147..4209688 16s 85
4209774..4209849 gaa 193
4210043..4212946 23s 93
4213040..4213159 5s 74 Terminateur début opéron rien
4213234..4213617 cds 128
695101..696276 cds 31 392
comp 696308..696378 rprg 51 Terminateur fin opéron rien
comp 696430..696504 cag 37
comp 696542..696616 cag 47
comp 696664..696740 atg 15
comp 696756..696830 caa 34
comp 696865..696939 caa 23
comp 696963..697047 cta 9
comp 697057..697133 atg 379 sigma FIS fin opéron rien
comp 697513..699177 cds 555
779598..780389 cds 164 264 sigma FIS fin opéron rien
780554..780629 aaa 135
780765..780840 gta 2
780843..780918 aaa 149
781068..781143 gta 3
781147..781222 aaa 146
781369..781444 aaa 132
781577..781652 aaa 432 Terminateur début opéron NadR pas sigma
782085..783128 cds 348
1286709..1286984 cds 81 92 Terminateur
comp 1287066..1287236 ncRNA -150
comp 1287087..1287176 tpr 67 30
comp 1287244..1287328 tac 209
comp 1287538..1287622 tac 159 sigma FIS
comp 1287782..1288624 cds 281
solitaire promoteur terminateur interc avant interc après protéines lien
236931..237007 gac sigma FIS Term 1 133 328 [43]
262871..262946 acg sigma FIS rien 115 204 [44]
564723..564799 aga sigma FIS rien 243 16 [45]
comp 925884..925971 InfA-tcc sigma FIS Term 1 344 254 [46]
comp 1031625..1031712 tca sigma FIS Term 2 207 427 [47]
comp 1097565..1097652 tcc sigma FIS Term 4 736 234 [48]
comp 2043468..2043557 tcg sigma - Term 1 570 94 [49]
2044549..2044624 aac sigma - Term 1 101 314 [50]
comp 2058027..2058102 aac sigma - Term 1 453 101 [51]
2059851..2059926 aac sigma - Term 1 5 38 [52]
2062260..2062335 aac sigma NtrC rien 327 56 [53]
2286211..2286287 ccc sigma FIS Term 1 75 103 [54]
2466309..2466383 agg sigma - Term 1 76 162 [55]
comp 2785762..2785837 atgi rien rien 410 -37 évidence faible1 [56]
comp 2998984..2999057 ggg sigma FIS rien 156 79 évidence faible [57]
3110366..3110441 ttc sigma FIS Term 1 106 149 [58]
3215598..3215673 atgi sigma - Term 1 125 54 [59]
comp 3318213..3318289 atgf sigma FIS Term 2 207 348 protéines1 [60]
comp 3322072..3322158 ctc sigma - Term 1 459 15 protéine2 [61]
comp 3708616..3708692 ccg sigma FIS Term 2 911 92 [62]
3836222..3836316 tga sigma - rien 293 109 [63]
comp 4362551..4362626 ttc sigma FIS Term 1 198 107 [64]
4496405..4496489 ttg sigma FIS Term 1 196 261 [65]

eco cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.eco. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
eco cumuls	opérons		effectif
avec rRNA	opérons		7
		16 23 5s 0	0
		16 atc gca	3
		16 23 5s a	0
		max a		3
		a doubles	0
		spéciaux	4
		total aas	14
sans 		opérons		36
		1 aa		23
		max a		7
		a doubles	10
		total aas	72
total aas			86
remarques			3

eco blocs

modifier
eco1. Escherichia coli, blocs à rRNA.
16s 68 16s 68 68
atc 42 atc 42 42
gca 174 gca 183 183
23s 92 23s 93 93
5s 12 5s 52
acc 37 gac
5s
16s 85 171 171 85
gaa 193 184 193 193
23s 92 92 92 93
5s 52
gac

eco remarques

modifier
  • Remarques : Pas de blocs 16-23-5s, un nouveau bloc 16-gaa-23-5s, beaucoup de doubles. Comme eal.
    1. @1  Les blocs 16-atc gca-23-5s sont au nombre de 3 avec 1 seul aa en plus.
      - Les intercalaires sont les mêmes pour les 3 opérons, 68 42 183 93.
      - Cependant les 3 1ers intercalaires diminuent de 3 bases chacun et le 4ème est divisé par 2.
      - Par rapport à eal un opéron sans aa de plus, s'est transformé avec 1 aa et 1 5s en plus. Son intercalaire gca-23s a diminué de 5 % par rapport aux 2 autres, 9/183.
    2. @2  4 nouveaux blocs analogues aux précédents, 16-gaa-23-5s, comme eal.
      - Les intercalaires sont les mêmes pour 2 opérons sans aa supplémentaire, 171 193 92.
      - Pour les 2 autres opérons le 1er intrcalaire est divisé par 2, 85 193 92.
      - Elles sont, dans le même ordre, analogue à celles des blocs 16-atc gca-23-5s.
      - Par rapport à eal, l'opéron avec 1 aa et 1 5s a perdu ces suppléments. Et l’on a 3 opérons sans et 1 opéron avec 2 aas en supplément.
    3. @3  2 opérons tRNAs+protéine : tactac-tpr et acatacggaacc-tufB
  • Séquences des doubles : beaucoup de doubles mais peu de séquences répétées.
    - Il y a 4 remaniements qui consistent tous en une ou 2 répétions de plus des répétitions déjà existantes
    - 2 opérons sans rRNAs et sans doubles ont été perdus de eal à eco.
    - Pour eco il y a toujours 10 opérons avec répétition et 3 sans répétitions:
    - 3 opérons à 2 aas répétés
    - 4 opérons à 3 aas répétés
    - 1 opéron à 4 aas répétés.
    - L'opéron au maximum de 7 aas a 2 répétitions de 2 aas en séquence et la 3ème a ses 2 aas séparés : atg cta 2caa atg 2cag.
    - Un opéron à 7 aas a une séquence répétée, 3aaa + 2*2.
		
		eco			eal
		Opérons sans rRNAs avec doubles		
		2tac			2tac
		2gtc			2gtc
		2gcc			2gcc
		3ctg			3ctg
		3atgf			3atgf
		atg cta 2caa atg 2cag	atg cta 2caa atg 2cag
		Remaniements des répétitions		
		3ggc			2ggc
		aaa 3gta		aaa 2gta
		agc 4cgt		agc 3cgt
		5aaa 2gta		3aaa 2gta
		Opérons sans rRNAs sans doubles		
		tta tgc ggc		tta tgc ggc
		cgg cac ctg cca		cgg cac ctg cca
		aca tac gga acc		aca tac gga acc
		Disparition de 2 opérons chez eco		
		-			atgi aga
		-			gga aca
  • Notes :

eco distribution

modifier
  • Lien tableur: eco distribution
  • Notes:
    - gtc2 gta3 ctg3 gcc2 tac2 aaa3 caa2 cag2 atgf3 cgt4 ggc3
    - gac: 1aa + 2 5s
    - Séquences:
    (aaa gta)2 aaa3
Gm4 eco, Escherichia coli str. K-12 substr. MG1655. gama
g1    t1       
atgi 2 tct tat atgf 4
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc 2 tac 3 tgc 1
atc 3 acc 2 aac 4 agc 1
ctc 1 ccc 1 cac 1 cgt 4
gtc 2 gcc 2 gac 3 ggc 4
tta 1 tca 1 taa tga 1
ata aca 1 aaa 6 aga 1
cta 1 cca 1 caa 2 cga
gta 5 gca 3 gaa 4 gga 1
ttg 1 tcg 1 tag tgg 1
atgj 2 acg 1 aag agg 1
ctg 4 ccg 1 cag 2 cgg 1
gtg gcg gag ggg 1
gama >1aa =1aa -5s +5s -16s +16s total
eco 49 23 4 10 86

eco intergen51

modifier

Intergen51. eco. Le génome

modifier
  • eco Le prélèvement: alpha gama
  • Le nom et le lien NCBI: eco, Escherichia coli str. K-12 substr. MG1655, NCBI [66], date 7.3.22.
  • spl La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
 		
Nom	intercals	génome		taux en %			
eco	501 283		4 641 652	10.8
eco données intercalaires
modifier
eco données intercalaires 200
modifier
eco autres intercalaires aas
modifier

Intergen51. eco. Les différents types d'intercalaires

modifier
Int51.2 eco les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2 188 647 16 2 851 2,4 65 6 71
x 1 061 95 13 1 169 0 6 6
t 3 249 742 29 4 020 65 12 77
% 80,8 18,5 0,7
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 37 0 0 37 1,3 tRNA-CDS 65 9
x 28 0 0 28 RNA-RNA 65 9
t 65 0 0 65 CDS-rRNA 12 2
% 100,0 0,0 0,0 non RNA 570 80
- total 712 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 2,9 10,8 13,7 33,8 2,7 47 0,6 0,0
x 5,3 14,3 3,9 5,9 3,6 65 1,1 0,0

Intergen51. eco. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: données intercalaires
  • Diagrammes:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées: eco fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées: eco fx1
  • Équations des courbes de tendance en pour 1000: à partir des colonnes fx fc des données intercalaires.
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	eco
R2	x3		x2		x		c		Inflexion poly3	x	c
0,538	2,01E-06	-1,39E-03	1,81E-01	29,40	fx1	abscisse	257,1	366,3	
0,802	-7,30E-06	5,57E-03	1,38E+00	121,0	fc1	ordonnée	19,9	3,8
								
0,706	-1,40E-06	1,08E-03	-3,51E-01	62,5	fx41			
0.964	-1,05E-06	1,16E-03	-4,61E-01	69.1	fc51
  • Le rfin après 400 est de 64 sur un total de 2204. Jusqu'à 1% les freq10 sont en continu jusqu'à 520, reste 22. L'indice i.rfin1 = 42/120 = 0.350.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	eco		calculs			poly3	eco
effect	2204		R2.21	800		abscis	250
xm	46		pte	12,36		flexa	137
ym	7		cste	3,74		flexo	2,53
x1m	222		r400l	178		xm	35
y1m	1		restp	136,57		sup4	117,4
rfin	29,04		%sd	29,98		sup4t	353,4
bornf	121		lond	176		%	33,2
supd	139,4		%sf	31,14		long	102
supdt	465,1		lf	75		R2	467
xmp	398,37		sf/lonf	1,15			
r400	107,53		sr/lr	0,53			
supf	86,2		sd/ld	0,79			
supft	276,8		i.r400	0,60													

Intergen51. eco. Les CDS-CDS négatifs

modifier
Sous-totaux	eco			totale	
fréquence	x-	c-		x-	c-
-1		0	162		4	4140
-2		2	0		85	11
-3		0	0		3	12
-4		43	260		717	10938
-5		0	0		5	19
sp6		50	225		1642	8424
total		95	647		2 456	23 544
reste		13	25		264	420
s6		14	0		361	41
s7		6	48		321	1438
s8		17	152		696	6525
rappot s1-5						
4/2/1		21,5	1,6		8,4	2,6
% / sp6						
s6/sp6		28,0	0,0		22,0	0,5
s7/sp6		12,0	21,3		19,5	17,1
s8/sp6		34,0	67,6		42,4	77,5
reste/sp6	26,0	11,1		16,1	5,0
						
total s1-5	45	422		814	15120
% / total						
%s1-5		47,4	65,2		33,1	64,2
%sp6		52,6	34,8		66,9	35,8

Intergen51. eco. Les intercalaires des blocs

modifier
  • Le détail et les rares
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		7			CDS 16s		4	3
16s 23s		7			5s CDS		2	3
16s tRNA				16 CDS			
tRNA 23s	7			CDS 5s			
5s tRNA		3			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	37			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		65	0		total		6	6

Intergen51. eco. Les intercalaires tRNA-tRNA extra bloc

modifier
  • Lien tableur: Intergen51. eco. Les intercalaires tRNA-tRNA extra bloc
  • Les contigus aux blocs: inexistants
  • Les hors blocs: 37 au total avec de fortes répétitions qui donnent un diagramme à 2 pics aux abscisses 5 35. Voir les doubles dans ancien eco et le chapitre distribution qui le suit. Faire un tableau avec couleurs.
  • Notes: les 7 intercalaires supérieurs à 120 pdbs sont dans des séquences à répétition
Int51.31 eco. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa
37 cag 4 gtc 33 atgf
47 cag ** gtc 33 atgf
15 atgj 12 tta ** atgf
34 caa 54 tgc 8 gac
23 caa ** ggc ** tgg
9 cta 39 ggc 57 cgg
** atgj ** ggc 20 cac
135 aaa 44 gta 42 ctg
2 gta 46 gta ** cca
149 aaa 4 gta 8 aca
3 gta ** aaa 116 tac
146 aaa 198 cgt 6 gga
132 aaa 62 cgt ** acc
** aaa 198 cgt 36 ggc
209 tac 3 cgt 35 ggc
** tac ** agc ** ggc
34 ctg
28 ctg
** ctg

eco intercalaires entre cds

modifier
  • Lien NCBI [67] daté du 23-9-2020 pour ces prélèvements.
  • Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.

eco intercalaires positifs S+

modifier
eco. Sx+ Sc+ Les diagrammes 400
eco Sx+ Sc+
Poly3 -7 -5 -3 1 R2 flex x+ comment. -7 -5 -3 1 R2 flex c+ comment.
1 à 400 22 -151 195 32 532 230 max50 -74 565 -1405 124 805 255 min50
31 à 400 7.6 -18 -162 50 934 79 2 parties
droite -a cste - R2 note R2’ -a cste - R2 note R2’
1 à 400 94 44 - 489 dte 43 tm 197 65 - 540 poly 265 SF
31 à 400 117 43 - 873 poly 61 tm
  • Légende du tableau des corrélations et des fréquences faibles
eco. Sx+ Sc+ Les diagrammes 400. Corrélations et les fréquences faibles 1-30
effectifs diagramme corrélation x+ c+, 41-n corrélation x+ c+, 1-n
gen minima x+ c+ total 400 200 250 diff 200 250 400
cbn min20 489 1701 2190 731 543 505 -38 -222 -114 271
eco min20 1003 2130 3133 735 296 440 144 -178 -64 287
bsu min10 1028 2444 3472 659 8 282 274 152 257 470
1-30 ‰ effectifs 0 ‰ <0 ‰ effectifs 1-40 corel
1-30 x+ 1-30 c+ x+/c+ x c x c x- c- x+ c+ x+/c+
65 312 0.21 553 1940 2 5 17 86 56 620 -382
63 348 0.18 1169 2855 11 6 80 226 126 821 -119
140 333 0.42 1125 3091 2 8 31 186 302 936 -432
  • Diagrammes 400:  eco cbn,   diagramme 1-40: c+ eco c+ cbn x+ eco total,   texte: cbn.
  • Résumé: J’ai classé les 21 génomes suivant la forme des diagrammes x+ 1-400. J’ai obtenu 3 groupes,
    1. Les tildes au nombre de 5. Ils sont réguliers et forts, tF, avec un R2’ supérieur à 138 pour 4 d’entre eux et scc avec 71. Ce sont, cbei mba pmq et blo scc.
    2. Les formes S au nombre de 6. Leurs forces (R2’) sont variables, ade rru Sf 20-39, ant mja Sm 70-78, pmg pub SF 179-249.
    3. Les diagrammes à pyramide, c’est à dire présentant une bosse avec 4 ou 5 points contigus. Ils sont au nombre de 10 dont 9 sont des tildes et bsu est un Sf très faible (R2’18). abra rtb spl afn sont des tF avec plus de 96, ase cbn cvi sont des tf avec moins de 30, eco myr sont des tm 43 68.
    - eco ressemble beaucoup à cbn comme on vient de le voir avec des courbes x+ 1-400 à pyramide et de forme tilde faible et moyen (R2’ 43 26). Ils ne diffèrent que par le total des effectifs 3133 contre 2190.
    - Les diagrammes 400
    • x+ 1-400:
      + Les 2 génomes ont une pyramide à 4 fréquences avec un maximum à 50. Quand j’enlève les 3 fréquences faibles pour ne laisser que la pyramide, la courbe eco devient une S faible, Sf, R2’ à 36 et la courbe cbn devient une S forte, SF, R2’ à 75. Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30 65 pour cbn et eco.
      + Les fréquences faibles 1-30 sont en opposition avec celles des cbn c+1-400 et en parallèle avec eco. Cette différence va impacter différemment les corrélations 1-n qu’on verra plus loin.
      + Les points d’inflexion sont normaux et presque égaux 238 pour cbn contre 230.
    • c+ 1-400: Ce sont 2 courbes presque identiques de formes S fort avec un R2’ de 265 pour eco contre 203 et des 2 points d’inflexion normaux, 255 pour eco et 263 pour cbn.
    • x+ 31-400: Je n’ai pas représenté les courbes x+ 31-400 à cause des taux peu élevés des fréquences faibles 1-30, 65 environ pour les 2. Il faudrait les remplacer par les courbes avec pyramide seule sans les fréquences faibles 1-30, voir le paragraphe x+ 1-400 ci-dessus.
    • c+ 31-400: Les 2 formes sont des tildes moyens , tm, avec un R2’ de 61 pour eco et 41 pour cbn. Les 2 points d’inflexions sont différents mais petits, 79 pour eco contre 121.
    - Les corrélations:
    • Sur les plages 41-n: Les 2 corrélations sur 41-250 sont quasiment identiques 440 pour eco contre 505. Par contre eco chute fortement sur 41-200, avec une différence de 144, alors que cbn s’améliore avec une différence de -38.
    • Sur les plages 1-n: les évolutions contraires des fréquences faibles 1-30 que j’ai mentionnées au paragraphe x+ 1-400 agissent fortement sur les corrélations 1-n.
      + Chez eco les fréquences faibles évoluent en parallèle entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives -178 pour 1-200 et -64 pour 1-250.
      + Chez cbn les fréquences faibles évoluent en opposition entre celles de x+ 1-400 et c+ 1-400 d’où des corrélations sur 1-n fortement négatives comme eco -222 pour 1-200 et -114 pour 1-250.
    - Les faibles fréquences: Les faibles fréquences 1-30 ne sont intéressantes à comparer que pour les génomes à courbes 1-400 semblables où le taux de ces fréquences sont élevés et évoluent en parallèle comme entre pmg et pub où le rapport x+/c+ passe de 0.78 à 0.51. Pour eco et cbn ils sont autour de 0.20. Les zéros sont à 7‰ pour cbn et 17‰ pour eco, avantage donné par les x+; alors que le taux des négatifs fait le triple de cbn chez eco, 103‰ contre 306‰ comme chez cvi.
    - Les courbes 1-40:
    • c+ 1-40: Les 2 courbes sont semblables et très proche de celle du total des c+ 1-40.
    • x+ 1-40: Avec un effectif de 56 pour cbn la courbe ne peut être significative. Eco avec 126 est différente du modèle c+ 1-40 car c’est une courbe régulièrement croissante à partir de la fréquence 8 et aussi à cause de la corrélation négative x+/c+ de -119.

eco autres intercalaires

modifier
  • Lien tableur: eco autres intercalaires aas
  • Légende:  
    - comp, le gène est sur le brin complement
    - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
    - misc_f, pour misc_feature
    - regul, pour regulatory
    - mobile, pour mobile_element
    - rep_or, pour rep_origin
    - gene, est dans NCBI, un pseudo gène
  • Note: attention le dernier 233 n'est pas comp', contrôle à l'adresse 4392892. corrigé ici
  • Totaux:
tRNA-cds		tRNA-tRNA		autres-cds		total	676
c+	x+	x-	c+	x+	c-	c+	c-	x+		
49	28	0	65	0	0				142	
cds-mob						19	44		63	
cds-gen						149	30	1	180	
cds-misc					39	17		56	
cds-ncR						118	25		143	1 x-
non cds						57	31	1	89	
rep-O						2			2	
gene	mobile	misc_f	ncRNA	rep-O	total	384	147	2	675	
129	50	48	79	1	307					
  • Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.

Escherichia coli Nissle 1917

modifier

ecoN opérons

modifier
  • Liens: gtRNAdb [68], NCBI [69], génome [70]
  • Lien tableur: ecoN opérons
  • Phylogénie: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia.
  • Légende: cdsa: cds aas, cdsd: cds dirigé
G7. Escherichia coli Nissle 1917
50%GC 21.8.19 Paris  123   doubles intercal cds aa avec aa cdsa cdsd protéines
231864..232436 CDS 365 365 191 D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase
232802..234321 16s 73 1520
234395..234471 gaa 12 12
234484..234557 gca 174
234732..237319 23s 83 2588
237403..237518 5s 54 116
237573..237649 gac 162 162 162
237812..238615 CDS 268 2,5-didehydrogluconate reductase DkgB
244934..245665 CDS 132 132 244 DNA polymerase III subunit epsilon
245798..245874 gac 120 120 120
comp 245995..246852 CDS 286 DUF4942 domain-containing protein
367329..368582 CDS 114 114 418 114 glutamate-5-semialdehyde dehydrogenase
368697..368772 acg 154 154
368927..369265 CDS 113 DUF4102 domain-containing protein
comp 631149..632015 CDS 270 270 289 bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD
632286..632362 aga 15 15 15
comp 632378..632997 CDS 207 tyrosine-type recombinase/integrase
733188..734363 CDS 153 153 392 153 2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase
comp 734517..734591 cag + 37 37
comp 734629..734703 cag 2 cag 48 48
comp 734752..734828 atgj 2 atgj 15 15
comp 734844..734918 caa 2 caa 34 34
comp 734953..735027 caa 23 23
comp 735051..735135 cta 10 10
comp 735146..735222 atgj 380 380
comp 735603..737267 CDS 555 asparagine synthase B
807377..808169 CDS 164 164 264 164 Pseudo, cell division protein CpoB
808334..808409 aaa + 35 35
808445..808520 gta 5 aaa 2 2
808523..808598 aaa 2 gta 51 51
808650..808725 gta 3 3
808729..808804 aaa 48 48
808853..808928 aaa 33 33
808962..809037 aaa 277 277
809315..810358 CDS 348 quinolinate synthase NadA
950069..952345 CDS 343 343 759 343 ATP-dependent Clp protease ATP-binding subunit ClpA
comp 952689..952776 tcc 253 253
comp 953030..953248 CDS 73 translation initiation factor IF-1
comp 1047224..1047883 CDS 206 206 220 206 FtsH protease modulator YccA
comp 1048090..1048177 tca 426 426
1048604..1049722 CDS 373 hydrogenase 1 small subunit
1183656..1184018 CDS 463 463 121 hp
1184482..1184558 aga 278 278 278
> comp 1184837..1185786 CDS 317 Pseudo, IS4 family transposase
1213982..1214809 CDS 165 165 276 165 DUF4942 domain-containing protein
comp 1214975..1215062 tcc 233 233
1215296..1216234 CDS 313 glyoxylate/hydroxypyruvate reductase GhrA
1216817..1217098 CDS 165 165 94 165 DUF4942 domain-containing protein
comp 1217264..1217351 tcc 234 234
1217586..1218524 CDS 313 glyoxylate/hydroxypyruvate reductase GhrA
1457038..1458129 CDS 16 16 364 16 acyl-CoA desaturase
comp 1458146..1458277 ncRNA 46 44 RtT sRNA
comp 1458324..1458408 tac + 33 33
comp 1458442..1458526 tac 2 tac 159 159
comp 1458686..1459528 CDS 281 formyltetrahydrofolate deformylase
comp 1829066..1830322 CDS 307 307 419 hp
1830630..1830706 gtc + 4 4
1830711..1830787 gtc 2 gtc 6 6 6
< 1830794..1831177 CDS @4 128 Pseudo, multidrug efflux MATE transporter MdtK
comp 1831218..1832474 CDS 307 307 419 hp
1832782..1832858 gtc + 4 4
1832863..1832939 gtc 2 gtc 8 8 8
< 1832948..1833280 CDS 111 Pseudo, MATE family efflux transporter
comp 1833321..1834577 CDS 307 307 419 hp
1834885..1834961 gtc + 4 4
1834966..1835042 gtc 2 gtc 108 108 108
1835151..1835456 CDS 102 monooxygenase
comp 2115794..2116459 CDS 195 195 222 UPF0149 family protein YecA
comp 2116655..2116741 tta 12 12
comp 2116754..2116827 tgc 53 53
comp 2116881..2116956 ggc 151 151 151
comp 2117108..2117656 CDS 183 CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase
comp 2191451..2192287 CDS 278 278 279 hp
comp 2192566..2192655 tcg 93 93 93
2192749..2193546 CDS 100 100 266 100 DgsA anti-repressor MtfA
2193647..2193722 aac 161 161
2193884..2195146 CDS 421 tyrosine-type recombinase/integrase
2232607..2233323 CDS 453 453 239 YebC/PmpR family DNA-binding transcriptional regulator
comp 2233777..2233852 acc 326 326 326
2234179..2235096 CDS 306 nitrogen assimilation transcriptional regulator
2235198..2236148 CDS 37 37 317 HTH-type transcriptional regulator Cbl
comp 2236186..2236261 aac 4 4 4
2236266..2237909 CDS 100 100 548 100 toxic metabolite efflux MATE transporter YeeO
2238010..2238085 aac 161 161
2238247..2239518 CDS 424 tyrosine-type recombinase/integrase
2546968..2548728 CDS 74 74 587 74 cardiolipin transport protein PbgA
2548803..2548879 ccc 101 101
comp 2548981..2549136 CDS 52 autotransporter outer membrane beta-barrel domain-containing protein
2717780..2718712 CDS 75 75 311 75 formate/nitrite transporter family protein
2718788..2718862 agg 437 437
comp 2719300..2719830 CDS 177 OmpH family outer membrane protein
comp 2768744..2770933 CDS 206 206 730 206 sensor domain-containing phosphodiesterase
comp 2771140..2771215 gcc + 39 39
comp 2771255..2771330 gcc 2 gcc 220 220
2771551..2771910 CDS 120 putative DNA-binding transcriptional regulator
comp 2772355..2773770 CDS 258 258 472 glutamate--tRNA ligase
2774029..2774104 gta + 43 43
2774148..2774223 gta 3 gta 46 46
2774270..2774345 gta 4 4
2774350..2774425 aaa 110 110 110
comp 2774536..2775420 CDS 295 LysR family transcriptional regulator
comp 2959205..2960503 CDS 323 323 433 323 alpha-ketoglutarate permease
comp 2960827..2960942 5s 83 116
comp 2961026..2965477 23s 184 4452
comp 2965662..2965737 gaa 431
comp 2966169..2967720 16s 441 441 1552
comp 2968162..2970735 CDS 858 ATP-dependent chaperone ClpB
comp 3027207..3027773 CDS 280 280 189 280 fructose-1-phosphate/6-phosphogluconate phosphatase
comp 3028054..3028130 cgt + 63 63
comp 3028194..3028270 cgt 5 cgt 62 62
comp 3028333..3028409 cgt 62 62
comp 3028472..3028548 cgt 64 64
comp 3028613..3028689 cgt 3 3
comp 3028693..3028785 agc 315 315
comp 3029101..3029286 CDS 62 carbon storage regulator CsrA
comp 3157337..3158434 CDS 208 208 366 208 murein transglycosylase A
3158643..3158719 atgf + 33 33
3158753..3158829 atgf 3 atgf 33 33
3158863..3158939 atgf 635 635
3159575..3160075 CDS 167 type VI secretion system contractile sheath small subunit
3230172..3231401 CDS 316 316 410 HAAAP family serine/threonine permease
comp 3231718..3231791 ggg 78 78 78
comp 3231870..3232625 CDS 252 peptidoglycan DD-metalloendopeptidase family protein
3341048..3341755 CDS 105 105 236 105 DUF554 domain-containing protein
3341861..3341936 ttc 197 197
3342134..3343399 CDS 422 integrase arm-type DNA-binding domain-containing protein
comp 3569308..3569814 CDS 124 124 169 G/U mismatch-specific DNA glycosylase
3569939..3570014 atgi 53 53 53
comp 3570068..3570832 CDS 255 NADPH-dependent ferric chelate reductase
comp 3670227..3670679 CDS 206 206 151 206 ribosome maturation factor RimP
comp 3670886..3670962 atgf 347 347
> 3671310..3672155 CDS 282 Pseudo, argininosuccinate synthase
comp 3673935..3674387 CDS 206 206 151 206 ribosome maturation factor RimP
comp 3674594..3674670 atgf 347 347
> 3675018..3675869 CDS 284 Pseudo, argininosuccinate synthase
comp 3677794..3678246 CDS 206 206 151 206 ribosome maturation factor RimP
comp 3678453..3678529 atgf 347 347
> 3678877..3679722 CDS 282 Pseudo, argininosuccinate synthase
comp 3681532..3681984 CDS 206 206 151 206 ribosome maturation factor RimP
comp 3682191..3682267 atgf 347 347
3682615..3683958 CDS 448 argininosuccinate synthase
comp 3683966..3685591 CDS 456 456 542 phosphoethanolamine transferase
comp 3686048..3686134 ctc 14 14 14
comp 3686149..3686481 CDS 111 preprotein translocase subunit SecG
3784553..3785311 CDS 62 62 253 62 amino acid ABC transporter ATP-binding protein
comp 3785374..3785489 5s @3 39 116
comp 3785529..3785605 acc 14
comp 3785620..3785735 5s 777 116
comp 3786513..3786588 acc 14
comp 3786603..3786718 5s 1834 116
comp 3788553..3788628 gaa 1360 1360
3789989..3790543 CDS 185 gamma carbonic anhydrase family protein
comp 4078635..4080242 CDS 743 743 536 dipeptide ABC transporter substrate-binding protein DppA
comp 4080986..4081062 ccg 91 91 91
comp 4081154..4082845 CDS 564 kdo(2)-lipid A phosphoethanolamine 7-transferase
comp 4205966..4207348 CDS 292 292 461 292 glycoside-pentoside-hexuronide family transporter
4207641..4207735 tga 300 300
> 4208036..4208857 CDS 274 Pseudo, DUF4102 domain-containing protein
comp 4338643..4339335 CDS 479 479 231 FadR family transcriptional regulator
4339815..4341342 16s 73 1528
4341416..4341491 gaa 184
4341676..4344286 23s 83 2611
4344370..4344485 5s 53 116
4344539..4344615 gac 8
4344624..4344699 tgg 95 95 95
comp 4344795..4345634 CDS 280 HTH-type transcriptional regulator HdfR
4377681..4379066 CDS 102 102 462 102 amino acid permease
4379169..4379245 cgg 58 58
4379304..4379379 cac 20 20
4379400..4379486 ctg 42 42
4379529..4379605 cca 146 146
4379752..4380987 CDS 412 anaerobic sulfatase maturase
4460971..4461516 CDS 377 377 182 menaquinone-dependent protoporphyrinogen IX dehydrogenase
4461894..4463631 16s 56 1738
4463688..4463764 atc 42 42
4463807..4463882 gca 165
4464048..4467338 23s 83 3291
4467422..4467537 5s 104 104 116 104
comp 4467642..4468169 CDS 176 molybdopterin-guanine dinucleotide biosynthesis protein B
4605577..4606434 CDS 374 374 286 glutamate racemase
4606809..4608362 16s 363 1554
4608726..4608801 gaa 1112
4609914..4610029 5s 136 136 116 136
4610166..4611194 CDS 343 UDP-N-acetylenolpyruvoylglucosamine reductase
comp 4612185..4613135 CDS 361 361 317 type I pantothenate kinase
4613497..4613572 aca 8 8
4613581..4613665 tac 116 116
4613782..4613856 gga 6 6
4613863..4613938 acc 114 114 114
4614053..4615237 CDS 395 elongation factor Tu
comp 4642984..4644573 CDS 616 616 530 bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
4645190..4646378 16s’ @1 83 83 1189 83
4646462..4648150 CDS 436 436 563 bifunctional isocitrate dehydrogenase kinase/phosphatase
4648587..4648662 gaa 185
4648848..4651319 23s 83 2472
4651403..4651518 5s 76 76 116 76
4651595..4651978 CDS 128 hypothetical protein
< comp 4834504..4834961 CDS 197 197 153 pseudo, integrase
comp 4835159..4835234 ttc 106 106 106
comp 4835341..4835916 CDS 192 transcriptional regulator
4864628..4865173 CDS 210 210 182 210 oligoribonuclease
4865384..4865459 ggc + 36 36
4865496..4865571 ggc 3 ggc 35 35
4865607..4865682 ggc 233 233
4865916..4865969 CDS 18 hp
comp 4974178..4975197 CDS 195 195 340 NADPH-dependent aldehyde reductase Ahr
4975393..4975477 ttg 39 39 39
<> comp 4975517..4976055 CDS 180 pseudo, IS630 family transposase
5042527..5042763 CDS 38 38 79 38 DUF1435 domain-containing protein
comp 5042802..5042888 ctg + 34 34
comp 5042923..5043009 ctg 3 ctg 28 28
comp 5043038..5043124 ctg 290 290
comp 5043415..5044446 CDS 344 16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC
comp 5079375..5079581 CDS 117 117 69 117 AlpA family transcriptional regulator
5079699..5081218 16s 73 1520
5081292..5081368 gaa 12 12
5081381..5081454 gca 366 366
5081821..5082018 CDS 524 524 66 hypothetical protein
comp 5082543..5082754 CDS 71 hypothetical protein
comp 5090325..5090876 CDS 1808 1808 184 MarR family transcriptional regulator
comp 5092685..5092760 gaa 588 588 588
< comp 5093349..5093474 CDS 592 592 42 sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB
5094067..5094142 gaa + 1472 1472
5095615..5095691 atc 3 gaa 42 42
5095734..5095809 atc 2 atc 1130 1130
5096940..5097015 gaa 1145 1145
5098161..5098236 gaa 185
5098422..5100893 23s 83 2472
5100977..5101092 5s 76 76 116 76
5101169..5101552 CDS 63 63 128 hypothetical protein
comp 5101616..5102059 CDS 148 acetyltransferase
5124754..5125197 CDS 63 63 148 acetyltransferase
comp 5125261..5125644 CDS 76 76 128 hypothetical protein
comp 5125721..5125836 5s 83 116
comp 5125920..5128366 23s’ @2 -10 -10 2447 -10
< 5128357..5128479 CDS 41 pilus assembly protein
comp 5252659..5253870 CDS 300 300 404 tyrosine-type recombinase/integrase
comp 5254171..5254249 tga 292 292 292
> 5254542..5255171 CDS 210 pseudo, glycoside-pentoside-hexuronide family transporter
> comp 5305902..5306228 CDS 0 0 109 0 pseudo, hp
comp 5306229..5306302 atc 1096 1096
5307399..5308450 CDS 351 pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada
comp 5321144..5321869 CDS 206 206 242 206 pseudo, histidine kinase
comp 5322076..5322151 gcc + 39 39
comp 5322191..5322266 gcc 3 gcc 39 39
comp 5322306..5322381 gcc 220 220
5322602..5322961 CDS 120 putative DNA-binding transcriptional regulator
comp 5323406..5324821 CDS 258 258 472 glutamate--tRNA ligase
5325080..5325155 gta + 44 44
5325200..5325275 gta 2 gta 0 0 0
< 5325276..5325389 CDS 38 pseudo, putative DNA-binding transcriptional regulator
> 5375524..5376270 CDS 891 891 249 891 pseudo, AI-2E family transporter
5377162..5377237 gaa 1047 1047
comp 5378285..5379589 CDS 435 isocitrate lyase
comp > 5341397..5341492 CDS -2 -2 32 -2 ABC transporter ATP-binding protein
comp 5341491..5344303 23s 174 2813
comp 5344478..5344553 gca 42 42
comp 5344596..5344672 atc 56
comp 5344729..5346282 16s 1063 1554
comp 5347346..5347421 gca 42 42
comp 5347464..5347540 atc 56
comp 5347597..5349150 16s 365 365 1554
comp 5349516..5350088 CDS 187 187 191 D-glycero-beta-D-manno-heptose 1,7-bisphosphate 7-phosphatase
> 5350276..5350914 CDS 213 methionine ABC transporter ATP-binding protein MetN
> comp 5359583..5360512 CDS 120 120 310 tyrosine-type recombinase/integrase
comp 5360633..5360708 gca 42
comp 5360751..5360827 atc 56
comp 5360884..5362138 16s’ 1 1 1255 1
< comp 5362140..5363543 CDS 468 IS66 family transposase
5425965..5426201 CDS 38 38 79 38 DUF1435 domain-containing protein
comp 5426240..5426325 ctg + 26 26 a disparu le 20.12.19
comp 5426352..5426438 ctg 3 ctg 28 28
comp 5426467..5426553 ctg 63 63
< comp 5426617..5427150 CDS 178 pseudo, IS630-like element IS630 family transposase
> 5433568..5433687 CDS 39 39 40 39 pseudo, nicotinamide-nucleotide amidase
comp 5433727..5433814 tcc 253 253
comp 5434068..5434286 CDS 73 translation initiation factor IF-1

ecoN cumuls

modifier
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.ecoN. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
  • Lien tableur: ecoN cumuls
cumuls. Escherichia coli Nissle 1917
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa gammes cdsa 300
avec rRNA opérons 12 1 0 1 5 1 5 100 16 1 0
16 23 5s 0 20 13 2 50 11 40 10 200 34 30 1
16 atc gca 2 40 17 100 17 80 7 300 29 60 6
16 gaa 235 2 60 9 4 150 16 120 16 400 18 90 8
max a 5 80 4 200 15 160 3 500 18 120 8
a doubles 1 100 0 250 14 200 4 600 8 150 7
spéciaux 8 120 1 300 14 240 9 700 0 180 11
total aas 27 140 0 350 12 280 2 800 2 210 11
sans opérons 50 160 0 400 7 320 2 900 1 240 6
1 aa 32 180 0 450 4 360 3 1000 0 270 9
max a 7 200 0 500 4 400 0 1100 0 300 12
a doubles 15 0 11 2 0 0
total aas 94 44 6 130 63 126 79
total aas 121
remarques 4
avec jaune moyenne 33 32 253 142 272 172
variance 23 15 258 145 162 79
sans jaune moyenne 31 178 127 260
variance 19 109 91 142

ecoN blocs

modifier
  • Lien tableur: ecoN blocs
  • Légende:
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - Protéines en vert, sont hypothétiques ou typées, gc anhydrase. Voir les noms longs.
ecoNb Escherichia coli Nissle 1917, ecoN blocs
ecoNb1 Escherichia coli Nissle 1917, ecoN blocs
gène interca pbs cdsa protéine
cds 365 191 D-glycero
16s 73 1520
gaa 12
gca 174
23s 83 2588
5s 54 116
gac 162
cds 268 gluDkgB
cds 323 433 glutarate pm
5s 83 116
23s 184 4452
gaa 431
16s 441 1552
cds 858 ClpB dep
cds 616 530 AICAR2
16s’ 83 1189
cds 436 563 kinase isocit
gaa 185
23s 83 2472
5s 76 116
cds 128 hp-128
cds 62 253 pu-ABC
5s 39 116
acc 14
5s 777 116
acc 14
5s 1834 116
gaa 1360
cds 185 gc anhydrase
cds 377 182 porphyrine M
16s 56 1738
atc 42
gca 165
23s 83 3291
5s 104 116
cds 176 Mlb pB
cds 479 231 FadR tr
16s 73 1528
gaa 184
23s 83 2611
5s 53 116
gac 8
tgg 95
cds 280 HdfR HTH
ecoNb2 Escherichia coli Nissle 1917, ecoN blocs
gène interca pbs cdsa protéine
cds 374 286 Glu race
16s 363 1554
gaa 1112
5s 136 116
cds 343 UDP-N
cds 117 69 tr AlpA
16s 73 1520
gaa 12
gca 366
cds 524 66 hp-66
cds 71 hp-71
cds -2 32 ABC 32
23s 174 2813
gca 42
atc 56
16s 1063 1554
gca 42
atc 56
16s 365 1554
cds 187 191 D-glycero
cds 213 ABC MetN
cds 120 310 Tyr recb 310
gca 42
atc 56
16s’ 1 1255
cds 468 IS66
cds 63 148 transferase
cds 76 128 hp-128
5s 83 116
23s’ -10 2447
cds 41 pilus
cds 1808 184 MarR
gaa 588
cds 592 42 sn-glycerol
gaa 1472
atc 42
atc 1130
gaa 1145
gaa 185
23s 83 2472
5s 76 116
cds 63 128 hp-128
cds 148 transferase
ecoNb3 ecoN rRNAs
rRNAs pbs
16s
1189
1255
1520
1520
1528
1552
1554
1554
1554
1738
23s
2447
2472
2472
2588
2611
2813
3291
4452
5s
116 x 11

ecoN remarques

modifier
  • Remarques: ecoN opérons
    Beaucoup de blocs à rRNAs incomplets, 7 sur 12. Parmi les 5 complets 1 est semi-complet puisqu’il manque le 5s peu important. Les 5 blocs complets sont conformes au typage des gamma, avec y atcgca gaagca gaa et avec z sans gactgg gac.
    1. @1
      - Deux 16s aux extrémités non conformes, 16s’, adresses 4645190..4646378 et 5360884..5362138 .
      - Il n’y a pas de 16s° ou de 23s° courts, apparemment ils n’ont pas laissé de traces.
      - C’est ce qui expliquerait les 7 blocs incomplets et le nombre élevé de 32 des clusters sans rRNAs et à 1 seul tRNA.
    2. @2
      - Un 23s aux extrémités non comforme, 23s’, adresse 5125920..5128366 .
      - Même remarque que pour les 16s’, mais en plus je peux attribuer le grand nombre de petits cds aux remaniements qu’ont du subir ces blocs incomplets, voir ecoN blocs.
        5128357..5128479  -10 cp 23s'
        5341397..5341492  atcgca -2
        5360884..5362138  16s’ 1
    3. @3
      - Les 5s se comportent en typage gamma même pour ceux qui sont dans un bloc incomplet. Parmi ces derniers la plupart n’ont pas de z mais dans le cluster comportant 3 5s, adresse 3785374..3785489 , on peut distinguer avec des intercalaires faibles un 5s-acc-5s et un 5s-acc, où les 5s du début appartiendraient à un bloc complet.
    4. @4
      - Parmi les 6 clusters sans rRNA et à 2 tRNAs tous sont doubles et 3 sont identiques même en intercalaires, les 3 gtc. Les 3 autres sont gta tac et gcc.
      - Parmi les 6 clusters sans rRNA et à 3 tRNAs 5 sont des triples dont 2 à cgt ont même 2 intercalaires identiques, adresses. Les tRNAs de ces triplets sont atgf ggc gcc et 2 fois cgt. Le 6ème cluster à 3 tRNAs n’ a pas de doubles.
  • Séquences des doubles:
aas	clusters	doubles	séquences					
1	32		-					
2	6		6	2 tac	2 gtc*3  2 gcc	2 gta	
3	6		5	3 atgf	3 ctg*2  3 ggc	3 gcc	
4	3		1	3 gta				
5	0						
6	1		1	5 cgt				
7	2		2	5 aaa 2 gta    2 cag 2 atgj 2 caa

ecoN distribution

modifier
  • Lien tableur: ecoN distribution
  • Notes:
    - 3gtc2 gta2+3 2ctg3 gcc2+3 tac2 aaa3 atgf3 ggc3
    - atc: 4 16s, atc2, 1aa
    - gaa: 7 16s, 5s, 4 1aa
    - acc: 2 5s, >1aa, 1aa
    - gac: 2 5s, 1aa
    - Séquences: (aaa gta)2 aaa3
    - Adresse 5098422: ce bloc est compté dans « avec rRNA » dans cumuls. Mais ici je compte
    1 gaa avec rRNA
    2 gaa 1aa
    2 atc >1aa
Gm5 ecoN, Escherichia coli Nissle 1917. gama
g1    t1       
atgi 1 tct tat atgf 7
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc tac 3 tgc 1
atc 7 acc 4 aac 3 agc 1
ctc 1 ccc 4 cac 1 cgt 5
gtc 6 gcc 1 gac 3 ggc 4
tta 1 tca 5 taa tga 2
ata aca 1 aaa 6 aga 2
cta 1 cca 1 caa 2 cga
gta 7 gca 1 gaa 12 gga 1
ttg 1 tcg 6 tag tgg 1
atgj 2 acg 1 aag agg 1
ctg 7 ccg 1 cag 2 cgg 1
gtg gcg 1 gag ggg 1
gama >1aa =1aa -5s +5s -16s +16s total
ecoN 64 34 6 17 121

ecoN eco

modifier

ecoN eco tableaux

modifier
  • Lien tableur: ecoN eco tableaux
  • Légende: eco 435, la recherche de isocitrate, voir noms longs, se trouve à l'adresse 4217109..4218413 chez eco.
    - 23s': possible 23S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - 16s': possible 16S ribosomal RNA but does not have good blast hits on one or both of the ends.
    - Colonne cdsa
    . en clair la longueur de la protéine en aas
    . en orange 1542, longueur des rRNAs en pbs.
    - Colonne cds, les noms courts des cds
    . en clair
    . en vert D glycero, protéine identique entre eco et ecoN, à peu près en longueur et par le nom.
    . en bleu YdiA, protéine complètement différente en nom et/ou en longueur, entre ecoN et eco
    . en turquoise hp-419, protéine identique par la longueur mais différente par le nom, entre ecoN et eco
    . en gris clair D glycero, dans le tableau E13, protéine transposée par complement (colonne sens) entre ecoN et eco alors qu'il y a transposition des intercalaires (colonne interca), 365.
    . en gris foncé ABC 32, dans le tableau E13, protéine non transposée par complement (colonne sens) entre ecoN et eco alors qu'il n'y a pas transposition des intercalaires (colonne interca), 174.
    . en vert très foncé, dans le tableau E13, Tyr recb 404,protéine existant dans ecoN mais non trouvée dans eco.
  • Notes: Les dates de prélèvements des blocs de eco sont ceux de eco opérons du 10.3.19 alors que les cds de eco ont été prélevés le 19.12.19, qu'on voit dans le tableur ecoN eco tableaux. Pour ecoN la date de prélèvement est celle de ecoN opérons.
E1. Comparaison eco ecoN
E11. Clusters eco
cluster sens gènes interca cdsa cds
eco1 222833..223408 cds 362 192 D-glycero
223771..225312 16s 68 1542
225381..225457 atc 42
225500..225575 gca 183
225759..228662 23s 93 2904
228756..228875 5s 52 120
228928..229004 gac 162
229167..229970 cds 268 metDkgB
eco2 236067..236798 cds 132 244 DNAIIIe
236931..237007 gac 327
237335..238120 cds 262 lipo YafT
eco3 261503..262756 cds 114 418 glu5dH
262871..262946 acg 203
comp 263150..263212 cds 21 YdiA
262898..297205 phage 11436 pp CP4-6
eco4 comp 563848..564480 cds 242 211 put FimZ
564723..564799 aga 15
comp 564815..565978 cds 388 put DLP12
564755..586056 phage 7101 pp DLP12
eco5 695101..696276 cds 31 392 octaprenyl
comp 696308..696378 rpr 51 71 rpt71
comp 696430..696504 cag 37
comp 696542..696616 cag 47
comp 696664..696740 atg 15
comp 696756..696830 caa 34
comp 696865..696939 caa 23
comp 696963..697047 cta 9
comp 697057..697133 atg 379
comp 697513..699177 cds 555 Asn B
eco6 779598..780389 cds 164 264 cell CpoB
780554..780629 aaa 135
780765..780840 gta 2
780843..780918 aaa 149
781068..781143 gta 3
781147..781222 aaa 146
781369..781444 aaa 132
781577..781652 aaa 432
782085..783128 cds 348 quino
eco7 923264..925540 cds 343 759 ATP ClpA
comp 925884..925971 tcc 253
comp 926225..926443 cds 73 tif IF-1
eco8 comp 1030759..1031418 cds 206 220 FtsH
comp 1031625..1031712 tca 426
1032139..1033257 cds 373 Hnase1
eco9
*****aga*****
eco10 1095843..1096829 cds 735 329 un-YcdU
comp 1097565..1097652 tcc 233
1097886..1098824 cds 313 glyoxylate A
eco11
*****tcc*****
eco12 1286709..1286984 cds 81 92 p-un-YchS
comp 1287066..1287236 ncRNA -150 171 RttR sRNA
comp 1287087..1287176 cds 67 30 tpr
comp 1287244..1287328 tac 209
comp 1287538..1287622 tac 159
comp 1287782..1288624 cds 281 fTHF
eco13
***** gtc *****
gtc
eco14 ***** gtc *****
gtc
eco15 comp 1744871..1746127 cds 307 419 adhes YdhQ
1746435..1746511 gtc 4
1746516..1746592 gtc 107
1746700..1747005 cds 102 pu-YdhR
eco16 comp 1990954..1991619 cds 195 222 UPF0149 YecA
comp 1991815..1991901 tta 12
comp 1991914..1991987 tgc 54
comp 1992042..1992117 ggc 151
comp 1992269..1992817 cds 183 glycerolP
eco17 2042368..2042898 cds 569 177 pu-cytochrom
comp 2043468..2043557 tcg 93
2043651..2044448 cds 100 266 Mtf
2044549..2044624 aac 313
2044938..2052014 cds 2359 Inv-adhesin
eco18 2056858..2057574 cds 452 239 pu-tr-YeeN
comp 2058027..2058102 aac 100
comp 2058203..2059846 cds 4 548 exporter
2059851..2059926 aac 37
comp 2059964..2060914 cds 101 317 tact Cbl
comp 2061016..2061933 cds 326 306 tr-Nac
2062260..2062335 aac 55
comp 2062391..2063323 cds 311 ErfK
eco19 2284376..2286136 cds 74 587 pu-cardiolip
2286211..2286287 ccc 102
comp 2286390..2288914 cds 842 adhes YejO
eco20 2465301..2466233 cds 75 311 YfdC
2466309..2466383 agg 161
2466545..2467702 cds 386 KpLE1
2466369..2476583 phage 3405 pp CPS-53
eco21 comp 2515643..2517832 cds 208 730 pu-sensor
comp 2518041..2518116 gcc 39
comp 2518156..2518231 gcc 235
2518467..2518811 cds 115 pu- YfeC
eco22 comp 2519257..2520672 cds 258 472 Glu ligase
2520931..2521006 gta 44
2521051..2521126 gta 46
2521173..2521248 gta 4
2521253..2521328 aaa 210
2521539..2521567 rpr 25 29 rpt-29
comp 2521593..2522477 cds 295 XapR
eco23 comp 2724448..2725746 cds 322 433 glutarate sm
comp 2726069..2726188 5s 92 120
comp 2726281..2729184 23s 184 2904
comp 2729369..2729444 gaa 171
comp 2729616..2731157 16s 442 1542
comp 2731600..2734173 cds 858 ClpB
eco24 comp 2784529..2785011 cds 750 161 DUF5507
comp 2785762..2785837 atgi 559
2786397..2788649 cds 751 pu-unYgaQ
eco25 comp 2816937..2817503 cds 280 189 fructose
comp 2817784..2817860 cgt 198
comp 2818059..2818135 cgt 62
comp 2818198..2818274 cgt 198
comp 2818473..2818549 cgt 3
comp 2818553..2818645 agc 315
comp 2818961..2819146 cds 62 Csr
eco26 comp 2946081..2947178 cds 208 366 murein lytic
2947387..2947463 atgf 33
2947497..2947573 atgf 33
2947607..2947683 atgf 73
comp 2947757..2949010 cds 418 Ala C
eco27 comp 2998034..2998828 cds 155 265 YgeQ
comp 2998984..2999057 ggg 78
comp 2999136..2999891 cds 252 pu-LysM
eco28 3109553..3110260 cds 105 236 DUF554
3110366..3110441 ttc 148
comp 3110590..3111126 cds 179 pu-ssM
eco29 comp 3214967..3215473 cds 124 169 G/U station
3215598..3215673 atgi 53
comp 3215727..3216491 cds 255 ferric
eco30
eco31
eco32
eco33 comp 3317554..3318006 cds 206 151 RimP
comp 3318213..3318289 atgf 347
3318637..3319980 cds 448 Arg-suc
eco34 comp 3319988..3321613 cds 458 542 pu-hydrolase
comp 3322072..3322158 ctc 14
comp 322173..3322505 cds 111 SecG-t
eco35 3422436..3423194 cds 228 253 pu-YhdZ
comp 3423423..3423542 5s 37 120
comp 3423580..3423655 acc 12
comp 3423668..3423787 5s 92 120
comp 3423880..3426783 23s 174 2904
comp 3426958..3427033 gca 42
comp 3427076..3427152 atc 68
comp 3427221..3428762 16s 473 1542
3429236..3429790 cds 185 protein YrdA
eco36 comp 3706098..3707705 cds 567 536 dip ABC
comp 3708273..3708306 rpr 16 34 rpt-34
3708323..3708358 rpr 257 36 rpt-36
comp 3708616..3708692 ccg 91
comp 3708784..3710475 cds 564 kdo2
eco37 comp 3834547..3835929 cds 292 461 pu-YicJ
3836222..3836316 tga 108
3836425..3836556 pseudo 396 132 p-yicT
3836953..3838137 cds 395 pu-arabi
eco38 comp 3940635..3941327 cds 480 231 pu-tr YieP
3941808..3943349 16s 85 1542
3943435..3943510 gaa 193
3943704..3946607 23s 92 2904
3946700..3946819 5s 52 120
3946872..3946948 gac 8
3946957..3947032 tgg 95
comp 3947128..3947967 cds 280 HdfR
eco39 3980887..3982272 cds 102 462 pu-YifK
3982375..3982451 cgg 57
3982509..3982585 cac 20
3982606..3982692 ctg 42
3982735..3982811 cca 146
3982958..3984193 cds 412 pu-AslB
eco40 4034608..4035153 cds 377 182 porphyrine O
4035531..4037072 16s 68 1542
4037141..4037217 atc 42
4037260..4037335 gca 183
4037519..4040423 23s 93 2905
4040517..4040636 5s 228 120
4040865..4040900 rpr 5 36 rpt-36
comp 4040906..4041433 cds 176 Mlb adapt
eco41 4165428..4166285 cds 373 286 Glu race
4166659..4168200 16s 171 1542
4168372..4168447 gaa 193
4168641..4171544 23s 92 2904
4171637..4171756 5s 300 120
4172057..4173085 cds 343 UDP-N
eco42 comp 4174076..4175026 cds 361 317 B5 kinase
4175388..4175463 aca 8
4175472..4175556 tac 116
4175673..4175747 gga 6
4175754..4175829 acc 114
4175944..4177128 cds 229 395 tufb
4177358..4177741 cds 128 SecE
eco43 comp 4205943..4207532 cds 614 530 AICAR1
4208147..4209688 16s 85 1542
4209774..4209849 gaa 193
4210043..4212946 23s 93 2904
4213040..4213159 5s 74 120
4213234..4213617 cds 128 stress
eco44 comp 4360396..4361934 cds 256 513 CadC
comp 4362191..4362353 pseudo 197 163 yjdQ
comp 4362551..4362626 ttc 106
comp 4362733..4363308 cds 192 pu-tr YjdC
eco45 4391604..4392149 cds 210 182 oligo-rnase
4392360..4392435 ggc 36
4392472..4392547 ggc 35
4392583..4392658 ggc 233
4392892..4392945 cds 18 un-YjeV
eco46 comp 4495190..4496209 cds 195 340 NADPH- Ah
4496405..4496489 ttg 260
4496750..4497940 cds 397 pu-KpLE2
4496675..4497940 phage 422 pp PR-Y
eco47 4605804..4606040 cds 38 79 protein YjjZ
comp 4606079..4606165 ctg 34
comp 4606200..4606286 ctg 28
comp 4606315..4606401 ctg 157
4606559..4606594 rpr 22 36 rpt 36
comp 4606617..4606650 rpr 18 34 rpt 34
comp 4606669..4607700 cds 344 G1207
E12. Clusters ecoN alignés sur les clusters de eco
cluster sens gènes interca cdsa cds
ecoN1 231864..232436 CDS 365 191 D-glycero
232802..234321 16s 73 1520
234395..234471 gaa 12
234484..234557 gca 174
234732..237319 23s 83 2588
237403..237518 5s 54 116
237573..237649 gac 162
237812..238615 CDS 268 gluDkgB
ecoN2 244934..245665 CDS 132 244 DNAIIIe
245798..245874 gac 120
comp 245995..246852 CDS 286 DUF4942
ecoN3 367329..368582 CDS 114 418 glu5dH
368697..368772 acg 154
368927..369265 CDS 113 DUF4102
ecoN4 comp 631149..632015 CDS 270 289 cyclo FolD
632286..632362 aga 15
comp 632378..632997 CDS 207 Tyr recb 207
ecoN5 733188..734363 CDS 153 392 octaprenyl
comp 734517..734591 cag 37
comp 734629..734703 cag 48
comp 734752..734828 atgj 15
comp 734844..734918 caa 34
comp 734953..735027 caa 23
comp 735051..735135 cta 10
comp 735146..735222 atgj 380
comp 735603..737267 CDS 555 Asn B
ecoN6 807377..808169 CDS 164 264 p-cell CpoB
808334..808409 aaa 35
808445..808520 gta 2
808523..808598 aaa 51
808650..808725 gta 3
808729..808804 aaa 48
808853..808928 aaa 33
808962..809037 aaa 277
809315..810358 CDS 348 quino NadA
ecoN7 950069..952345 CDS 343 759 ATP ClpA
comp 952689..952776 tcc 253
comp 953030..953248 CDS 73 tif IF-1
ecoN8 comp 1047224..1047883 CDS 206 220 FtsH YccA
comp 1048090..1048177 tca 426
1048604..1049722 CDS 373 Hnase1
ecoN9 1183656..1184018 CDS 463 121 hp-121
1184482..1184558 aga 278
> comp 1184837..1185786 CDS 317 p-IS4
ecoN10 1213982..1214809 CDS 165 276 DUF4942
comp 1214975..1215062 tcc 233
1215296..1216234 CDS 313 glyoxyl GhrA
ecoN11 1216817..1217098 CDS 165 94 DUF4942
comp 1217264..1217351 tcc 234
1217586..1218524 CDS 313 glyoxyl GhrA
ecoN12 1457038..1458129 CDS 16 364 acyl-CoA
comp 1458146..1458277 ncRNA 46 44 RtT sRNA
comp 1458324..1458408 tac 33
comp 1458442..1458526 tac 159
comp 1458686..1459528 CDS 281 fTHF
ecoN13 comp 1829066..1830322 CDS 307 419 hp-419
1830630..1830706 gtc 4
1830711..1830787 gtc 6
< 1830794..1831177 CDS 128 p-MdtK
ecoN14 comp 1831218..1832474 CDS 307 419 hp-419
1832782..1832858 gtc 4
1832863..1832939 gtc 8
< 1832948..1833280 CDS 111 p-MATE
ecoN15 comp 1833321..1834577 CDS 307 419 hp-419
1834885..1834961 gtc 4
1834966..1835042 gtc 108
1835151..1835456 CDS 102 mono-O2
ecoN16 comp 2115794..2116459 CDS 195 222 UPF0149 YecA
comp 2116655..2116741 tta 12
comp 2116754..2116827 tgc 53
comp 2116881..2116956 ggc 151
comp 2117108..2117656 CDS 183 CDP-diacyl
ecoN17 comp 2191451..2192287 CDS 278 279 hp-279
comp 2192566..2192655 tcg 93
2192749..2193546 CDS 100 266 MtfA
2193647..2193722 aac 161
2193884..2195146 CDS 421 Tyr recb-421
ecoN18 2232607..2233323 CDS 453 239 tr-YebC
comp 2233777..2233852 acc 326
2234179..2235096 CDS 101 306 tr-nitrogen
2235198..2236148 CDS 37 317 tr-Cbl
comp 2236186..2236261 aac 4
2236266..2237909 CDS 100 548 trp-YeeO
2238010..2238085 aac 161
2238247..2239518 CDS 424 Tyr recb 424
ecoN19 2546968..2548728 CDS 74 587 cardiolipine
2548803..2548879 ccc 101
comp 2548981..2549136 CDS 52 barrel
ecoN20 2717780..2718712 CDS 75 311 nitrite
2718788..2718862 agg 437
comp 2719300..2719830 CDS 177 OmpH
ecoN21 comp 2768744..2770933 CDS 206 730 sensor
comp 2771140..2771215 gcc 39
comp 2771255..2771330 gcc 220
2771551..2771910 CDS 120 pu-tr 120
ecoN22 comp 2772355..2773770 CDS 258 472 Glu ligase
2774029..2774104 gta 43
2774148..2774223 gta 46
2774270..2774345 gta 4
2774350..2774425 aaa 110
comp 2774536..2775420 CDS 295 LysR
ecoN23 comp 2959205..2960503 CDS 323 433 glutarate pm
comp 2960827..2960942 5s 83 116
comp 2961026..2965477 23s 184 4452
comp 2965662..2965737 gaa 431
comp 2966169..2967720 16s 441 1552
comp 2968162..2970735 CDS 858 ClpB dep
ecoN24
****atgi*****
ecoN25
comp 3027207..3027773 CDS 280 189 fructose 6
comp 3028054..3028130 cgt 63
comp 3028194..3028270 cgt 62
comp 3028333..3028409 cgt 62
comp 3028472..3028548 cgt 64
comp 3028613..3028689 cgt 3
comp 3028693..3028785 agc 315
comp 3029101..3029286 CDS 62 CsrA
ecoN26 comp 3157337..3158434 CDS 208 366 murein
3158643..3158719 atgf 33
3158753..3158829 atgf 33
3158863..3158939 atgf 635
3159575..3160075 CDS 167 sscs VI
ecoN27 3230172..3231401 CDS 316 410 HAAAP
comp 3231718..3231791 ggg 78
comp 3231870..3232625 CDS 252 glycan DD
ecoN28 3341048..3341755 CDS 105 236 DUF554
3341861..3341936 ttc 197
3342134..3343399 CDS 422 arm-type
ecoN29 comp 3569308..3569814 CDS 124 169 G/U
3569939..3570014 atgi 53
comp 3570068..3570832 CDS 255 ferric
ecoN30 comp 3670227..3670679 CDS 206 151 RimP
comp 3670886..3670962 atgf 347
> 3671310..3672155 CDS 282 p-Arg-sc 282
ecoN31 comp 3673935..3674387 CDS 206 151 RimP
comp 3674594..3674670 atgf 347
> 3675018..3675869 CDS 284 p-Arg-sc 284
ecoN32 comp 3677794..3678246 CDS 206 151 RimP
comp 3678453..3678529 atgf 347
> 3678877..3679722 CDS 282 p-Arg-sc 282
ecoN33 comp 3681532..3681984 CDS 206 151 RimP
comp 3682191..3682267 atgf 347
3682615..3683958 CDS 448 Arg-suc
ecoN34 comp 3683966..3685591 CDS 456 542 Pet
comp 3686048..3686134 ctc 14
comp 3686149..3686481 CDS 111 SecG-p
ecoN35 3784553..3785311 CDS 62 253 pu-ABC
comp 3785374..3785489 5s 39 116
comp 3785529..3785605 acc 14
comp 3785620..3785735 5s 777 116
comp 3786513..3786588 acc 14
comp 3786603..3786718 5s 1834 116
comp 3788553..3788628 gaa 1360
3789989..3790543 CDS 185 gc anhydrase
ecoN36 comp 4078635..4080242 CDS 743 536 DppA
comp 4080986..4081062 ccg 91
comp 4081154..4082845 CDS 564 kdo2
ecoN37 comp 4205966..4207348 CDS 292 461 glycoside-p5
4207641..4207735 tga 300
> 4208036..4208857 CDS 274 p-DUF4102
ecoN38 comp 4338643..4339335 CDS 479 231 FadR tr
4339815..4341342 16s 73 1528
4341416..4341491 gaa 184
4341676..4344286 23s 83 2611
4344370..4344485 5s 53 116
4344539..4344615 gac 8
4344624..4344699 tgg 95
comp 4344795..4345634 CDS 280 HdfR HTH
ecoN39 4377681..4379066 CDS 102 462 aa permease
4379169..4379245 cgg 58
4379304..4379379 cac 20
4379400..4379486 ctg 42
4379529..4379605 cca 146
4379752..4380987 CDS 412 ans maturase
ecoN40 4460971..4461516 CDS 377 182 porphyrine M
4461894..4463631 16s 56 1738
4463688..4463764 atc 42
4463807..4463882 gca 165
4464048..4467338 23s 83 3291
4467422..4467537 5s 104 116
comp 4467642..4468169 CDS 176 Mlb pB
ecoN41 4605577..4606434 CDS 374 286 Glu race
4606809..4608362 16s 363 1554
4608726..4608801 gaa 1112
4609914..4610029 5s 136 116
4610166..4611194 CDS 343 UDP-N
ecoN42 comp 4612185..4613135 CDS 361 317 B5 kinase I
4613497..4613572 aca 8
4613581..4613665 tac 116
4613782..4613856 gga 6
4613863..4613938 acc 114
4614053..4615237 CDS 395 tuf
ecoN43 comp 4642984..4644573 CDS 616 530 AICAR2
4645190..4646378 16s’ 83 1189
4646462..4648150 CDS 436 563 kinase isocit
4648587..4648662 gaa 185
4648848..4651319 23s 83 2472
4651403..4651518 5s 76 116
4651595..4651978 CDS 128 hp-128
ecoN44
< comp 4834504..4834961 CDS 197 153 pu-integrase
comp 4835159..4835234 ttc 106
comp 4835341..4835916 CDS 192 tr 192
ecoN45 4864628..4865173 CDS 210 182 oligo-rnase
4865384..4865459 ggc 36
4865496..4865571 ggc 35
4865607..4865682 ggc 233
4865916..4865969 CDS 18 hp-18
ecoN46 comp 4974178..4975197 CDS 195 340 NADPH- Ahr
4975393..4975477 ttg 39
<> comp 4975517..4976055 CDS 180 p-IS630
ecoN47 5042527..5042763 CDS 38 79 DUF1435
comp 5042802..5042888 ctg 34
comp 5042923..5043009 ctg 28
comp 5043038..5043124 ctg 290
comp 5043415..5044446 CDS 344 G1207 RsmC
E13. Clusters ecoN au-delà de eco
ecoN suite sens gènes interca cdsa cds
EcoN 48 comp 5079375..5079581 CDS 117 69 tr AlpA
ok 5079699..5081218 16s 73 1520
5081292..5081368 gaa 12
5081381..5081454 gca 366
5081821..5082018 CDS 524 66 hp-66
comp 5082543..5082754 CDS 71 hp-71
eco1 222833..223408 cds 362 192 D-glycero
223771..225312 16s 68 1542
225381..225457 atc 42
225500..225575 gca 183
225759..228662 23s 93 2904
228756..228875 5s 52 120
228928..229004 gac 162
229167..229970 cds 268 metDkgB
EcoN 56 comp > 5341397..5341492 CDS -2 32 ABC 32
ok comp 5341491..5344303 23s 174 2813
comp 5344478..5344553 gca 42
comp 5344596..5344672 atc 56
comp 5344729..5346282 16s 1063 1554
comp 5347346..5347421 gca 42
comp 5347464..5347540 atc 56
comp 5347597..5349150 16s 365 1554
comp 5349516..5350088 CDS 187 191 D-glycero
> 5350276..5350914 CDS 213 ABC MetN
eco35 eco 3422436..3423194 cds 228 253 pu-YhdZ
comp 3423423..3423542 5s 37 120
comp 3423580..3423655 acc 12
comp 3423668..3423787 5s 92 120
comp 3423880..3426783 23s 174 2904
comp 3426958..3427033 gca 42
comp 3427076..3427152 atc 68
comp 3427221..3428762 16s 473 1542
3429236..3429790 cds 185 protein YrdA
ecoN35 3784553..3785311 CDS 62 253 pu-ABC
comp 3785374..3785489 5s 39 116
comp 3785529..3785605 acc 14
comp 3785620..3785735 5s 777 116
comp 3786513..3786588 acc 14
comp 3786603..3786718 5s 1834 116
comp 3788553..3788628 gaa 1360
3789989..3790543 CDS 185 gc anhydrase
EcoN 59 > 5433568..5433687 CDS 39 40 p-Nam
ok comp 5433727..5433814 tcc 253
comp 5434068..5434286 CDS 73 tif IF-1
ecoN
EcoN 53 comp 5321144..5321869 CDS 206 242 p-His kinase
ok comp 5322076..5322151 gcc 39
comp 5322191..5322266 gcc 39
comp 5322306..5322381 gcc 220
5322602..5322961 CDS 120 pu-tr 120
ecoN
EcoN 54 comp 5323406..5324821 CDS 258 472 Glu ligase
ok 5325080..5325155 gta 44
5325200..5325275 gta 0
< 5325276..5325389 CDS 38 p-pu-tr 38
EcoN 51 comp 5252659..5253870 CDS 300 404 Tyr recb 404
ok comp 5254171..5254249 tga 292
> 5254542..5255171 CDS 210 p-glycoside
EcoN 52 > comp 5305902..5306228 CDS 0 109 p-hp
comp 5306229..5306302 atc 1096
ecoN ? 5307399..5308450 CDS 351 p-Ada
EcoN 57 > comp 5359583..5360512 CDS 120 310 Tyr recb 310
comp 5360633..5360708 gca 42
ecoN40 comp 5360751..5360827 atc 56
comp 5360884..5362138 16s’ 1 1255
< comp 5362140..5363543 CDS 468 IS66
EcoN 55 > 5375524..5376270 CDS 891 249 p-AI-2E
5377162..5377237 gaa 1047 eco 435
ecoN ? comp 5378285..5379589 CDS 435 isocitrate
EcoN 49 comp 5090325..5090876 CDS 1808 184 MarR
comp 5092685..5092760 gaa 588
ecoN ? < comp 5093349..5093474 CDS 592 42 sn-glycerol
5094067..5094142 gaa 1472
5095615..5095691 atc 42
5095734..5095809 atc 1130
5096940..5097015 gaa 1145
ok ecoN43 5098161..5098236 gaa 185
5098422..5100893 23s 83 2472
5100977..5101092 5s 76 116
5101169..5101552 CDS 63 128 hp-128
comp 5101616..5102059 CDS 148 transferase
EcoN 50 5124754..5125197 CDS 63 148 transferase
comp 5125261..5125644 CDS 76 128 hp-128
ecoN40 comp 5125721..5125836 5s 83 116
comp 5125920..5128366 23s’ -10 2447
< 5128357..5128479 CDS 41 pilus
EcoN 58 5425965..5426201 CDS 38 79 DUF1435
ok comp 5426240..5426325 ctg 26
comp 5426352..5426438 ctg 28
comp 5426467..5426553 ctg 63
< comp 5426617..5427150 CDS 178 p-IS630

ecoN eco noms cds

modifier
ecoN eco. Liste des noms longs et courts, et des fonctions
fonction Noms courts Noms longs
tr-regulator XapR DNA-binding transcriptional activator XapR
permease aa permease amino acid permease
ABC bind ABC 32 ABC transporter ATP-binding protein
ABC bind ABC MetN methionine ABC transporter ATP-binding protein MetN
desaturase acyl-CoA acyl-CoA desaturase
adhesin adhes YdhQ adhesin-like autotransporter YdhQ
adhesin adhes YejO adhesin-like autotransporter YejO, gene fragment 2 of yejO, misc_feature
hydrolase AICAR1 bifunctional AICAR transformylase/IMP cyclohydrolase
hydrolase AICAR2 bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase
amidase Ala C N-acetylmuramoyl-L-alanine amidase C
maturase ans maturase anaerobic sulfatase maturase
synthetase Arg-suc argininosuccinate synthetase
integrase arm-type integrase arm-type DNA-binding domain-containing protein
synthetase Asn B asparagine synthetase B
protease b ATP ClpA ATP-dependent Clp protease ATP-binding subunit ClpA
kinase B5 kinase pantothenate kinase
kinase B5 kinase I type I pantothenate kinase
transporter barrel autotransporter outer membrane beta-barrel domain-containing protein
tr-regulator CadC DNA-binding transcriptional activator CadC
cardiolipin cardiolipine cardiolipin transport protein PbgA
transferase CDP-diacyl CDP-diacylglycerol--glycerol-3-phosphate 3-phosphatidyltransferase
division cell CpoB cell division coordinator CpoB
chaperone ClpB ClpB chaperone
chaperone ClpB dep ATP-dependent chaperone ClpB
storage Csr carbon storage regulator
storage CsrA carbon storage regulator CsrA
hydrolase cyclo FolD bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD
phosphatase D-glycero D-glycero-beta-D-manno-heptose-1,7-bisphosphate 7-phosphatase
ABC bind dip ABC dipeptide ABC transporter periplasmic binding protein
polymerase DNAIIIe DNA polymerase III subunit epsilon
ABC bind DppA dipeptide ABC transporter substrate-binding protein DppA
DUF DUF1435 DUF1435 domain-containing protein
DUF DUF4102 DUF4102 domain-containing protein
DUF DUF4942 DUF4942 domain-containing protein
DUF DUF5507 DUF5507 domain-containing protein YpjC
DUF DUF554 DUF554 domain-containing protein
DUF DUF554 Yqg DUF554 domain-containing protein YqgA
peptidase ErfK L,D-transpeptidase ErfK
exporter exporter FMN/FAD exporter
tr-regulator FadR tr FadR family transcriptional regulator
reductase ferric NADPH-dependent ferric chelate reductase
phosphatase fructose fructose-1-phosphatase
phosphatase fructose 6 fructose-1-phosphate/6-phosphogluconate phosphatase
deformylase fTHF formyltetrahydrofolate deformylase
protase FtsH modulator of FtsH protease
protease FtsH YccA FtsH protease modulator YccA
glycosylase G/U G/U mismatch-specific DNA glycosylase
glycosylase G/U station stationary phase mismatch/uracil DNA glycosylase
transferase G1207 16S rRNA m(2)G1207 methyltransferase
transferase G1207 RsmC 16S rRNA (guanine(1207)-N(2))-methyltransferase RsmC
anhydrase gc anhydrase gamma carbonic anhydrase family protein
ligase Glu ligase glutamate--tRNA ligase
racemase Glu race glutamate racemase
dehydrogenase glu5dH glutamate-5-semialdehyde dehydrogenase
reductase gluDkgB 2,5-didehydrogluconate reductase DkgB
permease glutarate pm alpha-ketoglutarate permease
symporter glutarate sm alpha-ketoglutarate:H(+) symporter
peptidase glycan DD peptidoglycan DD-metalloendopeptidase family protein
synthetase glycerolP phosphatidylglycerophosphate synthase
transporter glycoside-p5 glycoside-pentoside-hexuronide family transporter
reductase glyoxyl A glyoxylate/hydroxypyruvate reductase A
reductase glyoxyl GhrA glyoxylate/hydroxypyruvate reductase GhrA
permease HAAAP HAAAP family serine/threonine permease
tr-regulator HdfR DNA-binding transcriptional dual regulator HdfR
tr-regulator HdfR HTH HTH-type transcriptional regulator HdfR
hydrogenase Hnase1 hydrogenase 1 small subunit
hp hp-121 hp-121
hp hp-128 hypothetical protein
hp hp-18 hp-18
adhesin Inv-adhesin inverse autotransporter adhesin
transposase IS66 IS66 family transposase
lyase isocitrate isocitrate lyase
transferase kdo2 kdo(2)-lipid A phosphoethanolamine 7-transferase
kinase/Pase kinase isocit bifunctional isocitrate dehydrogenase kinase/phosphatase
prophage KpLE1 CPS-53 (KpLE1) prophage; prophage CPS-53 integrase
lipoprotein lipo YafT lipoprotein YafT
tr-regulator LysR LysR family transcriptional regulator
tr-regulator MarR MarR family transcriptional regulator
reductase metDkgB methylglyoxal reductase DkgB
GDP Mlb adapt molybdopterin-guanine dinucleotide biosynthesis adaptor protein
GDP Mlb pB molybdopterin-guanine dinucleotide biosynthesis protein B
oxygenase mono-O2 monooxygenase
titration Mtf Mlc titration factor
tr-regulator MtfA DgsA anti-repressor MtfA
glycosylase murein murein transglycosylase A
glycosylase murein lytic membrane-bound lytic murein transglycosylase A
reductase NADPH- Ah aldehyde reductase, NADPH-dependent
reductase NADPH- Ahr NADPH-dependent aldehyde reductase Ahr
transporter nitrite formate/nitrite transporter family protein
hydroxylase octaprenyl 2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase
rnase oligo-rnase oligoribonuclease
protein OmpH OmpH family outer membrane protein
transferase p-Ada pseudo, bifunctional DNA-binding transcriptional regulator/O6-methylguanine-DNA methyltransferase Ada
transporter p-AI-2E pseudo, AI-2E family transporter
synthetase p-Arg-sc 282 Pseudo, argininosuccinate synthase
synthetase p-Arg-sc 284 Pseudo, argininosuccinate synthase
division p-cell CpoB Pseudo, cell division protein CpoB
DUF p-DUF4102 Pseudo, DUF4102 domain-containing protein
transporter p-glycoside pseudo, glycoside-pentoside-hexuronide family transporter
kinase p-His kinase pseudo, histidine kinase
hp p-hp pseudo, hp 109
integrase p-integrase pseudo, integrase
transposase p-IS4 Pseudo, IS4 family transposase
transposase p-IS630 pseudo, IS630 family transposase
transporter p-MATE Pseudo, MATE family efflux transporter
transporter p-MdtK Pseudo, multidrug efflux MATE transporter MdtK
amidase p-Nam pseudo, nicotinamide-nucleotide amidase
tr-regulator p-pu-tr 38 pseudo, putative DNA-binding transcriptional regulator
protein p-un-YchS putative uncharacterized protein YchS
gene p-yicT p-yicT
transferase Pet phosphoethanolamine transferase
protein pilus pilus assembly protein
dehydrogenase porphyrine M menaquinone-dependent protoporphyrinogen IX dehydrogenase
oxidase porphyrine O protoporphyrinogen oxidase
prophage pp CP4-6 note="cryptic prophage CP4-6" misc_feature
prophage pp CPS-53 cryptic prophage CPS-53, misc_feature
prophage pp DLP12 note="cryptic prophage DLP12" misc_feature
prophage pp PR-Y cryptic prophage PR-Y
protein protein YjjZ protein YjjZ
protein protein YrdA protein YrdA
tr-regulator pu- YfeC putative DNA-binding transcriptional regulator YfeC
ABC bind pu-ABC amino acid ABC transporter ATP-binding protein
exporter pu-arabi putative arabinose exporter
sulfatase pu-AslB putative anaerobic sulfatase maturation enzyme AslB
cardiolipin pu-cardiolip putative cardiolipin transport protein
cytochrome pu-cytochrom putative cytochrome
hydrolase pu-hydrolase putative hydrolase, inner membrane
integrase pu-KpLE2 KpLE2 phage-like element; putative integrase
peptidase pu-LysM LysM domain-containing putative peptidase lipoprotein YgeR
GMP pu-sensor putative c-di-GMP phosphodiesterase PdeA
protein Pu-ssM putative type II secretion system M-type protein
tr-regulator pu-tr 120 putative DNA-binding transcriptional regulator
tr-regulator pu-tr YieP putative transcriptional regulator YieP
tr-regulator pu-tr YjdC putative DNA-binding transcriptional regulator YjdC
tr-regulator pu-tr-YeeN putative transcriptional regulator YeeN
protein pu-unYgaQ putative uncharacterized protein YgaQ
oxygenase pu-YdhR putative monooxygenase YdhR
ABC bind pu-YhdZ putative ABC transporter ATP-binding subunit YhdZ
transporter pu-YicJ putative xyloside transporter YicJ
transporter pu-YifK putative transporter YifK
prophage put DLP12 DLP12 prophage; putative integrase
tr-regulator put FimZ putative LuxR family transcriptional regulator FimZ
synthetase quino quinolinate synthase
synthetase quino NadA quinolinate synthase NadA
ribosome RimP ribosome maturation factor RimP
rpt rpt-29 rpt-29
rpt rpt-34 rpt_type=other
rpt rpt-36 rpt_type=other
rpt rpt71 rpt_type=other 71
sRNA RttR sRNA small RNA RttR
translocase SecE Sec translocon subunit SecE
translocase SecG-p preprotein translocase subunit SecG
translocase SecG-t Sec translocon subunit SecG
esterase sensor sensor domain-containing phosphodiesterase
ABC bind sn-glycerol sn-glycerol-3-phosphate ABC transporter substrate-binding protein UgpB
protein sscs VI type VI secretion system contractile sheath small subunit
protein stress stress response protein
tr-regulator tact Cbl DNA-binding transcriptional activator Cbl
translation tif IF-1 translation initiation factor IF-1
protein tpr protamine-like protein
tr-regulator tr 192 transcriptional regulator
tr-regulator tr AlpA AlpA family transcriptional regulator
tr-regulator tr-Cbl HTH-type transcriptional regulator Cbl
tr-regulator tr-Nac DNA-binding transcriptional dual regulator Nac
tr-regulator tr-nitrogen nitrogen assimilation transcriptional regulator
tr-regulator tr-YebC YebC/PmpR family DNA-binding transcriptional regulator
transferase transferase acetyltransferase
transporter trp-YeeO toxic metabolite efflux MATE transporter YeeO
translation tuf elongation factor Tu
translation tufb tufb, translation elongation factor Tu 2
integrase Tyr recb 207 tyrosine-type recombinase/integrase
integrase Tyr recb 404 tyrosine-type recombinase/integrase
integrase Tyr recb 421 tyrosine-type recombinase/integrase
integrase Tyr recb 424 tyrosine-type recombinase/integrase
reductase UDP-N UDP-N-acetylenolpyruvoylglucosamine reductase
protein un-YcdU uncharacterized protein YcdU
protein un-YjeV uncharacterized protein YjeV
protein UPF0149 YecA UPF0149 family protein YecA
protein YdiA YdiA family protein
protein YfdC inner membrane protein YfdC
protein YgeQ protein YgeQ
gene yjdQ gene="yjdQ"
DUF DUF1435 DUF1435 domain-containing protein
transposase p-IS630 pseudo, IS630-like element IS630 family transposase

ecoN. Intergen51

modifier

Intergen51. ecoN. Le génome

modifier
  • ecoN Le prélèvement: gama
  • Le nom et le lien NCBI: ecoN, Escherichia coli Nissle 1917 chromosome, NCBI [71], date 11.5.21.
  • ecoN La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
ecoN	646,219		5,441,200	11.9	
ecoN données intercalaires
modifier
ecoN données intercalaires 200
modifier
ecoN autres intercalaires aas
modifier

Intergen51. ecoN. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. ecoN les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 ecoN les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,793 782 29 3,604 2.4 84 13 97
x 1,364 105 18 1,487 0 4 4
t 4,157 887 47 5,091 84 17 101
% 81.7 17.4 0.9
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 56 0 2 58 1.3 tRNA-CDS 104 48
x 46 0 0 46 RNA-RNA 84 39
t 102 0 2 104 CDS-rRNA 17 8
% 98.1 0.0 1.9 non RNA 12 6
- total 217 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 4.4 12.1 1.3 32.7 5.2 65 0.8 3.4
x 10.3 15.2 4.8 6.4 4.3 47 1.2 0.0

Intergen51. ecoN. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: ecoN données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées ecoN fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. ecoN fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	ecoN
R2	x3		x2		x		c		Inflexion poly3	x	c
0.561	1.45E-06	-8.87E-04	5.65E-02	35.30	fx1	abscisse	261.5	434.8
0.853	-6.60E-06	5.18E-03	-1.32E+00	119.0	fc1	ordonnée	15.7	5.2
								
0.784	-2.46E-06	1.93E-03	-5.54E-01	72.6	fx41			
0.959	-8.05E-07	1.05E-03	-4.48E-01	67.7	fc41
  • Le rfin après 400 est de 125 sur un total de 2822. Jusqu'à 1% les freq10 sont en continu jusqu'à 670, reste 27. L'indice i.rfin1 = 98/270 = 0.363.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	ecoN		calculs			poly3	ecoN
effect	2822		R2.21	814		abscis	250
xm	37		pte	12,85		flexa	123
ym	10		cste	4,02		flexo	2,71
x1m	235		r400l	165		xm	35
y1m	1		restp	136,07		sup4	103,6
rfin	44,29		%sd	22,42		sup4t	327,4
bornf	116		lond	198		%	31,7
supd	112,3		%sf	25,49		long	88
supdt	500,7		lonf	79		R2	565
xmp	363,22		sf/lf	0,99			
r400	91,78		sr/lr	0,29			
supf	77,9		sd/ld	0,57			
supft	305,8		i.r400	0,56											

Intergen51. ecoN. Les CDS-CDS négatifs

modifier
Sous-totaux	ecoN			totale	
fréquence	x-	c-		x-	c-
 - 1		2	173		4	4140
 - 2		4	5		85	11
 - 3		2	0		3	12
 - 4		39	328		717	10938
 - 5		2	2		5	19
sp6		56	274		1642	8424
total		105	782		2,456	23,544
reste		5	10		264	420
s6		18	5		361	41
s7		10	51		321	1438
s8		23	208		696	6525
rappot s1-5						
4/2/1		9.75	1.9		8.4	2.6
% / sp6						
s6/sp6		32.1	1.8		22.0	0.5
s7/sp6		17.9	18.6		19.5	17.1
s8/sp6		41.1	75.9		42.4	77.5
reste/sp6	8.9	3.6		16.1	5.0
						
total s1-5	49	508		814	15120
% / total						
%s1-5		46.7	65.0		33.1	64.2
%sp6		53.3	35.0		66.9	35.8

Intergen51. ecoN. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		7			CDS 16s		6	2
16s 23s					5s CDS		5	2
16s tRNA	9			16 CDS			
tRNA 23s	7			CDS 5s			
5s tRNA		4			23s CDS		2	
tRNA in		4			CDS 23s			
tRNA contig	5			5s 16s			
tRNA hors	43			16s16s			
tRNA 16s		1						
23s tRNA								
tRNA 5s		4						
16s 5s								
5s 23s								
5s 5s								
total		84	0		total		13	4
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. ecoN. Les intercalaires tRNA-tRNA extra bloc

modifier
inter	aa
8	gac
**	tgg
1472	°gaa
42	°atc
2351	$atc
**	$gaa
42	gca
**	atc
Int51.31 ecoN. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa
37 cag 4 gtc 58 cgg
48 cag ** gtc 20 cac
15 atgj 12 tta 42 ctg
34 caa 53 tgc ** cca
23 caa ** ggc 8 aca
10 cta 39 gcc 116 tac
** atgj ** gcc 6 gga
35 aaa 43 gta ** acc
2 gta 46 gta 36 ggc
51 aaa 4 gta 35 ggc
3 gta ** aaa ** ggc
48 aaa 63 cgt 34 ctg
33 aaa 62 cgt 28 ctg
** aaa 62 cgt ** ctg
33 tac 64 cgt 39 gcc
** tac 3 cgt 39 gcc
4 gtc ** agc ** gcc
** gtc 33 atgf 44 gta
4 gtc 33 atgf ** gta
** gtc ** atgf 28 ctg
** ctg

Vibrio campbellii

modifier

vha opérons

modifier
vha1. Vibrio campbellii ATCC BAA-1116
45.4%GC 26.7.19 Paris 121 doubles interca cds aa avec aa cdsa cdsd
Chromosome I
comp 1..1384 16s @1 103 103
comp 1488..1604 cds 102507 39
104112..105239 cds 529 529 376 529
comp 105769..105845 atgf + 158 158
comp 106004..106079 ggc 7 ggc 35 35
comp 106115..106190 ggc 5 atgf 35 35
comp 106226..106301 ggc 18 18
comp 106320..106396 atgf 39 39
comp 106436..106511 ggc 90 90
comp 106602..106678 atgf 39 39
comp 106718..106793 ggc 18 18
comp 106812..106888 atgf 39 39
comp 106928..107003 ggc 18 18
comp 107022..107098 atgf 39 39
comp 107138..107213 ggc 156 156 156
comp 107370..107915 cds 81764 182
189680..190715 cds 101 101 345 101
comp 190817..190933 5s 107
comp 191041..193955 23s 290
comp 194246..194321 gca 43 43
comp 194365..194441 atc 97
comp 194539..196096 16s @2 371
comp 196468..196584 5s 77
comp 196662..199576 23s 290
comp 199867..199942 gca 43 43
comp 199986..200062 atc 97
comp 200160..201717 16s 853 853 853
comp 202571..204706 cds 29595 712
comp 234302..235486 cds 101 101 395 101
comp 235588..235663 acc 13 13
comp 235677..235751 gga 35 35
comp 235787..235871 tac 52 52
comp 235924..235999 aca 206 206
236206..237129 cds 4144 308
comp 241274..242467 cds 546 546 398 546
comp 243014..243090 tgg 68 68
comp 243159..243235 gac 32
comp 243268..243384 5s 117
comp 243502..246404 23s 310
comp 246715..246790 gta 30 30
comp 246821..246896 aaa 2 2
comp 246899..246974 gaa 122
comp 247097..248654 16s 554 554 554
249209..249664 cds 60596 152
310261..311296 cds 121 121 345 121
comp 311418..311508 tca 91
comp 311600..311716 5s 108
comp 311825..314739 23s 289
comp 315029..315104 gca 43 43
comp 315148..315224 atc 56
comp 315281..316842 16s 471 471 471
comp 317314..318027 cds 40242 238
358270..359305 cds 147 147 345
comp 359453..359529 gac 31
comp 359561..359677 5s 108
comp 359786..362700 23s 310
comp 363011..363086 gta 30 30
comp 363117..363192 aaa 2 2
comp 363195..363270 gaa 82
comp 363353..364914 16s 83 83 83
comp 364998..365133 cds 84252 45
449386..449521 cds 83 83 45 83
449605..451162 16s 122
451285..451360 gaa 2 2
451363..451438 aaa 9 9
451448..451523 gca 37 37
451561..451636 gta 51 51 51
comp 451688..451873 cds 16 16 62 16
451890..454804 23s 77
454882..454998 5s 32
455031..455107 gac 162 162
comp 455270..455533 cds 11718 88
comp 467252..467665 cds 361 361 138
468027..468103 cgg 35 35
468139..468214 cac 76 76
468291..468367 cca 46 46
468414..468489 cac 64 64
468554..468630 cca 194 194 194
comp 468825..469550 cds 365688 242
comp 835239..835550 cds 138 138 104 138
comp 835689..835764 atgi 145 145
comp 835910..837772 cds 182191 621
1019964..1020128 cds 119 119 55
1020248..1021805 16s 129
1021935..1022010 gcc 41 41
1022052..1022127 gaa 55 55 55
comp 1022183..1022368 cds 16 16 62 16
1022385..1025299 23s 111
1025411..1025527 5s 31
1025559..1025635 gac 35 35
1025671..1025747 tgg 3 3 3
comp 1025751..1025933 cds 225465 61
1251399..1252574 cds 158 158 392
comp 1252733..1252817 cta + 54 54
comp 1252872..1252946 caa 5 cta 46 46
comp 1252993..1253077 cta 3 atgj 21 21
comp 1253099..1253183 cta 2 caa 18 18
comp 1253202..1253278 atgj 23 23
comp 1253302..1253386 cta 70 70
comp 1253457..1253533 atgj 79 79
comp 1253613..1253687 caa 31 31
comp 1253719..1253803 cta 39 39
comp 1253843..1253919 atgj 26 26 26
comp 1253946..1254157 cds 14564 71
comp 1268722..1268862 cds 260 260 47
1269123..1269199 cca 243 243 243
comp 1269443..1269628 cds 16361 62
1285990..1286571 cds 88 88 194
comp 1286660..1286736 agg 68 68 68
comp 1286805..1287938 cds 116753 378
comp 1404692..1405552 cds 204 204 287 204
1405757..1405833 aga 244 244
1406078..1407685 cds 49950 536
1457636..1458508 cds 407 407 291
comp 1458916..1459000 tac + 100 100
comp 1459101..1459185 tac 4 tac 100 100
comp 1459286..1459370 tac @7 100 100
comp 1459471..1459555 tac 282 282 282
1459838..1460935 cds 170368 366
1631304..1631753 cds 144 144 150 144
1631898..1631985 tcc 312 312
1632298..1632684 cds 550413 129
2183098..2183436 cds 179 179 113
2183616..2183692 gtc + 46 46
2183739..2183815 gtc 2 gtc 149 149 149
2183965..2185344 cds 578546 460
comp 2763891..2766782 cds 763 763 964 763
comp 2767546..2767621 ggc + 11 11
comp 2767633..2767719 tta 2 ggc 78 78
comp 2767798..2767873 ggc 37 37
comp 2767911..2767984 tgc 400 400 400
comp 2768385..2768942 cds 82481 186
2851424..2851855 cds 62 62 144 62
2851918..2851992 gga 333 333
2852326..2852970 cds 133282 215
comp 2986253..2986402 cds 1 1 50 1
2986404..2986479 aac 372 372
2986852..2989149 cds 60873 766
3050023..3051831 cds 139 139 603 139
3051971..3052061 tca 321 321
3052383..3053693 cds 384243 437
comp 3437937..3438392 cds 233 233 152
comp 3438626..3438702 atgf 56 56
comp 3438759..3438842 ctc 18 18 18
comp 3438861..3439199 cds 113972 113
comp 3553172..3554167 cds 189 189 332 189
comp 3554357..3554433 cgt + 59 59
comp 3554493..3554569 cgt 7 cgt 57 57
comp 3554627..3554703 cgt 2 agc 57 57
comp 3554761..3554837 cgt 57 57
comp 3554895..3554971 cgt 57 57
comp 3555029..3555105 cgt 85 85
comp 3555191..3555282 agc 29 29
comp 3555312..3555388 cgt 31 31
comp 3555420..3555511 agc 243 243
comp 3555755..3555952 cds 83212 66
3639165..3640295 cds 108 108 377 108
3640404..3640479 ttc + 51 51
3640531..3640606 aca 3 ttc 7 7
3640614..3640689 ttc 2 aca 43 43
3640733..3640808 aac 2 aac 69 69
3640878..3640953 aca 10 10
3640964..3641039 ttc 42 42
3641082..3641158 aac 292 292
3641451..3643076 cds 233 233 542
3643310..3643385 ttc 51 51
3643437..3643512 aca + 21 21
3643534..3643609 aac 2 aca 39 39
3643649..3643724 aca 2 aac 15 15
3643740..3643815 aac 156 156 156
comp 3643972..3645405 cds 561 561 478 561
comp 3645967..3646043 gac 31
comp 3646075..3646191 5s 57
comp 3646249..3646324 acc 100
comp 3646425..3646541 5s 111
comp 3646653..3649567 23s -13 -13 -13
comp 3649555..3649797 cds @3 35 35 81 35
comp 3649833..3649908 gca 43 43
comp 3649952..3650028 atc 97
comp 3650126..3651683 16s 557 557 557
comp 3652241..3653491 cds 9514 417
comp 3663006..3663598 cds 181 181 198
comp 3663780..3663864 ttg 177 177 177
comp 3664042..3664707 cds 93515 222
3758223..3759258 cds 578 578 345 578
comp 3759837..3759913 gac 68
comp 3759982..3760098 5s 111
comp 3760210..3763124 23s 290
comp 3763415..3763490 gca 43 43
comp 3763534..3763610 atc 97
comp 3763708..3765265 16s 86
comp 3765351 16s début
Chromosome II
comp 673782..674186 cds 358 358 135
comp 674545..674635 tca 329 329 329
674965..675645 cds 205537 227
881183..882640 cds 244 244 486 244
882885..882958 tgc 302 302
883261..883725 cds 1229 155
884955..886649 cds 245 245 565 245
886895..886981 tta 97 97
887079..887154 ggc 5 5
887160..887233 tgc 317 317
887551..889074 cds 465 508
comp 889540..890328 cds 386 386 263
890715..890801 tta + 53 53
890855..890928 tgc 2 tgc 181 181
891110..891183 tgc 366 366 366
891550..891891 cds 443950 114
1335842..1336042 cds 17 17 17
1336060..1336134 gga 272 272
comp 1336407..1337222 cds 505333 272
1842556..1842741 cds -36 -36 62 -36
1842706..1842789 ctc 29 29 29
1842819..1843430 cds 77699 204
1921130..1921561 cds 62 62 144 62
1921624..1921698 gga 337 337
comp 1922036..1922209 cds 15660 58
comp 1937870..1939129 cds 84 84 420
comp 1939214..1939304 tca 90
comp 1939395..1939511 5s 77
comp 1939589..1942503 23s 306
comp 1942810..1942885 gta 35 35
comp 1942921..1942996 gca 24 24
comp 1943021..1943096 aaa 2 2
comp 1943099..1943174 gaa 114
comp 1943289..1944850 16s 83 83 83
comp 1944934..1945071 cds 46

vha cumuls

modifier
  • Lien tableur: vha cumuls
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.vha. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cumuls. Vibrio campbellii ATCC BAA-1116
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 11 1 0 0 1 3 1 1 100 17
16 aas 23 5s 3 20 10 5 50 8 20 5 200 17
16 atc gca 4 40 17 6 100 10 40 3 300 10
16 cds 23 5s 3 60 16 6 150 12 60 2 400 13
max a 5 80 6 1 200 9 80 3 500 6
a doubles 0 100 6 0 250 9 100 3 600 4
spéciaux 1 120 0 0 300 4 120 3 700 2
total aas 37 140 0 0 350 7 140 3 800 2
sans opérons 27 160 1 0 400 6 160 4 900 0
1 aa 14 180 0 0 450 1 180 1 1000 1
max a 12 200 1 0 500 1 200 2 1100 0
a doubles 10 0 0 8 8 0
total aas 84 57 18 78 38 72
total aas 121
remarques 3
avec jaune moyenne 30 266
variance 19 199
sans jaune moyenne 46 183 86 240
variance 25 114 59 178

vha tRNA-cds

modifier
  • Note: intercalaires prélevés de la colonne cds de vha opérons dans un bloc de tRNAs uniquement. Le début du bloc est dans l'ordre des adresses, deb intercalaire entre le cds et le 1er tRNA dd bloc, fin entre le dernier tRNA et le cds terminal. J'ai procédé, dans les colonnes petit et grand, à la réorientation des blocs d'après la constatation que les blocs à rRNA ont leurs cds de début et de fin sont orientés du cds-16s au 5s-tRNAs-cds, l'intercalaire cds-16s étant plus grands que l'intercalaire avec le cds terminal. En tête de colonne est le % du nombre des intercalaires inférieurs à 201 pbs.
vha	56			37			22			70
deb	fin		deb	fin		grand	petit		grand	petit
-36	29		233	18		29	-36		29	-36
1	372		158	26		88	68		372	1
17	272		-36	29		145	138		272	17
62	333		88	68		158	26		233	18
62	337		138	145		179	149		158	26
88	68		179	149		181	177		333	62
101	206		233	156		206	101		337	62
108	292		529	156		233	18		88	68
138	145		181	177		233	156		206	101
139	321		361	194		243	189		292	108
144	312		101	206		244	204		145	138
158	26		189	243		260	243		321	139
179	149		260	243		272	17		312	144
181	177		204	244		292	108		179	149
189	243		17	272		302	244		233	156
204	244		407	282		312	144		529	156
233	18		108	292		317	245		181	177
233	156		244	302		321	139		243	189
244	302		144	312		333	62		361	194
245	317		245	317		337	62		244	204
260	243		139	321		358	329		260	243
358	329		358	329		361	194		302	244
361	194		62	333		372	1		317	245
386	366		62	337		386	366		407	282
407	282		386	366		407	282		358	329
529	156		1	372		529	156		386	366
763	400		763	400		763	400		763	400
  • Comparaison cds-cds tRNA-cds: deb fin, c'est l'ordre des adresses et grand petit l'ordre après réorientation. Leur pourcentage est calculé par rapport à la colonne, c'est-à-dire la moitié du total des tRNA-cds.
gama	cds total	total	<0	0-200	201-370	371-600	>600	deb	fin	grand	petit
vha	5,432		54	1	24	23	5	1	14	10	6	18
‰				19	444	426	93	19	519	370	222	667

vha blocs

modifier
vha1. Vibrio campbellii ATCC BAA-1116, blocs à rRNA.
cds 853 cds 471 cds 103
16s 97 16s 56 16s 86
atc 43 atc 43 16s 97
gca 290 gca 289 atc 43
23s 77 23s 108 gca 290
5s 371 5s 91 23s 111
16s 97 tca 121 5s 68
atc 43 cds gac 578
gca 290 cds
23s 107
5s 101
cds
cds 554 cds 83 cds 119
16s 122 16s 82 16s 129
gaa 2 gaa 2 gcc 41
aaa 30 aaa 30 gaa 55
gta 310 gta 310 cds 16
23s 117 23s 108 23s 111
5s 32 5s 31 5s 31
gac 68 gac 147 gac 35
tgg 546 cds tgg 3
cds cds
cds 83 cds 83 cds 557
16s 114 16s 122 16s 97
gaa 2 gaa 2 atc 43
aaa 24 aaa 9 gca 35
gca 35 gca 37 cds -13
gta 306 gta 51 23s 111
23s 77 cds 16 5s 100
5s 90 23s 77 acc 57
tca 84 5s 32 5s 31
cds gac 162 gac 561
cds cds

vha remarques

modifier
  • A faire, en comparaison avec vpb
  • Note du 4.10.20: contrôle des cds, 0/3 cds dans NCBI du 1.8.20

vha distribution

modifier
  • Lien tableur: vha distribution
  • Notes:
    - gtc2 cta2 tac4 tgc2 cgt6 ggc3
    - acc: 5s + >1aa
    - tca: 2 5s+ 2 1aa
    - gga: 1>a + 3 1aa
    - Séquences:
    (cac cca)2
    cgt5 (cgt agc)2
    ttc (aca aac)2
    (atgf ggc) ggc2 (atgf ggc)4
    ttc aca (ttc aac) aca (ttc aac)
Gm6 vha, Vibrio campbellii ATCC BAA-1116. gama
g1    t1       
atgi 1 tct tat atgf 8
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 4 tcc 1 tac 5 tgc 5
atc 5 acc 2 aac 5 agc 2
ctc 2 ccc cac 2 cgt 7
gtc 2 gcc 1 gac 6 ggc 8
tta 3 tca 4 taa tga
ata aca 5 aaa 4 aga 1
cta 5 cca 3 caa 2 cga
gta 4 gca 7 gaa 5 gga 4
ttg 1 tcg tag tgg 2
atgj 3 acg aag agg 1
ctg ccg cag cgg 1
gtg gcg gag ggg
gama >1aa =1aa -5s +5s -16s +16s total
vha 70 14 11 26 121

vha1. Intergen51

modifier

Intergen51. vha1. Le génome

modifier
  • vha1 Le prélèvement: gama
  • Le nom et le lien NCBI: vha1, Vibrio campbellii ATCC BAA-1116 chromosome I, NCBI [76], date 12.12.21.
  • vha1 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
vha1	499,733		3,765,351	13.3	
vha1 données intercalaires
modifier
vha1 données intercalaires 200
modifier
vha1 autres intercalaires aas
modifier

Intergen51. vha1. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. vha1 les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vha1 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,936 402 9 2,347 2.4 104 8 112
x 931 25 3 959 0 3 3
t 2,867 427 12 3,306 104 11 115
% 86.7 12.9 0.4
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 29 0 0 29 1.6 tRNA-CDS 47 25
x 18 0 0 18 RNA-RNA 104 55
t 47 0 0 47 CDS-rRNA 11 6
% 100.0 0.0 0.0 non RNA 28 15
- total 190 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.5 13.8 0.0 27.5 3.4 60 0.4 0.0
x 13.4 22.2 0.0 4.6 0.0 36 0.3 0.0

Intergen51. vha1. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: vha1 données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vha1 fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vha1 fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	vha1
R2	x3		x2		x		c		Inflexion poly3	x	c
0.625	4.79E-06	-3.09E-03	4.70E-01	15.50	fx1	abscisse	82.7	189.0
0.796	-5.34E-06	4.01E-03	-1.01E+00	96.9	fc1	ordonnée	40.9	20.1
								
0.736	8.54E-07	-2.12E-04	-1.61E-01	55.2	fx41			
0.929	1.23E-06	-7.00E-04	-8.87E-04	37.0	fc41
  • Le rfin après 400 est de 146 sur un total de 1945. Jusqu'à 1% les freq10 sont en continu jusqu'à 700, reste 19. L'indice i.rfin1 = 127/300 = 0.423.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	vha1		calculs			poly3	vha1
effect	1945		R2.21	757		abscis	400
xm	45		pte	8,98		flexa	179
ym	5		cste	2,97		flexo	2,08
x1m	220		r400l	180		xm	43
y1m	1		restp	203,08		sup4	150,2
rfin	75,06		%sd	38,71		sup4t	407,2
bornf	158		lond	175		%	36,9
supd	181,5		%sf	39,67		long	136
supdt	468,9		lonf	113		R2	475
xmp	328,02		sf/lf	1,25			
r400	128,02		sr/lr	0,65			
supf	141,3		sd/ld	1,04			
supft	356,3		i.r400	0,71						

Intergen51. vha1. Les CDS-CDS négatifs

modifier
Sous-totaux	vha1			totale	
fréquence	x-	c-		x-	c-
 - 1		0	98		4	4140
 - 2		0	0		85	11
 - 3		0	2		3	12
 - 4		9	141		717	10938
 - 5		0	1		5	19
sp6		16	160		1642	8424
total		25	402		2,456	23,544
reste		0	0		264	420
s6		7	0		361	41
s7		1	27		321	1438
s8		8	133		696	6525
rappot s1-5						
4/2/1		-	1.4		8.4	2.6
% / sp6						
s6/sp6		43.8	0.0		22.0	0.5
s7/sp6		6.3	16.9		19.5	17.1
s8/sp6		50.0	83.1		42.4	77.5
reste/sp6	0.0	0.0		16.1	5.0
						
total s1-5	9	242		814	15120
% / total						
%s1-5		36.0	60.2		33.1	64.2
%sp6		64.0	39.8		66.9	35.8

Intergen51. vha1. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		9			CDS 16s		6	2
16s 23s					5s CDS			1
16s tRNA	9			16 CDS			
tRNA 23s	9			CDS 5s			
5s tRNA		8			23s CDS			
tRNA in		13			CDS 23s			
tRNA contig	2			5s 16s		1	
tRNA hors	53			16s16s		1	
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		104	0		total		8	3

  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. vha1. Les intercalaires tRNA-tRNA extra bloc

modifier
contig	aa
68	tgg
**	gac
35	gac
**	tgg
Int51.31 vha1. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa
158 atgf 54 cta 59 cgt
35 ggc 46 caa 57 cgt
35 ggc 21 cta 57 cgt
18 ggc 18 cta 57 cgt
39 atgf 23 atgj 57 cgt
90 ggc 70 cta 85 cgt
39 atgf 79 atgj 29 agc
18 ggc 31 caa 31 cgt
39 atgf 39 cta ** agc
18 ggc ** atgj 51 ttc
39 atgf 100 tac 7 aca
** ggc 100 tac 43 ttc
13 acc 100 tac 69 aac
35 gga ** tac 10 aca
52 tac 46 gtc 42 ttc
** aca ** gtc ** aac
35 cgg 11 ggc 51 ttc
76 cac 78 tta 21 aca
46 cca 37 ggc 39 aac
64 cac ** tgc 15 aca
** cca 56 atgf ** aac
** ctc

vha2. Intergen51

modifier

Intergen51. vha2. Le génome

modifier
  • vha2 Le prélèvement: gama
  • Le nom et le lien NCBI: vha2, Vibrio campbellii ATCC BAA-1116 chromosome II, NCBI [77], date 12.12.21.
  • vha2 La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
vha2	317,649		2,204,018	14.4		
vha2 données intercalaires
modifier
vha2 données intercalaires 200
modifier
vha2 autres intercalaires aas
modifier

Intergen51. vha2. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. vha2 les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 vha2 les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 1,059 227 16 1,302 1.8 11 1 12
x 688 25 1 714 0 0 0
t 1,747 252 17 2,016 11 1 12
% 86.7 12.5 0.8
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 9 1 0 10 2.0 tRNA-CDS 15 45
x 5 0 0 5 RNA-RNA 11 33
t 14 1 0 15 CDS-rRNA 1 3
% 93.3 6.7 0.0 non RNA 6 18
- total 33 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 7.8 10.0 0.0 25.1 10.0 62 1.2 0.0
x 13.9 0.0 0.0 6.1 0.0 20 0.1 0.0

Intergen51. vha2. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: vha2 données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées vha2 fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. vha2 fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	vha2
R2	x3		x2		x		c		Inflexion poly3	x	c
0.661	4.10E-06	-2.65E-03	3.97E-01	17.80	fx1	abscisse	155.6	197,2	
0.763	-3.90E-06	3.05E-03	-8.11E-01	85.8	fc1	ordonnée	28.4	19,4
								
0.742	1.39E-06	-6.49E-04	-4.87E-02	46.5	fx41	
0.800	2,02E-06	-1,19E-03	9,37E-02	31.8	fc31
  • Le rfin après 400 est de 84 sur un total de 1075. Jusqu'à 1% les freq10 sont en continu jusqu'à 740, reste 11. L'indice i.rfin1 = 73/340 = 0.215.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	vha2		calculs			poly3	vha2
effect	1075		R2.21	577		abscis	400
xm	35		pte	0,02		flexa	191
ym	1,08		cste	1,01		flexo	1,96
x1m	238		r400l	162		xm	35
y1m	1		restp	201,86		sup4	196,1
rfin	78,14		%sd	66,00		sup4t	448,4
bornf	158		lond	203		%	43,7
supd	343,8		%sf	70,46		long	156
supdt	520,9		lonf	123		R2	316
xmp	277,21		sf/lf	2,24			
r400	123,72		sr/lr	0,85			
supf	276,0		sd/ld	1,69			
supft	391,6		i.r400	0,76									

Intergen51. vha2. Les CDS-CDS négatifs

modifier
Sous-totaux	vha2			totale	
fréquence	x-	c-		x-	c-
 - 1		0	62		4	4140
 - 2		2	0		85	11
 - 3		0	0		3	12
 - 4		3	77		717	10938
 - 5		0	1		5	19
sp6		20	87		1642	8424
total		25	227		2,456	23,544
reste		0	0		264	420
s6		7	0		361	41
s7		1	12		321	1438
s8		12	75		696	6525
rappot s1-5						
4/2/1		1.5	1.2		8.4	2.6
% / sp6						
s6/sp6		35.0	0.0		22.0	0.5
s7/sp6		5.0	13.8		19.5	17.1
s8/sp6		60.0	86.2		42.4	77.5
reste/sp6	0.0	0.0		16.1	5.0
						
total s1-5	5	140		814	15120
% / total						
%s1-5		20.0	61.7		33.1	64.2
%sp6		80.0	38.3		66.9	35.8

Intergen51. vha2. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		1			CDS 16s		1	
16s 23s					5s CDS			
16s tRNA	1			16 CDS			
tRNA 23s	1			CDS 5s			
5s tRNA		1			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	4			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s								
16s 5s								
5s 23s								
5s 5s								
total		11	0		total		1	0
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. vha2. Les intercalaires tRNA-tRNA extra bloc

modifier
hors b	aa
97	tta
5	ggc
**	tgc
53	tta
181	tgc°
**	tgc°

Aeromonas media WS

modifier

amed opérons

modifier
amed1. Aeromonas media WS
61.2%GC 25.7.19 Paris 126 doubles interca cds aa avec aa cdsa cdsd
6590..7159 cds 3 190
comp 7163..8359 cds 512 512 399
8872..10421 16s 66
10488..10564 atc 10 10
10575..10650 gca 231
10882..13800 23s 98
13899..14013 5s 386 386 386
14400..14717 cds 102422 106
117140..117850 cds 47 47 237 47
117898..117973 ttc 52 52
118026..118101 aca 3 3
118105..118180 ttc 45 45
118226..118301 aac 252 252
118554..119573 cds 50489 340
comp 170063..170329 cds 103 103 89 103
comp 170433..170518 ctg + 71 71
comp 170590..170675 ctg 5 ctg 46 46
comp 170722..170807 ctg 46 46
comp 170854..170939 ctg 51 51
comp 170991..171076 ctg 116 116
comp 171193..172653 cds 146173 487
318827..320692 cds 190 190 622 190
320883..320959 atgi 244 244
comp 321204..323780 cds 62601 859
386382..386732 cds 514 514 117
387247..388802 16s 268
389071..389146 gaa 245
389392..392312 23s 104
392417..392531 5s 268 268 268
comp 392800..394413 cds 81847 538
476261..476482 cds 64 64 74 64
comp 476547..476622 aac 5 5
comp 476628..476703 ttc 622 622
477326..477547 cds 22721 74
500269..500814 cds 177 177 182 177
500992..501067 ggc + 24 24
501092..501167 ggc 6 ggc 29 29
501197..501272 ggc 38 38
501311..501386 ggc 25 25
501412..501487 ggc 23 23
501511..501586 ggc 363 363
comp 501950..502159 cds 4810 70
506970..507110 cds 236 236 47 236
507347..507422 gcc + 28 28
507451..507526 gcc 5 gcc 66 66
507593..507668 gcc 58 58
507727..507802 gcc 40 40
507843..507918 gcc 471 471
508390..508473 riboswitch @1 134002 28
642476..642802 cds 9 9 109 9
642812..642896 ctc 91 91
642988..643064 atgf 166 166
643231..643689 cds 128528 153
772218..774050 cds 195 195 611 195
comp 774246..774329 cta + 8 8
comp 774338..774414 atg 3 atg 38 38
comp 774453..774527 caa 4 caa 47 47
comp 774575..774649 caa 17 17
comp 774667..774743 atg 35 35
comp 774779..774853 caa 47 47
comp 774901..774975 caa 13 13
comp 774989..775065 atg 235 235
comp 775301..776392 cds 3148 364
comp 779541..780557 cds 104 104 339 104
comp 780662..780736 caa -21 -21 -21
comp 780716..781612 cds 373301 299
comp 1154914..1155384 cds 131 131 157 131
comp 1155516..1155592 ccc 226 226
comp 1155819..1157162 cds 67691 448
comp 1224854..1226290 cds 301 301 479
comp 1226592..1226667 aac 2 2
comp 1226670..1226744 gga 164 164 164
comp 1226909..1227181 cds 13604 91
comp 1240786..1241733 cds 350 350 316
comp 1242084..1242156 aac + 2 2
comp 1242159..1242234 aac 2 aac 49 49 49
1242284..1242496 cds 294 71
1242791..1244527 cds 181 181 579 181
1244709..1244796 tcc 407 407
1245204..1246064 cds 161293 287
comp 1407358..1408338 cds 410 410 327
comp 1408749..1408836 tcc 177 177 177
comp 1409014..1409631 cds 34595 206
1444227..1444688 cds 146 146 154
1444835..1444922 tcc 127 127 127
1445050..1446834 cds 14349 595
comp 1461184..1462401 cds 163 163 406 163
comp 1462565..1462640 cac 124 124
comp 1462765..1462838 aga 240 240
comp 1463079..1464389 cds 61984 437
comp 1526374..1527606 cds 151 151 411 151
comp 1527758..1527833 cac 123 123
comp 1527957..1528033 aga 36 36
comp 1528070..1528146 cca 203 203
1528350..1529207 cds 60230 286
1589438..1589644 cds 138 138 69
comp 1589783..1589858 aac 132 132 132
1589991..1592003 cds 57434 671
1649438..1651867 cds 104 104 810 104
comp 1651972..1652048 gtc + 36 36
comp 1652085..1652161 gtc 5 gtc 26 26
comp 1652188..1652264 gtc 15 15
comp 1652280..1652356 gtc 11 11
comp 1652368..1652444 gtc 170 170
comp 1652615..1653994 cds 277443 460
comp 1931438..1932934 cds 145 145 499 145
comp 1933080..1933156 atgf + 110 110
comp 1933267..1933343 atgf 9 atgf 102 102
comp 1933446..1933522 atgf @2 101 101
comp 1933624..1933700 atgf 101 101
comp 1933802..1933877 atgf 103 103
comp 1933981..1934057 atgf 102 102
comp 1934160..1934236 atgf 102 102
comp 1934339..1934415 atgf 92 92
comp 1934508..1934584 atgf 268 268
comp 1934853..1935572 cds 490897 240
comp 2426470..2427675 cds 350 350 402
comp 2428026..2428112 tta 40 40
comp 2428153..2428226 tgc 35 35
comp 2428262..2428337 ggc 181 181 181
comp 2428519..2429073 cds 117921 185
comp 2546995..2547534 cds 271 271 180 271
2547806..2547882 ccc 1103 1103
2548986..2550593 cds 107760 536
2658354..2659094 cds 87 87 247 87
2659182..2659257 acg 108 108
< comp 2659366..2659705 cds 198821 113
comp 2858527..2859036 cds 126 126 170
2859163..2859247 tac + 30 30
2859278..2859362 tac 2 tac 121 121 121
comp 2859484..2863335 cds 115303 1284
2978639..2979358 cds 119 119 240 119
comp 2979478..2979552 gga 104 104
comp 2979657..2979730 ggg 201 201
2979932..2981701 cds 41492 590
3023194..3023487 cds 75 75 98 75
comp 3023563..3023636 tgc 57 57
comp 3023694..3023769 ggc 248 248
3024018..3027455 cds 17375 1146
3044831..3045361 cds 133 133 177 133
comp 3045495..3045584 tcg 380 380
3045965..3046882 cds 221147 306
comp 3268030..3268398 cds 318 318 123
comp 3268717..3268804 tca 198 198 198
3269003..3269752 cds 20717 250
3290470..3291624 cds 50 50 385 50
3291675..3291751 agg 126 126
comp 3291878..3292804 cds 41865 309
3334670..3335758 cds 230 230 363
3335989..3336073 tac + 32 32
3336106..3336190 tac 3 tac 45 45
3336236..3336320 tac 135 135 135
3336456..3336731 cds 169091 92
comp 3505823..3506272 cds 275 275 150 275
comp 3506548..3506662 5s 101
comp 3506764..3509682 23s 229
comp 3509912..3509987 gaa 218
comp 3510206..3511760 16s 592 592
3512353..3515220 cds 161083 956
comp 3676304..3677323 cds 113 113 340
comp 3677437..3677521 ttg 49 49 49
3677571..3678182 cds 9862 204
3688045..3688872 cds 369 369 276
comp 3689242..3689318 cgt + 25 25
comp 3689344..3689420 cgt 5 cgt 25 25
comp 3689446..3689522 cgt 26 26
comp 3689549..3689625 cgt 98 98
comp 3689724..3689800 cgt 4 4
comp 3689805..3689897 agc 213 213 213
comp 3690111..3690299 cds 196546 63
3886846..3887601 cds 302 302 252 302
comp 3887904..3887980 gac 98
comp 3888079..3888193 5s 105
comp 3888299..3891217 23s 231
comp 3891449..3891524 gca 10 10
comp 3891535..3891611 atc 66
comp 3891678..3893232 16s 420 420
comp 3893653..3894195 cds 18750 181
comp 3912946..3913317 cds 60 60 124
comp 3913378..3913454 tgg 52 52 52
comp 3913507..3914691 cds @3 171 171 395 171
comp 3914863..3914937 gga 38 38
comp 3914976..3915060 tac 263 263
3915324..3916262 cds 45900 313
comp 3962163..3963533 cds 306 306 457
comp 3963840..3963916 tgg 202 202 202
3964119..3964703 cds 59641 195
comp 4024345..4026816 cds 658 658 824
comp 4027475..4027551 ccg 140 140 140
comp 4027692..4028417 cds 80995 242
4109413..4111986 cds 99 99 858
comp 4112086..4112200 5s 101
comp 4112302..4115220 23s 231
comp 4115452..4115527 gaa 192
comp 4115720..4117273 16s 94 94 94
comp 4117368..4117547 cds 32227 60
comp 4149775..4150248 cds 204 204 158 204
comp 4150453..4150529 cca 58 58
comp 4150588..4150673 ctg 20 20
comp 4150694..4150769 cac 49 49
comp 4150819..4150895 cgg 258 258
4151154..4151744 cds 74862 197
4226607..4227725 cds 428 428 373
4228154..4229708 16s 192
4229901..4229976 gaa 229
4230206..4233124 23s 104
4233229..4233343 5s 106
4233450..4233525 acc 23
4233549..4233663 5s 164 164 164
4233828..4234793 cds 119351 322
comp 4354145..4355686 cds 622 622 514
4356309..4357863 16s 268
4358132..4358207 gaa 230
4358438..4361364 23s 102
4361467..4361581 5s 106
4361688..4361763 acc 233 233 233
4361997..4363241 cds 71363 415
4434605..4435198 cds 465 465 198
4435664..4437217 16s 219
4437437..4437512 gaa 229
4437742..4440657 23s 103
4440761..4440875 5s 98
4440974..4441050 gac 167 167 167
4441218..4442054 cds 39919 279
comp 4481974..4482513 cds 477 477 180
4482991..4484545 16s 513
4485059..4485549 23s° 37
comp 4485587..4486115 23s° 229
comp 4486345..4486419 gaa 218
comp 4486638..4488193 16s 94 94 94
comp 4488288..4488509 cds 72132 74
comp 4560642..4561676 cds 192 192 345
comp 4561869..4561944 gta + 18 18
comp 4561963..4562038 aaa 7 gta 34 34
comp 4562073..4562148 gta 5 aaa 18 18
comp 4562167..4562242 aaa 2 aag 23 23
comp 4562266..4562341 gta 18 18
comp 4562360..4562435 aaa 23 23
comp 4562459..4562534 gta 18 18
comp 4562553..4562628 aaa 34 34
comp 4562663..4562738 gta 22 22
comp 4562761..4562836 aag 46 46
comp 4562883..4562958 gta 22 22
comp 4562981..4563056 aag 46 46
comp 4563103..4563178 gta 32 32
comp 4563211..4563286 aaa 174 174 174
comp 4563461..4564276 cds 70895 272
comp 4635172..4636173 cds 275 275 334 275
comp 4636449..4636525 gac 95
comp 4636621..4636735 5s 101
comp 4636837..4639756 23s 231
comp 4639988..4640063 gca 10 10
comp 4640074..4640150 atc 66
comp 4640217..4641771 16s 512 512
4642284..4643480 cds 3 399
comp 4643484..4644053 cds 190

amed cumuls

modifier
  • Lien tableur: amed cumuls
  • Note: Les statistiques sur les intercalaires entre tRNA ne sont pas correctes. Se reporter à intergen51.amed. Il n'y a aucun commentaire sur les CDS. J'ai réduit le tableau aux clusters à rRNA. L'intitulé opéron doit d'être compris dans le sens cluster ou bloc de RNA, rRNA ou tRNA.
cumuls. Aeromonas media WS
opérons Fréquences intercalaires tRNAs Fréquences intercalaires cds Fréquences aas cds
effectif gammes sans rRNAs avec rRNAs gammes cds gammes cdsd gammes cdsa
avec rRNA opérons 10 1 0 - 1 1 40 1 100 14
16 gaa 23 5s 6 20 15 50 5 60 5 200 21
16 atc gca 3 40 27 100 8 80 2 300 15
16 23 5s 0 60 14 150 19 100 3 400 18
max a 3 80 2 200 17 120 4 500 11
a doubles 0 100 3 250 13 140 7 600 6
spéciaux 1 120 8 300 8 160 2 700 3
total aas 18 140 2 350 6 180 8 800 0
sans opérons 38 160 0 400 4 200 5 900 4
1 aa 16 180 0 450 4 220 3 1000 1
max a 14 200 0 500 3 240 2 1100 0
a doubles 12 0 8 6 2
total aas 109 71 0 96 48 95
total aas 127
remarques 3
avec jaune moyenne 49 156
variance 34 77
sans jaune moyenne 214 274
variance 122 157

amed blocs

modifier
A1. Aeromonas media WS, blocs à rRNA.
cds 512 cds 302 cds 275
16s 66 gac 98 gac 95
atc 10 5s 105 5s 101
gca 231 23s 231 23s 231
23s 98 gca 10 gca 10
5s 386 atc 66 atc 66
16s 420 16s 512
cds 514 275 99
16s 268 101 101
gaa 245 229 231
23s 104 218 192
5s 268 592 94
cds 428 cds 622 cds 465
16s 192 16s 268 16s 219
gaa 229 gaa 230 gaa 229
23s 104 23s 102 23s 103
5s 106 5s 106 5s 98
acc 23 acc 233 gac 167
5s 164

amed remarques

modifier
  • A faire

amed distribution

modifier
  • Lien tableur: amed distribution
  • Notes:
    - gtc5 ctg5 gcc5 tac3+2 aac2 caa2+2 atgf9 cgt5 ggc6
    - Séquences
    (atgj caa2)2
    (gta aaa)4 (gta aag)2 gta aaa
Gm7 amed, Aeromonas media WS. gama
g1    t1       
atgi 1 tct tat atgf 10
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc 3 tac 6 tgc 2
atc 3 acc 2 aac 6 agc 1
ctc 1 ccc 2 cac 3 cgt 5
gtc 5 gcc 5 gac 3 ggc 8
tta 1 tca 1 taa tga
ata aca 1 aaa 5 aga 2
cta 1 cca 2 caa 5 cga
gta 7 gca 3 gaa 7 gga 3
ttg 1 tcg 1 tag tgg 2
atgj 3 acg 1 aag 2 agg 1
ctg 6 ccg 1 cag cgg 1
gtg gcg gag ggg 1
gama >1aa =1aa -5s +5s -16s +16s total
amed 93 16 5 13 127

amed autres intercalaires

modifier

amed. Intergen51

modifier

Intergen51. amed. Le génome

modifier
  • amed Le prélèvement: alpha gama
  • Le nom et le lien NCBI: amed, Aeromonas media WS chromosome, NCBI [81], date 15.1.22.
  • amed La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom	intercals	génome		taux en %			
amed	601,332		4,777,154	12.6
amed données intercalaires
modifier
amed données intercalaires 200
modifier
amed autres intercalaires aas
modifier

Intergen51. amed. Les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. amed les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
Int51.2 amed les différents types d'intercalaires entre gène
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 2,370 444 12 2,826 2.0 106 8 114
x 1,341 42 2 1,385 0 8 8
t 3,711 486 14 4,211 106 16 122
% 88.1 11.5 0.3
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 53 1 0 54 2.2 tRNA-CDS 79 33
x 25 0 0 25 RNA-RNA 106 44
t 78 1 0 79 CDS-rRNA 16 7
% 98.7 1.3 0.0 non RNA 38 16
- total 239 100
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
type S+ R+ S- S+ R+ S- S+ R+
c 4.6 11.1 1.4 21.1 1.9 68 0.4 0.0
x 8.2 4.0 9.5 6.0 0.0 21 0.1 0.0

Intergen51. amed. Les diagrammes CDS-CDS positifs

modifier
  • Lien tableur: amed données intercalaires
  • Diagrammes des gamma:
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées amed fc40
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées. amed fx1
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41	amed
R2	x3		x2		x		c		Inflexion poly3	x	c
0.603	4.21E-06	-2.73E-03	3.91E-01	23.20	fx1	abscisse	366.7	185.9
0.856	-1.07E-06	1.09E-03	-4.42E-01	71.9	fc1	ordonnée	7.2	23.7
								
0.777	-1.00E-06	1.10E-03	-4.62E-01	78.0	fx41			
0.902	2.15E-06	-1.20E-03	-4.04E-02	43.9	fc41
  • Le rfin après 400 est de 109 sur un total de 2382. Jusqu'à 1% les freq10 sont en continu jusqu'à 700, reste 23. L'indice i.rfin1 = 86/340 = 0.287.
  • Moyennes glissantes fc+400, diagonale. Voir le détail des calculs dans abs.
données	amed		calculs			poly3	amed
effect	2382		R2.21	760		abscis	400
xm	45		pte	10,48		flexa	162
ym	7		cste	3,41		flexo	2,68
x1m	230		r400l	170		xm	45
y1m	1		restp	166,67		sup4t	150,3
rfin	45,76		%sd	39,58		sup4t	447,5
bornf	138		lond	185		%	33,6
supd	224,2		%sf	41,00		long	117
supdt	566,3		lonf	93		R2	674
xmp	267,00		sf/lf	1,68			
r400	120,91		sr/lr	0,74			
supf	155,9		sd/ld	1,21			
supft	380,4		i.r400	0,71									

Intergen51. amed. Les CDS-CDS négatifs

modifier
Sous-totaux	amed			totale	
fréquence	x-	c-		x-	c-
 - 1		0	91		4	4140
 - 2		1	0		85	11
 - 3		0	0		3	12
 - 4		8	212		717	10938
 - 5		0	0		5	19
sp6		33	141		1642	8424
total		42	444		2,456	23,544
reste		4	6		264	420
s6		8	0		361	41
s7		9	33		321	1438
s8		12	102		696	6525
rappot s1-5						
4/2/1		8	2.3		8.4	2.6
% / sp6						
s6/sp6		24.2	0.0		22.0	0.5
s7/sp6		27.3	23.4		19.5	17.1
s8/sp6		36.4	72.3		42.4	77.5
reste/sp6	12.1	4.3		16.1	5.0
						
total s1-5	9	303		814	15120
% / total						
%s1-5		21.4	68.2		33.1	64.2
%sp6		78.6	31.8		66.9	35.8

Intergen51. amed. Les intercalaires des blocs

modifier
  • Le détail
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		9			CDS 16s		5	6
16s 23s					5s CDS		3	2
16s tRNA	10			16 CDS			
tRNA 23s	9			CDS 5s			
5s tRNA		5			23s CDS			
tRNA in		3			CDS 23s			
tRNA contig				5s 16s			
tRNA hors	69			16s16s			
tRNA 16s								
23s tRNA								
tRNA 5s		1						
16s 5s								
5s 23s								
5s 5s								
total		106	0		total		8	8
  • Les rares voir gamma pour la longueur des intercalaires
  • Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.

Intergen51. amed. Les intercalaires tRNA-tRNA extra bloc

modifier
Int51.31 amed. Les intercalaires tRNA-tRNA hors blocs
inter aa    inter aa    inter aa    inter aa    inter aa
52 ttc 28 gcc 36 gtc 30 tac 58 cca
3 aca 66 gcc 26 gtc ** tac 20 ctg
45 ttc 58 gcc 15 gtc 104 gga 49 cac
** aac 40 gcc 11 gtc ** ggg ** cgg
71 ctg ** gcc ** gtc 57 tgc 18 gta
46 ctg 91 ctc 110 atgf ** ggc 34 aaa
46 ctg ** atgf 102 atgf 32 tac 18 gta
51 ctg 8 cta 101 atgf 45 tac 23 aaa
** ctg 38 atgj 101 atgf ** tac 18 gta
5 aac 47 caa 103 atgf 25 cgt 23 aaa
** ttc 17 caa 102 atgf 25 cgt 18 gta
24 ggc 35 atgj 102 atgf 26 cgt 34 aaa
29 ggc 47 caa 92 atgf 98 cgt 22 gta
38 ggc 13 caa ** atgf 4 cgt 46 aag
25 ggc ** atgj 40 tta ** agc 22 gta
23 ggc 2 aac 35 tgc 38 gga 46 aag
** ggc ** gga ** ggc ** tac 32 gta
123 cac ** aaa
36 aga
** cca

gamma synthèse

modifier

gamma distribution par génome

modifier
gamma. distribution par génome
gama >1aa 1aa -5s +5s -16s +16s duplica 1-3aas total
spl 46 8 6 79 3 142
vpb 60 11 21 22 12 126
vha 51 14 26 19 11 121
amed 47 16 13 46 5 127
eal 25 23 10 23 4 85
eco 20 23 10 29 4 86
ecoN 20 34 17 44 6 121
total 269 129 0 0 0 103 262 45 808

gamma distribution du total

modifier
  • Lien tableur: gamma distribution du total
  • Notes: dans le tableau de droite gaa comprend 33 +16s et 1 +5s.
  • Légende:
    - Couleurs du 1er tableau: voir bacilli
    - Couleurs du 2ème tableau: d'après les couleurs du pieds du tableau
    - Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
Gamma. Distribution du total.
gamma. Distribution du total sans +16s +5s
g1    t1       
atgi 11 tct tat atgf 48
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc 21 tcc 14 tac 30 tgc 18
atc 3 acc 6 aac 34 agc 11
ctc 9 ccc 6 cac 12 cgc 40
gtc 21 gcc 16 gac 7 ggc 46
tta 14 tca 12 taa tga 4
ata aca 19 aaa 33 aga 10
cta 24 cca 14 caa 23 cga
gta 34 gca gaa 17 gga 14
ttg 7 tcg 4 tag tgg 4
atgj 19 acg 4 aag 2 agg 7
ctg 21 ccg 4 cag 6 cgg 7
gtg gcg gag ggg 4
gama7 >1aa 1aa -5s +5s -16s +16s total
type 531 129 0 0 0 0 660
gamma. Distribution du total. +16s +5s (1-3aas)
g1    t1       
atgi tct tat atgf 0
att act aat agt
ctt cct cat cgt
gtt gct gat ggt
ttc tcc tac tgc
atc 23 acc 9 aac agc
ctc ccc cac cgc
gtc gcc 2 gac 23 ggc
tta tca 4 taa tga
ata aca aaa 8 aga
cta cca caa cga
gta 8 gca 29 gaa 34 gga
ttg tcg tag tgg 8
atgj acg aag agg
ctg ccg cag cgg
gtg gcg gag ggg
gama7 >1aa 1aa -5s +5s -16s +16s total
type 45 103 148
gamma. indices du 27.5.20 1183 génomes
g1 t1 1183 86713 1,5  0
atgi 130 tct 1,7 tat 1,3 atgf 292
att 0,1 act 0,5 aat 0,2 agt
ctt 0,9 cct cat cgc
gtt 0,5 gct gat ggt 0,5
ttc 175 tcc 152 tac 227 tgc 114
atc 285 acc 155 aac 311 agc 106
ctc 102 ccc 86 cac 115 cgt 298
gtc 173 gcc 167 gac 289 ggc 351
tta 120 tca 140 taa 1,0 tga 64
ata 0,8 aca 141 aaa 377 aga 151
cta 128 cca 141 caa 189 cga 13
gta 321 gca 283 gaa 324 gga 114
ttg 103 tcg 83 tag 2,7 tgg 113
atgj 170 acg 71 aag 24 agg 110
ctg 252 ccg 62 cag 102 cgg 100
gtg 8,3 gcg 6,9 gag 7,6 ggg 72
inter max min total

gamma distribution par type

modifier
Gamma. Distribution par type.
gamma. distribution des solitaires
g1    t1          
atgi 9 tct tat atgf 6
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 7 tcc 14 tac tgc 1
atc 1 acc 1 aac 14 agc
ctc 5 ccc 6 cac cgt
gtc gcc gac 3 ggc
tta tca 10 taa tga 4
ata aca aaa aga 6
cta cca 2 caa 1 cga
gta gca gaa 4 gga 4
ttg 7 tcg 4 tag tgg 2
atgj acg 4 aag agg 7
ctg ccg 4 cag cgg
gtg gcg gag ggg 3
gama7 1aa 129
gamma. distribution du type >1aa sans duplicata.
g1    t1          
atgi 2 tct tat atgf 18
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 14 tcc tac 6 tgc 15
atc acc 5 aac 11 agc 11
ctc 4 ccc cac 12 cgt 2
gtc 2 gcc 2 gac ggc 17
tta 14 tca taa tga
ata aca 19 aaa 15 aga 4
cta 18 cca 10 caa 12 cga
gta 13 gca gaa gga 10
ttg tcg tag tgg
atgj 19 acg aag 2 agg
ctg 4 ccg cag cgg 7
gtg gcg gag ggg 1
gama7 >1aa 269
gamma. distribution du type duplicata
g1    t1          
atgi tct tat atgf 24
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc tcc tac 24 tgc 2
atc 2 acc aac 9 agc
ctc ccc cac cgt 38
gtc 19 gcc 14 gac 4 ggc 29
tta tca 2 taa tga
ata aca aaa 18 aga
cta 6 cca 2 caa 10 cga
gta 21 gca gaa 13 gga
ttg tcg tag tgg 2
atgj acg aag agg
ctg 17 ccg cag 6 cgg
gtg gcg gag ggg
gama7 dupli 262

gamma par rapport au groupe de référence

modifier
Comparaison avec la référence
tRNAs blocs tRNAs blocs rRNAs
gama7 1aa >1aa dup +5s 1-3aas autres total
21 faible 37 18 39 2 96
16 moyen 51 104 31 21 52 259
14 fort 41 147 192 24 49 453
129 269 262 45 103 808
10 g+cga 15 3 6 24
2 agg+cgg 7 7 14
4 carre ccc 11 8 33 2 54
5 autres 4 4
37 18 39 2 96
total tRNAs ‰
gama7 1aa >1aa dup +5s 1-3aas autres gama ‰ ref.‰
21 faible 46 22 48 2 119 26
16 moyen 63 129 38 26 64 321 324
14 fort 51 182 238 30 61 561 650
160 333 324 56 127 808 729
10 g+cga 19 4 7 30 10
2 agg+cgg 9 9 17
4 carre ccc 14 10 41 2 67 16
5 autres 5 5
46 22 48 2 119
blocs tRNAs ‰ total colonne %
gama7 1aa >1aa dup total ref.‰ 1aa >1aa dup
21 faible 56 27 59 142 26 29 7 15
16 moyen 77 158 47 282 324 40 39 12
14 fort 62 223 291 576 650 32 55 73
195 408 397 660 729 129 269 262
10 g+cga 23 5 9 36 10 41 15
2 agg+cgg 11 11 21 19
4 carre ccc 17 12 50 79 16 30 85
5 autres 6 6 11
56 27 59 142 37 39

gamma, estimation des -rRNAs

modifier
  • Lien tableur: gamma, estimation des -rRNAs
  • Liens fiche:   typage
  • Légende: prélèvement de la base gtRNAdb le 22.1.21
    - ttt et tgt sont nuls partout
    - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
    - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
    - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
    - Voir la légende des tris, g1 t1 et des couleurs

gamma, calcul des -rRNAs

modifier
gam gamma 144 génomes
gam1 cumul des +rRNAs de la fiche gamma pour 144 génomes
g1    t1       
atgi tct tat atgf 3
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 3 tcc tac 1 tgc
atc 373 acc 57 aac agc 3
ctc ccc cac 10 cgt
gtc gcc 3 gac 151 ggc
tta 1 tca 3 taa tga
ata aca aaa 13 aga
cta cca 14 caa cga
gta 14 gca 378 gaa 423 gga
ttg 1 tcg tag tgg 73
atgj 1 acg aag agg
ctg ccg cag cgg 11
gtg gcg gag ggg
gama144 inter max min total
900 622 14 1536
gam2 indices du clade gamma du 27.5.20 de gtRNAdb pour 100 génomes
g1    t1     1183 1.5  0
atgi 130 tct 1.7 tat 1.3 atgf 292
att 0.1 act 0.5 aat 0.2 agt
ctt 0.9 cct cat cgc
gtt 0.5 gct gat ggt 0.5
ttc 175 tcc 152 tac 227 tgc 114
atc 285 acc 155 aac 311 agc 106
ctc 102 ccc 86 cac 115 cgt 298
gtc 173 gcc 167 gac 289 ggc 351
tta 120 tca 140 taa 1.0 tga 64
ata 0.8 aca 141 aaa 377 aga 151
cta 128 cca 141 caa 189 cga 13
gta 321 gca 283 gaa 324 gga 114
ttg 103 tcg 83 tag 2.7 tgg 113
atgj 170 acg 71 aag 24 agg 110
ctg 252 ccg 62 cag 102 cgg 100
gtg 8.3 gcg 6.9 gag 7.6 ggg 72
gtRNA inter max min total
2517 3550 1254 7321
gam3 cumul des -rRNAs de l'annexe gamma 7 génomes
g1    t1       
atgi 11 tct tat atgf 48
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 21 tcc 14 tac 30 tgc 18
atc 3 acc 6 aac 34 agc 11
ctc 9 ccc 6 cac 12 cgt 40
gtc 21 gcc 16 gac 7 ggc 46
tta 14 tca 12 taa tga 4
ata aca 19 aaa 33 aga 10
cta 24 cca 14 caa 23 cga
gta 34 gca gaa 17 gga 14
ttg 7 tcg 4 tag tgg 4
atgj 19 acg 4 aag 2 agg 7
ctg 21 ccg 4 cag 6 cgg 7
gtg gcg gag ggg 4
gama7 inter max min total
186 380 94 660
gam4 indices des +rRNAs de la fiche gamma pour 100 génomes
g1    t1       
atgi tct tat atgf 2
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 2 tcc tac 1 tgc 18
atc 259 acc 40 aac agc 2
ctc ccc cac 7 cgt 40
gtc gcc 2 gac 105 ggc 46
tta 1 tca 2 taa tga 4
ata aca aaa 9 aga 10
cta cca 10 caa cga
gta 10 gca 263 gaa 294 gga 14
ttg 1 tcg tag tgg 51
atgj 1 acg aag agg 7
ctg ccg cag cgg 8
gtg gcg gag ggg 4
gama144 inter max min total
625 432 10 1067
gam5 estimation des -rRNA du clade gamma pour 100 génomes
g1    t1       
atgi 130 tct 1.7 tat 1.3 atgf 290
att 0.1 act 0.5 aat 0.2 agt
ctt 0.9 cct cat cgc
gtt 0.5 gct gat ggt 0.5
ttc 173 tcc 152 tac 226 tgc 114
atc 26 acc 115 aac 311 agc 104
ctc 102 ccc 86 cac 108 cgt 298
gtc 173 gcc 165 gac 184 ggc 351
tta 119 tca 138 taa tga 64
ata 0.8 aca 141 aaa 368 aga 151
cta 128 cca 131 caa 189 cga 13
gta 311 gca 21 gaa 30 gga 114
ttg 102 tcg 83 tag tgg 62
atgj 169 acg 71 aag 24 agg 110
ctg 252 ccg 62 cag 102 cgg 92
gtg 8.3 gcg 6.9 gag 7.6 ggg 72
-rRNA inter max min total
1892 3118 1244 6254
gam6 indices des -rRNAs de l'annexe archeo pour 100 génomes
g1    t1       
atgi 157 tct tat atgf 686
att act aat agt
ctt cct cat cgc
gtt gct gat ggt 0.5
ttc 300 tcc 200 tac 429 tgc 257
atc 43 acc 86 aac 486 agc 157
ctc 129 ccc 86 cac 171 cgt 571
gtc 300 gcc 229 gac 100 ggc 657
tta 200 tca 171 taa tga 57
ata aca 271 aaa 471 aga 143
cta 343 cca 200 caa 329 cga 13
gta 486 gca gaa 243 gga 200
ttg 100 tcg 57 tag tgg 57
atgj 271 acg 57 aag 29 agg 100
ctg 300 ccg 57 cag 86 cgg 100
gtg gcg gag ggg 57
gama7 inter max min total
2657 5429 1343 9429

gamma, comparaison clade-annexe des -rRNAs

modifier
  • Lien tableur: gamma, comparaison clade-annexe des -rRNAs
  • Légende
    - gam7. diff, somme des couleurs de gam7. La différence entre tRNAs est faite entre gam5 et gam6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
    - gam8. rap, rapport des sommes couleurs gam5/gam2. Le rapport -rRNA/total est celui du tRNA de gam5 sur celui de gam2.
  • Fréquences des différences en % du tableau gam7
gamme		0/0	10	20	30	40	50	60	70	80	90	100		total
fréquence	0	7	7	6	8	10	2	1	0	1	6	0	48
tot ≤ 50						38							
  • Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 62% au dessus de celle de la fiche des gamma.
tRNAs		fiche		annexe
sans		8335		660
avec		1401		148
genomes		144		7
indice %	58		94
gam gamma 63 génomes
gam7 gamma, différence clade-annexe des -rRNAs
g1    t1       
atgi 17 tct 100 tat 100 atgf 58
att 100 act 100 aat 100 agt
ctt 100 cct cat cgc
gtt 100 gct gat ggt 100
ttc 42 tcc 24 tac 47 tgc 56
atc 39 acc 26 aac 36 agc 34
ctc 21 ccc 0 cac 37 cgt 48
gtc 42 gcc 28 gac 46 ggc 47
tta 40 tca 20 taa tga 11
ata 100 aca 48 aaa 22 aga 5
cta 63 cca 34 caa 42 cga 100
gta 36 gca 100 gaa 88 gga 43
ttg 2 tcg 31 tag tgg 8
atgj 38 acg 20 aag 16 agg 9
ctg 16 ccg 8 cag 16 cgg 8
gtg 100 gcg 100 gag 100 ggg 21
diff inter max min total
425 656 229 1310
gam8 gamma, rapports -rRNA/total
g1    t1       
atgi tct tat atgf 99
att act aat agt
ctt cct cat cgc
gtt gct gat ggt
ttc 99 tcc tac tgc
atc 9 acc 74 aac agc 98
ctc ccc cac 94 cgt
gtc gcc 99 gac 64 ggc
tta 99 tca 99 taa tga
ata aca aaa 98 aga
cta cca 93 caa cga
gta 97 gca 7 gaa 9 gga
ttg 99 tcg tag tgg 55
atgj acg aag agg
ctg ccg cag cgg 92
gtg gcg gag ggg
rap inter max min total
75 88 99 85

gamma intergen51

modifier

Intergen51. Introduction

modifier

Intergen51. Historique des pré-études

modifier

Intergen51. Formatage des résultats pour 7 génomes

modifier
gamma données intercalaires
modifier
	total	max1	reste	max2	un
spl	2482	1016	12	2727	3180
eco	2204	602	11	846	852
ecoN	2822	847	14	1486	1847
eal	2286	1073	11	1791	2324
vpb1	1757	799	9	1347	1605
vpb2	828	1030	4	1427	1439
vha1	1945	821	10	1507	2251
vha2	1075	914	5	1262	2682
amed	2382	815	12	2076	2281
gamma données intercalaires 200
modifier

Intergen51. Gamma vue de l'ensemble

modifier

Intergen51. La longueur totale des intercalaires d'un génome

modifier
  • Légende: intercals pour longueur totale des intercalaires positifs en pdb et génome pour celle de l'ADN du génome donnée par NCBI
  • Note: Les 9 éléments ont un taux autour de 12%
Nom	intercals	génome		taux en %
				
amed	601 332		4 777 154	12,6
eal	594 081		4 701 875	12,6
eco	501 283		4 641 652	10,8
ecoN	646 219		5 441 200	11,9
spl	789 212		5 174 581	15,3
vha1	499 733		3 765 351	13,3
vha2	317 649		2 204 018	14,4
vpb1	403 530		3 297 305	12,2
vpb2	242 529		1 806 219	13,4

Intergen51. Gamma les différents types d'intercalaires

modifier
  • Lien au tableur: Intergen51. Gamma les différents types d'intercalaires.
  • Légende:
    - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
    - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
    - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
    - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
    - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
  • Note:
    - taux des R-: c-/c = 100*2/301 = 0.7 et x-/x = 100*1/208 = 0.5.
Int51.2 Gamma les différents types d'intercalaires entre gène de 7 génomes
Int51.21 Les différents types
intercalaires CDS-CDS * autres intercalaires
continu S+ S- S0 total c/x RNA-RNA CDS-rRNA total
c 17 644 4 048 137 21 829 2,2 695 58 753
x 9 203 450 52 9 705 0 42 42
t 26 847 4 498 189 31 534 695 100 795
% 85,1 14,3 0,6
Int51.22 Détail des * autres intercalaires
intercalaires tRNA-CDS récapitulatif des * autres intercalaires
continu R+ R- R0 total c/x * autres total %
c 297 2 2 301 1,4 tRNA-CDS 509 21
x 207 1 0 208 RNA-RNA 695 29
t 504 3 2 509 CDS-rRNA 100 4
% 99,0 0,6 0,4 non RNA 1 112 46
Int51.23 Les taux remarquables
taux %reste %t30 %t5 %0
type S+ R+ S- S+ R+ S- S+ R+
gamme 400 400 6-50 - - - - -
c 6,0 15,6 1,3 28,5 3,7 64 0,6 0,7
x 11,3 17,3 7,8 5,6 2,4 39 0,5 0,0

Intergen51. Gamma Détail des intercalaires RNA-RNA et CDS-rRNA

modifier
RNA-RNA		c	x		CDS-RNA		c	x
23s 5s		62			CDS 16s		37	24
16s 23s		11			5s CDS		14	18
16s tRNA	54			16 CDS			
tRNA 23s	51			CDS 5s			
5s tRNA		36			23s CDS		2	
tRNA in		45			CDS 23s			
tRNA contig	11			5s 16s		4	
tRNA hors	414			16s16s		1	
tRNA 16s	1						
23s tRNA								
tRNA 5s		10						
16s 5s								
5s 23s								
5s 5s								
total		695	0		total		58	42

Intergen51. Gamma Les intercalaires rares

modifier
tRNA-CDS			
gen	x-	c-	zéro c
spl	-23		
ecoN			2
vha2		-36	
amed		-21	
16s16s		c+
vha1		0	

Intergen51. Les diagrammes des gamma

modifier

Intergen51. Les diagrammes CDS-CDS et tRNA-CDS

modifier
Intergen51. Les diagrammes CDS-CDS et tRNA-CDS positifs
modifier
  • Lien aux données intercalaires.
  • Diagrammes des gamma:  tg présente 4 diagrammes
    - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
    - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
    - ftc, tRNA-CDS continu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
    - ftx, tRNA-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et effectif en ordonnées
  • Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000			Calculs des f.41 et autres R2 des f.1	
R2	x3		x2		x		c		Inflexion poly3	x	c
0,790	3,47E-06	-2,26E-03	3,24E-01	22,6	fx1	abscisse	534,8	55,7
0,828	-5,39E-06	4,14E-03	1,06E+00	101,0	fc1	ordonnée	4,7	39,3
									poly3/droite	-12,8	35,3
0,963	-3,16E-07	5,07E-04	-2,86E-01	61,0	fx41			
0,976	5,33E-07	-8,91E-05	-1,60E-01	48,4	fc41	R2 f.1		x	c
									Poly 3		790	828
0,908					-1,12E-01	47,1	fx41	Poly 6		899	970
0,925					-1,09E-01	41,4	fc41	Poly 9		977	986
0,650					-8,30E-02	39,1	fx1			
0,650					-1,68E-01	57,8	fc1			
Intergen51. Gamma CDS-CDS négatifs
modifier
Intergen51. Gama comparaison avec la totale
modifier
  • Lien aux données intercalaires.
  • Gamma se distingue de la totale par le 4/1 des négatifs c, avec 1.6 contre 2.6
Sous-totaux	gama			totale	
fréquence	x-	c-		x-	c-
-1		2	1 002		4	4 140
-2		16	5		85	11
-3		2	2		3	12
-4		152	1 572		717	10 938
-5		2	4		5	19
sp6		276	1 463		1 642	8 424
total		450	4 048		2 456	23 544
reste		35	53		264	420
s6		84	5		361	41
s7		44	270		321	1 438
s8		113	1 135		696	6 525
rapport s1-5						
4/2/1		9,5	1,6		8,4	2,6
% / sp6						
s6/sp6		30,4	0,3		22,0	0,5
s7/sp6		15,9	18,5		19,5	17,1
s8/sp6		40,9	77,6		42,4	77,5
reste/sp6	12,7	3,6		16,1	5,0
						
total s1-5	174	2 585		814	15 120
% / total						
%s1-5		38,7	63,9		33,1	64,2
%sp6		61,3	36,1		66,9	35,8
Intergen51. Gama homogénéité des génomes
modifier
  • Lien aux données intercalaires des génomes
  • Grande homogénéité des génomes qui confirme la faiblesse du 4/1 des continus, à part amed avec 2.3 proche de 2.6 la totale.
négatifs x	amed	spl	eco	ecoN	eal	vpb1	vpb2	vha1	vha2	total
total		42	12	95	105	119	13	14	25	25	450
s1-5		9	7	45	49	43	2	5	9	5	174
sp6		33	5	50	56	76	11	9	16	20	276
rapport s1-5											
4/2		8.0	2.5	21.5	9.8	9.8	-	4.0	-	1.5	9.5
% / sp6											
s6		24	20	28	32	30	27	33	44	35	30
s7		27	0	12	18	21	9	0	6	5	16
s8		36	60	34	41	39	55	56	50	60	41
reste		12	20	26	9	9	9	11	0	0	13
% / total											
s1-5		21	58	47	47	36	15	36	36	20	39
sp6		79	42	53	53	64	85	64	64	80	61
											
											
négatifs c	amed	spl	eco	ecoN	eal	vpb1	vpb2	vha1	vha2	total
total		444	414	647	782	617	344	171	402	227	4048
s1-5		303	262	422	508	407	198	103	242	140	2585
sp6		141	152	225	274	210	146	68	160	87	1463
rapport s1-5											
4/1		2.3	1.1	1.6	1.9	1.6	1.4	1.1	1.4	1.2	1.6
% / sp6											
s6		0	0	0	2	0	0	0	0	0	0
s7		23	20	21	19	20	14	9	17	14	18
s8		72	77	68	76	78	86	91	83	86	78
reste		4	3	11	4	2	0	0	0	0	4
% / total											
s1-5		68	63	65	65	66	58	60	60	62	64
sp6		32	37	35	35	34	42	40	40	38	36
Intergen51. Gama Les grands négatifs inférieurs à -120
modifier

Intergen51. Les diagrammes CDS-rRNA

modifier
Intergen51. Gamma. Les diagrammes CDS-16s
modifier
gama		CDS16sc		CDS16sx		5sCDSc		5sCDSx
R2		-		-		-		-
moyenne		473,0		533,2		186,8		221,5
plage		360-690		450-630		30-390		60-480
total-p		31		17		12		14
%		84		71		86		78
queue		4		3		2		2
%		11		12,5		14		11
tête		2		4		0		0
%		5,4		16,7		0		0
max		390;9		480;4		90;4		120;6
total7		37		24		14		18
freq		30		30		30		30
  • Les moyennes CDS-16s par génome
Intergen51.gamma. Moyennes CDS-16s
CDS16sx. discontinu
CDS16sx moyenne écart m/e intercalaires haut bas
amed 560,3 63,6 8,8 3x481-516 626:627 35,4 72,9
eal 386,8 103,2 3,7 264 339 467:471 209,0 -100,7
eco 522,3 79,5 6,6 473:480 614 73,4 34,9
ecoN 298 256,0 1,2 117 479 297,7 -189,4
spl 821,5 250,6 3,3 614 687:807 1178:*1908 -225,8 334,1
vha1 523,0 43,8 11,9 492 554 72,7 35,6
vha2
vpb1 526,0 42,4 12,4 496 556 69,7 38,6
vpb2
total 541,6 197,1 2,7 595,7 487,4
CDS16sc. continu
CDS16sc moyenne écart m/e intercalaires haut bas
amed 488,4 72,1 6,8 424:432 469:518 599 63,5 36,8
eal 298,3 119,0 2,5 161 364:370 253,6 -153,2
eco 388,5 36,2 10,7 362 373:377 442 163,4 -63,1
ecoN 435,7 118,9 3,7 4x365-385 441 672 116,2 -15,9
spl 665,6 301,2 2,2 206 611:647 876:988 -113,7 214,0
vha1 584,3 146,6 4,0 4x451-557 631:853 -32,4 132,8
vha2 448 448 103,9 -3,6
vpb1 551,5 136,6 4,0 4x454-504 575:817 0,4 99,9
vpb2 468 468 83,9 16,4
total 501,7 173,5 2,9 551,9 451,6
Intergen51. Les diagrammes 5s-CDS
modifier
  • Lien aux données intercalaires.
  • Comparaison avec les tRNA-CDS
    - Les équations des polynômes de d°3
    fct    f(x) = 1.16E-06 x3 – 9,33E-04 x2 + 1,98E-01 x – 2,05
    fxt    f(X) = -2.37E-07 x3 + 7.01E-05 x2 + 6.66E-03 x +3.00E+00
    - Les caractéristiques des courbes: xs abscisse calculée du maximum de la courbe en pbs, plage des effectifs forts et max de l'effectif maximum et son abscisse.
gama		fct		fxt		5sCDSc		5sCDSx
R2		0,509		0,105		-		-
xs		145,7		236,8		186,8		221,5
plage		80-240		40-370		30-390		60-480
total-p		170		162		12		14
%		56		78		86		78
queue		103		40		2		2
%		34		19		14		11
tête		24		5		0		0
%		8,0		2,4		0		0
max		160;18		100;10		90;4		120;6
total7		301		208		14		18
freq		10		10		30		30
Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS
modifier
  • Lien tableur: Intergen51.gamma. Comparaison 5s-CDS tRNA-CDS CDS-CDS.
  • Légende:
    - Inf40, Sup700: nombre d'intercalaires du génome inférieurs à 41 et supérieurs à 700. Dans les tableaux 5sCDS ils sont notés en gras avec un *. A voir aux données intercalaires du génome.
    - moyenne: elle est calculée pour tous les intercalaires compris entre inf40 et sup700, 40 exclu. Et son écart est la fonction ecartype.
    - haut, bas: pour estimer que la moyenne du génome est très élevée ou trop basse par rapport à celle du total des alpha.
    + la référence du haut est égale à (total + total/10), indiquée sur la ligne total.
    + la référence du bas est égale à (total - total/10), indiquée sur la ligne total.
    + Pour un génome le haut est égal à (haut référence - sa moyenne): si cette différence est négative la moyenne est considérée trop élevée.
    + Pour un génome le bas est égal à (sa moyenne - haut référence): si cette différence est négative la moyenne est considérée trop basse.
    + pour les tableaux 5sCDS les références sont sur la ligne du total précédés du signe ++
    - Les colonnes f*t-f* représentent la différence entre les 2 moyennes.
    - intercalaires: pour les tableaux 5sCDS où les effectifs sont très faibles. Une plage continue de plus de 2 effectifs est représentée par un tiret, inférieur - supérieur. S'il n'y a que 2 intercalaires, ils sont séparés par 2 points, :.
  • Note: Sommes des différences f*t-f*, positives et négatives, dans les tableaux correspondants
fct-fc	509,0
fct-fc	-0
	
fxt-fx	804,9
fxt-fx	-0
Intergen51.gamma Comparaison 5s-CDS tRNA-CDS CDS-CDS
fxt. tRNA-CDS discontinu
fxt moyenne écart m/e Inf 40 Sup 700 haut bas
amed 215,8 114,5 1,9 0 0 71,6 -19,3
eal 213,1 140,6 1,5 2 0 74,3 -22,1
eco 243,8 133,8 1,8 3 1 43,5 8,7
ecoN 259,6 117,9 2,2 6 3 27,8 24,4
spl 300,0 140,1 2,1 1 3 -12,6 64,9
vha1 277,3 152,6 1,8 0 0 10,0 42,2
vha2 329,8 40,5 8,1 0 0 -42,4 94,7
vpb1 288,7 166,5 1,7 0 1 -1,3 53,6
vpb2 487,0 141,3 3,4 2 0 -237,7 283,1
total 261,2 141,9 1,8 ++ 287,4 235,1
5sCDSx. 5s-CDS discontinu
5sCDSx moyenne écart m/e intercalaires  -
amed 183,5 119,5 1,5 99 268
eal 223,7 204,8 1,1 98:113 460
eco 192,7 98,9 1,9 81 228:269
ecoN 83,0 29,7 2,8 62 104
spl 387,8 77,8 5,0 304:339 2x454 *768:798
vha1 101 101
vha2
vpb1 110 110
vpb2
total 221,5 145,6 1,5 ++ 243,7 199,4 -
fct. tRNA-CDS continu
fct moyenne écart m/e Inf 40 Sup 700 haut bas
amed 201,0 117,5 1,7 1 2 48,2 -2,9
eal 212,5 133,7 1,6 1 0 36,8 8,5
eco 187,9 105,6 1,8 1 2 61,3 -16,0
ecoN 214,4 127,2 1,7 4 2 34,9 10,4
spl 298,3 187,7 1,6 0 4 -49,1 94,4
vha1 238,1 138,9 1,7 1 1 11,2 34,1
vha2 254,0 125,2 2,0 1 0 -4,7 50,1
vpb1 253,9 138,9 1,8 3 1 -4,6 49,9
vpb2 266,3 77,7 3,4 1 1 -17,1 62,4
total 226,6 137,5 1,6 ++ 249,3 203,9
5sCDSc. 5s-CDS continu
5sCDSc moyenne écart m/e intercalaires  -
amed 275,0 111,0 2,5 164 275 386
eal 178,0 172,5 1,0 56 300
eco 187,0 159,8 1,2 74 300
ecoN 137,4 107,0 1,3 3x76 136 323
spl *715 17,0 42,1 *703 *727
vha1
vha2
vpb1
vpb2
total 186,8 121,1 1,5 ++ 205,5 168,2 -
fx. CDS-CDS discontinu
fx moyenne écart m/e fxt-fx Sup 700 haut bas
amed 183,3 129,6 1,41 32,5 16 36,4 3,5
eal 198,0 142,2 1,39 15,1 26 21,8 18,2
eco 185,9 118,7 1,57 57,9 9 33,8 6,1
ecoN 199,8 138,9 1,44 59,8 35 19,9 20,0
spl 227,7 147,9 1,54 72,3 48 -7,9 47,9
vha1 205,7 144,3 1,43 71,7 26 14,1 25,9
vha2 213,6 152,5 1,40 116,2 20 6,1 33,8
vpb1 195,2 146,0 1,34 93,5 12 24,5 15,4
vpb2 201,0 142,8 1,41 286,0 11 18,7 21,3
total 199,8 138,8 1,44 61,5 219,7 179,8
fc. CDS-CDS continu
fc moyenne écart m/e fct-fc Sup 700 haut bas
amed 165,4 113,5 1,5 35,6 23 30,3 5,3
eal 175,7 129,9 1,4 36,8 34 20,0 15,6
eco 161,6 111,5 1,4 26,3 3 34,1 1,5
ecoN 164,0 121,1 1,4 50,3 26 31,7 3,9
spl 201,0 142,9 1,4 97,4 58 -5,3 40,8
vha1 189,3 136,6 1,4 48,8 19 6,4 29,1
vha2 188,8 136,8 1,4 65,2 17 6,9 28,7
vpb1 177,7 120,7 1,5 76,2 17 18,0 17,6
vpb2 193,9 131,6 1,5 72,5 12 1,8 33,7
total 177,9 127,5 1,4 48,7 195,7 160,1
Intergen51. Les CDS-rRNA rares
modifier
23sCDSc	tRNA16sc	16s16sc
331	1063		0
385		

Intergen51. Les diagrammes RNA-RNA

modifier
Intergen51. Gamma. Les diagrammes rRNA-rRNA
modifier
gama		16s23s		16stRNA		tRNA23sc	23s5sc
R2		-		-		-		-
moyenne		332,3		118,7		243,8		118,0
plage		280-360		80-140		180-340		80-180
total-p		10		43		49		61
%		91		80		96		98
queue		1		11		2		1
%		9,1		20		4,0		1,6
tête		0		0		0		0
%		0		0		0		0
max		360;7		80;19		200;18		100;27
total7		11		54		51		61
freq		20		20		20		20
Intergen51. Les diagrammes rRNA-RNA
modifier
Intergen51.gamma. Moyennes rRNA-RNA
16s23s.
16s23s moyenne écart m/e intercalaires haut bas
amed    
eal
eco
ecoN
spl 353,0 12,5 28,2 7x348-349 384 12,5 54,0
vha1
vha2
vpb1 277 3x277 88,5 -22,0
vpb2
total 332,3 37,0 9,0 365,5 299,0
23s5s.
23s5s moyenne écart m/e intercalaires haut bas
amed 123,4 2,6 48,3 9x120-127     6,3 17,3
eal 169 7x169 -39,3 62,8
eco 92,4 0,5 172,9 7x92-93 37,3 -13,7
ecoN 95 6x95 *1881 34,7 -11,2
spl 136,3 13,5 10,1 10x132-133 177 -6,5 30,1
vha1 121,0 15,0 8,1 2x95 7x125-135 8,7 14,8
vha2 95 95 34,7 -11,2
vpb1 91 10x91 38,7 -15,2
vpb2 91 91 38,7 -15,2
total 118,0 26,5 4,4 129,7 106,2
16stRNA.
16stRNA moyenne écart m/e intercalaires haut bas
amed 183,3 81,0 2,3 3x72 7x198-274 -52,7 76,5
eal 78,3 8,4 9,3 7x68-85 52,3 -28,6
eco 102,3 47,6 2,2 5x68-85 2x171 28,3 -4,6
ecoN 149,4 148,3 1,0 7x68-85 375 443 -18,8 42,6
spl 74 3x74 56,6 -32,8
vha1 105,8 21,3 5,0 65 5x91-102 3x127-134 24,8 -1,1
vha2 123 123 7,6 16,2
vpb1 83,3 12,8 6,5 2x65 5x89 97 47,3 -23,6
vpb2 89 89 41,6 -17,8
total 118,7 79,4 1,5 130,6 106,9
tRNA23s.
tRNA23s moyenne écart m/e intercalaires haut bas
amed 238,8 5,0 47,3 8x236-238 252 29,4 19,4
eal 192,9 6,4 30,1 3x186 4x198 75,3 -26,5
eco 186,1 7,2 25,8 174 3x183-184 3x193 82,0 -33,3
ecoN 200,0 31,3 6,4 174 5x183-194 269 68,2 -19,4
spl 359,3 20,2 17,8 336 2x371 -91,2 139,9
vha1 290,8 21,0 13,8 3x260-272 6x296-317 -22,6 71,4
vha2 313 313 -44,8 93,6
vpb1 280,0 26,6 10,5 5x264-265 2x319 -11,8 60,6
vpb2 263 263 5,2 43,6
total 243,8 53,8 4,5 268,2 219,4
Intergen51. Gamma. Les diagrammes tRNA-tRNA
modifier
Les diagrammes des tRNA-tRNA
modifier
type c		S40	%	R2	diag	total	reste	x+	restes	5stRNA	hors	contig	tRNA 5s
hors		213	51	0,656	260	414	4	-		151	479	1472	777
contig		4	36	-	70	11	2	-			539	2351	1112
in		24	53	-	70	45	0	-			634		1360
5stRNA		14	39	-	120	36	1	-			1172		
tRNA5s		5	50	-	60	10	3	-					
Pourcentage des tRNA-tRNA hors blocs
modifier
tRNA h		amed	spl	eco	ecoN	eal	vpb	vha	vpb2	vha2	total	%
20		14	15	12	13	11	9	10	1	1	84	20.3
40		27	27	10	16	8	24	17			129	31.2
60		14	29	6	9	7	21	16		1	102	24.6
80		2	3	1	4	1	9	6	2		26	6.3
100		3	8	0	0	1	3	6		1	21	5.1
120		8	14	1	1	1					25	6.0
140		1	4	2	0	0					7	2
160		0	0	2	0	1		1			4	1
180			1								1	0
200			1	2		1		1		1	5	1
220			1	1		2	1				5	1
240			0								0	0
260			1								1	0
reste			4								4	1
total		69	108	37	43	33	67	57	3	4	414	100
												
repete		8	9	8	13	8	4	5	0	1	55	48
séquence	3	7	2	2	2	4	5	0	0	25	22
sans		9	5	4	3	4	7	3	3	1	35	30
clusters	20	21	14	18	14	15	13	3	2	115	100
Les moyennes des tRNA-tRNA par génome
modifier
Intergen51.gamma. Moyennes tRNA-tRNA
5stRNA
5stRNA moyenne écart m/e intercalaires haut bas
amed 100,6 5,1 19,8 95 2x98 2x106 -35,2 47,1
eal 52 57,2 1,5 2x52 *151 13,4 -1,5
eco 38,7 23,1 1,7 12 2x52 26,7 -14,8
ecoN 33,8 22,8 1,5 2x14 53:54 31,6 -19,7
spl 89,3 18,5 4,8 68 2x100 -24,0 35,9
vha1 55,0 30,8 1,8 5x31-32 68 91:100 10,4 1,5
vha2 90 90 -24,6 36,5
vpb1 43,8 26,5 1,7 6x30 69 100 21,6 -9,7
vpb2 69 69 -3,6 15,5
total 59,4 31,3 1,9 65,4 53,5
tRNA contigu
tRNA cont moyenne écart m/e intercalaires haut bas
amed
eal 11 11 35,1 -26,7
eco
ecoN 30,7 19,6 1,6 8 2x42 *1472:2351 15,4 -7,0
spl
vha1 51,5 23,3 2,2 35 68 -5,4 13,8
vha2
vpb1 57,0 19,1 3,0 35 2x68 -10,9 19,3
vpb2
total 41,9 23,0 1,8 46,1 37,7
tRNA intra cluster
tRNA in moyenne écart m/e intercalaires haut bas
amed 10 3x10 23,7 -17,6
eal 45 3x45 -11,3 17,4
eco 42 3x42 -8,3 14,4
ecoN 42 4x42 -8,3 14,4
spl 65 3x65 -31,3 37,4
vha1 30,5 16,6 1,8 5x43 4x2-9 4x30-41 3,2 2,9
vha2 20,3 16,8 1,2 2 24 35 13,4 -7,2
vpb1 21,8 16,3 1,3 2x41 4x2-14 12,0 -5,8
vpb2 10,7 7,6 1,4 2 14 16 23,0 -16,9
total 30,6 18,5 1,7 33,7 27,6
tRNA hors cluster
tRNA hors moyenne écart m/e total S60% sup120 haut bas
amed 43,0 29,5 1,5 69 80 1 4,3 4,3
eal 33,6 27,5 1,2 33 79 4 13,7 -5,1
eco 29,8 24,3 1,2 37 76 7 17,5 -8,9
ecoN 33,3 22,9 1,5 43 88 0 14,0 -5,4
spl 52,3 29,9 1,7 108 66 12 -5,0 13,6
vha1 45,8 24,3 1,9 53 77 1 1,6 7,1
vha2 51,7 46,0 1,1 4 50 1 -4,3 13,0
vpb1 43,1 19,6 2,2 64 83 1 4,2 4,4
vpb2 49,7 40,4 1,2 3 100 0 -2,3 11,0
total 43,0 27,2 1,6 414 76 27 47,3 38,7
Intergen51. Les RNA-RNA rares
modifier