Recherche:Les clusters de gènes tRNA et rRNA chez les procaryotes/Annexe/spiro
SpirochetesModifier
Sphaerochaeta coccoides DSM 17374Modifier
scc opéronsModifier
- Lien tableur: scc opérons
- Liens: gtRNAdb [1], NCBI [2], génome [orgn]
- Phylogénie: Bacteria; Spirochaetes; Spirochaetales; Spirochaetaceae; Sphaerochaeta.
- Légende:
50.6%GC | 12.1.21 Paris | 3.16s | doubles | intercal | cds | aa | avec.aa | cdsa | cdsd | protéines |
---|---|---|---|---|---|---|---|---|---|---|
comp | 215073..215231 | cds | 1194 | 1194 | 53 | hp | ||||
comp | 216426..216498 | gcg | @1 | 369 | 369 | 369 | ||||
comp | 216868..217047 | cds | 60 | hp | ||||||
243358..244170 | cds | @2 | 812 | 812 | 271 | HAD-IIB family hydrolase | ||||
244983..246519 | 16s | 132 | 132 | |||||||
246652..246725 | atc | 79 | 79 | |||||||
246805..249778 | 23s | 72 | ||||||||
249851..249962 | 5s | 175 | 175 | 175 | ||||||
250138..250947 | cds | 270 | metal ABC transporter permease | |||||||
300128..301798 | cds | 669 | 669 | 557 | formate--tetrahydrofolate ligase | |||||
302468..302539 | ggg | 452 | 452 | 452 | ||||||
302992..304032 | cds | 347 | ABC transporter substrate-binding protein | |||||||
comp | 316296..317216 | cds | 152 | 152 | 307 | 152 | phosphatase PAP2 family protein | |||
317369..317442 | gac | 176 | 176 | |||||||
317619..318692 | cds | 358 | tRNA 2-thiouridine(34) synthase MnmA | |||||||
330207..331004 | cds | 16 | 16 | 266 | 16 | class I SAM-dependent methyltransferase | ||||
comp | 331021..331104 | ttg | 251 | 251 | ||||||
331356..333446 | cds | 697 | patatin-like phospholipase family protein | |||||||
comp | 345290..346216 | cds | 228 | 228 | 309 | hp | ||||
comp | 346445..346517 | ccg | 182 | 182 | 182 | |||||
comp | 346700..347059 | cds | 120 | hp | ||||||
422975..424363 | cds | 71 | 71 | 463 | 71 | sulfatase-like hydrolase/transferase | ||||
comp | 424435..424506 | gtc | 252 | 252 | ||||||
424759..426600 | cds | 614 | hp | |||||||
436852..438168 | cds | 237 | 237 | 439 | MFS transporter | |||||
comp | 438406..438477 | gtg | 202 | 202 | 202 | |||||
438680..440152 | cds | 491 | hp | |||||||
comp | 481186..482484 | cds | 180 | 180 | 433 | HD domain-containing protein | ||||
482665..482737 | atgj | 82 | 82 | 82 | ||||||
482820..483494 | cds | 225 | hp | |||||||
530805..532313 | cds | 82 | 82 | 503 | 82 | IMP dehydrogenase | ||||
532396..532467 | gta | 310 | 310 | |||||||
532778..533485 | cds | 236 | YggS family pyridoxal phosphate-dependent enzyme | |||||||
568939..569700 | cds | 102 | 102 | 254 | 102 | NAD-dependent deacetylase | ||||
569803..569874 | gga | 412 | 412 | |||||||
570287..570952 | cds | 222 | hp | |||||||
636017..636391 | cds | 52 | 52 | 125 | 52 | chorismate mutase | ||||
636444..636517 | aca | 334 | 334 | |||||||
comp | 636852..637013 | cds | 54 | hp | ||||||
comp | 717326..717772 | cds | 66 | 66 | 149 | 66 | YkgJ family cysteine cluster protein | |||
comp | 717839..717920 | tac | 230 | 230 | ||||||
718151..719386 | cds | 412 | aminopeptidase | |||||||
comp | 721419..723056 | cds | @3 | 67 | 67 | 546 | 67 | ATP-binding cassette domain-containing protein | ||
comp | 723124..723195 | gag | 10 | 10 | ||||||
comp | 723206..723276 | cag | 104 | 104 | ||||||
comp | 723381..723911 | cds | 177 | adenine phosphoribosyltransferase | ||||||
comp | 724974..725225 | cds | 236 | 236 | 84 | hp | ||||
comp | 725462..725533 | acg | 124 | 124 | 124 | |||||
comp | 725658..728366 | cds | 903 | pyruvate, phosphate dikinase | ||||||
comp | 767509..768549 | cds | 350 | 350 | 347 | 350 | DegT/DnrJ/EryC1/StrS aminotransferase family protein | |||
comp | 768900..769011 | 5s | 72 | |||||||
comp | 769084..772057 | 23s | 40 | 40 | ||||||
comp | 772098..772171 | gca | 137 | 137 | ||||||
comp | 772309..773845 | 16s | 535 | 535 | ||||||
774381..774947 | cds | 189 | peroxiredoxin | |||||||
783089..784627 | cds | 273 | 273 | 513 | glycoside hydrolase family 43 protein | |||||
comp | 784901..784972 | gaa | 43 | 43 | ||||||
comp | 785016..785088 | aaa | 223 | 223 | 223 | |||||
785312..787483 | cds | 724 | cadmium-translocating P-type ATPase | |||||||
comp | 877367..879202 | cds | 447 | 447 | 612 | 447 | translational GTPase TypA | |||
comp | 879650..879761 | 5s | 72 | |||||||
comp | 879834..882807 | 23s | 40 | 40 | ||||||
comp | 882848..882921 | gca | 137 | 137 | ||||||
comp | 883059..884595 | 16s | 648 | 648 | ||||||
885244..885867 | cds | 208 | GNAT family N-acetyltransferase | |||||||
900855..901490 | cds | 73 | 73 | 212 | 73 | Fic family protein | ||||
comp | 901564..901637 | ccc | 214 | 214 | ||||||
901852..903519 | cds | 556 | Alpha-glucosidase | |||||||
928254..930545 | cds | 138 | 138 | 764 | 138 | AAA family ATPase | ||||
930684..930755 | cac | 32 | 32 | |||||||
930788..930861 | cga | 38 | 38 | |||||||
930900..930972 | aag | 37 | 37 | |||||||
931010..931091 | cta | 36 | 36 | |||||||
931128..931199 | ggc | 423 | 423 | |||||||
931623..932981 | cds | 453 | trigger factor | |||||||
937885..939693 | cds | 171 | 171 | 603 | 171 | oligoendopeptidase F | ||||
939865..939938 | aga | 437 | 437 | |||||||
940376..940579 | cds | 68 | helix-turn-helix domain-containing protein | |||||||
comp | 974079..974468 | cds | @4 | 223 | 223 | 130 | tyrosine-type recombinase/integrase | |||
comp | 974692..974775 | ctc | 153 | 153 | 153 | |||||
comp | 974929..975384 | cds | 112 | 112 | 152 | VOC family protein | ||||
comp | 975497..975569 | cca | 95 | 95 | 95 | |||||
975665..976339 | cds | 225 | endonuclease III | |||||||
1069506..1069922 | cds | 81 | 81 | 139 | hp | |||||
comp | 1070004..1070087 | tta | 78 | 78 | 78 | |||||
1070166..1070981 | cds | 272 | TatD family hydrolase | |||||||
comp | 1113338..1113928 | cds | 247 | 247 | 197 | 247 | NAD(P)H-dependent oxidoreductase | |||
1114176..1114248 | aac | 247 | 247 | |||||||
comp | 1114496..1117318 | cds | 941 | 5'-nucleotidase C-terminal domain-containing protein | ||||||
comp | 1126672..1127604 | cds | 173 | 173 | 311 | 173 | DUF362 domain-containing protein | |||
1127778..1127850 | caa | 193 | 193 | |||||||
comp | 1128044..1128334 | cds | 97 | septation regulator SpoVG | ||||||
comp | 1257969..1258763 | cds | 140 | 140 | 265 | nucleotidyltransferase domain-containing protein | ||||
1258904..1258977 | agg | 79 | 79 | 79 | ||||||
1259057..1259779 | cds | 241 | nitroreductase family protein | |||||||
comp | 1273039..1273944 | cds | 217 | 217 | 302 | DNA-protecting protein DprA | ||||
1274162..1274234 | ttc | 103 | 103 | 103 | ||||||
comp | 1274338..1274865 | cds | 176 | cysteine hydrolase | ||||||
comp | 1363097..1364389 | cds | 432 | 432 | 431 | H(+)-transporting two-sector ATPase | ||||
1364822..1364894 | atgf | 213 | 213 | 213 | ||||||
1365108..1366457 | cds | 450 | Trk system potassium transporter TrkA | |||||||
comp | 1478531..1479448 | cds | 196 | 196 | 306 | 196 | hp | |||
1479645..1479718 | cgg | 256 | 256 | |||||||
comp | 1479975..1481738 | cds | 588 | ABC transporter ATP-binding protein | ||||||
comp | 1522454..1523143 | cds | 86 | 86 | 230 | hp | ||||
1523230..1523301 | tgc | 34 | 34 | 34 | ||||||
comp | 1523336..1523890 | cds | 185 | hp | ||||||
comp | 1540671..1541807 | cds | 186 | 186 | 379 | 186 | DUF2974 domain-containing protein | |||
comp | 1541994..1542066 | gcc | 351 | 351 | ||||||
1542418..1544223 | cds | 602 | IS1634 family transposase | |||||||
1691238..1692578 | cds | 189 | 189 | 447 | 189 | sn-glycerol-1-phosphate dehydrogenase | ||||
1692768..1692851 | ctg | 564 | 564 | |||||||
1693416..1693646 | cds | 77 | helix-turn-helix domain-containing protein | |||||||
comp | 1760709..1761905 | cds | 185 | 185 | 399 | 185 | hp | |||
1762091..1762164 | atgi | 316 | 316 | |||||||
comp | 1762481..1765135 | cds | 885 | valine--tRNA ligase | ||||||
comp | 2034849..2035028 | cds | @4 | 32 | 32 | 60 | preprotein translocase subunit SecE | |||
comp | 2035061..2035134 | tgg | 26 | 26 | 26 | |||||
comp | 2035161..2035337 | cds | 64 | 64 | 59 | 64 | 50S ribosomal protein L33 | |||
comp | 2035402..2035474 | acc | 246 | 246 | ||||||
2035721..2036506 | cds | 262 | HAD family hydrolase | |||||||
2185380..2186171 | cds | @5 | 84 | 84 | 264 | 84 | 16S rRNA (uracil(1498)-N(3))-methyltransferase | |||
2186256..2186340 | tca | 40 | 40 | |||||||
2186381..2186467 | agc | 25 | 25 | |||||||
2186493..2186566 | cgc | 16 | 16 | |||||||
2186583..2186669 | tcg | 40 | 40 | |||||||
2186710..2186795 | tcc | 13 | ||||||||
2186809..2186906 | ncRNA | 133 | 133 | 33 | ||||||
comp | 2187040..2188236 | cds | 399 | transposase |
scc cumulsModifier
- Lien tableur: scc cumuls
opérons | Fréquences intercalaires tRNAs | Fréquences intercalaires cds | Fréquences aas cds | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
effectif | gammes | sans rRNAs | avec rRNAs | gammes | cds | gammes | cdsd | gammes | cdsa | gammes | cdsa 300 | ||
avec rRNA | opérons | 3 | 1 | 0 | 1 | 0 | 1 | 0 | 100 | 9 | - | - | |
16 23 5s 0 | 20 | 2 | 50 | 4 | 20 | 1 | 200 | 11 | |||||
16 atc23s5s | 1 | 40 | 7 | 2 | 100 | 14 | 40 | 2 | 300 | 16 | |||
16gca23s5s | 2 | 60 | 1 | 0 | 150 | 8 | 60 | 1 | 400 | 11 | |||
max a | 1 | 80 | 1 | 200 | 13 | 80 | 7 | 500 | 9 | ||||
a doubles | 100 | 0 | 250 | 13 | 100 | 4 | 600 | 6 | |||||
autres | 120 | 0 | 300 | 4 | 120 | 2 | 700 | 5 | |||||
total aas | 3 | 140 | 3 | 350 | 4 | 140 | 2 | 800 | 2 | ||||
sans | opérons | 34 | 160 | 400 | 2 | 160 | 2 | 900 | 1 | ||||
1 aa | 30 | 180 | 450 | 5 | 180 | 3 | 1000 | 2 | |||||
max a | 5 | 200 | 500 | 1 | 200 | 5 | 1100 | ||||||
a doubles | 0 | 6 | 4 | ||||||||||
total aas | 44 | 10 | 6 | 74 | 33 | 72 | |||||||
total aas | 47 | ||||||||||||
remarques | 5 | ||||||||||||
avec jaune | moyenne | 32 | 94 | 236 | 154 | 343 | |||||||
variance | 11 | 47 | 196 | 108 | 215 | ||||||||
sans jaune | moyenne | 188 | 124 | 299 | |||||||||
variance | 110 | 64 | 164 |
scc blocsModifier
- Lien tableur: scc blocs
cds | 812 | cds | 350 | 447 | |
16s | 132 | 5s | 72 | 72 | |
atc | 79 | 23s | 40 | 40 | |
23s | 72 | gca | 137 | 137 | |
5s | 175 | 16s | 535 | 648 | |
cds | cds |
scc remarquesModifier
- Lien tableur: scc remarques
- Remarques : Ce génome se distingue par ses 3 blocs à rRNA avec 1 seul aa et le grand nombre de solitaires.
- @ Sur les 30 solitaires 9 sont rares dont ccc. Deux autres rares sont dans un blocs de 2 aas. Les 2 blocs de 5aas contiennent chacun un rare, tcg aag.
- @ Il n’y a pas plus d’un aa entre 16s et 23s et qui sont les plus communs, atc et gca comme les archées qui n’ont que gca. Les intercalaires, à par les cds, sont identiques sauf pour l’intercalaire aa-23s qui est différent entre atc et gca, du double, 40/79.
- @ Les 2 rares ne sont pas solitaires comme les 9 autres. Ils appartiennent à la même colonne, xag qui est plus fréquentes que la colonne xcg.
- @ 2 blocs avec 2 opérons solitaires séparés par un petit cds de 152 et 59 aas. Les intercalaires sont moyens pour le 1er (120 pbs) et faibles (30 pbs) pour le second.
- @ 2 blocs de 5 aas. Le dernier contient un aa rare et cgc au lieu de cgt.
- Séquences des doubles: pas de doubles.
scc distributionModifier
- Lien tableur: scc distribution
- Lien indices clades: cyano tener spiro beta epsilon delta bactéries
- Liens aux fiches: spiro tener gama alpha beta delta epsilon bacilli clostridia autres firmicutes actino bactero cyano archeo
- Légende: Tableau des indices, en-tête: total des génomes, total des tRNAs, indice ttt, indice tgt.
|
|
|
scc. Intergen51Modifier
Intergen51. scc. Le génomeModifier
- scc Le prélèvement: Artb
- Le nom et le lien NCBI: scc, Sphaerochaeta coccoides DSM 17374, NCBI [3], date 16.07.20.
- scc La longueur totale des intercalaires, longueur du génome et taux intercalaires/génome:
Nom intercals génome taux en % scc 214,658 2,227,296 9.6
scc données intercalairesModifier
- Lien tableur: scc données intercalaires
- Lien sauvegarde NCBI: Artb
scc autres intercalaires aasModifier
- Lien tableur: scc autres intercalaires aas
- Lien sauvegarde NCBI: Artb
Intergen51. scc. Les différents types d'intercalairesModifier
- Lien au tableur: Intergen51. scc les différents types d'intercalaires.
- Légende:
- - S pour intercalaire CDS-CDS et R pour tRNA-CDS,
- - c pour intercalaire continu (les 2 gènes sont sur le même brin) et x pour discontinu (les 2 gènes sont sur 2 brins différents, le brin et son complément)
- - %reste = 100*reste/total, le reste étant ce qui reste du total après la fin du diagramme, gamme.
- - %t30 = 100*t30/total, t30 étant le total des fréquences 10 20 30
- - %t5 = 100*t/total, t5 étant le total des fréquences de -1 à -5 dans le diagramme des S-.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Intergen51. scc. Les diagrammes CDS-CDS positifsModifier
- Lien tableur: Les diagrammes
- Diagrammes des gamma: scc présente 2 diagrammes
- - fc40, CDS-CDS continu, fréquence unitaire en abscisses et effectif en ordonnées
- - fx%, CDS-CDS discontinu, fréquences regroupées par 10 (freq10) en abscisses et pourcentage en ‰ par rapport au total, en ordonnées.
- Équations des courbes de tendance en pour 1000: colonnes %fx %fc
Courbes de tendances pour les diagrammes en pour 1000 Calculs des f.41 scc R2 x3 x2 x c Inflexion poly3 x c 0.702 2.69E-06 -1.79E-03 2.37E-01 28.30 fx1 abscisse 221.8 321.3 0.829 -8.29E-06 6.33E-03 -1.54E+00 129.0 fc1 ordonnée -8.7 6.4 0.745 2.36E-06 -1.57E-03 1.92E-01 30.5 fx41 0.938 -1.66E-06 1.60E-03 -5.41E-01 70.1 fc41
Intergen51. scc. Les CDS-CDS négatifsModifier
Sous-totaux scc totale fréquence x- c- x- c- - 1 0 39 4 4140 - 2 1 0 85 11 - 3 0 0 3 12 - 4 2 156 717 10938 - 5 0 0 5 19 sp6 25 124 1642 8424 total 28 319 2,456 23,544 reste 1 6 264 420 s6 9 1 361 41 s7 3 22 321 1438 s8 12 95 696 6525 rapport s1-5 4/2/1 2.0 4.0 8.4 2.6 % / sp6 s6/sp6 36.0 0.8 22.0 0.5 s7/sp6 12.0 17.7 19.5 17.1 s8/sp6 48.0 76.6 42.4 77.5 reste/sp6 4.0 4.8 16.1 5.0 total s1-5 3 195 814 15120 % / total %s1-5 10.7 61.1 33.1 64.2 %sp6 89.3 38.9 66.9 35.8
Intergen51. scc. Les intercalaires des blocsModifier
- Le détail
RNA-RNA c x CDS-RNA c x 23s 5s 3 CDS 16s 3 16s 23s 5s CDS 2 1 16s tRNA 3 16 CDS tRNA 23s 3 CDS 5s 5s tRNA 23s CDS tRNA in CDS 23s tRNA contig 5s 16s tRNA hors 10 16s16s tRNA 16s 23s tRNA tRNA 5s 16s 5s 5s 23s 5s 5s total 19 0 total 5 1
- Les rares voir gamma pour la longueur des intercalaires
- Les tRNA-CDS compris, comparaison dans le clade et dans l'étude.
Intergen51. scc. Les intercalaires tRNA-tRNA extra blocModifier
- Lien tableur: Intergen51. scc. Les intercalaires tRNA-tRNA extra bloc
inter | aa | |||
---|---|---|---|---|
10 | gag | |||
** | cag | |||
43 | gaa | |||
** | aaa | |||
32 | cac | |||
38 | cga | |||
37 | aag | |||
36 | cta | |||
** | ggc | |||
40 | tca | |||
25 | agc | |||
16 | cgc | |||
40 | tcg | |||
** | tcc |
scc intercalaires entre cdsModifier
- Lien NCBI [4]
- Note: Pour les génomes des annexes j'ai relevé les intercalaires entre tRNAs et entre ceux-ci et les cds qui leur sont adjacents. L'exemple est celui de rru du clade alpha. L'idée de départ de ces prélèvements est la recherche d'opérons formés de tRNA et de protéine comme dans le cas d'E.coli: l'intercalaire entre le tRNA et la protéine devrait être faible. Voir l'exemple d'eco (remarque @3) avec tac-tac-tpr et aca-tac-gga-acc-tufB.
scc intercalaires positifs S+Modifier
- Lien tableur: scc intercalaires positifs S+
- Diagrammes 400: scc ase, diagramme 1-40: c+ scc c+ ase x+ ase total, texte: ase.
- Légende: voir la légende de cvi.
scc | Sx+ | Sc+ | ||||||||||||
Poly3 | -7 | -5 | -3 | 1 | R2 | flex x+ | comment. | -7 | -5 | -3 | 1 | R2 | flex c+ | comment. |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 à 400 | 30 | -200 | 266 | 31 | 690 | 222 | max30 | -86 | 660 | -1605 | 134 | 830 | 256 | min60 |
31 à 400 | 2 parties | -7 | 162 | -551 | 72 | 949 | 318 | 2 parties | ||||||
droite | -a | cste | - | R2 | note | R2’ | -a | cste | - | R2 | note | R2’ | ||
1 à 400 | 104 | 46 | - | 619 | poly | 71 | tF | 197 | 65 | 499 | poly | 331 | SF | |
31 à 400 | 114 | 43 | - | 787 | poly | 162 | SF |
- Légende du tableau des corrélations et des fréquences faibles
effectifs diagramme | corrélation x+ c+, 41-n | corrélation x+ c+, 1-n | |||||||||
gen | minima | x+ | c+ | total | 400 | 200 | 250 | diff | 200 | 250 | 400 |
---|---|---|---|---|---|---|---|---|---|---|---|
blo | min20 | 448 | 993 | 1441 | 820 | 406 | 537 | 131 | 38 | 255 | 669 |
scc | min10 | 416 | 961 | 1377 | 748 | 440 | 530 | 90 | -88 | 49 | 367 |
cbn | min20 | 489 | 1701 | 2190 | 731 | 543 | 505 | -38 | -222 | -114 | 271 |
1-30 ‰ | effectifs | 0 ‰ | <0 ‰ | effectifs 1-40 | corel | ||||||
1-30 x+ | 1-30 c+ | x+/c+ | x | c | x | c | x- | c- | x+ | c+ | x+/c+ |
89 | 208 | 0.43 | 518 | 1255 | 4 | 1 | 35 | 167 | 54 | 241 | -109 |
118 | 353 | 0.33 | 485 | 1320 | 4 | 5 | 58 | 242 | 60 | 389 | -177 |
65 | 312 | 0.21 | 553 | 1940 | 2 | 5 | 17 | 86 | 56 | 620 | -382 |
- Diagrammes 400: scc ase, diagramme 1-40: c+ scc c+ ase x+ ase total, texte: ase.
- Résumé: C’est un génome bien particulier, le seul à avoir un maximum à la fréquence 30 pour x+ 1-400. J’ai essayé de le comparer à des génomes similaires avec des taux faibles aux fréquences 1-30 et un maximum plus en amont comme ase cvi myr, et seul ase s’en approche le plus avec un max à 70. On peut le comparer à bsu qui a un maximum à 40 mais x+ 1-400 est un Sf et c+ 31-400 est un tF. Enfin on peut le comparer à pmq mais son max est à 160 et c+ 31-400 est un Sf avec un R2’ de 51 bien plus petit que celui de scc avec 162; en plus avec pmq on aborde les corrélations très négatives, -852 contre 530 pour scc. Scc est donc plus proche de ase avec 2 corrélations positives, une moyenne, 530 de scc, et une maximum, 940 de ase mais qui descend à 725 en 1-250. Donc j’ai choisi ase malgré une grande différence dans les effectifs, 1377 contre 5956 pour ase. Les effectifs de bsu et pmq sont aussi plus élevés que celui de scc, respectivement 2441 et 4170.
- - Les diagrammes 400
- x+1-400
- + Le génome ase se distingue par un faux départ à la fréquence 10 comme maximum. Son taux 1-30 est de 135 ‰ or les vrais départ à 10 ont un taux supérieur à 169 (rru), ade ant mja pmg pub rru. Son vrai maximum est à 70 au-delà de 30 comme les 15 génomes restant. La forme de la courbe est un tilde faible, tf, due notamment au renflement au niveau du maximum 70 contrairement aux formes S des 6 vrais départs en 10, ade Sf 39, ant SF 71, mja SF 78, pmg SF 179, pub SF 249, rru Sf 20 (forme suivie du R2’).
- + Le génome ssc: en alignant les taux des 5 1ères fréquences, 10 20 30 40 50, j’obtiens 3 groupes de 7 génomes chacun.
- Le 1er, les taux décroissent fortement avec un taux à la fréquence 30 entre 38 et 68, ce sont: ade ant ase mja pmg pub rru.
- Le 2ème, les taux croissent fortement avec un taux à 30 entre 24 et 68, ce sont: abra afn blo bsu cbn myr scc. Seuls blo et scc ont un maximum en 30 avec respectivement un taux de 33 et 60.
- Le 3ème groupe varie peu avec un taux à 30 entre 7 et 18, ce sont: cbei cvi eco mba pmq rtb spl.
- + Malgré que ase et scc soient dans 2 groupes différents leur rapprochement est du au maximum à 70 de ase et à un 2ème maximum à 100 de scc.
- + La forme de la courbe est un tilde franc avec un R2’ de 71 contre 25 pour ase.
- + Le génome blo: j’aurais pu comparer scc à blo à cause de la forte ressemblance des 2 courbes x+ 1-400 (maximum à 30 et forme tF avec des effectifs similaires) mais ses courbes c+ n-400 sont nettement différentes de celles de scc, Sf 41 et tf 36 contre SF 331 et SF 162 (forme suivie du R2’).
- c+ n-400: ce sont les 4 courbes en commun avec des R2’ élevés pour 1-400 et moins élevés pour 31-400, 331 162 pour scc et 216 149 pour ase. Les points d’inflexion se trouvent à des fréquences moyennes, 256 et 318 pour scc, et 273 et 337 pour ase. Par ailleurs la 1ère partie de chaque courbe c+ 31-400 présente des bosses nettes qui s’éloignent de la courbe de décroissance en fonction de la distance.
- x+1-400
- - Les corrélations:
- ase a la corrélation 41-250 la plus élevée de tous les génomes étudiés et elle se maintient à 41-200, 922 contre 940. Par contre les faibles fréquences 1-30 diminuent fortement la corrélation sur 1-250 à 725.
- scc va se comporter comme ase avec les faibles fréquences mais avec une corrélation moyenne au départ, de 530 contre 940. Elle diminue fortement sur 41-200 au contraire de ase, la différence entre les 2 plages (diff) est de 90 contre 18 pour ase. Sur la plage 1-250 elle diminue comme ase mais plus fortement, elle devient quasiment nulle (49) alors que ase resiste (725).
- - Les faibles fréquences:
- Les faibles fréquences 1-30: scc avec 471‰ et largement au-dessus de ase, 135‰, à cause du maximum à la fréquence 30.
- Les taux des zéros sont à peu près identiques, 9‰ pour scc et 10‰ pour ase
- De même pour le taux des négatifs 300‰ pour scc contre 280‰ pour ase.
- Le rapport des faibles fréquences x+/c+ a peu de sens ici car les corrélations x+ 1-40 ci-dessous sont très faibles ou négatives.
- - Les diagrammes 40:
- Les 2 courbes c+ sont très proches du modèle des c+ 1-40 malgré la faiblesse de l’effectif de scc de 389 contre 1165 d’ase.
- Les effectifs x+ 1-40 de scc, 60, sont trop faibles pour faire des comparaisons significatives. Chez ase avec un effectif de 389 j’ai pu montrer que la courbe x+ 1-40 est différente du modèle c+ 1-40.
- Les corrélations x+/c+ 1-40 traduisent les formes des courbes aux faibles fréquences 1-30. Avec une corrélation de 0.346, ase a les taux des fréquences qui décroissent parallèlement en x+ et c+, mais elle reste faible par rapport à pmg, par exemple, avec 0.703. Scc a sa corrélation négative, -0.177, montrant que les 2 courbes ont des pentes opposées à ce niveau.
- - Les diagrammes 400
scc autres intercalairesModifier
- Lien tableur: scc autres intercalaires aas
- Légende:
- - comp, le gène est sur le brin complement
- - deb, fin sont respectivement dans le sens des adresses croissantes, le cds avant le 1er tRNA et le cds après le dernier tRNA du bloc.
- Totaux: 2 repeat_region 1 regulatory 1 ncRNA 1 tmRNA
tRNA-cds tRNA-tRNA autres-cds total c+ x+ x- c+ x+ c- c+ x+ c- 38 36 20 9 1 104
- Méthode de calculs des intercalaires autres que les CDS-CDS voir le cas de amed.
scc par rapport au groupe de référenceModifier
- Lien tableur: scc par rapport au groupe de référence
- Le groupe de référence: voir la référence
- Légende:
- - carré ccc, c'est ctc gtc ccc gcc
- - g+cga, c'est gtg xcg xag ggg cga (dans l'hypothèse de la bascule des cgx, cgt/cgc cga/cgg)
tRNAs | blocs tRNAs | blocs rRNAs | |||||||
scc | 1aa | >1aa | dup | +5s | 1-3aas | autres | total | ||
---|---|---|---|---|---|---|---|---|---|
21 | faible | 11 | 6 | 17 | |||||
16 | moyen | 9 | 5 | 3 | 17 | ||||
14 | fort | 10 | 3 | 13 | |||||
30 | 14 | 0 | 0 | 0 | 3 | 47 | |||
10 | g+cga | 5 | 6 | 11 | |||||
2 | agg+cgg | 2 | 2 | ||||||
4 | carre ccc | 4 | 4 | ||||||
5 | autres | 0 | |||||||
11 | 6 | 0 | 0 | 0 | 0 | 17 | |||
total tRNAs ‰ | |||||||||
scc | 1aa | >1aa | dup | +5s | 1-3aas | autres | scc ‰ | ref.‰ | |
21 | faible | 234 | 128 | 362 | 26 | ||||
16 | moyen | 191 | 106 | 64 | 362 | 324 | |||
14 | fort | 213 | 64 | 277 | 650 | ||||
638 | 298 | 64 | 47 | 729 | |||||
10 | g+cga | 106 | 128 | 234 | 10 | ||||
2 | agg+cgg | 43 | 43 | ||||||
4 | carre ccc | 85 | 85 | 16 | |||||
5 | autres | ||||||||
234 | 128 | 362 | |||||||
blocs tRNAs ‰ | total colonne % | ||||||||
scc | 1aa | >1aa | dup | total | ref.‰ | 1aa | >1aa | dup | |
21 | faible | 250 | 136 | 386 | 26 | 37 | 43 | ||
16 | moyen | 205 | 114 | 318 | 324 | 30 | 36 | ||
14 | fort | 227 | 68 | 295 | 650 | 33 | 21 | ||
682 | 318 | 44 | 729 | 30 | 14 | ||||
10 | g+cga | 114 | 136 | 250 | 10 | 45 | 100 | ||
2 | agg+cgg | 45 | 45 | 18 | |||||
4 | carre ccc | 91 | 91 | 16 | 36 | ||||
5 | autres | ||||||||
250 | 136 | 386 | 11 | 6 |
spirochetes, estimation des -rRNAsModifier
- Lien tableur: spirochetes, estimation des -rRNAs
- Liens fiche: typage
- Légende: prélèvement de la base gtRNAdb le 11.1.21
- - ttt et tgt sont nuls partout
- - atgi, c'est Ile2, mis à la place de ttt, très rare chez les procaryotes.
- - atgf, c'est Metf, mis à la place de tgt, très rare chez les procaryotes.
- - atgj, c'est Met, remplace le atg standard qui est la somme Ile2 Met fMet.
- - Voir la légende des tris, g1 t1 et des couleurs
spirochetes, calcul des -rRNAsModifier
- Lien tableur: spirochetes, calcul des -rRNAs
|
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
spirochetes, comparaison clade-annexe des -rRNAsModifier
- Lien tableur: spirochetes, comparaison clade-annexe des -rRNAs
- Légende
- - spi7. diff, somme des couleurs de spi7. La différence entre tRNAs est faite entre spi5 et spi6 du tableau précédent. Elle est exprimée en % et rapporté à la plus grande valeur des 2 termes de la différence. Ce qui fait quand un tRNA est à zéro la différence en % est égale à 100.
- - spi8. rap, rapport des sommes couleurs spi5/spi2. Le rapport -rRNA/total est celui du tRNA de spi5 sur celui de spi2.
- Fréquences des différences en % du tableau spi7
gamme 0/0 10 20 30 40 50 60 70 80 90 100 total fréquence 27 2 1 1 5 6 1 1 0 5 0 49 tot ≤ 50 36
- Comparaison avec le nombre de tRNAs de la fiche du clade: L’estimation des -rRNA par l'annexe est 18% au dessus de celle de la fiche des spirochetes.
tRNAs fiche annexe sans 485 44 avec 22 3 genomes 13 1 indice % 37 44
|
|