# -*- coding: utf-8 -*-
fixes = {
'encodage': {
'regex': True,
'nocase': False,
'msg': {
'cs': ur'Bot : Oprava kódování znaků',
'de': ur'Bot : Fixed Zeichenkodierung',
'el': ur'Bot : Σταθερή κωδικοποίησης χαρακτήρων',
'en': ur'Bot : Fixed character encoding',
'es': ur'Bot : carácter fijo de codificación',
'fi': ur'Bot : Kiinteät merkkikoodauksen',
'fr': ur'Robot : Correction des encodages de caractère',
'it': ur'Bot : carattere di codifica fissa',
'ja': ur'Bot : 固定文字エンコーディング',
'rur': ur'Bot : Исправлены кодировки',
},
'replacements': [
(ur'"', ur'"'),
(ur'&', ur'&'),
(ur''', ur"'"),
(ur'/', ur'/'),
(ur'<', ur'<'),
(ur'>', ur'>'),
(ur'A', ur'A'),
(ur'B', ur'B'),
(ur'C', ur'C'),
(ur'D', ur'D'),
(ur'E', ur'E'),
(ur'F', ur'F'),
(ur'G', ur'G'),
(ur'H', ur'H'),
(ur'I', ur'I'),
(ur'J', ur'J'),
(ur'K', ur'K'),
(ur'L', ur'L'),
(ur'M', ur'M'),
(ur'N', ur'N'),
(ur'O', ur'O'),
(ur'P', ur'P'),
(ur'Q', ur'Q'),
(ur'R', ur'R'),
(ur'S', ur'S'),
(ur'T', ur'T'),
(ur'U', ur'U'),
(ur'V', ur'V'),
(ur'W', ur'W'),
(ur'X', ur'X'),
(ur'Y', ur'Y'),
(ur'Z', ur'Z'),
(ur'[', ur'['),
(ur']', ur']'),
(ur'a', ur'a'),
(ur'b', ur'b'),
(ur'c', ur'c'),
(ur'd', ur'd'),
(ur'e', ur'e'),
(ur'f', ur'f'),
(ur'g', ur'g'),
(ur'h', ur'h'),
(ur'i', ur'i'),
(ur'j', ur'j'),
(ur'k', ur'k'),
(ur'l', ur'l'),
(ur'm', ur'm'),
(ur'n', ur'n'),
(ur'o', ur'o'),
(ur'p', ur'p'),
(ur'q', ur'q'),
(ur'r', ur'r'),
(ur's', ur's'),
(ur't', ur't'),
(ur'u', ur'u'),
(ur'v', ur'v'),
(ur'w', ur'w'),
(ur'x', ur'x'),
(ur'y', ur'y'),
(ur'Ý', ur'Ý'),
(ur'z', ur'z'),
(ur'|', ur'|'),
(ur'ƒ', ur'ƒ'),
(ur'„', ur'„'),
(ur'…', ur'…'),
(ur'†', ur'†'),
(ur'‡', ur'‡'),
(ur'ˆ', ur'ˆ'),
(ur'‰', ur'‰'),
(ur'Š', ur'Š'),
(ur'‹', ur'‹'),
(ur'Œ', ur'Œ'),
(ur'‘', ur'‘'),
(ur'’', ur'’'),
(ur'“', ur'“'),
(ur'”', ur'”'),
(ur'•', ur'•'),
(ur'–', ur'–'),
(ur'—', ur'—'),
(ur'˜', ur'˜'),
(ur'™', ur'™'),
(ur'š', ur'š'),
(ur'›', ur'›'),
(ur'œ', ur'œ'),
(ur'Ÿ', ur'Ÿ'),
(ur' ', ur' '),
(ur'¡', ur'¡'),
(ur'¢', ur'¢'),
(ur'£', ur'£'),
(ur'¤', ur'¤'),
(ur'¥', ur'¥'),
(ur'¦', ur'¦'),
(ur'§', ur'§'),
(ur'¨', ur'¨'),
(ur'©', ur'©'),
(ur'ª', ur'ª'),
(ur'«', ur'«'),
(ur'¬', ur'¬'),
(ur'­', ur''),
(ur'®', ur'®'),
(ur'¯', ur'¯'),
(ur'°', ur'°'),
(ur'±', ur'±'),
(ur'²', ur'²'),
(ur'³', ur'³'),
(ur'´', ur'´'),
(ur'µ', ur'µ'),
(ur'¶', ur'¶'),
(ur'·', ur'·'),
(ur'¸', ur'¸'),
(ur'¹', ur'¹'),
(ur'º', ur'º'),
(ur'»', ur'»'),
(ur'¼', ur'¼'),
(ur'½', ur'½'),
(ur'¾', ur'¾'),
(ur'¿', ur'¿'),
(ur'À', ur'À'),
(ur'Á', ur'Á'),
(ur'Â', ur'Â'),
(ur'Ã', ur'Ã'),
(ur'Ä', ur'Ä'),
(ur'Å', ur'Å'),
(ur'Æ', ur'Æ'),
(ur'Ç', ur'Ç'),
(ur'È', ur'È'),
(ur'É', ur'É'),
(ur'Ê', ur'Ê'),
(ur'Ë', ur'Ë'),
(ur'Ì', ur'Ì'),
(ur'Í', ur'Í'),
(ur'Î', ur'Î'),
(ur'Ï', ur'Ï'),
(ur'Ð', ur'Ð'),
(ur'Ñ', ur'Ñ'),
(ur'Ò', ur'Ò'),
(ur'Ó', ur'Ó'),
(ur'Ô', ur'Ô'),
(ur'Õ', ur'Õ'),
(ur'Ö', ur'Ö'),
(ur'×', ur'×'),
(ur'Ø', ur'Ø'),
(ur'Ù', ur'Ù'),
(ur'Ú', ur'Ú'),
(ur'Û', ur'Û'),
(ur'Ü', ur'Ü'),
(ur'Ý', ur'Ý'),
(ur'Þ', ur'Þ'),
(ur'ß', ur'ß'),
(ur'à', ur'à'),
(ur'á', ur'á'),
(ur'â', ur'â'),
(ur'ã', ur'ã'),
(ur'ä', ur'ä'),
(ur'å', ur'å'),
(ur'æ', ur'æ'),
(ur'ç', ur'ç'),
(ur'è', ur'è'),
(ur'é', ur'é'),
(ur'ê', ur'ê'),
(ur'ë', ur'ë'),
(ur'ì', ur'ì'),
(ur'í', ur'í'),
(ur'î', ur'î'),
(ur'ï', ur'ï'),
(ur'ð', ur'ð'),
(ur'ñ', ur'ñ'),
(ur'ò', ur'ò'),
(ur'ó', ur'ó'),
(ur'ô', ur'ô'),
(ur'õ', ur'õ'),
(ur'ö', ur'ö'),
(ur'÷', ur'÷'),
(ur'ø', ur'ø'),
(ur'ù', ur'ù'),
(ur'ú', ur'ú'),
(ur'û', ur'û'),
(ur'ü', ur'ü'),
(ur'ý', ur'ý'),
(ur'þ', ur'þ'),
(ur'ÿ', ur'ÿ'),
(ur'Ā', ur'Ā'),
(ur'ā', ur'ā'),
(ur'Ă', ur'Ă'),
(ur'ă', ur'ă'),
(ur'Ą', ur'Ą'),
(ur'ą', ur'ą'),
(ur'Ć', ur'Ć'),
(ur'ć', ur'ć'),
(ur'Ĉ', ur'Ĉ'),
(ur'ĉ', ur'ĉ'),
(ur'Ċ', ur'Ċ'),
(ur'ċ', ur'ċ'),
(ur'Č', ur'Č'),
(ur'č', ur'č'),
(ur'Ď', ur'Ď'),
(ur'ď', ur'ď'),
(ur'Đ', ur'Đ'),
(ur'đ', ur'đ'),
(ur'Ē', ur'Ē'),
(ur'ē', ur'ē'),
(ur'Ĕ', ur'Ĕ'),
(ur'ĕ', ur'ĕ'),
(ur'Ė', ur'Ė'),
(ur'ė', ur'ė'),
(ur'Ę', ur'Ę'),
(ur'ę', ur'ę'),
(ur'Ě', ur'Ě'),
(ur'ě', ur'ě'),
(ur'Ĝ', ur'Ĝ'),
(ur'ĝ', ur'ĝ'),
(ur'Ğ', ur'Ğ'),
(ur'ğ', ur'ğ'),
(ur'Ġ', ur'Ġ'),
(ur'ġ', ur'ġ'),
(ur'Ģ', ur'Ģ'),
(ur'ģ', ur'ģ'),
(ur'Ĥ', ur'Ĥ'),
(ur'ĥ', ur'ĥ'),
(ur'Ħ', ur'Ħ'),
(ur'ħ', ur'ħ'),
(ur'Ĩ', ur'Ĩ'),
(ur'ĩ', ur'ĩ'),
(ur'Ī', ur'Ī'),
(ur'ī', ur'ī'),
(ur'Ĭ', ur'Ĭ'),
(ur'ĭ', ur'ĭ'),
(ur'Į', ur'Į'),
(ur'į', ur'į'),
(ur'İ', ur'İ'),
(ur'ı', ur'ı'),
(ur'IJ', ur'IJ'),
(ur'ij', ur'ij'),
(ur'Ĵ', ur'Ĵ'),
(ur'ĵ', ur'ĵ'),
(ur'Ķ', ur'Ķ'),
(ur'ķ', ur'ķ'),
(ur'ĸ', ur'ĸ'),
(ur'Ĺ', ur'Ĺ'),
(ur'ĺ', ur'ĺ'),
(ur'Ļ', ur'Ļ'),
(ur'ļ', ur'ļ'),
(ur'Ľ', ur'Ľ'),
(ur'ľ', ur'ľ'),
(ur'Ŀ', ur'Ŀ'),
(ur'ŀ', ur'ŀ'),
(ur'Ł', ur'Ł'),
(ur'ł', ur'ł'),
(ur'Ń', ur'Ń'),
(ur'ń', ur'ń'),
(ur'Ņ', ur'Ņ'),
(ur'ņ', ur'ņ'),
(ur'Ň', ur'Ň'),
(ur'ň', ur'ň'),
(ur'ʼn', ur'ʼn'),
(ur'Ŋ', ur'Ŋ'),
(ur'ŋ', ur'ŋ'),
(ur'Ō', ur'Ō'),
(ur'ō', ur'ō'),
(ur'Ŏ', ur'Ŏ'),
(ur'ŏ', ur'ŏ'),
(ur'Ő', ur'Ő'),
(ur'ő', ur'ő'),
(ur'Œ', ur'Œ'),
(ur'œ', ur'œ'),
(ur'Ŕ', ur'Ŕ'),
(ur'ŕ', ur'ŕ'),
(ur'Ŗ', ur'Ŗ'),
(ur'ŗ', ur'ŗ'),
(ur'Ř', ur'Ř'),
(ur'ř', ur'ř'),
(ur'Ś', ur'Ś'),
(ur'ś', ur'ś'),
(ur'Ŝ', ur'Ŝ'),
(ur'ŝ', ur'ŝ'),
(ur'Ş', ur'Ş'),
(ur'ş', ur'ş'),
(ur'Š', ur'Š'),
(ur'š', ur'š'),
(ur'Ţ', ur'Ţ'),
(ur'ţ', ur'ţ'),
(ur'Ť', ur'Ť'),
(ur'ť', ur'ť'),
(ur'Ŧ', ur'Ŧ'),
(ur'ŧ', ur'ŧ'),
(ur'Ũ', ur'Ũ'),
(ur'ũ', ur'ũ'),
(ur'Ū', ur'Ū'),
(ur'ū', ur'ū'),
(ur'Ŭ', ur'Ŭ'),
(ur'ŭ', ur'ŭ'),
(ur'Ů', ur'Ů'),
(ur'ů', ur'ů'),
(ur'Ű', ur'Ű'),
(ur'ű', ur'ű'),
(ur'Ų', ur'Ų'),
(ur'ų', ur'ų'),
(ur'Ŵ', ur'Ŵ'),
(ur'ŵ', ur'ŵ'),
(ur'Ŷ', ur'Ŷ'),
(ur'ŷ', ur'ŷ'),
(ur'Ź', ur'Ź'),
(ur'ź', ur'ź'),
(ur'Ż', ur'Ż'),
(ur'ż', ur'ż'),
(ur'Ž', ur'Ž'),
(ur'ž', ur'ž'),
(ur'ſ', ur'ſ'),
(ur'ƒ', ur'ƒ'),
(ur'Ʒ', ur'Ʒ'),
(ur'DŽ', ur'DŽ'),
(ur'Dž', ur'Dž'),
(ur'dž', ur'dž'),
(ur'LJ', ur'LJ'),
(ur'Lj', ur'Lj'),
(ur'lj', ur'lj'),
(ur'NJ', ur'NJ'),
(ur'Nj', ur'Nj'),
(ur'nj', ur'nj'),
(ur'Ǟ', ur'Ǟ'),
(ur'ǟ', ur'ǟ'),
(ur'Ǥ', ur'Ǥ'),
(ur'ǥ', ur'ǥ'),
(ur'Ǧ', ur'Ǧ'),
(ur'ǧ', ur'ǧ'),
(ur'Ǩ', ur'Ǩ'),
(ur'ǩ', ur'ǩ'),
(ur'Ǯ', ur'Ǯ'),
(ur'ǯ', ur'ǯ'),
(ur'DZ', ur'DZ'),
(ur'Dz', ur'Dz'),
(ur'dz', ur'dz'),
(ur'Ǵ', ur'Ǵ'),
(ur'ǵ', ur'ǵ'),
(ur'Ǻ', ur'Ǻ'),
(ur'ǻ', ur'ǻ'),
(ur'Ǽ', ur'Ǽ'),
(ur'ǽ', ur'ǽ'),
(ur'Ǿ', ur'Ǿ'),
(ur'ǿ', ur'ǿ'),
(ur'ɼ', ur'ɼ'),
(ur'ʒ', ur'ʒ'),
(ur'Ḃ', ur'Ḃ'),
(ur'ḃ', ur'ḃ'),
(ur'Ḋ', ur'Ḋ'),
(ur'ḋ', ur'ḋ'),
(ur'Ḑ', ur'Ḑ'),
(ur'ḑ', ur'ḑ'),
(ur'Ḟ', ur'Ḟ'),
(ur'ḟ', ur'ḟ'),
(ur'Ḱ', ur'Ḱ'),
(ur'ḱ', ur'ḱ'),
(ur'Ṁ', ur'Ṁ'),
(ur'ṁ', ur'ṁ'),
(ur'Ṗ', ur'Ṗ'),
(ur'ṗ', ur'ṗ'),
(ur'Ṡ', ur'Ṡ'),
(ur'ṡ', ur'ṡ'),
(ur'Ṫ', ur'Ṫ'),
(ur'ṫ', ur'ṫ'),
(ur'Ẁ', ur'Ẁ'),
(ur'ẁ', ur'ẁ'),
(ur'Ẃ', ur'Ẃ'),
(ur'ẃ', ur'ẃ'),
(ur'Ẅ', ur'Ẅ'),
(ur'ẅ', ur'ẅ'),
(ur'Ỳ', ur'Ỳ'),
(ur'ỳ', ur'ỳ'),
(ur'‑', ur'‑'),
(ur'ff', ur'ff'),
(ur'fi', ur'fi'),
(ur'fl', ur'fl'),
(ur'ffi', ur'ffi'),
(ur'ffl', ur'ffl'),
(ur'ſt', ur'ſt'),
# Caractères graphique
#
(ur'[\%\.]21', ur'!'),
(ur'[\%\.]22', ur'"'),
(ur'[\%\.]23', ur'#'),
(ur'[\%\.]24', ur'$'),
(ur'[\%\.]25', ur'%'),
(ur'[\%\.]26', ur'&'),
(ur'[\%\.]27', ur"'"),
(ur'[\%\.]28', ur'('),
(ur'[\%\.]29', ur')'),
(ur'[\%\.]2a', ur'*'),
(ur'[\%\.]2b', ur'+'),
(ur'[\%\.]2c', ur','),
(ur'[\%\.]2d', ur'-'),
(ur'[\%\.]2e', ur'.'),
(ur'[\%\.]2f', ur'/'),
(ur'[\%\.]30', ur'0'),
(ur'[\%\.]31', ur'1'),
(ur'[\%\.]32', ur'2'),
(ur'[\%\.]33', ur'3'),
(ur'[\%\.]34', ur'4'),
(ur'[\%\.]35', ur'5'),
(ur'[\%\.]36', ur'6'),
(ur'[\%\.]37', ur'7'),
(ur'[\%\.]38', ur'8'),
(ur'[\%\.]39', ur'9'),
(ur'[\%\.]3a', ur':'),
(ur'[\%\.]3b', ur';'),
(ur'[\%\.]3c', ur'<'),
(ur'[\%\.]3d', ur'='),
(ur'[\%\.]3e', ur'>'),
(ur'[\%\.]3f', ur'?'),
(ur'[\%\.]40', ur'@'),
(ur'[\%\.]41', ur'A'),
(ur'[\%\.]42', ur'B'),
(ur'[\%\.]43', ur'C'),
(ur'[\%\.]44', ur'D'),
(ur'[\%\.]45', ur'E'),
(ur'[\%\.]46', ur'F'),
(ur'[\%\.]47', ur'G'),
(ur'[\%\.]48', ur'H'),
(ur'[\%\.]49', ur'I'),
(ur'[\%\.]4a', ur'J'),
(ur'[\%\.]4b', ur'K'),
(ur'[\%\.]4c', ur'L'),
(ur'[\%\.]4d', ur'M'),
(ur'[\%\.]4e', ur'N'),
(ur'[\%\.]4f', ur'O'),
(ur'[\%\.]50', ur'P'),
(ur'[\%\.]51', ur'Q'),
(ur'[\%\.]52', ur'R'),
(ur'[\%\.]53', ur'S'),
(ur'[\%\.]54', ur'T'),
(ur'[\%\.]55', ur'U'),
(ur'[\%\.]56', ur'V'),
(ur'[\%\.]57', ur'W'),
(ur'[\%\.]58', ur'X'),
(ur'[\%\.]59', ur'Y'),
(ur'[\%\.]5a', ur'Z'),
(ur'[\%\.]5b', ur'['),
# (ur'[\%\.]5c', ur'\'),
(ur'[\%\.]5d', ur']'),
(ur'[\%\.]5e', ur'^'),
(ur'[\%\.]5f', ur'_'),
(ur'[\%\.]60', ur'`'),
(ur'[\%\.]61', ur'a'),
(ur'[\%\.]62', ur'b'),
(ur'[\%\.]63', ur'c'),
(ur'[\%\.]64', ur'd'),
(ur'[\%\.]65', ur'e'),
(ur'[\%\.]66', ur'f'),
(ur'[\%\.]67', ur'g'),
(ur'[\%\.]68', ur'h'),
(ur'[\%\.]69', ur'i'),
(ur'[\%\.]6a', ur'j'),
(ur'[\%\.]6b', ur'k'),
(ur'[\%\.]6c', ur'l'),
(ur'[\%\.]6d', ur'm'),
(ur'[\%\.]6e', ur'n'),
(ur'[\%\.]6f', ur'o'),
(ur'[\%\.]70', ur'p'),
(ur'[\%\.]71', ur'q'),
(ur'[\%\.]72', ur'r'),
(ur'[\%\.]73', ur's'),
(ur'[\%\.]74', ur't'),
(ur'[\%\.]75', ur'u'),
(ur'[\%\.]76', ur'v'),
(ur'[\%\.]77', ur'w'),
(ur'[\%\.]78', ur'x'),
(ur'[\%\.]79', ur'y'),
(ur'[\%\.]7a', ur'z'),
(ur'[\%\.]7b', ur'{'),
(ur'[\%\.]7c', ur'|'),
(ur'[\%\.]7d', ur'}'),
(ur'[\%\.]7e', ur'~'),
(ur'[\%\.]7f', ur'?'),
(ur'[\%\.]80', ur'€'),
(ur'[\%\.]81', ur''),
(ur'[\%\.]82', ur'‚'),
(ur'[\%\.]83', ur'ƒ'),
(ur'[\%\.]84', ur'„'),
(ur'[\%\.]85', ur'…'),
(ur'[\%\.]86', ur'†'),
(ur'[\%\.]87', ur'‡'),
(ur'[\%\.]88', ur'ˆ'),
(ur'[\%\.]89', ur'‰'),
(ur'[\%\.]8a', ur'Š'),
(ur'[\%\.]8b', ur'‹'),
(ur'[\%\.]8c', ur'Œ'),
(ur'[\%\.]8d', ur''),
(ur'[\%\.]8e', ur'Ž'),
(ur'[\%\.]8f', ur''),
(ur'[\%\.]90', ur''),
(ur'[\%\.]91', ur'‘'),
(ur'[\%\.]92', ur'’'),
(ur'[\%\.]93', ur'“'),
(ur'[\%\.]94', ur'”'),
(ur'[\%\.]95', ur'•'),
(ur'[\%\.]96', ur'–'),
(ur'[\%\.]97', ur'—'),
(ur'[\%\.]98', ur'˜'),
(ur'[\%\.]99', ur'™'),
(ur'[\%\.]9a', ur'š'),
(ur'[\%\.]9b', ur'›'),
(ur'[\%\.]9c', ur'œ'),
(ur'[\%\.]9d', ur''),
(ur'[\%\.]9e', ur'ž'),
(ur'[\%\.]9f', ur'Ÿ'),
(ur'[\%\.]a0', ur' '),
(ur'[\%\.]a1', ur'¡'),
(ur'[\%\.]a2', ur'¢'),
(ur'[\%\.]a3', ur'£'),
(ur'[\%\.]a4', ur'¤'),
(ur'[\%\.]a5', ur'¥'),
(ur'[\%\.]a6', ur'¦'),
(ur'[\%\.]a7', ur'§'),
(ur'[\%\.]a8', ur'¨'),
(ur'[\%\.]a9', ur'©'),
(ur'[\%\.]aa', ur'ª'),
(ur'[\%\.]ab', ur'«'),
(ur'[\%\.]ac', ur'¬'),
(ur'[\%\.]ad', ur''),
(ur'[\%\.]ae', ur'®'),
(ur'[\%\.]af', ur'¯'),
(ur'[\%\.]b0', ur'°'),
(ur'[\%\.]b1', ur'±'),
(ur'[\%\.]b2', ur'²'),
(ur'[\%\.]b3', ur'³'),
(ur'[\%\.]b4', ur'´'),
(ur'[\%\.]b5', ur'µ'),
(ur'[\%\.]b6', ur'¶'),
(ur'[\%\.]b7', ur'·'),
(ur'[\%\.]b8', ur'¸'),
(ur'[\%\.]b9', ur'¹'),
(ur'[\%\.]ba', ur'º'),
(ur'[\%\.]bb', ur'»'),
(ur'[\%\.]bc', ur'¼'),
(ur'[\%\.]bd', ur'½'),
(ur'[\%\.]be', ur'¾'),
(ur'[\%\.]bf', ur'¿'),
(ur'[\%\.]c0', ur'À'),
(ur'[\%\.]c1', ur'Á'),
(ur'[\%\.]c2', ur'Â'),
(ur'[\%\.]c3', ur'Ã'),
(ur'[\%\.]c4', ur'Ä'),
(ur'[\%\.]c5', ur'Å'),
(ur'[\%\.]c6', ur'Æ'),
(ur'[\%\.]c7', ur'Ç'),
(ur'[\%\.]c8', ur'È'),
(ur'[\%\.]c9', ur'É'),
(ur'[\%\.]ca', ur'Ê'),
(ur'[\%\.]cb', ur'Ë'),
(ur'[\%\.]cc', ur'Ì'),
(ur'[\%\.]cd', ur'Í'),
(ur'[\%\.]ce', ur'Î'),
(ur'[\%\.]cf', ur'Ï'),
(ur'[\%\.]d0', ur'Ð'),
(ur'[\%\.]d1', ur'Ñ'),
(ur'[\%\.]d2', ur'Ò'),
(ur'[\%\.]d3', ur'Ó'),
(ur'[\%\.]d4', ur'Ô'),
(ur'[\%\.]d5', ur'Õ'),
(ur'[\%\.]d6', ur'Ö'),
(ur'[\%\.]d7', ur'×'),
(ur'[\%\.]d8', ur'Ø'),
(ur'[\%\.]d9', ur'Ù'),
# (ur'[\%\.]da', ur'Ú'),
(ur'[\%\.]db', ur'Û'),
(ur'[\%\.]dc', ur'Ü'),
(ur'[\%\.]dd', ur'Ý'),
(ur'[\%\.]de', ur'Þ'),
(ur'[\%\.]df', ur'ß'),
(ur'[\%\.]e0', ur'à'),
(ur'[\%\.]e1', ur'á'),
(ur'[\%\.]e2', ur'â'),
(ur'[\%\.]e3', ur'ã'),
(ur'[\%\.]e4', ur'ä'),
(ur'[\%\.]e5', ur'å'),
(ur'[\%\.]e6', ur'æ'),
(ur'[\%\.]e7', ur'ç'),
(ur'[\%\.]e8', ur'è'),
(ur'[\%\.]e9', ur'é'),
(ur'[\%\.]ea', ur'ê'),
(ur'[\%\.]eb', ur'ë'),
(ur'[\%\.]ec', ur'ì'),
(ur'[\%\.]ed', ur'í'),
(ur'[\%\.]ee', ur'î'),
(ur'[\%\.]ef', ur'ï'),
(ur'[\%\.]f0', ur'ð'),
(ur'[\%\.]f1', ur'ñ'),
(ur'[\%\.]f2', ur'ò'),
(ur'[\%\.]f3', ur'ó'),
(ur'[\%\.]f4', ur'ô'),
(ur'[\%\.]f5', ur'õ'),
(ur'[\%\.]f6', ur'ö'),
(ur'[\%\.]f7', ur'÷'),
(ur'[\%\.]f8', ur'ø'),
(ur'[\%\.]f9', ur'ù'),
(ur'[\%\.]fa', ur'ú'),
(ur'[\%\.]fb', ur'û'),
(ur'[\%\.]fc', ur'ü'),
(ur'[\%\.]fd', ur'ý'),
(ur'[\%\.]fe', ur'þ'),
(ur'[\%\.]ff', ur'ÿ'),
(ur'[\%\.]100', ur'Ā'),
(ur'[\%\.]101', ur'ā'),
(ur'[\%\.]102', ur'Ă'),
(ur'[\%\.]103', ur'ă'),
(ur'[\%\.]104', ur'Ą'),
(ur'[\%\.]105', ur'ą'),
(ur'[\%\.]106', ur'Ć'),
(ur'[\%\.]107', ur'ć'),
(ur'[\%\.]108', ur'Ĉ'),
(ur'[\%\.]109', ur'ĉ'),
(ur'[\%\.]10a', ur'Ċ'),
(ur'[\%\.]10b', ur'ċ'),
(ur'[\%\.]10c', ur'Č'),
(ur'[\%\.]10d', ur'č'),
(ur'[\%\.]10e', ur'Ď'),
(ur'[\%\.]10f', ur'ď'),
(ur'[\%\.]110', ur'Đ'),
(ur'[\%\.]111', ur'đ'),
(ur'[\%\.]112', ur'Ē'),
(ur'[\%\.]113', ur'ē'),
(ur'[\%\.]114', ur'Ĕ'),
(ur'[\%\.]115', ur'ĕ'),
(ur'[\%\.]116', ur'Ė'),
(ur'[\%\.]117', ur'ė'),
(ur'[\%\.]118', ur'Ę'),
(ur'[\%\.]119', ur'ę'),
(ur'[\%\.]11a', ur'Ě'),
(ur'[\%\.]11b', ur'ě'),
(ur'[\%\.]11c', ur'Ĝ'),
(ur'[\%\.]11d', ur'ĝ'),
(ur'[\%\.]11e', ur'Ğ'),
(ur'[\%\.]11f', ur'ğ'),
(ur'[\%\.]120', ur'Ġ'),
(ur'[\%\.]121', ur'ġ'),
(ur'[\%\.]122', ur'Ģ'),
(ur'[\%\.]123', ur'ģ'),
(ur'[\%\.]124', ur'Ĥ'),
(ur'[\%\.]125', ur'ĥ'),
(ur'[\%\.]126', ur'Ħ'),
(ur'[\%\.]127', ur'ħ'),
(ur'[\%\.]128', ur'Ĩ'),
(ur'[\%\.]129', ur'ĩ'),
(ur'[\%\.]12a', ur'Ī'),
(ur'[\%\.]12b', ur'ī'),
(ur'[\%\.]12c', ur'Ĭ'),
(ur'[\%\.]12d', ur'ĭ'),
(ur'[\%\.]12e', ur'Į'),
(ur'[\%\.]12f', ur'į'),
(ur'[\%\.]130', ur'İ'),
(ur'[\%\.]131', ur'ı'),
(ur'[\%\.]132', ur'IJ'),
(ur'[\%\.]133', ur'ij'),
(ur'[\%\.]134', ur'Ĵ'),
(ur'[\%\.]135', ur'ĵ'),
(ur'[\%\.]136', ur'Ķ'),
(ur'[\%\.]137', ur'ķ'),
(ur'[\%\.]138', ur'ĸ'),
(ur'[\%\.]139', ur'Ĺ'),
(ur'[\%\.]13a', ur'ĺ'),
(ur'[\%\.]13b', ur'Ļ'),
(ur'[\%\.]13c', ur'ļ'),
(ur'[\%\.]13d', ur'Ľ'),
(ur'[\%\.]13e', ur'ľ'),
(ur'[\%\.]13f', ur'Ŀ'),
(ur'[\%\.]140', ur'ŀ'),
(ur'[\%\.]141', ur'Ł'),
(ur'[\%\.]142', ur'ł'),
(ur'[\%\.]143', ur'Ń'),
(ur'[\%\.]144', ur'ń'),
(ur'[\%\.]145', ur'Ņ'),
(ur'[\%\.]146', ur'ņ'),
(ur'[\%\.]147', ur'Ň'),
(ur'[\%\.]148', ur'ň'),
(ur'[\%\.]149', ur'ʼn'),
(ur'[\%\.]14a', ur'Ŋ'),
(ur'[\%\.]14b', ur'ŋ'),
(ur'[\%\.]14c', ur'Ō'),
(ur'[\%\.]14d', ur'ō'),
(ur'[\%\.]14e', ur'Ŏ'),
(ur'[\%\.]14f', ur'ŏ'),
(ur'[\%\.]150', ur'Ő'),
(ur'[\%\.]151', ur'ő'),
(ur'[\%\.]152', ur'Œ'),
(ur'[\%\.]153', ur'œ'),
(ur'[\%\.]154', ur'Ŕ'),
(ur'[\%\.]155', ur'ŕ'),
(ur'[\%\.]156', ur'Ŗ'),
(ur'[\%\.]157', ur'ŗ'),
(ur'[\%\.]158', ur'Ř'),
(ur'[\%\.]159', ur'ř'),
(ur'[\%\.]15a', ur'Ś'),
(ur'[\%\.]15b', ur'ś'),
(ur'[\%\.]15c', ur'Ŝ'),
(ur'[\%\.]15d', ur'ŝ'),
(ur'[\%\.]15e', ur'Ş'),
(ur'[\%\.]15f', ur'ş'),
(ur'[\%\.]160', ur'Š'),
(ur'[\%\.]161', ur'š'),
(ur'[\%\.]162', ur'Ţ'),
(ur'[\%\.]163', ur'ţ'),
(ur'[\%\.]164', ur'Ť'),
(ur'[\%\.]165', ur'ť'),
(ur'[\%\.]166', ur'Ŧ'),
(ur'[\%\.]167', ur'ŧ'),
(ur'[\%\.]168', ur'Ũ'),
(ur'[\%\.]169', ur'ũ'),
(ur'[\%\.]16a', ur'Ū'),
(ur'[\%\.]16b', ur'ū'),
(ur'[\%\.]16c', ur'Ŭ'),
(ur'[\%\.]16d', ur'ŭ'),
(ur'[\%\.]16e', ur'Ů'),
(ur'[\%\.]16f', ur'ů'),
(ur'[\%\.]170', ur'Ű'),
(ur'[\%\.]171', ur'ű'),
(ur'[\%\.]172', ur'Ų'),
(ur'[\%\.]173', ur'ų'),
(ur'[\%\.]174', ur'Ŵ'),
(ur'[\%\.]175', ur'ŵ'),
(ur'[\%\.]176', ur'Ŷ'),
(ur'[\%\.]177', ur'ŷ'),
(ur'[\%\.]178', ur'Ÿ'),
(ur'[\%\.]179', ur'Ź'),
(ur'[\%\.]17a', ur'ź'),
(ur'[\%\.]17b', ur'Ż'),
(ur'[\%\.]17c', ur'ż'),
(ur'[\%\.]17d', ur'Ž'),
(ur'[\%\.]17e', ur'ž'),
(ur'[\%\.]17f', ur'ſ'),
(ur'[\%\.]180', ur'ƀ'),
(ur'[\%\.]181', ur'Ɓ'),
(ur'[\%\.]182', ur'Ƃ'),
(ur'[\%\.]183', ur'ƃ'),
(ur'[\%\.]184', ur'Ƅ'),
(ur'[\%\.]185', ur'ƅ'),
(ur'[\%\.]186', ur'Ɔ'),
(ur'[\%\.]187', ur'Ƈ'),
(ur'[\%\.]188', ur'ƈ'),
(ur'[\%\.]189', ur'Ɖ'),
(ur'[\%\.]18a', ur'Ɗ'),
(ur'[\%\.]18b', ur'Ƌ'),
(ur'[\%\.]18c', ur'ƌ'),
(ur'[\%\.]18d', ur'ƍ'),
(ur'[\%\.]18e', ur'Ǝ'),
(ur'[\%\.]18f', ur'Ə'),
(ur'[\%\.]190', ur'Ɛ'),
(ur'[\%\.]191', ur'Ƒ'),
(ur'[\%\.]192', ur'ƒ'),
(ur'[\%\.]193', ur'Ɠ'),
(ur'[\%\.]194', ur'Ɣ'),
(ur'[\%\.]195', ur'ƕ'),
(ur'[\%\.]196', ur'Ɩ'),
(ur'[\%\.]197', ur'Ɨ'),
(ur'[\%\.]198', ur'Ƙ'),
(ur'[\%\.]199', ur'ƙ'),
(ur'[\%\.]19a', ur'ƚ'),
(ur'[\%\.]19b', ur'ƛ'),
(ur'[\%\.]19c', ur'Ɯ'),
(ur'[\%\.]19d', ur'Ɲ'),
(ur'[\%\.]19e', ur'ƞ'),
(ur'[\%\.]19f', ur'Ɵ'),
(ur'[\%\.]1a0', ur'Ơ'),
(ur'[\%\.]1a1', ur'ơ'),
(ur'[\%\.]1a2', ur'Ƣ'),
(ur'[\%\.]1a3', ur'ƣ'),
(ur'[\%\.]1a4', ur'Ƥ'),
(ur'[\%\.]1a5', ur'ƥ'),
(ur'[\%\.]1a6', ur'Ʀ'),
(ur'[\%\.]1a7', ur'Ƨ'),
(ur'[\%\.]1a8', ur'ƨ'),
(ur'[\%\.]1a9', ur'Ʃ'),
(ur'[\%\.]1aa', ur'ƪ'),
(ur'[\%\.]1ab', ur'ƫ'),
(ur'[\%\.]1ac', ur'Ƭ'),
(ur'[\%\.]1ad', ur'ƭ'),
(ur'[\%\.]1ae', ur'Ʈ'),
(ur'[\%\.]1af', ur'Ư'),
(ur'[\%\.]1b0', ur'ư'),
(ur'[\%\.]1b1', ur'Ʊ'),
(ur'[\%\.]1b2', ur'Ʋ'),
(ur'[\%\.]1b3', ur'Ƴ'),
(ur'[\%\.]1b4', ur'ƴ'),
(ur'[\%\.]1b5', ur'Ƶ'),
(ur'[\%\.]1b6', ur'ƶ'),
(ur'[\%\.]1b7', ur'Ʒ'),
(ur'[\%\.]1b8', ur'Ƹ'),
(ur'[\%\.]1b9', ur'ƹ'),
(ur'[\%\.]1ba', ur'ƺ'),
(ur'[\%\.]1bb', ur'ƻ'),
(ur'[\%\.]1bc', ur'Ƽ'),
(ur'[\%\.]1bd', ur'ƽ'),
(ur'[\%\.]1be', ur'ƾ'),
(ur'[\%\.]1bf', ur'ƿ'),
(ur'[\%\.]1c0', ur'ǀ'),
(ur'[\%\.]1c1', ur'ǁ'),
(ur'[\%\.]1c2', ur'ǂ'),
(ur'[\%\.]1c3', ur'ǃ'),
(ur'[\%\.]1c4', ur'DŽ'),
(ur'[\%\.]1c5', ur'Dž'),
(ur'[\%\.]1c6', ur'dž'),
(ur'[\%\.]1c7', ur'LJ'),
(ur'[\%\.]1c8', ur'Lj'),
(ur'[\%\.]1c9', ur'lj'),
(ur'[\%\.]1ca', ur'NJ'),
(ur'[\%\.]1cb', ur'Nj'),
(ur'[\%\.]1cc', ur'nj'),
(ur'[\%\.]1cd', ur'Ǎ'),
(ur'[\%\.]1ce', ur'ǎ'),
(ur'[\%\.]1cf', ur'Ǐ'),
(ur'[\%\.]1d0', ur'ǐ'),
(ur'[\%\.]1d1', ur'Ǒ'),
(ur'[\%\.]1d2', ur'ǒ'),
(ur'[\%\.]1d3', ur'Ǔ'),
(ur'[\%\.]1d4', ur'ǔ'),
(ur'[\%\.]1d5', ur'Ǖ'),
(ur'[\%\.]1d6', ur'ǖ'),
(ur'[\%\.]1d7', ur'Ǘ'),
(ur'[\%\.]1d8', ur'ǘ'),
(ur'[\%\.]1d9', ur'Ǚ'),
(ur'[\%\.]1da', ur'ǚ'),
(ur'[\%\.]1db', ur'Ǜ'),
(ur'[\%\.]1dc', ur'ǜ'),
(ur'[\%\.]1dd', ur'ǝ'),
(ur'[\%\.]1de', ur'Ǟ'),
(ur'[\%\.]1df', ur'ǟ'),
(ur'[\%\.]1e0', ur'Ǡ'),
(ur'[\%\.]1e1', ur'ǡ'),
(ur'[\%\.]1e2', ur'Ǣ'),
(ur'[\%\.]1e3', ur'ǣ'),
(ur'[\%\.]1e4', ur'Ǥ'),
(ur'[\%\.]1e5', ur'ǥ'),
(ur'[\%\.]1e6', ur'Ǧ'),
(ur'[\%\.]1e7', ur'ǧ'),
(ur'[\%\.]1e8', ur'Ǩ'),
(ur'[\%\.]1e9', ur'ǩ'),
(ur'[\%\.]1ea', ur'Ǫ'),
(ur'[\%\.]1eb', ur'ǫ'),
(ur'[\%\.]1ec', ur'Ǭ'),
(ur'[\%\.]1ed', ur'ǭ'),
(ur'[\%\.]1ee', ur'Ǯ'),
(ur'[\%\.]1ef', ur'ǯ'),
(ur'[\%\.]1f0', ur'ǰ'),
(ur'[\%\.]1f1', ur'DZ'),
(ur'[\%\.]1f2', ur'Dz'),
(ur'[\%\.]1f3', ur'dz'),
(ur'[\%\.]1f4', ur'Ǵ'),
(ur'[\%\.]1f5', ur'ǵ'),
(ur'[\%\.]1f6', ur'Ƕ'),
(ur'[\%\.]1f7', ur'Ƿ'),
(ur'[\%\.]1f8', ur'Ǹ'),
(ur'[\%\.]1f9', ur'ǹ'),
(ur'[\%\.]1fa', ur'Ǻ'),
(ur'[\%\.]1fb', ur'ǻ'),
(ur'[\%\.]1fc', ur'Ǽ'),
(ur'[\%\.]1fd', ur'ǽ'),
(ur'[\%\.]1fe', ur'Ǿ'),
(ur'[\%\.]1ff', ur'ǿ'),
(ur'[\%\.]200', ur'Ȁ'),
(ur'[\%\.]201', ur'ȁ'),
(ur'[\%\.]202', ur'Ȃ'),
(ur'[\%\.]203', ur'ȃ'),
(ur'[\%\.]204', ur'Ȅ'),
(ur'[\%\.]205', ur'ȅ'),
(ur'[\%\.]206', ur'Ȇ'),
(ur'[\%\.]207', ur'ȇ'),
(ur'[\%\.]208', ur'Ȉ'),
(ur'[\%\.]209', ur'ȉ'),
(ur'[\%\.]20a', ur'Ȋ'),
(ur'[\%\.]20b', ur'ȋ'),
(ur'[\%\.]20c', ur'Ȍ'),
(ur'[\%\.]20d', ur'ȍ'),
(ur'[\%\.]20e', ur'Ȏ'),
(ur'[\%\.]20f', ur'ȏ'),
(ur'[\%\.]210', ur'Ȑ'),
(ur'[\%\.]211', ur'ȑ'),
(ur'[\%\.]212', ur'Ȓ'),
(ur'[\%\.]213', ur'ȓ'),
(ur'[\%\.]214', ur'Ȕ'),
(ur'[\%\.]215', ur'ȕ'),
(ur'[\%\.]216', ur'Ȗ'),
(ur'[\%\.]217', ur'ȗ'),
(ur'[\%\.]218', ur'Ș'),
(ur'[\%\.]219', ur'ș'),
(ur'[\%\.]21a', ur'Ț'),
(ur'[\%\.]21b', ur'ț'),
(ur'[\%\.]21c', ur'Ȝ'),
(ur'[\%\.]21d', ur'ȝ'),
(ur'[\%\.]21e', ur'Ȟ'),
(ur'[\%\.]21f', ur'ȟ'),
(ur'[\%\.]220', ur'Ƞ'),
(ur'[\%\.]221', ur'ȡ'),
(ur'[\%\.]222', ur'Ȣ'),
(ur'[\%\.]223', ur'ȣ'),
(ur'[\%\.]224', ur'Ȥ'),
(ur'[\%\.]225', ur'ȥ'),
(ur'[\%\.]226', ur'Ȧ'),
(ur'[\%\.]227', ur'ȧ'),
(ur'[\%\.]228', ur'Ȩ'),
(ur'[\%\.]229', ur'ȩ'),
(ur'[\%\.]22a', ur'Ȫ'),
(ur'[\%\.]22b', ur'ȫ'),
(ur'[\%\.]22c', ur'Ȭ'),
(ur'[\%\.]22d', ur'ȭ'),
(ur'[\%\.]22e', ur'Ȯ'),
(ur'[\%\.]22f', ur'ȯ'),
(ur'[\%\.]230', ur'Ȱ'),
(ur'[\%\.]231', ur'ȱ'),
(ur'[\%\.]232', ur'Ȳ'),
(ur'[\%\.]233', ur'ȳ'),
(ur'[\%\.]234', ur'ȴ'),
(ur'[\%\.]235', ur'ȵ'),
(ur'[\%\.]236', ur'ȶ'),
(ur'[\%\.]237', ur'ȷ'),
(ur'[\%\.]238', ur'ȸ'),
(ur'[\%\.]239', ur'ȹ'),
(ur'[\%\.]23a', ur'Ⱥ'),
(ur'[\%\.]23b', ur'Ȼ'),
(ur'[\%\.]23c', ur'ȼ'),
(ur'[\%\.]23d', ur'Ƚ'),
(ur'[\%\.]23e', ur'Ⱦ'),
(ur'[\%\.]23f', ur'ȿ'),
(ur'[\%\.]240', ur'ɀ'),
(ur'[\%\.]241', ur'Ɂ'),
(ur'[\%\.]242', ur'ɂ'),
(ur'[\%\.]243', ur'Ƀ'),
(ur'[\%\.]244', ur'Ʉ'),
(ur'[\%\.]245', ur'Ʌ'),
(ur'[\%\.]246', ur'Ɇ'),
(ur'[\%\.]247', ur'ɇ'),
(ur'[\%\.]248', ur'Ɉ'),
(ur'[\%\.]249', ur'ɉ'),
(ur'[\%\.]24a', ur'Ɋ'),
(ur'[\%\.]24b', ur'ɋ'),
(ur'[\%\.]24c', ur'Ɍ'),
(ur'[\%\.]24d', ur'ɍ'),
(ur'[\%\.]24e', ur'Ɏ'),
(ur'[\%\.]24f', ur'ɏ'),
(ur'[\%\.]250', ur'ɐ'),
(ur'[\%\.]251', ur'ɑ'),
(ur'[\%\.]252', ur'ɒ'),
(ur'[\%\.]253', ur'ɓ'),
(ur'[\%\.]254', ur'ɔ'),
(ur'[\%\.]255', ur'ɕ'),
(ur'[\%\.]256', ur'ɖ'),
(ur'[\%\.]257', ur'ɗ'),
(ur'[\%\.]258', ur'ɘ'),
(ur'[\%\.]259', ur'ə'),
(ur'[\%\.]25a', ur'ɚ'),
(ur'[\%\.]25b', ur'ɛ'),
(ur'[\%\.]25c', ur'ɜ'),
(ur'[\%\.]25d', ur'ɝ'),
(ur'[\%\.]25e', ur'ɞ'),
(ur'[\%\.]25f', ur'ɟ'),
(ur'[\%\.]260', ur'ɠ'),
(ur'[\%\.]261', ur'ɡ'),
(ur'[\%\.]262', ur'ɢ'),
(ur'[\%\.]263', ur'ɣ'),
(ur'[\%\.]264', ur'ɤ'),
(ur'[\%\.]265', ur'ɥ'),
(ur'[\%\.]266', ur'ɦ'),
(ur'[\%\.]267', ur'ɧ'),
(ur'[\%\.]268', ur'ɨ'),
(ur'[\%\.]269', ur'ɩ'),
(ur'[\%\.]26a', ur'ɪ'),
(ur'[\%\.]26b', ur'ɫ'),
(ur'[\%\.]26c', ur'ɬ'),
(ur'[\%\.]26d', ur'ɭ'),
(ur'[\%\.]26e', ur'ɮ'),
(ur'[\%\.]26f', ur'ɯ'),
(ur'[\%\.]270', ur'ɰ'),
(ur'[\%\.]271', ur'ɱ'),
(ur'[\%\.]272', ur'ɲ'),
(ur'[\%\.]273', ur'ɳ'),
(ur'[\%\.]274', ur'ɴ'),
(ur'[\%\.]275', ur'ɵ'),
(ur'[\%\.]276', ur'ɶ'),
(ur'[\%\.]277', ur'ɷ'),
(ur'[\%\.]278', ur'ɸ'),
(ur'[\%\.]279', ur'ɹ'),
(ur'[\%\.]27a', ur'ɺ'),
(ur'[\%\.]27b', ur'ɻ'),
(ur'[\%\.]27c', ur'ɼ'),
(ur'[\%\.]27d', ur'ɽ'),
(ur'[\%\.]27e', ur'ɾ'),
(ur'[\%\.]27f', ur'ɿ'),
(ur'[\%\.]280', ur'ʀ'),
(ur'[\%\.]281', ur'ʁ'),
(ur'[\%\.]282', ur'ʂ'),
(ur'[\%\.]283', ur'ʃ'),
(ur'[\%\.]284', ur'ʄ'),
(ur'[\%\.]285', ur'ʅ'),
(ur'[\%\.]286', ur'ʆ'),
(ur'[\%\.]287', ur'ʇ'),
(ur'[\%\.]288', ur'ʈ'),
(ur'[\%\.]289', ur'ʉ'),
(ur'[\%\.]28a', ur'ʊ'),
(ur'[\%\.]28b', ur'ʋ'),
(ur'[\%\.]28c', ur'ʌ'),
(ur'[\%\.]28d', ur'ʍ'),
(ur'[\%\.]28e', ur'ʎ'),
(ur'[\%\.]28f', ur'ʏ'),
(ur'[\%\.]290', ur'ʐ'),
(ur'[\%\.]291', ur'ʑ'),
(ur'[\%\.]292', ur'ʒ'),
(ur'[\%\.]293', ur'ʓ'),
(ur'[\%\.]294', ur'ʔ'),
(ur'[\%\.]295', ur'ʕ'),
(ur'[\%\.]296', ur'ʖ'),
(ur'[\%\.]297', ur'ʗ'),
(ur'[\%\.]298', ur'ʘ'),
(ur'[\%\.]299', ur'ʙ'),
(ur'[\%\.]29a', ur'ʚ'),
(ur'[\%\.]29b', ur'ʛ'),
(ur'[\%\.]29c', ur'ʜ'),
(ur'[\%\.]29d', ur'ʝ'),
(ur'[\%\.]29e', ur'ʞ'),
(ur'[\%\.]29f', ur'ʟ'),
(ur'[\%\.]2a0', ur'ʠ'),
(ur'[\%\.]2a1', ur'ʡ'),
(ur'[\%\.]2a2', ur'ʢ'),
(ur'[\%\.]2a3', ur'ʣ'),
(ur'[\%\.]2a4', ur'ʤ'),
(ur'[\%\.]2a5', ur'ʥ'),
(ur'[\%\.]2a6', ur'ʦ'),
(ur'[\%\.]2a7', ur'ʧ'),
(ur'[\%\.]2a8', ur'ʨ'),
(ur'[\%\.]2a9', ur'ʩ'),
(ur'[\%\.]2aa', ur'ʪ'),
(ur'[\%\.]2ab', ur'ʫ'),
(ur'[\%\.]2ac', ur'ʬ'),
(ur'[\%\.]2ad', ur'ʭ'),
(ur'[\%\.]2ae', ur'ʮ'),
(ur'[\%\.]2af', ur'ʯ'),
(ur'[\%\.]2b0', ur'ʰ'),
(ur'[\%\.]2b1', ur'ʱ'),
(ur'[\%\.]2b2', ur'ʲ'),
(ur'[\%\.]2b3', ur'ʳ'),
(ur'[\%\.]2b4', ur'ʴ'),
(ur'[\%\.]2b5', ur'ʵ'),
(ur'[\%\.]2b6', ur'ʶ'),
(ur'[\%\.]2b7', ur'ʷ'),
(ur'[\%\.]2b8', ur'ʸ'),
(ur'[\%\.]2b9', ur'ʹ'),
(ur'[\%\.]2ba', ur'ʺ'),
(ur'[\%\.]2bb', ur'ʻ'),
(ur'[\%\.]2bc', ur'ʼ'),
(ur'[\%\.]2bd', ur'ʽ'),
(ur'[\%\.]2be', ur'ʾ'),
(ur'[\%\.]2bf', ur'ʿ'),
(ur'[\%\.]2c0', ur'ˀ'),
(ur'[\%\.]2c1', ur'ˁ'),
(ur'[\%\.]2c2', ur'˂'),
(ur'[\%\.]2c3', ur'˃'),
(ur'[\%\.]2c4', ur'˄'),
(ur'[\%\.]2c5', ur'˅'),
(ur'[\%\.]2c6', ur'ˆ'),
(ur'[\%\.]2c7', ur'ˇ'),
(ur'[\%\.]2c8', ur'ˈ'),
(ur'[\%\.]2c9', ur'ˉ'),
(ur'[\%\.]2ca', ur'ˊ'),
(ur'[\%\.]2cb', ur'ˋ'),
(ur'[\%\.]2cc', ur'ˌ'),
(ur'[\%\.]2cd', ur'ˍ'),
(ur'[\%\.]2ce', ur'ˎ'),
(ur'[\%\.]2cf', ur'ˏ'),
(ur'[\%\.]2d0', ur'ː'),
(ur'[\%\.]2d1', ur'ˑ'),
(ur'[\%\.]2d2', ur'˒'),
(ur'[\%\.]2d3', ur'˓'),
(ur'[\%\.]2d4', ur'˔'),
(ur'[\%\.]2d5', ur'˕'),
(ur'[\%\.]2d6', ur'˖'),
(ur'[\%\.]2d7', ur'˗'),
(ur'[\%\.]2d8', ur'˘'),
(ur'[\%\.]2d9', ur'˙'),
(ur'[\%\.]2da', ur'˚'),
(ur'[\%\.]2db', ur'˛'),
(ur'[\%\.]2ef', ur'˯'),
(ur'[\%\.]2f0', ur'˰'),
(ur'[\%\.]2f1', ur'˱'),
(ur'[\%\.]2f2', ur'˲'),
(ur'[\%\.]2f3', ur'˳'),
(ur'[\%\.]2f4', ur'˴'),
(ur'[\%\.]2f5', ur'˵'),
(ur'[\%\.]2f6', ur'˶'),
(ur'[\%\.]2f7', ur'˷'),
(ur'[\%\.]2f8', ur'˸'),
(ur'[\%\.]2f9', ur'˹'),
(ur'[\%\.]2fa', ur'˺'),
(ur'[\%\.]2fb', ur'˻'),
(ur'[\%\.]2fc', ur'˼'),
(ur'[\%\.]2fd', ur'˽'),
(ur'[\%\.]2fe', ur'˾'),
(ur'[\%\.]2ff', ur'˿'),
(ur'[\%\.]300', ur'̀'),
(ur'[\%\.]301', ur'́'),
(ur'[\%\.]302', ur'̂'),
(ur'[\%\.]303', ur'̃'),
(ur'[\%\.]304', ur'̄'),
(ur'[\%\.]305', ur'̅'),
(ur'[\%\.]306', ur'̆'),
(ur'[\%\.]307', ur'̇'),
(ur'[\%\.]308', ur'̈'),
(ur'[\%\.]309', ur'̉'),
(ur'[\%\.]30a', ur'̊'),
(ur'[\%\.]30b', ur'̋'),
(ur'[\%\.]30c', ur'̌'),
(ur'[\%\.]30d', ur'̍'),
(ur'[\%\.]30e', ur'̎'),
(ur'[\%\.]30f', ur'̏'),
(ur'[\%\.]310', ur'̐'),
(ur'[\%\.]311', ur'̑'),
(ur'[\%\.]312', ur'̒'),
(ur'[\%\.]313', ur'̓'),
(ur'[\%\.]314', ur'̔'),
(ur'[\%\.]315', ur'̕'),
(ur'[\%\.]316', ur'̖'),
(ur'[\%\.]317', ur'̗'),
(ur'[\%\.]318', ur'̘'),
(ur'[\%\.]319', ur'̙'),
(ur'[\%\.]31a', ur'̚'),
(ur'[\%\.]31b', ur'̛'),
(ur'[\%\.]31c', ur'̜'),
(ur'[\%\.]31d', ur'̝'),
(ur'[\%\.]31e', ur'̞'),
(ur'[\%\.]31f', ur'̟'),
(ur'[\%\.]320', ur'̠'),
(ur'[\%\.]321', ur'̡'),
(ur'[\%\.]322', ur'̢'),
(ur'[\%\.]323', ur'̣'),
(ur'[\%\.]324', ur'̤'),
(ur'[\%\.]325', ur'̥'),
(ur'[\%\.]326', ur'̦'),
(ur'[\%\.]327', ur'̧'),
(ur'[\%\.]328', ur'̨'),
(ur'[\%\.]329', ur'̩'),
(ur'[\%\.]32a', ur'̪'),
(ur'[\%\.]32b', ur'̫'),
(ur'[\%\.]32c', ur'̬'),
(ur'[\%\.]32d', ur'̭'),
(ur'[\%\.]32e', ur'̮'),
(ur'[\%\.]32f', ur'̯'),
(ur'[\%\.]330', ur'̰'),
(ur'[\%\.]331', ur'̱'),
(ur'[\%\.]332', ur'̲'),
(ur'[\%\.]333', ur'̳'),
(ur'[\%\.]334', ur'̴'),
(ur'[\%\.]335', ur'̵'),
(ur'[\%\.]336', ur'̶'),
(ur'[\%\.]337', ur'̷'),
(ur'[\%\.]338', ur'̸'),
(ur'[\%\.]339', ur'̹'),
(ur'[\%\.]33a', ur'̺'),
(ur'[\%\.]33b', ur'̻'),
(ur'[\%\.]33c', ur'̼'),
(ur'[\%\.]33d', ur'̽'),
(ur'[\%\.]33e', ur'̾'),
(ur'[\%\.]33f', ur'̿'),
(ur'[\%\.]340', ur'̀'),
(ur'[\%\.]341', ur'́'),
(ur'[\%\.]342', ur'͂'),
(ur'[\%\.]343', ur'̓'),
(ur'[\%\.]344', ur'̈́'),
(ur'[\%\.]345', ur'ͅ'),
(ur'[\%\.]346', ur'͆'),
(ur'[\%\.]347', ur'͇'),
(ur'[\%\.]348', ur'͈'),
(ur'[\%\.]349', ur'͉'),
(ur'[\%\.]34a', ur'͊'),
(ur'[\%\.]34b', ur'͋'),
(ur'[\%\.]34c', ur'͌'),
(ur'[\%\.]34d', ur'͍'),
(ur'[\%\.]34e', ur'͎'),
(ur'[\%\.]34f', ur'͏'),
(ur'[\%\.]350', ur'͐'),
(ur'[\%\.]351', ur'͑'),
(ur'[\%\.]352', ur'͒'),
(ur'[\%\.]353', ur'͓'),
(ur'[\%\.]354', ur'͔'),
(ur'[\%\.]355', ur'͕'),
(ur'[\%\.]356', ur'͖'),
(ur'[\%\.]357', ur'͗'),
(ur'[\%\.]358', ur'͘'),
(ur'[\%\.]359', ur'͙'),
(ur'[\%\.]35a', ur'͚'),
(ur'[\%\.]35b', ur'͛'),
(ur'[\%\.]35c', ur'͜'),
(ur'[\%\.]35d', ur'͝'),
(ur'[\%\.]35e', ur'͞'),
(ur'[\%\.]35f', ur'͟'),
(ur'[\%\.]360', ur'͠'),
(ur'[\%\.]361', ur'͡'),
(ur'[\%\.]362', ur'͢'),
(ur'[\%\.]363', ur'ͣ'),
(ur'[\%\.]364', ur'ͤ'),
(ur'[\%\.]365', ur'ͥ'),
(ur'[\%\.]366', ur'ͦ'),
(ur'[\%\.]367', ur'ͧ'),
(ur'[\%\.]368', ur'ͨ'),
(ur'[\%\.]369', ur'ͩ'),
(ur'[\%\.]36a', ur'ͪ'),
(ur'[\%\.]36b', ur'ͫ'),
(ur'[\%\.]36c', ur'ͬ'),
(ur'[\%\.]36d', ur'ͭ'),
(ur'[\%\.]36e', ur'ͮ'),
(ur'[\%\.]36f', ur'ͯ'),
(ur'[\%\.]370', ur'Ͱ'),
(ur'[\%\.]371', ur'ͱ'),
(ur'[\%\.]372', ur'Ͳ'),
(ur'[\%\.]373', ur'ͳ'),
(ur'[\%\.]374', ur'ʹ'),
(ur'[\%\.]375', ur'͵'),
(ur'[\%\.]376', ur'Ͷ'),
(ur'[\%\.]377', ur'ͷ'),
(ur'[\%\.]378', ur''),
(ur'[\%\.]379', ur''),
(ur'[\%\.]37a', ur'ͺ'),
(ur'[\%\.]37b', ur'ͻ'),
(ur'[\%\.]37c', ur'ͼ'),
(ur'[\%\.]37d', ur'ͽ'),
(ur'[\%\.]37e', ur';'),
(ur'[\%\.]37f', ur'Ϳ'),
(ur'[\%\.]380', ur''),
(ur'[\%\.]381', ur''),
(ur'[\%\.]382', ur''),
(ur'[\%\.]383', ur''),
(ur'[\%\.]384', ur'΄'),
(ur'[\%\.]385', ur'΅'),
(ur'[\%\.]386', ur'Ά'),
(ur'[\%\.]387', ur'·'),
(ur'[\%\.]388', ur'Έ'),
(ur'[\%\.]389', ur'Ή'),
(ur'[\%\.]38a', ur'Ί'),
(ur'[\%\.]38b', ur''),
(ur'[\%\.]38c', ur'Ό'),
(ur'[\%\.]38d', ur''),
(ur'[\%\.]38e', ur'Ύ'),
(ur'[\%\.]38f', ur'Ώ'),
(ur'[\%\.]390', ur'ΐ'),
(ur'[\%\.]391', ur'Α'),
(ur'[\%\.]392', ur'Β'),
(ur'[\%\.]393', ur'Γ'),
(ur'[\%\.]394', ur'Δ'),
(ur'[\%\.]395', ur'Ε'),
(ur'[\%\.]396', ur'Ζ'),
(ur'[\%\.]397', ur'Η'),
(ur'[\%\.]398', ur'Θ'),
(ur'[\%\.]399', ur'Ι'),
(ur'[\%\.]39a', ur'Κ'),
(ur'[\%\.]39b', ur'Λ'),
(ur'[\%\.]39c', ur'Μ'),
(ur'[\%\.]39d', ur'Ν'),
(ur'[\%\.]39e', ur'Ξ'),
(ur'[\%\.]39f', ur'Ο'),
(ur'[\%\.]3a0', ur'Π'),
(ur'[\%\.]3a1', ur'Ρ'),
(ur'[\%\.]3a2', ur''),
(ur'[\%\.]3a3', ur'Σ'),
(ur'[\%\.]3a4', ur'Τ'),
(ur'[\%\.]3a5', ur'Υ'),
(ur'[\%\.]3a6', ur'Φ'),
(ur'[\%\.]3a7', ur'Χ'),
(ur'[\%\.]3a8', ur'Ψ'),
(ur'[\%\.]3a9', ur'Ω'),
(ur'[\%\.]3aa', ur'Ϊ'),
(ur'[\%\.]3ab', ur'Ϋ'),
(ur'[\%\.]3ac', ur'ά'),
(ur'[\%\.]3ad', ur'έ'),
(ur'[\%\.]3ae', ur'ή'),
(ur'[\%\.]3af', ur'ί'),
(ur'[\%\.]3b0', ur'ΰ'),
(ur'[\%\.]3b1', ur'α'),
(ur'[\%\.]3b2', ur'β'),
(ur'[\%\.]3b3', ur'γ'),
(ur'[\%\.]3b4', ur'δ'),
(ur'[\%\.]3b5', ur'ε'),
(ur'[\%\.]3b6', ur'ζ'),
(ur'[\%\.]3b7', ur'η'),
(ur'[\%\.]3b8', ur'θ'),
(ur'[\%\.]3b9', ur'ι'),
(ur'[\%\.]3ba', ur'κ'),
(ur'[\%\.]3bb', ur'λ'),
(ur'[\%\.]3bc', ur'μ'),
(ur'[\%\.]3bd', ur'ν'),
(ur'[\%\.]3be', ur'ξ'),
(ur'[\%\.]3bf', ur'ο'),
(ur'[\%\.]3c0', ur'π'),
(ur'[\%\.]3c1', ur'ρ'),
(ur'[\%\.]3c2', ur'ς'),
(ur'[\%\.]3c3', ur'σ'),
(ur'[\%\.]3c4', ur'τ'),
(ur'[\%\.]3c5', ur'υ'),
(ur'[\%\.]3c6', ur'φ'),
(ur'[\%\.]3c7', ur'χ'),
(ur'[\%\.]3c8', ur'ψ'),
(ur'[\%\.]3c9', ur'ω'),
(ur'[\%\.]3ca', ur'ϊ'),
(ur'[\%\.]3cb', ur'ϋ'),
(ur'[\%\.]3cc', ur'ό'),
(ur'[\%\.]3cd', ur'ύ'),
(ur'[\%\.]3ce', ur'ώ'),
(ur'[\%\.]3cf', ur'Ϗ'),
(ur'[\%\.]3d0', ur'ϐ'),
(ur'[\%\.]3d1', ur'ϑ'),
(ur'[\%\.]3d2', ur'ϒ'),
(ur'[\%\.]3d3', ur'ϓ'),
(ur'[\%\.]3d4', ur'ϔ'),
(ur'[\%\.]3d5', ur'ϕ'),
(ur'[\%\.]3d6', ur'ϖ'),
(ur'[\%\.]3d7', ur'ϗ'),
(ur'[\%\.]3d8', ur'Ϙ'),
(ur'[\%\.]3d9', ur'ϙ'),
(ur'[\%\.]3da', ur'Ϛ'),
(ur'[\%\.]3db', ur'ϛ'),
(ur'[\%\.]3dc', ur'Ϝ'),
(ur'[\%\.]3dd', ur'ϝ'),
(ur'[\%\.]3de', ur'Ϟ'),
(ur'[\%\.]3df', ur'ϟ'),
(ur'[\%\.]3e0', ur'Ϡ'),
(ur'[\%\.]3e1', ur'ϡ'),
(ur'[\%\.]3e2', ur'Ϣ'),
(ur'[\%\.]3e3', ur'ϣ'),
(ur'[\%\.]3e4', ur'Ϥ'),
(ur'[\%\.]3e5', ur'ϥ'),
(ur'[\%\.]3e6', ur'Ϧ'),
(ur'[\%\.]3e7', ur'ϧ'),
(ur'[\%\.]3e8', ur'Ϩ'),
(ur'[\%\.]3e9', ur'ϩ'),
(ur'[\%\.]3ea', ur'Ϫ'),
(ur'[\%\.]3eb', ur'ϫ'),
(ur'[\%\.]3ec', ur'Ϭ'),
(ur'[\%\.]3ed', ur'ϭ'),
(ur'[\%\.]3ee', ur'Ϯ'),
(ur'[\%\.]3ef', ur'ϯ'),
(ur'[\%\.]3f0', ur'ϰ'),
(ur'[\%\.]3f1', ur'ϱ'),
(ur'[\%\.]3f2', ur'ϲ'),
(ur'[\%\.]3f3', ur'ϳ'),
(ur'[\%\.]3f4', ur'ϴ'),
(ur'[\%\.]3f5', ur'ϵ'),
(ur'[\%\.]3f6', ur'϶'),
(ur'[\%\.]3f7', ur'Ϸ'),
(ur'[\%\.]3f8', ur'ϸ'),
(ur'[\%\.]3f9', ur'Ϲ'),
(ur'[\%\.]3fa', ur'Ϻ'),
(ur'[\%\.]3fb', ur'ϻ'),
(ur'[\%\.]3fc', ur'ϼ'),
(ur'[\%\.]3fd', ur'Ͻ'),
(ur'[\%\.]3fe', ur'Ͼ'),
(ur'[\%\.]3ff', ur'Ͽ'),
(ur'[\%\.]400', ur'Ѐ'),
(ur'[\%\.]401', ur'Ё'),
(ur'[\%\.]402', ur'Ђ'),
(ur'[\%\.]403', ur'Ѓ'),
(ur'[\%\.]404', ur'Є'),
(ur'[\%\.]405', ur'Ѕ'),
(ur'[\%\.]406', ur'І'),
(ur'[\%\.]407', ur'Ї'),
(ur'[\%\.]408', ur'Ј'),
(ur'[\%\.]409', ur'Љ'),
(ur'[\%\.]40a', ur'Њ'),
(ur'[\%\.]40b', ur'Ћ'),
(ur'[\%\.]40c', ur'Ќ'),
(ur'[\%\.]40d', ur'Ѝ'),
(ur'[\%\.]40e', ur'Ў'),
(ur'[\%\.]40f', ur'Џ'),
(ur'[\%\.]410', ur'А'),
(ur'[\%\.]411', ur'Б'),
(ur'[\%\.]412', ur'В'),
(ur'[\%\.]413', ur'Г'),
(ur'[\%\.]414', ur'Д'),
(ur'[\%\.]415', ur'Е'),
(ur'[\%\.]416', ur'Ж'),
(ur'[\%\.]417', ur'З'),
(ur'[\%\.]418', ur'И'),
(ur'[\%\.]419', ur'Й'),
(ur'[\%\.]41a', ur'К'),
(ur'[\%\.]41b', ur'Л'),
(ur'[\%\.]41c', ur'М'),
(ur'[\%\.]41d', ur'Н'),
(ur'[\%\.]41e', ur'О'),
(ur'[\%\.]41f', ur'П'),
(ur'[\%\.]420', ur'Р'),
(ur'[\%\.]421', ur'С'),
(ur'[\%\.]422', ur'Т'),
(ur'[\%\.]423', ur'У'),
(ur'[\%\.]424', ur'Ф'),
(ur'[\%\.]425', ur'Х'),
(ur'[\%\.]426', ur'Ц'),
(ur'[\%\.]427', ur'Ч'),
(ur'[\%\.]428', ur'Ш'),
(ur'[\%\.]429', ur'Щ'),
(ur'[\%\.]42a', ur'Ъ'),
(ur'[\%\.]42b', ur'Ы'),
(ur'[\%\.]42c', ur'Ь'),
(ur'[\%\.]42d', ur'Э'),
(ur'[\%\.]42e', ur'Ю'),
(ur'[\%\.]42f', ur'Я'),
(ur'[\%\.]430', ur'а'),
(ur'[\%\.]431', ur'б'),
(ur'[\%\.]432', ur'в'),
(ur'[\%\.]433', ur'г'),
(ur'[\%\.]434', ur'д'),
(ur'[\%\.]435', ur'е'),
(ur'[\%\.]436', ur'ж'),
(ur'[\%\.]437', ur'з'),
(ur'[\%\.]438', ur'и'),
(ur'[\%\.]439', ur'й'),
(ur'[\%\.]43a', ur'к'),
(ur'[\%\.]43b', ur'л'),
(ur'[\%\.]43c', ur'м'),
(ur'[\%\.]43d', ur'н'),
(ur'[\%\.]43e', ur'о'),
(ur'[\%\.]43f', ur'п'),
(ur'[\%\.]440', ur'р'),
(ur'[\%\.]441', ur'с'),
(ur'[\%\.]442', ur'т'),
(ur'[\%\.]443', ur'у'),
(ur'[\%\.]444', ur'ф'),
(ur'[\%\.]445', ur'х'),
(ur'[\%\.]446', ur'ц'),
(ur'[\%\.]447', ur'ч'),
(ur'[\%\.]448', ur'ш'),
(ur'[\%\.]449', ur'щ'),
(ur'[\%\.]44a', ur'ъ'),
(ur'[\%\.]44b', ur'ы'),
(ur'[\%\.]44c', ur'ь'),
(ur'[\%\.]44d', ur'э'),
(ur'[\%\.]44e', ur'ю'),
(ur'[\%\.]44f', ur'я'),
(ur'[\%\.]450', ur'ѐ'),
(ur'[\%\.]451', ur'ё'),
(ur'[\%\.]452', ur'ђ'),
(ur'[\%\.]453', ur'ѓ'),
(ur'[\%\.]454', ur'є'),
(ur'[\%\.]455', ur'ѕ'),
(ur'[\%\.]456', ur'і'),
(ur'[\%\.]457', ur'ї'),
(ur'[\%\.]458', ur'ј'),
(ur'[\%\.]459', ur'љ'),
(ur'[\%\.]45a', ur'њ'),
(ur'[\%\.]45b', ur'ћ'),
(ur'[\%\.]45c', ur'ќ'),
(ur'[\%\.]45d', ur'ѝ'),
(ur'[\%\.]45e', ur'ў'),
(ur'[\%\.]45f', ur'џ'),
(ur'[\%\.]460', ur'Ѡ'),
(ur'[\%\.]461', ur'ѡ'),
(ur'[\%\.]462', ur'Ѣ'),
(ur'[\%\.]463', ur'ѣ'),
(ur'[\%\.]464', ur'Ѥ'),
(ur'[\%\.]465', ur'ѥ'),
(ur'[\%\.]466', ur'Ѧ'),
(ur'[\%\.]467', ur'ѧ'),
(ur'[\%\.]468', ur'Ѩ'),
(ur'[\%\.]469', ur'ѩ'),
(ur'[\%\.]46a', ur'Ѫ'),
(ur'[\%\.]46b', ur'ѫ'),
(ur'[\%\.]46c', ur'Ѭ'),
(ur'[\%\.]46d', ur'ѭ'),
(ur'[\%\.]46e', ur'Ѯ'),
(ur'[\%\.]46f', ur'ѯ'),
(ur'[\%\.]470', ur'Ѱ'),
(ur'[\%\.]471', ur'ѱ'),
(ur'[\%\.]472', ur'Ѳ'),
(ur'[\%\.]473', ur'ѳ'),
(ur'[\%\.]474', ur'Ѵ'),
(ur'[\%\.]475', ur'ѵ'),
(ur'[\%\.]476', ur'Ѷ'),
(ur'[\%\.]477', ur'ѷ'),
(ur'[\%\.]478', ur'Ѹ'),
(ur'[\%\.]479', ur'ѹ'),
(ur'[\%\.]47a', ur'Ѻ'),
(ur'[\%\.]47b', ur'ѻ'),
(ur'[\%\.]47c', ur'Ѽ'),
(ur'[\%\.]47d', ur'ѽ'),
(ur'[\%\.]47e', ur'Ѿ'),
(ur'[\%\.]47f', ur'ѿ'),
(ur'[\%\.]480', ur'Ҁ'),
(ur'[\%\.]481', ur'ҁ'),
(ur'[\%\.]482', ur'҂'),
(ur'[\%\.]483', ur'҃'),
(ur'[\%\.]484', ur'҄'),
(ur'[\%\.]485', ur'҅'),
(ur'[\%\.]486', ur'҆'),
(ur'[\%\.]487', ur'҇'),
(ur'[\%\.]488', ur'҈'),
(ur'[\%\.]489', ur'҉'),
(ur'[\%\.]48a', ur'Ҋ'),
(ur'[\%\.]48b', ur'ҋ'),
(ur'[\%\.]48c', ur'Ҍ'),
(ur'[\%\.]48d', ur'ҍ'),
(ur'[\%\.]48e', ur'Ҏ'),
(ur'[\%\.]48f', ur'ҏ'),
(ur'[\%\.]490', ur'Ґ'),
(ur'[\%\.]491', ur'ґ'),
(ur'[\%\.]492', ur'Ғ'),
(ur'[\%\.]493', ur'ғ'),
(ur'[\%\.]494', ur'Ҕ'),
(ur'[\%\.]495', ur'ҕ'),
(ur'[\%\.]496', ur'Җ'),
(ur'[\%\.]497', ur'җ'),
(ur'[\%\.]498', ur'Ҙ'),
(ur'[\%\.]499', ur'ҙ'),
(ur'[\%\.]49a', ur'Қ'),
(ur'[\%\.]49b', ur'қ'),
(ur'[\%\.]49c', ur'Ҝ'),
(ur'[\%\.]49d', ur'ҝ'),
(ur'[\%\.]49e', ur'Ҟ'),
(ur'[\%\.]49f', ur'ҟ'),
(ur'[\%\.]4a0', ur'Ҡ'),
(ur'[\%\.]4a1', ur'ҡ'),
(ur'[\%\.]4a2', ur'Ң'),
(ur'[\%\.]4a3', ur'ң'),
(ur'[\%\.]4a4', ur'Ҥ'),
(ur'[\%\.]4a5', ur'ҥ'),
(ur'[\%\.]4a6', ur'Ҧ'),
(ur'[\%\.]4a7', ur'ҧ'),
(ur'[\%\.]4a8', ur'Ҩ'),
(ur'[\%\.]4a9', ur'ҩ'),
(ur'[\%\.]4aa', ur'Ҫ'),
(ur'[\%\.]4ab', ur'ҫ'),
(ur'[\%\.]4ac', ur'Ҭ'),
(ur'[\%\.]4ad', ur'ҭ'),
(ur'[\%\.]4ae', ur'Ү'),
(ur'[\%\.]4af', ur'ү'),
(ur'[\%\.]4b0', ur'Ұ'),
(ur'[\%\.]4b1', ur'ұ'),
(ur'[\%\.]4b2', ur'Ҳ'),
(ur'[\%\.]4b3', ur'ҳ'),
(ur'[\%\.]4b4', ur'Ҵ'),
(ur'[\%\.]4b5', ur'ҵ'),
(ur'[\%\.]4b6', ur'Ҷ'),
(ur'[\%\.]4b7', ur'ҷ'),
(ur'[\%\.]4b8', ur'Ҹ'),
(ur'[\%\.]4b9', ur'ҹ'),
(ur'[\%\.]4ba', ur'Һ'),
(ur'[\%\.]4bb', ur'һ'),
(ur'[\%\.]4bc', ur'Ҽ'),
(ur'[\%\.]4bd', ur'ҽ'),
(ur'[\%\.]4be', ur'Ҿ'),
(ur'[\%\.]4bf', ur'ҿ'),
(ur'[\%\.]4c0', ur'Ӏ'),
(ur'[\%\.]4c1', ur'Ӂ'),
(ur'[\%\.]4c2', ur'ӂ'),
(ur'[\%\.]4c3', ur'Ӄ'),
(ur'[\%\.]4c4', ur'ӄ'),
(ur'[\%\.]4c5', ur'Ӆ'),
(ur'[\%\.]4c6', ur'ӆ'),
(ur'[\%\.]4c7', ur'Ӈ'),
(ur'[\%\.]4c8', ur'ӈ'),
(ur'[\%\.]4c9', ur'Ӊ'),
(ur'[\%\.]4ca', ur'ӊ'),
(ur'[\%\.]4cb', ur'Ӌ'),
(ur'[\%\.]4cc', ur'ӌ'),
(ur'[\%\.]4cd', ur'Ӎ'),
(ur'[\%\.]4ce', ur'ӎ'),
(ur'[\%\.]4cf', ur'ӏ'),
(ur'[\%\.]4d0', ur'Ӑ'),
(ur'[\%\.]4d1', ur'ӑ'),
(ur'[\%\.]4d2', ur'Ӓ'),
(ur'[\%\.]4d3', ur'ӓ'),
(ur'[\%\.]4d4', ur'Ӕ'),
(ur'[\%\.]4d5', ur'ӕ'),
(ur'[\%\.]4d6', ur'Ӗ'),
(ur'[\%\.]4d7', ur'ӗ'),
(ur'[\%\.]4d8', ur'Ә'),
(ur'[\%\.]4d9', ur'ә'),
(ur'[\%\.]4da', ur'Ӛ'),
(ur'[\%\.]4db', ur'ӛ'),
(ur'[\%\.]4dc', ur'Ӝ'),
(ur'[\%\.]4dd', ur'ӝ'),
(ur'[\%\.]4de', ur'Ӟ'),
(ur'[\%\.]4df', ur'ӟ'),
(ur'[\%\.]4e0', ur'Ӡ'),
(ur'[\%\.]4e1', ur'ӡ'),
(ur'[\%\.]4e2', ur'Ӣ'),
(ur'[\%\.]4e3', ur'ӣ'),
(ur'[\%\.]4e4', ur'Ӥ'),
(ur'[\%\.]4e5', ur'ӥ'),
(ur'[\%\.]4e6', ur'Ӧ'),
(ur'[\%\.]4e7', ur'ӧ'),
(ur'[\%\.]4e8', ur'Ө'),
(ur'[\%\.]4e9', ur'ө'),
(ur'[\%\.]4ea', ur'Ӫ'),
(ur'[\%\.]4eb', ur'ӫ'),
(ur'[\%\.]4ec', ur'Ӭ'),
(ur'[\%\.]4ed', ur'ӭ'),
(ur'[\%\.]4ee', ur'Ӯ'),
(ur'[\%\.]4ef', ur'ӯ'),
(ur'[\%\.]4f0', ur'Ӱ'),
(ur'[\%\.]4f1', ur'ӱ'),
(ur'[\%\.]4f2', ur'Ӳ'),
(ur'[\%\.]4f3', ur'ӳ'),
(ur'[\%\.]4f4', ur'Ӵ'),
(ur'[\%\.]4f5', ur'ӵ'),
(ur'[\%\.]4f6', ur'Ӷ'),
(ur'[\%\.]4f7', ur'ӷ'),
(ur'[\%\.]4f8', ur'Ӹ'),
(ur'[\%\.]4f9', ur'ӹ'),
(ur'[\%\.]4fa', ur'Ӻ'),
(ur'[\%\.]4fb', ur'ӻ'),
(ur'[\%\.]4fc', ur'Ӽ'),
(ur'[\%\.]4fd', ur'ӽ'),
(ur'[\%\.]4fe', ur'Ӿ'),
(ur'[\%\.]4ff', ur'ӿ'),
(ur'[\%\.]500', ur'Ԁ'),
(ur'[\%\.]501', ur'ԁ'),
(ur'[\%\.]502', ur'Ԃ'),
(ur'[\%\.]503', ur'ԃ'),
(ur'[\%\.]504', ur'Ԅ'),
(ur'[\%\.]505', ur'ԅ'),
(ur'[\%\.]506', ur'Ԇ'),
(ur'[\%\.]507', ur'ԇ'),
(ur'[\%\.]508', ur'Ԉ'),
(ur'[\%\.]509', ur'ԉ'),
(ur'[\%\.]50a', ur'Ԋ'),
(ur'[\%\.]50b', ur'ԋ'),
(ur'[\%\.]50c', ur'Ԍ'),
(ur'[\%\.]50d', ur'ԍ'),
(ur'[\%\.]50e', ur'Ԏ'),
(ur'[\%\.]50f', ur'ԏ'),
(ur'[\%\.]510', ur'Ԑ'),
(ur'[\%\.]511', ur'ԑ'),
(ur'[\%\.]512', ur'Ԓ'),
(ur'[\%\.]513', ur'ԓ'),
(ur'[\%\.]514', ur'Ԕ'),
(ur'[\%\.]515', ur'ԕ'),
(ur'[\%\.]516', ur'Ԗ'),
(ur'[\%\.]517', ur'ԗ'),
(ur'[\%\.]518', ur'Ԙ'),
(ur'[\%\.]519', ur'ԙ'),
(ur'[\%\.]51a', ur'Ԛ'),
(ur'[\%\.]51b', ur'ԛ'),
(ur'[\%\.]51c', ur'Ԝ'),
(ur'[\%\.]51d', ur'ԝ'),
(ur'[\%\.]51e', ur'Ԟ'),
(ur'[\%\.]51f', ur'ԟ'),
(ur'[\%\.]520', ur'Ԡ'),
(ur'[\%\.]521', ur'ԡ'),
(ur'[\%\.]522', ur'Ԣ'),
(ur'[\%\.]523', ur'ԣ'),
(ur'[\%\.]524', ur'Ԥ'),
(ur'[\%\.]525', ur'ԥ'),
(ur'[\%\.]526', ur'Ԧ'),
(ur'[\%\.]527', ur'ԧ'),
(ur'[\%\.]528', ur'Ԩ'),
(ur'[\%\.]529', ur'ԩ'),
(ur'[\%\.]52a', ur'Ԫ'),
(ur'[\%\.]52b', ur'ԫ'),
(ur'[\%\.]52c', ur'Ԭ'),
(ur'[\%\.]52d', ur'ԭ'),
(ur'[\%\.]52e', ur'Ԯ'),
(ur'[\%\.]52f', ur'ԯ'),
(ur'[\%\.]530', ur''),
(ur'[\%\.]531', ur'Ա'),
(ur'[\%\.]532', ur'Բ'),
(ur'[\%\.]533', ur'Գ'),
(ur'[\%\.]534', ur'Դ'),
(ur'[\%\.]535', ur'Ե'),
(ur'[\%\.]536', ur'Զ'),
(ur'[\%\.]537', ur'Է'),
(ur'[\%\.]538', ur'Ը'),
(ur'[\%\.]539', ur'Թ'),
(ur'[\%\.]53a', ur'Ժ'),
(ur'[\%\.]53b', ur'Ի'),
(ur'[\%\.]53c', ur'Լ'),
(ur'[\%\.]53d', ur'Խ'),
(ur'[\%\.]53e', ur'Ծ'),
(ur'[\%\.]53f', ur'Կ'),
(ur'[\%\.]540', ur'Հ'),
(ur'[\%\.]541', ur'Ձ'),
(ur'[\%\.]542', ur'Ղ'),
(ur'[\%\.]543', ur'Ճ'),
(ur'[\%\.]544', ur'Մ'),
(ur'[\%\.]545', ur'Յ'),
(ur'[\%\.]546', ur'Ն'),
(ur'[\%\.]547', ur'Շ'),
(ur'[\%\.]548', ur'Ո'),
(ur'[\%\.]549', ur'Չ'),
(ur'[\%\.]54a', ur'Պ'),
(ur'[\%\.]54b', ur'Ջ'),
(ur'[\%\.]54c', ur'Ռ'),
(ur'[\%\.]54d', ur'Ս'),
(ur'[\%\.]54e', ur'Վ'),
(ur'[\%\.]54f', ur'Տ'),
(ur'[\%\.]550', ur'Ր'),
(ur'[\%\.]551', ur'Ց'),
(ur'[\%\.]552', ur'Ւ'),
(ur'[\%\.]553', ur'Փ'),
(ur'[\%\.]554', ur'Ք'),
(ur'[\%\.]555', ur'Օ'),
(ur'[\%\.]556', ur'Ֆ'),
(ur'[\%\.]557', ur''),
(ur'[\%\.]558', ur''),
(ur'[\%\.]559', ur'ՙ'),
(ur'[\%\.]55a', ur'՚'),
(ur'[\%\.]55b', ur'՛'),
(ur'[\%\.]55c', ur'՜'),
(ur'[\%\.]55d', ur'՝'),
(ur'[\%\.]55e', ur'՞'),
(ur'[\%\.]55f', ur'՟'),
(ur'[\%\.]560', ur'ՠ'),
(ur'[\%\.]561', ur'ա'),
(ur'[\%\.]562', ur'բ'),
(ur'[\%\.]563', ur'գ'),
(ur'[\%\.]564', ur'դ'),
(ur'[\%\.]565', ur'ե'),
(ur'[\%\.]566', ur'զ'),
(ur'[\%\.]567', ur'է'),
(ur'[\%\.]568', ur'ը'),
(ur'[\%\.]569', ur'թ'),
(ur'[\%\.]56a', ur'ժ'),
(ur'[\%\.]56b', ur'ի'),
(ur'[\%\.]56c', ur'լ'),
(ur'[\%\.]56d', ur'խ'),
(ur'[\%\.]56e', ur'ծ'),
(ur'[\%\.]56f', ur'կ'),
(ur'[\%\.]570', ur'հ'),
(ur'[\%\.]571', ur'ձ'),
(ur'[\%\.]572', ur'ղ'),
(ur'[\%\.]573', ur'ճ'),
(ur'[\%\.]574', ur'մ'),
(ur'[\%\.]575', ur'յ'),
(ur'[\%\.]576', ur'ն'),
(ur'[\%\.]577', ur'շ'),
(ur'[\%\.]578', ur'ո'),
(ur'[\%\.]579', ur'չ'),
(ur'[\%\.]57a', ur'պ'),
(ur'[\%\.]57b', ur'ջ'),
(ur'[\%\.]57c', ur'ռ'),
(ur'[\%\.]57d', ur'ս'),
(ur'[\%\.]57e', ur'վ'),
(ur'[\%\.]57f', ur'տ'),
(ur'[\%\.]580', ur'ր'),
(ur'[\%\.]581', ur'ց'),
(ur'[\%\.]582', ur'ւ'),
(ur'[\%\.]583', ur'փ'),
(ur'[\%\.]584', ur'ք'),
(ur'[\%\.]585', ur'օ'),
(ur'[\%\.]586', ur'ֆ'),
(ur'[\%\.]587', ur'և'),
(ur'[\%\.]588', ur'ֈ'),
(ur'[\%\.]589', ur'։'),
(ur'[\%\.]58a', ur'֊'),
(ur'[\%\.]58b', ur''),
(ur'[\%\.]58c', ur''),
(ur'[\%\.]58d', ur'֍'),
(ur'[\%\.]58e', ur'֎'),
(ur'[\%\.]58f', ur'֏'),
(ur'[\%\.]590', ur''),
(ur'[\%\.]591', ur'֑'),
(ur'[\%\.]592', ur'֒'),
(ur'[\%\.]593', ur'֓'),
(ur'[\%\.]594', ur'֔'),
(ur'[\%\.]595', ur'֕'),
(ur'[\%\.]596', ur'֖'),
(ur'[\%\.]597', ur'֗'),
(ur'[\%\.]598', ur'֘'),
(ur'[\%\.]599', ur'֙'),
(ur'[\%\.]59a', ur'֚'),
(ur'[\%\.]59b', ur'֛'),
(ur'[\%\.]59c', ur'֜'),
(ur'[\%\.]59d', ur'֝'),
(ur'[\%\.]59e', ur'֞'),
(ur'[\%\.]59f', ur'֟'),
(ur'[\%\.]5a0', ur'֠'),
(ur'[\%\.]5a1', ur'֡'),
(ur'[\%\.]5a2', ur'֢'),
(ur'[\%\.]5a3', ur'֣'),
(ur'[\%\.]5a4', ur'֤'),
(ur'[\%\.]5a5', ur'֥'),
(ur'[\%\.]5a6', ur'֦'),
(ur'[\%\.]5a7', ur'֧'),
(ur'[\%\.]5a8', ur'֨'),
(ur'[\%\.]5a9', ur'֩'),
(ur'[\%\.]5aa', ur'֪'),
(ur'[\%\.]5ab', ur'֫'),
(ur'[\%\.]5ac', ur'֬'),
(ur'[\%\.]5ad', ur'֭'),
(ur'[\%\.]5ae', ur'֮'),
(ur'[\%\.]5af', ur'֯'),
(ur'[\%\.]5b0', ur'ְ'),
(ur'[\%\.]5b1', ur'ֱ'),
(ur'[\%\.]5b2', ur'ֲ'),
(ur'[\%\.]5b3', ur'ֳ'),
(ur'[\%\.]5b4', ur'ִ'),
(ur'[\%\.]5b5', ur'ֵ'),
(ur'[\%\.]5b6', ur'ֶ'),
(ur'[\%\.]5b7', ur'ַ'),
(ur'[\%\.]5b8', ur'ָ'),
(ur'[\%\.]5b9', ur'ֹ'),
(ur'[\%\.]5ba', ur'ֺ'),
(ur'[\%\.]5bb', ur'ֻ'),
(ur'[\%\.]5bc', ur'ּ'),
(ur'[\%\.]5bd', ur'ֽ'),
(ur'[\%\.]5be', ur'־'),
(ur'[\%\.]5bf', ur'ֿ'),
(ur'[\%\.]5c0', ur'׀'),
(ur'[\%\.]5c1', ur'ׁ'),
(ur'[\%\.]5c2', ur'ׂ'),
(ur'[\%\.]5c3', ur'׃'),
(ur'[\%\.]5c4', ur'ׄ'),
(ur'[\%\.]5c5', ur'ׅ'),
(ur'[\%\.]5c6', ur'׆'),
(ur'[\%\.]5c7', ur'ׇ'),
(ur'[\%\.]5c8', ur''),
(ur'[\%\.]5c9', ur''),
(ur'[\%\.]5ca', ur''),
(ur'[\%\.]5cb', ur''),
(ur'[\%\.]5cc', ur''),
(ur'[\%\.]5cd', ur''),
(ur'[\%\.]5ce', ur''),
(ur'[\%\.]5cf', ur''),
(ur'[\%\.]5d0', ur'א'),
(ur'[\%\.]5d1', ur'ב'),
(ur'[\%\.]5d2', ur'ג'),
(ur'[\%\.]5d3', ur'ד'),
(ur'[\%\.]5d4', ur'ה'),
(ur'[\%\.]5d5', ur'ו'),
(ur'[\%\.]5d6', ur'ז'),
(ur'[\%\.]5d7', ur'ח'),
(ur'[\%\.]5d8', ur'ט'),
(ur'[\%\.]5d9', ur'י'),
(ur'[\%\.]5da', ur'ך'),
(ur'[\%\.]5db', ur'כ'),
(ur'[\%\.]5dc', ur'ל'),
(ur'[\%\.]C2[\%\.]A1', ur'¡'),
(ur'[\%\.]C2[\%\.]A2', ur'¢'),
(ur'[\%\.]C2[\%\.]A3', ur'£'),
(ur'[\%\.]C2[\%\.]A4', ur'¤'),
(ur'[\%\.]C2[\%\.]A5', ur'¥'),
(ur'[\%\.]C2[\%\.]A6', ur'¦'),
(ur'[\%\.]C2[\%\.]A7', ur'§'),
(ur'[\%\.]C2[\%\.]A8', ur'¨'),
(ur'[\%\.]C2[\%\.]A9', ur'©'),
(ur'[\%\.]C2[\%\.]AA', ur'ª'),
(ur'[\%\.]C2[\%\.]AB', ur'«'),
(ur'[\%\.]C2[\%\.]AC', ur'¬'),
(ur'[\%\.]C2[\%\.]AD', ur''),
(ur'[\%\.]C2[\%\.]AE', ur'®'),
(ur'[\%\.]C2[\%\.]AF', ur'¯'),
(ur'[\%\.]C2[\%\.]B0', ur'°'),
(ur'[\%\.]C2[\%\.]B1', ur'±'),
(ur'[\%\.]C2[\%\.]B2', ur'²'),
(ur'[\%\.]C2[\%\.]B3', ur'³'),
(ur'[\%\.]C2[\%\.]B4', ur'´'),
(ur'[\%\.]C2[\%\.]B5', ur'µ'),
(ur'[\%\.]C2[\%\.]B6', ur'¶'),
(ur'[\%\.]C2[\%\.]B7', ur'·'),
(ur'[\%\.]C2[\%\.]B8', ur'¸'),
(ur'[\%\.]C2[\%\.]B9', ur'¹'),
(ur'[\%\.]C2[\%\.]BA', ur'º'),
(ur'[\%\.]C2[\%\.]BB', ur'»'),
(ur'[\%\.]C2[\%\.]BC', ur'¼'),
(ur'[\%\.]C2[\%\.]BD', ur'½'),
(ur'[\%\.]C2[\%\.]BE', ur'¾'),
(ur'[\%\.]C2[\%\.]BF', ur'¿'),
# Caractères latins accentués
(ur'[\%\.]C3[\%\.]80', ur'À'),
(ur'[\%\.]C3[\%\.]81', ur'Á'),
(ur'[\%\.]C3[\%\.]82', ur'Â'),
(ur'[\%\.]C3[\%\.]83', ur'Ã'),
(ur'[\%\.]C3[\%\.]84', ur'Ä'),
(ur'[\%\.]C3[\%\.]85', ur'Å'),
(ur'[\%\.]C3[\%\.]86', ur'Æ'),
(ur'[\%\.]C3[\%\.]87', ur'Ç'),
(ur'[\%\.]C3[\%\.]88', ur'È'),
(ur'[\%\.]C3[\%\.]89', ur'É'),
(ur'[\%\.]C3[\%\.]8A', ur'Ê'),
(ur'[\%\.]C3[\%\.]8B', ur'Ë'),
(ur'[\%\.]C3[\%\.]8C', ur'Ì'),
(ur'[\%\.]C3[\%\.]8D', ur'Í'),
(ur'[\%\.]C3[\%\.]8E', ur'Î'),
(ur'[\%\.]C3[\%\.]8F', ur'Ï'),
(ur'[\%\.]C3[\%\.]90', ur'Ð'),
(ur'[\%\.]C3[\%\.]91', ur'Ñ'),
(ur'[\%\.]C3[\%\.]92', ur'Ò'),
(ur'[\%\.]C3[\%\.]93', ur'Ó'),
(ur'[\%\.]C3[\%\.]94', ur'Ô'),
(ur'[\%\.]C3[\%\.]95', ur'Õ'),
(ur'[\%\.]C3[\%\.]96', ur'Ö'),
(ur'[\%\.]C3[\%\.]97', ur'×'),
(ur'[\%\.]C3[\%\.]98', ur'Ø'),
(ur'[\%\.]C3[\%\.]99', ur'Ù'),
(ur'[\%\.]C3[\%\.]9A', ur'Ú'),
(ur'[\%\.]C3[\%\.]9B', ur'Û'),
(ur'[\%\.]C3[\%\.]9C', ur'Ü'),
(ur'[\%\.]C3[\%\.]9D', ur'Ý'),
(ur'[\%\.]C3[\%\.]9E', ur'Þ'),
(ur'[\%\.]C3[\%\.]9F', ur'ß'),
(ur'[\%\.]C3[\%\.]A0', ur'à'),
(ur'[\%\.]C3[\%\.]A1', ur'á'),
(ur'[\%\.]C3[\%\.]A2', ur'â'),
(ur'[\%\.]C3[\%\.]A3', ur'ã'),
(ur'[\%\.]C3[\%\.]A4', ur'ä'),
(ur'[\%\.]C3[\%\.]A5', ur'å'),
(ur'[\%\.]C3[\%\.]A6', ur'æ'),
(ur'[\%\.]C3[\%\.]A7', ur'ç'),
(ur'[\%\.]C3[\%\.]A8', ur'è'),
(ur'[\%\.]C3[\%\.]A9', ur'é'),
(ur'[\%\.]C3[\%\.]AA', ur'ê'),
(ur'[\%\.]C3[\%\.]AB', ur'ë'),
(ur'[\%\.]C3[\%\.]AC', ur'ì'),
(ur'[\%\.]C3[\%\.]AD', ur'í'),
(ur'[\%\.]C3[\%\.]AE', ur'î'),
(ur'[\%\.]C3[\%\.]AF', ur'ï'),
(ur'[\%\.]C3[\%\.]B0', ur'ð'),
(ur'[\%\.]C3[\%\.]B1', ur'ñ'),
(ur'[\%\.]C3[\%\.]B2', ur'ò'),
(ur'[\%\.]C3[\%\.]B3', ur'ó'),
(ur'[\%\.]C3[\%\.]B4', ur'ô'),
(ur'[\%\.]C3[\%\.]B5', ur'õ'),
(ur'[\%\.]C3[\%\.]B6', ur'ö'),
(ur'[\%\.]C3[\%\.]B7', ur'÷'),
(ur'[\%\.]C3[\%\.]B8', ur'ø'),
(ur'[\%\.]C3[\%\.]B9', ur'ù'),
(ur'[\%\.]C3[\%\.]BA', ur'ú'),
(ur'[\%\.]C3[\%\.]BB', ur'û'),
(ur'[\%\.]C3[\%\.]BC', ur'ü'),
(ur'[\%\.]C3[\%\.]BD', ur'ý'),
(ur'[\%\.]C3[\%\.]BE', ur'þ'),
(ur'[\%\.]C3[\%\.]BF', ur'ÿ'),
(ur'[\%\.]C4[\%\.]80', ur'Ā'),
(ur'[\%\.]C4[\%\.]81', ur'ā'),
(ur'[\%\.]C4[\%\.]82', ur'Ă'),
(ur'[\%\.]C4[\%\.]83', ur'ă'),
(ur'[\%\.]C4[\%\.]84', ur'Ą'),
(ur'[\%\.]C4[\%\.]85', ur'ą'),
(ur'[\%\.]C4[\%\.]86', ur'Ć'),
(ur'[\%\.]C4[\%\.]87', ur'ć'),
(ur'[\%\.]C4[\%\.]88', ur'Ĉ'),
(ur'[\%\.]C4[\%\.]89', ur'ĉ'),
(ur'[\%\.]C4[\%\.]8A', ur'Ċ'),
(ur'[\%\.]C4[\%\.]8B', ur'ċ'),
(ur'[\%\.]C4[\%\.]8C', ur'Č'),
(ur'[\%\.]C4[\%\.]8D', ur'č'),
(ur'[\%\.]C4[\%\.]8E', ur'Ď'),
(ur'[\%\.]C4[\%\.]8F', ur'ď'),
(ur'[\%\.]C4[\%\.]90', ur'Đ'),
(ur'[\%\.]C4[\%\.]91', ur'đ'),
(ur'[\%\.]C4[\%\.]92', ur'Ē'),
(ur'[\%\.]C4[\%\.]93', ur'ē'),
(ur'[\%\.]C4[\%\.]94', ur'Ĕ'),
(ur'[\%\.]C4[\%\.]95', ur'ĕ'),
(ur'[\%\.]C4[\%\.]96', ur'Ė'),
(ur'[\%\.]C4[\%\.]97', ur'ė'),
(ur'[\%\.]C4[\%\.]98', ur'Ę'),
(ur'[\%\.]C4[\%\.]99', ur'ę'),
(ur'[\%\.]C4[\%\.]9A', ur'Ě'),
(ur'[\%\.]C4[\%\.]9B', ur'ě'),
(ur'[\%\.]C4[\%\.]9C', ur'Ĝ'),
(ur'[\%\.]C4[\%\.]9D', ur'ĝ'),
(ur'[\%\.]C4[\%\.]9E', ur'Ğ'),
(ur'[\%\.]C4[\%\.]9F', ur'ğ'),
(ur'[\%\.]C4[\%\.]A0', ur'Ġ'),
(ur'[\%\.]C4[\%\.]A1', ur'ġ'),
(ur'[\%\.]C4[\%\.]A2', ur'Ģ'),
(ur'[\%\.]C4[\%\.]A3', ur'ģ'),
(ur'[\%\.]C4[\%\.]A4', ur'Ĥ'),
(ur'[\%\.]C4[\%\.]A5', ur'ĥ'),
(ur'[\%\.]C4[\%\.]A6', ur'Ħ'),
(ur'[\%\.]C4[\%\.]A7', ur'ħ'),
(ur'[\%\.]C4[\%\.]A8', ur'Ĩ'),
(ur'[\%\.]C4[\%\.]A9', ur'ĩ'),
(ur'[\%\.]C4[\%\.]AA', ur'Ī'),
(ur'[\%\.]C4[\%\.]AB', ur'ī'),
(ur'[\%\.]C4[\%\.]AC', ur'Ĭ'),
(ur'[\%\.]C4[\%\.]AD', ur'ĭ'),
(ur'[\%\.]C4[\%\.]AE', ur'Į'),
(ur'[\%\.]C4[\%\.]AF', ur'į'),
(ur'[\%\.]C4[\%\.]B0', ur'İ'),
(ur'[\%\.]C4[\%\.]B1', ur'ı'),
(ur'[\%\.]C4[\%\.]B2', ur'IJ'),
(ur'[\%\.]C4[\%\.]B3', ur'ij'),
(ur'[\%\.]C4[\%\.]B4', ur'Ĵ'),
(ur'[\%\.]C4[\%\.]B5', ur'ĵ'),
(ur'[\%\.]C4[\%\.]B6', ur'Ķ'),
(ur'[\%\.]C4[\%\.]B7', ur'ķ'),
(ur'[\%\.]C4[\%\.]B8', ur'ĸ'),
(ur'[\%\.]C4[\%\.]B9', ur'Ĺ'),
(ur'[\%\.]C4[\%\.]BA', ur'ĺ'),
(ur'[\%\.]C4[\%\.]BB', ur'Ļ'),
(ur'[\%\.]C4[\%\.]BC', ur'ļ'),
(ur'[\%\.]C4[\%\.]BD', ur'Ľ'),
(ur'[\%\.]C4[\%\.]BE', ur'ľ'),
(ur'[\%\.]C4[\%\.]BF', ur'Ŀ'),
(ur'[\%\.]C5[\%\.]80', ur'ŀ'),
(ur'[\%\.]C5[\%\.]81', ur'Ł'),
(ur'[\%\.]C5[\%\.]82', ur'ł'),
(ur'[\%\.]C5[\%\.]83', ur'Ń'),
(ur'[\%\.]C5[\%\.]84', ur'ń'),
(ur'[\%\.]C5[\%\.]85', ur'Ņ'),
(ur'[\%\.]C5[\%\.]86', ur'ņ'),
(ur'[\%\.]C5[\%\.]87', ur'Ň'),
(ur'[\%\.]C5[\%\.]88', ur'ň'),
(ur'[\%\.]C5[\%\.]89', ur'ʼn'),
(ur'[\%\.]C5[\%\.]8A', ur'Ŋ'),
(ur'[\%\.]C5[\%\.]8B', ur'ŋ'),
(ur'[\%\.]C5[\%\.]8C', ur'Ō'),
(ur'[\%\.]C5[\%\.]8D', ur'ō'),
(ur'[\%\.]C5[\%\.]8E', ur'Ŏ'),
(ur'[\%\.]C5[\%\.]8F', ur'ŏ'),
(ur'[\%\.]C5[\%\.]90', ur'Ő'),
(ur'[\%\.]C5[\%\.]91', ur'ő'),
(ur'[\%\.]C5[\%\.]92', ur'Œ'),
(ur'[\%\.]C5[\%\.]93', ur'œ'),
(ur'[\%\.]C5[\%\.]94', ur'Ŕ'),
(ur'[\%\.]C5[\%\.]95', ur'ŕ'),
(ur'[\%\.]C5[\%\.]96', ur'Ŗ'),
(ur'[\%\.]C5[\%\.]97', ur'ŗ'),
(ur'[\%\.]C5[\%\.]98', ur'Ř'),
(ur'[\%\.]C5[\%\.]99', ur'ř'),
(ur'[\%\.]C5[\%\.]9A', ur'Ś'),
(ur'[\%\.]C5[\%\.]9B', ur'ś'),
(ur'[\%\.]C5[\%\.]9C', ur'Ŝ'),
(ur'[\%\.]C5[\%\.]9D', ur'ŝ'),
(ur'[\%\.]C5[\%\.]9E', ur'Ş'),
(ur'[\%\.]C5[\%\.]9F', ur'ş'),
(ur'[\%\.]C5[\%\.]A0', ur'Š'),
(ur'[\%\.]C5[\%\.]A1', ur'š'),
(ur'[\%\.]C5[\%\.]A2', ur'Ţ'),
(ur'[\%\.]C5[\%\.]A3', ur'ţ'),
(ur'[\%\.]C5[\%\.]A4', ur'Ť'),
(ur'[\%\.]C5[\%\.]A5', ur'ť'),
(ur'[\%\.]C5[\%\.]A6', ur'Ŧ'),
(ur'[\%\.]C5[\%\.]A7', ur'ŧ'),
(ur'[\%\.]C5[\%\.]A8', ur'Ũ'),
(ur'[\%\.]C5[\%\.]A9', ur'ũ'),
(ur'[\%\.]C5[\%\.]AA', ur'Ū'),
(ur'[\%\.]C5[\%\.]AB', ur'ū'),
(ur'[\%\.]C5[\%\.]AC', ur'Ŭ'),
(ur'[\%\.]C5[\%\.]AD', ur'ŭ'),
(ur'[\%\.]C5[\%\.]AE', ur'Ů'),
(ur'[\%\.]C5[\%\.]AF', ur'ů'),
(ur'[\%\.]C5[\%\.]B0', ur'Ű'),
(ur'[\%\.]C5[\%\.]B1', ur'ű'),
(ur'[\%\.]C5[\%\.]B2', ur'Ų'),
(ur'[\%\.]C5[\%\.]B3', ur'ų'),
(ur'[\%\.]C5[\%\.]B4', ur'Ŵ'),
(ur'[\%\.]C5[\%\.]B5', ur'ŵ'),
(ur'[\%\.]C5[\%\.]B6', ur'Ŷ'),
(ur'[\%\.]C5[\%\.]B7', ur'ŷ'),
(ur'[\%\.]C5[\%\.]B8', ur'Ÿ'),
(ur'[\%\.]C5[\%\.]B9', ur'Ź'),
(ur'[\%\.]C5[\%\.]BA', ur'ź'),
(ur'[\%\.]C5[\%\.]BB', ur'Ż'),
(ur'[\%\.]C5[\%\.]BC', ur'ż'),
(ur'[\%\.]C5[\%\.]BD', ur'Ž'),
(ur'[\%\.]C5[\%\.]BE', ur'ž'),
(ur'[\%\.]C5[\%\.]BF', ur'ſ'),
# Caractère inconnue
(ur'[\%\.]C6[\%\.]80', ur'ƀ'),
(ur'[\%\.]C6[\%\.]81', ur'Ɓ'),
(ur'[\%\.]C6[\%\.]82', ur'Ƃ'),
(ur'[\%\.]C6[\%\.]83', ur'ƃ'),
(ur'[\%\.]C6[\%\.]84', ur'Ƅ'),
(ur'[\%\.]C6[\%\.]85', ur'ƅ'),
(ur'[\%\.]C6[\%\.]86', ur'Ɔ'),
(ur'[\%\.]C6[\%\.]87', ur'Ƈ'),
(ur'[\%\.]C6[\%\.]88', ur'ƈ'),
(ur'[\%\.]C6[\%\.]89', ur'Ɖ'),
(ur'[\%\.]C6[\%\.]8A', ur'Ɗ'),
(ur'[\%\.]C6[\%\.]8B', ur'Ƌ'),
(ur'[\%\.]C6[\%\.]8C', ur'ƌ'),
(ur'[\%\.]C6[\%\.]8D', ur'ƍ'),
(ur'[\%\.]C6[\%\.]8E', ur'Ǝ'),
(ur'[\%\.]C6[\%\.]8F', ur'Ə'),
(ur'[\%\.]C6[\%\.]90', ur'Ɛ'),
(ur'[\%\.]C6[\%\.]91', ur'Ƒ'),
(ur'[\%\.]C6[\%\.]92', ur'ƒ'),
(ur'[\%\.]C6[\%\.]93', ur'Ɠ'),
(ur'[\%\.]C6[\%\.]94', ur'Ɣ'),
(ur'[\%\.]C6[\%\.]95', ur'ƕ'),
(ur'[\%\.]C6[\%\.]96', ur'Ɩ'),
(ur'[\%\.]C6[\%\.]97', ur'Ɨ'),
(ur'[\%\.]C6[\%\.]98', ur'Ƙ'),
(ur'[\%\.]C6[\%\.]99', ur'ƙ'),
(ur'[\%\.]C6[\%\.]9A', ur'ƚ'),
(ur'[\%\.]C6[\%\.]9B', ur'ƛ'),
(ur'[\%\.]C6[\%\.]9C', ur'Ɯ'),
(ur'[\%\.]C6[\%\.]9D', ur'Ɲ'),
(ur'[\%\.]C6[\%\.]9E', ur'ƞ'),
(ur'[\%\.]C6[\%\.]9F', ur'Ɵ'),
(ur'[\%\.]C6[\%\.]A0', ur'Ơ'),
(ur'[\%\.]C6[\%\.]A1', ur'ơ'),
(ur'[\%\.]C6[\%\.]A2', ur'Ƣ'),
(ur'[\%\.]C6[\%\.]A3', ur'ƣ'),
(ur'[\%\.]C6[\%\.]A4', ur'Ƥ'),
(ur'[\%\.]C6[\%\.]A5', ur'ƥ'),
(ur'[\%\.]C6[\%\.]A6', ur'Ʀ'),
(ur'[\%\.]C6[\%\.]A7', ur'Ƨ'),
(ur'[\%\.]C6[\%\.]A8', ur'ƨ'),
(ur'[\%\.]C6[\%\.]A9', ur'Ʃ'),
(ur'[\%\.]C6[\%\.]AA', ur'ƪ'),
(ur'[\%\.]C6[\%\.]AB', ur'ƫ'),
(ur'[\%\.]C6[\%\.]AC', ur'Ƭ'),
(ur'[\%\.]C6[\%\.]AD', ur'ƭ'),
(ur'[\%\.]C6[\%\.]AE', ur'Ʈ'),
(ur'[\%\.]C6[\%\.]AF', ur'Ư'),
(ur'[\%\.]C6[\%\.]B0', ur'ư'),
(ur'[\%\.]C6[\%\.]B1', ur'Ʊ'),
(ur'[\%\.]C6[\%\.]B2', ur'Ʋ'),
(ur'[\%\.]C6[\%\.]B3', ur'Ƴ'),
(ur'[\%\.]C6[\%\.]B4', ur'ƴ'),
(ur'[\%\.]C6[\%\.]B5', ur'Ƶ'),
(ur'[\%\.]C6[\%\.]B6', ur'ƶ'),
(ur'[\%\.]C6[\%\.]B7', ur'Ʒ'),
(ur'[\%\.]C6[\%\.]B8', ur'Ƹ'),
(ur'[\%\.]C6[\%\.]B9', ur'ƹ'),
(ur'[\%\.]C6[\%\.]BA', ur'ƺ'),
(ur'[\%\.]C6[\%\.]BB', ur'ƻ'),
(ur'[\%\.]C6[\%\.]BC', ur'Ƽ'),
(ur'[\%\.]C6[\%\.]BD', ur'ƽ'),
(ur'[\%\.]C6[\%\.]BE', ur'ƾ'),
(ur'[\%\.]C6[\%\.]BF', ur'ƿ'),
(ur'[\%\.]C7[\%\.]80', ur'ǀ'),
(ur'[\%\.]C7[\%\.]81', ur'ǁ'),
(ur'[\%\.]C7[\%\.]82', ur'ǂ'),
(ur'[\%\.]C7[\%\.]83', ur'ǃ'),
(ur'[\%\.]C7[\%\.]84', ur'DŽ'),
(ur'[\%\.]C7[\%\.]85', ur'Dž'),
(ur'[\%\.]C7[\%\.]86', ur'dž'),
(ur'[\%\.]C7[\%\.]87', ur'LJ'),
(ur'[\%\.]C7[\%\.]88', ur'Lj'),
(ur'[\%\.]C7[\%\.]89', ur'lj'),
(ur'[\%\.]C7[\%\.]8A', ur'NJ'),
(ur'[\%\.]C7[\%\.]8B', ur'Nj'),
(ur'[\%\.]C7[\%\.]8C', ur'nj'),
(ur'[\%\.]C7[\%\.]8D', ur'Ǎ'),
(ur'[\%\.]C7[\%\.]8E', ur'ǎ'),
(ur'[\%\.]C7[\%\.]8F', ur'Ǐ'),
(ur'[\%\.]C7[\%\.]90', ur'ǐ'),
(ur'[\%\.]C7[\%\.]91', ur'Ǒ'),
(ur'[\%\.]C7[\%\.]92', ur'ǒ'),
(ur'[\%\.]C7[\%\.]93', ur'Ǔ'),
(ur'[\%\.]C7[\%\.]94', ur'ǔ'),
(ur'[\%\.]C7[\%\.]95', ur'Ǖ'),
(ur'[\%\.]C7[\%\.]96', ur'ǖ'),
(ur'[\%\.]C7[\%\.]97', ur'Ǘ'),
(ur'[\%\.]C7[\%\.]98', ur'ǘ'),
(ur'[\%\.]C7[\%\.]99', ur'Ǚ'),
(ur'[\%\.]C7[\%\.]9A', ur'ǚ'),
(ur'[\%\.]C7[\%\.]9B', ur'Ǜ'),
(ur'[\%\.]C7[\%\.]9C', ur'ǜ'),
(ur'[\%\.]C7[\%\.]9D', ur'ǝ'),
(ur'[\%\.]C7[\%\.]9E', ur'Ǟ'),
(ur'[\%\.]C7[\%\.]9F', ur'ǟ'),
(ur'[\%\.]C7[\%\.]A0', ur'Ǡ'),
(ur'[\%\.]C7[\%\.]A1', ur'ǡ'),
(ur'[\%\.]C7[\%\.]A2', ur'Ǣ'),
(ur'[\%\.]C7[\%\.]A3', ur'ǣ'),
(ur'[\%\.]C7[\%\.]A4', ur'Ǥ'),
(ur'[\%\.]C7[\%\.]A5', ur'ǥ'),
(ur'[\%\.]C7[\%\.]A6', ur'Ǧ'),
(ur'[\%\.]C7[\%\.]A7', ur'ǧ'),
(ur'[\%\.]C7[\%\.]A8', ur'Ǩ'),
(ur'[\%\.]C7[\%\.]A9', ur'ǩ'),
(ur'[\%\.]C7[\%\.]AA', ur'Ǫ'),
(ur'[\%\.]C7[\%\.]AB', ur'ǫ'),
(ur'[\%\.]C7[\%\.]AC', ur'Ǭ'),
(ur'[\%\.]C7[\%\.]AD', ur'ǭ'),
(ur'[\%\.]C7[\%\.]AE', ur'Ǯ'),
(ur'[\%\.]C7[\%\.]AF', ur'ǯ'),
(ur'[\%\.]C7[\%\.]B0', ur'ǰ'),
(ur'[\%\.]C7[\%\.]B1', ur'DZ'),
(ur'[\%\.]C7[\%\.]B2', ur'Dz'),
(ur'[\%\.]C7[\%\.]B3', ur'dz'),
(ur'[\%\.]C7[\%\.]B4', ur'Ǵ'),
(ur'[\%\.]C7[\%\.]B5', ur'ǵ'),
(ur'[\%\.]C7[\%\.]B6', ur'Ƕ'),
(ur'[\%\.]C7[\%\.]B7', ur'Ƿ'),
(ur'[\%\.]C7[\%\.]B8', ur'Ǹ'),
(ur'[\%\.]C7[\%\.]B9', ur'ǹ'),
(ur'[\%\.]C7[\%\.]BA', ur'Ǻ'),
(ur'[\%\.]C7[\%\.]BB', ur'ǻ'),
(ur'[\%\.]C7[\%\.]BC', ur'Ǽ'),
(ur'[\%\.]C7[\%\.]BD', ur'ǽ'),
(ur'[\%\.]C7[\%\.]BE', ur'Ǿ'),
(ur'[\%\.]C7[\%\.]BF', ur'ǿ'),
(ur'[\%\.]C8[\%\.]80', ur'Ȁ'),
(ur'[\%\.]C8[\%\.]81', ur'ȁ'),
(ur'[\%\.]C8[\%\.]82', ur'Ȃ'),
(ur'[\%\.]C8[\%\.]83', ur'ȃ'),
(ur'[\%\.]C8[\%\.]84', ur'Ȅ'),
(ur'[\%\.]C8[\%\.]85', ur'ȅ'),
(ur'[\%\.]C8[\%\.]86', ur'Ȇ'),
(ur'[\%\.]C8[\%\.]87', ur'ȇ'),
(ur'[\%\.]C8[\%\.]88', ur'Ȉ'),
(ur'[\%\.]C8[\%\.]89', ur'ȉ'),
(ur'[\%\.]C8[\%\.]8A', ur'Ȋ'),
(ur'[\%\.]C8[\%\.]8B', ur'ȋ'),
(ur'[\%\.]C8[\%\.]8C', ur'Ȍ'),
(ur'[\%\.]C8[\%\.]8D', ur'ȍ'),
(ur'[\%\.]C8[\%\.]8E', ur'Ȏ'),
(ur'[\%\.]C8[\%\.]8F', ur'ȏ'),
(ur'[\%\.]C8[\%\.]90', ur'Ȑ'),
(ur'[\%\.]C8[\%\.]91', ur'ȑ'),
(ur'[\%\.]C8[\%\.]92', ur'Ȓ'),
(ur'[\%\.]C8[\%\.]93', ur'ȓ'),
(ur'[\%\.]C8[\%\.]94', ur'Ȕ'),
(ur'[\%\.]C8[\%\.]95', ur'ȕ'),
(ur'[\%\.]C8[\%\.]96', ur'Ȗ'),
(ur'[\%\.]C8[\%\.]97', ur'ȗ'),
(ur'[\%\.]C8[\%\.]98', ur'Ș'),
(ur'[\%\.]C8[\%\.]99', ur'ș'),
(ur'[\%\.]C8[\%\.]9A', ur'Ț'),
(ur'[\%\.]C8[\%\.]9B', ur'ț'),
(ur'[\%\.]C8[\%\.]9C', ur'Ȝ'),
(ur'[\%\.]C8[\%\.]9D', ur'ȝ'),
(ur'[\%\.]C8[\%\.]9E', ur'Ȟ'),
(ur'[\%\.]C8[\%\.]9F', ur'ȟ'),
(ur'[\%\.]C8[\%\.]A0', ur'Ƞ'),
(ur'[\%\.]C8[\%\.]A1', ur'ȡ'),
(ur'[\%\.]C8[\%\.]A2', ur'Ȣ'),
(ur'[\%\.]C8[\%\.]A3', ur'ȣ'),
(ur'[\%\.]C8[\%\.]A4', ur'Ȥ'),
(ur'[\%\.]C8[\%\.]A5', ur'ȥ'),
(ur'[\%\.]C8[\%\.]A6', ur'Ȧ'),
(ur'[\%\.]C8[\%\.]A7', ur'ȧ'),
(ur'[\%\.]C8[\%\.]A8', ur'Ȩ'),
(ur'[\%\.]C8[\%\.]A9', ur'ȩ'),
(ur'[\%\.]C8[\%\.]AA', ur'Ȫ'),
(ur'[\%\.]C8[\%\.]AB', ur'ȫ'),
(ur'[\%\.]C8[\%\.]AC', ur'Ȭ'),
(ur'[\%\.]C8[\%\.]AD', ur'ȭ'),
(ur'[\%\.]C8[\%\.]AE', ur'Ȯ'),
(ur'[\%\.]C8[\%\.]AF', ur'ȯ'),
(ur'[\%\.]C8[\%\.]B0', ur'Ȱ'),
(ur'[\%\.]C8[\%\.]B1', ur'ȱ'),
(ur'[\%\.]C8[\%\.]B2', ur'Ȳ'),
(ur'[\%\.]C8[\%\.]B3', ur'ȳ'),
(ur'[\%\.]C8[\%\.]B4', ur'ȴ'),
(ur'[\%\.]C8[\%\.]B5', ur'ȵ'),
(ur'[\%\.]C8[\%\.]B6', ur'ȶ'),
(ur'[\%\.]C8[\%\.]B7', ur'ȷ'),
(ur'[\%\.]C8[\%\.]B8', ur'ȸ'),
(ur'[\%\.]C8[\%\.]B9', ur'ȹ'),
(ur'[\%\.]C8[\%\.]BA', ur'Ⱥ'),
(ur'[\%\.]C8[\%\.]BB', ur'Ȼ'),
(ur'[\%\.]C8[\%\.]BC', ur'ȼ'),
(ur'[\%\.]C8[\%\.]BD', ur'Ƚ'),
(ur'[\%\.]C8[\%\.]BE', ur'Ⱦ'),
(ur'[\%\.]C8[\%\.]BF', ur'ȿ'),
(ur'[\%\.]C9[\%\.]80', ur'ɀ'),
(ur'[\%\.]C9[\%\.]81', ur'Ɂ'),
(ur'[\%\.]C9[\%\.]82', ur'ɂ'),
(ur'[\%\.]C9[\%\.]83', ur'Ƀ'),
(ur'[\%\.]C9[\%\.]84', ur'Ʉ'),
(ur'[\%\.]C9[\%\.]85', ur'Ʌ'),
(ur'[\%\.]C9[\%\.]86', ur'Ɇ'),
(ur'[\%\.]C9[\%\.]87', ur'ɇ'),
(ur'[\%\.]C9[\%\.]88', ur'Ɉ'),
(ur'[\%\.]C9[\%\.]89', ur'ɉ'),
(ur'[\%\.]C9[\%\.]8A', ur'Ɋ'),
(ur'[\%\.]C9[\%\.]8B', ur'ɋ'),
(ur'[\%\.]C9[\%\.]8C', ur'Ɍ'),
(ur'[\%\.]C9[\%\.]8D', ur'ɍ'),
(ur'[\%\.]C9[\%\.]8E', ur'Ɏ'),
(ur'[\%\.]C9[\%\.]8F', ur'ɏ'),
(ur'[\%\.]C9[\%\.]90', ur'ɐ'),
(ur'[\%\.]C9[\%\.]91', ur'ɑ'),
(ur'[\%\.]C9[\%\.]92', ur'ɒ'),
(ur'[\%\.]C9[\%\.]93', ur'ɓ'),
(ur'[\%\.]C9[\%\.]94', ur'ɔ'),
(ur'[\%\.]C9[\%\.]95', ur'ɕ'),
(ur'[\%\.]C9[\%\.]96', ur'ɖ'),
(ur'[\%\.]C9[\%\.]97', ur'ɗ'),
(ur'[\%\.]C9[\%\.]98', ur'ɘ'),
(ur'[\%\.]C9[\%\.]99', ur'ə'),
(ur'[\%\.]C9[\%\.]9A', ur'ɚ'),
(ur'[\%\.]C9[\%\.]9B', ur'ɛ'),
(ur'[\%\.]C9[\%\.]9C', ur'ɜ'),
(ur'[\%\.]C9[\%\.]9D', ur'ɝ'),
(ur'[\%\.]C9[\%\.]9E', ur'ɞ'),
(ur'[\%\.]C9[\%\.]9F', ur'ɟ'),
(ur'[\%\.]C9[\%\.]A0', ur'ɠ'),
(ur'[\%\.]C9[\%\.]A1', ur'ɡ'),
(ur'[\%\.]C9[\%\.]A2', ur'ɢ'),
(ur'[\%\.]C9[\%\.]A3', ur'ɣ'),
(ur'[\%\.]C9[\%\.]A4', ur'ɤ'),
(ur'[\%\.]C9[\%\.]A5', ur'ɥ'),
(ur'[\%\.]C9[\%\.]A6', ur'ɦ'),
(ur'[\%\.]C9[\%\.]A7', ur'ɧ'),
(ur'[\%\.]C9[\%\.]A8', ur'ɨ'),
(ur'[\%\.]C9[\%\.]A9', ur'ɩ'),
(ur'[\%\.]C9[\%\.]AA', ur'ɪ'),
(ur'[\%\.]C9[\%\.]AB', ur'ɫ'),
(ur'[\%\.]C9[\%\.]AC', ur'ɬ'),
(ur'[\%\.]C9[\%\.]AD', ur'ɭ'),
(ur'[\%\.]C9[\%\.]AE', ur'ɮ'),
(ur'[\%\.]C9[\%\.]AF', ur'ɯ'),
(ur'[\%\.]C9[\%\.]B0', ur'ɰ'),
(ur'[\%\.]C9[\%\.]B1', ur'ɱ'),
(ur'[\%\.]C9[\%\.]B2', ur'ɲ'),
(ur'[\%\.]C9[\%\.]B3', ur'ɳ'),
(ur'[\%\.]C9[\%\.]B4', ur'ɴ'),
(ur'[\%\.]C9[\%\.]B5', ur'ɵ'),
(ur'[\%\.]C9[\%\.]B6', ur'ɶ'),
(ur'[\%\.]C9[\%\.]B7', ur'ɷ'),
(ur'[\%\.]C9[\%\.]B8', ur'ɸ'),
(ur'[\%\.]C9[\%\.]B9', ur'ɹ'),
(ur'[\%\.]C9[\%\.]BA', ur'ɺ'),
(ur'[\%\.]C9[\%\.]BB', ur'ɻ'),
(ur'[\%\.]C9[\%\.]BC', ur'ɼ'),
(ur'[\%\.]C9[\%\.]BD', ur'ɽ'),
(ur'[\%\.]C9[\%\.]BE', ur'ɾ'),
(ur'[\%\.]C9[\%\.]BF', ur'ɿ'),
(ur'[\%\.]CA[\%\.]80', ur'ʀ'),
(ur'[\%\.]CA[\%\.]81', ur'ʁ'),
(ur'[\%\.]CA[\%\.]82', ur'ʂ'),
(ur'[\%\.]CA[\%\.]83', ur'ʃ'),
(ur'[\%\.]CA[\%\.]84', ur'ʄ'),
(ur'[\%\.]CA[\%\.]85', ur'ʅ'),
(ur'[\%\.]CA[\%\.]86', ur'ʆ'),
(ur'[\%\.]CA[\%\.]87', ur'ʇ'),
(ur'[\%\.]CA[\%\.]88', ur'ʈ'),
(ur'[\%\.]CA[\%\.]89', ur'ʉ'),
(ur'[\%\.]CA[\%\.]8A', ur'ʊ'),
(ur'[\%\.]CA[\%\.]8B', ur'ʋ'),
(ur'[\%\.]CA[\%\.]8C', ur'ʌ'),
(ur'[\%\.]CA[\%\.]8D', ur'ʍ'),
(ur'[\%\.]CA[\%\.]8E', ur'ʎ'),
(ur'[\%\.]CA[\%\.]8F', ur'ʏ'),
(ur'[\%\.]CA[\%\.]90', ur'ʐ'),
(ur'[\%\.]CA[\%\.]91', ur'ʑ'),
(ur'[\%\.]CA[\%\.]92', ur'ʒ'),
(ur'[\%\.]CA[\%\.]93', ur'ʓ'),
(ur'[\%\.]CA[\%\.]94', ur'ʔ'),
(ur'[\%\.]CA[\%\.]95', ur'ʕ'),
(ur'[\%\.]CA[\%\.]96', ur'ʖ'),
(ur'[\%\.]CA[\%\.]97', ur'ʗ'),
(ur'[\%\.]CA[\%\.]98', ur'ʘ'),
(ur'[\%\.]CA[\%\.]99', ur'ʙ'),
(ur'[\%\.]CA[\%\.]9A', ur'ʚ'),
(ur'[\%\.]CA[\%\.]9B', ur'ʛ'),
(ur'[\%\.]CA[\%\.]9C', ur'ʜ'),
(ur'[\%\.]CA[\%\.]9D', ur'ʝ'),
(ur'[\%\.]CA[\%\.]9E', ur'ʞ'),
(ur'[\%\.]CA[\%\.]9F', ur'ʟ'),
(ur'[\%\.]CA[\%\.]A0', ur'ʠ'),
(ur'[\%\.]CA[\%\.]A1', ur'ʡ'),
(ur'[\%\.]CA[\%\.]A2', ur'ʢ'),
(ur'[\%\.]CA[\%\.]A3', ur'ʣ'),
(ur'[\%\.]CA[\%\.]A4', ur'ʤ'),
(ur'[\%\.]CA[\%\.]A5', ur'ʥ'),
(ur'[\%\.]CA[\%\.]A6', ur'ʦ'),
(ur'[\%\.]CA[\%\.]A7', ur'ʧ'),
(ur'[\%\.]CA[\%\.]A8', ur'ʨ'),
(ur'[\%\.]CA[\%\.]A9', ur'ʩ'),
(ur'[\%\.]CA[\%\.]AA', ur'ʪ'),
(ur'[\%\.]CA[\%\.]AB', ur'ʫ'),
(ur'[\%\.]CA[\%\.]AC', ur'ʬ'),
(ur'[\%\.]CA[\%\.]AD', ur'ʭ'),
(ur'[\%\.]CA[\%\.]AE', ur'ʮ'),
(ur'[\%\.]CA[\%\.]AF', ur'ʯ'),
(ur'[\%\.]CA[\%\.]B0', ur'ʰ'),
(ur'[\%\.]CA[\%\.]B1', ur'ʱ'),
(ur'[\%\.]CA[\%\.]B2', ur'ʲ'),
(ur'[\%\.]CA[\%\.]B3', ur'ʳ'),
(ur'[\%\.]CA[\%\.]B4', ur'ʴ'),
(ur'[\%\.]CA[\%\.]B5', ur'ʵ'),
(ur'[\%\.]CA[\%\.]B6', ur'ʶ'),
(ur'[\%\.]CA[\%\.]B7', ur'ʷ'),
(ur'[\%\.]CA[\%\.]B8', ur'ʸ'),
(ur'[\%\.]CA[\%\.]B9', ur'ʹ'),
(ur'[\%\.]CA[\%\.]BA', ur'ʺ'),
(ur'[\%\.]CA[\%\.]BB', ur'ʻ'),
(ur'[\%\.]CA[\%\.]BC', ur'ʼ'),
(ur'[\%\.]CA[\%\.]BD', ur'ʽ'),
(ur'[\%\.]CA[\%\.]BE', ur'ʾ'),
(ur'[\%\.]CA[\%\.]BF', ur'ʿ'),
(ur'[\%\.]CB[\%\.]80', ur'ˀ'),
(ur'[\%\.]CB[\%\.]81', ur'ˁ'),
(ur'[\%\.]CB[\%\.]82', ur'˂'),
(ur'[\%\.]CB[\%\.]83', ur'˃'),
(ur'[\%\.]CB[\%\.]84', ur'˄'),
(ur'[\%\.]CB[\%\.]85', ur'˅'),
(ur'[\%\.]CB[\%\.]86', ur'ˆ'),
(ur'[\%\.]CB[\%\.]87', ur'ˇ'),
(ur'[\%\.]CB[\%\.]88', ur'ˈ'),
(ur'[\%\.]CB[\%\.]89', ur'ˉ'),
(ur'[\%\.]CB[\%\.]8A', ur'ˊ'),
(ur'[\%\.]CB[\%\.]8B', ur'ˋ'),
(ur'[\%\.]CB[\%\.]8C', ur'ˌ'),
(ur'[\%\.]CB[\%\.]8D', ur'ˍ'),
(ur'[\%\.]CB[\%\.]8E', ur'ˎ'),
(ur'[\%\.]CB[\%\.]8F', ur'ˏ'),
(ur'[\%\.]CB[\%\.]90', ur'ː'),
(ur'[\%\.]CB[\%\.]91', ur'ˑ'),
(ur'[\%\.]CB[\%\.]92', ur'˒'),
(ur'[\%\.]CB[\%\.]93', ur'˓'),
(ur'[\%\.]CB[\%\.]94', ur'˔'),
(ur'[\%\.]CB[\%\.]95', ur'˕'),
(ur'[\%\.]CB[\%\.]96', ur'˖'),
(ur'[\%\.]CB[\%\.]97', ur'˗'),
(ur'[\%\.]CB[\%\.]98', ur'˘'),
(ur'[\%\.]CB[\%\.]99', ur'˙'),
(ur'[\%\.]CB[\%\.]9A', ur'˚'),
(ur'[\%\.]CB[\%\.]9B', ur'˛'),
(ur'[\%\.]CB[\%\.]9C', ur'˜'),
(ur'[\%\.]CB[\%\.]9D', ur'˝'),
(ur'[\%\.]CB[\%\.]9E', ur'˞'),
(ur'[\%\.]CB[\%\.]9F', ur'˟'),
(ur'[\%\.]CB[\%\.]A0', ur'ˠ'),
(ur'[\%\.]CB[\%\.]A1', ur'ˡ'),
(ur'[\%\.]CB[\%\.]A2', ur'ˢ'),
(ur'[\%\.]CB[\%\.]A3', ur'ˣ'),
(ur'[\%\.]CB[\%\.]A4', ur'ˤ'),
(ur'[\%\.]CB[\%\.]A5', ur'˥'),
(ur'[\%\.]CB[\%\.]A6', ur'˦'),
(ur'[\%\.]CB[\%\.]A7', ur'˧'),
(ur'[\%\.]CB[\%\.]A8', ur'˨'),
(ur'[\%\.]CB[\%\.]A9', ur'˩'),
(ur'[\%\.]CB[\%\.]AA', ur'˪'),
(ur'[\%\.]CB[\%\.]AB', ur'˫'),
(ur'[\%\.]CB[\%\.]AC', ur'ˬ'),
(ur'[\%\.]CB[\%\.]AD', ur'˭'),
(ur'[\%\.]CB[\%\.]AE', ur'ˮ'),
(ur'[\%\.]CB[\%\.]AF', ur'˯'),
(ur'[\%\.]CB[\%\.]B0', ur'˰'),
(ur'[\%\.]CB[\%\.]B1', ur'˱'),
(ur'[\%\.]CB[\%\.]B2', ur'˲'),
(ur'[\%\.]CB[\%\.]B3', ur'˳'),
(ur'[\%\.]CB[\%\.]B4', ur'˴'),
(ur'[\%\.]CB[\%\.]B5', ur'˵'),
(ur'[\%\.]CB[\%\.]B6', ur'˶'),
(ur'[\%\.]CB[\%\.]B7', ur'˷'),
(ur'[\%\.]CB[\%\.]B8', ur'˸'),
(ur'[\%\.]CB[\%\.]B9', ur'˹'),
(ur'[\%\.]CB[\%\.]BA', ur'˺'),
(ur'[\%\.]CB[\%\.]BB', ur'˻'),
(ur'[\%\.]CB[\%\.]BC', ur'˼'),
(ur'[\%\.]CB[\%\.]BD', ur'˽'),
(ur'[\%\.]CB[\%\.]BE', ur'˾'),
(ur'[\%\.]CB[\%\.]BF', ur'˿'),
(ur'[\%\.]CC[\%\.]80', ur'̀'),
(ur'[\%\.]CC[\%\.]81', ur'́'),
(ur'[\%\.]CC[\%\.]82', ur'̂'),
(ur'[\%\.]CC[\%\.]83', ur'̃'),
(ur'[\%\.]CC[\%\.]84', ur'̄'),
(ur'[\%\.]CC[\%\.]85', ur'̅'),
(ur'[\%\.]CC[\%\.]86', ur'̆'),
(ur'[\%\.]CC[\%\.]87', ur'̇'),
(ur'[\%\.]CC[\%\.]88', ur'̈'),
(ur'[\%\.]CC[\%\.]89', ur'̉'),
(ur'[\%\.]CC[\%\.]8A', ur'̊'),
(ur'[\%\.]CC[\%\.]8B', ur'̋'),
(ur'[\%\.]CC[\%\.]8C', ur'̌'),
(ur'[\%\.]CC[\%\.]8D', ur'̍'),
(ur'[\%\.]CC[\%\.]8E', ur'̎'),
(ur'[\%\.]CC[\%\.]8F', ur'̏'),
(ur'[\%\.]CC[\%\.]90', ur'̐'),
(ur'[\%\.]CC[\%\.]91', ur'̑'),
(ur'[\%\.]CC[\%\.]92', ur'̒'),
(ur'[\%\.]CC[\%\.]93', ur'̓'),
(ur'[\%\.]CC[\%\.]94', ur'̔'),
(ur'[\%\.]CC[\%\.]95', ur'̕'),
(ur'[\%\.]CC[\%\.]96', ur'̖'),
(ur'[\%\.]CC[\%\.]97', ur'̗'),
(ur'[\%\.]CC[\%\.]98', ur'̘'),
(ur'[\%\.]CC[\%\.]99', ur'̙'),
(ur'[\%\.]CC[\%\.]9A', ur'̚'),
(ur'[\%\.]CC[\%\.]9B', ur'̛'),
(ur'[\%\.]CC[\%\.]9C', ur'̜'),
(ur'[\%\.]CC[\%\.]9D', ur'̝'),
(ur'[\%\.]CC[\%\.]9E', ur'̞'),
(ur'[\%\.]CC[\%\.]9F', ur'̟'),
(ur'[\%\.]CC[\%\.]A0', ur'̠'),
(ur'[\%\.]CC[\%\.]A1', ur'̡'),
(ur'[\%\.]CC[\%\.]A2', ur'̢'),
(ur'[\%\.]CC[\%\.]A3', ur'̣'),
(ur'[\%\.]CC[\%\.]A4', ur'̤'),
(ur'[\%\.]CC[\%\.]A5', ur'̥'),
(ur'[\%\.]CC[\%\.]A6', ur'̦'),
(ur'[\%\.]CC[\%\.]A7', ur'̧'),
(ur'[\%\.]CC[\%\.]A8', ur'̨'),
(ur'[\%\.]CC[\%\.]A9', ur'̩'),
(ur'[\%\.]CC[\%\.]AA', ur'̪'),
(ur'[\%\.]CC[\%\.]AB', ur'̫'),
(ur'[\%\.]CC[\%\.]AC', ur'̬'),
(ur'[\%\.]CC[\%\.]AD', ur'̭'),
(ur'[\%\.]CC[\%\.]AE', ur'̮'),
(ur'[\%\.]CC[\%\.]AF', ur'̯'),
(ur'[\%\.]CC[\%\.]B0', ur'̰'),
(ur'[\%\.]CC[\%\.]B1', ur'̱'),
(ur'[\%\.]CC[\%\.]B2', ur'̲'),
(ur'[\%\.]CC[\%\.]B3', ur'̳'),
(ur'[\%\.]CC[\%\.]B4', ur'̴'),
(ur'[\%\.]CC[\%\.]B5', ur'̵'),
(ur'[\%\.]CC[\%\.]B6', ur'̶'),
(ur'[\%\.]CC[\%\.]B7', ur'̷'),
(ur'[\%\.]CC[\%\.]B8', ur'̸'),
(ur'[\%\.]CC[\%\.]B9', ur'̹'),
(ur'[\%\.]CC[\%\.]BA', ur'̺'),
(ur'[\%\.]CC[\%\.]BB', ur'̻'),
(ur'[\%\.]CC[\%\.]BC', ur'̼'),
(ur'[\%\.]CC[\%\.]BD', ur'̽'),
(ur'[\%\.]CC[\%\.]BE', ur'̾'),
(ur'[\%\.]CC[\%\.]BF', ur'̿'),
(ur'[\%\.]CD[\%\.]80', ur'̀'),
(ur'[\%\.]CD[\%\.]81', ur'́'),
(ur'[\%\.]CD[\%\.]82', ur'͂'),
(ur'[\%\.]CD[\%\.]83', ur'̓'),
(ur'[\%\.]CD[\%\.]84', ur'̈́'),
(ur'[\%\.]CD[\%\.]85', ur'ͅ'),
(ur'[\%\.]CD[\%\.]86', ur'͆'),
(ur'[\%\.]CD[\%\.]87', ur'͇'),
(ur'[\%\.]CD[\%\.]88', ur'͈'),
(ur'[\%\.]CD[\%\.]89', ur'͉'),
(ur'[\%\.]CD[\%\.]8A', ur'͊'),
(ur'[\%\.]CD[\%\.]8B', ur'͋'),
(ur'[\%\.]CD[\%\.]8C', ur'͌'),
(ur'[\%\.]CD[\%\.]8D', ur'͍'),
(ur'[\%\.]CD[\%\.]8E', ur'͎'),
(ur'[\%\.]CD[\%\.]8F', ur'͏'),
(ur'[\%\.]CD[\%\.]90', ur'͐'),
(ur'[\%\.]CD[\%\.]91', ur'͑'),
(ur'[\%\.]CD[\%\.]92', ur'͒'),
(ur'[\%\.]CD[\%\.]93', ur'͓'),
(ur'[\%\.]CD[\%\.]94', ur'͔'),
(ur'[\%\.]CD[\%\.]95', ur'͕'),
(ur'[\%\.]CD[\%\.]96', ur'͖'),
(ur'[\%\.]CD[\%\.]97', ur'͗'),
(ur'[\%\.]CD[\%\.]98', ur'͘'),
(ur'[\%\.]CD[\%\.]99', ur'͙'),
(ur'[\%\.]CD[\%\.]9A', ur'͚'),
(ur'[\%\.]CD[\%\.]9B', ur'͛'),
(ur'[\%\.]CD[\%\.]9C', ur'͜'),
(ur'[\%\.]CD[\%\.]9D', ur'͝'),
(ur'[\%\.]CD[\%\.]9E', ur'͞'),
(ur'[\%\.]CD[\%\.]9F', ur'͟'),
(ur'[\%\.]CD[\%\.]A0', ur'͠'),
(ur'[\%\.]CD[\%\.]A1', ur'͡'),
(ur'[\%\.]CD[\%\.]A2', ur'͢'),
(ur'[\%\.]CD[\%\.]A3', ur'ͣ'),
(ur'[\%\.]CD[\%\.]A4', ur'ͤ'),
(ur'[\%\.]CD[\%\.]A5', ur'ͥ'),
(ur'[\%\.]CD[\%\.]A6', ur'ͦ'),
(ur'[\%\.]CD[\%\.]A7', ur'ͧ'),
(ur'[\%\.]CD[\%\.]A8', ur'ͨ'),
(ur'[\%\.]CD[\%\.]A9', ur'ͩ'),
(ur'[\%\.]CD[\%\.]AA', ur'ͪ'),
(ur'[\%\.]CD[\%\.]AB', ur'ͫ'),
(ur'[\%\.]CD[\%\.]AC', ur'ͬ'),
(ur'[\%\.]CD[\%\.]AD', ur'ͭ'),
(ur'[\%\.]CD[\%\.]AE', ur'ͮ'),
(ur'[\%\.]CD[\%\.]AF', ur'ͯ'),
(ur'[\%\.]CD[\%\.]B0', ur'Ͱ'),
(ur'[\%\.]CD[\%\.]B1', ur'ͱ'),
(ur'[\%\.]CD[\%\.]B2', ur'Ͳ'),
(ur'[\%\.]CD[\%\.]B3', ur'ͳ'),
(ur'[\%\.]CD[\%\.]B4', ur'ʹ'),
(ur'[\%\.]CD[\%\.]B5', ur'͵'),
(ur'[\%\.]CD[\%\.]B6', ur'Ͷ'),
(ur'[\%\.]CD[\%\.]B7', ur'ͷ'),
(ur'[\%\.]CD[\%\.]B8', ur''),
(ur'[\%\.]CD[\%\.]B9', ur''),
(ur'[\%\.]CD[\%\.]BA', ur'ͺ'),
(ur'[\%\.]CD[\%\.]BB', ur'ͻ'),
(ur'[\%\.]CD[\%\.]BC', ur'ͼ'),
(ur'[\%\.]CD[\%\.]BD', ur'ͽ'),
(ur'[\%\.]CD[\%\.]BE', ur';'),
(ur'[\%\.]CD[\%\.]BF', ur'Ϳ'),
(ur'[\%\.]CE[\%\.]80', ur''),
(ur'[\%\.]CE[\%\.]81', ur''),
(ur'[\%\.]CE[\%\.]82', ur''),
(ur'[\%\.]CE[\%\.]83', ur''),
(ur'[\%\.]CE[\%\.]84', ur'΄'),
(ur'[\%\.]CE[\%\.]85', ur'΅'),
(ur'[\%\.]CE[\%\.]86', ur'Ά'),
(ur'[\%\.]CE[\%\.]87', ur'·'),
(ur'[\%\.]CE[\%\.]88', ur'Έ'),
(ur'[\%\.]CE[\%\.]89', ur'Ή'),
(ur'[\%\.]CE[\%\.]8A', ur'Ί'),
(ur'[\%\.]CE[\%\.]8B', ur''),
(ur'[\%\.]CE[\%\.]8C', ur'Ό'),
(ur'[\%\.]CE[\%\.]8D', ur''),
(ur'[\%\.]CE[\%\.]8E', ur'Ύ'),
(ur'[\%\.]CE[\%\.]8F', ur'Ώ'),
(ur'[\%\.]CE[\%\.]90', ur'ΐ'),
# Caractères grecques ?
(ur'[\%\.]CE[\%\.]91', ur'Α'),
(ur'[\%\.]CE[\%\.]92', ur'Β'),
(ur'[\%\.]CE[\%\.]93', ur'Γ'),
(ur'[\%\.]CE[\%\.]94', ur'Δ'),
(ur'[\%\.]CE[\%\.]95', ur'Ε'),
(ur'[\%\.]CE[\%\.]96', ur'Ζ'),
(ur'[\%\.]CE[\%\.]97', ur'Η'),
(ur'[\%\.]CE[\%\.]98', ur'Θ'),
(ur'[\%\.]CE[\%\.]99', ur'Ι'),
(ur'[\%\.]CE[\%\.]9A', ur'Κ'),
(ur'[\%\.]CE[\%\.]9B', ur'Λ'),
(ur'[\%\.]CE[\%\.]9C', ur'Μ'),
(ur'[\%\.]CE[\%\.]9D', ur'Ν'),
(ur'[\%\.]CE[\%\.]9E', ur'Ξ'),
(ur'[\%\.]CE[\%\.]9F', ur'Ο'),
(ur'[\%\.]CE[\%\.]A0', ur'Π'),
(ur'[\%\.]CE[\%\.]A1', ur'Ρ'),
(ur'[\%\.]CE[\%\.]A2', ur''),
(ur'[\%\.]CE[\%\.]A3', ur'Σ'),
(ur'[\%\.]CE[\%\.]A4', ur'Τ'),
(ur'[\%\.]CE[\%\.]A5', ur'Υ'),
(ur'[\%\.]CE[\%\.]A6', ur'Φ'),
(ur'[\%\.]CE[\%\.]A7', ur'Χ'),
(ur'[\%\.]CE[\%\.]A8', ur'Ψ'),
(ur'[\%\.]CE[\%\.]A9', ur'Ω'),
(ur'[\%\.]CE[\%\.]AA', ur'Ϊ'),
(ur'[\%\.]CE[\%\.]AB', ur'Ϋ'),
(ur'[\%\.]CE[\%\.]AC', ur'ά'),
(ur'[\%\.]CE[\%\.]AD', ur'έ'),
(ur'[\%\.]CE[\%\.]AE', ur'ή'),
(ur'[\%\.]CE[\%\.]AF', ur'ί'),
(ur'[\%\.]CE[\%\.]B0', ur'ΰ'),
(ur'[\%\.]CE[\%\.]B1', ur'α'),
(ur'[\%\.]CE[\%\.]B2', ur'β'),
(ur'[\%\.]CE[\%\.]B3', ur'γ'),
(ur'[\%\.]CE[\%\.]B4', ur'δ'),
(ur'[\%\.]CE[\%\.]B5', ur'ε'),
(ur'[\%\.]CE[\%\.]B6', ur'ζ'),
(ur'[\%\.]CE[\%\.]B7', ur'η'),
(ur'[\%\.]CE[\%\.]B8', ur'θ'),
(ur'[\%\.]CE[\%\.]B9', ur'ι'),
(ur'[\%\.]CE[\%\.]BA', ur'κ'),
(ur'[\%\.]CE[\%\.]BB', ur'λ'),
(ur'[\%\.]CE[\%\.]BC', ur'μ'),
(ur'[\%\.]CE[\%\.]BD', ur'ν'),
(ur'[\%\.]CE[\%\.]BE', ur'ξ'),
(ur'[\%\.]CE[\%\.]BF', ur'ο'),
(ur'[\%\.]CF[\%\.]80', ur'π'),
(ur'[\%\.]CF[\%\.]81', ur'ρ'),
(ur'[\%\.]CF[\%\.]82', ur'ς'),
(ur'[\%\.]CF[\%\.]83', ur'σ'),
(ur'[\%\.]CF[\%\.]84', ur'τ'),
(ur'[\%\.]CF[\%\.]85', ur'υ'),
(ur'[\%\.]CF[\%\.]86', ur'φ'),
(ur'[\%\.]CF[\%\.]87', ur'χ'),
(ur'[\%\.]CF[\%\.]88', ur'ψ'),
(ur'[\%\.]CF[\%\.]89', ur'ω'),
(ur'[\%\.]CF[\%\.]8A', ur'ϊ'),
(ur'[\%\.]CF[\%\.]8B', ur'ϋ'),
(ur'[\%\.]CF[\%\.]8C', ur'ό'),
(ur'[\%\.]CF[\%\.]8D', ur'ύ'),
(ur'[\%\.]CF[\%\.]8E', ur'ώ'),
(ur'[\%\.]CF[\%\.]8F', ur'Ϗ'),
(ur'[\%\.]CF[\%\.]90', ur'ϐ'),
(ur'[\%\.]CF[\%\.]91', ur'ϑ'),
(ur'[\%\.]CF[\%\.]92', ur'ϒ'),
(ur'[\%\.]CF[\%\.]93', ur'ϓ'),
(ur'[\%\.]CF[\%\.]94', ur'ϔ'),
(ur'[\%\.]CF[\%\.]95', ur'ϕ'),
(ur'[\%\.]CF[\%\.]96', ur'ϖ'),
(ur'[\%\.]CF[\%\.]97', ur'ϗ'),
(ur'[\%\.]CF[\%\.]98', ur'Ϙ'),
(ur'[\%\.]CF[\%\.]99', ur'ϙ'),
(ur'[\%\.]CF[\%\.]9A', ur'Ϛ'),
(ur'[\%\.]CF[\%\.]9B', ur'ϛ'),
(ur'[\%\.]CF[\%\.]9C', ur'Ϝ'),
(ur'[\%\.]CF[\%\.]9D', ur'ϝ'),
(ur'[\%\.]CF[\%\.]9E', ur'Ϟ'),
(ur'[\%\.]CF[\%\.]9F', ur'ϟ'),
(ur'[\%\.]CF[\%\.]A0', ur'Ϡ'),
(ur'[\%\.]CF[\%\.]A1', ur'ϡ'),
(ur'[\%\.]CF[\%\.]A2', ur'Ϣ'),
(ur'[\%\.]CF[\%\.]A3', ur'ϣ'),
(ur'[\%\.]CF[\%\.]A4', ur'Ϥ'),
(ur'[\%\.]CF[\%\.]A5', ur'ϥ'),
(ur'[\%\.]CF[\%\.]A6', ur'Ϧ'),
(ur'[\%\.]CF[\%\.]A7', ur'ϧ'),
(ur'[\%\.]CF[\%\.]A8', ur'Ϩ'),
(ur'[\%\.]CF[\%\.]A9', ur'ϩ'),
(ur'[\%\.]CF[\%\.]AA', ur'Ϫ'),
(ur'[\%\.]CF[\%\.]AB', ur'ϫ'),
(ur'[\%\.]CF[\%\.]AC', ur'Ϭ'),
(ur'[\%\.]CF[\%\.]AD', ur'ϭ'),
(ur'[\%\.]CF[\%\.]AE', ur'Ϯ'),
(ur'[\%\.]CF[\%\.]AF', ur'ϯ'),
(ur'[\%\.]CF[\%\.]B0', ur'ϰ'),
(ur'[\%\.]CF[\%\.]B1', ur'ϱ'),
(ur'[\%\.]CF[\%\.]B2', ur'ϲ'),
(ur'[\%\.]CF[\%\.]B3', ur'ϳ'),
(ur'[\%\.]CF[\%\.]B4', ur'ϴ'),
(ur'[\%\.]CF[\%\.]B5', ur'ϵ'),
(ur'[\%\.]CF[\%\.]B6', ur'϶'),
(ur'[\%\.]CF[\%\.]B7', ur'Ϸ'),
(ur'[\%\.]CF[\%\.]B8', ur'ϸ'),
(ur'[\%\.]CF[\%\.]B9', ur'Ϲ'),
(ur'[\%\.]CF[\%\.]BA', ur'Ϻ'),
(ur'[\%\.]CF[\%\.]BB', ur'ϻ'),
(ur'[\%\.]CF[\%\.]BC', ur'ϼ'),
(ur'[\%\.]CF[\%\.]BD', ur'Ͻ'),
(ur'[\%\.]CF[\%\.]BE', ur'Ͼ'),
(ur'[\%\.]CF[\%\.]BF', ur'Ͽ'),
# Caractères cyrilliques
(ur'[\%\.]D0[\%\.]92', ur'В'),
(ur'[\%\.]D0[\%\.]93', ur'Г'),
(ur'[\%\.]D0[\%\.]98', ur'И'),
(ur'[\%\.]D0[\%\.]9E', ur'О'),
(ur'[\%\.]D0[\%\.]A1', ur'С'),
(ur'[\%\.]D0[\%\.]A3', ur'У'),
(ur'[\%\.]D0[\%\.]B0', ur'а'),
(ur'[\%\.]D0[\%\.]B1', ur'б'),
(ur'[\%\.]D0[\%\.]B2', ur'в'),
(ur'[\%\.]D0[\%\.]B4', ur'д'),
(ur'[\%\.]D0[\%\.]B5', ur'е'),
(ur'[\%\.]D0[\%\.]B8', ur'и'),
(ur'[\%\.]D0[\%\.]BA', ur'к'),
(ur'[\%\.]D0[\%\.]BB', ur'л'),
(ur'[\%\.]D0[\%\.]BC', ur'м'),
(ur'[\%\.]D0[\%\.]BD', ur'н'),
(ur'[\%\.]D0[\%\.]BE', ur'о'),
(ur'[\%\.]D0[\%\.]BF', ur'п'),
(ur'[\%\.]D1[\%\.]80', ur'р'),
(ur'[\%\.]D1[\%\.]81', ur'с'),
(ur'[\%\.]D1[\%\.]82', ur'т'),
(ur'[\%\.]D1[\%\.]83', ur'у'),
(ur'[\%\.]D1[\%\.]85', ur'х'),
(ur'[\%\.]D1[\%\.]87', ur'ч'),
(ur'[\%\.]D1[\%\.]8B', ur'ы'),
(ur'[\%\.]D1[\%\.]8C', ur'ь'),
(ur'[\%\.]D1[\%\.]8F', ur'я'),
(ur'[\%\.]D1[\%\.]91', ur'ё'),
#caractères arabes
(ur'[\%\.]D8[\%\.]80', ur''),
(ur'[\%\.]D8[\%\.]81', ur''),
(ur'[\%\.]D8[\%\.]82', ur''),
(ur'[\%\.]D8[\%\.]83', ur''),
(ur'[\%\.]D8[\%\.]84', ur''),
(ur'[\%\.]D8[\%\.]85', ur''),
(ur'[\%\.]D8[\%\.]86', ur'؆'),
(ur'[\%\.]D8[\%\.]87', ur'؇'),
(ur'[\%\.]D8[\%\.]88', ur'؈'),
(ur'[\%\.]D8[\%\.]89', ur'؉'),
(ur'[\%\.]D8[\%\.]8A', ur'؊'),
(ur'[\%\.]D8[\%\.]8B', ur'؋'),
(ur'[\%\.]D8[\%\.]8C', ur'،'),
(ur'[\%\.]D8[\%\.]8D', ur'؍'),
(ur'[\%\.]D8[\%\.]8E', ur'؎'),
(ur'[\%\.]D8[\%\.]8F', ur'؏'),
(ur'[\%\.]D8[\%\.]90', ur'ؐ'),
(ur'[\%\.]D8[\%\.]91', ur'ؑ'),
(ur'[\%\.]D8[\%\.]92', ur'ؒ'),
(ur'[\%\.]D8[\%\.]93', ur'ؓ'),
(ur'[\%\.]D8[\%\.]94', ur'ؔ'),
(ur'[\%\.]D8[\%\.]95', ur'ؕ'),
(ur'[\%\.]D8[\%\.]96', ur'ؖ'),
(ur'[\%\.]D8[\%\.]97', ur'ؗ'),
(ur'[\%\.]D8[\%\.]98', ur'ؘ'),
(ur'[\%\.]D8[\%\.]99', ur'ؙ'),
(ur'[\%\.]D8[\%\.]9A', ur'ؚ'),
(ur'[\%\.]D8[\%\.]9B', ur'؛'),
(ur'[\%\.]D8[\%\.]9C', ur''),
(ur'[\%\.]D8[\%\.]9D', ur'؝'),
(ur'[\%\.]D8[\%\.]9E', ur'؞'),
(ur'[\%\.]D8[\%\.]9F', ur'؟'),
(ur'[\%\.]D8[\%\.]A0', ur'ؠ'),
(ur'[\%\.]D8[\%\.]A1', ur'ء'),
(ur'[\%\.]D8[\%\.]A2', ur'آ'),
(ur'[\%\.]D8[\%\.]A3', ur'أ'),
(ur'[\%\.]D8[\%\.]A4', ur'ؤ'),
(ur'[\%\.]D8[\%\.]A5', ur'إ'),
(ur'[\%\.]D8[\%\.]A6', ur'ئ'),
(ur'[\%\.]D8[\%\.]A7', ur'ا'),
(ur'[\%\.]D8[\%\.]A8', ur'ب'),
(ur'[\%\.]D8[\%\.]A9', ur'ة'),
(ur'[\%\.]D8[\%\.]AA', ur'ت'),
(ur'[\%\.]D8[\%\.]AB', ur'ث'),
(ur'[\%\.]D8[\%\.]AC', ur'ج'),
(ur'[\%\.]D8[\%\.]AD', ur'ح'),
(ur'[\%\.]D8[\%\.]AE', ur'خ'),
(ur'[\%\.]D8[\%\.]AF', ur'د'),
(ur'[\%\.]D8[\%\.]B0', ur'ذ'),
(ur'[\%\.]D8[\%\.]B1', ur'ر'),
(ur'[\%\.]D8[\%\.]B2', ur'ز'),
(ur'[\%\.]D8[\%\.]B3', ur'س'),
(ur'[\%\.]D8[\%\.]B4', ur'ش'),
(ur'[\%\.]D8[\%\.]B5', ur'ص'),
(ur'[\%\.]D8[\%\.]B6', ur'ض'),
(ur'[\%\.]D8[\%\.]B7', ur'ط'),
(ur'[\%\.]D8[\%\.]B8', ur'ظ'),
(ur'[\%\.]D8[\%\.]B9', ur'ع'),
(ur'[\%\.]D8[\%\.]BA', ur'غ'),
(ur'[\%\.]D8[\%\.]BB', ur'ػ'),
(ur'[\%\.]D8[\%\.]BC', ur'ؼ'),
(ur'[\%\.]D8[\%\.]BD', ur'ؽ'),
(ur'[\%\.]D8[\%\.]BE', ur'ؾ'),
(ur'[\%\.]D8[\%\.]BF', ur'ؿ'),
(ur'[\%\.]D9[\%\.]80', ur'ـ'),
(ur'[\%\.]D9[\%\.]81', ur'ف'),
(ur'[\%\.]D9[\%\.]82', ur'ق'),
(ur'[\%\.]D9[\%\.]83', ur'ك'),
(ur'[\%\.]D9[\%\.]84', ur'ل'),
(ur'[\%\.]D9[\%\.]85', ur'م'),
(ur'[\%\.]D9[\%\.]86', ur'ن'),
(ur'[\%\.]D9[\%\.]87', ur'ه'),
(ur'[\%\.]D9[\%\.]88', ur'و'),
(ur'[\%\.]D9[\%\.]89', ur'ى'),
(ur'[\%\.]D9[\%\.]8A', ur'ي'),
(ur'[\%\.]D9[\%\.]8B', ur'ً'),
(ur'[\%\.]D9[\%\.]8C', ur'ٌ'),
(ur'[\%\.]D9[\%\.]8D', ur'ٍ'),
(ur'[\%\.]D9[\%\.]8E', ur'َ'),
(ur'[\%\.]D9[\%\.]8F', ur'ُ'),
(ur'[\%\.]D9[\%\.]90', ur'ِ'),
(ur'[\%\.]D9[\%\.]91', ur'ّ'),
(ur'[\%\.]D9[\%\.]92', ur'ْ'),
(ur'[\%\.]D9[\%\.]93', ur'ٓ'),
(ur'[\%\.]D9[\%\.]94', ur'ٔ'),
(ur'[\%\.]D9[\%\.]95', ur'ٕ'),
(ur'[\%\.]D9[\%\.]96', ur'ٖ'),
(ur'[\%\.]D9[\%\.]97', ur'ٗ'),
(ur'[\%\.]D9[\%\.]98', ur'٘'),
(ur'[\%\.]D9[\%\.]99', ur'ٙ'),
(ur'[\%\.]D9[\%\.]9A', ur'ٚ'),
(ur'[\%\.]D9[\%\.]9B', ur'ٛ'),
(ur'[\%\.]D9[\%\.]9C', ur'ٜ'),
(ur'[\%\.]D9[\%\.]9D', ur'ٝ'),
(ur'[\%\.]D9[\%\.]9E', ur'ٞ'),
(ur'[\%\.]D9[\%\.]9F', ur'ٟ'),
(ur'[\%\.]D9[\%\.]A0', ur'٠'),
(ur'[\%\.]D9[\%\.]A1', ur'١'),
(ur'[\%\.]D9[\%\.]A2', ur'٢'),
(ur'[\%\.]D9[\%\.]A3', ur'٣'),
(ur'[\%\.]D9[\%\.]A4', ur'٤'),
(ur'[\%\.]D9[\%\.]A5', ur'٥'),
(ur'[\%\.]D9[\%\.]A6', ur'٦'),
(ur'[\%\.]D9[\%\.]A7', ur'٧'),
(ur'[\%\.]D9[\%\.]A8', ur'٨'),
(ur'[\%\.]D9[\%\.]A9', ur'٩'),
(ur'[\%\.]D9[\%\.]AA', ur'٪'),
(ur'[\%\.]D9[\%\.]AB', ur'٫'),
(ur'[\%\.]D9[\%\.]AC', ur'٬'),
(ur'[\%\.]D9[\%\.]AD', ur'٭'),
(ur'[\%\.]D9[\%\.]AE', ur'ٮ'),
(ur'[\%\.]D9[\%\.]AF', ur'ٯ'),
(ur'[\%\.]D9[\%\.]B0', ur'ٰ'),
(ur'[\%\.]D9[\%\.]B1', ur'ٱ'),
(ur'[\%\.]D9[\%\.]B2', ur'ٲ'),
(ur'[\%\.]D9[\%\.]B3', ur'ٳ'),
(ur'[\%\.]D9[\%\.]B4', ur'ٴ'),
(ur'[\%\.]D9[\%\.]B5', ur'ٵ'),
(ur'[\%\.]D9[\%\.]B6', ur'ٶ'),
(ur'[\%\.]D9[\%\.]B7', ur'ٷ'),
(ur'[\%\.]D9[\%\.]B8', ur'ٸ'),
(ur'[\%\.]D9[\%\.]B9', ur'ٹ'),
(ur'[\%\.]D9[\%\.]BA', ur'ٺ'),
(ur'[\%\.]D9[\%\.]BB', ur'ٻ'),
(ur'[\%\.]D9[\%\.]BC', ur'ټ'),
(ur'[\%\.]D9[\%\.]BD', ur'ٽ'),
(ur'[\%\.]D9[\%\.]BE', ur'پ'),
(ur'[\%\.]D9[\%\.]BF', ur'ٿ'),
(ur'[\%\.]DB[\%\.]8C', ur'ی'),
(ur'[\%\.]DA[\%\.]98', ur'ژ'),
(ur'A', ur'A'),
(ur'a', ur'a'),
(ur'À', ur'À'),
(ur'à', ur'à'),
(ur'Á', ur'Á'),
(ur'á', ur'á'),
(ur'Â', ur'Â'),
(ur'â', ur'â'),
(ur'Ã', ur'Ã'),
(ur'ã', ur'ã'),
(ur'Ä', ur'Ä'),
(ur'ä', ur'ä'),
(ur'Å', ur'Å'),
(ur'å', ur'å'),
(ur'Ā', ur'Ā'),
(ur'ā', ur'ā'),
(ur'Ă', ur'Ă'),
(ur'ă', ur'ă'),
(ur'Ą', ur'Ą'),
(ur'ą', ur'ą'),
(ur'Ǟ', ur'Ǟ'),
(ur'ǟ', ur'ǟ'),
(ur'Ǻ', ur'Ǻ'),
(ur'ǻ', ur'ǻ'),
(ur'Æ', ur'Æ'),
(ur'æ', ur'æ'),
(ur'Ǽ', ur'Ǽ'),
(ur'ǽ', ur'ǽ'),
(ur'B', ur'B'),
(ur'b', ur'b'),
(ur'Ḃ', ur'Ḃ'),
(ur'ḃ', ur'ḃ'),
(ur'C', ur'C'),
(ur'c', ur'c'),
(ur'Ć', ur'Ć'),
(ur'ć', ur'ć'),
(ur'Ç', ur'Ç'),
(ur'ç', ur'ç'),
(ur'Č', ur'Č'),
(ur'č', ur'č'),
(ur'Ĉ', ur'Ĉ'),
(ur'ĉ', ur'ĉ'),
(ur'Ċ', ur'Ċ'),
(ur'ċ', ur'ċ'),
(ur'D', ur'D'),
(ur'd', ur'd'),
(ur'Ḑ', ur'Ḑ'),
(ur'ḑ', ur'ḑ'),
(ur'Ď', ur'Ď'),
(ur'ď', ur'ď'),
(ur'Ḋ', ur'Ḋ'),
(ur'ḋ', ur'ḋ'),
(ur'Đ', ur'Đ'),
(ur'đ', ur'đ'),
(ur'Ð', ur'Ð'),
(ur'ð', ur'ð'),
(ur'dz', ur'dz'),
(ur'dž', ur'dž'),
(ur'E', ur'E'),
(ur'e', ur'e'),
(ur'È', ur'È'),
(ur'è', ur'è'),
(ur'É', ur'É'),
(ur'é', ur'é'),
(ur'Ě', ur'Ě'),
(ur'ě', ur'ě'),
(ur'Ê', ur'Ê'),
(ur'ê', ur'ê'),
(ur'Ë', ur'Ë'),
(ur'ë', ur'ë'),
(ur'Ē', ur'Ē'),
(ur'ē', ur'ē'),
(ur'Ĕ', ur'Ĕ'),
(ur'ĕ', ur'ĕ'),
(ur'Ę', ur'Ę'),
(ur'ę', ur'ę'),
(ur'Ė', ur'Ė'),
(ur'ė', ur'ė'),
(ur'Ʒ', ur'Ʒ'),
(ur'ʒ', ur'ʒ'),
(ur'Ǯ', ur'Ǯ'),
(ur'ǯ', ur'ǯ'),
(ur'F', ur'F'),
(ur'f', ur'f'),
(ur'Ḟ', ur'Ḟ'),
(ur'ḟ', ur'ḟ'),
(ur'ƒ', ur'ƒ'),
(ur'ff', ur'ff'),
(ur'fi', ur'fi'),
(ur'fl', ur'fl'),
(ur'ffi', ur'ffi'),
(ur'ffl', ur'ffl'),
(ur'ſt', ur'ſt'),
(ur'G', ur'G'),
(ur'g', ur'g'),
(ur'Ǵ', ur'Ǵ'),
(ur'ǵ', ur'ǵ'),
(ur'Ģ', ur'Ģ'),
(ur'ģ', ur'ģ'),
(ur'Ǧ', ur'Ǧ'),
(ur'ǧ', ur'ǧ'),
(ur'Ĝ', ur'Ĝ'),
(ur'ĝ', ur'ĝ'),
(ur'Ğ', ur'Ğ'),
(ur'ğ', ur'ğ'),
(ur'Ġ', ur'Ġ'),
(ur'ġ', ur'ġ'),
(ur'Ǥ', ur'Ǥ'),
(ur'ǥ', ur'ǥ'),
(ur'H', ur'H'),
(ur'h', ur'h'),
(ur'Ĥ', ur'Ĥ'),
(ur'ĥ', ur'ĥ'),
(ur'Ħ', ur'Ħ'),
(ur'ħ', ur'ħ'),
(ur'I', ur'I'),
(ur'i', ur'i'),
(ur'Ì', ur'Ì'),
(ur'ì', ur'ì'),
(ur'Í', ur'Í'),
(ur'í', ur'í'),
(ur'Î', ur'Î'),
(ur'î', ur'î'),
(ur'Ĩ', ur'Ĩ'),
(ur'ĩ', ur'ĩ'),
(ur'Ï', ur'Ï'),
(ur'ï', ur'ï'),
(ur'Ī', ur'Ī'),
(ur'ī', ur'ī'),
(ur'Ĭ', ur'Ĭ'),
(ur'ĭ', ur'ĭ'),
(ur'Į', ur'Į'),
(ur'į', ur'į'),
(ur'İ', ur'İ'),
(ur'ı', ur'ı'),
(ur'IJ', ur'IJ'),
(ur'ij', ur'ij'),
(ur'J', ur'J'),
(ur'j', ur'j'),
(ur'Ĵ', ur'Ĵ'),
(ur'ĵ', ur'ĵ'),
(ur'K', ur'K'),
(ur'k', ur'k'),
(ur'Ḱ', ur'Ḱ'),
(ur'ḱ', ur'ḱ'),
(ur'Ķ', ur'Ķ'),
(ur'ķ', ur'ķ'),
(ur'Ǩ', ur'Ǩ'),
(ur'ǩ', ur'ǩ'),
(ur'ĸ', ur'ĸ'),
(ur'L', ur'L'),
(ur'l', ur'l'),
(ur'Ĺ', ur'Ĺ'),
(ur'ĺ', ur'ĺ'),
(ur'Ļ', ur'Ļ'),
(ur'ļ', ur'ļ'),
(ur'Ľ', ur'Ľ'),
(ur'ľ', ur'ľ'),
(ur'Ŀ', ur'Ŀ'),
(ur'ŀ', ur'ŀ'),
(ur'Ł', ur'Ł'),
(ur'ł', ur'ł'),
(ur'lj', ur'lj'),
(ur'M', ur'M'),
(ur'm', ur'm'),
(ur'Ṁ', ur'Ṁ'),
(ur'ṁ', ur'ṁ'),
(ur'N', ur'N'),
(ur'n', ur'n'),
(ur'Ń', ur'Ń'),
(ur'ń', ur'ń'),
(ur'Ņ', ur'Ņ'),
(ur'ņ', ur'ņ'),
(ur'Ň', ur'Ň'),
(ur'ň', ur'ň'),
(ur'Ñ', ur'Ñ'),
(ur'ñ', ur'ñ'),
(ur'ʼn', ur'ʼn'),
(ur'Ŋ', ur'Ŋ'),
(ur'ŋ', ur'ŋ'),
(ur'nj', ur'nj'),
(ur'O', ur'O'),
(ur'o', ur'o'),
(ur'Ò', ur'Ò'),
(ur'ò', ur'ò'),
(ur'Ó', ur'Ó'),
(ur'ó', ur'ó'),
(ur'Ô', ur'Ô'),
(ur'ô', ur'ô'),
(ur'Õ', ur'Õ'),
(ur'õ', ur'õ'),
(ur'Ö', ur'Ö'),
(ur'ö', ur'ö'),
(ur'Ō', ur'Ō'),
(ur'ō', ur'ō'),
(ur'Ŏ', ur'Ŏ'),
(ur'ŏ', ur'ŏ'),
(ur'Ø', ur'Ø'),
(ur'ø', ur'ø'),
(ur'Ő', ur'Ő'),
(ur'ő', ur'ő'),
(ur'Ǿ', ur'Ǿ'),
(ur'ǿ', ur'ǿ'),
(ur'Œ', ur'Œ'),
(ur'œ', ur'œ'),
(ur'P', ur'P'),
(ur'p', ur'p'),
(ur'Ṗ', ur'Ṗ'),
(ur'ṗ', ur'ṗ'),
(ur'Q', ur'Q'),
(ur'q', ur'q'),
(ur'R', ur'R'),
(ur'r', ur'r'),
(ur'Ŕ', ur'Ŕ'),
(ur'ŕ', ur'ŕ'),
(ur'Ŗ', ur'Ŗ'),
(ur'ŗ', ur'ŗ'),
(ur'Ř', ur'Ř'),
(ur'ř', ur'ř'),
(ur'ɼ', ur'ɼ'),
(ur'S', ur'S'),
(ur's', ur's'),
(ur'Ś', ur'Ś'),
(ur'ś', ur'ś'),
(ur'Ş', ur'Ş'),
(ur'ş', ur'ş'),
(ur'Š', ur'Š'),
(ur'š', ur'š'),
(ur'Ŝ', ur'Ŝ'),
(ur'ŝ', ur'ŝ'),
(ur'Ṡ', ur'Ṡ'),
(ur'ṡ', ur'ṡ'),
(ur'ſ', ur'ſ'),
(ur'ß', ur'ß'),
(ur'T', ur'T'),
(ur't', ur't'),
(ur'Ţ', ur'Ţ'),
(ur'ţ', ur'ţ'),
(ur'Ť', ur'Ť'),
(ur'ť', ur'ť'),
(ur'Ṫ', ur'Ṫ'),
(ur'ṫ', ur'ṫ'),
(ur'Ŧ', ur'Ŧ'),
(ur'ŧ', ur'ŧ'),
(ur'Þ', ur'Þ'),
(ur'þ', ur'þ'),
(ur'U', ur'U'),
(ur'u', ur'u'),
(ur'Ù', ur'Ù'),
(ur'ù', ur'ù'),
(ur'Ú', ur'Ú'),
(ur'ú', ur'ú'),
(ur'Û', ur'Û'),
(ur'û', ur'û'),
(ur'Ũ', ur'Ũ'),
(ur'ũ', ur'ũ'),
(ur'Ü', ur'Ü'),
(ur'ü', ur'ü'),
(ur'Ů', ur'Ů'),
(ur'ů', ur'ů'),
(ur'Ū', ur'Ū'),
(ur'ū', ur'ū'),
(ur'Ŭ', ur'Ŭ'),
(ur'ŭ', ur'ŭ'),
(ur'Ų', ur'Ų'),
(ur'ų', ur'ų'),
(ur'Ű', ur'Ű'),
(ur'ű', ur'ű'),
(ur'V', ur'V'),
(ur'v', ur'v'),
(ur'W', ur'W'),
(ur'w', ur'w'),
(ur'Ẁ', ur'Ẁ'),
(ur'ẁ', ur'ẁ'),
(ur'Ẃ', ur'Ẃ'),
(ur'ẃ', ur'ẃ'),
(ur'Ŵ', ur'Ŵ'),
(ur'ŵ', ur'ŵ'),
(ur'Ẅ', ur'Ẅ'),
(ur'ẅ', ur'ẅ'),
(ur'X', ur'X'),
(ur'x', ur'x'),
(ur'Y', ur'Y'),
(ur'y', ur'y'),
(ur'Ỳ', ur'Ỳ'),
(ur'ỳ', ur'ỳ'),
(ur'Ý', ur'Ý'),
(ur'ý', ur'ý'),
(ur'Ŷ', ur'Ŷ'),
(ur'ŷ', ur'ŷ'),
(ur'Ÿ', ur'Ÿ'),
(ur'ÿ', ur'ÿ'),
(ur'Z', ur'Z'),
(ur'z', ur'z'),
(ur'Ź', ur'Ź'),
(ur'ź', ur'ź'),
(ur'Ž', ur'Ž'),
(ur'ž', ur'ž'),
(ur'Ż', ur'Ż'),
(ur'ż', ur'ż'),
#caractères japonais
(ur'あ', ur'あ'),
(ur'い', ur'い'),
(ur'う', ur'う'),
(ur'え', ur'え'),
(ur'お', ur'お'),
(ur'か', ur'か'),
(ur'が', ur'が'),
(ur'き', ur'き'),
(ur'ぎ', ur'ぎ'),
(ur'く', ur'く'),
(ur'ぐ', ur'ぐ'),
(ur'け', ur'け'),
(ur'げ', ur'げ'),
(ur'こ', ur'こ'),
(ur'ご', ur'ご'),
(ur'さ', ur'さ'),
(ur'ざ', ur'ざ'),
(ur'し', ur'し'),
(ur'じ', ur'じ'),
(ur'す', ur'す'),
(ur'ず', ur'ず'),
(ur'せ', ur'せ'),
(ur'ぜ', ur'ぜ'),
(ur'そ', ur'そ'),
(ur'ぞ', ur'ぞ'),
(ur'た', ur'た'),
(ur'だ', ur'だ'),
(ur'ち', ur'ち'),
(ur'ぢ', ur'ぢ'),
(ur'つ', ur'つ'),
(ur'づ', ur'づ'),
(ur'て', ur'て'),
(ur'で', ur'で'),
(ur'と', ur'と'),
(ur'ど', ur'ど'),
(ur'な', ur'な'),
(ur'に', ur'に'),
(ur'ぬ', ur'ぬ'),
(ur'ね', ur'ね'),
(ur'の', ur'の'),
(ur'は', ur'は'),
(ur'ば', ur'ば'),
(ur'ぱ', ur'ぱ'),
(ur'ひ', ur'ひ'),
(ur'び', ur'び'),
(ur'ぴ', ur'ぴ'),
(ur'ふ', ur'ふ'),
(ur'ぶ', ur'ぶ'),
(ur'ぷ', ur'ぷ'),
(ur'へ', ur'へ'),
(ur'べ', ur'べ'),
(ur'ぺ', ur'ぺ'),
(ur'ほ', ur'ほ'),
(ur'ぼ', ur'ぼ'),
(ur'ぽ', ur'ぽ'),
(ur'ま', ur'ま'),
(ur'み', ur'み'),
(ur'む', ur'む'),
(ur'め', ur'め'),
(ur'も', ur'も'),
(ur'や', ur'や'),
(ur'ゆ', ur'ゆ'),
(ur'よ', ur'よ'),
(ur'ら', ur'ら'),
(ur'り', ur'り'),
(ur'る', ur'る'),
(ur'れ', ur'れ'),
(ur'ろ', ur'ろ'),
(ur'わ', ur'わ'),
(ur'ゐ', ur'ゐ'),
(ur'ゑ', ur'ゑ'),
(ur'を', ur'を'),
(ur'ん', ur'ん'),
(ur'ゔ', ur'ゔ'),
#Entités HTML : lettres grecques
(ur'Α', ur'Α'),
(ur'Β', ur'Β'),
(ur'Γ', ur'Γ'),
(ur'Δ', ur'Δ'),
(ur'Ε', ur'Ε'),
(ur'Ζ', ur'Ζ'),
(ur'Η', ur'Η'),
(ur'Θ', ur'Θ'),
(ur'Ι', ur'Ι'),
(ur'Κ', ur'Κ'),
(ur'Λ', ur'Λ'),
(ur'Μ', ur'Μ'),
(ur'Ν', ur'Ν'),
(ur'Ξ', ur'Ξ'),
(ur'Ο', ur'Ο'),
(ur'Π', ur'Π'),
(ur'Ρ', ur'Ρ'),
(ur'Σ', ur'Σ'),
(ur'Τ', ur'Τ'),
(ur'Υ', ur'Υ'),
(ur'Φ', ur'Φ'),
(ur'Χ', ur'Χ'),
(ur'Ψ', ur'Ψ'),
(ur'Ω', ur'Ω'),
(ur'α', ur'α'),
(ur'β', ur'β'),
(ur'γ', ur'γ'),
(ur'δ', ur'δ'),
(ur'ε', ur'ε'),
(ur'ζ', ur'ζ'),
(ur'η', ur'η'),
(ur'θ', ur'θ'),
(ur'ι', ur'ι'),
(ur'κ', ur'κ'),
(ur'λ', ur'λ'),
(ur'μ', ur'μ'),
(ur'ν', ur'ν'),
(ur'ξ', ur'ξ'),
(ur'ο', ur'ο'),
(ur'π', ur'π'),
(ur'ρ', ur'ρ'),
(ur'ς', ur'ς'),
(ur'σ', ur'σ'),
(ur'τ', ur'τ'),
(ur'υ', ur'υ'),
(ur'φ', ur'φ'),
(ur'χ', ur'χ'),
(ur'ψ', ur'ψ'),
(ur'ω', ur'ω'),
(ur'ϑ', ur'ϑ'),
(ur'ϒ', ur'ϒ'),
(ur'ϖ', ur'ϖ'),
(ur'Α', ur'Α'),
(ur'Β', ur'Β'),
(ur'Γ', ur'Γ'),
(ur'Δ', ur'Δ'),
(ur'Ε', ur'Ε'),
(ur'Ζ', ur'Ζ'),
(ur'Η', ur'Η'),
(ur'Θ', ur'Θ'),
(ur'Ι', ur'Ι'),
(ur'Κ', ur'Κ'),
(ur'Λ', ur'Λ'),
(ur'Μ', ur'Μ'),
(ur'Ν', ur'Ν'),
(ur'Ξ', ur'Ξ'),
(ur'Ο', ur'Ο'),
(ur'Π', ur'Π'),
(ur'Ρ', ur'Ρ'),
(ur'Σ', ur'Σ'),
(ur'Τ', ur'Τ'),
(ur'Υ', ur'Υ'),
(ur'Φ', ur'Φ'),
(ur'Χ', ur'Χ'),
(ur'Ψ', ur'Ψ'),
(ur'Ω', ur'Ω'),
(ur'α', ur'α'),
(ur'β', ur'β'),
(ur'γ', ur'γ'),
(ur'δ', ur'δ'),
(ur'ε', ur'ε'),
(ur'ζ', ur'ζ'),
(ur'η', ur'η'),
(ur'θ', ur'θ'),
(ur'ι', ur'ι'),
(ur'κ', ur'κ'),
(ur'λ', ur'λ'),
(ur'μ', ur'μ'),
(ur'ν', ur'ν'),
(ur'ξ', ur'ξ'),
(ur'ο', ur'ο'),
(ur'π', ur'π'),
(ur'ρ', ur'ρ'),
(ur'ς', ur'ς'),
(ur'σ', ur'σ'),
(ur'τ', ur'τ'),
(ur'υ', ur'υ'),
(ur'φ', ur'φ'),
(ur'χ', ur'χ'),
(ur'ψ', ur'ψ'),
(ur'ω', ur'ω'),
(ur'ϑ', ur'ϑ'),
(ur'ϒ', ur'ϒ'),
(ur'ϖ', ur'ϖ'),
# #Entités HTML : autres caractères
(ur'À', ur'À'),
(ur'à', ur'à'),
(ur'Á', ur'Á'),
(ur'á', ur'á'),
(ur'Â', ur'Â'),
(ur'â', ur'â'),
(ur'Ã', ur'Ã'),
(ur'ã', ur'ã'),
(ur'Ä', ur'Ä'),
(ur'ä', ur'ä'),
(ur'Å', ur'Å'),
(ur'å', ur'å'),
(ur'Æ', ur'Æ'),
(ur'æ', ur'æ'),
(ur'Ç', ur'Ç'),
(ur'ç', ur'ç'),
(ur'Ð', ur'Ð'),
(ur'ð', ur'ð'),
(ur'È', ur'È'),
(ur'è', ur'è'),
(ur'É', ur'É'),
(ur'é', ur'é'),
(ur'Ê', ur'Ê'),
(ur'ê', ur'ê'),
(ur'Ë', ur'Ë'),
(ur'ë', ur'ë'),
(ur'Ì', ur'Ì'),
(ur'ì', ur'ì'),
(ur'Í', ur'Í'),
(ur'í', ur'í'),
(ur'Î', ur'Î'),
(ur'î', ur'î'),
(ur'Ï', ur'Ï'),
(ur'ï', ur'ï'),
(ur'Ñ', ur'Ñ'),
(ur'ñ', ur'ñ'),
(ur'Ò', ur'Ò'),
(ur'ò', ur'ò'),
(ur'Ó', ur'Ó'),
(ur'ó', ur'ó'),
(ur'Ô', ur'Ô'),
(ur'ô', ur'ô'),
(ur'Õ', ur'Õ'),
(ur'õ', ur'õ'),
(ur'Ö', ur'Ö'),
(ur'ö', ur'ö'),
(ur'Ø', ur'Ø'),
(ur'ø', ur'ø'),
(ur'Œ', ur'Œ'),
(ur'œ', ur'œ'),
(ur'ß', ur'ß'),
(ur'Þ', ur'Þ'),
(ur'þ', ur'þ'),
(ur'Ù', ur'Ù'),
(ur'ù', ur'ù'),
(ur'Ú', ur'Ú'),
(ur'ú', ur'ú'),
(ur'Û', ur'Û'),
(ur'û', ur'û'),
(ur'Ü', ur'Ü'),
(ur'ü', ur'ü'),
(ur'Ý', ur'Ý'),
(ur'ý', ur'ý'),
(ur'Ÿ', ur'Ÿ'),
(ur'ÿ', ur'ÿ'),
(ur'Ç', ur'Ç'),
(ur'ç', ur'ç'),
#Symboles
(ur'´', ur'´'),
(ur'&', ur'&'),
(ur'∧', ur'∧'),
(ur'¦', ur'¦'),
(ur'•', ur'•'),
(ur'¸', ur'¸'),
(ur'¢', ur'¢'),
(ur'©', ur'©'),
(ur'¤', ur'¤'),
(ur'°', ur'°'),
(ur'÷', ur'÷'),
(ur'½', ur'½'),
(ur'¼', ur'¼'),
(ur'¾', ur'¾'),
(ur'¾', ur'¾'),
# (ur'≥', ur''),
(ur'>', ur'>'),
(ur'¡', ur'¡'),
(ur'¿', ur'¿'),
(ur'«', ur'«'),
# (ur'≤', ur''),
(ur'<', ur'<'),
(ur'·', ur'·'),
# (ur'−', ur''),
(ur'¬', ur'¬'),
(ur'∨', ur'∨'),
(ur'ª', ur'ª'),
(ur'º', ur'º'),
(ur'¶', ur'¶'),
(ur'±', ur'±'),
(ur'£', ur'£'),
(ur'"', ur'"'),
(ur'»', ur'»'),
(ur'→', ur'→'),
(ur'⇒', ur'⇒'),
(ur'®', ur'®'),
(ur'§', ur'§'),
(ur'⊆', ur'⊆'),
(ur'¹', ur'¹'),
(ur'²', ur'²'),
(ur'³', ur'³'),
(ur'˜', ur'˜'),
(ur'×', ur'×'),
(ur'™', ur'™'),
(ur'¥', ur'¥'),
# (ur'', ur''),
],
'exceptions': {
'inside-tags': [
'nowiki',
'comment',
'math',
'source',
'pre',
],
}
},
'wikilien': {
'regex': True,
'msg': {
'fr': ur'Robot : Correction et amélioration des liens wiki',
'en': ur'Robot: Correcting and improving links wiki',
'de': ur'Roboter: Korrektur und Verbesserung der Verbindungen Wiki',
},
'replacements': [
(ur'\[https?://(..).wikiversity.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[:\1:\2|\3]]'),
(ur'\[https?://(..).wikiversity.org/wiki/(\S+)\s?\]', ur'[[:\1:\2]]'),
(ur'\[https?://(..).wikipedia.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[w:\1:\2|\3]]'),
(ur'\[https?://(..).wikipedia.org/wiki/(\S+)\s?\]', ur'[[w:\1:\2]]'),
(ur'\[https?://(..).wikibooks.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[b:\1:\2|\3]]'),
(ur'\[https?://(..).wikibooks.org/wiki/(\S+)\s?\]', ur'[[b:\1:\2]]'),
(ur'\[https?://(..).wikisource.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[s:\1:\2|\3]]'),
(ur'\[https?://(..).wikisource.org/wiki/(\S+)\s?\]', ur'[[s:\1:\2]]'),
(ur'\[https?://(..).wikiquote.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[q:\1:\2|\3]]'),
(ur'\[https?://(..).wikiquote.org/wiki/(\S+)\s?\]', ur'[[q:\1:\2]]'),
(ur'\[https?://(..).wikinews.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[n:\1:\2|\3]]'),
(ur'\[https?://(..).wikinews.org/wiki/(\S+)\s?\]', ur'[[n:\1:\2]]'),
(ur'\[https?://(..).wiktionary.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[wikt:\1:\2|\3]]'),
(ur'\[https?://(..).wiktionary.org/wiki/(\S+)\s?\]', ur'[[wikt:\1:\2]]'),
(ur'\[https?://meta.wikimedia.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[meta:\1|\2]]'),
(ur'\[https?://meta.wikimedia.org/wiki/(\S+)\s?\]', ur'[[meta:\1]]'),
(ur'\[https?://www.mediawiki.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[mw:\1|\2]]'),
(ur'\[https?://www.mediawiki.org/wiki/(\S+)\s?\]', ur'[[mw:\1]]'),
(ur'\[https?://commons.wikimedia.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[commons:\1|\2]]'),
(ur'\[https?://commons.wikimedia.org/wiki/(\S+)\s?\]', ur'[[commons:\1]]'),
(ur'\[https?://wikimediafoundation.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[Foundation:\1|\2]]'),
(ur'\[https?://wikimediafoundation.org/wiki/(\S+)\s?\]', ur'[[Foundation:\1]]'),
(ur'\[https?://upload.wikimedia.org/([^\]]+)\/([^\/\s]+)\s([^\]]+)\]', ur'[[media:\2|\3]]'),
(ur'\[https?://upload.wikimedia.org/([^\]]+)\/([^\/\s]+)\]', ur'[[media:\2]]'),
(ur'\[\[[Ww]ikipedia:([^\]]+)\]\]', ur'[[w:en:\1]]'),
(ur'\[\[[Ww]ikisource:([^\]]+)\]\]', ur'[[s:en:\1]]'),
(ur'\[\[[Ww]ikibooks:([^\]]+)\]\]', ur'[[b:en:\1]]'),
(ur'\[\[[Ww]ikinews:([^\]]+)\]\]', ur'[[n:en:\1]]'),
(ur'\[\[[Ww]ikiquote:([^\]]+)\]\]', ur'[[q:en:\1]]'),
(ur'\[\[[Ww]iktionary:([^\]]+)\]\]', ur'[[wikt:en:\1]]'),
(ur'\[https?://(..).wikiversity.org/w/index.php\?title=([^\s\?\&]+)\s([^\]]+)\]', ur'[[:\1:\2|\3]]'),
(ur'\[\[:([^\]*):fr:([^:\]]*)\]\]', ur'[[\1:\2]]'),
],
'exceptions': {
'inside-tags': [
'nowiki',
'comment',
'math',
'source',
'pre',
],
}
},
'wikilienbeta': {
'regex': True,
'msg': {
'fr': ur'Robot : Correction et amélioration des liens wiki',
'en': ur'Robot: Correcting and improving links wiki',
'de': ur'Roboter: Korrektur und Verbesserung der Verbindungen Wiki',
},
'replacements': [
(ur'\[https?://beta.wikiversity.org/wiki/([^\s\]]+)\s([^\]]+)\]', ur'[[\1|\2]]'),
(ur'\[https?://beta.wikiversity.org/wiki/(\S+)\s?\]', ur'[[\1]]'),
# (ur'\[https?://beta.wikiversity.org/w/index.php\?title=([^\s\?\&]+)\s([^\]]+)\]', ur'[[\1|\2]]'),
],
'exceptions': {
'inside-tags': [
'nowiki',
'comment',
'math',
'source',
'pre',
],
}
},
'syntaxechapitre': {
'regex': True,
'msg': {
'fr': ur'Robot : Correction syntaxique des boites de chapitre',
},
'replacements': [
(ur' *\| ?titre *= ?([^\|]+)\s?', ur' | titre = \1'),
# (ur' *\| ?titre_leçon *= ?([^\|]+)', ur' | titre_leçon = \1'),
(ur' *\| ?idfaculté *= ?([^\|]+)\s?', ur' | idfaculté = \1'),
(ur' *\| ?leçon *= ?([^\|]+)\s?', ur' | leçon = \1'),
(ur' *\| ?leçon *= ?\[\[([^\]]*)\]\]', ur' | leçon = [[../]]'),
(ur' *\| ?numéro *= ?([^\|]+)\s?', ur' | numero = \1'),
(ur' *\| ?précédent *= ?([^\|]+)\s?', ur' | précédent = \1'),
(ur' *\| ?suivant *= ?([^\|]+)\s?', ur' | suivant = \1'),
(ur' *\| ?niveau *= ?([^\|]+)\s?', ur' | niveau = \1'),
# (ur'\{\{[tT]héorème ?\| ?titre ?= ?([^\|])', ur'{{Théorème\n | titre = \1\n'),
],
},
'syntaxelecon': {
'regex': True,
'msg': {
'fr': ur'Robot : Correction syntaxique des boites de leçon',
},
'replacements': [
(ur' *\| ?département *= ?', ur' | département = '),
(ur' *\| ?idfaculté *= ?', ur' | idfaculté = '),
(ur' *\| ?([1-9]) *= ?', ur' | \1 = '),
(ur' *\| ?([1-9][1-9]) *= ?', ur' | \1 = '),
(ur' *\| ?niveau *= ?', ur' | niveau = '),
(ur' *\| ?exo([1-9]) *=', ur' | exo\1 = '),
],
},
'Dates': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Dates ',
},
'replacements': [
(ur'(\[\[|\{\{)([0-9]{1,2})(er)? +(janvier|février|mars|avril|mai|juin|juillet|ao[ûu]t|septembre|octobre|novembre|décembre)(\]\]|\}\})?,? *(\[\[)?([0-9]{4})\]\]', ur'{{date|\2|\4|\7}}'),
(ur'\[\[(janvier|février|mars|avril|mai|juin|juillet|ao[ûu]t|septembre|octobre|novembre|décembre)(\]\] *\[\[| +)?([0-9]{4})\]\]', ur'{{date||\1|\3}}'),
# (ur'(\[\[|\{\{)([0-9]{1,2})(er)? +(janvier|février|mars|avril|mai|juin|juillet|ao[ûu]t|septembre|octobre|novembre|décembre)(\]\]|\}\}),? *\[\[([0-9]{4}) +(en|dans|aux?|à) +(aéronautique|architecture|astronomie|politique|cinéma|les chemins de fer|les croisades|droit|échecs|économie|informatique|jeu|littérature|musique|musique classique|les parcs d'attractions|science|sociologie|sport|la télévision|théâtre|animation asiatique)(\|[0-9]{4})?\]\]', ur'{{date|\2|\4|\6|\7 \8}}'),
# (ur'\[\[(janvier|février|mars|avril|mai|juin|juillet|ao[ûu]t|septembre|octobre|novembre|décembre)\]\] *\[\[([0-9]{4}) +(en|aux?|dans|à) +(aéronautique|architecture|astronomie|politique|cinéma|les chemins de fer|les croisades|droit|échecs|économie|informatique|jeu|littérature|musique|musique classique|les parcs d'attractions|science|sociologie|sport|la télévision|théâtre|animation asiatique)(\|[0-9]{4})?\]\]', ur'{{Date||\1|\2|\3 \4}}'),
],
},
'Mois': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Mois ',
},
'replacements': [
(ur'\b(\d{1,2}) +Janvier\b', ur'\1 janvier'),
(ur'([a-z,;:] ) ?(\[*)Janvier\b', ur'\1\2janvier'),
(ur'\b[Jj]anv?\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'janvier \1'),
(ur'\b(\d{1,2}) +[fF][eé]vrier\b', ur'\1 février'),
(ur'([a-z,;:] ) ?(\[*)[fF][eé]vrier\b', ur'\1\2février'),
(ur'\b[Ff][eé][vb]\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'février \1'),
(ur'\b(\d{1,2}) +Mars\b', ur'\1 mars'),
(ur'\b[Mm]ar\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'mars \1'),
(ur'\b(\d{1,2}) +Avril\b', ur'\1 avril'),
(ur"([a-z,;:] |['’]) ?(\[*)Avril\b", ur'\1\2avril'),
(ur'\b[Aa]vr\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'avril \1'),
(ur'\b(\d{1,2}) +Mai\b', ur'\1 mai'),
(ur'([a-z,;:] ) ?(\[*)Mai\b', ur'\1\2mai'),
(ur'\b(\d{1,2}) +Juin\b', ur'\1 juin'),
(ur'([a-z,;:] ) ?(\[*)Juin\b', ur'\1\2juin'),
(ur'\b(\d{1,2}) +Juillet\b', ur'\1 juillet'),
(ur'([a-z,;:] ) ?(\[*)Juillet\b', ur'\1\2juillet'),
(ur'\b[Jj]uil?\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'juillet \1'),
(ur'\b(\d{1,2}) +Août\b', ur'\1 août'),
(ur"([a-z,;:] |['’]) ?(\[*)Août\b", ur'\1\2août'),
(ur'\b[Aa]oû.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'août \1'),
(ur'\b(\d{1,2}) +Aout\b', ur'\1 aout'),
(ur"([a-z,;:] |['’]) ?(\[*)Aout\b", ur'\1\2aout'),
(ur'\b(\d{1,2}) +Septembre\b', ur'\1 septembre'),
(ur'([a-z,;:] ) ?(\[*)Septembre\b', ur'\1\2septembre'),
(ur'\b[Ss]ept?\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'septembre \1'),
(ur'\b(\d{1,2}) +Octobre\b', ur'\1 octobre'),
(ur"([a-z,;:] |['’]) ?(\[*)Octobre\b", ur'\1\2octobre'),
(ur'\[Oo]ct\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'octobre \1'),
(ur'\b(\d{1,2}) +Novembre\b', ur'\1 novembre'),
(ur'([a-z,;:] ) ?(\[*)Novembre\b', ur'\1\2novembre'),
(ur'\b[Nn]ov\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'novembre \1'),
(ur'\b(\d{1,2}) +[dD][ée]cembre\b', ur'\1 décembre'),
(ur'([a-z,;:] ) ?(\[*)[dD][ée]cembre\b', ur'\1\2décembre'),
(ur'\b[Dd][eé]c\.? +([0-9]{4}|\[\[[0-9]{4}\]\])\b', ur'décembre \1'),
# (ur'\b1 +(janvier|février|mars|avril|mai|juin|juillet|ao[uû]t|septembre|octobre|novembre|décembre)\b', ur'{{1er}} \1'),
],
},
'Annees': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Années ',
},
'replacements': [
(ur'\b(a|A)nnées +([1-9]0)\b', ur'\1nnées 19\2'),
],
},
'Siecles': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Siècles ',
},
'replacements': [
(ur'\b(?:I|1) *(?:<sup(?: +class=\"exposant\")?>)?(?:i?[éeè°](?:me)?|er)(?:</sup>)? *[Ss](?:i[eèé]cle|\.) +av(?:ant|\.) +J(?:ésus|\.)?[- ]?C(?:hrist\b|\.|\b)', ur'{{-s-|I|er}}'),
# (ur'\b([12]?\d) *(?:<sup(?: +class=\"exposant\")?>)?i?[éeè°](?:me)?(?:</sup>)? *[Ss](?:i[eèé]cle|\.) +av(?:ant|\.) +J(?:ésus|\.)?[- ]?C(?:hrist\b|\.|\b)', ur'{{-s-|{{subst:Nombre en romain|\1|subst=subst:}}|e}}'),
# (ur'\b([XVI]+) *(?:<sup(?: +class=\"exposant\")?>)?i?[éeè°](?:me)?(?:</sup>)? *[Ss](?:i[eèé]cle|\.) +av(?:ant|\.) +J(?:ésus|\.)?[- ]?C(?:hrist\b|\.|\b)', ur'{{-s-|\1|e}}'),
# (ur'\b(?:I|1) *(?:<sup(?: +class=\"exposant\")?>)?(?:i?[éeè°](?:me)?|er)(?:</sup>)? *[Ss](?:i[eèé]cle\b|\.)', ur'{{s-|I|er}}'),
# (ur'\b([12]?\d) *(?:<sup(?: +class=\"exposant\")?>)?i?[éeè°](?:me)?(?:</sup>)? *[Ss](?:i[eèé]cle\b|\.)', ur'{{s-|{{subst:Nombre en romain|\1|subst=subst:}}|e}}'),
# (ur'\b([XVI]+) *(?:<sup(?: +class=\"exposant\")?>)?i?[éeè°](?:me)?(?:</sup>)? *[Ss](?:i[eèé]cle\b|\.)', ur'{{s-|\1|e}}'),
(ur'\bap\. +J\.[- ]?C\.', ur'ap. J.-C.'),
],
},
'Phonetique': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Phonétique ',
},
'replacements': [
(ur'ʣ', ur'd͡z'),
(ur'ʤ', ur'd͡ʒ'),
(ur'ʥ', ur'd͡ʑ'),
(ur'ʦ', ur't͡s'),
(ur'ʧ', ur't͡ʃ'),
(ur'ʨ', ur't͡ɕ'),
],
},
# 'Typographie': {
# 'regex': True,
# 'msg': {
# 'fr': u'Robot : Correction syntaxique de type Typographie ',
# },
# 'replacements': [
# (ur'\b(N|n)°([^0-9][^0-9])', ur'\1{{o}}\2'),
# (ur'\betc(\.\.\.*|…)', ur'etc.'),
# ],
# },
'Unites': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Unités ',
},
'replacements': [
(ur'\b(G|M|k|K|h|da|d|c|m|u|µ|n|p)?m[²2]\b', ur'\1m{{2}}'),
(ur'\b(G|M|k|K|h|da|d|c|m|u|µ|n|p)?m[³3]\b', ur'\1m{{3}}'),
(ur'\b(?:k|K)(m|W|g|V|A)\b', ur'k\1'),
],
},
'Syntaxe Wiki': {
'regex': True,
'msg': {
'fr': ur'Robot : Correction syntaxique de type Syntaxe Wiki ',
},
'replacements': [
(ur'\b (1|I) ?i?er\b', ur' {{\1er}}'),
(ur'\b (1|I) ?(re|i?ere|i?ère|i?ére)\b', ur' {{\1re}}'),
(ur'\b ([0-9]{1,2}) ?(e|é|è|i?eme|i?ème|i?éme) \b', ur' {{\1e}} '),
(ur'<sup>e</sup>', ur'{{e}}'),
(ur' (:|;|\!|\?|»)', ur' \1'),
(ur'« ', ur'« '),
(ur' »', ur' »'),
(ur'\[\s*\[[ _]*(?:(:)[ _]*)?(?:fr[ _]*:[ _]*)?[Cc]at[éèêe]gor(?:ie|y)[ _]*:[ _]*(.*[^\s*\]]+)\s*\]\s*\]', ur'[[\1Catégorie:\2]]'),
(ur'<sup>(-?[0-9]+)</sup>', ur'{{exp|\1}}'),
(ur'(k?m)\.([sh])-([1-4])', ur'\1.\2<sup>-\3</sup>'),
(ur'(k?m)\/([sh])([1-4])', ur'\1.\2<sup>-\3</sup>'),
(ur'(k?m)\/([sh])<sup>([1-4])</sup>', ur'\1.\2<sup>-\3</sup>'),
(ur'\[\[[ _]*(?:(:)[ _]*)?(?:fr[ _]*:[ _]*)?[Ii]mage[ _]*:[ _]*', ur'[[\1Image:'),
(ur'<[Bb][Rr] +[cC]lear *[=:] *\"?(left|right)\"? */?>', ur'{{Clr|\1}}'),
(ur'<[Bb][Rr] +[cC]lear *[=:] *\"?(both|all)\"? */?>', ur'{{Clr}}'),
(ur'</?[Bb][Rr] ?/?>', ur'<br />'),
(ur"{{lang\|([^\|]{2})\|('+)([^']+)('+)}}", ur'\2{{lang|\1|\3}}\4'),
# (ur'(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\'\′] *(N|S) *,? *(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\'\′] *(E|W)', ur'{{Coord|\1\2|\3\4|\5|\6\7|\8\9|\10}}'),
# (ur'(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\.,] *([0-9]{1,2}) *[\'\′] *(N|S) *,? *(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\.,] *([0-9]{1,2}) *[\'\′] *(E|W)', ur'{{Coord|\1\2|\3\4.\5|\6|\7\8|\9\10.\11|\12}}'),
# (ur'(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\'\′] *(-?) *([0-9]{1,2}) *[\"\″] *(N|S) *,? *(-?) *([0-9]{1,3}) *° *(-?) *([0-9]{1,2}) *[\'\′] *(-?) *([0-9]{1,2}) *[\"\″] *(E|W)', ur'{{Coord|\1\2|\3\4|\5\6|\7|\8\9|\10\11|\12\13|\14}}'),
(ur'\b(n°|n{{o}}|N°|N{{o}})s( | )*([0-9–-]+)\b', ur'{{numéros|\3}}'),
(ur'\b(n°|n{{o}}|N°|N{{o}})( | )*([0-9]+)\b', ur'{{numéro|\3}}'),
(ur'\b[Pp]p?\.?( | +)?([0-9][0-9–-]*)\b', ur'{{p.|\2}}'),
(ur'(</ref>|<ref[^/]*/>) *(<sup>)?[,;\.]?(</sup>)? *<ref\b', ur'\1{{,}}<ref'),
(ur'(\.|\.{3}|,| *;| *:| *\!| *\?)? *(<ref[^>]*>[^<]*</ref>|<ref[^/]*/>)({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?({{,}}<ref[^>]*>[^<]*</ref>|{{,}}<ref[^/]*/>)?', ur'\2\3\4\5\6\1'),
(ur'(</ref>|<ref[^/]*/>)\.{2}([^\.])', ur'\1.\2'),
(ur'([^|]) <ref', ur'\1<ref'),
# (ur'<ruby><rb>([^<]+)</rb><rt>([^<]+)</rt></ruby>', ur'{{Ruby|\1|\2}}'),
(ur'([0-9]+)( | )*([0-9]+)?[.,]([0-9]+)( | +)?(€|\$|euros?|dollars?)', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | )*([0-9]+)?( | +)?([0-9]+)?( | +)?(€|\$|euros?|dollars?)', ur'{{unité|\1\3\5|\7}}'),
(ur'(-?)([0-9]+)( | )*([0-9]*)[.,]([0-9]+)( | )*°(C|F)', ur'{{unité|\1\2\4.\5|°\7}}'),
(ur'(-?)([0-9]+)( | )*([0-9]*)( | )*([0-9]*)( | )*°(C|F)', ur'{{unité|\1\2\4\6|°\8}}'),
(ur'([0-9]+)( | )*([0-9]*)[.,]([0-9]+)( | )*(octets?|o|ko|Kio|Mo|Mio|Go|Gio|To|Tio|Po|Pio|Eo|Eio)\b', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | )*([0-9]*)( | )*([0-9]*)( | )*(octets?|o|ko|Kio|Mo|Mio|Go|Gio|To|Tio|Po|Pio|Eo|Eio)\b', ur'{{unité|\1\3\5|\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(grammes?|g|kg|mg|t|tonnes?)\b', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(grammes?|g|kg|mg|t|tonnes?)\b', ur'{{unité|\1\3\5|\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?([Hh]ertz|hz|Hz|kHz|MHz|GHz)\b', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?([Hh]ertz|hz|Hz|kHz|MHz|GHz)\b', ur'{{unité|\1\3\5|\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?([Vv]olts?|V|mV|kV|MV|GV)\b', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?([Vv]olts?|V|mV|kV|MV|GV)\b', ur'{{unité|\1\3\5|\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?([Aa]mpères?|A|mA|µA)\b', ur'{{unité|\1\3.\4|\6}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?([Aa]mpères?|A|mA|µA)\b', ur'{{unité|\1\3\5|\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(m|km|mm|cm)/(s|h)\b', ur'{{unité|\1\3.\4|\6/\7}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(m|km|mm|cm)/(s|h)\b', ur'{{unité|\1\3\5|\7/\8}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?([2-9])(</sup>|}})?', ur'{{unité|\1\3.\4|\6|\8}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?([2-9])(</sup>|}})?', ur'{{unité|\1\3\5|\7|\9}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?²(</sup>|}})?', ur'{{unité|\1\3.\4|\6|2}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?²(</sup>|}})?', ur'{{unité|\1\3\5|\7|2}}'),
(ur'([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?³(</sup>|}})?', ur'{{unité|\1\3.\4|\6|3}}'),
(ur'([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(m|km|mm|cm)(<sup>|{{|{{exp\|)?³(</sup>|}})?', ur'{{unité|\1\3\5|\7|3}}'),
(ur'( |\n|\()([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?(mètres?|m|km|mm|cm)\b', ur'\1{{unité|\2\4.\5|\7}}'),
(ur'( |\n|\()([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?(mètres?|m|km|mm|cm)\b', ur'\1{{unité|\2\4\6|\8}}'),
(ur'( |\n|\()([0-9]+)( | +)?([0-9]+)?[.,]([0-9]+)( | +)?‰', ur'\1{{unité|\2\4.\5|‰}}'),
(ur'( |\n|\()([0-9]+)( | +)?([0-9]+)?( | +)?([0-9]+)?( | +)?‰', ur'\1{{unité|\2\4\6|‰}}'),
(ur'( |\n|\()([0-9]{1,3})( | )([0-9]{3})( | )([0-9]{3})( | )([0-9]{3})( |\))', ur'\1{{formatnum:\2\4\6\8}}\9'),
(ur'( |\n|\()([0-9]{1,3})( | )([0-9]{3})( | )([0-9]{3})( |\))', ur'\1{{formatnum:\2\4\6}}\7'),
(ur'( |\n|\()([0-9]{1,3})( | )([0-9]{3})( |\))', ur'\1{{formatnum:\2\4}}\5'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*(octets?|o|ko|Kio|[MGTPE]i?o)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*(grammes?|g|kg|mg|t|tonnes?)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*([Hh]ertz|hz|Hz|[kMG]Hz)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*([Vv]olts?|V|[mMG]V)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*([Aa]mpères?|A|mA|µA)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*(m|[kmv]m)/(s|h)\b', ur'{{unité|\1|\3'),
(ur'\{\{formatnum:([^\}*)\}\}( | )*(€|\\|euros?|dollars?)', ur'{{unité|\1|\3'),
],
},
'Toponymie': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Toponymie ',
},
'replacements': [
(ur'\b[Aa][bhk]*azie\b', ur'Abkhazie'),
(ur'\b[Aa]fgh?ann?istan\b', ur'Afghanistan'),
(ur'\b[Aa]ll?bann?ie\b', ur'Albanie'),
(ur'\b[Aa]llg[eéèêë]rie\b', ur'Algérie'),
(ur'\b[Aa]ll?emagne\b', ur'Allemagne'),
(ur'\b[Aa]ndorr?e\b', ur'Andorre'),
(ur'\b[Aa]ngleterr?e\b', ur'Angleterre'),
(ur'\b[Aa]ngoll?a\b', ur'Angola'),
(ur'\b[Aa]rm[eéèêë]nie\b', ur'Arménie'),
(ur'\b[Aa]ustrall?ie\b', ur'Australie'),
(ur'\bautriche\b', ur'Autriche'),
(ur'\b[aA]d?zz?erba[iï]d?jj?an\b', ur'Azerbaïdjan'),
(ur'\bbahamas\b', ur'Bahamas'),
(ur'\b[bB]ahre[iï]n\b', ur'Bahreïn'),
(ur'\bbangladesh\b', ur'Bangladesh'),
(ur'\b[bB][eéèêë]lgique\b', ur'Belgique'),
(ur'\b[bB][eéèêë]ll?ize\b', ur'Belize'),
(ur'\b[bB][eéèêë]n[eéèêë]lux\b', ur'Benelux'),
(ur'\b[bB]irmann?ie\b', ur'Birmanie'),
(ur'\b[bB]oll?ivie\b', ur'Bolivie'),
(ur'\b[bB]osnie[ -]et[ -](h|H)[éeèêë]r[sz][éeèêë]gg?ovine\b', ur'Bosnie-et-Herzégovine'),
(ur'\b[bB]osnie[ -](h|H)[éeèêë]r[sz][éeèêë]gg?ovine\b', ur'Bosnie-Herzégovine'),
(ur'\b[bB]os?ts?wann?a\b', ur'Botswana'),
(ur'\b[bB]r[eé][sz]il\b', ur'Brésil'),
(ur'\b[bB]ulgarr?ie\b', ur'Bulgarie'),
(ur'\b[bB]urkinn?a\b', ur'Burkina'),
(ur'\b[bB]urkinn?a[ -](f|F)ass?o\b', ur'Burkina Faso'),
(ur'\b[Cc]a[mn]bodge\b', ur'Cambodge'),
(ur'\b[Cc]amm?err?oun\b', ur'Cameroun'),
(ur'\b[Cc]ann?ada\b', ur'Canada'),
(ur'\b(C|c)arr?a[iïî]bb?e(s?)\b', ur'\1araïbe\2'),
(ur'\bceylan\b', ur'Ceylan'),
(ur'\b[Cc]isjordann?ie?\b', ur'Cisjordanie'),
(ur'\b[Cc]oll?o[mn]bie?\b', ur'Colombie'),
(ur'\b[Cc]omm?orr?es?\b', ur'Comores'),
(ur'\bcongo\b', ur'Congo'),
(ur'\b[CcKk]orr?[eéèêë]e\b', ur'Corée'),
(ur'\b[cC]osta[ -][rR]ica\b', ur'Costa Rica'),
(ur"\b[cC][oô]tt?es?[ -]d('|’)[iI]vo[iïî]rr?es?\b", ur'Côte d\1Ivoire'),
(ur'\bcroatie\b', ur'Croatie'),
(ur'\b[Dd]ann?emm?arc?k\b', ur'Danemark'),
(ur'\b[Dd]jibb?outt?ie?s?\b', ur'Djibouti'),
(ur'\b[Dd]omm?inn?ique\b', ur'Dominique'),
(ur'\b[Eeé]cosse\b', ur'Écosse'),
(ur'\b[Eeé]gypte\b', ur'Égypte'),
(ur'\b[EÉ]quatt?eur\b', ur'Équateur'),
(ur'\b[EÉeé]mm?irr?at?e?s?[ -][Aa]rr?abb?es?[ -][Uu]nn?is?\b', ur'Émirats arabes unis'),
(ur'\b[EÉeé]rr?yh?tt?h?r[ée]e?\b', ur'Érythrée'),
(ur'\bespagne\b', ur'Espagne'),
(ur'\b[EÉÈeéè]stonn?ie\b', ur'Estonie'),
(ur'\b[ÉEeé]tats(?:-|_| +)[Uu]nis\b', ur'États-Unis'),
(ur'\b[Eeé]thiopie\b', ur'Éthiopie'),
(ur'\bfidji\b', ur'Fidji'),
(ur'\bfinlande\b', ur'Finlande'),
(ur'\bfrance\b', ur'France'),
(ur'\bgabon\b', ur'Gabon'),
(ur'\bgambie\b', ur'Gambie'),
(ur'\bgéorgie\b', ur'Géorgie'),
(ur'\bghana\b', ur'Ghana'),
(ur'\bgibraltar\b', ur'Gibraltar'),
(ur'\b[gG]rande[ -][bB]retagne\b', ur'Grande-Bretagne'),
(ur'\bgrèce\b', ur'Grèce'),
(ur'\b[gG]r(oe|oë|ø)nlande?\b', ur'Gr\1nland'),
(ur'\b[Gg]u?att?(e|é)mm?all?a\b', ur'Guat\1mala'),
(ur'\b[Gg]uinn?ée?[ -][bB]is[seaou]*\b', ur'Guinée-Bissau'),
(ur'\bguyana\b', ur'Guyana'),
(ur'\b[hH]aute[ -][vV]olta\b', ur'Haute-Volta'),
(ur'\b[hH]o[mn]durr?as?\b', ur'Honduras'),
(ur'\b[hH]ongrie?\b', ur'Hongrie'),
(ur'\b[iIîÎ]le[ -]de[ -][fF]rance\b', ur'Île-de-France'),
(ur'\b[iI]ndochinn?e\b', ur'Indochine'),
(ur'\bi([rs])lande\b', ur'I\1lande'),
(ur'\b[iI]sra[éeèêë]l\b', ur'Israël'),
(ur'\bitalie\b', ur'Italie'),
(ur'\b[iI]t?chk[éeèëê]rr?ie?\b', ur'Itchkérie'),
(ur'\b[jJ]amm?a[iï]que\b', ur'Jamaïque'),
(ur'\b[jJ]ordann?ie?\b', ur'Jordanie'),
(ur'\b[kK]a[sz]z?ac?h?kh?stan\b', ur'Kazakhstan'),
(ur'\b[kK]enn?ya\b', ur'Kenya'),
(ur'\b[kK]ih?rh?gg?h?i?[sz]i?h?s?tan\b', ur'Kirghizistan'),
(ur'\b[kK]irr?ibb?h?att?h?i\b', ur'Kiribati'),
(ur'\bkos(s?)ovo\b', ur'Kos\1ovo'),
(ur'\b[kK]oh?w[éeèëê][iîï]th?\b', ur'Koweït'),
(ur'\b[kK]urdh?isth?an\b', ur'Kurdistan'),
(ur'\blaos\b', ur'Laos'),
(ur'\b[lL]e[sz]ott?h?o\b', ur'Lesotho'),
(ur'\b[lL]ett?onn?ie?\b', ur'Lettonie'),
(ur'\b[lL]ibb?an\b', ur'Liban'),
(ur'\b[lL]ibb?(é|e)rr?ia\b', ur'Lib\1ria'),
(ur'\b[Ll][iy]b[iy]e\b', ur'Libye'),
(ur'\b[Ll]ie?chtens?th?[ae]i?n\b', ur'Liechtenstein'),
(ur'\b[Ll]itt?uann?ie?\b', ur'Lituanie'),
(ur'\bluxembourg\b', ur'Luxembourg'),
(ur'\bmacao\b', ur'Macao'),
(ur'\b[mM]add?agg?ascar\b', ur'Madagascar'),
(ur'\b[mM]all?aisie\b', ur'Malaisie'),
(ur'\b[mM]all?awie?\b', ur'Malawi'),
(ur'\b[mM]aldives?\b', ur'Maldives'),
(ur'\bmaroc\b', ur'Maroc'),
(ur'\bmaurice\b', ur'Maurice'),
(ur'\b[mM]aurr?itt?ann?ie?\b', ur'Mauritanie'),
(ur'\bmayotte\b', ur'Mayotte'),
(ur'\bmexique\b', ur'Mexique'),
(ur'\b[mM]icronn?[éeèëê]sie?\b', ur'Micronésie'),
(ur'\b[mM]oldavie?\b', ur'Moldavie'),
(ur'\bmoldova\b', ur'Moldova'),
(ur'\b[Mm]ongoll?ie?\b', ur'Mongolie'),
(ur'\b[Mm]o[mn]t[éeèëê]nn?[éeèëê]gros?\b', ur'Monténégro'),
(ur'\b[Mm]o[sz][ae][mn]biques?\b', ur'Mozambique'),
(ur'\b[Mm]ya[mn][mn]ar\b', ur'Myanmar'),
(ur'\bnauru\b', ur'Nauru'),
(ur'\bnépal\b', ur'Népal'),
(ur'\b[nN]icc?arr?ag[uü]?[aä]s?\b', ur'Nicaragua'),
(ur'\bniger\b', ur'Niger'),
(ur'\bnig(é|e)ria\b', ur'Nig\1ria'),
(ur'\b[nN]orv[éeèêë]ge\b', ur'Norvège'),
(ur'\b[nN]ouvell?es?[ -][cC]all[éeèêë]donn?ie?\b', ur'Nouvelle-Calédonie'),
(ur'\b[nN]ouvell?es?[ -][zZ][éeèêë]ll?[ae]ndes?\b', ur'Nouvelle-Zélande'),
(ur'\boman\b', ur'Oman'),
(ur'\b[Oo](?:c|ss?)étie?\b', ur'Ossétie'),
(ur'\bouganda\b', ur'Ouganda'),
(ur'\b[oO]u?[sz]b[éeèêë][chk]*is?ts?[ae]n\b', ur'Ouzbékistan'),
(ur'\b(p|P)ac?kistan\b', ur'Pakistan'),
(ur'\bpala(os|u)\b', ur'Pala\1'),
(ur'\b[pP]all?estinn?e', ur'Palestine'),
(ur'\b[pP]app?ouh?a[sz]ie?[ -][nN]ouvell?e[ -][gG]u?inn?ée?\b', ur'Papouasie-Nouvelle-Guinée'),
(ur'\b[pP]arr?ag[uü?][aä]y\b', ur'Paraguay'),
(ur'\b[pP]ays[ -][bB]as\b', ur'Pays-Bas'),
(ur'\b[pP]ays[ -][bB]asque\b', ur'Pays basque'),
(ur'\b[pP][eé]rou\b', ur'Pérou'),
(ur'\b[Pp]hill?ipp?inn?es?\b', ur'Philippines'),
(ur'\b[Pp]oll?ogne\b', ur'Pologne'),
(ur'\b[Pp]orto[ -][rR]icc?o\b', ur'Porto Rico'),
(ur'\bportugal\b', ur'Portugal'),
(ur'\bpuntland\b', ur'Puntland'),
(ur'\b[Qq]u?atar\b', ur'Qatar'),
(ur'\b[Qq]u[eéèêë]bec\b', ur'Québec'),
(ur'\b[Rr]eykjavík\b', ur'Reykjavik'),
(ur'\b[rR]oumm?ann?ie?\b', ur'Roumanie'),
(ur'\b[rR]oyaume-[uU]ni\b', ur'Royaume-Uni'),
(ur'\brussie\b', ur'Russie'),
(ur'\b[rR]wa[mn]da\b', ur'Rwanda'),
(ur'\b[sS]ahara[ -][oO]cc?idd?ental\b', ur'Sahara occidental'),
(ur'\bsalomon\b', ur'Salomon'),
(ur'\bsalvador\b', ur'Salvador'),
(ur'\bsamoa\b', ur'Samoa'),
(ur'\bsénégal\b', ur'Sénégal'),
(ur'\bserbie\b', ur'Serbie'),
(ur'\b[sS][éeèêë][iy]chell?es?\b', ur'Seychelles'),
(ur'\b[sS]ierr?a[ -][lL][éeèêë]onn?e\b', ur'Sierra Leone'),
(ur'\bsingapour\b', ur'Singapour'),
(ur'\bslov(aquie|énie)\b', ur'Slov\1'),
(ur'\b[Ss]ri[ -][lL]a[mn]c?ka\b', ur'Sri Lanka'),
(ur'\b[sS]omm?all?ill?and\b', ur'Somaliland'),
(ur'\b[Ss]u[eéèêë]de\b', ur'Suède'),
(ur'\b[Ss]urr?inn?amm?(e?)\b', ur'Surinam\1'),
(ur'\b[Ss]wazz?ill?ande?\b', ur'Swaziland'),
(ur'\bsyrie\b', ur'Syrie'),
(ur'\b[Tt]a[dj]*i[chk]*i[sth]*an\b', ur'Tadjikistan'),
(ur'\bta(i|ï)wan\b', ur'Ta\1wan'),
(ur'\b[Tt]anzanie?\b', ur'Tanzanie'),
(ur'\btchad\b', ur'Tchad'),
(ur'\b[tT]ch[eéèêë]t?ch[eéèêë]nn?ie?\b', ur'Tchétchénie'),
(ur'\b[tT]ch[eéèêë][ck]*oslovaquie?\b', ur'Tchécoslovaquie'),
(ur'\b[tT]ch[eéèêë](?:[chk]*|qu)ie?\b', ur'Tchéquie'),
(ur'\b[Tt]h?a[iï]ll?ande\b', ur'Thaïlande'),
(ur'\btimor\b', ur'Timor'),
(ur'\btogo\b', ur'Togo'),
(ur'\b[tT]ransi?nn?i?strie?\b', ur'Transnistrie'),
(ur'\b[tT]rinn?i(té|dad)[ -]et[ -][tT]obb?agg?o\b', ur'Trini\1-et-Tobago'),
(ur'\btunisie\b', ur'Tunisie'),
(ur'\b[Tt]urc?km[eéèêë]?nis?tan\b', ur'Turkménistan'),
(ur'\b[Tt]urc?quie\b', ur'Turquie'),
(ur'\btuvalu\b', ur'Tuvalu'),
(ur'\bukraine\b', ur'Ukraine'),
(ur'\b[uU]rr?ugg?u?a[iïy]\b', ur'Uruguay'),
(ur'\b[vV]ann?uatt?u\b', ur'Vanuatu'),
(ur'\b[vV]att?icc?an\b', ur'Vatican'),
(ur'\b[vV][eéè]nn?[eéè]zu[eéè]ll?a\b', ur'Venezuela'),
(ur'\b[Vv]i[eéèêë]t(?:-| *)[Nn]am\b', ur'Viêt Nam'),
(ur'\b[wW]all?is[ -]et[ -][fF]utt?unn?a\b', ur'Wallis-et-Futuna'),
(ur'\b[yY][eéèêë]mm?en\b', ur'Yémen'),
(ur'\b[zZ]a[mn]bie\b', ur'Zambie'),
(ur'\b[zZ]i[mn]bab(?:w|ou)[eé]e?\b', ur'Zimbabwe'),
(ur'\b[Aa]ff?rique\b', ur'Afrique'),
(ur'Afrique du sud', ur'Afrique du Sud'),
(ur'\b[Aa]m[eéèêë]rique(s?)\b', ur'Amérique\1'),
(ur'Amérique du sud', ur'Amérique du Sud'),
(ur'Amérique du nord', ur'Amérique du Nord'),
(ur'\b([Aa]nta|[Aa])rtique(s?)\b', ur'\1rctique\2'),
(ur'\b[Aa]sie\b', ur'Asie'),
(ur'Asie du sud-est', ur'Asie du Sud-Est'),
(ur'\beurope\b', ur'Europe'),
(ur"\b([Ee])urope de l(['’])[Ee]st\b", ur'Europe de l\2Est'),
(ur"\b([Ee])urope de l(['’])[Oo]uest\b", ur'Europe de l\2Ouest'),
(ur'Europe du nord', ur'Europe du Nord'),
(ur'Europe du sud', ur'Europe du Sud'),
(ur'\b[Oo]c[eéèêë]anie\b', ur'Océanie'),
],
},
'Regles orthographiques generales': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Règles orthographiques générales ',
},
'replacements': [
(ur'(?<=[^0-9 {]) *, *(?!\s)', ur', '),
(ur'(?<=[^0-9 ]) +,$', ur','),
(ur'(\.|\:|\?|!|==) A ', ur'\1 À '),
(ur'(\n)A ', ur'\1À '),
(ur"(\n)(\*+|#+|'+) ?A ", ur'\1\2 À '),
(ur'[éèê](cc|dd|ff|ll|nn|pp|rr|ss|tt|x|zz)', ur'e\1'),
(ur'\bEcr([aéêeiou])', ur'Écr\1'),
(ur'[éèê]ene(s?)\b', ur'éenne\1'),
(ur'émm', ur'ém'),
(ur'[èê]mm', ur'emm'),
(ur'([c-zé]|rb|ob|ib|brimb|ueb)allement?(s?)\b', ur'\1alement\2'),
(ur'innement(s?)\b', ur'inement\1'),
(ur'onement(s?)\b', ur'onnement\1'),
(ur'\b(o|O)rto([^l]|l[^a])', ur'\1rtho\2'),
(ur'repp', ur'rep'),
(ur'\b(S|s)i il', ur"\1'il"),
(ur'([^-])[-—–]\x3E', ur'\1→'),
],
},
'A': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type A ',
},
'replacements': [
(ur'\b(a|A)bandon([aâeéèio])', ur'\1bandonn\2'),
(ur'\b([aA]|[rR]a)bbat(s?)\b', ur'\1bat\2'),
(ur'\b([aA]|[rR]a)bb?att?([raeîou]|i[^a])', ur'\1batt\2'),
(ur'\b([aA]|[sS]ura)bb?ondamm?[ae]nt\b', ur'\1bondamment'),
(ur'\b(a|A)bb?r[éèe]viation(s?)\b', ur'\1bréviation\2'),
(ur'\b(a|A)b[sc]s?isse(s?)\b', ur'\1bscisse\2'),
(ur'\b(a|A)calmie(s?)\b', ur'\1ccalmie\2'),
(ur'\b(a|A)cept', ur'\1ccept'),
(ur'\b(a|A)cc?essibb?ill?itt?ée?(s?)\b', ur'\1ccessibilité\2'),
(ur'\b([aA]|[rR]a|ina)cc?omm?od', ur'\1ccommod'),
(ur'\b([aA]|[rR]é?a)cc?o[mn]pagn', ur'\1ccompagn'),
(ur'\b([aA]|[dD]ésa|[rR]é?a|ina)cord', ur'\1ccord'),
(ur'\b(a|A)cc?(?:eu|ue)il(s?)\b', ur'\1ccueil\2'),
(ur'\b([aA]|[iI]na)cc?(?:eu|ue)ill?([aeiîo])', ur'\1ccueill\2'),
(ur'\b([aA]|[rR]é?a)cus', ur'\1ccus'),
(ur'\b(a|A)s?cs?erbe(s?)\b', ur'\1cerbe\2'),
(ur'\b(a|A)ccompte(s?)\b', ur'\1compte\2'),
(ur'\b(a|A)c?qu?(i?[eéè]r|î|ir|is[eis])', ur'\1cqu\2'),
(ur'\b(a|A)c?qu?i([st]s?)\b', ur'\1cqui\2'),
(ur'\b(a|A)c?qu?itt?([âeéèio]|ai[^n]|an[^i]|a[^in])', ur'\1cquitt\2'),
(ur'\b(a|A)ctivitt?ée?(s?)\b', ur'\1ctivité\2'),
(ur'\b(a|A)ctuall?itt?ée?(s?)\b', ur'\1ctualité\2'),
(ur'\b(a|A)dm[eèé]t([raeio])', ur'\1dmett\2'),
(ur'\b(a|A)[eèéêë]rologi(e?|que?)(s?)\b', ur'\1érologi\2\3'),
(ur'\b(a|A)[eèéêë]ropage\b', ur'\1réopage'),
(ur'\b(a|A)r?[eèéêë]r?oport(s?)\b', ur'\1éroport\2'),
(ur'\b(a|A)faire(s?)\b', ur'\1ffaire\2'),
(ur'\b([aA]|[rR]éa)ff?ill?i', ur'\1ffili'),
(ur'\b([aA]|[rR]éa)firm', ur'\1ffirm'),
(ur'\b(A|a)ffin (de?|que?)\b', ur'\1fin \2'),
(ur'\bage(s?)\b', ur'âge\1'),
(ur'\bAge(s?)\b', ur'Âge\1'),
(ur'\b(a|A)gg?ll?omm?[ée]ration(s?)\b', ur'\1gglomération\2'),
(ur'\b(a|A)ggio(s?)\b', ur'\1gio\2'),
(ur'\b(a|A)gg?r[eéèê][cst]s?ion(s?)\b', ur'\1gression\2'),
(ur'\b(a|A)gg?r[eéèê][cst]s?ivitt?ée?(s?)\b', ur'\1gressivité\2'),
(ur'\b(a|A)i?ll?i?eurs?\b', ur'\1illeurs'),
(ur'\baît\b', ur'ait'),
(ur'\b(a|A)ll?entour(s?)\b', ur'\1lentour\2'),
(ur'\b(a|A)lzeimer\b', ur'Alzheimer'),
(ur'\bame(s?)\b', ur'âme\1'),
(ur'\bAme(s?)\b', ur'Âme\1'),
(ur'\b(a|A)mm?itt?iée?(s?)\b', ur'\1mitié\2'),
(ur'\b(a|A)nn?[ée][gc]dott?(es?|iques?)\b', ur'\1necdot\2'),
(ur'\b(a|A)nonce([sr]?)\b', ur'\1nnonce\2'),
(ur'\b(a|A)nth?oll?ogie(s?)\b', ur'\1nthologie\2'),
(ur'\b(a|A)ntic?quitt?ée?(s?)\b', ur'\1ntiquité\2'),
(ur'\b(a|A)nxyog[eéèê]ne(s?)\b', ur'\1nxiogène\2'),
(ur'\b(a|A)pper', ur'\1per'),
(ur'\b(a|A)pp[eéèê]rr?itt?if(s?)\b', ur'\1péritif\2'),
(ur'\b(a|A)pp?ogée?\b', ur'\1pogée'),
(ur'\b(a|A)pareil(s?)\b', ur'\1ppareil\2'),
(ur'\b(a|A)pp?arr?[ae]mm?ent\b', ur'\1pparemment'),
(ur'\b(a|A)pp?art(enir|enai[st]|enaient|enances?|iend|iendrai[st]|ien[st]|enu|enant)\b', ur'\1ppart\2'),
(ur'\b(a|A)pp?artenue?s?\b', ur'\1ppartenu'),
(ur'\b(a|A)pp?artienn?e(nt?|s?)\b', ur'\1ppartienne\2'),
(ur'\b([aA]|[rR]a)pp?ell?(er|ée?s?|ante?s?|ons)\b', ur'\1ppel\2'),
(ur'\b([aA])pp?[éeè]ll?a[cst]s?ion(s?)\b', ur'\1ppellation\2'),
(ur'\b([aA]|[iI]na)pp?ll?i(?:c|qu)a(bles?|bilités?|tions?|teurs?)\b', ur'\1pplica\2'),
(ur'\b(a|A|ina|Ina|ra|Ra)pliqu(er?|ée?s?|ai[st]|aient)\b', ur'\1ppliqu\2'),
(ur'\b(a|A|ra|Ra)port(er|é?e?s?|[ae]nt|i?ons|i?ez|ai?s?|ait|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1pport\2'),
(ur'\b(a|A)préci(er|ée?s?|es?|i?ons|i?ez|ent|ais?|ait|aient|as?|âmes|âtes|èrent|erais?|eras?|eri?ons|eri?ez|eront|erait|eraient|ant)\b', ur'\1ppréci\2'),
(ur'\b(a|A)pp?r[éeè]h?en(der|dée?s?|dai?s?|dait|daient)\b', ur'\1ppréhen\2'),
(ur'\b(a|A)pp?r[éeè]h?en(?:t|ss?)(ions?)\b', ur'\1ppréhens\2'),
(ur'\b(a|A)prendre\b', ur'\1pprendre'),
(ur'\b([aA]|[iI]na|[rR]a)pp?roch(er?|ée?s?|as?|ais?|ait|aient|able|antes?|ants?|ements?)\b', ur'\1pproch\2'),
(ur'\b([aA]p|[rR]éap)?p?rovisionn?(er|ée?s?|ements?|a|ai[ts]|aient)\b', ur'\1provisionn\2'),
(ur'\b(a|A)pr[éeêè]s?\b', ur'\1près'),
(ur'\b(a|A)rd[ae]mm?[ae]nt\b', ur'\1rdemment'),
(ur"\b(L|l|S|s|C|c)('|’|on|ette) ?(\[\[)?(a|A)rmoiries?\b", ur'\1es \3\4rmoiries'),
(ur'\bArmoirie\b', ur'Armoiries'),
(ur'\b(a|A)rrières-cuisines\b', ur'\1rrière-cuisines'),
(ur'\b(a|A)rondi([^n])', ur'\1rrondi\2'),
(ur'\b(a|A)rtisant?(s?)\b', ur'\1rtisan\2'),
(ur'\b(a|A)s[sc]?[ae]n[cst](eurs?|ions?|ionnels?|ionnelles?)\b', ur'\1scens\2'),
(ur'\b(a|A)ssocial\b', ur'\1social'),
(ur'\b(a|A)stérique(s?)\b', ur'\1stérisque\2'),
(ur'\b(a|A)the(is[mt]e|e?)(s?)\b', ur'\1thé\2\3'),
(ur'\b(a|A)th?l[éèêëe]te(s?)\b', ur'\1thlète\2'),
(ur'\b([aA])tach', ur'\1ttach'),
(ur'\b([aA]|[iI]na|[rR]éa)taqu', ur'\1ttaqu'),
(ur'\b(a|A)tei', ur'\1ttei'),
(ur'\b(a|A)tteind(s?)\b', ur'\1tteint\2'),
(ur'\b(a|A)titude(s?)\b', ur'\1ttitude\2'),
(ur'\b([aA]|[rR]éa)tribu', ur'\1ttribu'),
(ur'\b(a|A)u vu(e?s?)\b', ur'\1u vu'),
(ur"(?<![dD]['’])\b(a|A)ucun(e?)s\b", ur'\1ucun\2'),
(ur'\b(A|a)ujourd *hui\b', ur"\1ujourd'hui"),
(ur'\b(a|A)us?trall?', ur'\1ustral'),
(ur'\b(a|A)uth?[ae]nti', ur'\1uthenti'),
(ur'\b(a|A)uxilliaire(s?)\b', ur'\1uxiliaire\2'),
(ur'\b(a|A)uxquel(le)?\b', ur'\1uxquel\2s'),
(ur'\b(a|A)valid', ur'\1valis'),
(ur'\b(a|A)vants-postes\b', ur'\1vant-postes'),
(ur'\b[àa] proprement parlé\b', ur'à proprement parler'),
],
},
'B': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type B ',
},
'replacements': [
(ur'\b(B|b)acc?all?aurr?[eé]at?(s?)\b', ur'\1accalauréat\2'),
(ur'\b(B|b)allistique(s?)\b', ur'\1alistique\2'),
(ur'\b[Bb]ar?rac?k? [Oo]bamm?a\b', ur'Barack Obama'),
(ur'\b(B|b)arage(s?)\b', ur'\1arrage\2'),
(ur'\b(B|b)âteau(x?)\b', ur'\1ateau\2'),
(ur'\b(B|b)[aâ]tt?[iî]mm?ent(s?)\b', ur'\1âtiment\2'),
(ur'\b([aA]b|[bB]|[cC]omb|[Dd]éb|é|[rR]ab|[rR]eb)a(tante?s?|tre|tue?s?|tes?|tent)\b', ur'\1at\2'),
(ur'\b(?:B|b)e?audelaire\b', ur'Baudelaire'),
(ur'\b(b|B)e?aucc?oup?s?\b', ur'\1eaucoup'),
(ur'\b(b|B)énifice(s?)\b', ur'\1énéfice\2'),
(ur'\b(b|B)[ëèée]te(s?)\b', ur'\1ête\2'),
(ur'\b(b|B)il?b(?:li?|i)ograph', ur'\1ibliograph'),
(ur'\b(b|B)il?b(?:li?|i)oth?[eéèêë](?:qu|c)aire(s?)\b', ur'\1ibliothécaire\2'),
(ur'\b(b|B)il?b(?:li?|i)oth?[eéèêë]que(s?)\b', ur'\1ibliothèque\2'),
(ur'\b(B|b)ient[oô]t?s?\b', ur'\1ientôt'),
(ur'\b(B|b)ijous\b', ur'\1ijoux'),
(ur'\b(B|b)leux\b', ur'\1leus'),
(ur'\b(b|B)oeuf(s?)\b', ur'\1œuf\2'),
(ur'\b(b|B)oît(eux|euses?|er|ent|ai[ts]|aient)\b', ur'\1oit\2'),
(ur'\b(b|B)oudd?h?i(s[mt]e|que)(s?)\b', ur'\1ouddhi\2\3'),
(ur'\b(b|B)oull?e?vers(ante?s?|ements?|er?|ée?s?|ai?s?|ait|aient|ent|erai?s?|erait|eraient)\b', ur'\1oulevers\2'),
(ur'\b(b|B)ri[eèé]ve?tt?ée?(s?)\b', ur'\1rièveté\2'),
(ur'\b(b|B)rill?[ae]mm?ent\b', ur'\1rillamment'),
(ur'\b(b|B)ritt?ann?ique(s?)\b', ur'\1ritannique\2'),
(ur'\b(b|B)ru(?:i|ill|y)amm?ent\b', ur'\1ruyamment'),
],
},
'C': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type C ',
},
'replacements': [
(ur'\b(c|C)abl(e|ée?|age|eur|euse|ante?)(s?)\b', ur'\1âbl\2\3'),
(ur'\b(C|c)aillous\b', ur'\1ailloux'),
(ur'\b(C|c)am[eè]ra(s?)\b', ur'\1améra\2'),
(ur'\b(c|C)app?acitt?ée?(s?)\b', ur'\1apacité\2'),
(ur'\b(C|c)arr?act[éeèêë]rr?e(s?)\b', ur'\1aractère\2'),
(ur'\b(C|c)arr?act[éèeêë]rr?is(tiques?|tiquement?|ations?|ée?s?|er|ante?s?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1aractéris\2'),
(ur'\b(C|c)arr?i[éeè]rr?e(s?)\b', ur'\1arrière\2'),
(ur'\b(C|c)ass?err?oll?e(s?)\b', ur'\1asserole\2'),
(ur'\b(C|c)ath?all?h?[iy]th?ique(s?)\b', ur'\1atalytique\2'),
(ur'\b(C|c)auchemard(s?)\b', ur'\1auchemar\2'),
(ur'\b(C|c)ep[ae]nd[ae]nts?\b', ur'\1ependant'),
(ur"\b([Cc][’'])est +[àa] +dire\b", ur'\1est-à-dire'),
(ur'\b([Cc])-?à-?d\b', ur"\1'est-à-dire"),
(ur'\b(C|c)e(lui|lles?|ux)-?[cç]i\b', ur'\1e\2-ci'),
(ur'\b(C|c)e(lui|lles?|ux)-?l[aà]\b', ur'\1e\2-là'),
(ur'\b(C|c)ell?ull?e(s?)\b', ur'\1ellule\2'),
(ur'\b(C|c)ette\s+article \b', ur'\1et article '),
(ur'\b(c|C)ha(?:c|qu?)un(e?)s\b', ur'\1hacun\2'),
(ur'\b(C|c)hampion(e|ats?)\b', ur'\1hampionn\2'),
(ur'\b[Cc]hamp(s?)[- ][Eeé]lys[eé]e(s?)\b', ur'Champs-Élysées'),
(ur'\b(c|C)haques\b', ur'\1haque'),
(ur'\b(c|C)haranco', ur'\1haranço'),
(ur'\b(C|c)hassis\b', ur'\1hâssis'),
(ur'\b(C|c)h[aàáâ]te?au(x?)\b', ur'\1hâteau\2'),
(ur"\b(c|C)hef(s?)[ -]d([’'])(?:oe|œ)uvres?\b", ur'\1hef\2-d\3œuvre'),
(ur'\b(c|C)hef[ -]lieue?\b', ur'\1hef-lieu'),
(ur'\b(c|C)heveaux\b', ur'\1hevaux'),
(ur'\b(C|c)hifre(s?)\b', ur'\1hiffre\2'),
(ur'\b(c|C)hoeur(s?)\b', ur'\1hœur\2'),
(ur'\b(c|C)inquantes\b', ur'\1inquante'),
(ur'\b(c|C)inqui[ée]mm?e(ment)?\b', ur'\1inquième\2'),
(ur'\b(c|C)lartée?(s?)\b', ur'\1larté\2'),
(ur'\b(c|C)l[oô]tt?urr?((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant)\b', ur'\1lôtur\2'),
(ur'\b(c|C)oeur(s?)\b', ur'\1œur\2'),
(ur'\b(c|C)oll?ection(s?)\b', ur'\1ollection\2'),
(ur'\b(c|C)oll?ectionn?((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|eurs?|euses?|ismes?)\b', ur'\1ollectionn\2'),
(ur'\b(c|C)ommité(s?)\b', ur'\1omité\2'),
(ur'\b([cC]|[rR]ec|[tT]éléc|[dD]éc)omand((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant)\b', ur'\1ommand\2'),
(ur'\b(c|C)omand(ant|ement|itaire|ite|itée?|o|eur|erie)(s?)\b', ur'\1ommand\2\3'),
(ur'\b(c|C)omm?[éeè]mm?orr?((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|ations?|atifs?|atives?|ables?)\b', ur'\1ommémor\2'),
(ur'\b(c|C)omm?[ae]nc(ement|er?|ée?s?|ent)\b', ur'\1ommenc\2'),
(ur'\b(c|C)omm?iss?a(ires?|riats?)\b', ur'\1ommissa\2'),
(ur'\b(c|C)omm?iss?ion(s?|né?|née?s?|nais?|nait?|na?|ne?|naient?|nement?|nements?)\b', ur'\1ommission\2'),
(ur'\b(c|C)omun(s?)\b', ur'\1ommun\2'),
(ur'\b(c|C)omm?un((?:auté|e|ale?|autaire|autarité)s?|aux)\b', ur'\1ommun\2'),
(ur'\b(c|C)omm?unn?(is[mt]es?)\b', ur'\1ommun\2'),
(ur'\b([cC]|[iI]nc)omm?unn?i(cations?|quer|quée?s?|cable|cateurs?|cateuses|catifs?|catives?|er|ée?s?|ai[st]|aient)\b', ur'\1ommuni\2'),
(ur'\b([cC]|[iI]nc)omparr', ur'\1ompar'),
(ur'\b([cC]|[iI]nc)omp[eéè]t[ae]n(?:c|ss?)e(s?)\b', ur'\1ompétence\2'),
(ur'\b([cC]|[iI]nc)ompl[eéèê]t(er|ifs?|ives?|udes?)\b', ur'\1omplét\2'),
(ur'\b([cC]|[iI]nc)ompl[eéèê]temm?ent\b', ur'\1omplètement'),
(ur'\b(C|c)onc(oi[s]t|ue?s?)\b', ur'\1onç\2'),
(ur'\b(c|C)oncc?urr?[ea]n(te?s?|ces?|tiels?|tielles?|cer|cée?s?|çai?s?|çait|çaient|çant)\b', ur'\1oncurren\2'),
(ur'\b[Cc]ondole?ez?za [Rr]ice\b', ur'Condoleezza Rice'),
(ur'\b(c|C)onff?idd?[ae]n[cst]iel(s?)\b', ur'\1onfidentiel\2'),
(ur'\b([cC]|[mM]éc|[rR]ec)onn?aiss?a(nces?|nte?s?|bles?)\b', ur'\1onnaissa\2'),
(ur'\b(c|C)onn?ection(s?)\b', ur'\1onnexion\2'),
(ur'\b([cC]|[dD]éc|[rR]ec)onn?ect(er|ée?s?|ant|iques?|es?|i?ons|i?ez|ent|ai?s?|ait|i?ons|i?ez|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1onnect\2'),
(ur'\b(c|C)onn?ot?((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|ations?|ables?)\b', ur'\1onnot\2'),
(ur'\b([cC]|[iI]nc|[mM]éc|[rR]ec)onu(e?s?)\b', ur'\1onnu\2'),
(ur'\b[cC]on[cs]s?ien[cs]e(s?)\b', ur'\1onscience\2'),
(ur'\b(c|C)on(?:c|ss?)en(?:ss?|[cç])u(s|els?|elles?)\b', ur'\1onsensu\2'),
(ur'\b([cC]|[iI]nc)on(?:c|ss?)[eéè]qu[ae]n(ces?|te?s?)\b', ur'\1onséquen\2'),
(ur'\b([cC]|[aA]utoc|[iI]nc|[sS]urc)onsomm?(ables?|abilité|er|ée?s?|es?|ai[st]|aient|a|ations?|ateurs?|atrices?|ations?)\b', ur'\1onsomm\2'),
(ur'\b(c|C)onsonn?[ae]n(?:c|ss?)e(s?)\b', ur'\1onsonance\2'),
(ur'\b(c|C)onstamm?[ae]nt\b', ur'\1onstamment'),
(ur'\b(C|c)ontr[oô]ll?(ent|er|ez|ons|es?|ée?s?|ait|aient|ais)\b', ur'\1ontrôl\2'),
(ur'\b(C|c)onvainc?t\b', ur'\1onvainc'),
(ur'\b([cC]|[rR]ec)onv[ae]n[cst]ion(s?)\b', ur'\1onvention\2'),
(ur'\b([cC]|[dD]éc|[rR]ec)onv[ae]n[cst]ion(els?|elles?|ée?s?|ellement|ements?)\b', ur'\1onventionn\2'),
(ur'\b(\-?[cCkK])orr?[eéèêë]e(n?s?)\b', ur'\1orée\2'),
(ur'\b(c|C)orr?ec[cst]ion(s?)\b', ur'\1orrection\2'),
(ur'\b(c|C)orr?espondan(te?s?|ces?)\b', ur'\1orrespondan\2'),
(ur'\b([Dd][eu]|[àÀ]|[aA]ux?) coté(s?)\b', ur'\1 côté\2'),
(ur'\b([cC]|[dD]éc|[eE])ourr?age(s?|ux?|uses?|ante?s?|usement)\b', ur'\1ourage\2'),
(ur'\b([cC]|[cC]onc)ourr?an(te?s?)\b', ur'\1ouran\2'),
(ur'\b(c|C)ourr?amm?[ae]nt\b', ur'\1ouramment'),
(ur'\b(c|C)ourr?onn?(es?|er|ements?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|eri?ons|eri?ez|eraient|eront|ant|ée?s?)\b', ur'\1ouronn\2'),
(ur'\b(c|C)ruautt?ée?(s?)\b', ur'\1ruauté\2'),
(ur'\b(c|C)upp?idd?itt?ée?(s?)\b', ur'\1upidité\2'),
(ur'\b(c|C)urr?iositt?ée?(s?)\b', ur'\1uriosité\2'),
(ur'\b(c|C)urr?icc?ull?um(s?)\b', ur'\1urriculum\2'),
],
},
'D': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type D ',
},
'replacements': [
(ur"\b(d|D)'ou\b", ur"\1'où"),
(ur'\b(d|D)ang[eéèê]rr?oss?itt?ée?(s?)\b', ur'\1angerosité\2'),
(ur'\b([dD]|[rR]ed)[éèe]ball?', ur'\1éball'),
(ur'\b([dD]é|[Ee]m)barr?as?\b', ur'\1barras'),
(ur'\b([dD]é|[Ee]m)barr?ass?(ée?s?|er|es?|ai[st]|aient|as?|at|ante?s?)\b', ur'\1barrass\2'),
(ur'\b([dD])[eéèêë][sc]h[eéèêë]t[eéèêë]rr?ie(s?)\b', ur'\1échèterie\2'),
(ur'\b([dD])[eéèêë][sc]h[eéèêë]tt[eéèêë]rr?ie(s?)\b', ur'\1échetterie\2'),
(ur'\b(d|D)[éèe]ff?[ea]nd', ur'\1éfend'),
(ur'\b([dD]|[aA]utod)[ée]ff?[ae]n([cçs]|ss)e(s?|ur?|use?|urs?|uses?)\b', ur'\1éfense\3'),
(ur'\b(d|D)[éeè]j[aà]\b', ur'\1éjà'),
(ur'\b(d|D)[éeè]je[uû]nn?er(s?)\b', ur'\1éjeuner\2'),
(ur'\b(d|D)[éeè]mm?i(?:ss?|c)ionn?([aâeéèio])', ur'\1émissionn\2'),
(ur'\b(d|D)en[cs]itt?ée?(s?)\b', ur'\1ensité\2'),
(ur'\b(d|D)[éèeêë]pp?ann?(age|er|ée?s?|ant|es?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|eri?ons|eri?ez|eraient)\b', ur'\1épann\2'),
(ur'\b(d|D)(é|e|è)rnn?i[éeà]rr?e\b', ur'\1ernière'),
(ur'\b(D|d)[éeè]s[éeè]sp[éeè]rr?[éeè]ment\b', ur'\1ésespérément'),
(ur'\b(D|d)[éeè]s(o?eu|œu)vr(ement|ée?s?)\b', ur'\1ésœuvr\3'),
(ur'\b(d|D)[éeè]sormai[st]\b', ur'\1ésormais'),
(ur'\b(d|D|Red|red)[eéè]ss?inn?(e\b|ent\b|e[rsz]|[oaièéâ])', ur'\1essin\2'),
(ur'\b(d|D)étéct(er|es?|ions?|eurs?|ives?|rices?)\b', ur'\1étect\2'),
(ur'\b(d|D)[éeè]tt?[eè]rmin', ur'\1étermin'),
(ur'\b(d|D)euxi(é|e)me(ment)?\b', ur'\1euxième\3'),
(ur'\b(d|D)[ée]vell?opp?(ai[st]|aient|er?|eurs?|ée?s?|ement)\b', ur'\1évelopp\2'),
(ur'\b(d|D)ic[cst]ionn?aire(s?)\b', ur'\1ictionnaire\2'),
(ur'\b([dD]|[iI]nd)iff?[eé]rr?[ae]n(ces?|te?s?|tiation|tielles?|tiels?|[ct]ier)\b', ur'\1ifféren\2'),
(ur'\b([dD]|[iI]nd)iff?[éeè]rr?[ae]mm?[ae]nt\b', ur'\1ifféremment'),
(ur'\b(d|D)iff?ic(ile|ilement)\b', ur'\1iffic\2'),
(ur'\b(d|D)iff?icultée?(s?)\b', ur'\1ifficulté\2'),
(ur'\b(d|D)ifus(ions?|er|es?|ée?s?|ant?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1iffus\2'),
(ur'\b(d|D)ignitt?ée?(s?)\b', ur'\1ignité\2'),
(ur'\b(d|D)ilemn?e(s?)\b', ur'\1ilemme\2'),
(ur'\b(d|D)ipp?l[oô]mm?(es?|ée?s?|er|ante?s?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|erait|eraient|eri?ons|eri?ez|eront)\b', ur'\1iplôm\2'),
(ur'\b([dD]|[iI]nd)irr?ectemm?ent\b', ur'\1irectement'),
(ur'\b([dD]|[bB]id|[cC]od|[oO]mnid|[uU]nid)irr?ection?(nels?|nelles?|s)\b', ur'\1irection\2'),
(ur'\b(d|D)iscour\b', ur'\1iscours'),
(ur'\b(d|D)iscution(s?)\b', ur'\1iscussion\2'),
(ur'\b(d|D)isponnib(les?|ilités?)\b', ur'\1isponib\2'),
(ur'\bdi(ss?|[cç])ua(ss|t)i(on|f|ive)\b', ur'dissuasi\3'),
(ur'\b(d|D)iverge?a?n([ct]es?)\b', ur'\1ivergen\2'),
(ur'\b(d|D)ixi[ée]me(ment)?\b', ur'\1ixième\2'),
(ur'\b([dD]|[dD]éd|[eE]nd)omm?ag(es?|ements?|ée?s?|er|as?|ai[st]|aient|eant|eables?)\b', ur'\1ommag\2'),
(ur'\b(d|D)onn?[ée]e(s?)\b', ur'\1onnée\2'),
(ur'\b(d|D)ouzes\b', ur'\1ouze'),
(ur'\b(d|D)û(e|s|es)\b', ur'\1u\2'),
(ur'\b(d|D)uctill?itt?ée?(s?)\b', ur'\1uctilité\2'),
(ur'\b(d|D)urr?ett?ée?(s?)\b', ur'\1ureté\2'),
],
},
'E': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type E ',
},
'replacements': [
(ur'\beb\b', ur'en'),
(ur'\b[ée]co?eu?rr?(ante?|ment|ée?s?|er?|ai[st]|aient|ent)\b', ur'écœur\1'),
(ur'\b[ÉE]co?eu?rr?(ante?|ment|ée?s?|er?|ai[st]|aient|ent)\b', ur'Écœur\1'),
(ur'\becoll?e(s?)\b', ur'école\1'),
(ur'\bEcoll?e(s?)\b', ur'École\1'),
(ur'\bEconomie(s?)\b', ur'Économie\1'),
(ur'\b[éeèê]cc?rit(s?|ures?|oires?|eaux?|es?)\b', ur'écrit\1'),
(ur'\b[éeèê]dit(ée?s?|er?|ai[st]|aient|ent|es|eurs?|rices?|ions?)\b', ur'édit\1'),
(ur'\b[ÉEÈÊ]dit(ée?s?|er?|ai[st]|aient|ent|es|eurs?|rices?|ions?)\b', ur'Édit\1'),
(ur'\b(e|E)ff?icacitt?ée?(s?)\b', ur'\1fficacité\2'),
(ur'\b[eé]gall?emm?ent\b', ur'également'),
(ur'\b[EÉ]gall?emm?ent\b', ur'Également'),
(ur'\b[ée]gall?itt?ée?(s?)\b', ur'égalité\1'),
(ur'\b[EÉ]gall?itt?ée?(s?)\b', ur'Égalité\1'),
(ur'\beglise(s?)\b', ur'église\1'),
(ur'\bEglise(s?)\b', ur'Église\1'),
(ur'\b(é|É|E)gout(s?)\b', ur'\1gout\2'),
(ur'\b(é|e)lectricitt?ée?(s?)\b', ur'\1lectricité\2'),
(ur'\b[éeè]l[éeè]ctron(s?)\b', ur'électron\1'),
(ur'\b[ÉE]l[ée]mm?ent(aires?|s?)\b', ur'Élément\1'),
(ur'\b[ée]l[ée]mm?ent(aires?|s?)\b', ur'élément\1'),
(ur'\belu(e?s?)\b', ur'élu\1'),
(ur'\bElu(e?s?)\b', ur'Élu\1'),
(ur'\b[Eeé]lys[eé]e(s?)\b', ur'Élysée\1'),
(ur'\b([eE]|[rR]é?e)mbal([^lu])', ur'\1mball\2'),
(ur'\b(e|E)mbarr?a(?:c|ss?)(er|ée?s?|ant|es?|i?ons|i?ez|ent|ai?s?|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1mbarrass\2'),
(ur'\b[EÉée]milie\b', ur'Émilie'),
(ur'\b(?:e|é)mm?i(?:c|ss?)ion(s?)\b', ur'émission\1'),
(ur'\b(?:É|E)mm?i(?:c|ss?)ion(s?)\b', ur'Émission\1'),
(ur'\bempire (R|r)omain\b', ur'Empire romain'),
(ur'\b(en|En)?cha(i|î)n(er|es?|[ae]nt|ée?s?|ements?)\b', ur'\1cha\2n\3'),
(ur'\b(e|E)ncc?orr?es?\b', ur'\1ncore'),
(ur'\b(e|E)ncourr?ag(ée?s?|er|ai[st]|aient|a|ements?|eante?|es?)\b', ur'\1ncourag\2'),
(ur'\b(e|E)ndomm?ag(er|ée?s?|eant|es?|i?ons|i?ez|ent|eai?s?|eaient|erai?s?|erait|eri?ons|eri?ez|eront|eraient)\b', ur'\1ndommag\2'),
(ur'\b(e|E)nemi(e?s?)\b', ur'\1nnemi\2'),
(ur'\b(e|E)[mn]ss?e[nm]ble\b', ur'\1nsemble'),
(ur'\b(e|E)ntitt?ée?(s?)\b', ur'\1ntité\2'),
(ur'\b(e|E)ntre[ -]autre\b', ur'\1ntre autres'),
(ur'\b(e|E)ntra(i|î)nn?(er?|[ae]nt|ée?s?|ements?|eurs?)\b', ur'\1ntra\2n\3'),
(ur'\b(e|E)nvirr?onn?(ements?|ementale?s?|ementaux|ementalis[mt]es?|ante?s?|er|ée?s?|ai?s?|ait|aient)\b', ur'\1nvironn\2'),
(ur'\bepisode(s?)\b', ur'épisode\1'),
(ur'\bEpisode(s?)\b', ur'Épisode\1'),
(ur'\bepoque(s?)\b', ur'époque\1'),
(ur'\bEpoque(s?)\b', ur'Époque\1'),
(ur'\bepou(x|ses?|ser|sai[st]|sa|saient|sé|ée?s?)\b', ur'épou\1'),
(ur'\bEpou(x|ses?|ser|sai[st]|sa|saient|sé|ée?s?)\b', ur'Épou\1'),
(ur'\bEquation(s?)\b', ur'Équation\1'),
(ur'\b[eé]quipp?e(s?)\b', ur'équipe\1'),
(ur'\b[EÉ]quipp?e(s?)\b', ur'Équipe\1'),
(ur'\b(e|E)rr?onn?é(e?s?)\b' ur'\1rroné\2'),
(ur'\b(e|E)sapce(s?)\b', ur'\1space\2'),
(ur'\b(e|E)ss?en([tscç]|ss)iell?emm?ent\b', ur'\1ssentiellement'),
(ur'\b(e|E)ss?en([tscç]|ss)iel(le?)\b', ur'\1ssentiel\3'),
(ur'\beta(i[st]|ient|nt)\b', ur'éta\1'),
(ur'\bEta(i[st]|ient|nt)\b', ur'Éta\1'),
(ur'\bEtampes\b', ur'Étampes'),
(ur'\bEtat(s?)\b', ur'État\1'),
(ur'\b[ée]tt?[eéèê]rnitt?ée?(s?)\b', ur'éternité\1'),
(ur'\b[EÉ]tt?[eéèê]rnitt?ée?(s?)\b', ur'Éternité\1'),
(ur'\b[EÉée]tienn?e\b', ur'Étienne'),
(ur'\betiologie(s?)\b', ur'étiologie\1'),
(ur'\bEtiologie(s?)\b', ur'Étiologie\1'),
(ur'\b[eé]tonn?amm?ent\b', ur'étonnamment'),
(ur'\b[EÉ]tonn?amm?ent\b', ur'Étonnamment'),
(ur'\b(e|é)tonn?emm?ent\b', ur'étonnement'),
(ur'\b[éèe]tre(s?)\b', ur'être\1'),
(ur'\b[EÉÈ]t(res?|es)\b', ur'Êt\1'),
(ur'\be(tud)', ur'é\1'),
(ur'\bE(tud)', ur'É\1'),
(ur'\b(é|É)thymologie\b', ur'\1tymologie'),
(ur'\bEth?ymologie\b', ur'Étymologie'),
(ur'\beth?ymologie\b', ur'étymologie'),
(ur'€uros?\b', ur'€'),
(ur'\b(e|E)uropp?[eé]{1,2}n(s?|nes?)\b', ur'\1uropéen\2'),
(ur'\b(é|e)ventuall?itt?ée?(s?)\b', ur'\1ventualité\2'),
(ur'\b[eé]ventuell?emm?ent\b', ur'éventuellement'),
(ur'\b[EÉ]ventuell?emm?ent\b', ur'Éventuellement'),
(ur'\b[eé]vid[aeé]mm?[ae]n[ts]?\b', ur'évidemment'),
(ur'\b[EÉ]vid[ae]mm?[aeé]n[ts]?\b', ur'Évidemment'),
(ur'\b(e|E)xep', ur'\1xcep'),
(ur'\b(e|E)xc?eptionn?e(ls?|lles?|llement)\b', ur'\1xceptionne\2'),
(ur'\b(e|E)xc?ell?(ents?|entes?|ences?|er|ée?s?|ai[st]|aient)\b', ur'\1xcell\2'),
(ur'\b(e|E)[cx]c?entricitt?ée?(s?)\b', ur'\1xcentricité\2'),
(ur'\b[EÈÉ]x[éeè]cut', ur'Exécut'),
(ur'\b[éèe]x[éeè]cut', ur'exécut'),
(ur'\b(e|E)xample(s?)\b(?<!(?:[fF]or|[aA]n)\s+(e|E)xample(s?))', ur'\1xemple\2'),
(ur'\b(e|E)xig(?:ea|a|e)nce(s?)\b', ur'\1xigence\2'),
(ur'\b(e|E)xig[ae]nte(s?)\b', ur'\1xigeante\2'),
(ur'\b([eE]|[cC]oe|[iI]ne)xist[ae]n[cs]e\b', ur'\1xistence'),
(ur'\b([eE]|[iI]ne)xpliquable(s?)\b', ur'\1xplicable\2'),
(ur'\b(e|E)xt[ae]n[st]ion(s?)\b', ur'\1xtension\2'),
(ur'\b(e|E)xtr[éèeê]me?ment\b', ur'\1xtrêmement'),
(ur'\b(e|E)xtr[éèeê]mitt?ée?(s?)\b', ur'\1xtrémité\2'),
(ur'(ré-?)?[eé]chantillonage', ur'\1échantillonnage'),
],
},
'F': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type F ',
},
'replacements': [
(ur'\b(f|F)acade(s?)\b', ur'\1açade\2'),
(ur'\b(f|F)acc?ultée?(s?)\b', ur'\1aculté\2'),
(ur'\b([vV]ous (ne )?(me )?(les? |la )?)faîtes\b', ur'\1faites'),
(ur'\b(f|F)a(sc?|cs?)inn?(ation|ante?s?|ée?s?|er|ai[st]|aient)\b', ur'\1ascin\3'),
(ur'\b(f|F)auss?ett?ée?(s?)\b', ur'\1ausseté\2'),
(ur'\b(f|F)[éèeê]conditt?ée?(s?)\b', ur'\1écondité\2'),
(ur'\b(f|F)[eéèê]rm[eéèê]tt?ée?(s?)\b', ur'\1ermeté\2'),
(ur'\b(f|F)ertill?itée?(s?)\b', ur'\1ertilité\2'),
(ur'\b(f|F)i[eéèê]rtée?(s?)\b', ur'\1ierté\2'),
(ur'\b(f|F)ill?iall?e(s?)\b', ur'\1iliale\2'),
(ur'\b(f|F)inn?all?emm?[ae]nt?\b', ur'\1inalement'),
(ur'\b(f|F)oeu?t(al|ales?|aux|us|ologies?)\b', ur'\1œt\2'),
(ur'\b([fF]|[dD]ysf|[Pp]lurif)onctio(nement|ner|née?s?|nai[st]|naient|naire(s?)|naliser|nalismes?|nalistes?|nariat|narisation|nels?|nelles?|nellement)\b', ur'\1onction\2'),
(ur'\b(f|F)onc[cst]ionn?aire(s?)\b', ur'\1onctionnaire\2'),
(ur'\b(f|F)onctionn?alitée?(s?)\b', ur'\1onctionnalité\2'),
(ur'\b(f|F)orc(e|é|è)mm?ents?\b', ur'\1orcément'),
(ur'\b(f|F)ragill?itt?ée?(s?)\b', ur'\1ragilité\2'),
(ur'\b(f|F)rancais(e?s?)\b', ur'\1rançais\2'),
(ur'\b(f|F)ratt?[eéèê]rnitée?(s?)\b', ur'\1raternité\2'),
(ur'\b(f|F)r[éeè]qu[eéèa]mm?[ae]nts?\b', ur'\1réquemment'),
(ur'\b(F|f)r[éêè]t(s?)\b', ur'\1ret\2'),
(ur'\b(f|F)rugalitt?ée?(s?)\b', ur'\1rugalité\2'),
(ur'\b([bdefpstBDEFPST])[uû]rr?ent\b', ur'\1urent'),
(ur'\b(f|F)usion(ée?s?|er|ai[st]|aient|ement)\b', ur'\1usionn\2'),
],
},
'G': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type G ',
},
'replacements': [
(ur'\b(G|g)allerie(s?)\b', ur'\1alerie\2'),
(ur'\b([gG])arcon((?:net?|ère)?s?)\b', ur'\1arçon\2'),
(ur'\b(G|g)azs\b', ur'\1az'),
(ur'\b(G|g)[éeè]nn?[éeè]rr?all?emm?ent\b', ur'\1énéralement'),
(ur'\b(G|g)enous\b', ur'\1enoux'),
(ur'\b(g|G)[eéèêë]stionn?aire(s?)\b', ur'\1estionnaire\2'),
(ur'\b(g|G)race ([aà]|aux?)\b', ur'\1râce \2'),
(ur'\b([Dd]isg|[Gg])r(?:â|a)(?:c|ss)i(er|ée?s?|ais?|as?)\b', ur'\1raci\2'),
(ur'\b([Uu]n|[Ll]e|[Pp]lus|[Ee]n|[Dd]u|[Tt]rop) grand nombres\b', ur'\1 grand nombre'),
],
},
'H': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type H ',
},
'replacements': [
(ur'\b(h|H)abb?ill?ett?ée?(s?)\b', ur'\1abileté\2'),
(ur'\b(h|H)amec', ur'\1ameç'),
(ur'\b(h|H)[eé]mm?orr?agie?(s?)\b', ur'\1émorragie\2'),
(ur'\b(h|H)éro \b', ur'\1éros '),
(ur'\b(h|H)ibous\b', ur'\1iboux'),
(ur'\b(h|H)uiti[ée]me(ment)?\b', ur'\1uitième\2'),
(ur'\b(h|H)[oô]mm?age(s?)\b', ur'\1ommage\2'),
(ur'\b([hH]|[dD]ésh)onn?eur(s?)\b', ur'\1onneur\2'),
(ur'\b([hH]|[dD]ésh)onnor(er|ée?s?|ai[st]|a|aient)\b', ur'\1onor\2'),
(ur'\b(h|H)opita(l|ux)\b', ur'\1ôpita\2'),
(ur'\b(h|H)ormi\b', ur'\1ormis'),
(ur'\b(h|H)otel(lerie?|ier?|ière?|s?)\b', ur'\1ôtel\2'),
(ur'\b(h|H)uits\b', ur'\1uit'),
(ur'\b(h|H)umm?ann?itt?ée?(s?)\b', ur'\1umanité\2'),
(ur'\b(h|H)umm?idd?itt?ée?(s?)\b', ur'\1umidité\2'),
(ur'\b(H|h)[iy]poth?[eéèêë]nuse\b', ur'\1ypoténuse'),
],
},
'I': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type I ',
},
'replacements': [
(ur'\b(I|i)çi\b', ur'\1ci'),
(ur'\b(I|i)mmaginaire\b', ur'\1maginaire'),
(ur'\b(I|i)mm?[eéè]diat(ement|e)?\b', ur'\1mmédiat\2'),
(ur'\b(I|i)mm?[eéè]diatemm?ent\b', ur'\1mmédiatement'),
(ur'\b(I|i)mm?en[sc](es?|ément)\b', ur'\1mmens\2'),
(ur'\b(i|I)mm?en[sc]itt?ée?(s?)\b', ur'\1mmensité\2'),
(ur'\b(I|i)mm?er[st]ion(s?)\b', ur'\1mmersion\2'),
(ur'\b(I|i)mm?ortall?i[sc](es?|er|a[in]t|ée?s?|ai?s?|aient)\b', ur'\1mmortalis\2'),
(ur'\b(i|I)mm?ortel(s?)\b', ur'\1mmortel\2'),
(ur'\b(I|i)[mn]pp?ecc?able(s|ment)\b', ur'\1mpeccable\2'),
(ur'\b(I|i)[mn]pp?éd[ae]nce(s?)\b', ur'\1mpédance\2'),
(ur'\b(I|i)[mn]pp?r[éeèê][cs]s?ionn?(abilités?|ables?|ante?s?|es?|er|ée?s?|ai?s?|ait|aient|ismes?|istes?)\b', ur'\1mpressionn\2'),
(ur'\b(i|I)nactivitt?ée?(s?)\b', ur'\1nactivité\2'),
(ur'\b(I|i)ncon?v[éeè]ni[ae]nt(s?)\b', ur'\1nconvénient\2'),
(ur'\b(I|i)nd[eé]p[ae]nd[ae]mm?ent\b', ur'\1ndépendamment'),
(ur'\b(i|I)ndemnitt?ée?(s?)\b', ur'\1ndemnité\2'),
(ur'\b(i|I)nf[éèeê]rr?iorr?itt?ée?(s?)\b', ur'\1nfériorité\2'),
(ur'\b(i|I)nflection(s?)\b', ur'\1nflexion\2'),
(ur'\b(I|i)nh?[eéè]rr?[ea]ns?((?:t|te|ce)s?)\b', ur'\1nhéren\2'),
(ur'\b(I|i)nn?itiall?(e|é|ement)\b', ur'\1nitial\2'),
(ur'\b(I|i)nn?on?cen(te?s?|ces?|ter|tée?s?|ai?s?|ait|aient)\b', ur'\1nnocen\2'),
(ur'\b(I|i)nov(ante?s?|er|ée?s?|ai?s?|ait|aient|ateurs?|atrices?|ations?)\b', ur'\1nnov\2'),
(ur'\b(I|i)nn?h?ond(ations?|ée?s?|ai?s?|a[in]t|aient|er?|ables?)\b', ur'\1nond\2'),
(ur'\b(I|i)nten(?:ss?|t)ionn?el(s?|les?|lement)?\b', ur'\1ntentionnel\2'),
(ur'\b(I|i|Dési|dési)nt[eé]rr?[éeêè](ssements?|sser|ssée?s?|ssante?s?|ai?s?|ait|ent)\b', ur'\1ntére\2'),
(ur'\b(I|i)nt[eé]rr?[éeêè]t(s?)\b', ur'\1ntérêt\2'),
(ur'\b(I|i)nt[eéèêë]rna(?:c|t|ss?)ionn?a(l|ux|lités?|lement|lisations?|liser|lisée?s?|lismes?)\b', ur'\1nternationa\2'),
(ur'\b(i|I)nt[eéèêë]rvall?e(s?)\b', ur'\1ntervalle\2'),
(ur'\b(i|I)ntr[eèé]pidit?ée?(s?)\b', ur'\1ntrépidité\2'),
(ur'\b(I|i)nfractus\b', ur'\1nfarctus'),
(ur'\b(I|i)nn?on?[cç]e(nce|mment|ntes?|nter|ntés?|nta|ntai[st]|ntaient|nts?)\b', ur'\1nnoce\2'),
(ur'\b(i|I)nvin[cs]ibb?ill?itt?ée?(s?)\b', ur'\1nvincibilité\2'),
(ur'\b(I|i)sraëlien(s?)\b', ur'\1sraélien\2'),
],
},
'J': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type J ',
},
'replacements': [
(ur'\b(j|J)amias\b', ur'\1amais'),
(ur'\b(j|J)oujous\b', ur'\1oujoux'),
(ur"\b([jJ])usqu(['’]) *[áaà]\b", ur'\1usqu\2à'),
(ur"\b([jJ])usqu´? *[áaà]\b", ur"\1usqu'à"),
(ur'\b([jJ])eu [Vv]id[ée]os?\b', ur'\1eu vidéo'),
(ur'\b([jJ])eux [Vv]id[ée]o(s)?\b', ur'\1eux vidéo\2'),
],
},
'K': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type K ',
},
'replacements': [
(ur'\bkeyn[eé]siann?isme\b', ur'keynésianisme'),
(ur'\b([kK])enyan(s?)\b', ur'\1ényan\2'),
(ur'\b([kK])enyan?ne(s?)\b', ur'\1ényane\2'),
],
},
'L': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type L ',
},
'replacements': [
(ur'\b(l|L)anguage(s?)\b', ur'\1angage\2'),
(ur'\b(l|L)attitude(s?)\b', ur'\1atitude\2'),
(ur'\b([lL])azer(s?)\b', ur'\1aser\2'),
(ur'\b(l|L)aquell?es?\b', ur'\1aquelle'),
(ur'\b(l|L)[eéèê][jg][eéèê]rr?ett?ée?(s?)\b', ur'\1égèreté\2'),
(ur'\b(l|L)esque(l|lle)\b', ur'\1esque\2s'),
(ur'\b(l|L)eque(l|lle)s\b', ur'\1esque\2s'),
(ur'\b(l|L)ibb?[eéèê]rtée?(s?)\b', ur'\1iberté\2'),
(ur'\b(l|L)itérature(s?)\b', ur'\1ittérature\2'),
(ur'\b(l|L)occ?all?itt?ée?(s?)\b', ur'\1ocalité\2'),
(ur'\b(l|L)oess\b', ur'\1œss'),
(ur'\b(l|L)ongu?eur(s?)\b', ur'\1ongueur\2'),
(ur'\b(l|L)u[iy]re?\b', ur'\1uire'),
(ur'\b(l|L)ycé(s?)\b', ur'\1ycée\2'),
],
},
'M': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type M ',
},
'replacements': [
(ur'\b(M|m)aintenn?[ae]n(s?|d?|t?s?)\b', ur'\1aintenan\2'),
(ur'\b(m|M)ajorr?itt?ée?(s?)\b', ur'\1ajorité\2'),
(ur'\b(M|m)algr[éè](s?)\b', ur'\1algré'),
(ur'\b(M|m)alh?eu?reu?(sement|x|se)\b', ur'\1alheureu\2'),
(ur'\b(M|m)all?ett?e(s?)\b', ur'\1allette\2'),
(ur'\b(m|M)anoeuvre(s?|r?)\b', ur'\1anœuvre\2'),
(ur'\bmarri(er|ée?s?)\b', ur'mari\1'),
(ur'\b([mMpP])att?ernitt?ée?(s?)\b', ur'\1aternité\2'),
(ur'\b(m|M)att?h?[éeèê]mm?att?ique(s?)\b', ur'\1athématique\2'),
(ur'\b(m|M)att?urr?itt?ée?(s?)\b', ur'\1aturité\2'),
(ur'\b([mM]ax|[mM]in)imas\b', ur'\1ima'),
(ur'\b(m|M)[eéèê]chan[cs]ett?ée?(s?)\b', ur'\1échanceté\2'),
(ur'\b(m|M)[eé]diterr?ann?ée?\b', ur'Méditerranée'),
(ur'\bm[eé]diterr?ann?ée?n(s?|ne?s?)\b', ur'méditerranéen\1'),
(ur'\b(m|M)[eéè]ga(lo)?p[oô]ll?e(s?)\b', ur'\1éga\2pole\3'),
(ur'\b([mMtT]oi|[eE]ux|[lL]ui|[nNvN]ous|[eE]lles?) m[êe]me(s?)\b', ur'\1-même\2'),
(ur'\b(m|M)emm?e(s?)\b', ur'\1ême\2'),
(ur'\b(m|M)[éeèêë]tt?h?od(es?|iques?|iquement)\b', ur'\1éthod\2'),
(ur'\b(m|M)[eèéêë]t[eèéêë]orologi(e?|ste?|que?)(s?)\b', ur'\1étéorologi\2\3'),
(ur'\b([aA]d|[cC]om|[cC]ompro|[dD]é|[éÉoO]|[eE]ntre|[pP]er|[pP]ro|[rR]éad|[rR]e|[rR]etrans|[sS]ou|[tT]rans)?me(tant|tre|trait|traient|te(s?)|tent|tiez|tions|tra(s?)|trai(s?)|tront)\b', ur'\1met\2'),
(ur'\b(m|M)illieu\b', ur'\1ilieu'),
(ur'\b(m|M)illitan(t(s?)|te(s?)|tisme|tiste(s?))\b', ur'\1ilitan\2'),
(ur'\b([mM]|[aA]ntim|[dD]ém)illita(ires?|risée?s?|irement|risation|risme)\b', ur'\1ilita\2'),
(ur'\b(M|m)ill?i?ardi?aire(s?)\b', ur'\1illiardaire\2'),
(ur'\b(M|m)ill?imm?[éeè]tre(s?)\b', ur'\1illimètre\2'),
(ur'\b(M|m)ill?i?onn?i?aire(s?)\b', ur'\1illionnaire\2'),
(ur'\b(m|M)insitre(s)?\b', ur'\1inistre\2'),
(ur'\b(m|M)inn?orr?itt?ée?(s?)\b', ur'\1inorité\2'),
(ur'\b(M|m)irroir(s?)\b', ur'\1iroir\2'),
(ur'\b(M|m)is(e?s?) a\b', ur'\1is\2 à'),
(ur'\b(m|M)odele\b', ur'\1odèle'),
(ur'\b(m|M)oeurs\b', ur'\1œurs'),
(ur'\b(m|M)oitt?iée?(s?)\b', ur'\1oitié\2'),
(ur'\b(m|M)onarchie de (J|j)uillet\b', ur'\1onarchie de Juillet'),
(ur'\b(M|m)onn?ol[yi]th?e(s?)\b', ur'\1onolithe\2'),
(ur'\b(M|m)ourrir\b', ur'\1ourir'),
(ur'\b[mM]oyen[ -][aAâÂäÄàÀ]ge\b', ur'Moyen Âge'),
(ur'\b(M|m)r(\.)?\b', ur'{{M.}}'),
(ur'\b(m|M)ulti[ -]?plates?(-?)forme(s?)\b', ur'\1ultiplate\2forme\3'),
(ur'\b(M|m)ünich(oise?s?)?\b', ur'\1unich\2'),
(ur'\b(m|M)unn?icipp?all?itt?ée?(s?)\b', ur'\1unicipalité\2'),
],
},
'N': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type N ',
},
'replacements': [
(ur'\b(n|N)a[ïîi]vett?ée?(s?)\b', ur'\1aïveté\2'),
(ur'\b(n|N)arr?a[ct]t?(eurs?|rices?|ions?|ifs?|ives?|ivement)\b', ur'\1arrat\2'),
(ur'\b(n|N)a[ct]ionn?all?itt?ée?(s?)\b', ur'\1ationalité\2'),
(ur'(n|N)avigateur(s?) +(i|I)nternet', ur'\1avigateur\2 Web'),
(ur'\b(n|N)[ée]a[mn]{1,2}oin(s?)\b', ur'\1éanmoins'),
(ur'\b(n|N)[éeè](c|ss?)[eéè](ss?|c)airr?(e(s?)|ement(s?))\b', ur'\1écessair\4'),
(ur'\b(n|N)égationis(m|t)e(s?)\b', ur'\1égationnis\2e\3'),
(ur'\b(n|N)eutrall?itt?ée?(s?)\b', ur'\1eutralité\2'),
(ur'\b(n|N)euvi[ée]me(ment)?\b', ur'\1euvième\2'),
(ur'\b(n|N)euveu\b', ur'\1eveu'),
(ur'\b(n|N)eu?veus\b', ur'\1eveux'),
(ur'\b(n|N)oeud(s?)\b', ur'\1œud\2'),
(ur'\b(n|N)ommination(s?)\b', ur'\1omination\2'),
(ur'\b([nN]|[dD]én|[iI]nn|[Pp]rén|[rR]en|[sS]urn)n?omm?(é(s?)|ée(s?)|er?|ément|able|a(s?)|ai[st]|aient)\b', ur'\1omm\2'),
(ur'\b([nN]|[aA]n|[pP]aran)ormall(e|ement|ité(s?)|ien(s?)|isateur(s)|isatrice(s?)|isation(s?)|iser|isée?(s?)|isai[ts]|isaient)\b', ur'\1ormal\2'),
(ur'\b(n|N)ott?[ae]mm?[ae]nt\b', ur'\1otamment'),
(ur'\b(n|N)our(ie?|issante?s?|ir|itures?|ices?|iciers?|icières?|issage|isseurs?|isseuses?|issons?|i[ts]|issent|issai[st])\b', ur'\1ourr\2'),
(ur'\b(n|N)ouv[eè]le(s?)\b', ur'\1ouvelle\2'),
],
},
'O': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type O ',
},
'replacements': [
(ur'\b(o|O)bscurr?itt?ée?(s?)\b', ur'\1bscurité\2'),
(ur'\b(o|O)btiend\b', ur'\1btient'),
(ur'\b(o|O)cc?asionn?(er|ée?s?|ai[st]|aient|ellement|els?|elles?)\b', ur'\1ccasionn\2'),
(ur'\b(o|O|préo|Préo|ino|Ino)cc?upp?(er?|ée?s?|ai[st]|aient|a|ant(e?|s?|tes?)|ations?|ationnel(le?|les?|s?))\b', ur'\1ccup\2'),
(ur'\b(o|O)cc?urr?[ae]n(c|ss?)e(s?)\b', ur'\1ccurrence\3'),
(ur'\b(oe|œ|oE)u?cc?umm?[eéèêë]nn?i(s[mt]es?|ques?)\b', ur'œcuméni\2'),
(ur'\b(Oe|Œ|OE)u?cc?umm?[eéèêë]nn?i(s[mt]es?|ques?)\b', ur'Œcuméni\2'),
(ur'\b(oe|œ|oE)dd?[eéèêë]mm?e(s?)\b', ur'œdème\2'),
(ur'\b(Oe|Œ|OE)dd?[eéèêë]mm?e(s?)\b', ur'Œdème\2'),
(ur'\bO[Ee]u?dipe\b', ur'Œdipe'),
(ur'\b(pré|post)?oeu?dip', ur'\1œdip'),
(ur'\bO[Ee]il', ur'Œil'),
(ur'\boeil', ur'œil'),
(ur'\b(oe|oE|œ)u?nn?oll?og([iu]es?|iques?)\b', ur'œnolog\2'),
(ur'\b(Oe|OE|Œ)u?nn?oll?og([iu]es?|iques?)\b', ur'Œnolog\2'),
(ur'\b(oe|oE|œ)u?[sz]ophage(s?)\b', ur'œsophage\2'),
(ur'\b(Oe|OE|Œ)u?[sz]ophage(s?)\b', ur'Œsophage\2'),
(ur'\b(oe|oE|œ)u?strog[eéèêë]nn?e(s?)\b', ur'œstrogène\2'),
(ur'\b(Oe|OE|Œ)u?strog[eéèêë]nn?e(s?)\b', ur'Œstrogène\2'),
(ur'\boeuvre(s?|r?)\b', ur'œuvre\1'),
(ur'\b(OE|Oe)uvre(s?|r?)\b', ur'Œuvre\2'),
(ur'\b(OE|Oe)uf(s?)\b', ur'Œuf\2'),
(ur'\boeuf(s?)\b', ur'œuf\1'),
(ur'\b(o|O)ff?[ae]n[cs]i(fs?|ves?|vement)\b', ur'\1ffensi\2'),
(ur'\b(o|O)ff?i(?:c|ss?)ie(ls?|lles?|ux|uses?|rs?)\b', ur'\1fficie\2'),
(ur'\b(o|O)nzes\b', ur'\1nze'),
(ur'\b(o|O|ino|Ino)pp?[éeè]rr?a[cst]s?ionn?(els?|elles?)\b', ur'\1pérationn\2'),
(ur'\b(o|O)pp?r?obre\b', ur'\1pprobre'),
],
},
'P': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type P ',
},
'replacements': [
(ur'\b(p|P)arr?aff?inn?(es?|ée?s?|ages?)\b', ur'\1araffin\2'),
(ur'\b([pP]|[aA]pp)arr?aiss?ants?\b', ur'\1araissant'),
(ur'\b([pP]|[aA]ntip)arr?all?[eéè]ll?e(s?|ment?)\b', ur'\1arallèle\2'),
(ur'\b([Pp]ara)ll?l[eéêè]ll?ogramm?e(s?)\b', ur'\1llélogramme\2'),
(ur'\b(p|P)arcour\b', ur'\1arcours'),
(ur'\b(p|P)arr?[ae]nth?[èéeêë]se(s?)\b', ur'\1arenthèse\2'),
(ur'\baprfois?\b', ur'parfois'),
(ur'\b(p|P)armi[es]\b', ur'\1armi'),
(ur'\b(p|P)arr?ainn?(s?|age|er?|ée?s?|a|ai[st]?|aient)\b', ur'\1arrain\2'),
(ur'\b(p|P)ar(c|t|ss?)ialitt?ée?(s?)\b', ur'\1artialité\3'),
(ur'\b(p|P)articc?ull?arr?itt?ée?(s?)\b', ur'\1articularité\2'),
(ur'\b(p|P)articc?ull?(ariser|arismes?|arités?|es?|iers?|ières?|ièrement)\b', ur'\1articul\2'),
(ur'\b(p|P)articc?ull?i[éeè]re(s?|ment)\b', ur'\1articulière\2'),
(ur'\b(p|P)artisant(s?)\b', ur'\1artisan\2'),
(ur'\b(p|P)auvrett?ée?(s?)\b', ur'\1auvreté\2'),
(ur'\b(p|P)[eéèêë]ll?err?i(ne?s?|nages?)\b', ur'\1èleri\2'),
(ur'\b(p|P)ersanne(s?)\b', ur'\1ersane\2'),
(ur'\b(p|P)ersonn?(ages?|alisations?|aliser|alisée?s?|alisas?|alisai[ts]|alisaient|alisme|alistes?|el?s?|elles?|ellement|ifications?|ifiée?s?|ifier|ifiait)\b', ur'\1ersonn\2'),
(ur'\b(p|P)ersonn?all?itée?(s?)\b', ur'\1ersonnalité\2'),
(ur'\b(p|P)h[iy]s[iy]que(s?)\b', ur'\1hysique\2'),
(ur'\b(p|P)i[eé]ce(s?)\b', ur'\1ièce\2'),
(ur'\b(p|P)l[éeè]bi[sc]{1,2}itt?(es?|ée?s?|er|ais?|ait|aient|as?|ant|aires?)\b', ur'\1lébiscit\2'),
(ur'\b(p|P)l[uû]s?part?s?\b', ur'\1lupart'),
(ur'\b(p|P)lusieur[te]?s?\b', ur'\1lusieurs'),
(ur'\b(p|P)o[êëeé]me(s?)\b', ur'\1oème\2'),
(ur'\b(p|P)oltique(s?)\b', ur'\1olitique\2'),
(ur'\b(p|P)oll?onn?ais(e?s?)\b', ur'\1olonais\2'),
(ur'\b(p|P)olution(s?)\b', ur'\1ollution\2'),
(ur'\b(p|P)ortugu?ais(e?s?)\b', ur'\1ortugais\2'),
(ur'\b(p|P)oss?[éeè]d(ante?s?|ée?s?|er)\b', ur'\1osséd\2'),
(ur'\b(p|P)oss?[éeè]de(n?t?)\b', ur'\1ossède\2'),
(ur'\b(p|P)oss?ibill?itée?(s?)\b', ur'\1ossibilité\2'),
(ur'\b(p|P)ost[éèeê]rr?itt?ée?(s?)\b', ur'\1ostérité\2'),
(ur'\b(p|P)our?(?:c|qu?)oi(s?)\b', ur'\1ourquoi'),
(ur'\b(p|P)lusieures\b', ur'\1lusieurs'),
(ur'\b(p|P)lutot\b', ur'\1lutôt'),
(ur'\b(p|P)ratiqu[ae]mm?ent\b', ur'\1ratiquement'),
(ur'\b(p|P)r[eéè][cs]{1,2}[éeè]d[aeé]mm?ent\b', ur'\1récédemment'),
(ur'\b(p|P)récept(s)\b', ur'\1récepte\2'),
(ur'\b(p|P)r[éeè]sent\b', ur'\1résent'),
(ur'\b(p|P)r[éêe]sid(a|e)nt(s?)\b', ur'\1résid\2nt\3'),
(ur'\b(p|P)remm?i[éeè]r?(res?|rement)\b', ur'\1remiè\2'),
(ur'\b(app|comp|dép|entrep|m?ép|p|réapp|rep|surp)r[éeêè]nn?(es?|ent)\b', ur'\1renn\2'),
(ur'\b(p|P)r[éeêè]s(?:qu|k)es?\b', ur'\1resque'),
(ur'\b(p|P)r[éeêè]t(er?|ée?s?|ai[st])\b', ur'\1rêt\2'),
(ur'\b(p|P)rin[sc]ipp?all?emm?[ae]nt\b', ur'\1rincipalement'),
(ur'\b(p|P)rocés\b', ur'\1rocès'),
(ur'\b(p|P)roff?ess?ionn?e(ls?|lles?|llement)\b', ur'\1rofessionne\2'),
(ur'\b(P|p)r?or?gramm?(ai?s?|es?|ée?s?|er|ations?|eurs?|euses?|atiques?|ant)', ur'\1rogramm\2'),
(ur'\b(p|P)rogr[eéè]s?\b', ur'\1rogrès'),
(ur'\b(p|P)roprett?ée?(s?)\b', ur'\1ropreté\2'),
(ur'\b(p|P)rosp[eéè]rr?itt?ée?(s?)\b', ur'\1rospérité\2'),
(ur'\b(p|P)roximm?itt?ée?(s?)\b', ur'\1roximité\2'),
(ur'\b(p|P)uiss?amm?[ae]nts?\b', ur'\1uissamment'),
],
},
'Q': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Q ',
},
'replacements': [
# (ur'\b(Q|q)uand (à|au|aux)\b', ur'\1uant \2'),
(ur'\b(q|Q)u?all?itt?ée?(s?)\b', ur'\1ualité\2'),
(ur'\b(q|Q)u?antitt?ée?(s?)\b', ur'\1uantité\2'),
(ur'\b(Q|q)uarantes\b', ur'\1uarante'),
(ur'\b(Q|q)uatorzes\b', ur'\1uatorze'),
(ur'\b(Q|q)uatres\b', ur'\1uatre'),
(ur'\b(Q|q)uatri[ée]me(ment)?\b', ur'\1uatrième\2'),
(ur'\b(q|Q)uébecois(es?)?\b', ur'\1uébécois\2'),
(ur'\b(q|Q)uelque soit le\b', ur'\1uel que soit le'),
(ur'\b(q|Q)uelque soit ([ls]a)\b', ur'\1uelle que soit \2'),
(ur'\b(Q|q)uestionn?airr?e(s?)\b', ur'\1uestionnaire\2'),
(ur'\b(Q|q)uinzes\b', ur'\1uinze'),
(ur'\b(Q|q)uitt?an[cs]e(s?)\b', ur'\1uittance\2'),
],
},
'R': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type R ',
},
'replacements': [
(ur'\b(r|R)accont((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|ables?|ars?)\b', ur'\1acont\2'),
(ur'\b(r|R)acc?our[cs](ie?s?|ir|issi?ons|issi?ez|issent|issant)\b', ur'\1accourc\2'),
(ur'\b(r|R)aff?inn?(er|ée?s?|ant|antes?|es?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|erait|eraient|eries?|ages?)\b', ur'\1affin\2'),
(ur'\b(r|R)ancoeur(s?)\b', ur'\1ancœur\2'),
(ur'\b(r|R)app?idemm?[ae]nt\b', ur'\1apidement'),
(ur'\b(r|R)arr?ett?ée?(s?)\b', ur'\1areté\2'),
(ur'\b([rR]|[iI]rr)ationn?(ellement|els?|elles?|ements?|er|ée?s?|a|ai[st]|aient)\b', ur'\1ationn\2'),
(ur'\b([rR]|[iI]rr)ationn?alité\b', ur'\1ationalité'),
(ur'\b([rR]|[iI]rr)[ée]alitt?ée?(s?)\b', ur'\1éalité\2'),
(ur'\b(r|R)ecc?ord?(s|mans?|men)?\b', ur'\1ecord\2'),
(ur'\b(r|R)ecu(e?s?)\b', ur'\1eçu\2'),
(ur'\b(r|R)[éeè]cc?urr?[ae]n(te?|ce)\b', ur'\1écurren\2'),
(ur'\b(r|R)[éeè][cs]{1,2}[aeéè]mm?ent\b', ur'\1écemment'),
(ur'\b(r|R)e(?:cc?|ss?)en(?:cc?|ss?)((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|ement)\b', ur'\1ecens\2'),
(ur'\b(r|R)[eé]{2}d.\b', ur'\1ééd.'),
(ur'\b(r|R)[eé]{2}ll?emm?ent\b', ur'\1éellement'),
(ur'\b(r|R)éflection(s?)\b', ur'\1éflexion\2'),
(ur'\b(r|R)efut?s?\b', ur'\1efus'),
(ur'\b(r|R)[eé]gl(ement(aire)?s?|es?)\b', ur'\1ègl\2'),
(ur'\b(r|R)[eè]gl(ables?|ages?|ée?s?|ement(ation|airement|er)|e[rt]s?|ettes?|eurs?|euses?|isse?|os?|oirs?|ures?)\b', ur'\1égl\2'),
(ur'\b([iI]mpr|[rR])[eé]gne(s|nt)\b', ur'\1ègne\2'),
(ur'\b([rR]|[iI]rr)[eéè]gull?i[eéè]rr?emm?[ae]nt\b', ur'\1égulièrement'),
(ur'\b(r|R)enouvell(er|ée?s?|a|ai[st]|aient)\b', ur'\1enouvel\2'),
(ur'\b(r|R)enouvell?emm?ent(s?)\b', ur'\1enouvellement\2'),
(ur'\b(r|R)epproch((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant)\b', ur'\1eproch\2'),
(ur'\b([rR]|[iI]rr)eponsable\b', ur'\1esponsable'),
(ur'\b(r|R)([éeèê])sonn?ance(s?)\b', ur'\1\2sonance\3'),
(ur'\b([rR]|[iI]rr)esponsabb?ill?itt?ée?(s?)\b', ur'\1esponsabilité\2'),
(ur'\b(r|R)(?:e|é|è)[sc]{1,2}u[sc]{1,2}it((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant)\b', ur'\1essuscit\2'),
(ur'\b(r|R)[eéè]ss?urr?ection(s?)\b', ur'\1ésurrection\2'),
(ur'\b(r|R)h?yth?m(es?|iques?|ée?s?)\b', ur'\1ythm\2'),
],
},
'S': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type S ',
},
'replacements': [
(ur'\b(s|S)agg?acitt?ée?(s?)\b', ur'\1agacité\2'),
(ur'\b(s|S)all?e?tt?ée?(s?)\b', ur'\1aleté\2'),
(ur'\b(s|S)a(ss?|c|t)i[éeè]tt?ée?(s?)\b', ur'\1atiété\3'),
(ur'\b(s|S)c?[éè]nariis?\b', ur'\1cénarios'),
(ur'\b([sS])c[eé]ne(s?)\b', ur'\1cène\2'),
(ur'\b(s|S)c?h[éeè]mat?(s?)\b', ur'\1chéma\2'),
(ur'\b(s|S)ien(ces?|tifiques?|tifiquement|tis[tm]es?)\b', ur'\1cien\2'),
(ur'\b(s|S)cult(eur|euse|rice)(s?)\b', ur'\1culpt\2\3'),
(ur'\b(s|S)[ée]chement\b', ur'\1èchement'),
(ur'\b(s|S)[e]ch(er|eresses?|eries?)\b', ur'\1éch\2'),
(ur'\b(s|S)[èe]ch(eurs?|euses?|oirs?)\b', ur'\1éch\2'),
(ur'\b(s|S)écc?urr?itt?ée?(s?)\b', ur'\1écurité\2'),
(ur'\b(s|S)ei[zs]es?\b', ur'\1eize'),
(ur'\b([sS]|[pP]rés)[éeè]lection?(s?|n(?:(?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|able|eu(?:r|se)s?))\b', ur'\1élection\2'),
(ur'\b(s|S)en[cs]ibb?ill?itt?ée?(s?)\b', ur'\1ensibilité\2'),
(ur'\b(s|S)[eéèê]pp?arr?[eéèê]mm?ent\b', ur'\1éparément'),
(ur'\b(s|S)epti[ée]me(ment)?\b', ur'\1eptième\2'),
(ur'\b(s|S)implicitt?ée?(s?)\b', ur'\1implicité\2'),
(ur'\b(s|S)imm?ultann?[éeè]mm?[ae]nt\b', ur'\1imultanément'),
(ur'\b(s|S)ixi[ée]me(ment)?\b', ur'\1ixième\2'),
(ur'\b(s|S)ociétt?ée?(s?)\b', ur'\1ociété\2'),
(ur'\b(s|S)oixantes\b', ur'\1oixante'),
(ur'\b(s|S)oeur(s?)\b', ur'\1œur\2'),
(ur'\b(s|S)oll?icitt?(er|ée?s?|ant|es?|i?ons|i?ez|ent|ai?s?|ait|aient|erai?s?|erait|eri?ons|eri?ez|eront|eraient|ations?|udes?|eurs?|euses?)\b', ur'\1ollicit\2'),
(ur'\b(s|S)oll?ution?(s?|n(?:(?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant))\b', ur'\1olution\2'),
(ur'\b(s|S)ous[ -]jacent(e?s?)\b', ur'\1ous-jacent\2'),
(ur'\b(s|S)outt?err?ain(s?)\b', ur'\1outerrain\2'),
(ur'\b(s|S)ouv[ae]nt?s?\b', ur'\1ouvent'),
(ur'\b(s|S)p[eéè][cs]iall?(es?|ement|ités?|is(?:(?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|ations?|tes?))?\b', ur'\1pécial\2'),
(ur'\b(s|S)péciall?itt?ée?(s?)\b', ur'\1pécialité\2'),
(ur'\b(s|S)p[eèé]ctacle(s?)\b', ur'\1pectacle\2'),
(ur'\b(s|S)tatu[st]?(?:-| +)quo\b', ur'\1tatu quo'),
(ur'\b(s|S)tatus\b', ur'\1tatut'),
(ur'\b(s|S)térr?ill?itt?ée?(s?)\b', ur'\1térilité\2'),
(ur'\b(s|S)to(c|qu)(ages?|ée?s?|er)\b', ur'\1tock\3'),
(ur'\b([sS]u|[oO])bjectivitt?ée?(s?)\b', ur'\1bjectivité\2'),
(ur'\b([sS]|[iI]ns)ucc[eé]s\b', ur'\1uccès'),
(ur'\b(s|S)ucc?int(e?s?|ement)\b', ur'\1uccinct\2'),
(ur'\b(s|S)ucc?ursall?e(s?)\b', ur'\1uccursale\2'),
(ur'\b([sS]|[iI]ns)uff?is[ae]mm?[ea]nts?\b', ur'\1uffisamment'),
(ur'\b([sS]|[iI]ns|[aA]utos)ufisant(e?s?)\b', ur'\1uffisant\2'),
(ur'\b([sS]|[iI]ns|[aA]utos)ufisance(s?)\b', ur'\1uffisance\2'),
(ur'\b(s|S)upp?érr?iorr?itt?ée?(s?)\b', ur'\1upériorité\2'),
(ur'\b(s|S)upp?ll?[eéè]mm?ent(s?|aires?)\b', ur'\1upplément\2'),
(ur'\b(s|S)upp?rimm?((?:er)?(?:a(?:s|i(?:s|t|ent)?)?|i?(?:ez|ons))|ass(?:es?|iez|ions)|â(?:mes|t|tes)|(?:èr|ass)?ent|(?:ée?|e)s?|er(?:ont)?|ant|able)\b', ur'\1upprim\2'),
(ur'\b(s|S)upp?ress?ion(s?)\b', ur'\1uppression\2'),
(ur'\b(s|S)uport', ur'\1upport'),
(ur'\b(s|S)u[cs]{2}eptib(les?|ilités?)\b', ur'\1usceptib\2'),
(ur'\b(s|S)u[èe]dois(es?)\b', ur'\1uédois\2'),
(ur'\b(s|S)yndrôme(s?)\b', ur'\1yndrome\2'),
(ur'\b([sS]|[aA]ntis)ymm?[éeèêë]tri(es?|ques?)\b', ur'\1ymétri\2'),
(ur'\b(s|S)ymptome(s?)\b', ur'\1ymptôme\2'),
(ur'\b(s|S)[iy]nth?axe(s?)\b', ur'\1yntaxe\2'),
(ur'\b(s|S)yst[êe]me(s?)\b', ur'\1ystème\2'),
],
},
'T': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type T ',
},
'replacements': [
(ur'\b(T|t)ch[eéê]que(s)?\b', ur'\1chèque\2'),
(ur'\b(T|t)err?itt?oirr?e(s?)\b', ur'\1erritoire\2'),
(ur'\b(T|t)h?[éeèê]ath?re(s?)\b', ur'\1héâtre\2'),
(ur'\b(T|t)h?[éeèê]orr?i(es?|ques?|quement|ciens?|ciennes?|ser|sée?s?|ses?|si?ons|si?ez|sent|sai?s?|sait|saient|serai?s?|serait|seraient|seront|seri?ons|seri?ez)\b', ur'\1héori\2'),
(ur'\b(t|T)imm?idd?itt?ée?(s?)\b', ur'\1imidité\2'),
(ur'\b(à|À|a[is]|a|ont|avai[st]|avi?ons|avi?ez|avaient|eu|avoir|en|pas) tord\b', ur'\1 tort'),
(ur'\b(T|t)otall?emm?ent\b', ur'\1otalement'),
(ur'\b(t|T)ott?all?itt?ée?(s?)\b', ur'\1otalité\2'),
(ur'\b(T|t)oujoure?s?\b', ur'\1oujours'),
(ur'\b(D|d)ans (T|t)ous le \b', ur'\1ans \2out le '),
(ur'\b(T|t)out les\b(?<!(?:[eE]n|[aA]vant)\s+(T|t)out les)', ur'\1ous les'),
(ur'\b(T|t)our?tefois?\b', ur'\1outefois'),
(ur'\b(T|t)raditionn?el(s?|les?|lement?)\b', ur'\1raditionnel\2'),
(ur'\b(T|t)raff+ic(s?)\b', ur'\1rafic\2'),
(ur'\b(t|T)ranqu?ill?itt?ée?(s?)\b', ur'\1ranquillité\2'),
(ur'\b(t|T)rave?au(s?|x?)\b', ur'\1ravaux'),
(ur'\b(T|t)rei[sz]es', ur'\1reize'),
(ur'\b(T|t)rentes\b', ur'\1rente'),
(ur'\b(T|t)rés\b', ur'\1rès'),
(ur'\b(T|t)roisi[ée]me(ment)?\b', ur'\1roisième\2'),
(ur'\b(T|t)rombonn?e(s?)\b', ur'\1rombone\2'),
(ur'\b(T|t)r[ou]mp(èt|ett?)e(s?)\b', ur'\1rompette\3'),
(ur'\b(T|t)roph[éêèëe]e\b', ur'\1rophée'),
],
},
'U': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type U ',
},
'replacements': [
(ur'\b(U|u)n esp[èeé]ce\b', ur'\1ne espèce'),
(ur'\b(u|U)nn?itt?ée?(s?)\b', ur'\1nité\2'),
(ur'\b(u|U)nn?iversitt?ée?(s?)\b', ur'\1niversité\2'),
(ur'\b(u|U)tt?ill?', ur'\1til'),
],
},
'V': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type V ',
},
'replacements': [
(ur'\b(v|V)ann?itt?ée?(s?)\b', ur'\1anité\2'),
(ur'\b(v|V)arr?iétt?ée?(s?)\b', ur'\1ariété\2'),
(ur'\b(v|V)ell?ourt?\b', ur'\1elours'),
(ur'\b(v|V)erball?emm?ent\b', ur'\1erbalement'),
(ur'\b([vV][éo])rr?acitt?ée?(s?)\b', ur'\1racité\2'),
(ur'\b([vV]|[rR]ev)[éeè]rr?iff?', ur'\1érif'),
(ur'\b(v|V)[eéèê]rr?itt?ée?(s?)\b', ur'\1érité\2'),
(ur'\b(V|v)[eéèêë]temm?ent(s?)\b', ur'\1êtement\2'),
(ur'\b(v|V)ioll?[ae]mm?ent\b', ur'\1iolemment'),
(ur'\b([vV])ision((?:er)?i?(?:ez|ons)|ée?s?|e(?:u?s(?:es?)?)?|(?:er)?a(?:i(?:ent|s|t))?|er(?:ai|as|ont)?|aires?|(?:èr)?ent|ant)\b', ur'\1isionn\2'),
(ur'\b(v|V)oeu(x?)\b', ur'\1œu\2'),
(ur'\b(v|V)(oe|œ)us\b', ur'\1œux'),
(ur'\b(v|V)oll?att?ill?itt?ée?(s?)\b', ur'\1olatilité\2'),
(ur'\b(v|V)oll?ontt?ée?(s?)\b', ur'\1olonté\2'),
(ur'\b(v|V)oll?ontiers?\b', ur'\1olontiers'),
(ur'\bvrais?sembl[a|e]ble(ment)?\b', ur'vraisemblable\1'),
(ur'\b(v|V)ulgarr?itt?ée?(s?)\b', ur'\1ulgarité\2'),
(ur'\b(v|V)is[ -][aà][ -]vis\b', ur'\1is-à-vis'),
],
},
'W': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type W ',
},
'replacements': [
(ur'\b(W|w)aggon(s?)\b', ur'\1agon\2'),
(ur'\b[Ww]hermacht\b', ur'Wehrmacht'),
(ur'\b[Ww]ermacht\b', ur'Wehrmacht'),
],
},
'X': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type X ',
},
'replacements': [
],
},
'Y': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Y ',
},
'replacements': [
(ur'\b[Yy][ée]men\b', ur'Yémen'),
],
},
'Z': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Z ',
},
'replacements': [
],
},
'Regles grammaticales': {
'regex': True,
'msg': {
'fr': u'Robot : Correction syntaxique de type Règles grammaticales ',
},
'replacements': [
(ur"\ba (n['’]|en )?avoir\b", ur'à \1avoir'),
(ur'\ba ([ns]e |en )?comparer\b', ur'à \1comparer'),
(ur'\ba ([mnst]e |[nv]ous |en )?comprendre\b', ur'à \1comprendre'),
(ur'\ba ([ns]e |en )?compter\b', ur'à \1compter'),
(ur'\ba ([ns]e |en |les? )?défendre\b', ur'à \1défendre'),
(ur'\ba ([ns]e |en )?définir\b', ur'à \1définir'),
(ur'\ba ([ns]e |en )?dire\b', ur'à \1dire'),
(ur"\ba (n['’]|en )?être\b", ur'à \1être'),
(ur'\ba ([ns]e |en )?faire\b', ur'à \1faire'),
(ur'\ba ([ns]e |en )?finir\b', ur'à \1finir'),
(ur'\ba ([ns]e |en )?jouer\b', ur'à \1jouer'),
(ur'\ba ([nms]e )?mettre\b', ur'à \1mettre'),
(ur"\ba (n['’])?obtenir\b", ur'à \1obtenir'),
(ur'\ba partir\b', ur'à partir'),
(ur'\ba ([ns]e |en )?placer\b', ur'à \1placer'),
(ur'\ba ([ns]e |en )?([a-zé]*)poser\b', ur'à \1\2poser'),
(ur'\ba ([ns]e |en |le |lui |les )?prendre\b', ur'à \1prendre'),
(ur'\ba ([ns]e |en )?produire\b', ur'à \1produire'),
(ur'\ba propos\b', ur'à propos'),
(ur'\ba ([ns]e |en )?remplacer\b', ur'à \1remplacer'),
(ur'\ba se\b', ur'à se'),
(ur'\ba ([ns]e |en |le |la |les )?(re|dé|main)?tenir\b', ur'à \1\2tenir'),
(ur"\ba (n['’]|en )?utiliser\b", ur'à \1utiliser'),
(ur'\ba ([ns]e |en )?vérifier\b', ur'à \1vérifier'),
(ur'\ba ([ns]e |en |sa|re|pré)?voir\b', ur'à \1voir'),
(ur'\b(c|C)omme convenu[est]s?\b', ur'\1omme convenu'),
(ur'\b(c|C)omme prévu[est]s?\b', ur'\1omme prévu'),
(ur"\b(e|E)n terme (d['’e])\b", ur'\1n termes \2'),
(ur'\b(i|I)l peuvent\b', ur'\1ls peuvent'),
(ur'\b(i|I)l veulent\b', ur'\1ls veulent'),
(ur'\b([Qq])ue ([AEIOUaeéèêiou])', ur"\1u'\2"),
(ur"\bs(e +son|['’]es)t?([ \w,()]{0,50})succ?[éèe]dé(?:s|es?)\b", ur's\1t\2succédé'),
],
'exceptions': {
'inside-tags': [
'nowiki',
'comment',
'math',
'source',
'pre',
],
}
},
'population': {
'regex': True,
'msg': {
'fr': ur'Robot : Travaux sur [[Catégorie:Infobox Subdivision administrative - Population non numérique]]',
},
'replacements': [
(ur'(date-?pop\s*=\s*)(\d+)\s*\.\s*(\d+)\s*\.\s*(\d+)', ur'\1\2/\3/\4'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d*)\s*<small>([^<]*)</small><br\s*\/>([^\|]*)', ur'\1\4\n| population notes = \3'),
(ur"(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d+)(\s|\.|'|,| )+(\d+)(\s+h(ab)?\.)?", ur'\1\4'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)env\.\s*(\d+)', ur'\1\3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d+)\s*\?+', ur'\1'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)\{\{formatnum:(\d*)\}\}', ur'\1\3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d*)\s*\<ref\>([^\<]*)\<\/ref\>', ur'\1\n| population notes = \3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)\{\{Unité\|(\d*)\|([^\}]*)\}\}', ur'\1\3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d*)\s*hab\.?\s*\((\d*)\)', ur'\1\n| année_pop = \3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)\{\{formatnum\:([^\}]*)\}\}', ur'\1\3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d+)\s*\((\d*)\)', ur'\1\n| année_pop = \3'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d+)\s*\(en \?\)', ur'\1'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)(env.)?\s*(\d+)?\s*(\d+)\s*\(estimation\s*(\d+)\)', ur'\1\4\6\n| date-sans= \6'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)(\?|x)+', ur'\1'),
#(ur'((habitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*)(\d+)?\s*(\d+)', ur'\1\3\4'),
(ur'Population (2\d{3})\s*=\s*(\d+)?\s*(\d+)', ur'population=\2\3\n|année_pop=\1'),
(ur'(([Hh]abitants|[Pp]opulal|[Ss]ans|[Pp]opulation|[Pp]op|[Pp]op-metropole)\s*=\s*\d*)\s*<small>([^<]*)</small>\s*(\d*[\s,\.]?\d*)', ur'\1\4\n| population notes = \3'),
],
},
'superficie': {
'regex': True,
'msg': {
'fr': ur'Robot : Travaux sur [[Catégorie:Infobox Subdivision administrative - Superficie non numérique]]',
},
'replacements': [
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*\d+)\.(\d{3}),(\d+)', ur'\1\3.\4'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*\d+)[\,\.](\d+)(\s*km[2²]?)?', ur'\1.\3'),
(ur"((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*\d+)[\s']?(\d+)(\s*km[2²]?)?", ur'\1\3'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*\d*)(\s*km[²2])?', ur'\1'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*)\?+', ur'\1'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*)(nc)', ur'\1'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*)\{\{formatnum\:([^\}]*)\}\}', ur'\1\3'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*\d*\.?\d*)\s*\<ref\>([^\<]*)\<\/ref\>', ur'\1\n|superficie notes=\3'),
(ur'((km²|[Ss]uperf|[Ss]upkm2|[Ss]uperficie)\s*=\s*)\{\{Unité\|((\d*)(\.)?(\d*))\|([^\}]*)\}\}', ur'\1\3'),
],
},
'blason': {
'regex': True,
'msg': {
'fr': ur'Robot : Travaux sur [[Catégorie:Infobox Subdivision administrative - Image mal codifiée]]',
},
'replacements': [
(ur'(([dD]rapeau|[Ii]mage|[Bb]lason)\s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:(defaut.svg)\s*\]\]', ur'\1\4'),
(ur'(([dD]rapeau|[Bb]lason)\s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:([^\|]*)\|([^\]]*)\]\]', ur'\1\4'),
#(ur'([Ii]mage \s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:([^\|\]]*)\|([^px]*)\|\d*px\|([^\]]*)\]\](\s*\|)', ur'\1\3\n|légende=\5\6'),
(ur'([Ii]mage \s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:([^\|\]]*)\|.*\|([^\]]*)\]\](\s*\|)', ur'\1\3\n|légende=\4\5'),
(ur'([Ii]mage \s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:([^\|\]]*)\|([^\]]*)\]\](\s*\|)', ur'\1\3\5'),
(ur'([Ii]mage \s*=\s*)\[\[([fF]ichier|[fF]ile|[iI]mage)\:([^\]]*)\]\]([^\|]*)(\s*\|)', ur'\1\3\n|légende=\4\5'),
(ur'([Bb]lason\s*=\s*([^\{]*))\{\{\!\}\}([^\|]*)', ur'\1\n'),
],
},
'syntaxe siecle': {
'regex': True,
'msg': {
'fr': ur'Robot : Travaux sur le second temps de [[Wikipédia:Bot/Requêtes/À faire périodiquement#Changer les liens vers les siècles par les modèles correspondants]]',
},
'replacements': [
(ur'\[\[([IVXCDM]*)e siècle\]\]', ur'{{\1e siècle}}'),
],
},
'modele date': {
'regex': True,
'msg': {
'fr': ur'Robot : Passage au modèle {{m|date}} pour les date configuré comme tel',
},
'replacements': [
(ur'\[\[(\d{1,2})\s(janvier|février|mars|avril|mai|juil|juillet|aout|août|septembre|novembre|décembre)\]\]\s\[\[(\d{4})\]\]', ur'{{date|\1|\2|\3}}'),
],
},
}