« Utilisateur:Crochet.david.bot/Scripts » : différence entre les versions
Contenu supprimé Contenu ajouté
mise à jour |
|||
Ligne 4 :
<source lang="bash">
#!/bin/bash
VERT="\\033[1;32m"
NORMAL="\\033[0;39m"
ROUGE="\\033[1;31m"
ROSE="\\033[1;35m"
BLEU="\\033[1;34m"
BLANC="\\033[0;02m"
BLANCLAIR="\\033[1;08m"
JAUNE="\\033[1;33m"
CYAN="\\033[1;36m"
function charge_et_decompresse {
wget --progress=dot:binary http://download.wikimedia.org/${1}wikiversity/latest/${1}wikiversity-latest-pages-articles.xml.bz2
mv -v ${1}wikiversity-latest-pages-articles.xml.bz2 ${1}-wikiversity-latest-pages-articles.xml.bz2
echo -e $JAUNE "Mise à jour de la langue $1" $NORAML
echo -e $JAUNE "décompression de l'archive de la langue $1" $NORMAL
bunzip2 -v $1-wikiversity-latest-pages-articles.xml.bz2
}
function decharge {
echo -e $VERT "suppression de l'xml de la langue $1" $NORMAL
rm -v $1-wikiversity-latest-pages-articles.xml
}
Ligne 22 ⟶ 30 :
fairelangue
for isolang in $existlang ; do
for namespace in
python interwiki.py -start:"${namespace}:" -lang:$isolang -skipfile:"file.skip"
done
Ligne 31 ⟶ 39 :
isolang='fr'
charge_et_decompresse $isolang
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
python replace.py -fix:syntaxechapitre -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml
decharge $isolang
Ligne 39 ⟶ 47 :
isolang='fr'
charge_et_decompresse $isolang
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
python replace.py -fix:syntaxelecon -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml
decharge $isolang
Ligne 45 ⟶ 53 :
function cosmetic {
for isolang in $existlang ; do
echo "execution de cosmetic_change.py pour la langue $isolang" python cosmetic_changes.py -lang:$isolang -start:!
done
}
Ligne 54 ⟶ 64 :
for isolang in $existlang ; do
charge_et_decompresse $isolang
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
python replace.py -fix:encodage -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml
decharge $isolang
done
}
function encodagemanu {
echo -e $ROSE "nom de la page AVEC son lien langue ?" $NORMAL
read page
python replace.py -fix:encodage -page:"$page"
}
Ligne 64 ⟶ 80 :
for isolang in $existlang ; do
charge_et_decompresse $isolang
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
python replace.py -fix:wikilien -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml
python replace.py -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml "[[:$isolang:" "[["
Ligne 74 ⟶ 90 :
done
}
function wikilienmanu {
echo -e $ROSE "nom de la page SANS son lien langue ?" $NORMAL
read page
echo -e $ROSE "code langue ?" $NORMAL
read isolang
python replace.py -fix:wikilien -page:"$page" -lang:"$isolang"
python replace.py -page:"$page" -lang:"$isolang" "[[:$isolang:" "[["
python replace.py -page:"$page" -lang:"$isolang" -regex "\[\[(n|q|wikt|w|s|b):$isolang:" "[[\1:"
python replace.py -page:"$page" -lang:"$isolang" -regex ":..:$isolang:" ":"
python replace.py -page:"$page" -lang:"$isolang" ":$isolang:" ":"
python replace.py -page:"$page" -lang:"$isolang" -regex "\[\[:(n|q|wikt|w|s|b):" "[[\1:"
}
function fairelangue {
echo -e $ROSE "Sur quel langue exécuter le programme parmi ?" $NORMAL
echo -e $BLEU "cs de el en es fi fr it ja pt ru" $NORMAL
echo -e $CYAN "all pour toutes" $NORMAL
read langue
if [ $langue = 'all' ] ;
Ligne 90 ⟶ 120 :
function typoauto {
isolang="fr"
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
bash typo-fr.sh
decharge $isolang
}
function interwikimanu {
python interwiki.py
}
function tabletowiki {
echo -e $ROSE "nom de la page avec son lien langue ?" $NORMAL
read page
python table2wiki.py $page
}
function typomanu {
fairelangue
for isolang in $existlang ; do
echo -e $ROUGE "execution de remplace.py pour la langue $isolang" $NORMAL
echo "Utilisation du regex [N] [y] ?"
read useregex
do
echo "regex du texte avant. Taper 'FiN' pour arrêter ce sous programme"
read avant
if [ $avant = 'FiN' ] ;
else
echo "regex du texte après"
read apres
if [ $useregex = 'y' ] ;
then
python replace.py -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml -regex "$avant" "$apres"
else
python replace.py -lang:$isolang -xml:$isolang-wikiversity-latest-pages-articles.xml "$avant" "$apres"
fi
fi
done
decharge $isolang
done
}
while true
Ligne 130 ⟶ 171 :
echo
echo "Les arguments possibles sont :"
echo " 1 : syntaxechapitre "
echo " 2 : syntaxelecon "
echo " 3 : wikilien : Transforme les wikiliens ou lien internet de façon correct"
echo " 4 : automatique : Effectue une vérification des liens interwiki"
echo " 5 : encodage : Transforme les code étendu en code UTF-8"
echo " 6 : cosmetic "
echo " 7 : mise à jour de pywikipediabot "
echo " 8 : correction suivant règle de typographie manuel"
echo " 9 : correction suivant règle de typographie automatique avec le fichier typo-fr.sh"
echo " 10 : interwiki manuel "
echo " 11 : encodage manuel "
echo " 12 : table -> wiki"
echo " 13 : correction des wikilien en manuel"
echo " 0 : fin"
read clavier
Ligne 149 ⟶ 195 :
7) svn up ;;
8) typomanu ;;
9) typoauto ;;
10) interwikimanu ;;
11) encodagemanu ;;
12) tabletowiki ;;
13) wikilienmanu ;;
0) exit 0 ;;
esac
sleep
done
</source>
Ligne 176 ⟶ 227 :
},
'replacements': [
(u'%2B',
(u'"', u'"'),
(u'&', u'&'),
(u'/', u'/'),
(u'<', u'<'),
(u'>', u'>'),
(u'|', u'|'),
(u'ƒ', u'ƒ'),
(u'„', u'„'),
(u'…', u'…'),
(u'†', u'†'),
(u'‡', u'‡'),
(u'ˆ', u'ˆ'),
(u'‰', u'‰'),
(u'Š', u'Š'),
(u'‹', u'‹'),
(u'Œ', u'Œ'),
(u'‘', u'‘'),
(u'’', u'’'),
(u'“', u'“'),
(u'”', u'”'),
(u'•', u'•'),
(u'–', u'–'),
(u'—', u'—'),
(u'˜', u'˜'),
(u'™', u'™'),
(u'š', u'š'),
(u'›', u'›'),
(u'œ', u'œ'),
(u'Ÿ', u'Ÿ'),
(u'¡', u'¡'),
(u'¢', u'¢'),
(u'£', u'£'),
(u'¤', u'¤'),
(u'¥', u'¥'),
(u'¦', u'¦'),
(u'§', u'§'),
(u'¨', u'¨'),
(u'©', u'©'),
(u'ª', u'ª'),
(u'«', u'«'),
(u'¬', u'¬'),
(u'­', u''),
(u'®', u'®'),
(u'¯', u'¯'),
(u'°', u'°'),
(u'±', u'±'),
(u'²', u'²'),
(u'³', u'³'),
(u'´', u'´'),
(u'µ', u'µ'),
(u'¶', u'¶'),
(u'·', u'·'),
(u'¸', u'¸'),
(u'¹', u'¹'),
(u'º', u'º'),
(u'»', u'»'),
(u'¼', u'¼'),
(u'½', u'½'),
(u'¾', u'¾'),
(u'¿', u'¿'),
(u'À', u'À'),
(u'Á', u'Á'),
(u'Â', u'Â'),
(u'Ã', u'Ã'),
(u'Ä', u'Ä'),
(u'Å', u'Å'),
(u'Æ', u'Æ'),
(u'Ç', u'Ç'),
(u'È', u'È'),
(u'É', u'É'),
(u'Ê', u'Ê'),
(u'Ë', u'Ë'),
(u'Ì', u'Ì'),
(u'Í', u'Í'),
(u'Î', u'Î'),
(u'Ï', u'Ï'),
(u'Ð', u'Ð'),
(u'Ñ', u'Ñ'),
(u'Ò', u'Ò'),
(u'Ó', u'Ó'),
(u'Ô', u'Ô'),
(u'Õ', u'Õ'),
(u'Ö', u'Ö'),
(u'×', u'×'),
(u'Ø', u'Ø'),
(u'Ù', u'Ù'),
(u'Ú', u'Ú'),
(u'Û', u'Û'),
(u'Ü', u'Ü'),
(u'Ý', u'Ý'),
(u'Þ', u'Þ'),
(u'ß', u'ß'),
(u'à', u'à'),
(u'á', u'á'),
(u'â', u'â'),
(u'ã', u'ã'),
(u'ä', u'ä'),
(u'å', u'å'),
(u'æ', u'æ'),
(u'ç', u'ç'),
(u'è', u'è'),
(u'é', u'é'),
(u'ê', u'ê'),
(u'ë', u'ë'),
(u'ì', u'ì'),
(u'í', u'í'),
(u'î', u'î'),
(u'ï', u'ï'),
(u'ð', u'ð'),
(u'ñ', u'ñ'),
(u'ò', u'ò'),
(u'ó', u'ó'),
(u'ô', u'ô'),
(u'õ', u'õ'),
(u'ö', u'ö'),
(u'÷', u'÷'),
(u'ø', u'ø'),
(u'ù', u'ù'),
(u'ú', u'ú'),
(u'û', u'û'),
(u'ü', u'ü'),
(u'ý', u'ý'),
(u'þ', u'þ'),
(u'ÿ', u'ÿ'),
# Caractères latins accentués
(u'%C3%84', u'Ä'),
Ligne 206 ⟶ 382 :
(u'%C5%82', u'ł'),
(u'%C5%99', u'ř'),
# Caractères cyrilliques
(u'%D0%A1', u'С'),
(u'%D0%B0', u'а'),
(u'%D0%B2', u'в'),
(u'%D0%B4', u'д'),
(u'%D0%B5', u'е'),
(u'%D0%B8', u'и'),
(u'%D0%BA', u'к'),
(u'%D0%BB', u'л'),
(u'%D0%BD', u'н'),
(u'%D0%BE', u'о'),
(u'%D0%BF', u'п'),
(u'%D1%81', u'с'),
(u'%D1%82', u'т'),
(u'%D1%83', u'у'),
(u'%D1%85', u'х'),
(u'%D1%8B', u'ы'),
(u'%D1%91', u'ё'),
#caractères japonais
(u'あ', u'あ'),
Ligne 218 ⟶ 412 :
(u'お', u'お'),
(u'か', u'か'),
(u'が', u'が'),
(u'き', u'き'),
(u'ぎ', u'ぎ'),
(u'く', u'く'),
(u'ぐ', u'ぐ'),
(u'け', u'け'),
(u'げ', u'げ'),
(u'こ', u'こ'),
(u'ご', u'ご'),
(u'さ', u'さ'),
(u'ざ', u'ざ'),
(u'し', u'し'),
(u'じ', u'じ'),
(u'す', u'す'),
(u'ず', u'ず'),
(u'せ', u'せ'),
(u'ぜ', u'ぜ'),
(u'そ', u'そ'),
(u'ぞ', u'ぞ'),
(u'た', u'た'),
(u'だ', u'だ'),
(u'ち', u'ち'),
(u'ぢ', u'ぢ'),
(u'つ', u'つ'),
(u'づ', u'づ'),
(u'て', u'て'),
(u'で', u'で'),
(u'と', u'と'),
(u'ど', u'ど'),
(u'な', u'な'),
(u'に', u'に'),
(u'ぬ', u'ぬ'),
(u'ね', u'ね'),
(u'の', u'の'),
(u'は', u'は'),
(u'ば', u'ば'),
(u'ぱ', u'ぱ'),
(u'ひ', u'ひ'),
(u'び', u'び'),
(u'ぴ', u'ぴ'),
(u'ふ', u'ふ'),
(u'ぶ', u'ぶ'),
(u'ぷ', u'ぷ'),
(u'へ', u'へ'),
(u'べ', u'べ'),
(u'ぺ', u'ぺ'),
(u'ほ', u'ほ'),
(u'ぼ', u'ぼ'),
(u'ぽ', u'ぽ'),
(u'ま', u'ま'),
(u'み', u'み'),
(u'む', u'む'),
(u'め', u'め'),
(u'も', u'も'),
(u'や', u'や'),
(u'ゆ', u'ゆ'),
(u'よ', u'よ'),
(u'ら', u'ら'),
(u'り', u'り'),
(u'る', u'る'),
(u'れ', u'れ'),
(u'ろ', u'ろ'),
(u'わ', u'わ'),
(u'ゐ', u'ゐ'),
(u'ゑ', u'ゑ'),
(u'を', u'を'),
(u'ん', u'ん'),
(u'ゔ', u'ゔ'),
#Entités HTML : lettres grecques
(u'α', u'α'),
(u'Α', u'Α'),
Ligne 263 ⟶ 516 :
(u'ζ', u'ζ'),
(u'Ζ', u'Ζ'),
# #Entités HTML : autres caractères
(u'Ç', u'Ç'),
(u'ç', u'ç'),
#Symboles
(u'&
(u'&
(u'&
(u'&
(u'&
(u'Æ', u'Æ'),
(u'æ', u'æ'),
(u'à', u'à'),
(u'À', u'À'),
(u'&', u'&'),
(u'Å', u'Å'),
(u'å', u'å'),
(u'Ã', u'Ã'),
(u'ã', u'ã'),
(u'Ä', u'Ä'),
(u'ä', u'ä'),
(u'¦', u'¦'),
(u'&
(u'&
(u'ç', u'ç'),
(u'¸', u'¸'),
(u'¢', u'¢'),
(u'©', u'©'),
(u'&
(u'°', u'°'),
(u'&
(u'&
(u'&
(u'&
(u'ê', u'ê'),
(u'È', u'È'),
(u'è', u'è'),
(u'Ð', u'Ð'),
(u'ð', u'ð'),
(u'Ë', u'Ë'),
(u'ë', u'ë'),
(u'½', u'½'),
(u'¼', u'¼'),
(u'¾', u'¾'),
(u'¾', u'¾'),
# (u'≥', u''),
(u'>', u'>'),
(u'Í', u'Í'),
(u'í', u'í'),
(u'Î', u'Î'),
(u'î', u'î'),
(u'¡', u'¡'),
(u'Ì', u'Ì'),
(u'ì', u'ì'),
(u'¿', u'¿'),
(u'Ï', u'Ï'),
(u'ï', u'ï'),
(u'«', u'«'),
# (u'≤', u''),
(u'<', u'<'),
(u'µ', u'µ'),
(u'·', u'·'),
# (u'&
(u'&
(u'Ñ', u'Ñ'),
(u'ñ', u'ñ'),
(u'Ó', u'Ó'),
(u'ó', u'ó'),
(u'ô', u'ô'),
(u'Œ', u'Œ'),
(u'œ', u'œ'),
(u'Ò', u'Ò'),
(u'ò', u'ò'),
(u'ª', u'ª'),
(u'º', u'º'),
(u'Ø', u'Ø'),
(u'ø', u'ø'),
(u'Õ', u'Õ'),
(u'õ', u'õ'),
(u'Ö', u'Ö'),
(u'ö', u'ö'),
(u'¶', u'¶'),
(u'±', u'±'),
(u'£', u'£'),
(u'"', u'"'),
(u'»', u'»'),
(u'&
(u'&
(u'&
(u'&
(u'&
(u'ß', u'ß'),
(u'Þ', u'Þ'),
(u'þ', u'þ'),
(u'˜', u'˜'),
(u'×', u'×'),
(u'™', u'™'),
(u'ú', u'ú'),
(u'Û', u'Û'),
(u'û', u'û'),
(u'Ù', u'Ù'),
(u'ù', u'ù'),
(u'¨', u'¨'),
(u'Ü', u'Ü'),
(u'ü', u'ü'),
(u'Ý', u'Ý'),
(u'ý', u'ý'),
(u'¥', u'¥'),
(u'ÿ', u'ÿ'),
# (u'', u''),
],
Ligne 322 ⟶ 652 :
(r'\[http://meta.wikimedia.org/wiki/([^\s\]]+)\s([^\]]+)\]', r'[[meta:\1|\2]]'),
(r'\[http://meta.wikimedia.org/wiki/(\S+)\s?\]', r'[[meta:\1]]'),
(r'\[http://www.mediawiki.org/wiki/([^\s\]]+)\s([^\]]+)\]', r'[[mw:\1|\2]]'),
(r'\[http://www.mediawiki.org/wiki/(\S+)\s?\]', r'[[mw:\1]]'),
(r'\[http://commons.wikimedia.org/wiki/([^\s\]]+)\s([^\]]+)\]', r'[[commons:\1|\2]]'),
(r'\[http://commons.wikimedia.org/wiki/(\S+)\s?\]', r'[[commons:\1]]'),
(r'\[http://wikimediafoundation.org/wiki/([^\s\]]+)\s([^\]]+)\]', r'[[Foundation:\1|\2]]'),
(r'\[http://wikimediafoundation.org/wiki/(\S+)\s?\]', r'[[Foundation:\1]]'),
(r'\[http://upload.wikimedia.org/(
(r'\[http://upload.wikimedia.org/(
(r'\[\[[Ww]ikipedia:([^\]]+)\]\]',
(r'\[\[[Ww]ikisource:([^\]]+)\]\]',
(r'\[\[[Ww]ikibooks:([^\]]+)\]\]',
(r'\[\[[Ww]ikinews:([^\]]+)\]\]',
(r'\[\[[Ww]ikiquote:([^\]]+)\]\]',
(r'\[\[[Ww]iktionary:([^\]]+)\]\]',
(r'\[http://(..).wikiversity.org/w/index.php\?title=([^\s\?\&]+)\s([^\]]+)\]', r'[[:\1:\2|\3]]'),
],
'exceptions': {
Ligne 379 ⟶ 712 :
],
},
}
</source>
|