Discussion Projet:Restauration des ancres brisées
De Wikipedia, l'encyclopédie encyclopedia
déplacé depuis la page Wikipédia:Bot/Requêtes
Chers robots,
Je souhaiterais avoir une liste des liens vers des paragraphes incorrects. Je suis persuadé qu'il y en a plein et il serait bon de les corriger.
Exemple : Wikipédia:Bot/Requêtes#Bon redirect vers Jésus est correct mais pas Wikipédia:Bot/Requêtes#Redirect vers Jésus.
Est-ce qu'un dresseur aurait le temps de faire ça ?
Merci à+ Plyd /!\ 27 mai 2006 à 23:12 (CEST)
- Pas simple, je vais voir ce que je peux faire. Il y aura probablement des cas mal gérés mais rarement utilisé du style == <math>formule</math>== - phe 29 mai 2006 à 11:37 (CEST)
- Merci. Je n'ai pas eu le temps de me plonger dans les bots, donc je peux pas trop t'aider. Sinon, il ne faut pas non plus oublier les #redirect [[Article#Mauvais titre de paragraphe]], même si ils n'ont aucun effet. Plyd /!\ 29 mai 2006 à 15:26 (CEST)
- J'ai fait un premier jet, mais c'est pas vraiment exploitable, 400Ko user:phe/test13 (pour l'instant j'ai fait l'impasse sur les redirects). S'il y en autant c'est que je considére des liens invalides alors qu'ils sont valides, du genre [[#.C3.A9l.C3.A8ve|élève]], j'ai bien envie de continuer à les considerer comme invalide pour pouvoir les corriger avec le forme que je trouve plus correcte [[#elève|élève]], il va falloir faire ces corrections via un bot car il y en trop. Il y a aussi des tas de petits problèmes, par exemple des gens utilisent <span id="foo">foo</span> (font id="" et d'autres variantes sont aussi utilisées) pour créer les liens sans créer de titres de section, je vais probablement les ignorer en blacklistant ces pages. Une fois que ce sera exploitable il faudra probablement créer un projet mis à jour à chaque dump pour gérer tout ça. - phe 30 mai 2006 à 12:21 (CEST)
- Pfff c plus compliqué que je pensais ^^. Ya pas déjà de bot qui tourne pour transformer les liens UTF8 .C3.A9 -> é .C3.A8 -> è etc. ? Plyd /!\ 30 mai 2006 à 13:19 (CEST)
- Non, il va falloir que j'écrive un bot spécifique pour faire les remplacements, c'est un peu compliqué par le fait qu'une partie du lien peut être quoté de façon différente, typiquement [[p%C3%A8re#m.C3.A8re]] et qu'en dehors de ce contexte les % et . sont interprété différement. - phe 30 mai 2006 à 13:42 (CEST)
- Pfff c plus compliqué que je pensais ^^. Ya pas déjà de bot qui tourne pour transformer les liens UTF8 .C3.A9 -> é .C3.A8 -> è etc. ? Plyd /!\ 30 mai 2006 à 13:19 (CEST)
- J'ai fait un premier jet, mais c'est pas vraiment exploitable, 400Ko user:phe/test13 (pour l'instant j'ai fait l'impasse sur les redirects). S'il y en autant c'est que je considére des liens invalides alors qu'ils sont valides, du genre [[#.C3.A9l.C3.A8ve|élève]], j'ai bien envie de continuer à les considerer comme invalide pour pouvoir les corriger avec le forme que je trouve plus correcte [[#elève|élève]], il va falloir faire ces corrections via un bot car il y en trop. Il y a aussi des tas de petits problèmes, par exemple des gens utilisent <span id="foo">foo</span> (font id="" et d'autres variantes sont aussi utilisées) pour créer les liens sans créer de titres de section, je vais probablement les ignorer en blacklistant ces pages. Une fois que ce sera exploitable il faudra probablement créer un projet mis à jour à chaque dump pour gérer tout ça. - phe 30 mai 2006 à 12:21 (CEST)
- Merci. Je n'ai pas eu le temps de me plonger dans les bots, donc je peux pas trop t'aider. Sinon, il ne faut pas non plus oublier les #redirect [[Article#Mauvais titre de paragraphe]], même si ils n'ont aucun effet. Plyd /!\ 29 mai 2006 à 15:26 (CEST)
Même un s/(\%|\.)C3(\%|\.)A8/é/g sans regarder si on est dans un lien ou pas ça pose pb ? ah oui. pour les liens externes :)
Bon j'ai pas d'autres idées... :/ Plyd /!\ 30 mai 2006 à 13:59 (CEST)
- et ça n'a pas l'air comme ça mais t'en a presque 5000 des liens erronés ^^ à la main ça va être tendu. Plyd /!\ 30 mai 2006 à 14:19 (CEST)
- Pas seulement un pb de lien externe, mais ausi d'entrer toutes les expressions régulières. J'ai écrit un bot qui qui normalise les liens mais je crois que je vais devoir surveiller chaque remplacement, ça m'étonnerai pas de trouver des cas particulier ou le bot casse des trucs ([[http://%C3...]] ?) dans le code wiki. - phe 30 mai 2006 à 16:09 (CEST)
- Je ne sais pas comment tu t'es débrouillé mais en tous cas, ça a l'air d'avoir bien marché :) Plus que 3600 ! Plyd /!\ 31 mai 2006 à 11:06 (CEST)
- maintenant 3322 :D. Pour la normalisation des liens le bot a fait le boulot, un peu fastidieux à faire fois car il faut surveiller toutes les modifs, les itérations suivantes devraient trouver beaucoup moins de pages à modifier. Je ne vais pas tarder à ouvrir le projet. hummmm, « projet:Ancre brisée » ou « projet:Restauration des ancres brisées » ? - phe 31 mai 2006 à 13:35 (CEST)
- err, 3322 mais je fais encore l'impasse sur les redirect - phe 31 mai 2006 à 13:38 (CEST)
- maintenant 3322 :D. Pour la normalisation des liens le bot a fait le boulot, un peu fastidieux à faire fois car il faut surveiller toutes les modifs, les itérations suivantes devraient trouver beaucoup moins de pages à modifier. Je ne vais pas tarder à ouvrir le projet. hummmm, « projet:Ancre brisée » ou « projet:Restauration des ancres brisées » ? - phe 31 mai 2006 à 13:35 (CEST)
- Je ne sais pas comment tu t'es débrouillé mais en tous cas, ça a l'air d'avoir bien marché :) Plus que 3600 ! Plyd /!\ 31 mai 2006 à 11:06 (CEST)
- Pas seulement un pb de lien externe, mais ausi d'entrer toutes les expressions régulières. J'ai écrit un bot qui qui normalise les liens mais je crois que je vais devoir surveiller chaque remplacement, ça m'étonnerai pas de trouver des cas particulier ou le bot casse des trucs ([[http://%C3...]] ?) dans le code wiki. - phe 30 mai 2006 à 16:09 (CEST)