Wikipédia:Robôs/Pedidos de aprovação/Fluxbot

FluxbotEditar

pedidoediçõescontadorlogsblock userblock logflag logflag botSUL util

Operator: Xaosflux

Automatic or manually assisted: Automatic for long, explicit expressions; manual for general edits

Programming language(s): AWB

Function summary: HTML reparar Categoria:!Páginas com etiquetas HTML de autofechamento não válidas

Edit period(s) (e.g. continuous, daily, one time run): a few large runs (>300 edits/each); small recurring runs on-demand (weekly)

Edit rate requested: 4-10 edits per min

Already has a bot flag (Y/N): No

Function details: Fluxbot (Task 1) will clean up malformed HTML found on pages. I have recently cleaned the backlog from ~6000 pages to ~1700 pages by repairing templates. Most of the remaining is malformed html on individual pages. This bot will not edit "content" in any way, only the HTML tags. This bot is running on multiple projects (enwiki, rowiki, itwiki, eswiki, plwiki, nowiki, meta, commons, wikidata). This bot will require AWB "bot" access. As some of these pages may be in the Usuário Discussão: namespace, the bot flag will allow Fluxbot to use (nominornewtalk) to prevent triggering the new messages flag for editors. — xaosflux Talk 02h15min de 17 de novembro de 2016 (UTC)

DiscussionEditar

Here is an example of some of the edits that Fluxbot will make, made under my operator account example. Fluxbot will include a link to its task description (e.g. this nowiki edit: w:no:Special:Diff/16894518). — xaosflux Talk 02h24min de 17 de novembro de 2016 (UTC)
@Xaosflux: You may start the tests; please perform approximately 100 edits, no more than 5 edits per minute. Thanks, RadiX 03h04min de 17 de novembro de 2016 (UTC)
Thank you, will do. — xaosflux Talk 03h10min de 17 de novembro de 2016 (UTC)
@RadiX: will you please add Fluxbot to Wikipédia:AutoWikiBrowser/CheckPage for the test (does not need to be in the 'bots' section). These will be 100% supervised, and no user_talk: will be done without bot flag. — xaosflux Talk 03h13min de 17 de novembro de 2016 (UTC)
@Xaosflux: Added. On hold. RadiX 00h16min de 18 de novembro de 2016 (UTC)
  Indicação 100 trial edits. — xaosflux Talk 02h46min de 18 de novembro de 2016 (UTC)
@Xaosflux:How does de bot detects malformed HTML? Just regex? Alchimista Fala comigo! 15h24min de 18 de novembro de 2016 (UTC)
@Alchimista: The first round of detection is the special category, second round is by using insource: searches; third round is chasing known contributors (normally for someone who loaded a lot of mal-formed user signatures). The repairs are done with multiple regexes as well as static replacements. The static replacements are for very specific replacements where there is an extremely unlikely chance of false positive (these are the automated edits); the regex repairs have to be supervised as they hit a 5-10% false positive rate on pages that have complex errors. The complex error I clean up by hand, if it is a highly transcluded template or module I will use my editor account, for the rest I use an interactive session under the bot. — xaosflux Talk 16h11min de 18 de novembro de 2016 (UTC)

  Flag granted. This bot is already flagged in several other projects primarily for this task, and it is running good code here and on other wikis. RadiX 02h55min de 19 de novembro de 2016 (UTC)

@RadiX: O robô está fazendo mais de 6 edições por minuto, isso é contra as regars, eu contei 18 edições às 16h47min, e nas edições de teste eu contei 7 em um minuto, aí já dava para perceber que ele não tinha configurado o limite de edições. Outro ponto é que ele parece estar fazendo edições semiautomáticas, se fossem automáticas o número de edições por minuto seriam constante. E ainda que ele tivesse com o limite corretamente configurado eu sinceramente eu não teria aprovado esse robô, não temos regras explicitas que dizem isso mas na minha opinião nenhum robô deve fazer edições tão triviais, esse tipo de edição deve ser feita em conjunto com outras correções. Não faz diferença nenhuma para quem lê o artigo e não vai gerar nenhum problema se deixasse como está, se outros projetos permitem esse tipo de edição acho que é um erro deles e que não deveríamos replicar aqui. Em todo caso, o problema mesmo é o limite de edições, se ele não for capaz de manter a 6 por minuto deve ser bloqueado. Danilo.mac(discussão) 15h22min de 22 de novembro de 2016 (UTC)

Hello @RadiX: and @Danilo.mac:. I have reduced the edit rate per request. The request above did estimate this to be 4-10epm; but slowing is not a problem. The backlog has been reduced from the initial ~1700 pages to ~700 now (many by way of template corrections). While these edits appear trivial, they are anticipated to cause display issues for readers next year (see phab:T134423). For example a bad <big>Some text<big/> may result in the rest of the line being double-big, instead of turning off big. The sporadic edits are due to a few factors, sometimes many pages get parsed, but no corrections are made - leading to gaps; also most of the edits require manual approval to avoid false positives, so they are dependent on clicking save. As a concern has been raised as to this task's appropriateness, I am now suspending operations for at least 24 hours to give time for the approver to comment.xaosflux Talk 19h10min de 22 de novembro de 2016 (UTC)
@Xaosflux: Thank you for clarify and indicate the phab task, the edits seem very trivial and unnecessary without this explanation. It is ok for me go on with this task, limiting to 6 edits per minute.
Apenas para deixar registrado em português do que se trata, os developers estão desenvolvendo um parser HTML5, que vai transformar automaticamente código HTML4 em HTML5 e existem algumas tags que não serão convertidas corretamente, por isso essa correção é necessária. Danilo.mac(discussão) 03h53min de 23 de novembro de 2016 (UTC)
  •   Comentário A justificativa apresentada pelo Xaosflux deixa claro o motivo do time rate inconstante, e eu já está ciente disso, uma vez que se trata do mesmo script aprovado em outras wikis, com o mesmo objetivo. Além disso, há de se observar os horários de pico e o tráfego nos servidores, e os horários em que o limite de seis edições por minuto foram excedidos não são tão problemáticos. De qualquer modo, se ele não exceder o limite de seis edições por minuto, estabelecido na ptwiki para AWB, não vejo problemas em prosseguir com as operações. RadiX 19h13min de 23 de novembro de 2016 (UTC)