Wikipédia:Esplanada/propostas/Eliminação de centenas de páginas de botânica criadas indevidamente (25mar2023)

Eliminação de centenas de páginas de botânica criadas indevidamente (25mar2023)

Categoria:Acer e muitas outras categorias de gêneros botânicos foram populadas totalmente por um bot. O banco de dados usado originalmente foi o defunto Zipcodezoo. Quase todas as páginas do Zipcodezoo morreram sem serem arquivadas; já houveram algumas ondas de remoção de links mortos da wiki. Cada item naquele site foi transformado em um esboço idêntico, a não ser pelo nome da espécie mencionada. Resultado: centenas de páginas para cultivares, variedades, etc. sem notabilidade própria, que deviam ser fundidos na página da espécie-mãe. Por exemplo, somente a espécie Acer campestre possui as seguintes "páginas-sombra", que a acompanham sem acrescentar uma vírgula de informação útil:

O horror, o horror

Além do grande número de esboços clone, todas essas páginas vêm com uma "bibliografia-fantasma" copiada e colada, ou seja, uma lista enorme de livros e ligações externas que, na grande maioria dos casos, NÃO MENCIONAM a espécie em questão. Pior que página sem fontes é uma página que lista "fontes" que só vão desperdiçar o tempo do leitor que for atrás delas, dando um falso ar de confiabilidade ao verbete.

WP:TAXO (proposta por mim, é preciso mencionar, justamente visando estabelecer normas pra corrigir esse tipo de página) tem ligações-exemplo pra páginas de espécies que listam subespécies, cultivares etc. sem precisar de centenas de clones para isso.

Arrumei centenas de páginas do tipo em outros gêneros como Acaena, principalmente fundindo sinônimos sob a forma de subespécies nominotípicas, mas vendo a escala do problema, senti necessidade de escrever na esplanada pois 1. Não acho bom precedente eliminar centenas de páginas tornando-as redirects sem antes perguntar à comunidade, mesmo que ao meu ver sejam eliminações totalmente incontroversas, e 2. É muita coisa, e eu não aguento mais fazer isso sozinho. Nomear cada página para eliminação, separadamente, seria um trabalho desnecessário ao meu ver, e facilmente passaria dos limites semanais das modalidades.

Não sei quantos gêneros foram afetados por essa onda de criações. Os gêneros parecem ter sido selecionados em ordem alfabética, então é jogo começar procurando pela letra A. Fora Acaena (consertado manualmente), sei de Categoria:Acer, Categoria:Alchemilla e Categoria:Acalypha.

Peço/proponho que as páginas de variedades intraespecíficas (subespécies, variedades, formas, cultivares, basicamente tudo abaixo do rank de espécie, e.g. todas as páginas na categoria que tenham mais do que duas palavras no nome) sejam eliminadas, se possível mantendo redirecionamentos à espécie-mãe, caso não seja muito difícil de automatizar. Caso aceito, também seria bom desligar as páginas tornadas redirects de seus itens no Wikidata (ver discussão). Caso não seja possível automatizar o processo de eliminar essas páginas, procuro ao menos um consenso positivo antes de continuar a eliminá-las por redireção manualmente. Sou da opinião de que vale a pena manter as páginas de espécies, mesmo que estejam em sua maioria no estado de esboços mínimos, pois essas podem ser melhoradas e eventualmente se transformarem em artigos úteis, ao contrário de páginas duplicadas e cultivares que em muitos casos não possuem uma única menção na Internet depois da morte do Zipcodezoo.

Edit: Avisando 79a e Yanguas por estarem frequentemente envolvidos na eliminação de páginas de discussão após fusões de duplicatas mencionadas acima. Convido o resto da comunidade a opinar.

YuriNikolai (discussão) 06h58min de 25 de março de 2023 (UTC)[responder]

Concordo com a transformação em redirect de taxons sub-especificos que não tenham mais informação, raramente serão notaveis. Mas não concordo com a remoção do link para o Wikidata. Pode-se marcar no Wikidata que aqueles são redirects intencionais. É algo que eu tenho feito em famílias e géneros de anfíbios monotípicos. Ajuda bastante para saber que páginas faltam na Wikipédia em português através de queries. GoEThe (discussão) 19h49min de 25 de março de 2023 (UTC)[responder]
Não sabia dessa possibilidade! Risquei a linha que pede a remoção das ligações. YuriNikolai (discussão) 19h55min de 26 de março de 2023 (UTC)[responder]

Subscrevo o Goethe. JMagalhães (discussão) 00h32min de 27 de março de 2023 (UTC)[responder]

Fiz uma listagem dos artigos criados pelo FMTbot entre maio e novembro de 2010 (26757 artigos !?) e filtrei para os artigos cujos títulos incluem mais do que duas palavras (indicativo de ser sobre variedades ou subespécies. Inclui também espécies resultantes de hibridação natural, denotadas pela presença do "x" no nome. Talvez deva retirar essas da lista . Resultado, 3544 páginas (atualização, sem espécies híbridas são 3445 pág.). Muitas destas já estão redirecionadas (activando o gadget "Highlight Redirects", consegue-se visualizá-los a verde), mas não sei como retirar estas da lista. GoEThe (discussão) 14h42min de 27 de março de 2023 (UTC)[responder]

Retirei também espécies com nomes do género Aloe 'Snow White'. Nova contagem: 3159. GoEThe (discussão) 09h42min de 28 de março de 2023 (UTC)[responder]
Faltou o link: User:GoEThe/zipcodezoo. GoEThe (discussão) 14h48min de 27 de março de 2023 (UTC)[responder]
Como marcar um redirecionamento como intencional no wikidata: d:Wikidata:Sitelinks to redirects. GoEThe (discussão) 09h28min de 28 de março de 2023 (UTC)[responder]
@GoEThe: Acho que as espécies com nomes entre aspas (como a Aloe 'Snow White' por exemplo), sendo cultivares, poderiam ir na lista sim. É a menor diferença mensurável entre duas populações, muito menos relevante do que subespécies, e a grande maioria delas possui menos ou nenhuma fonte, por não serem registradas pelos bancos de dados que costumamos usar. YuriNikolai (discussão) 22h19min de 28 de março de 2023 (UTC)[responder]
Repus a edição anterior com os cultivars. GoEThe (discussão) 14h30min de 29 de março de 2023 (UTC)[responder]
Eu também tenho feito trabalho a referenciar os artigo, tem bastantes que necessitam atualização, e a informação no Wikidata é importante até porque se atualiza lá primeiro se é um sinónimo. Seria um caso de fazer uma lista para avaliar caso a caso, visto que necessita de revisão e a informação estava correta e agora necessita revisão. Dbastro (discussão) 14h39min de 30 de março de 2023 (UTC)[responder]

Tenho um script preparado para redirecionar todas as páginas identificadas. Se não houver nada contra, faço-o correr. GoEThe (discussão) 12h37min de 31 de março de 2023 (UTC)[responder]

Todas as páginas foram redirecionadas para a espécie ou género correspondente. GoEThe (discussão) 12h04min de 3 de abril de 2023 (UTC)[responder]
GoEThe Obrigada! YuriNikolai, eu e o Yanguas não fommos "avisados", pois a predefinição só avisa quando tem uma assinatura na mesma edição, o que não aconteceu no caso. Sds -- Sete de Nove msg 12h13min de 3 de abril de 2023 (UTC)[responder]
79a Olá, perdão! Não sabia desse detalhe sobre a pred., no futuro vou me certificar de aplicá-la corretamente. Espero que não tenha afetado o resultado da discussão, pessoalmente concordo 100% com a passagem do script. Agradecendo também ao GoEThe pela automação dos redirects! YuriNikolai (discussão) 12h45min de 5 de abril de 2023 (UTC)[responder]
Seria possível usar a mesma lista em um script ou semi-bot para marcar todos os itens remanescentes do Wikidata cmo redirects intencionais? YuriNikolai (discussão) 12h49min de 5 de abril de 2023 (UTC)[responder]
Não sei. Vou investigar. GoEThe (discussão) 12h57min de 5 de abril de 2023 (UTC)[responder]
Encontrei uma maneira usando o d:Wikidata:Tools/WikibaseJS-cli. O mais difícil foi gerar a lista de items correspondentes aos artigos direcionados. Não encontrei uma maneira directa. GoEThe (discussão) 15h36min de 14 de abril de 2023 (UTC)[responder]