Wikipédia:Esplanada/propostas/Artigos de qualidade um ou dois (12fev2011)

Proponho criarmos uma categoria para artigos de "qualidade 1 ou 2".

Pela escala de qualidade, artigos sem fontes tem qualidade 1 ou 2, nunca mais que isso. Seria possível criarmos uma cat para esses artigos (artigos com qualidade 1 ou 2) marcada por um bot (sem link externo, sem ref, sem seções relacionadas), de modo que eles fiquem separados do resto?

Isso vai ajudar no trabalho manual, pois já sabemos q esses artigos realmente não tem fonte, e já vemos os artigos pensando (é 1 ou 2), sendo mais rápido determinar a qualidade (será só ver o tamanho do artigo). E ao menos fala mais informações que "qualidade desconhecida".

Rjclaudio msg 16h10min de 12 de fevereiro de 2011 (UTC)

Mas eles já não são categorizados nas páginas de discussão, através da predefinições de avaliação? Flávio, o Maddox (msg!contrib) 19h02min de 12 de fevereiro de 2011 (UTC)

Sim, mas queria que aceitasse colocar |qualidade=1-2 (qualidade 1 ou 2) e fazer a cat nessa nova categoria. Essa separação é importante como falei acima, pelo menos pra mim q prefiro avaliar 50 artigos que tem grandes chances de ter qualidade 3 pra cima, que avaliar 500 artigos de qualidade 1 ou 2. Do jeito atual nem tenho vontade de avaliar pq a maioria é tudo 1 ou 2. Rjclaudio msg 19h16min de 12 de fevereiro de 2011 (UTC)

Concordo para qualidade 1. Um bot pode marcar todos arigos com menos de X bytes com qualidade 1, mas para saber se é 2 não depende só do tamanho e das marcações de sem-fontes ou esboço, é preciso verificar o nível wikificação, se o assunto exige caixa de informação, se não existe outros problemas, não é algo que um bot possa analizar. E também, se fosse qualidade "1 ou 2" complicaria as já complicadas tarefas dos wikiprojetos. Marcar todas qualidades 1 já ajudaria bastante. Danilo.mac(discussão) 19h42min de 12 de fevereiro de 2011 (UTC)
concordo para qualidade 1, neutro para qualidade 2. O que seria avaliado para deixar um artigo na qualidade 2? OTAVIO1981 (discussão) 12h48min de 14 de fevereiro de 2011 (UTC)

Proposta 1. Já q não dá pra preencher com "1 ou 2" pq pode causar confusão, um bot poderia produzir uma lista de artigos que tem a marca x e que não tem fonte, para alguém do projeto fazer a avaliação manualmente? Ex, tenho interesse em música, e quero fazer a avaliação. Primeiro pediria pra um bot fazer essa lista e depois passava pelos artigos fazendo a avaliação. É um modo de separar o trabalho. Seria como cruzar os artigos da cat "qualidade desconhecida" + "sem fontes"

Proposta 2. Pra qualidade 2 há uma opção pros bots: se o artigo não tem fonte, não importa o tamanho ele não pode ter qualidade maior que 2, certo? O critério para passar de 2 para 3 é ter verificabilidade. Então o bot pode fazer a avaliação para artigos com mais de x bytes (não pode ser pouco para não ter dúvidas) e que não tenham fontes (nenhuma url, nem ref, nem seção relacionada, só pra ter certeza) e colocar a qualidade 2.

Rjclaudio msg 12h58min de 14 de fevereiro de 2011 (UTC)

  • Na verdade, se um artigo não tem fontes, ele não deveria ser nem qualidade 2... Há uma inversão de valores quando um esboço referenciado é "1" e um artigo extenso sem referências é "2". A possibilidade do segundo ser pior é consideravelmente maior. Flávio, o Maddox (msg!contrib) 13h10min de 14 de fevereiro de 2011 (UTC)

Segundo a escala Wikipédia:Versão 1.0/Avaliação q foi mt discutida, "1- Reservado aos artigos esboçados não referenciados. 2- Reservados aos artigos extensos não referenciados." Então sim, sem fonte pode ser 1 ou 2, dependendo da quantidade de conteúdo. Se essa escala está perfeita ou não já é outro assunto, e pela extensão daquela discussão é algo q nem quero pensar. Rjclaudio msg 13h14min de 14 de fevereiro de 2011 (UTC)

De fato a escala não é perfeita e a intenção era tirar do 1 artigos com algum potencial para serem melhorados. Se é informativo, apresentando seções, boa formatação, wikificação e conteúdo já é um ponto de partida para trabalhar. Na qualidade 1 este artigo ficaria com muitos outros sem condição alguma de serem amplicados. Um esboço referenciado também é 2 por acaso. Importante ressaltar também que as classificações de projeto são para uso interno da wikipédia do que ainda precisa ser melhorado para chegar a algum lugar, e não refletem necessariamente a condição ideal do artigo.OTAVIO1981 (discussão) 13h31min de 14 de fevereiro de 2011 (UTC)
A respeito das propostas, concordo com as duas. OTAVIO1981 (discussão) 13h31min de 14 de fevereiro de 2011 (UTC)
Da mesma página, sobre "qualidade 2": Geralmente possui mais de um extenso parágrafo, podendo ou não conter alguma(s) seção(ões). Com ou sem imagem, está formatado e referenciado. Conteúdo pouco trabalhado, porém objetivo e informativo, passa mais afluentes e uma ou outra especificidade. Por isso, discordo da proposta 2.
Flávio, o Maddox (msg!contrib) 13h42min de 14 de fevereiro de 2011 (UTC)
São dois tipos de artigos que tem qualidade 2. Ou esboço referenciado, ou artigo desenvolvido não referenciado. Não é apenas esboço referenciado, é um ou outro. Assim como na qualidade 1, ou é mínimo ou é esboço não referenciado. A edição que você fez mudou o sentido do critério.
Na seção generalidades diz "Como princípios da Wikipédia, a imparcialidade e a verificabilidade, enquanto critérios avaliativos, reduzem a qualificação dos artigos diante do método de escolha.". Ou seja, o esboço se tiver ref é qualidade 2, se não tiver é qualidade 1. Se o artigo é maior q esboço e tem ref é qualidade 3, se não tiver é qualidade 2. A falta de ref diminui a qualidade em 1, não força a qualidade para 1.
Na coluna critérios de avaliação: 2.1 "Este desqualificou-se em um nível devido a sua falta de verificabilidade." (grande sem WP:V) 2.2 "Com ou sem imagem, está formatado e referenciado." (esboço com WP:V).
Na coluna Para o editor: "Edição substancial é necessária e muitas informações devem ser adicionadas ou referenciadas. Pode apresentar a ausência de caixa de informação e certos moldes de wikificação, que não os básicos, como categoria. Para os artigos extensos, (ou seja, a partir daqui é para os extensos sem WP:V, antes era para esboços com alguma WP:V) providenciar referências ainda ausentes."
A própria discussão da escala diz isso, se bem me lembro quando participei. Só não vou procurar onde está.
Rjclaudio msg 14h06min de 14 de fevereiro de 2011 (UTC)
Veja também os dois exemplos dados para qualidade 2: Zoltán Magyar é esboço referenciado e Hot Wheels AcceleRacers está bem desenvolvido e sem referências. Vai me dizer que os usuários que fizeram a escala erraram na hora de colocar o exemplo? É mais fácil pensar q sua interpretação está errada. Rjclaudio msg 14h15min de 14 de fevereiro de 2011 (UTC)
Sobre as propostas: A lista gerada por bots só deve ser usada quando quando não existe outra forma, pois ela precisará ser frequentemente atualizada. Para gerar lista dos artigos marcados por um projeto e que têm marca de sem-fontes pode-se usar o CatScan. Para gerar lista de todos artigos sem fontes com mais de X bytes pode-se adicionar na {{sem-fontes}} um código usando {{PAGESIZE:{{PAGENAME}}}} para colocar os artigos maiores que X bytes numa categoria "!Artigos grandes sem fontes". Danilo.mac(discussão) 14h43min de 14 de fevereiro de 2011 (UTC)
Diante do exposto pelo Rjclaudio, entendo que os usuários que fizeram a escala erraram. Não na hora de colocar o exemplo, mas ao relativizar WP:CITE. Isso, entretanto, abordarei numa outra proposta, com o objetivo de modificar essa escala de avaliação.
O que está sendo discutido aqui é a categorização automática como "qualidade 1" e "qualidade 2". Como os critérios para o primeiro grupo estão mais definidos, já que os "2" podem ou não ter referências, Symbol support vote.svg continuo concordando apenas com a automatização do primeiro grupo, dentro do definido também pro grupo 2. Flávio, o Maddox (msg!contrib) 15h35min de 14 de fevereiro de 2011 (UTC)
  • Symbol question.svg Pergunta Artigos mínimos, mesmo com uma ou duas referências, são considerados sempre "de qualidade 1", certo? Flávio, o Maddox (msg!contrib) 14h27min de 25 de fevereiro de 2011 (UTC)
Sim. Mínimo sempre 1, independente de WP:V. Rjclaudio msg 14h44min de 25 de fevereiro de 2011 (UTC)
Perfeito. O que seria preciso pra ocorrer automação pra qualidade 1? Flávio, o Maddox (msg!contrib) 14h53min de 25 de fevereiro de 2011 (UTC)
Foi criada uma cat para artigos grandes sem fontes com essa discussão. Podemos criar tb uma cat para artigos pequenos sem fontes. E depois um bot passar por lá e colocar as marcas. A cat ajudaria tb na manutenção da WP:V (no projeto manutenção fizeram uma lista de artigos pequenos sem fontes, a cat seria mais eficiente)
Pelo oq vi, mts artigos grandes com a {{sem-fontes}} deveriam estar marcados com a {{mais notas}}. É importante separar os casos de artigos sem fonte alguma (possivel candidato a eliminação) e artigos que tem algumas informações sem fontes. Sugiro trocar a categorização da predef para Categoria:!Artigos que carecem de notas de rodapé qnd estiver sendo usada para apenas uma seção, usando o campo equivalente para isso. E um bot passar pelos afluentes preenchendo esse campo qnd a predef não estiver no topo do artigo, ou mudando para a {{mais notas}} qnd estiver no topo mas o artigo tiver seção de referências.
Rjclaudio msg 15h53min de 25 de fevereiro de 2011 (UTC)
Concordo também com esse ponto... Houve uma explosão de {{sem-fontes}} nos últimos tempos - talvez relacionada à popularização do FastButtons - e, se há ao menos um trecho referenciado, caberia, na verdade, a {{Mais notas}}.
No mais, o que achas que automatizar como "de qualidade 2" todos os artigos que tenham a marcação de esboço? Seguiria com os critérios de avaliação, que determinam que, se um artigo é 3, essa marcação tem que ser removida.
Flávio, o Maddox (msg!contrib) 16h13min de 25 de fevereiro de 2011 (UTC)
O FastButtons poderia verificar se há {{referências}} (e redirects), se tiver ao invés de adicionar a sem-fontes adiciona a mais-notas. Tem como fazer isso? Acho q dá, já q ele verifica se tem {{ER}} antes de adicionar, pra não ficar 2 tags, então daria pra verificar as refs.
Esboço sem ref é 1, esboço com ref é 2. Se fizer essa distinção concordo.
Rjclaudio msg 16h30min de 25 de fevereiro de 2011 (UTC)
Não são só as referências que separam os esboços de qualidade 1 e 2, tem que levar em conta também a wikificação e o tamanho do artigo.
O FastButtons só coloca sem-fontes no topo do artigo, nunca vi ninguém colocar sem-fontes no topo de artigos que já têm referências, mas se isso acontece seria melhor simplesmente desativar o botão sem-fontes quando a página tiver referências, pois já existe o botão "mais notas".
Concordo com passar o bot em todos artigos que tem sem-fontes em seção para preencher o parâmetro.
Danilo.mac(discussão) 17h50min de 25 de fevereiro de 2011 (UTC)
Pode não ser só as refs, mas ao menos sabemos q se não tiver ref não será qualidade 2, correto? E se não tiver wikificação não será qualidade 2 tb, não é? Ou seja, artigos pequenos com {{Sem-fontes}} e/ou {{Wikificação}} devem estar com qualidade 1. Alguma outra predef relacionada? Ao menos pra qualidade 1 teremos bastante.
Tem como fazer uma cat extra (uma só) pra todos os artigos (independente do projeto) pequenos sem qualidade? E outra para os grandes?
Rjclaudio msg 20h08min de 25 de fevereiro de 2011 (UTC)
Esboços sem referências não têm necessáriamente a qualidade 1, se tiver wikificado e for grande pode ser de qualidade 2. Podemos fazer assim: menor que 2000 bytes é 1 e menor que 10000 bytes com "sem-fontes" ou "wikificação" também. Aí é só fazer o bot rodar em todos artigos ligados a Wikiprojetos, nem precisaria de categoria. E essa categoria seria gigantesca. Danilo.mac(discussão) 01h05min de 26 de fevereiro de 2011 (UTC)
Concordo. Não tenho ideia de qual seria a quantidade de conteúdo de um artigo de 10k sem wikificação ou sem fonte, pq não teria as predefs/código wiki para aumentar o tamanho da página. Mas sigo as sugestões dos mais experientes.
Se tivermos problema com o número mágico 10k sempre dá pra pegar uma amostra de 10/20/50 maiores artigos nesses critérios e ver se tem algum falso-positivo. Se bem q não teria mt problema, só quando retirarem a predef de esboço/sem fonte/wikificar o usuário revisa a qualidade (e isso deveria ser usual)
Rjclaudio msg 22h00min de 26 de fevereiro de 2011 (UTC)

Critérios para qualidade doisEditar

Agora que estou mexendo com robôs, acho que dá para fazer o robô verificar outros parâmetros da página, por exemplo, contar as ligações internas, o número de seções, o número de parágrafos, imagens, referências, etc. Como esses dados estão ligados ao nível de wikificação, acho que daria para estipular parâmetros para definir qualidade 2 e 3. Danilo.mac(discussão) 17h26min de 6 de março de 2011 (UTC)
Estou passando o bot classificando os artigos de qualidade desconhecida para 1 com base no tamanho da página (2000 bytes), mas já os artigos de qualidade 2 ou 3 já seria meio complicado com base nas ligações ou tamanho da página, poderiam ser juntadas as informações e a partir da lista classificar, talvez, se não forem muitas páginas, manualmente. Fabiano Tatsch 19h08min de 6 de março de 2011 (UTC)
Pô, seria interessante automatizar a qualificação em qualidade 2 e 3... Mas nesses dois casos, acho que deveria ser incluída uma marcação também na página de discussão - A qualidade deste artigo foi atribuída por um robô - abrindo espaço para que seja melhor discutido. Afinal, como são critérios mais, digamos, "flutuantes", um artigo 2 poderia ser classificado erroneamente como 3 - ou um artigo 4, como de qualidade 3.
Isso não tiraria a legitimidade da qualificação, mas deixaria claro que essa qualificação não está escrita em pedra. O que acham?
Flávio, o Maddox (msg!contrib) 20h15min de 6 de março de 2011 (UTC)
Faço o uso da data de revisão, onde os artigos são listados após seis meses numa categoria do tipo ...Artigos a reavaliar sobre ... Se fosse 100% aplicado, cada artigo deveria ser reavaliado a cada seis meses, mas por enquanto isso não acontece. Já que precisam ser reavaliados a cada seis meses, não custa nada classificar automaticamente os artigos de qualidade dois ou três, só precisaria saber quais os parâmetros. Fabiano Tatsch 21h05min de 6 de março de 2011 (UTC)
Acho que a parte de desenvolver o robô não é difícil, acho que o mais difícil vai ser escolher os parâmetros, é preciso fazer uma tabela [tamanho da página; nº de ligações internas; nº de seções; nº de parágrafos; nº de imagens; predef que não podem ter] por [qualidade 2; qualidade 3], tendo essa tabela o desenvolvimento do script é uma questão de tempo. Acho que ninguém ligaria de ter a qualidade marcada por robô, seria até melhor pois a classificação ficaria mais equânime, se alguém achar que as informações do artigo estão muito inconsistente para aquela qualidade é só colocar uma marca de revisão, ou outra semelhante, que o robô irá levar a marca em consideração e colocar em uma qualidade mais baixa. Danilo.mac(discussão) 23h49min de 6 de março de 2011 (UTC)
Coloquei uma proposta para os parâmetros aqui. Danilo.mac(discussão) 22h10min de 9 de março de 2011 (UTC)
Como para qualidade 1 basta não se enquadrar na 2 e para 5 e 6 basta ter {{artigo bom}} ou {{artigo destacado}}, só ficou faltando a qualidade 4, então completei a tabela com uma proposta para qualidade 4 também, aí a classificação ficaria toda automatizada. O que acham? Danilo.mac(discussão) 16h48min de 10 de março de 2011 (UTC)
Fiz uma adição nos critérios para qualidade 4, mas surgiu uma dúvida: porque 2 e 4 imagens? Acredito que 1 e 2 seriam uma exigência mais factível. 1 na infobox e outra, caso esteja suficientemente desenvolvido. Flávio, o Maddox (msg!contrib) 17h15min de 10 de março de 2011 (UTC)
Com o Maddox. Lembrando que assuntos q exigem o URC não deveriam ter tantas imagens assim. Pra mts imagens já vai ficando subjetivo. Melhor o bot só ver se tem ou não imagem (na info e no corpo) Rjclaudio msg 18h08min de 10 de março de 2011 (UTC)
Também acho importante os bots não deixarem de incluir a data de revisão, assim uma hora saberemos que temos que revisar a qualidade. Rjclaudio msg 18h14min de 10 de março de 2011 (UTC)
Modifiquei a exigência de imagens como sugerido. Sobre a data de revisão, as marcas atuais tem "|rev=#######" com o oldid da página, para o robô e para a predefinição fica mais fácil colocar a data mesmo, no estilo "20110310" (ano,mês,dia), pois desse jeito uma data mais antiga é sempre um número menor, facilitando a comparação, aí a predefinição colocaria automaticamente marcas atualizadas a mais de X meses em uma categoria para reavaliação. Danilo.mac(discussão) 22h52min de 10 de março de 2011 (UTC)
Só pra constar, já uso a data de revisão faz muito tempo, para facilitar criei a {{Rev}}. Fabiano Tatsch 23h08min de 10 de março de 2011 (UTC)
Desculpe Fabiano, sempre olhei esse número e pensei que era o id da revisão, mas agora que você falou percebi que é a data gerada por essa predefinição. Já existe categoria que agrupa os artigos a reavaliar? Danilo.mac(discussão) 23h28min de 10 de março de 2011 (UTC)
Sim, Categoria:!Artigos por reavaliar. Fabiano Tatsch 00h03min de 11 de março de 2011 (UTC)
Modifiquei a {{marca de projeto}} para fazer essa categorização também. Danilo.mac(discussão) 21h31min de 11 de março de 2011 (UTC)
Tem que ver agora quais marcas de projeto não tem a {{marca de projeto}}, mas sim estabelecem parâmetros manuais específicos. Como exemplo tem a {{Banda Desenhada/Marca}}. Flávio, o Maddox (msg!contrib) 21h40min de 11 de março de 2011 (UTC)
A {{marca de projeto}} é a predefinição que substituirá todas as marcas, como discutimos aqui. Estou desenvolvendo um robô que troca a marca e avalia a qualidade ao mesmo tempo, aí já resolvemos tudo de uma vez. Danilo.mac(discussão) 22h06min de 11 de março de 2011 (UTC)
Falando em fazer a substituição, comecei a escrever há alguns dias atrás um script para fazer a troca das predefinições, até onde vi deu certo. Neste código dá pra pegar a qualidade atual e inserir as marcas existentes com a suas respectivas importâncias. Fabiano Tatsch 22h23min de 11 de março de 2011 (UTC)
Também consegui fazer essa parte. Coloquei aqui o script como está agora. Danilo.mac(discussão) 04h26min de 12 de março de 2011 (UTC)
O que acham de colocar essa tabela em uma página independente e que tenha uma sigla fácil? Por exemplo, 'WP:RAQ' poderia redirecionar para 'Wikipédia:Robô avaliador de qualidade', aí o robô colocaria um comentário do tipo "[[WP:RAQ|RAQ]]: Qualidade X (menos de Y seções)", com isso os editores do artigo saberiam porque o robô marcou aquela qualidade e teriam um link para a tabela para ver o que falta para o próximo nível. Danilo.mac(discussão) 18h12min de 12 de março de 2011 (UTC)
Talvez seja necessário ampliar mais a tabela então, explicando cada um dos critérios? Ou basta apontar pra Wikipédia:Versão 1.0/Avaliação?
Flávio, o Maddox (msg!contrib) 18h17min de 12 de março de 2011 (UTC)

Pras seções tb conta as seções padrão, como LE, REF, Bibliografia, Ver também, essas coisas? Ou só de conteúdo mesmo? Rjclaudio msg 20h03min de 12 de março de 2011 (UTC)

Atualmente está contando tudo que esteja entre ==...==, {{referências}} por exemplo, não conta. Sobre a tabela acho que poderia ser colocada em Wikipédia:Versão 1.0/Avaliação mesmo, já fica tudo junto. Danilo.mac(discussão) 22h27min de 12 de março de 2011 (UTC)

Gerei esta lista das avaliações do script na categoria:Ciência. Danilo.mac(discussão) 00h48min de 13 de março de 2011 (UTC)

O melhor modo de testar é passar o script nos ADs e ABs (retirando a regra que detecta as predefs correspondentes) e ver qual qualidade que vai dar. Se o script der qualidade 1 para um AD então tem algo errado. Dá pra fazer isso? Rjclaudio msg 01h14min de 13 de março de 2011 (UTC)
Feito. Está dando problemas com o tamanho dos parágrafos, o que sugerem? Danilo.mac(discussão) 18h20min de 13 de março de 2011 (UTC)
Tem Age of Empires (série) com 2385 bytes, então no mínimo dos mínimos, 2500.
Alanya apareceu como menos de 5 refs, mas tem mais que 100. Algum erro no script
Clássico dos Clássicos está como sem imagem. Adicionar {{imagem dupla}} no script.
Frei Galvão é AB mas só tem 5 seções, sendo 3 seções padrão. E eu que queria que esse limite de 6 seções descontasse as seções padrão. Esse é um caso isolado ou dá pra mudarmos esse critério?
De início seria bom o bot listar os artigos/qualidade em algum lugar (uma página para cada qualidade, uma seção para cada motivo) pra revisão humana, pelo menos no início até o script ficar realmente confiável e ajustarmos bem os parâmetros.
Rjclaudio msg 20h42min de 13 de março de 2011 (UTC)

Aproveitando o bot pra análise de qualidade, um sonho antigo meu é um bot ajudando a avaliar as EADs, listando possíveis problemas, termos que possam indicar imparcialidade ou necessidade de fonte (ex: "segundo estudo xxx ..."), parágrafos/seções sem fontes, etc, incorporando também as ferramentas já existentes (numero de links para desambiguação, link vermelho na introdução). Como são coisas que precisam de pessoas pra ver se realmente é um problema, seria apenas indicar a lista na EAD. Poderia falar "pelos critérios de bot, o artigo teria qualidade 4, e foram encontrados os possíveis erros: ..." Um bot que sempre que uma EAD fosse criada analisasse o artigo indicando problemas. Ou por demanda, principalmente antes da EAD, pra resolver essas coisas antes da votação. Seria possível fazer algo do tipo? Rjclaudio msg 21h01min de 13 de março de 2011 (UTC)

Vou fazer as correções. Sobre o Frei Galvão, o script não contou a {{referências}}, então só tem 4 seções, na minha opinião, pelo tamanho do artigo, deveria ser qualidade 3 mesmo.
Assim que eu fizer as correções, vou fazer testes nas categorias "!Artigos de qualidade X...". Acho que não é necessário criar muitas listas, pois depois que o script ficar pronto, os robôs avaliariam primeiro as qualidades desconhecidas, isso já seria uma lista para revisar.
Sobre a EAD, buscar termos no texto e parágráfos sem fonte é fácil, para testar os links dá também, mas seria um pouco mais complicado. Danilo.mac(discussão) 00h12min de 14 de março de 2011 (UTC)
Danilo, pelo que percebi a contagem no artigo Alanya não considerou os <refname="XYZ"/> pois não são acompanhados de </ref>. Acho que é isso, de resto tudo me parece ótimo! OTAVIO1981 (discussão) 01h06min de 14 de março de 2011 (UTC)
O problema nem é esse. São 100+ refs diferentes. Tem 100+ </ref>. Não foi pela não contagem das refs repetidas. Mas o script realmente deve contar cada ref, mesmo as repetidas, ou só as diferentes? Rjclaudio msg 01h12min de 14 de março de 2011 (UTC)
Acho que descobri o problema. As refs estão em um anexo que está embutido {{Anexo:Alanya (notas e referências)}}. Particularmente, acho errado ficar embutindo as coisas, mas como não é regrado o melhor é contar os ref names e os refs "normais".OTAVIO1981 (discussão) 11h31min de 14 de março de 2011 (UTC)

Fiz as correções e gerei a mesma lista. Danilo.mac(discussão) 17h21min de 16 de março de 2011 (UTC)

Gerei listas das categorias de qualidade 4, 3, 2, 1 e desconhecida de dois dos projetos que têm mais artigos em qualidades altas (matriz geral): História militar e Brasil. A maioria das qualidades deram diferentes da categoria em que estão, mas na minha opinião as avaliações do robô estão mais corretas que as avaliações humanas. Danilo.mac(discussão) 18h49min de 16 de março de 2011 (UTC)

Não queria abusar da boa vontade, mas vc podia passar o bot no projeto enxadrismo? Pode salvar em uma subpágina minha se for o caso, é só curiosidade mesmo. Se não der não tem problema. Obrigado. OTAVIO1981 (discussão) 19h09min de 16 de março de 2011 (UTC)
  • Vendo qualidade 4 que passou para qualidade 1, pra ter tamanha diferença tem usuários que não estão classificando direito. E usuários experientes. Depois pode fazer uma lista de artigos que passaram de 4 para 1, para orientarmos os usuários?
  • Tem algum modo de vermos quais são as novas páginas de qualidade 4?
  • Seguindo a sugestão lá em cima, melhor passar os critérios de bots para uma página mais acessível, como a WP:1.0, pra poder deixar o link pros usuários. Como a qualidade vai ser independente de projeto, podemos deixar o link pros critérios na marca mesmo (atualmente não tem nenhum link pra explicação, então os novatos acabam fazendo besteira)
  • Com critérios objetivos assim, uma avaliação humana será melhor q a avaliação do bot? Pq se não for, melhor deixar a avaliação 1-4 só pros bots (a avaliação dele teria prioridade) e 5-6 (AB e AD) pros usuários. O único critério que o humano seria melhor é abrangencia do conteúdo, mas pra mim está mais como critério de AB. Talvez verificabilidade, mas se falta ref tem predef para isso, e se tem predef no artigo o bot leva isso em conta também.
  • Ampliaria o critério de refs de qualidade 4 para no mínimo 1 ref em cada seção nível 2, substituindo ou não o critério de número de refs (pode ficar os dois tb). Tem artigo com 20 refs em uma seção e nenhuma nas outras. Ou, se quiser ser mais restrito, ref em cada seção nível 2 seria qualidade 3 e ref para cada seção nível 3 nível 4. O nível 5 (AB) iria verificar se é necessário uma ref pra cada parágrafo, e 6 (AD) se precisa de mais de uma ref por paragrafo.
  • Rjclaudio msg 21h01min de 16 de março de 2011 (UTC)
15000 bytes para qualidade 3?! Já acho 10000 meio forte para tal já que tamanho não quer dizer que tenha qualidade. Fabiano Tatsch 21h58min de 16 de março de 2011 (UTC)
Diminuí o tamanho da qualidade 3 para 12000 e da qualidade 2 para 8000 quando não tiver fontes e passei o bot nas categorias de enxadrismo. Está bom ou acham melhor diminuir mais?
Isto aqui ajuda um pouco a procurar as avaliações de nível 4, mas buscar só as avaliações acho que não dá.
Acho que será natural que os robôs passem a fazer essa tarefa, pois ficará muito mais fácil para os editores, se tiver qualquer problema no conteúdo do artigo é só colocar as predefinições de manutenção para limitar a qualidade, na qualidade 4 sobre Brasil por exemplo, duas qualidades foram limitadas pelas predefinições.
Tentei verificar se todos parágrafos têm referências, mas não vai dar certo, a maioria dos artigos bons não passa, América do Sul por exemplo, deu: qualidade 3 (paragrafo sem referências:"A América do Sul ficou ...").
Danilo.mac(discussão) 01h03min de 17 de março de 2011 (UTC)
Vou guardar esse link, ajuda sim. Se tivessemos um js para atualizar as marcas que indicasse isso no sumário seria mais fácil de achar as mudanças.
As refs por parágrafo ficaria mesmo como critério a ser avaliado (a necessidade ou não) na EAD. O bot pode ver se todas as seções tem ref. Se toda seção principal tiver ref seria nivel 3. Se toda subseção logo abaixo (só as de nivel 3, as de nível 4 ou maior não precisaria) tiver ref seria nível 4. Contar por parágrafo pode ficar até meio difícil, ainda mais quando alguns parágrafos só estão introduzindo uma lista logo abaixo. Rjclaudio msg 02h31min de 17 de março de 2011 (UTC)
Rjclaudio msg 02h31min de 17 de março de 2011 (UTC)
Obrigado por ter passado pelo Enxadrismo Danilo. Acho que ficou bom as linhas de corte de tamanho em 20000, 12000 e 8000. O numéro é uma regua inflexível e a aderência dos resultados me pareceu satisfatória. A maioria dos artigos que falharam na classificação em tamanho foi por pouco, menos de 2000kB. Não considero adequado que o bot verifique se todos os parágrafos tem referência, é uma avaliação muito crítica no qual a maioria dos artigos vai falhar. Respondendo ao Rjclaudio ali em cima se Citação: Rjclaudio escreveu: «Com critérios objetivos assim, uma avaliação humana será melhor q a avaliação do bot?» creio que sim, e não me oponho que fosse feito prioritariamente por bots para artigos sem avaliação.OTAVIO1981 (discussão) 11h34min de 17 de março de 2011 (UTC)

Fiz algumas modificações no script:

  • Juntei as funções de atualizar a marca e avaliar dando as opções de só atualizar, atualizar e avalair ou atualizar e avaliar só as qualidades desconhecidas, e também um comando para adicionar um tema à marca
  • Modifiquei a busca de seções para não buscar seções com predefinições no nome (ex: == {{Ver também}} ==), o que reduziu ainda mais a contagem de seções em alguns artigos, fanzendo-os cair um nível de qualidade, talvez seja melhor rever os parâmetros.
  • Adicionei uma busca de referências nas seções, mas as vezes aparece um falso positivo, juntei os que vi numa lista de exeções, mas provavelmente aparecerá mais, principalmente quando tiver só uma tabela ou lista na seção, algumas das exeções que coloquei foi Discografia, Galeria de imagens, Leitura adicional, Subdivisões e Leitura recomendada, além do Ver também , Notas, etc; e coloquei essa como a última busca, logo antes da qualidade 4, classificando como 3 se as referências não forem encontradas. Acham mesmo necessário a busca de referências nas seções?

Por fim gerei esta lista da categoria de artigos bons, tem uma seção "Bibliografia" pega como sem referências que só adicionei como exeção depois que gerei a lista, e como juntei com as funções de atualizar e avaliar, os artigos sem marcas não foram avaliados.

E além disso eu quero fazer uma proposta: mover a Wikipédia:Versão 1.0/Avaliação para 'Wikipédia:Qualidade' ou algo parecido, a Wikipédia 1.0 é apenas um dos usos da qualidade e muita gente nem sabe o que é isso. Danilo.mac(discussão) 23h28min de 24 de março de 2011 (UTC)

Ninguém tem sugestões?
Sobre o JS para adicionar/atualizar a marca, já faz alguns dias que começei a desenvolver uma nova função do FastButtons para isso, mas está sendo mais difícil que com o python, vou demorar mais um pouco para terminar. Danilo.mac(discussão) 23h30min de 25 de março de 2011 (UTC)
  • Futebol está como sem seção de ref. O artigo está usando a reflist e vários códigos (quase um subst {{referências}}), pode ter outros casos com variações, então melhor além de verificar se tem a seção verificar se há alguma <ref>. Raramente um artigo com mt ref não terá nem uma tagzinha que seja de ref, então a chance de erro é bem menor.
  • O número de seções está difícil como critério. Talvez incluir o número de subseções caso tenha poucas seções principais (tem artigo com só 4 seções principais, mas dezenas de subseções). Mts subseções compensaria poucas seções principais. Talvez, a cada 5 subseções contar como +1 seção principal. Outra opção (ou as duas) é abaixar um pouquinho o número de seções, pq tem temas q realmente não tem motivo para ter tanta seção. Abaixar pelo menos para 5, podendo ir até 4. Menos que isso já acho que tá com baixa qualidade, deixando que a comunidade diga o contrário em um EaD.
  • Pras exceções das seções pode tentar retirar as seções que só tem tabela, com a primeira linha após o cabeçalho começando com {| e a última linha da seção com |} (e sem duas quebras de linha, logo é a mesma tabela). Isso deve tirar alguns casos. Seções com tabela e com conteúdo significativo / q precisam de ref normalmente tem algum texto de introdução.
  • Ainda acho importante o critério de ref nas seções, pq senão teremos artigos de qualidade 4 com várias seções sem ref. Um meio termo, talvez deixar um pouco mais relaxado (evitando as várias exceções). Um modo é só considerar WP:V nas seções com mais de x parágrafos (conteúdo grande o suficiente) ou que tenha alguma subseção (tem conteúdo diverso, mesmo que seja pouco)
  • Rjclaudio msg 00h14min de 26 de março de 2011 (UTC)
  • Não sei como será feito, se vamos aplicar esse critério logo pra todos os artigos, ou passar por um grupo de teste. Se for com teste, nas marcas pode ter um link tipo "informe um erro na avaliação", pros usuários relatarem artigos que consideram de boa qualidade mas que o bot não considera (possivelmente necessário rever os critérios/script). Caso contrário capaz de os usuários simplesmente mudarem a qualidade por conta própria, ou nem mudar nem falar nada, ficar com medo de fazer qualquer coisa. Rjclaudio msg 00h17min de 26 de março de 2011 (UTC)
Gostei da idéia de só procurar referências nas seções que tem subseções, isso vai reduzir bastantes o número de falsos positivos. Coloquei 'reflist' na busca de referências. Vou tentar contar as subseções para aumentar o número de seções. Para a implementação, acho que a melhor forma de iniciar é fazer a avaliação primeiro nos projetos que pedirem, assim os participantes do projeto saberão onde reclamar se não concordarem com alguma avaliação ou acharem algum erro, ou poderam simplesmente falar com o operador do robô que fez a avaliação (quando terminar o script vou divulgá-lo para que outros operadores de robô possam ajudar na tarefa). Danilo.mac(discussão) 22h56min de 26 de março de 2011 (UTC)
Fiz as modificações e gerei novamente uma lista. Cada 5 seçẽs nível 3 (=== ===) conta mais uma, mas mesmo assim estava dando qualidade 3 em alguns bons, então eu abaixei para 5 seções para qualidade 4 e 3 para qualidade 3, tudo bem? Alguém tem mais sugestões de modificações antes de iniciar as avaliações? Danilo.mac(discussão) 02h01min de 30 de março de 2011 (UTC)
Ainda estou encontrando falsos positivos procurando as referências nas seções, como na seção "Módulos e frameworks" no artigo Python, estou modificando para só procurar referências em seções com pelo menos 2 parágrafos.
Não consegui atualizar a marca com o FastButtons, as regex do JavaScript são muito mais limitadas que as do python. Danilo.mac(discussão) 20h01min de 1 de abril de 2011 (UTC)
Concordo com as modificações feitas.
Deixa pra atualizar manualmente/bot então. Mas pra adicionar, dá? Adicionar qnd não tiver nenhuma marca (adiciona a predef toda) ou qnd tiver (adiciona os campos). Deve ser mais fácil pro javascript. Rjclaudio msg 21h16min de 1 de abril de 2011 (UTC)
Adicionar a marca quando não tem nenhuma é bem mais fácil, estava mesmo pensando em aproveitar o que já fiz para isso, mas para adicionar mais temas seria a mesma coisa que atualizar, estou com uma idéia para resolver o problema mas não sei se vai dar certo. Danilo.mac(discussão) 23h00min de 1 de abril de 2011 (UTC)
Veja se isso pode ser útil, me parece ter quase todos os códigos do regex (só não achei o [^x] ). Isso só faz mudança pré-definida, mas vai saber se dá pra juntar isso com a caixa pra inserir o motivo de ER do Fastbuttons e fazer algo útil. Rjclaudio msg 23h43min de 1 de abril de 2011 (UTC)
Ajuda sim, só vou ter que pegar o código da página de discussão por API (essa é a idéia que falei) para poder atualizar corretamente a marca. Danilo.mac(discussão) 00h02min de 2 de abril de 2011 (UTC)
Meu robô foi aprovado e avaliei a qualidade de todos os artigos vinculados ao Projeto Física. Verifiquei algumas das edições e parece que está tudo certo. Danilo.mac(discussão) 00h34min de 9 de abril de 2011 (UTC)
Estou diminuindo a avaliação de várias biografias de 2 para 1 por causa do número de seções, o que acham de diminuir ainda mais esse critério? Fiaria 1 para qualidade 2, 2 para 3 e 4 para 4. Danilo.mac(discussão) 18h00min de 13 de abril de 2011 (UTC)
Acho que encontrei uma solução específica para as biografias, para não dispersar a discussão eu comentei na discussão do Conselho de WikiProjetos. Danilo.mac(discussão) 19h34min de 13 de abril de 2011 (UTC)

Identificando artigos sem fontesEditar

  •   Comentário Seria possível que um bot avaliasse todos os artigos da Wikipédia e, não encontrando a {{Referências}} ou, encontrando apenas uma fonte, pudesse marcar essas páginas com a {{Sem-fontes}} e {{Sem-notas}}? Flávio, o Maddox (msg!contrib) 19h54min de 13 de abril de 2011 (UTC)
  • Possível é, resta saber se é de interesse. Se já reclamam de usuários editando só pra colocar essas tags, mesmo quando fazem correções além de taggear, com bot então. Além de não ter certeza que aprovam colocar a tag em todos os artigos (já fui bloqueado por colocar essa tag em artigos que não precisavam dela). No script do projeto AWB eu colocava a sem-fontes como automático, até reclamarem para desabilitar, aí está opcional, regra desabilitada por padrão e só usa quem quer. Nem com awb deixam. Rjclaudio msg 20h02min de 13 de abril de 2011 (UTC)
  • Azar de quem reclama, entendo. WP:V está acima de opiniões pessoais. Quando reclamaram pra desabilitar e que argumentos utilizaram? Flávio, o Maddox (msg!contrib) 15h12min de 18 de abril de 2011 (UTC)

Teria q procurar, mas o principal era que "não há consenso". E como na minha época eu enchi páginas e páginas de discussão sobre isso, deixei quieto. Melhor fazer essa proposta como uma proposta nova, a parte, senão fica oculta sob a discussão da qualidade por bot. Fazendo nova deve ter mais opiniões.

Tem uma discussão na coordenação robótica para um bot passar pelos afluentes da Sem-fontes atualizando (retira, muda para Sem-notas ou para Mais notas), bom olhar lá também. Rjclaudio msg 15h46min de 18 de abril de 2011 (UTC)

Sem dúvida. Aguardemos o momento oportuno para retomar a discussão. Flávio, o Maddox (msg!contrib) 15h58min de 18 de abril de 2011 (UTC)