Wikipédia:Esplanada/geral/Edições e reversões na Wikipédia lusófona - 2001 a 2010 (12mar2013)

Edições e reversões na Wikipédia lusófona - 2001 a 2010 (12mar2013)

Dados de edições e reversões lusófonas editar

Algo que sempre quis saber era a proporção de edições feitas por IPs. Buscando na página Especial:Estatísticas, navegando pelos links no fim da página cheguei a alguns gráficos e tabelas que analisam o período de 2001 a julho de 2010; esses dados ajudam a entender melhor o que ocorre aqui dentro nas edições de usuários, robôs e IPs.


Link: http://stats.wikimedia.org/EN/EditsRevertsPT.htm


Por exemplo sobre IPs, constata-se no período que:

  • 24% de todas as edições foram feitas por IPs (1 a cada 4)
  • 80% das edições de IPs não foram revertidas (apenas 20% foram revertidas, 1 a cada 5)
  • 75% de todas as reversões realizadas em artigos foram revertendo edições de IPs (3 a cada 4)
  • Cálculo meu: as reversões de edições de IPs representam apenas 4,9% do total das edições feitas na Wikipédia. Ou seja, aproximadamente 1 a cada 20 edições realizadas na Wikipédia será a edição de um IP que será revertida. (cálculo: 689 mil reversões de edições IPs dividido por 14,2 milhões de edições totais do período)


Artigos mais revertidos (está no fim da página):

  • Países, capitais de estados, times de futebol e cantores/bandas pop


Acima dei exemplo de IPs, mas no link constam também dados de edições e reversões de editores registrados e robôs. Esse tópico pode servir de curiosidade, referência ou embasar futuras políticas, implementações, ideias e sugestões com dados reais.

JAMAL 09h39min de 12 de março de 2013 (UTC)[responder]

Quer dizer que apenas 20% dos vandalismos de IPs foram notados a tempo de serem revertidos? Em outras palavras, 80% dos IPs conseguem vandalizar artigos, e deixar os artigos vandalizados até que venha uma nova edição? Acho assustador isto. É o caso de pensar em mais rigor na proteção de artigos. Eu já tinha proposto proteção automática de um dia, aumentando em progressão geométrica de razão dois, para cada vandalismo de IP. Talvez seja pouco. Devia começar com um mês de proteção. Albmont (discussão) 10h58min de 12 de março de 2013 (UTC)[responder]
80 % das edições totais feitas por IPs foram mantidas, seja porque foram edições válidas ou porque escaparam do radar dos usuários e bots, não sei, pelos dados do link não conseguimos afirmar. JAMAL 11h21min de 12 de março de 2013 (UTC)[responder]
20% de todas as edições de IPs tiveram que ser revertidas, alem daquelas que tiveram que ser corrigidas .... numeros assustadores. -- DARIO SEVERI (discussão) 11h07min de 12 de março de 2013 (UTC) Ps.Excelente trabalho Jamal.[responder]
Para efeito de comparação, 3,05% das edições de usuários registrados foram revertidas, algo como 1 edição revertida a cada 33 edições(195 mil revertidos de um total de 6,4 milhões de edições), portanto um usuário registrado é revertido em média 6 vezes menos que um IP. JAMAL 11h21min de 12 de março de 2013 (UTC)[responder]

Ver também: Wikipédia em português tem o dobro de contribuições por IPs em relação a em inglês. --ezalvarenga (discussão) 11h26min de 12 de março de 2013 (UTC)[responder]

Os dados da enwiki não são muito confiáveis para comparar pois pessoas do mundo inteiro editam lá, creio que quando alguém quiser comparar dados seria melhor e mais preciso comparar com as outras wikis, por exemplo a francesa, espanhola, italiana, alemã e outras. JAMAL 11h51min de 12 de março de 2013 (UTC)[responder]
@DARIO SEVERI: Se os números fossem 99% de todas as edições de IPs foram revertidas, eu nem me assutaria tanto - porque, neste caso, haveria apenas um teto de 1% de vandalismos que não foram percebidos. O que assusta nos 20% não é o 20%, mas o 80% - são 80% de vandalismos que não foram percebidos. Albmont (discussão) 11h30min de 12 de março de 2013 (UTC)[responder]
Albmont, onde é que diz que os 80% são vandalismos? -- L'Éclipse [msg] 11h42min de 12 de março de 2013 (UTC)[responder]
@Albmont: Está distorcendo a interpretação da estatística. 80% das edições de IPs permaneceram na Wikipédia, seja porque foram edições válidas, seja porque nenhum usuário ou robô detectou. Não podemos afirmar que todos esses 80% de edições de IPs que ficaram são vandalismos, uma porcentagem desconhecida com certeza é mas não tudo. JAMAL 11h51min de 12 de março de 2013 (UTC)[responder]
Por amostragem, pode-se constatar que no máximo 10% das edições por IPs não são vandalismos. Ou seja, se 80% das edições não são revertidas, 70% são vandalismos que foram deixados nos artigos. Albmont (discussão) 11h57min de 12 de março de 2013 (UTC)[responder]
Pedido o bloqueio do sujeito acima pois obviamente não tem como provar acusações (recorrentes) como essa--Arthemius x (discussão) 12h38min de 12 de março de 2013 (UTC)[responder]

Espero que não haja ips bons editores conhecedores desta discriminação que neste caso é completamente exagerada e falsa. Esta interpretação dos dados, é completamente errada, e gostava de saber essa tal amostragem, albmont, de que apenas 10% das contribuições de ip não é vandalismo. Ninux2000 (discussão) 14h18min de 12 de março de 2013 (UTC)[responder]

Tenha calma IP 189.106.137.42, mas é contra os príncipios pilares da wikipédia ser contra as edições de ips, pois ips são apenas (em relação à Wikipédia) editores não-registados, não os Vândalos (sim Vândalos, uma tribo de bárbaros) cá do site. Generalizar e atacar um tipo (por tipo refiro-me aos privilégios que detêm, nãos às edições que preferem fazer) de editores só por uma parcela deles fazer vandalismo. Ou seja o Albmont viola o príncipio 3 e 4 dos Cinco pilares.

Não concordo com a proteção desta página. Desde que ele fique calmo, ele pode editar.

Ninux2000 (discussão) 15h05min de 12 de março de 2013 (UTC)[responder]

A proteção foi por 1 hora apenas pra ele tomar uma aguinha e esfriar a cabeça. José Luiz disc 15h11min de 12 de março de 2013 (UTC)[responder]
  • Se discorda da proteção da página, discuta no local apropriado, e não aqui, que é um lugar dedicado a analisar o estrago que os IPs tem feito na Wikipédia. Aliás, a tática de desviar o assunto e inserir ofensas mais uma vez funcionou, em vez de debatermos medidas concretas para diminuir o vandalismo, estamos perdendo tempo revertendo IPs. O certo é remover tudo que foi escrito aí em cima, e que não tem nada a ver com o assunto em questão. Albmont (discussão) 15h13min de 12 de março de 2013 (UTC)[responder]
Esta página não é dedicada a analisar o estrago que os IP têm feito. Esta página é dedicada a analisar as Edições e reversões na Wikipédia lusófona, mas que você está a distorcer o sentido, ou seja, o que você está a apresentar nada tem que ver com o assunto em questão, nem com os dados apresentados. -- L'Éclipse [msg] 15h28min de 12 de março de 2013 (UTC)[responder]

  Sobre reversões feitas por bots vendo a tabela "Distribution of reverts, each subdivision adds up to 100%": eu não sei se isso melhorou de 2010 até hoje, mas se se manteve como antes o número de reversões de IPs que bots fazem, apenas 12,2% das reversões totais de edições de IPs, é algo a ser melhorado; a cada 8 reversões de IPs 1 quem faz é um bot e 7 são humanos que fazem a tarefa. Analisando as reversões por bots de edições de usuários registrados, apenas 5,3% das reversões são feitas por bots; a cada 20 reversões de edições de usuários registrados apenas 1 é revertida por um bot e 19 são feitas via edição humana. Poderíamos melhorar os bots de alguma forma para diminuir a carga de trabalho humano. JAMAL 15h43min de 12 de março de 2013 (UTC)[responder]

Esse é o tipo de coisa que melhoraria se mais gente acompanhasse, por exemplo, os registros do filtro de edições e a página de discussão do Salebot (para detectar falsos positivos e sugerir aprimoramentos, de modo a torná-los mais eficientes - note que os filtros agem antes de ocorrer um vandalismo, não depois). Helder 16h03min de 12 de março de 2013 (UTC)[responder]
Esses números parecem mostrar que a maioria das edições de IP não são vandalismo óbvio. Não sei se será fácil melhorar muito esses números já que os bots, obviamente automáticos, devem reverter só o que é tomado como vandalismo no seu modo geral, afim de não se desfazer edições válidas automaticamente. Se o Helder pudesse, e como está mais por dentro do assunto técnico, seria interessante alongar mais as medidas que podemos tomar para aprimorar os bots -- L'Éclipse [msg] 16h23min de 12 de março de 2013 (UTC)[responder]
Os bots só pegam vandalismos óbvios e grosseiros, o mais comum e pernicioso é o vandalismo sutil, como quando IPs trocam números, nomes de pessoas, invertem a lógica dos parágrafos ou inserem blocos de lixo sem fontes. Pequena amostra do estrago que os IPs fazem: peguei as últimas edições do Erif Duff (escolhi o nome ao acaso: usei "página aleatória" e peguei o último que havia editado uma página), peguei as últimas 10 páginas que ele editou, e peguei a última edição dos IPs nestas páginas:
  1. 4 de janeiro - vandalismo de IP
  2. TV Nordeste - vandalismo de IP (removendo partes sem fontes, inserindo partes sem fontes)
  3. Oi TV - vandalismo de IP
  4. GVT TV - vandalismo de IP
  5. Plantel da WWE - vandalismo de IP
  6. Claro TV - vandalismo de IP
  7. Brasília - vandalismo de IP
  8. Farroupilha - vandalismo de IP
  9. K-On! - possível vandalismo de IP (teria que analisar as fontes com mais cuidado)
  10. FIFA 13 - vandalismo de IP
Ou seja, de dez edições, oito foram vandalismos óbvios, uma foi um vandalismo que reduziu a qualidade do artigo, e uma talvez não tenha sido vandalismo. Façam o teste e constatem o óbvio. Albmont (discussão) 16h40min de 12 de março de 2013 (UTC)[responder]
Albmont, escolhi ao acaso uma dessas páginas que apresentas - Claro TV, que classificas como vandalismo de IP. Bem, vejo que a edição do editor referido, não é uma simples reversão de edição, mas sim, limpeza de quase toda uma secção sem fontes, que continha informações inseridas durante meses por diversos IP e editores [1]. Notar que o editor considerou essas informações desnecessárias e o artigo continuou com informações sem fontes, aliás, até lá estão avisos destes: [carece de fontes]. Escrever informações sem fontes é vandalismo? Os dados dos gráficos e tabelas não apresentam o conteúdo das edições, logo não dá como provar o que pretendes com esta análise que trouxe o JAMAL, nem com a análise de 1 ou 10 artigos num espaço de milhares. Aliás, se fossemos todos fazer análises à Albmont, diríamos que 80% das edições de IP são correctas, já que não tiveram qualquer reversão! -- L'Éclipse [msg] 19h14min de 12 de março de 2013 (UTC)[responder]

eu fiz um levantamento algum tempo atrás na página do presidente Lula, nas 100 edições entre as 20h26min de 2 de fevereiro de 2010 e as 19h07min de 3 de março de 2010, e constatei que das 59 edições de IPs, apenas 8 acrescentaram conteúdo referenciado, enquanto o restante foi vandalismo claro ou edições de valor duvidoso, além de 8 negligenciáveis, de importância mínima, somente acrescentando espaçamento entre seções, fazendo correção em algum erro gramatical ou em alguma ligação interna. Das 41 edições de usuários cadastrados, apenas 1 foi um vandalismo, e outra de valor questionável. 12 acrescentaram conteúdo, mas 25 edições estiveram envolvidas no combate ao vandalismo. Mais da metade das ações dos usuários cadastrados foi de combate ao vandalismo, e apenas cerca de 1/6 das edições de IPs foram claramente úteis, com o restante condenável ou questionável. Edições claramente vandalizadoras ficaram na proporção de 24/1 para IPs/usuários cadastrados. Edições de valor questionável ficaram na proporção de 17/1 para IPs/usuários cadastrados. detalhes aqui. Tetraktys (discussão) 18h46min de 12 de março de 2013 (UTC)[responder]

O artigo do Lula é um alvo claro de vândalos, se proibirmos os IPs provavelmente continuarão os vandalismos e edições duvidosas.--Arthemius x (discussão) 10h30min de 13 de março de 2013 (UTC)[responder]

A melhor análise possível tem de ser feita às contribuições por ips e as outras, e têm de se arranjar as melhores propostas para evitar as más, eu fiz uma proposta para isso, mas ninguém ligou. Só há uma hipótese sem banir os pis, um sistema de supervisão, pelos editores autorrevisores nível um como eu propus, e assim aumentar a audacidade dos ips e permiti-los editar todos os artigos. Ninux2000 (discussão) 21h43min de 12 de março de 2013 (UTC)[responder]

A WMF contratou o Henrique como analista de dados para o movimento wikimedia no Brasil e uma de suas atribuições é nos ajudar neste tipo de análise. Pedi para ele participar aqui e ver se é possível sistematizar uma análise mais apurada dos dados para termos um resultado robusto para pensarmos em soluções.OTAVIO1981 (discussão) 16h42min de 13 de março de 2013 (UTC)[responder]

Obrigado por chamar minha atenção para esse debate, OTAVIO1981. As falas aqui me lembraram muito a preocupação que o Rayton apresentou tanto na última conversa no IRC como na discussão do planejanemento de análise de dados sobre a falta de carinho com que olhamos para os IPs. Vejo aqui algumas opiniões baseadas em achismos e gostaria de ajudar a levantar números concretos para fomentar essa questão. Uma das formas que pensei em fazer isso foi a seguinte: Observar as edições feitas por IPs (e a taxa de reversão) em artigos que estão em destaque na PP e comparar esses valores com os dias que esse artigo não estava em destaque. Acredito que essa informação razoavelmente simples de ser obtida possa ser um primeiro passo para sabermos quanto o destaque de um bom artigo trás de novatos bem intencionados e de vândalos. O que acham? HAndrade (WMF) (discussão) 10h20min de 15 de março de 2013 (UTC)[responder]
Henrique, como comentei mais pra baixo, será necessário antes discutir o "costume" de se proteger os artigos em destaque enquanto eles estão na PP, coisa bem arraigada por aqui (não sei se foi discutido em algum lugar - talvez o Cláudio saiba). Eu concordo plenamente com a proposta, by the way, pois acho que a PP pode ser usada também para lidarmos com novatos (IPs ou não), como disse aqui. José Luiz disc 10h47min de 15 de março de 2013 (UTC)[responder]

  Sobre artigos mais revertidos: vendo a tabela "Most Reverted Articles" no fim da página e a página especial "Páginas de conteúdo com mais revisões"(que infelizmente está desatualizada, última versão dela é de outubro de 2009) noto visualmente uma correlação entre os artigos com mais revisões e os artigos mais revertidos. Uma ideia possível para reduzir a maior parte dos vandalismos seria proteger as top 500 ou top 1000 páginas mais acessadas, vandalizadas ou com mais revisões. Proteger as mais vandalizadas seria o ideal, não sei se esses dados estão disponíveis em algum lugar. Uma solução alternativa seria atualizar essa "Páginas de conteúdo com mais revisões" e proteger as top 500, 1000 ou qualquer número que acharem melhor que irá ter efeito semelhante, afinal as páginas com mais revisões tendem a ser as mais vandalizadas. JAMAL 17h32min de 13 de março de 2013 (UTC)[responder]

Outra medida sugerida que conteria boa parte dos vandalismos seria proteger todos os Wikipédia:Artigos destacados e Wikipédia:Artigos bons, que são os melhores artigos da Wikipédia, portanto nada mais justo e inteligente de se fazer que protegê-los. JAMAL 19h07min de 13 de março de 2013 (UTC)[responder]
Pelamordedeus não faça isso! Eu estava pra propor que artigos destacados em exibição na PP não fossem protegidos e, ao invés disso, fossem vigiados por editores interessados na atração de novatos. Explico-me: me parece que a PP é um instrumento de atração de novatos muito eficiente e, ao proteger os artigos ali expostos, de fato nos protegemos contra vandalismos imbecis, mas também impedimos o "novatão desinteressado" de se aproximar da wiki. Aqui, é claro, entra uma opinião minha que devemos usar melhor a PP como instrumento de atração (algo que fazemos às vezes nos EAD): tentar casar o artigo em destaque na PP com algum evento da vida real (colocar o destaque da música da Lady Gaga na PP no dia em que ela tem uma notícia importante, por ex, ou um artigo sobre D. Pedro II no feriado do 7 de setembro). Na enwiki, que o MC detesta, isso é muito bem trabalhado e a PP é vista como uma porta de entrada importante. Acho é que deveria haver um projeto sobre o tema. Até anteontem, estava lá um artigo que eu destaquei (sobre a Guerra Civil Bizantina) e que eu gostaria de saber a reação dos IPs/não registrados... José Luiz disc 01h20min de 14 de março de 2013 (UTC)[responder]
Só um comentário: há os não tão famosos vandalismos marcados via redes sociais. Hoje, 13 de março, foi escolhido o artigo Capitalismo. Não dá pra vigiar isto, e nem dá pra rastrear os tais IP's. Por sugestão, seria possível uma ferramenta/filtro automática pra bloquear a edição de IP's no artigo após três (ou mais) reversões seguidas em um mesmo dia? Halleltalk 02h03min de 14 de março de 2013 (UTC)[responder]

Esses dados são de 2010, não há um mais atual não? Vitor MazucoMsg 10h50min de 14 de março de 2013 (UTC)[responder]

Achei os dados de 6 de março de 2013, mas são os dados em si, são vários gigas para quem quiser baixar, analisar, etc: http://dumps.wikimedia.org/ptwiki/20130306/ . Outros dados podem ser encontrados em: http://stats.wikimedia.org . Mas sobre reversões é esse link do topo que temos, último dado de 2010. JAMAL 11h13min de 14 de março de 2013 (UTC)[responder]

Qual desse equivale ao link que vc passou? Vitor MazucoMsg 11h33min de 14 de março de 2013 (UTC)[responder]

Não faço ideia. Talvez mandando um email para o criador da página "Author:Erik Zachte" ezachte@wikimedia.org ele possa ajudar com alguma coisa. Achei o user dele: http://en.wikipedia.org/wiki/User:Erik_Zachte mas duvido que ele responda, última contribuição dele com esse user foi em "11 July 2012", talvez seja melhor via email. Chequei o twitter dele está ativo, última mensagem 4 horas atrás, quem tiver conta pode falar com ele lá ou no email do site dele erikzachte@infodisiac.com .JAMAL 11h57min de 14 de março de 2013 (UTC)[responder]
Manter tantos artigos desprotegidos é puro masoquismo. Se um artigo é vandalizado cinco, dez, quinze vezes, é óbvio de que ele deve ser protegido por, digamos, quinze dias, um ano ou cinquenta anos. É um trabalho de Sísifo ficar revertendo IPs, quem faz isto não consegue fazer mais nada e só vai desanimando de editar a wiki.pt. Albmont (discussão) 11h24min de 14 de março de 2013 (UTC)[responder]

Excepto no caso de surtos de vandalismo, biografias de pessoas vivas ou casos extremamente polémicos, é preferível deixar desprotegidos os artigos mais visitados. Porque são esses que têm o maior número de vigilantes e onde o vandalismo é mais facilmente e rapidamente revertido. Protegê-los em excesso só fará com que os vândalos passem para artigos onde o vandalismo passa despercebido e demora anos até ser detectado. Polyethylen (discussão) 11h45min de 14 de março de 2013 (UTC)[responder]

  Concordo com o Polythylen. Ninux2000 (discussão) 14h46min de 14 de março de 2013 (UTC)[responder]

Também   Concordo. --ezalvarenga (discussão) 15h14min de 14 de março de 2013 (UTC)[responder]

Propostas de medidas editar

O Henrique sugeriu acima uma proposta para medir as contribuições por IP no contexto do que está sendo aqui discutido, que vou repetir aqui para não ficar perdido no meu da discussão:

  • "Observar as edições feitas por IPs (e a taxa de reversão) em artigos que estão em destaque na PP e comparar esses valores com os dias que esse artigo não estava em destaque. Acredito que essa informação razoavelmente simples de ser obtida possa ser um primeiro passo para sabermos quanto o destaque de um bom artigo trás de novatos bem intencionados e de vândalos."

Opiniões? Sugestões? --ezalvarenga (discussão) 10h43min de 15 de março de 2013 (UTC)[responder]

O verbete física é destacada. Quando mediram o bóson de Higgs, eu quis adicionar sobre isso. Ainda não o fiz, é verdade. Mas está aí um exemplo. Editar verbetes destacados é mais difícil e diminui a chance de um novo editor da Wikipédia sem algum conhecimento especializado de alguma área editar. Mas suponha que chamemos uns 5 bons físicos, o que eles não poderiam fazer com o exemplo citada? Talvez fazer virar um super super destacado? :D E há verbete aqui com nível 3 ou 4, por exemplo, que se compararmos com a versão anglófona, vemos que é bastante inferior, principalmente em relação às fontes fiáveis. Sempre dá para melhor, ser destacado não significa que é uma pérola intocável. --ezalvarenga (discussão) 11h02min de 15 de março de 2013 (UTC)[responder]
Pelo que sei vc pode ser bem-intencionado mas não é IP nem novato mas, tudo bem, é uma hipótese.--Arthemius x (discussão) 11h11min de 15 de março de 2013 (UTC)[responder]
Ué, mas um professor de física que estiver navegando na Internet e eventualmente ler aqui, poderia tentar editar sem se registrar, principalmente devido a sua falta de tempo e informação sobre como a Wikipédia funciona. Comecei a editar a Wikipédia como IP em 2004, durante meu mestrado. Mas imagino que se o cara errasse o CAPTCHA 2 ou 3 vezes ele poderia pensar "que merda é essa?", desistir e voltar a publicar artigos científicos que pagam a conta no final do mês. :) --ezalvarenga (discussão) 11h17min de 15 de março de 2013 (UTC)[responder]
Sim, eu também editava como IP quando li o primeiro artigo destacado que me interessei, Western, e durante muito tempo achei que era imexível até que depois de relê-lo várias vezes comecei a notar as lacunas e tentei completá-lo mas não sei se ainda era novato pois sabia que poderia causar a fúria dos autores ou autor. Não fui revertido (o que aconteceria atualmente, com certeza) mas o artigo perdeu o destaque, ou seja, depois dessa parei de perder meu tempo com isso e deixei os artigos destacados para seus autores medalhados mas aí já não era mais novato.--Arthemius x (discussão) 11h24min de 15 de março de 2013 (UTC)[responder]

  Artigos destacados e bons: Os itens de necessários ao destaque (Wikipédia:O que é um artigo em destaque?) já deixam pouquíssima margem de mudança a qualquer tipo de usuário, não só IPs, pois artigos destacados são muito completos, corretamente escritos(ortografia), tem conteúdo estável, já tem uma imagem, são perfeitamente wikificados, tem todas as ligações internas, possuem referências e bibliografia verificáveis e layout correto. Esse criterioso processo de seleção já deixa pouquíssimo espaço para eventuais mudanças futuras e são nosso maior patrimônio e, logo em seguida, os Artigos bons que possuem critérios semelhantes. Analisando o artigo de hoje que foi destacado em 24/out/2012, desde lá contei visualmente 8 reversões de edições indevidas de IPs(todas revertidas por humanos). Mas esse artigo tem apenas cerca de 120 visitas diárias, não é muito, tem muito esboço com mais que isso, se analisar os destacados com mais visitas provavelmente notarão uma taxa maior de reversões. JAMAL 11h38min de 15 de março de 2013 (UTC)[responder]

  • Acho que vocês dois tem razão. Analisarmos os destaques da PP pode enviesar a análise. E se, ao invés disso, olhássemos para os artigos das seções "Sabia que" e "Eventos recentes"?? Esta última principalmente direciona muitos IPs para artigos novos e ainda em formulação. Além de serem temas de grande repercussão... José Luiz disc 11h46min de 15 de março de 2013 (UTC)[responder]
  Boa ideia. O seu comentário me deu uma ideia, fazer um histograma da frequência de edições por IP por "tipo" de verbete: destacado, bom, que está na página principal, listados no "Sabia que" e "Eventos recentes" etc.. Seria um bom dado para saber o melhor local para fazer a análise sobre edições de IPs. --ezalvarenga (discussão) 12h12min de 15 de março de 2013 (UTC)[responder]
  • Qualquer lista será arbitrária. Como estou inferindo que o método de coleta dos dados será automático, acho que podemos ser flexíveis e pensar num conjunto maior de dados para posteriormente segmentá-los em categorias. Me parece pacífico que quanto mais acessado, melhor. Seja na PP ou não, portanto a lista de artigos mais acessados é o ponto de partida inicial. Complementar com artigos que eventualmente aparecem na PP daria o trabalho manual de analisar os históricos das predefinições que andaram na PP em determinado período. Tem uma ferramenta num blog que aponta os artigos como o maior aumento percentual na semana. O Cláudio sabe dessa, pode ser um bom insumo para montar a lista também.OTAVIO1981 (discussão) 13h45min de 15 de março de 2013 (UTC)[responder]
Sim, claro, a divisão seria feita a partir de um conjunto grande de dados. O objetivo aqui é deixarmos de achismos e começarmos análise estatística, se bem entendi. Essa análise do que aparece na página principal pode ser feito com um script. Seria até interessante uma comparação do número de acessos dos verbetes quando saem da página principal, boa ideia.
Um script que pega as 25 páginas mais acessadas é o Wikitrends (código). Também acho que é uma boa estratégia analisar verbetes com bastante acesso, mas também seria legal constatar empiricamente se outros verbetes, como os que o Zé mencionou, também sofrem muitas edições por IPs. --ezalvarenga (discussão) 14h00min de 15 de março de 2013 (UTC)[responder]
Pô, dei uma olhada no Javascript do Wikitrends e não parece tão difícil listar os N verbetes mais acessados. Se eu tiver tempo, vou ver se coloco no toolserver no ar a lista dos, hummm..., 100 mais acessados da Wikipédia lusófona. :) Depois. --ezalvarenga (discussão) 14h04min de 15 de março de 2013 (UTC)[responder]
Podia experimentar rodar o script em 3 artigos muito acessados (isto é, com um histórico de edições supostamente longo) e ver quanto tempo demora para fazer a análise. Quando esta sistemática estivesse pronta era só ensinar aos outros o caminho das pedras para aumentar a quantidade de artigos e podemos definir a quantidade de elementos da lista, em função do tempo de análise.OTAVIO1981 (discussão) 17h02min de 15 de março de 2013 (UTC)[responder]

Dados para refletir: Wikipédia em japonês editar

Dados:

  • ptwiki: 24% de todas as edições foram feitas por IPs
  • jawiki: 43 % de todas as edições foram feitas por IPs
  • ptwiki: 20% das edições de IPs foram revertidas
  • jawiki: 3,1% das edições de IPs foram revertidas (uma das menores taxas do mundo)
  • ptwiki: 75% de todas as reversões realizadas em artigos foram revertendo edições de IPs
  • jawiki: 60.9% de todas as reversões realizadas em artigos foram revertendo edições de IPs

  Hipóteses e comentário:

1. A comunidade da Wikipédia em japonês não está nem aí para as edições e não reverte nada (pouco provável)

2. Os IPs que falam japonês são mais bem intencionados e fazem mais edições corretas que os nossos (muito provável)

Revertemos 1 a 5 edições de IPs enquanto na japonesa 1 a cada 33 edições. Me parece que trollagem e edições erradas são fenômenos culturais e são relacionados ao baixo nível educacional e possivelmente relacionados à uma baixa idade média da população; falantes do japonês em sua maioria estão no Japão, que além de ter um alto nível educacional tem uma população com idade média mais avançada(é menos provável que um senhor de 50 anos se dê ao trabalho de vandalizar ou escrever algo errado em um artigo, mais fácil um adolescente de 12 anos fazer isso). Então continuando tudo como está vai demorar bastante tempo, coisa de 20/30 anos para a comunidade lusófona melhorar o nível educacional, envelhecer e parar de ter que se preocupar com reversões. Temos muito trabalho pela frente. JAMAL 12h35min de 17 de março de 2013 (UTC)[responder]

Isto é assustador.

Eu penso que podia haver uma forma de acabarmos com todo este vandalismo de ips, seria se antes das edições dos ips serem publicadas, tivessem de ser aprovadas por um autorrevisor, e desta forma os vandalismo quase nunca passariam, e poderíamos dar aos ips a liberdade de editarem todos os artigos no domínio principal.

Também já não precisariamos de estar a bloquear os ips com a mesma frequência, ou até deixarmos de o fazer.

E não ía ser preciso esperar até os níveis de educação e ética nos países lusofónos alcançarem grandes resultados. Ninux2000 (discussão) 13h10min de 18 de março de 2013 (UTC)[responder]

A ideia me parece boa, Ninux. Mas será que temos autorrevisores o suficiente para não ficarmos sobrecarregados com o número de edições por IPs?
JAMAL, boa observação, comparar as edições por IPs. Dá um bom estudo cultural.
Albmont, se for constatado que IPs de fato sobrecarregam os voluntários da lusófona, uma das coisas que sugeri ao Henrique medir (tenho que colocar isso na página do meta), não me parece tão ruim. Pelo menos para a criação de verbertes, não acho que IPs deveriam ter esse privilégio. --ezalvarenga (discussão) 13h28min de 18 de março de 2013 (UTC)[responder]
@Ninux2000 e Ezalvarenga: Vocês estão brincando, não é? Porque todas estas propostas para proteger a wiki.pt do vandalismo de IPs já foram feitas, e são sempre rejeitadas pelos amiguinhos de IPs. Acho que o pessoal aqui gosta de sofrer. Ou então de aumentar algum contador pessoal de reversões, para se achar útil revertendo 100 IPs por dia. Albmont (discussão) 13h31min de 18 de março de 2013 (UTC)[responder]
IP é uma praga, atrapalha mais quando quer ajudar do que quando quer apenas vandalizar: diff. Um texto completamente referenciado, e lá vem o IP inserir um "por remorso", baseado na cabeça dele. O texto não fala que foi por remorso, pode ser por vários outros motivos, mas o IP tem que botar lá sua opinião. Saco. Albmont (discussão) 13h35min de 18 de março de 2013 (UTC)[responder]
Ezalvarenga, pode ser analisado se o número de edições que são marcadas como patrulhadas equivale ao número de edições feitas. Isso daria uma estimativa do trabalho adicional que seria preciso para manter o patrulhamento o mais actualizado possível. GoEThe (discussão) 14h45min de 18 de março de 2013 (UTC)[responder]

Os autorrevisores podiam passar a serem os únicos com direito ao voto, mas precisarem de apenas 300 edições e 90 dias de registo para serem aprovados. E que tal darmos uma chance ao sistema de supervisão? Só aumenta a liberdade dos ips e diminui drasticamente os vandalismos e as más edições. Ninux2000 (discussão) 17h35min de 18 de março de 2013 (UTC)[responder]

Atualização mensal das estatísticas editar

Talvez esta informação seja de interesse: foi atendido o pedido para que haja atualizações mensais das estatísticas de edições e reversões a partir dos dumps (bug 46212). Conforme o analista de dados da WMF, Erik Zachte:

Fix is online and running. In one week time all wikis will have updated reports. Updates will be supplied monthly.

Helder 17h10min de 24 de julho de 2013 (UTC)[responder]

Para mais informações, confiram o tópico New Edit and Revert Stats do blog do Erik. Helder 16h09min de 25 de julho de 2013 (UTC)[responder]