Abrir menu principal

Wikipédia:Esplanada/geral/Pesquisa sobre páginas eliminadas (29dez2013)

Gostaria de compartilhar com vocês a seguinte pesquisa que fiz sobre páginas eliminadas. Não temos muitos dados sobre o assunto, então acho que essas estatísticas podem ser úteis para compreender melhor as eliminações, e talvez orientar aprimoramentos em políticas e procedimentos. Todos os dados são sobre páginas eliminadas em 2013.

Tabela A
até 1 hora entre 1h
e 24h
entre 24h
e 1 mês
mais de
1 mês
6631 (31%) 12568 (59%) 1266 (6%) 774 (4%)

A Tabela A lado mostra os artigos eliminados pela regra 20 da eliminação rápida (conteúdo impróprio) por tempo decorrido entre a criação e eliminação da página. A concentração das eliminações nas primeiras 24 horas após a criação dos artigos mostra que a grande maioria dos artigos que são identificados como impróprios são eliminados rapidamente.

Tabela B
até 1 mês entre 1 mês
e 1 ano
entre 1 ano
e 2 anos
entre 2 anos
e 4 anos
entre 4 anos
e 6 anos
mais de
6 anos
189 (17%) 96 (9%) 69 (6%) 193 (18%) 271 (25%) 266 (25%)

A tabela B mostra os artigos eliminados por consenso/votação (PEs) por tempo decorrido entre a criação e eliminação da página. Os números mostram que as PEs eliminam artigos de diversas idades, sendo metade artigos criados a mais de 4 anos.

Tabela C
Regra páginas eliminadas
20 21480 (50,5%)
R1 6138 (14,4%)
ESR 4034 (9,5%)
A1 3354 (7,8%)
6 3194 (7,5%)
PE 1295 (3,0%)
5 714 (1,6%)
9 427 (1,0%)
13 408 (0,9%)
VDA 342 (0,8%)
#R 206 (0,5%)
(sem tag) ~200 (0,4%)

A tabela C mostra as regras de eliminação mais usadas em páginas dos domínios principal e Anexo. Os números mostram que metade das páginas foram eliminadas com a regra 20 da ER, aproximadamente 10% das eliminação foram feitas com eliminação semirrápida e 3% com eliminação por consenso/votação. Os dois últimos números mostram as eliminações sem uso de predefinições de eliminação, no qual "#R" são páginas que começam por "#Redirec..." em sua última edição antes da eliminação e "(sem tag)" as demais páginas em que não foram encontradas predefinições de eliminação em sua última edição.

Tabela D
Criadas por
registrados
Criadas
por IPs
Total
Criadas e mantidas 43020 4960 47980
Criadas e eliminadas 14706 22633 37339
Total de criadas 57726 27593 85319
Páginas criadas e eliminadas em 2013

A tabela D mostra as páginas criadas em 2013 nos domínios principal e Anexo separados por criador e por mantidas e eliminadas. Ela é interessante para ajudar em discussões sobre os IPs. A tabela mostra que os IPs respondem por 32% das criações de páginas nos domínios de conteúdo, e 82% dessas páginas criadas por IPs são eliminadas, enquanto 25% das páginas criadas por registrados são eliminadas, os IPs criam menos páginas, porém com uma proporção maior de páginas eliminadas. Para ver esses números ao longo de 2013 fiz o gráfico ao lado colocando a segunda linha da tabela (criadas e eliminadas) divididas por semana. Podemos ver no gráfico que no período em que o CAPTCHA estava desativado (de abril a julho) teve um aumento nas páginas criadas por IPs e eliminadas, podemos também ver que houve uma queda para os IPs entre o meio de outubro e meio de novembro, provavelmente devido ao filtro 113.

Esses são os números que achei interessantes, se quiserem outros números ou cruzamentos com esses dados posso conseguir também. Espero que esses números sejam úteis para discussões sobre eliminações e sobre IPs. Danilo.mac(discussão) 20h15min de 29 de dezembro de 2013 (UTC)

Pesquisa muito boa Danilo! E ela só comprova o que eu penso a respeito dos IPs. Eles são responsáveis por somente 32% da criação de páginas, porém 82% delas são deletadas contra apenas 25% de usuário registrados. Silent (discussão) 22h11min de 29 de dezembro de 2013 (UTC)
pois é, concordo, até já usei para reforçar um ensaio rss. Tetraktys (discussão) 22h24min de 29 de dezembro de 2013 (UTC)
Também gostei da pesquisa. Sempre que puder, compartilhe estas pesquisas com agente!:)
Minha opinião sobre IPs: artigos criados por IPs são colocados no domínio "rascunho". rs Guiwp (discussão) 00h34min de 30 de dezembro de 2013 (UTC)
Continuaria dando trabalho para a gente da mesma forma. O ideal seria banir a criação de artigos por IPs. Silent (discussão) 00h40min de 30 de dezembro de 2013 (UTC)
Também acho. Mas fazer o que? São as políticas. Discordo a respeito de "banir IPs" do projeto, no entanto acredito que tirar alguns privilégios de IPs faz sentido (que é o que você propôs: não deixar IPs criarem artigos). Não porque seria a única solução, mas porque os IPs não vândalos se cadastrariam, enquanto que os IP vândalos iriam embora! Tudo se resolveria (teoricamente rs) \o/ Guiwp (discussão) 01h23min de 30 de dezembro de 2013 (UTC)
Criadas em 2013 e mantidas

Minha intenção com a pesquisa não era atacar os IPs, apesar de os números não lhes serem favoráveis, então fiz um gráfico ao lado para as páginas cridas e mantidas, pensando que no período do captcha desativado iria mostrar um aumento também das páginas criadas por IPs que foram mantidas, mas parece que isso não aconteceu. O gráfico mostra que o número de páginas criadas por IPs que foram mantidas se mantiveram em um patamar baixo durante o ano inteiro, com uma subida leve no fim de fevereiro. Já as páginas criadas por registrados que foram mantidas apresentam grandes flutuações, das quais se destacam um pico no início de maio e uma queda significativa no início de setembro, mas não sei a que eventos essas variações estão relacionadas. Danilo.mac(discussão) 02h14min de 30 de dezembro de 2013 (UTC)

Excelente pesquisa Danilo, copiei ela pois depois é mais dificil encontra-la. Concordo com o que Guiwp explicou logo acima. DARIO SEVERI (discussão) 03h04min de 30 de dezembro de 2013 (UTC)

ConsequênciaEditar

Esta pequisa está servindo como argumento para esta proposta: Wikipédia:Esplanada/propostas/Criação de novos artigos: limitar a somente registrados (27jun2019). Acredito que vocês, que acharam esta pesquisa interessante, gostariam de opinar na proposta. Por isto, notifico-lhes: Danilo.mac, !Silent, Tetraktys, Guiwp e DARIO SEVERI.--Mister Sanderson (discussão) 16h43min de 28 de junho de 2019 (UTC)