Diferenças entre versões

EntradaVersão de 19h59min de 19 de janeiro de 2011 por KleinerVersão de 22h26min de 15 de julho de 2013 por He7d3r
Informações básicas
Notas:
Descrição: Detectar tentativa de inserir informações de pessoas (supostamente) recentemente falecidas. Não raro, alguns vândalos "matam" alguém que ainda está vivo. O filtro não detecta edições acompanhadas de fontes (inserção de texto contendo "http://" ou "<ref>").
Descrição: Detectar tentativa de inserir informações de pessoas (supostamente) recentemente falecidas. Não raro, alguns vândalos "matam" alguém que ainda está vivo. O filtro não detecta edições acompanhadas de fontes (inserção de texto contendo "http://" ou "<ref>").


Ativando filtro apenas no modo de registro, a princípio, para observação preliminar. --Kleiner
Ativando filtro apenas no modo de registro, a princípio, para observação preliminar. --Kleiner


Retirando bots. Por algum motivo desconhecido, todo o wikitexto de uma edição é armazenado na added_lines, mesmo quando apenas uma única linha é alterada, causando falsos positivos absurdos. Deve ser verificado se isto ocorre só com bots ou com outros usuários também. --Kleiner
Retirando bots. Por algum motivo desconhecido, todo o wikitexto de uma edição é armazenado na added_lines, mesmo quando apenas uma única linha é alterada, causando falsos positivos absurdos. Deve ser verificado se isto ocorre só com bots ou com outros usuários também. --Kleiner


Analisando alguns disparos e fazendo mais alguns testes, percebo que uma configuração eficiente desse filtro será bem mais complicado do que parece, dadas as inúmeras possibilidades de falsos positivos. A priori, evitar certos tipos de falso positivo causam um grande aumento de falsos negativos, deixando o filtro bastante ineficiente. Mais estudos e testes são fundamentais. --Kleiner
Analisando alguns disparos e fazendo mais alguns testes, percebo que uma configuração eficiente desse filtro será bem mais complicado do que parece, dadas as inúmeras possibilidades de falsos positivos. A priori, evitar certos tipos de falso positivo causam um grande aumento de falsos negativos, deixando o filtro bastante ineficiente. Mais estudos e testes são fundamentais. --Kleiner


Desativando filtro, pois não há perspectiva de melhoria a curto prazo, e portanto, tudo o que faz hoje é deixar o sistema mais lento. --Kleiner
Desativando filtro, pois não há perspectiva de melhoria a curto prazo, e portanto, tudo o que faz hoje é deixar o sistema mais lento. --Kleiner
* Remoção de "action='edit'", pois "added_lines" nem está definido nas outras ações. --Helder
* Remoção de parêntesis supérfluos, para consumir menos condições. -- Helder
* Sincronização das regexes em uma única variável, com correções. --Helder
Condições do filtro
Condições:
(ajuda | discussão)
(article_namespace = 0 | article_namespace = 102) & (action = "edit") & !("bot" in user_groups)
dead := '(?:mor(?:t[ao]|rido)|falec(?:imento|id[ao]|eu))(?:[^a-záâãéêíóôõúç]|$)';
&
 
(lcase(added_lines) rlike "(morto|morta|morrido|falecimento|faleceu|falecida|falecido)[^a-z]")
( article_namespace == 0 | article_namespace == 102 )
&
& ! 'bot' in user_groups
!(lcase(removed_lines) rlike "(morto|morta|morrido|faleceu|falecida|falecido)[^a-z]")
& lcase( added_lines ) rlike dead
&
& !lcase( removed_lines ) rlike dead
!(lcase(added_lines) rlike "(http|<ref)")
& !lcase( added_lines ) rlike 'http|<ref'