Wikipédia:Software/Anti-vandal tool/badwords/Cabeçalho

Ferramenta antivandalismo
Monitoramento de edições Manutenção da ferramenta
( Com palavras inadequadas | Com erros | De IPs | Nos vigiados | Todas ) ( Palavras inadequadas | Erros comuns | Documentação | Código-fonte | Bugs? )

A página Wikipedia:Software/Anti-vandal tool/badwords consiste numa "lista negra" com palavras e expressões regulares que são destacadas na página monitorizar filtro (caso tenha ativado a ferramenta anti-vandalismo).

Sinta-se à vontade para aprimorar esta lista, mas faça-o com responsabilidade, pois as alterações afectam todos os usuários que estejam a usar a ferramenta anti-vandalismo. Se tiver dúvidas ou quiser sugerir novas palavras e/ou expressões, pode utilizar a página de discussão.

Instruções

editar
  • Cada linha da lista negra corresponde a uma palavra e/ou expressão regular;
  • As linhas que começam com "<" são ignoradas pelo filtro, sendo consideradas comentários na lista.
  • As linhas que começam e terminam com "/" ou "\" são interpretadas como expressões regulares:
    • Expressões que começam e terminam nas bordas das palavras[1] são colocadas entre barras inclinadas ("/.../")
    • As strings que devem ser detectadas em qualquer posição no texto, são colocadas entre barras inclinadas invertidas ("\...\")
    • Pode-se utilizar ferramentas como o regexpal e o rubular para testar o que cada expressão regular detecta
  • As demais linhas são interpretadas literalmente, e não como expressões regulares. Isso inclui as linhas que contêm apenas uma barra inclinada, como por exemplo /ganh(e|ar?) ou ganh(e|ar)/, e como tal essas linhas frequentemente terão resultados diferentes do esperado. Para corrigir, inclua as duas barras, como em /ganh(e|ar?)/ ou /ganh(e|ar)/
  • O gadget não distingue maiúsculas de minúsculas, por isso não é necessário escrever "palavra" e "PALAVRA", basta uma delas.
  • Caso uma edição contenha mais do que uma ocorrência, apenas a primeira é destacada. Por exemplo, considerando que as palavras "haha" e "piada" estejam nesta lista, se aparecer numa edição que piada haha apenas a primeira palavra (piada) é destacada.
  • Caso seja adicionada na lista uma expressão regular que não seja interpretada correctamente pelo anti-vandal tool, ao visualizar a página monitorizar filtro é indicada nessa página a expressão regular que está a ser ignorada pelo script e a linha onde ocorreu esse erro.
  • Para usar a versão mais recente da lista negra ao filtrar as mudanças recentes, deve forçar o seu navegador a ignorar qualquer cópia da página que ele possa ter guardado no cache. Para isso, abra esta página e, mantendo premida a tecla shift, actualize-a. De seguida, faça o mesmo na página monitorizar filtro.
Exemplos de expressões regulares
Exemplo Palavras detectadas Explicação
/[cs]egueta/ "cegueta" e "segueta" Os símbolos [ e ] servem para detectar qualquer um dos caracteres que forem colocados dentro destes.
/ac?ção/ "ação" e "acção" O símbolo ? serve para indicar que é "opcional" a presença do caractere (ou expressão) que estiver à sua esquerda.
/ba(rra)?cada/ "barracada" e "bacada" Caso parecido com o anterior, mas a função "opcional" é aplicada a um grupo (rra) e não um só caracter. O símbolo ( ) é utilizado para agrupar as expressões.
/fix(e|ola|ix)/ "fixe", "fixola" e "fixix" O símbolo | significa "ou".
/p+a+t+o/ "pato", "paaatto", etc. O símbolo + indica que a expressão anterior ocorre 1 vez ou mais de forma repetida.
/lo*l/ "ll", "lol", "loool", etc. O símbolo * indica que a expressão anterior pode não ocorrer, ocorrer 1 vez ou mais de forma repetida.
/p.ta/ "pota", "p1ta", "p$ta", etc. O símbolo . indica que pode ser um caracter qualquer.
/exemplo\.com/ "exemplo.com" A expressão \. interpreta o ponto final como um caracter, ao contrário do exemplo anterior.
/nota [1-9]/ "nota 1", "nota 2" até "nota 9" O símbolo - nesta caso é utilizado para indicar o intervalo de caracteres desde o "1" até o "9"
/amo[-_ ]?te/ "amo-te", "amo_te", "amo te" e "amote". O símbolo - para ser interpretado como caractere, deve ser colocado no início ou no fim dos parênteses rectos.
/re[cçs]s?ebo/ "recebo", "reçebo", "ressebo", "recsebo" e "reçsebo" Exemplo para detectar erros ortográficos.
/re([]|ss?)ebo/ "recebo", "reçebo", "ressebo" e "resebo" Técnica alternativa. Para estes casos deve ser usado o exemplo anterior por conter menos caracteres (ver notas seguintes sobre limitações quanto ao tamanho da lista)
  1. Note, no entanto, que em JavaScript o suporte a expressões regulares contendo caracteres acentuados é incompleto, então uma palavra como "aeróbico" poderia ser tratada como se fossem duas ("aer" e "bico")
  • Algumas expressões regulares presentes na lista negra são propositadamente redundantes. Por exemplo, /calote(ir[oa])?/ pode ser simplificado como calote pois os resultados serão os mesmos. No entanto, como a lista está a ser desenvolvida e corrigida, poderá ser necessário alterar mais tarde /calote(ir[oa])?/ para /calote(ir[oa])/, e nesse caso já não é redundante.
  • Deve-se ter algum cuidado ao acrescentar mais informação na lista, pois sobrecarrega o Anti-vandal tool e o navegador de cada utilizador. O programa não funciona se a página tiver mais de 50Kb. A lista está constantemente a ser actualizada de forma a optimizar o filtro e diminuir o tamanho da página. Os endereços de sites acrescentados à lista devem ser aqueles que são incluídos bastantes vezes em várias páginas, e não uma só página. Para isso pode-se vigiar o artigo. Consultar também a página Ligações externas.