Wikipédia:Esplanada/propostas/Solução técnica para o "problema" da dupla grafia - segundo round (14nov2014)

Solução técnica para o "problema" da dupla grafia - segundo round (14nov2014)

A problemática da dupla grafia, cujo exemplo mais emblemático parece ser o das palavras seção e secção, foi discutido aqui, nos idos de 2012, sem que no entanto se chegasse a um consenso a respeito da implementação, ou não, dos códigos pt-pt e pt-br (criação da página MediaWiki:Lang e das subpáginas MediaWiki:Lang/pt-br e MediaWiki:Lang/en).

Decorridos cerca de 2 anos, eis que decidi implementar várias melhorias na predefinição {{Citar livro}}, até que ontem deparei-me com o problema da dupla grafia no parâmetro "seção". A nível de código, tudo bem: criei diversos aliases (apelidos) para o parâmetro, então ele será reconhecido pela predefinição independentemente de o usuário grafar seção, Seção, secao, Secao, secção, Secção, seccao ou Seccao. Porém, no momento em que a predefinição transclui o código, ela exibe a palavra seção (ou então Seção, caso o parâmetro capítulo não seja declarado). E daí o problema da dupla grafia veio novamente à tona, o que me levou a iniciar uma discussão para definir como que esse problema seria tratado.

Foi aí que o He7d3r mencionou a possibilidade de se usar {{#switch:{{int:Lang}}|pt-pt=secção|pt-br=seção|se(c)ção}}, embora isso necessite antes ser implementado. Se implementado, esse recurso verificará qual foi o idioma que o editor selecionou em Especial:Preferências#mw-prefsection-personal (seção Internacionalização, campo Língua) e, com base nisso, escolherá o que exibir para o leitor: seção (caso identifique o código pt-BR) , secção (caso identifique o código pt-PT), ou se(c)ção (caso não identifique o código, ou o código identificado não seja nem pt-BR nem pt-PT).

  • A presente proposta procura estender a proposta inicial do Helder, sugerindo:
    • [1] Que o recurso "Lang" seja implementado; e
    • [2] Que nessa implementação a grafia seção seja exibida somente caso o código pt-BR seja detectado: caso contrário, será exibido sempre secção.

→A justificativa para [1]: o novo acordo ortográfico uniformizou algumas coisas, como o fez ao abolir, por exemplo, alguns grafemas consonânticos que não são pronunciados (como é o caso do 'c' em acção e do 'p' em óptimo, por exemplo) e os acentos agudos das palavras cujas sílabas são tônicas mesmo se o acento agudo não for grafado (como é o que ocorre em européia e em idéia, por exemplo), porém o mesmo acordo ortográfico manteve a dupla grafia no caso de seção / secção. Como o próprio acordo instituiu a dupla grafia, não vejo por que os artigos e outras páginas (discussões, predefinições etc.) não possam usar dupla grafia – e utilizar-se de um recurso tecnológico para adequar a grafia a quem está lendo a página. Isso nada mais é do que aplicação prática do acordo ortográfico: tanto quanto abolir acentos ou consoantes que não são pronunciadas. Tentar manter somente a grafia "seção" ou somente a grafia "secção" é forçar uma única grafia, o que contraria o acordo.

→A justificativa para [2]: até onde sei, somente a variante dialetal do Brasil (pt-BR) diverge significativamente da portuguesa (pt-PT). Digo: em Timor-Leste, Moçambique, Angola etc. existem diferenças, claro (vide tabela abaixo, que atribui um código de variante dialetal para cada país), mas a grafia e pronúncia são essencialmente as mesmas, naqueles países: pelo menos a ponto de não ser necessária a implementação tecnológica que eu mesmo, como brasileiro, sinto necessidade de ver ser implementada para o pt-BR. Inclusive, tive a oportunidade de estudar com uma professora Angolana e uma colega de sala moçambicana e ambas falavam como em Portugal: mesmo sotaque ("Todox temox sutáke"), uso de palavras como "ficheiro" e "registo" (ao invés de "arquivo" e "registro"), uso do infinitivo em segunda pessoa ("O que estás a fazer?") ao invés do gerúndio em terceira ("O que você está fazendo?"), e assim por diante.

LínguaCódigo ISO 639-1PaísCódigo ISO 3166-1 alfa-2Resultado (variante dialetal)
Portuguêsptpt
PortuguêsptAngolaAOpt-AO
PortuguêsptBrasilBRpt-BR
PortuguêsptCabo VerdeCVpt-CV
PortuguêsptGuiné-BissauGWpt-GW
PortuguêsptMoçambiqueMZpt-MZ
PortuguêsptPortugalPTpt-PT
PortuguêsptSão Tomé e PríncipeSTpt-ST
PortuguêsptTimor-LesteTLpt-TL

Se implementado, o recurso "Lang" poderá posteriormente ser aplicado a outros casos de dupla grafia. Um problema / limitação está nos artigos em que a variante pt-BR esteja presente junto com pt-PT (código "misto"). Já no caso de predefinições como {{Citar livro}}, {{Citar web}} etc., isso é mais simples de se resolver e o recurso "Lang" pode vir a ser um recurso poderoso e muitíssimo útil.Sampayu 19h51min de 14 de novembro de 2014 (UTC)[responder]

Adendo: observem que em [2] eu estou basicamente sugerindo que no lugar de {{#switch:{{int:Lang}}|pt-pt=secção|pt-br=seção|se(c)ção}} nós usemos {{#switch:{{int:Lang}}|pt-br=seção|secção}}. Em outras palavras: se o editor estiver conectado e a opção de idioma dele for pt-BR, ser-lhe-á exibida a palavra seção. Caso contrário – se o editor estiver desconectado, ou, caso conectado, ele não estiver usando pt-BR – a palavra a ser exibida por padrão será secção.Sampayu 01h51min de 15 de novembro de 2014 (UTC)[responder]

Pra quem estiver conectado, a solução é perfeita. Mas quando se está desconectado é que surgem complicações... Por que escolher uma variante como padrão e não a outra? Max51diga! 16h08min de 15 de novembro de 2014 (UTC)[responder]
Então... Esse é um problema que acontecerá independentemente de a solução tecnológica acima ser adotada ou não. A diferença é que, usando a solução tecnológica, pelo menos quando o usuário (brasileiro, ou não-brasileiro mas que prefira usar pt-BR) estiver conectado ele verá a grafia brasileira. Já o que estiver desconectado, bem, este é um caso a se discutir: pode-se adotar pt-PT ou pt-BR ou ainda uma grafia "mista" (como por exemplo se(c)ção, anónimo/anônimo etc.). Aí já é outro ponto de discussão... Mas independentemente do que se decida naquele outro ponto de discussão, ao meu ver deveria pelo menos ser possível usar aquele {{#switch:{{int:Lang}}|pt-pt=grafia_PT|pt-br=grafia_BR|grafia_dupla}} para resolver problemas menos complexos, como é o caso da palavra seção/secção na predefinição {{Citar livro}}.

Em outras palavras: por que não implementar logo esse recurso (para ser possível aplicá-lo em situações mais simples como essa da palavra seção/secção dentro de predefinições) e depois pensar em como aproveitar melhor esse recurso em casos mais complexos (como por exemplo um artigo cheio de palavras em que há dupla grafia)?Sampayu 16h23min de 15 de novembro de 2014 (UTC)[responder]
Notem que atualmente o MediaWiki só dispõe das opções "pt" (que tem sido usado para misturar as variantes) e "pt-BR" (que, geralmente não tem expressões que só sejam usadas fora do Brasil) para a interface em Português. Então, a não ser que venha a ser criado o pt-PT que sugeri na outra discussão (no software e no Translatewiki, não aqui), só poderia ser utilizado isso:

{{#switch:{{int:Lang}}|pt-br=seção|en=section|it=sezioni|[outro código de idioma já suportado pelo MediaWiki]=...|secção}}

Helder 16h50min de 16 de novembro de 2014 (UTC)[responder]
Acabei de ver que, em 2013, o Lijealso já estava tentando utilizar o recurso que está sendo proposto aqui, ao criar a Predefinição:Label e a Predefinição:Autodescription. Helder 18h17min de 16 de novembro de 2014 (UTC)[responder]
Obrigado, He7d3r, pelo ajuste no código.  E sim, realmente essa funcionalidade é bem interessante: natural que outros editores já tenham, até mesmo instintivamente, tentado encontrar alguma maneira de explorar esse recurso. Como eu havia comentado antes, o Novo Acordo Ortográfico "oficializou" a dupla grafia, então usar duas grafias está correto, é ortográfico: tudo agora resume-se a implementar um recurso tecnológico que permita usar dupla grafia de maneira mais cômoda e transparente para quem lê. Sou superfavorável a esse recurso e estou ansioso para poder usá-lo. Sampayu 21h39min de 16 de novembro de 2014 (UTC)[responder]
Uma outra aplicação de {{int:Lang}} é em páginas que potencialmente seriam utilizadas por editores de outras wikis, e que atualmente têm conteúdo em inglês misturado com outras partes em português. Por exemplo, Wikipédia:Robôs/Pedidos de aprovação/PtwikisBot e Wikipédia:Esplanada/geral. Helder 11h16min de 20 de novembro de 2014 (UTC)[responder]

Bom, pelo visto ninguém se opôs à implementação disso. Talvez alguém até questione a utilidade prática, mas, provavelmente devido à ausência de um aspecto prejudicial, até o momento nenhum argumento surgiu opondo-se à implementação desse recurso tecnológico que, inclusive, já é usado na en-wiki no Commons. Então creio que a "carta branca" esteja dada.Sampayu 21h43min de 22 de novembro de 2014 (UTC)[responder]

Na verdade isso não é usado na enwiki. Se referia ao Commons? Helder 23h59min de 22 de novembro de 2014 (UTC)[responder]
Isso, isso. Commons. Sampayu 00h07min de 23 de novembro de 2014 (UTC)[responder]