Usuário:Gildemar Felix/Teste - Erro padrão

A margem de erro é uma estatística que expressa a quantidade de erro amostral aleatório nos resultados de uma pesquisa. Isto é, a margem de erro é a medida do raio ou a metade da largura do intervalo de confiança para a mesma estatística. A margem de erro indica a probabilidade do resultado da amostra ser próximo de 1, se toda população for pesquisada. Geralmente a probabilidade do resultado da amostra estar dentro da margem de erro é de 95%, embora às vezes sejam usados outros valores.{{carece de fontes}} Quanto maior a margem de erro, menor a confiança dos resultados da uma pesquisa serem próximos dos valores reais para toda população.

A margem de erro geralmente é usada em contextos diferentes de pesquisas para indicar o erro observacional para reportar quantidades medidas. Por exemplo, na astronomia reporta–se a margem de erro como 4,2421(16) anos–luz (distância da Proxima Centauri), com o número entre parêntesis indicado o intervalo esperado de valores nos dígitos correspondentes anteriores. Neste caso, 4,2421(16) é equivalente a 4,2421 0,0016.[1] Esta notação com é mais comumente vista em outras áreas da ciência e da engenharia.{{carece de fontes}}

Histórico editar

A margem de erro é uma estimativa do intervalo de confiança[2], conceito introduzido pelo matemático polonês Jerzy Neyman em meados da década de 1930.[3][4] A teoria foi publicada no apêndice do artigo On the Two Different Aspects of the Representative Method: the Method of Stratified Sampling and the Method of Purposive Selection.[5]

Definição formal editar

 
The top portion charts probability density against actual percentage, showing the relative probability that the actual percentage is realised, based on the sampled percentage. Predefinição:Paragraph break In the bottom portion, each line segment shows the 95% confidence interval of a sampling (with the margin of error on the left, and unbiased samples on the right). Note the greater the unbiased samples, the smaller the margin of error.

A margem de erro para uma estatística particular geralmente é definida como o raio ou a metade da largura do intervalo de confiança para a mesma estatística.[6][7]

Então, para o nível de significância de 95% para determinar um intervalo de confiança, tem–se:

 ,

onde   é a função de distribuição cumulativa. {{carece de fontes}}

Decorre o score   pela formação   (ou na tabela de aproximação   pela distribuição normal  ). A posição 0,975 do interior da tabela mostra  .[8][9]

*** incluir figura da tabela de distribuição aproximação de z para normal*** Vamos inserir a imagem?Se for o caso, consultar o Célio e pedir ao Éder (deixar as imagens por último, depois de todas as edições no texto).

Portanto, o intervalo de confiança para nível de significância de 95% é  ,

onde   é o desvio padrão e   é o número da população. {{carece de fontes}}

O raio do intervalo de confiança é  .[8]

Assim, conclui–se que o erro é  . Nos casos das distribuições amostrais, o erro possui um modelo próprio de cálculo.{{carece de fontes}}

Interpretação editar

Quando uma margem de erro é reportada em uma pesquisa, isto refere–se à margem de erro máxima para todas as porcentagens usando a amostra completa da pesquisa. Se a estatística é uma porcentagem, a margem de erro máxima pode ser calculada como o raio do intervalo de confiança para uma porcentagem de 50%. A margem de erro tem sido descrita como uma quantidade absoluta, igual ao raio do intervalo de confiança para a estatística. Por exemplo, se o valor real for 50 pontos percentuais e a estatística tiver raio de intervalo de confiança de 5 pontos percentuais, então pode–se afirmar que a margem de erro é de 5 pontos percentuais.{{carece de fontes}}

Em alguns casos, a margem de erro não é expressa como uma quantidade absoluta. Em vez disto, a margem de erro é expressa como uma quantidade relativa. Por exemplo, supondo que o valor real seja 50 pontos percentuais e que o raio do intervalo de confiança seja 5 pontos percentuais. Se for utilizada a definição absoluta, a margem de erro seria 5 pontos percentuais. Se for utilizada a definição relativa, a margem de erro seria 10% (5 pontos percentuais corresponde a 10% de 50 pontos percentuais). Entretanto, a distinção geralmente não é explícita.{{carece de fontes}}

A margem de erro pode ser definida para qualquer nível de confiança, mas geralmente são escolhidos 90%, 95% (principalmente) ou 99%. Este nível de confiança é a porcentagem de pesquisas repetidas da mesma maneira, cuja margem de erro em torno da porcentagem reportada incluiria a porcentagem real. Junto com o nível de confiança, a configuração da amostra para uma pesquisa e particularmente o tamanho da amostra, determina a magnitude da margem de erro. Uma amostra maior produz uma margem de erro menor, com todo o resto permanecendo igual.{{carece de fontes}}

Se os mesmos intervalos de confiança forem usados, então a margem de erro considera tanto o erro amostral quanto o erro não–amostral. Se um intervalo de confiança aproximado é usado (por exemplo, assumindo que a distribuição é normal e modelando o intervalo de confiança), então a margem de erro pode considerar apenas o erro amostral aleatório. Isto não representa outras fontes de erro ou viés em potencial como uma configuração não representativa de uma amostra, perguntas mal formuladas, pessoas mentindo ou recusando–se a responder, a exclusão de pessoas que não puderam ser contatadas ou erros de contagem ou de cálculo.{{carece de fontes}}

Exemplo editar

De acordo com uma pesquisa realizada em 2 de outubro de 2004 pela Newsweek sobre a campanha presidencial dos Estados Unidos, 47% dos eleitores votariam em John Kerry / John Edwards e 45% dos eleitores votariam em Ralph Nader / Peter Camejo se a eleição acontecesse naquele dia. O tamanho da amostra era de 1.013 pessoas.[10]

Basicamente pesquisas envolvem tomar uma amostra de uma certa população. No caso da pesquisa da Newsweek, a população de interesse são os eleitores. Como é impraticável consultar todos os eleitores, os pesquisadores tomam pequenas amostras que devem ser representativas. Isto é, uma amostra aleatória da população.[11] É possível que os pesquisadores coletem uma amostra de 1.013 eleitores que votarão em Bush, quando na verdade a população está dividida entre Bush e Kerry. Porém, isto é extremamente improvável ( ) Poderíamos explicar em pouquíssimas palavras o que quer dizer a expressão  ? dado que a amostra é aleatória.{{carece de fontes}}

A teoria da amostragem fornece métodos para calcular a probabilidade dos resultados da pesquisa divergirem da realidade simplesmente devido ao acaso. Por exemplo, a pesquisa mostra Kerry com 47% das intenções de votos, mas seu apoio é tão maior quanto 50% ou tão menor quanto 44%. Esta teoria e algumas suposições bayeseanas sugerem que a porcentagem real será razoavelmente próxima de 47%. Quanto mais pessoas forem consultadas, mais confiantes os pesquisadores podem ficar que a porcentagem real é próxima da porcentagem observada (a margem de erro é uma medida do quão próximo os resultados devem estar).{{carece de fontes}}

Entretanto, a margem de erro apenas conta para o erro amostral aleatório. Então, não há correspondência para erros sistemáticos que podem ocorrer pela falta de respostas ou por interações entre a pesquisa e as memórias, as motivações, a comunicação e o conhecimento dos sujeitos.[12]

Cálculo da margem de erro para amostras aleatórias editar

Esta seção discutirá brevemente o erro padrão da porcentagem e o intervalo de confiança correspondente, associando estes dois conceitos à margem de erro. No caso da pesquisa da Newsweek, os cálculos assumem que esta foi baseada em uma amostra aleatória simples de uma grande população.{{carece de fontes}}

O erro padrão de uma proporção ou uma porcentagem   é o desvio padrão estimado e mede a precisão da porcentagem. O erro padrão pode ser estimado apenas a partir da porcentagem   e do tamanho da amostra  , se   for pequeno em relação ao tamanho da população, pela fórmula

 .[13]

Cálculo da porcentagem editar

O cálculo da porcentagem é dado pela atribuição da intenção de voto. Isto é, se uma pessoa afirma que votará em John Kerry, o pesquisador contabilizará um voto para o candidato. Em termos matemáticos, a variável aleatória   recebe valores quando um entrevistado   afirma que votaria em John Kerry e não recebe valores caso contrário. Isto significa que  ,  . {{carece de fontes}}

No caso da pesquisa da Newsweek, John Kerry tem 47% das intenções de voto. Portanto, a porcentagem é obtida a partir da amostra de 1013 pessoas quando

  (equivalente a 47%).{{carece de fontes}}

A densidade de probabilidade deve ser concentrada em torno de  . Então,

 . {{carece de fontes}}

Pela definição de esperança,

 . {{carece de fontes}}

Substituindo   por   obtém–se

 . {{carece de fontes}}

A variação da amostra para a eleição entre os candidatos é dada por

 . {{carece de fontes}}

Este cálculo somente é possível se a amostra for aleatória.{{carece de fontes}}

Decorre que  . {{carece de fontes}}

 . Logo,  .{{carece de fontes}}

Substituindo   por  , obtém–se

 .{{carece de fontes}}

Então, o desvio padrão é  . Portanto, a aproximação pela distribuição normal se torna possível para  . {{carece de fontes}}

Interpretação do resultado editar

No caso da pesquisa da Newsweek, quando a reportagem informar que a margem de erro está para dois pontos percentuais para mais ou para menos, isto refere–se a probalidade de 95% quando a porcentagem   está no intervalo   e  . Caso a amostra não seja uma amostra aleatória simples de uma grande população, o erro padrão e o intervalo de confiança precisam ser estimados por meio de cálculos mais avançados (Linearização e reamostragem são técnicas amplamente usadas para dados de uma complexa configuração de amostras).{{carece de fontes}}

Nota–se que não há necessariamente uma conexão estrita entre o intervalo de confiança real e o erro padrão real. O intervalo de confiança real da porcentagem   é o intervalo  , que contém a porcentagem   da distribuição e em que   da distribuição está abaixo de   e   da distribuição está acima de   . O erro padrão real da estatística é a raiz quadrada da variância real da amostragem da estatística. O intervalo de confiança real e o erro padrão real podem não estar estritamente conectados, embora haja uma relação direta geralmente para grandes distribuições que parecem curvas normais.{{carece de fontes}}

No caso da pesquisa da Newsweek, o nível de apoio de John Kerry era  , para e  . O erro padrão (0,016 ou 1,6%) ajuda a dar a sensação de precisão para a porcentagem estimada para John Kerry. Uma interpretação bayeseana do erro padrão é que, embora a porcentagem real não seja conhecida, é altamente provavelmente que a porcentagem esteja localizada dentro de dois erros padrão da porcentagem estimada. O erro padrão pode ser usado para criar um intervalo de confiança dentro do qual a porcentagem real deve ter um certo nível de confiança.{{carece de fontes}}

A porcentagem estimada mais ou menos sua margem de erro é o intervalo de confiança para a porcentagem (em outras palavras, a margem de erro é metade da largura do intervalo de confiança). Isto pode ser calculado como um múltiplo do erro padrão, com o fator dependendo do nível de confiança desejado. Uma margem de um erro padrão corresponde a um intervalo de confiança de 68%, enquanto a estimativa mais ou menos 1,96 erros padrão corresponde a um intervalo de confiança de 95% e um intervalo de confiança de 99% corresponde a 2,58 erros padrão nos dois lados da estimativa.{{carece de fontes}}

Erros padrões de distribuição amostrais editar

Em estatística, é possível verificar erros para as distribuições amostrais as quais são utilizadas em grande medida para análise de dados. Portanto, os erros das distribuições são:{{carece de fontes}}

Médias editar

O erro da média é utilizada para grandes e pequenas amostras para  .

 {{carece de fontes}}[14]

Proporções editar

 {{carece de fontes}}[15]

Desvio padrão editar

Caso ocorra uma distribuição de   (desvio padrão) por uma aproximação da distribuição normal e  , o erro é calculado por:

 {{carece de fontes}}[16]

No entanto, para casos em que a população não é normal e  , o erro é calculado por:

 {{carece de fontes}}[16]

Medianas editar

Quando  , a distribuição amostral da mediana é próxima de uma distribuição normal e é possível calcular o erro da mediana por:

 {{carece de fontes}}[16]

Primeiro e terceiro quartil editar

Quando  , a posição dos quartis   e   são respectivamente aproximados para o primeiro e terceiro quartil da população utilizando o cálculo do erro da mediana e, para   (posição do segundo quartil) é utilizado o mesmo cálculo do erro da mediana.

 {{carece de fontes}}[16]

Variância editar

Caso ocorra uma distribuição de   (variância) por uma aproximação da distribuição normal e  , o erro é calculado por:

 {{carece de fontes}}[17]

No entanto, para casos em que a população não é normal e  , o erro é calculado por:

 {{carece de fontes}}[17]

Coeficiente de variação editar

O coeficiente de variação da população é dado por por   quando as população possui distribuição aproximadamente ou somente normal é possível encontrar o erro por:

 {{carece de fontes}}[17]

Uso da margem de erro em pesquisas editar

A margem de erro é comumente usada em pesquisas, como pesquisas de opinião, pesquisas de marketing ou pesquisas de rastreamento. Geralmente utiliza–se o nível de confiança de 95%.[18] Entre os exemplos de uso da margem de erro em pesquisas estão a proporção de domicílios da Grande São Paulo preparados para o sinal digital em São Paulo e em 38 municípios da região[19], a aprovação do presidente Donald Trump após derrota do projeto de reforma do Obamacare na Câmara dos Estados Unidos[20] e a porcentagem de brasileiros que consideram urgente a promoção da igualdade de gênero[21].

De acordo com levantamento realizado pelo IBOPE e pela Organização das Nações Unidas (ONU) Mulheres, 75% dos brasileiros consideram de grande importância o desenvolvimento de políticas de igualdade entre homens e mulheres por gestores e legisladores. Para a pesquisa foram ouvidas 2.002 pessoas acima de 16 anos em 143 municípios, entre 16 de fevereiro e 20 de fevereiro de 2017. A margem de erro é de 2 pontos percentuais para mais ou para menos,[21] o que significa uma variação nos dados amostrais.

Segundo levantamento realizado pela empresa de pesquisa de opinião Gallup Poll, 57% das pessoas dizem aprovar e 36% das pessoas dizem desaprovar o desempenho de Donald Trump. O resultado é a média da pesquisa com aproximadamente 1.500 pessoas por meio de ligações telefônicas, entre 24 de março de 26 de março de 2017. A margem de erro é de 3 pontos percentuais para mais ou para menos[20], o que significa que significa uma variação nos dados amostrais.

Conforme levantamento realizado pelo IBOPE, 90% dos domicílios na Grande São Paulo estão preparados para o sinal digital e 10% dos domicílios na Grande São Paulo não possuem conversor ou televisão compatível para assistir aos canais abertos. Entretanto, a proporção de domicílios na Grande São Paulo preparados para o sinal digital está abaixo da meta de 93% do governo para autorizar o procedimento. A margem de erro é de 3 pontos percentuais para mais ou para menos[19], o que significa que significa uma variação nos dados amostrais.

Diferentes níveis de confiança editar

Para uma amostra aleatória simples de uma grande população, a margem de erro máxima E{{{j1}}}    {{{j2}}} é uma simples reexpressão do tamanho da amostra  . Os numeradores destas equações são arredondados em duas casas decimais.{{carece de fontes}}

Para confiança  ,  .{{carece de fontes}}

Para confiança de 99%,  .{{carece de fontes}}

Para confiança de 95%,  .{{carece de fontes}}

Para confiança de 90%,  .{{carece de fontes}}

Se um artigo sobre uma pesquisa não reporta a margem de erro, mas não determina que uma amostra aleatória simples de determinado tamanho foi usada, a margem de erro pode ser calculada para um grau de confiança desejado por meio das fórmulas acima. Também, dada a margem de erro de 95%, é possível encontrar a margem de erro de 99% elevando a margem de erro reportada em cerca de 30%.{{carece de fontes}}

Por exemplo, uma amostra aleatória com tamanho 400 fornecerá uma margem de erro em um nível de confiança de 95% de 0,98 / 2 ou 0,049 – logo abaixo de 5%. Uma amostra aleatória de tamanho 1.600 fornecerá uma margem de erro de 0,98 / 40 ou 0,0245 – logo abaixo de 2,5%. Uma amostra aleatória de tamanho 10.000 fornecerá uma margem de erro em um nível de confiança de 95% de 0,98 / 100 ou 0,0098 – logo abaixo de 1%.{{carece de fontes}}

Margens de erro máximas e específicas editar

Enquanto a margem de erro tipicamente reportada na imprensa é uma imagem da pesquisa que reflete a variação amostral máxima de qualquer porcentagem baseado em todos os entrevistados, o termo margem de erro também refere–se ao radio do intervalo de confiança para uma estatística particular. A margem de erro para uma porcentagem particular individual geralmente será menor que a margem de erro máxima reportada pela pesquisa. Este máximo aplica–se apenas quando a porcentagem observada é 50% e a margem de erro encolhe à medida que a porcentagem aproxima–se dos extremos 0% e 100%.{{carece de fontes}}

Em outras palavras, a margem de erro máxima é o raio de um intervalo de confiança de 95% para uma porcentagem reportada de 50%. Se   move–se para longe de 50%, o intervalo de confiança para   será melhor. Portanto, a margem de erro máxima representa o majorante da incerteza, tem–se 95% de certeza de que a porcentagem real está dentro da margem de erro máxima de uma porcentagem reportada para qualquer porcentagem reportada.{{carece de fontes}}

Efeito do tamanho da população editar

A fórmula acima para a margem de erro assume que há uma população infinitamente grande. Portanto, não depende do tamanho da população de interesse. De acordo com a teoria da amostragem, esta suposição é razoável quando a fração amostral é pequena. A margem de erro para um método amostral particular é essencialmente a mesma, independente do tamanho da população de interesse, contanto que a fração amostral seja menor que 5%.Em casos em que a fração amostral é maior que 5%, analistas podem ajustar a margem de erro com o fator de correção para população finita (FCPF) para considerar a pressão adicional obtida pela amostragem próxima de uma porcentagem maior da população. {{carece de fontes}}

O FCPF pode ser caculado pela fórmula[22] {{carece de fontes}}

Para ajustar a margem de erro para uma grande fração amostral, o FCPF reduz a margem de erro. O FCPF aproxima–se de 0 à medida que o tamanho da amostra   aproxima–se do tamanho da população  , que tem o efeito de eliminar completamente a margem de erro. Isto faz sentido porque quando  , a amostra torna–se um censo e o erro amostral torna–se irrelevante. Os analistas devem estar cientes que as amostras continuam verdadeiramente aleatórias à medida que a fração amostral aumenta para que o viés não seja introduzido.{{carece de fontes}}

Comparação de porcentagens editar

Em um sistema de pluralidade dos votos, em que o ganhador é o candidato com mais votos, é importante saber quem está na frente. Os termos statistical tie e statistical dead heat às vezes são usados para descrever porcentagens que divergem por menos que uma margem de erro, mas estes termos podem ser mal interpretados.[23][24] Por um lado, a margem de erro como é geralmente calculada é aplicável à porcentagem individual, não à diferença entre porcentagens. Então, a diferença entre duas estimativas percentuais pode não ser estatisticamente significante, mesmo quando elas divergem por mais que uma margem de erro. Os resultados da pesquisa também fornecem frequentemente informações relevantes mesmo quando não há diferença estatisticamente significante.{{carece de fontes}}

Quando as porcentagens são comparadas, pode ser útil considerar a probabilidade de uma ser maior que outra.[25] Em situações simples, a probabilidade pode ser derivada pelo cálculo do erro padrão mencionado acima, pela fórmula para a variância da diferença de duas variáveis aleatórias e pela suposição de que se ninguém escolher o candidato A, eles escolherão o candidato B e vice–versa. Elas são perfeitamente e negativamente correlatas. Isto pode não ser uma suposição aceitável quando há mais de duas respostas possíveis para a pesquisa. Para pesquisas mais complexas, fórmulas diferentes para calcular o erro padrão da diferença devem ser usadas.{{carece de fontes}}

O erro padrão da diferença de duas porcentagens   para o candidato A e   para o candidato B, supondo que elas são perfeitamente e negativamente correlatas, é

 {{carece de fontes}}

Dada a diferença da porcentagem observada   (2% ou 0,02) e o erro padrão da diferença mencionado acima (0,03), qualquer cálculo estatístico pode ser usado para calcular a probabilidade de uma amostra de uma distribuição normal com média 0,02 e desvio padrão 0,03 ser maior que 0.{{carece de fontes}}

Probabilidade de erro editar

Em estatística, fala–se em probabilidade de erro quando trata–se de teste de hipótese. Probabilidade de erro significa aceitar a hipótese quando esta deveria ser rejeitada ou rejeitar a hipótese quando esta deveria ser aceita. Em termos matemáticos, o erro de probabilidade é:[26]

 , para os casos em que se aceita a hipótese quando ela deveria ser rejeitada. Ou seja, aceitam a hipótese com dados na região crítica. {{carece de fontes}}

 , para os casos em que se rejeita a hipótese quando ela deveria ser aceita. Ou seja, rejeitam a hipótese com dados fora da região crítica. {{carece de fontes}}

Nestes casos ,  e   são as hipóteses, respectivamente as quais se aceita ou rejeita quando a variável não deveria ser aceita ou rejeitada. Então, em termos de notação   e   pode ser substituído entre si sempre pela hipótese a qual quem realiza o teste de hipótese está assumindo a hipótese a ser rejeitada ou aceita, por exemplo, quem assume   para se aceitar uma hipótese em um teste. Qualquer  , com  , pode ser colocado, desde que fique claro no teste de hipótese a qual será rejeitada e a que será aceita.[26] {{carece de fontes}}

Erro amostral editar

É possível calcular o erro de uma amostra   através da sua média. Importante saber se a amostra a qual o pesquisador tem acesso mostra o desvio padrão, caso contrário deve estimar o desvio padrão. Logo,

 , onde   é o desvio padrão,   é a quantidade da amostra e   é a média da amostra. Caso o desvio padrão   seja desconhecido, então o estima por  . Logo,

 .[27]

Também é possível calcular o erro da proporção de duas amostras. Por exemplo, se um fabricante A de um remédio que evita ataque do coração diz que tem mais efeito do que o atual remédio no mercado, então é possível fazer uma estatística da afirmação do fabricante A. A partir de uma amostra   de uma população ativa na utilização do remédio do mercado e comparando com os usuários (amostra)   do remédio do fabricante A, se obtém por exemplo,   e  . Após observar os usuários tomando os remédios por um período, há a descoberta que 40 pessoas tiveram ataque do coração enquanto tomavam o remédio do fabricante A e os usuários do remédio do mercado teve 58 pessoas com ataque do coração. Ou seja, a proporção de mortes do remédio do fabricante A é   e do remédio do mercado é  . Após o estudo da proporção, existe uma evidência de que a informação do fabricante A está correta, mas ainda não é suficiente.[28]

Através da estatística   é possível verificar se a afirmação do fabricante A é verdadeira. Se  ,   quer dizer se uma população   única e desconhecida terá ataque do coração. Ao invés de estimar   e  , é possível somar as duas proporções das amostras para ter um parâmetro global para estimar o parâmetro  .[29] Então,

 [28]

 

A estatística   é dada por:

 [28]

Substituindo os valores,

 

 

Após consultar a tabela padronizada para o valor  , enconta-se  , o que significa dizer, nível de significância  . Ou seja, existe 19% de chances de   acontecer (de pessoas terem ataque do coração).


No entanto, existe um erro nesse processo medido pelo erro proporcional dado por  , onde   é a proporção da primeira amostra, nesse exemplo   e   a proporção da segunda amostra, nesse exemplo  .[30]

Substituindo,

 

 

 

 

O erro é de 2%.[31]

Erro não amostral editar

Além dos erros mencionados anteriormente. Existe outros erros como:

Erro de arredondamento é utilizado nas contas e também cometido por computadores, pois as máquinas não possuem espaços suficientes para calcular números irracionais ou números racionais com muitas casas decimais. Como em estatística se procura trabalhar com uma amostra muito grande e ao realizar múltiplos arredondamentos de contas, no final ocorrerá um erro considerável e desprezado pelo mercado que utiliza dados estatísticos. Computadores são bastante utilizado na estatística e cometem também erro de truncamento para realizar os seus cálculos. Ou seja, truncar o número 3,4562372881 é decidir a partir de qual casa decimal irá desconsiderar as demais casas decimais à direita do número, então ao truncar 3,4562372881 fica 3,45 e ao arredondar o número 3,4562372881, fica 3,46. Isso são aproximações nos números, podendo ser também um erro de aproximação

Erro provável é conhecido como   de uma estatística  . Esse erro é provável a partir de uma estimativa.

Erro padrão em relação à mínimos quadrados é cometido a partir de uma regressão linear e é dado por

 .

Resíduos (desvios verticais) são estimadores quando   varia em torno da verdadeira reta.

Conceitos relacionados editar

Assim como as margens de erro, intervalos de confiança podem ser calculados para uma série de estatísticas incluindo porcentagens individuais, diferenças entre porcentagens, médias, medianas[32] e totais. A margem de erro para a diferença entre porcentagens é maior que as margens de erro para cada uma destas porcentagens e pode ser ainda maior que a margem de erro máxima para qualquer porcentagem individual de uma pesquisa.{{carece de fontes}}

Intervalo de confiança editar

O intervalo de confiança é um tipo de estimativa por intervalo de um parâmetro populacional desconhecido. O intervalo de confiança contém os valores do parâmetro que quando testados não devem ser rejeitados com a mesma amostra. Como os dados observados são amostras aleatórias da população, o intervalo de confiança construído a partir dos dados também é aleatório. Entretanto, o intervalo de confiança calculado a partir de uma amostra particular não inclui necessariamente o valor real do parâmetro. Os intervalos de confiança são tipicamente estabelecidos no nível de confiança de 95%.[33] No entanto, quando apresentados graficamente, os intervalos de confiança podem ser mostrados em vários níveis de confiança como 90%, 95% e 99%.[34]

Significância estatística editar

A significância estatística é uma medida estimada do grau em que o resultado de um experimento é verdadeiro.[35] Em testes de hipóteses estatísticos[36][37], a significância estatística ou o resultado estatisticamente significante é obtido quando o valor–p observado é menor que o nível de significância definido para o estudo.[38][39][40][41][42][43][44]. O valor–p é o menor nível de significância para o qual se rejeita a hipótese nula.[45] O nível de significância é a probabilidade de se rejeitar a hipótese nula quando ela é verdadeira.[46] Em muitas áreas de estudo, resultados com nível de significância de 0,05 (probabilidade de erro de 5%) são considerados estatisticamente relevantes.[35]

Teste de hipóteses editar

Um teste de hipótese é um método de inferência estatística usando dados de um estudo científico. É um procedimento estatístico baseado na análise de uma amostra, através da teoria de probabilidades, usado para avaliar determinados parâmetros que são desconhecidos numa população. Os testes de hipótese são constituídos de alternativas que são testadas. São fundamentais os seguintes conceitos para um teste de hipótese:

  • Hipótese nula (H0) : é a hipótese que assumimos como verdade para a construção do teste. É o efeito, teoria, alternativa que estamos interessados em testar.
  • Hipótese alternativa (H1) : é o que consideramos caso a hipótese nula não tenha evidência estatística que a defenda.
  • Erro do tipo I: a probabilidade de rejeitarmos a hipótese nula quando ela é efetivamente verdadeira ( )
  • Erro do tipo II: a probabilidade de rejeitarmos a hipótese alternativa quando ela é efetivamente verdadeira. 

Não ficamos de ampliar esta seção, com algumas subseções para os conceitos relacionados? Se não der tempo, indicar os conceitos relacionados e o link para o verbete na Wikipédia. Você acha que vale acrescentar teste de hipóteses? Se sim, você acha que vale usar os termos hipótese nula e hipótese alternativa na seção probabilidade de erro e acrescentar algo como "ver mais em teste de hipóteses" com link para a seção de conceitos relacionados? São perguntas reais (não são perguntas retóricas), porque realmente não tenho muita ideia.

See also editar

Notes editar

  1. «Errors». COSMOS - The SAO Encyclopedia of Astronomy. Swinburne University of Technology. Consultado em 30 December 2013  Verifique data em: |acessodata= (ajuda)
  2. Pegg, Pegg, Ed Jr.; Weisstein, Eric W. «Margin of Error». MathWorld – A Wolfram Web Resource 
  3. Memória, José Maria Pompeu (2004). «Breve História da Estatística» (PDF). Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA) 
  4. «The Legacy of Jerzy Neyman» (PDF) 
  5. Neyman, Jerzy (1934). «On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection». Journal of the Royal Statistical Society. 97 (4): 558 – 625 
  6. Lohr, Sharon L. (1999). Sampling: Design and Analysis. Pacific Grove, California: Duxbury Press. 49 páginas. ISBN 0-534-35361-4. The margin of error of an estimate is the half-width of the confidence interval ... 
  7. Stokes, Lynne; Tom Belin (2004). «What is a Margin of Error?» (PDF). What is a Survey?. Survey Research Methods Section, American Statistical Association. 64 páginas. Consultado em 31 de maio de 2006 
  8. a b Spiegel, Murray R. (2006). Estatística. São Paulo: Pearson. 195 páginas 
  9. Farber, Larson. «Distribuição normal de probabilidade» (PDF). Universidade Federal da Paraíba. p. 9. Consultado em 27 de março de 2017 
  10. «NEWSWEEK POLL: First Presidential Debate» (Nota de imprensa). Newsweek. 2 October 2004. Consultado em 31 de maio de 2006  Verifique data em: |data= (ajuda)
  11. Wonnacott and Wonnacott (1990), pp. 4–8.
  12. Sudman, S.L. and Bradburn N.M. (1982) Asking Questions. Jossey-Bass: pp. 17-19
  13. Sample Sizes, Margin of Error, Quantitative AnalysisArquivado em janeiro 21, 2012, no Wayback Machine
  14. Chiann, Chang. «Estimação para a média» (PDF). IME-USP. p. 17. Consultado em 6 de abril de 2017 
  15. Viali, Lorí. «Amostragem e Estimação» (PDF). PUCRS. p. 13. Consultado em 6 de abril de 2017 
  16. a b c d Spiegel, Murray R. (2006). Estatística. São Paulo: Pearson. 219 páginas 
  17. a b c Spiegel, Murray R. (2006). Estaística. São Paulo: Pearson. 220 páginas 
  18. Doane, David P.; Seword, Lori E. (2014). Estatística Aplicada à Administração e Economia. [S.l.]: AMGH Editora. p. 318 – 319 
  19. a b «São Paulo desliga TV analógica, mas 2 milhões de casas ainda não têm conversor». Estadão. 29 de março de 2017. Consultado em 04 de abril de 2017  Verifique data em: |acessodata= (ajuda)
  20. a b «Aprovação de Trump cai após derrota no Congresso, aponta pesquisa». Folha de S. Paulo. 27 de março de 2017. Consultado em 04 de abril de 2017  Verifique data em: |acessodata= (ajuda)
  21. a b «Para 75% dos brasileiros promoção da igualdade de gênero é urgente, diz pesquisa». The Hunffington Post Brasil. 14 de março de 2017. Consultado em 04 de abril de 2017  Verifique data em: |acessodata= (ajuda)
  22. Isserlis, L. (1918). «On the value of a mean as calculated from a sample». Blackwell Publishing. Journal of the Royal Statistical Society. 81 (1): 75–81. JSTOR 2340569. doi:10.2307/2340569  (Equation 1)
  23. Braiker, Brian. "The Race is On: With voters widely viewing Kerry as the debate’s winner, Bush’s lead in the NEWSWEEK poll has evaporated". MSNBC, October 2, 2004. Retrieved on 2 February 2007.
  24. Rogosa, D.R. (2005). A school accountability case study: California API awards and the Orange County Register margin of error folly. In R.P. Phelps (Ed.), Defending standardized testing (pp. 205–226). Mahwah, NJ: Lawrence Erlbaum Associates.
  25. Drum, Kevin. Political Animal, Washington Monthly, August 19, 2004. Retrieved on 15 February 2007.
  26. a b Viali, Lorí. «Estatística Básica» (PDF). Universidade Federal do Rio Grande do Sul. p. 7. Consultado em 9 de março de 2017 
  27. Moore, David (2000). Estatística Básica e sua Prática. Rio de Janeiro: LTC. 288 páginas 
  28. a b c Moore, David (2000). A Estatística Básica e a Sua Prática. Rio de Janeiro: LTC. 357 páginas 
  29. Moore, David (2000). A Estatística Básica e Sua Prática. Rio de Janeiro: LTC. 354 páginas 
  30. Moore, David (2000). A Estatística Básica e Sua Prática. Rio de Janeiro: LTC. 355 páginas 
  31. Moore, David (2000). A Estatística Básica e Sua Prática. Rio de Janeiro: LTC. 358 páginas 
  32. Income - Median Family Income in the Past 12 Months by Family Size, U.S. Census Bureau. Retrieved February 15, 2007.
  33. Zar, J. H. (1984). Biostatistical Analysis. New Jersey: Prentice Hall International. pp. 43 – 45 
  34. Zhou, Mai. «Formulas for Exam 2» (PDF). University of Kentucky. Consultado em 21 de março de 2017 
  35. a b «Conceitos Elementares de Estatística». Consultado em 1 de fevereiro de 2017 
  36. Sirkin, R. Mark (2005). «Two-sample t tests». Statistics for the Social Sciences 3rd ed. Thousand Oaks, CA: SAGE Publications, Inc. pp. 271–316. ISBN 1-412-90546-X 
  37. Borror, Connie M. (2009). «Statistical decision making». The Certified Quality Engineer Handbook 3rd ed. Milwaukee, WI: ASQ Quality Press. pp. 418–472. ISBN 0-873-89745-5 
  38. Redmond, Carol; Colton, Theodore (2001). «Clinical significance versus statistical significance». Biostatistics in Clinical Trials. Col: Wiley Reference Series in Biostatistics 3rd ed. West Sussex, United Kingdom: John Wiley & Sons Ltd. pp. 35–36. ISBN 0-471-82211-6 
  39. Cumming, Geoff (2012). Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis. New York, USA: Routledge. pp. 27–28 
  40. Krzywinski, Martin; Altman, Naomi (30 de outubro de 2013). «Points of significance: Significance, P values and t-tests». Nature Publishing Group. Nature Methods. 10 (11): 1041–1042. doi:10.1038/nmeth.2698. Consultado em 3 de julho de 2014 
  41. Sham, Pak C.; Purcell, Shaun M (17 de abril de 2014). «Statistical power and significance testing in large-scale genetic studies». Nature Publishing Group. Nature Reviews Genetics. 15 (5): 335–346. doi:10.1038/nrg3706. Consultado em 3 de julho de 2014 
  42. Johnson, Valen E. (9 de outubro de 2013). «Revised standards for statistical evidence». National Academies of Science. Proceedings of the National Academy of Sciences. 110: 19313–19317. doi:10.1073/pnas.1313476110. Consultado em 3 de julho de 2014 
  43. Altman, Douglas G. (1999). Practical Statistics for Medical Research. New York, USA: Chapman & Hall/CRC. 167 páginas. ISBN 978-0412276309 
  44. Devore, Jay L. (2011). Probability and Statistics for Engineering and the Sciences 8th ed. Boston, MA: Cengage Learning. pp. 300–344. ISBN 0-538-73352-7 
  45. Paes, Ângela Tavares (1998). «Itens Essenciais em Bioestatística». Arquivos Brasileiros de Cardiologia. 71 (4) 
  46. Schlotzhauer, Sandra (2007). Elementary Statistics Using JMP (SAS Press) PAP/CDR ed. Cary, NC: SAS Institute. pp. 166–169. ISBN 1-599-94375-1 

References editar

  • Sudman, Seymour and Bradburn, Norman (1982). Asking Questions: A Practical Guide to Questionnaire Design. San Francisco: Jossey Bass. ISBN 0-87589-546-8
  • Wonnacott, T.H. and R.J. Wonnacott (1990). Introductory Statistics 5th ed. [S.l.]: Wiley. ISBN 0-471-61518-8 

External links editar

 
Wikilivros
O Wikilivros tem mais informações sobre Gildemar Felix/Teste - Erro padrão


[[Category:Statistical deviation and dispersion]] [[Category:Errors and residuals]] [[Category:Sampling (statistics)]]