Sobreajuste: diferenças entre revisões

Conteúdo apagado Conteúdo adicionado
KLBot2 (discussão | contribs)
m Bot: A migrar 10 interwikis, agora providenciados por Wikidata em d:Q331309
Correção gramatical da palavra sobre-ajuste, conforme revisão ortográfica do português de 2008 (DECRETO Nº 6.583, DE 29 DE SETEMBRO DE 2008 da Presidência da República do Brasil).
Linha 1:
[[Imagem:Overfitting.svg|300px|right|thumb|Sistema de predição em que a linha verde representa um modelo sobreajustado e a linha preta um modelo regularizado.]]
'''SobrejusteSobre-ajuste''' (do [[inglês]]: ''overfitting'') é o termo, em [[aprendizagem de máquina]], [[estatística]] e afins, para quando o [[modelo estatístico]] se ajusta em demasiado ao [[conjunto de dados]]/[[amostra]]. É comum que a amostra apresente desvios causados por erros de medição ou fatores aleatórios, ocorre o sobreajustesobre-ajuste quando o modelo se ajusta a estes. Um modelo sobreajustadosobre-ajustado apresenta alta [[precisão]] quando testado com seu conjunto de dados porém tal modelo não é uma boa [[representação]] da [[realidade]] e por isso deve ser evitado.
É bem comum que estes modelos apresentem considerável [[variância]] e que seus [[gráficos]] tenham várias pequenas [[oscilação|oscilações]], por tanto espera se que modelos representativos sejam [[convexos]]. Uma ferramenta para contornar este problema é a [[regularização]], que adiciona à [[função custo]] o valor dos parâmetros. Tal resulta na eliminação de parâmetros de pouca importância e por tanto em um modelo mais convexo, do qual que se espera que seja mais representativo da realidade.
Através da [[validação cruzada]], em que testamos o nosso modelo em relação a uma parte reservada do conjunto de dados que não foi utilizada no treino do modelo em questão, é possível se ter uma ideia de se o modelo sofre de sobreajustesobre-ajuste ou não.
 
==Ver também==