Processo empírico

Em teoria das probabilidades, um processo empírico é um processo estocástico que descreve a proporção de objetos em um sistema em um dado estado. Para um processo em um espaço de estados discreto, uma cadeia de Markov populacional de tempo contínuo^[1]^[2] ou modelo populacional de Markov^[3] é um processo que conta o número de objetos em um dado estado (sem reescalonamento). Na teoria de campo médio, teoremas do limite (conforme o número de objetos se torna grande) são considerados e generalizam o teorema central do limite para medidas empíricas.^[4] Aplicações da teoria dos processos empíricos surgem na estatística não paramétrica.^[5]

Definição

Para variáveis aleatórias independentes e identicamente distribuídas $X_{1},X_{2},\cdots ,X_{n}$ em $\mathbb {R}$ com função distribuição acumulada comum $F(x)$ , a função distribuição empírica é definida por:

$F_{n}(x)={\frac {1}{n}}\sum _{i=1}^{n}I_{(-\infty ,x]}(X_{i}),$

em que $I_{C}$ é a função indicadora do conjunto $C$ .^[6]

Para todo $x$ fixo, $F_{n}(x)$ é uma sequência de variáveis aleatórias que converge a $F(x)$ quase certamente pela lei forte dos grandes números, isto é, $F_{n}$ converge pontualmente a $F$ . O matemático ucraniano Valery Glivenko e o matemático italiano Francesco Paolo Cantelli fortaleceram este resultado ao provar a convergência uniforme de $F_{n}$ a $F$ pelo teorema de Glivenko–Cantelli.^[7]

Uma versão centralizada e escalonada da medida empírica é a medida sinalizada:

$G_{n}(A)={\sqrt {n}}(P_{n}(A)-P(A)).$

Isto induz um mapa sobre as funções mensuráveis $f$ dado por:

$f\mapsto G_{n}f={\sqrt {n}}(P_{n}-P)f={\sqrt {n}}\left({\frac {1}{n}}\sum _{i=1}^{n}f(X_{i})-\mathbb {E} f\right).$

Pelo teorema central do limite, $G_{n}(A)$ converge em distribuição a uma variável aleatória normal $N(0,P(A)(1-P(A)))$ para um conjunto mensurável fixo $A$ .^[8] De forma semelhante, para uma função fixa $f$ , $G_{n}f$ converge em distribuição a uma variável aleatória normal $N(0,\mathbb {E} (f-\mathbb {E} f)^{2})$ , desde que $\mathbb {E} f$ e $\mathbb {E} f^{2}$ .^[9]

${\bigl (}G_{n}(c){\bigr )}_{c\in {\mathcal {C}}}$ é um processo empírico indexado por ${\mathcal {C}}$ , uma coleção de subconjuntos mensuráveis de $S$ .^[10]

${\bigl (}G_{n}f{\bigr )}_{f\in {\mathcal {F}}}$ é um processo empírico indexado por ${\mathcal {F}}$ , uma coleção de funções mensuráveis de $S$ a $\mathbb {R}$ .^[11]

Um resultado significante na área dos processos empíricos é o teorema de Donsker. Isto levou a um estudo das classes de Donsker: conjuntos de funções com a útil propriedade de processo empíricos indexados por estas classes que convergem fracamente a um certo processo gaussiano.^[12] Ainda que se possa mostrar que classes de Donsker são classes de Glivenko–Cantelli, o contrário não é verdadeiro em geral.

Exemplo

Como um exemplo, considere funções distribuição empírica. Para variáveis aleatórias independentes e identicamente distribuídas de valores reais $X_{1},X_{2},\cdots ,X_{n}$ , elas são dadas por:

$F_{n}(x)=P_{n}((-\infty ,x])=P_{n}I_{(-\infty ,x]}.$

Neste caso, processos empíricos são indexados por uma classe ${\mathcal {C}}=\{(-\infty ,x]:x\in \mathbb {R} \}.$ . Mostrou-se que ${\mathcal {C}}$ é uma classe de Donsker em particular.^[13]

${\sqrt {n}}(F_{n}(x)-F(x))$ converge fracamente em $\ell ^{\infty }(\mathbb {R} )$ a uma ponte browniana $B(F(x))$ .

Referências

↑ Bortolussi, Luca; Hillston, Jane; Latella, Diego; Massink, Mieke. «Continuous approximation of collective system behaviour: A tutorial». Performance Evaluation. 70 (5): 317–349. doi:10.1016/j.peva.2013.01.001
↑ Stefanek, Anton; Hayden, Richard A.; Gonagle, Mark Mac; Bradley, Jeremy T. (4 de junho de 2012). «Mean-Field Analysis of Markov Models with Reward Feedback». Springer, Berlin, Heidelberg. Analytical and Stochastic Modeling Techniques and Applications. Lecture Notes in Computer Science (em inglês): 193–211. ISBN 9783642307812. doi:10.1007/978-3-642-30782-9_14
↑ Dayar, Tuǧrul; Hermanns, Holger; Spieler, David; Wolf, Verena (1 de novembro de 2011). «Bounding the equilibrium distribution of Markov population models». Numerical Linear Algebra with Applications (em inglês). 18 (6): 931–946. ISSN 1099-1506. doi:10.1002/nla.795
↑ Dudley, R. M. (1978). «Central Limit Theorems for Empirical Measures». The Annals of Probability (em inglês). 6 (6): 899–929. ISSN 0091-1798. doi:10.1214/aop/1176995384
↑ Mojirsheibani, Majid. «Nonparametric curve estimation with missing data: A general empirical process approach». Journal of Statistical Planning and Inference. 137 (9): 2733–2758. doi:10.1016/j.jspi.2006.02.016
↑ Billingsley, Patrick (20 de janeiro de 2012). Probability and Measure (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118341919
↑ Wolfowitz, J. (1954). «Generalization of the Theorem of Glivenko-Cantelli». The Annals of Mathematical Statistics (em inglês). 25 (1): 131–138. ISSN 0003-4851. doi:10.1214/aoms/1177728852
↑ Dudley, R. M. (28 de julho de 1999). Uniform Central Limit Theorems (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521461023
↑ Dzhaparidze, K. O.; Nikulin, M. S. (1 de outubro de 1982). «Probability distributions of the Kolmogorov and omega-square statistics for continuous distributions with shift and scale parameters». Journal of Soviet Mathematics (em inglês). 20 (3): 2147–2164. ISSN 0090-4104. doi:10.1007/BF01239992
↑ R., Kosorok, Michael (2008). Introduction to empirical processes and semiparametric inference. New York, N.Y.: Springer. ISBN 9780387749785. OCLC 233972325
↑ Shorack, G.; Wellner, J. (1 de janeiro de 2009). Empirical Processes with Applications to Statistics. Col: Classics in Applied Mathematics. [S.l.]: Society for Industrial and Applied Mathematics. ISBN 9780898716849. doi:10.1137/1.9780898719017
↑ vaart, Aad van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452
↑ Donsker, Monroe D. (1952). «Justification and Extension of Doob's Heuristic Approach to the Kolmogorov- Smirnov Theorems». The Annals of Mathematical Statistics (em inglês). 23 (2): 277–281. ISSN 0003-4851. doi:10.1214/aoms/1177729445

[1] Bortolussi, Luca; Hillston, Jane; Latella, Diego; Massink, Mieke. «Continuous approximation of collective system behaviour: A tutorial». Performance Evaluation. 70 (5): 317–349. doi:10.1016/j.peva.2013.01.001

[2] Stefanek, Anton; Hayden, Richard A.; Gonagle, Mark Mac; Bradley, Jeremy T. (4 de junho de 2012). «Mean-Field Analysis of Markov Models with Reward Feedback». Springer, Berlin, Heidelberg. Analytical and Stochastic Modeling Techniques and Applications. Lecture Notes in Computer Science (em inglês): 193–211. ISBN 9783642307812. doi:10.1007/978-3-642-30782-9_14

[3] Dayar, Tuǧrul; Hermanns, Holger; Spieler, David; Wolf, Verena (1 de novembro de 2011). «Bounding the equilibrium distribution of Markov population models». Numerical Linear Algebra with Applications (em inglês). 18 (6): 931–946. ISSN 1099-1506. doi:10.1002/nla.795

[4] Dudley, R. M. (1978). «Central Limit Theorems for Empirical Measures». The Annals of Probability (em inglês). 6 (6): 899–929. ISSN 0091-1798. doi:10.1214/aop/1176995384

[5] Mojirsheibani, Majid. «Nonparametric curve estimation with missing data: A general empirical process approach». Journal of Statistical Planning and Inference. 137 (9): 2733–2758. doi:10.1016/j.jspi.2006.02.016

[6] Billingsley, Patrick (20 de janeiro de 2012). Probability and Measure (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118341919

[7] Wolfowitz, J. (1954). «Generalization of the Theorem of Glivenko-Cantelli». The Annals of Mathematical Statistics (em inglês). 25 (1): 131–138. ISSN 0003-4851. doi:10.1214/aoms/1177728852

[8] Dudley, R. M. (28 de julho de 1999). Uniform Central Limit Theorems (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521461023

[9] Dzhaparidze, K. O.; Nikulin, M. S. (1 de outubro de 1982). «Probability distributions of the Kolmogorov and omega-square statistics for continuous distributions with shift and scale parameters». Journal of Soviet Mathematics (em inglês). 20 (3): 2147–2164. ISSN 0090-4104. doi:10.1007/BF01239992

[10] R., Kosorok, Michael (2008). Introduction to empirical processes and semiparametric inference. New York, N.Y.: Springer. ISBN 9780387749785. OCLC 233972325

[11] Shorack, G.; Wellner, J. (1 de janeiro de 2009). Empirical Processes with Applications to Statistics. Col: Classics in Applied Mathematics. [S.l.]: Society for Industrial and Applied Mathematics. ISBN 9780898716849. doi:10.1137/1.9780898719017

[12] vaart, Aad van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452

[13] Donsker, Monroe D. (1952). «Justification and Extension of Doob's Heuristic Approach to the Kolmogorov- Smirnov Theorems». The Annals of Mathematical Statistics (em inglês). 23 (2): 277–281. ISSN 0003-4851. doi:10.1214/aoms/1177729445

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]