Desigualdad de Dvoretzky-Kiefer-Wolfowitz

En la teoría de probabilidades y estadística, la desigualdad Dvoretzky–Kiefer–Wolfowitz predice cómo cerca una función de distribución empíricamente decidida será a la función de distribución de la cual las muestras empíricas se dibujan. Se nombra por Aryeh Dvoretzky, Jack Kiefer y Jacob Wolfowitz, que en 1956 demostró

la desigualdad con C constante multiplicative no especificado delante del exponente a la derecha. En 1990, Pascal Massart demostró la desigualdad con C constante agudo = 1, confirmando una conjetura debido a Birnbaum y McCarty.

La desigualdad DKW

Considerando un número natural n, deje X, X, …, X valorarse del modo verdadero independiente e idénticamente distribuyó variables arbitrarias con la función de distribución F (·). Deje a F denotar la función de distribución empírica asociada definida por

:

F_n (x) = \frac1n \sum_ {i=1} ^n \mathbf {1} _ {\\{X_i\leq x\}}, \qquad x\in\mathbb {R}.

</matemáticas>

La desigualdad Dvoretzky–Kiefer–Wolfowitz salta la probabilidad que la función arbitraria F se diferencia de F por más que un ε constante dado> 0 en todas partes en la verdadera línea. Más exactamente, hay estimación unilateral

:

\Pr\Bigl (\sup_ {x\in\mathbb R} \bigl (F_n (x) - F (x) \bigr)> \varepsilon \Bigr) \le e^ {-2n\varepsilon^2 }\\qquad \text {para cada }\\varepsilon\geq\sqrt {\\tfrac {1} {2n }\\ln2},

</matemáticas>

que también implica una estimación dos colindada

:

\Pr\Bigl (\sup_ {x\in\mathbb R} |F_n (x) - F (x) |> \varepsilon \Bigr) \le 2e^ {-2n\varepsilon^2 }\\qquad \text {para cada }\\varepsilon> 0.

</matemáticas>

Esto refuerza el teorema de Glivenko-Cantelli cuantificando el precio de convergencia ya que el n tiende al infinidad. También estima la probabilidad de la cola de la estadística de Kolmogorov-Smirnov. Las desigualdades encima siguen del caso donde F corresponde para ser la distribución uniforme en [0,1] en vista del hecho

esto F tiene las mismas distribuciones que G (F) donde G es la distribución empírica de

U, U, …, U donde éstos son independientes y Uniformes (0,1), y notando esto

:

\sup_ {x\in\mathbb R} |F_n (x) - F (x) | \stackrel {d} {=} \sup_ {x \in \mathbb R} | G_n (F (x)) - F (x) | \le \sup_ {0 \le t \le 1} | G_n (t)-t |,

</matemáticas>

con la igualdad si y sólo si F es continuo.



Buscar