6.2 Función de distribución.

Sea \(X\) una variable aleatoria cualquiera, la función de distribución, denotada como \(F(x) : \mathbb{R} \rightarrow \mathbb{R}\) (lo cual se lee como: \(F(x)\) toma un número real y lo transformar en otro número real) se define como la probabilidad: \[F(x) = P(X \le x)\]

Vemos entonces porque la llamamos también función de probabilidad acumulada, ya que \(F(x)\) denota la probabilidad acumulada hasta el valor observado \(x\).
También notamos que, como las probabilidades son todas mayores o iguales a cero, y que la probabilidad del espacio muestral en su totalidad es \(1\), la función de distribución se define entre \(0\) y \(1\).

Al igual que antes, se hace necesario distinguir entre la función de distribución en el caso discreto y en el caso continuo.

Caso discreto. Si \(X\) es una v.a. discreta con función de distribución \(f(x)\), entonces se define: \[F(x) = \sum_{t \le x} f(t)\]

Ejemplo. Para el ejemplo anterior dado para la función de probabilidad de una v.a. discreta, podemos construir la función de distribución considerando todos los intervalos donde la probabilidad se mantenga contante. De esta forma obtenemos: \[F(x) = \begin{cases} 0, & x < 1 \\ 0{,}3, & 1 \le x < 2 \\ 0{,}8, & 2 \le x < 3 \\ 1, & x \ge 3 \\ \end{cases}\] cuyo gráfico se muestra a continuación.

ggplot(NULL, aes(x = 1:3, y=c(.3, .8, 1))) +
  geom_point(size = 3) +
  geom_line(aes(x = c(0, 1), y = c(0, 0)), linewidth = 2) +
  geom_line(aes(x = c(1, 2), y = c(.3, .3)), linewidth = 2) +
  geom_line(aes(x = c(2, 3), y = c(.8, .8)), linewidth = 2) +
  geom_line(aes(x = c(3, 4), y = c(1, 1)), linewidth = 2) +
  geom_point(aes(x = c(1, 2, 3), y = c(0, .3, .8)), size = 3, shape = 21, fill = "white") +
  ylab("F(x)") + xlab("x") +
  theme_light()

Caso continuo. Si \(X\) es una v.a. continua con función de distribución \(f(x)\), entonces se define: \[F(x) = \int_{-\infty}^x f(t)dt\]

Ejemplo. Se tiene una variable aleatoria \(X\) con función de probabilidad dada por: \(f(x) = \begin{cases}\vert x\vert, & -1 < x < 1 \\ 0 & \text{ de otra forma}\end{cases}\). La obtención de la función de distribución se obtiene aplicando la definición en cada intervalo en los que la definición de \(f(x)\) cambia. Empezando con el intervalo de \((-\infty, -1)\), se tiene: \[F(X) = \int_{-\infty}^-1 0dx = 0\] Luego, en el intervalo \([-1,0)\) se tiene: \[F(X) = \int_{-1}^x -xdx = (1-x^2)/2\] y así seguimos hasta obtener \(F(x)\) en todos los reales: \[F(x) = \begin{cases} 0, &x \le -1 \\ (1-x^2)/2, &-1 \le x < 0 \\ (1+x^2)/2, &0 < x \le 1 \\ 1, &x \ge 1 \\ \end{cases}\] cuyo gráfico se muestra a continuación.

ggplot(NULL, aes(x = c(-1.5, -1), y=c(0, 0))) +
  geom_line(linewidth = 2) +
  geom_line(aes(x = seq(-1, 0, by = .1), y = (1 - seq(-1, 0, by = .1) ** 2) / 2), linewidth = 2) +
  geom_line(aes(x = seq(0, 1, by = .1), y = (1 + seq(0, 1, by = .1) ** 2) / 2), linewidth = 2) +
  geom_line(aes(x = c(1, 1.5), y = c(1, 1)), linewidth = 2) +
  ylab("F(x)") + xlab("x") +
  theme_light()

6.2.1 Propiedades de la función de distribución.

La función de distribución resulta ser muy importante desde el punto de vista matemático, pues siempre puede definirse dicha función para cualquier variable aleatoria y a través de ella quedan representadas todas las propiedades de la variable aleatoria.

Cualquier función que cumpla las siguientes propiedades es una función de distribución, sea que tenga o no una variable aleatoria asociada.

  • \(F(x)\) está acotada por arriba por \(1\), lo cual se puede escribir como \[\lim_{x\rightarrow\infty} F(x) = 1\]. Esto es así dado que la probabilidad de todo el espacio muestral es \(1\).
  • \(F(x)\) está acotada por abajo por \(0\), lo cual se puede escribir como \[\lim_{x\rightarrow-\infty} F(x) = 0\]. Esto es así dado que las probabilidades son no negativas.
  • \(F(x)\) es monótona no decreciente, esto es, si \(x_1 \le x_2\), entonces \(F(x_1) \le F(x_2)\).
  • \(F(x)\) es continua por la derecha, lo cual se puede escribir como \[F(x) = \lim_{x\rightarrow x_0^+} F(x)\].