10.4 Necesidad de especificar una muestra.

La especificación de una muestra requiere de varios pasos particulares, pero de forma invariable esta sujeta a la pregunta que se busca responder al realizar un experimento, y a la cantidad de esfuerzo y dinero que se puede invertir para realizar dicho experimento.

El proceso de diseño y toma de muestra no es puramente matemático: Los objetivos del experimento deben especificarse, y esto involucra especificar variables que podrían ser importantes, el equipo de muestreo a usar, cuanto esfuerzo se puede invertir, …
Toda esta información, es la que ayuda a elegir un método de estimación a usar.

En este punto, se hace la pregunta: ¿Qué tan grande debe ser la muestra que voy a tomar?

El tamaño de la muestra es muy importante para asegurar la representatividad de la población que se esta muestreando, pero también lo es para poder evaluar el efecto de un tratamiento al realizar un experimento (en, por ejemplo, diseños experimentales factoriales o por bloques, o análisis tan sencillos como pruebas \(t\)).

La elección del tamaño de la muestra requiere de la especificación de:

  • La prueba a utilizar.
  • El nivel de significancia mínimo a usar (tradicionalmente, 1%, 5% o 10%).
  • El tamaño del efecto a contrastar.
  • La potencia deseada para la prueba (usualmente, 80%).

La potencia tiene como valor el que su consideración obliga al investigador a pensar en términos de la fuerza de los efectos que su experimento es probable produzca.
Aquí, la información a priori comienza a ser de vital importancia.

Particularmente en el contraste de hipótesis El trabajo del investigador no es demostrar que un tratamiento no produce el mismo efecto que el control, es demostrar la efectividad del tratamiento.

El tamaño de la muestra a usar tiene que ser tal que: * Permita determinar si un efecto dado (su magnitud) puede interpretarse como suficientemente confiable o válido como para que la comunidad científica acepte una hipótesis. * Permita determinar (o se determina tal que) que tan probable es que los datos de un estudio resulten en una significancia estadística antes de que el estudio se haya llevado a acabo.

No solo es profesionalmente autodestructivo el diseñar experimentos que no tengan una alta probabilidad de éxito, sino que no es ético el hacerlo por la simple razón de que se consumen recursos escasos (monetarios, de esfuerzo o tiempo).