Muestras representativas

muestraestadistica

Los estudios muestrales y, en concreto, las encuestas, forman parte de nuestro día a día. La fiabilidad de sus resultados depende mucho de una correcta elección de muestras representativas sobre la población a estudiar. Veamos una reflexión al respecto.

Vivimos inmersos en un mundo de datos en el que, de manera continua, queremos conocer las tendencias, las opiniones o los gustos de una población o grupo de personas en particular. Los motivos por los que puede ser necesario un estudio poblacional concreto pueden ser muchos y muy variados; por ejemplo, poder predecir el resultado electoral antes de que las elecciones se celebren, conocer los gustos o las preferencias de los consumidores para así poder lanzar un nuevo producto con garantías de éxito, conocer la opinión de la sociedad frente a una u otra cuestión, etc. Los motivos por los que pueda ser importante un estudio poblacional son muchos, y su importancia en la época actual, capital.

La mejor manera de poder conocer la opinión de la población sobre uno u otro tema sería poder preguntar la opinión persona por persona, encuestar a toda la población; en este caso, evidentemente, los resultados finales serían los correctos pero este método, aparte de que sería carísimo, es también inviable, sobretodo cuando hablamos de poblaciones de miles o millones de individuos. No obstante, la estadística nos ha brindado una herramienta muy útil para poder efectuar un estudio de una población con garantías de fiabilidad, de un modo barato y con grandes expectativas de éxito, es decir, con un margen de error controlado. Como es imposible poder llegar a preguntar al respecto a toda la población, podemos intentar llegar a una parte de la misma, podemos escoger una muestra, y del resultado del estudio muestral se puede deducir, con un margen de fiabilidad más que aceptable, cómo actuará la población en su conjunto ante tal o cuál tema estudiado.

Es decir, que si escogemos muestras bien definidas de n integrantes sobre una población total de N individuos, el comportamiento de la muestra n será muy probablemente igual al de la población N. Para entender este concepto haré un símil sencillo, si tiramos un dado sólo seis veces es bastante improbable que consigamos que no se repita ningún número, aunque cada número tenga la misma probabilidad de salir seguramente se repetirá algún resultado; ante un número pequeño de intentos, el resultado final es imprevisible. No obstante, si tiramos diez mil veces el dado, muy probablemente la frecuencia en la que obtendremos los resultados será más que parecida a la esperada, es decir, un sexto de las tiradas obtendremos un uno, un sexto de las tiradas obtendremos un dos y así, sucesivamente, hasta llegar al seis.

Muestra representativa es aquella que posee calidad y tamaño apropiado para hacer mínimos los errores de muestreo. Si la inferencia estadística realiza generalizaciones sobre el comportamiento de una población estudiando solo una parte limitada de ella (muestra) entonces si la muestra (o las muestras) no es representativa la inferencia carecerá de valor científico“. Cita de la monografía del enlace anterior.

forges

Este concepto anterior es muy importante para poder elegir la muestra a entrevistar, cuanto mayor sea la muestra, más se parecerá a la población original, más representativa será y el resultado del estudio de su distribución se podrá inferir, con una alta probabilidad, al estudio de la distribución de la población total. Escoger muestras representativas en los sondeos de opinión es vital; si no escogemos correctamente una muestra, si ésta no es representativa, corremos el riesgo de obtener resultados incorrectos. El tamaño muestral es muy importante en la representatividad, pero también hay otro factores que influyen en que nuestras muestras puedan ser representativas, el criterio de elección de la muestra debe ser objetivo e independiente, veamos dos ejemplos más o menos actuales:

  • Imaginemos que en una población de ocho millones de personas acuden dos millones a una manifestación en la que se reivindica una cuestión concreta. Si entrevistamos a estos dos millones de personas sobre esta cuestión, probablemente obtendremos unos resultados favorables a la cuestión reivindicada, una abrumadora mayoría. Ahora bien,aunque en este caso la muestra sea lo suficientemente grande, n dos millones contra N ocho millones, no lo es el criterio de elección. Una muestra así no es representativa y sus resultados no son correctos.
  • De igual manera, pretender que los seis millones que se han quedado en casa están todos en contra del ideal de la manifestación anterior es estadísticamente tan erróneo como pretender lo contrario según el punto anterior. En este caso tenemos un n de seis millones sobre N de ocho millones, pero tal muestra tampoco es representativa porque estamos eliminando de la población a estudiar precisamente a los dos millones que sí fueron a la manifestación; además, seguramente en estos seis millones “silenciosos” habrá muchísima gente de acuerdo con las ideas de los que fueron a manifestarse, pero que no fueron por diversos motivos, por desidia, por distancia, o lo que fuera.

forges2

En las noticias de actualidad, y más en los tiempos que corren, podemos observar cómo se usan los datos estadísticos al antojo de quien los promueve. Por ejemplo, si hacemos un estudio de intención de voto en unas elecciones y escogemos una muestra lo suficientemente grande sobre la población total pero sólo en las zonas de votantes de cierto partido, los resultados que obtendremos serán inconsistentes. Por lo tanto, queda claro que tan importante es el tamaño muestral como la independencia y el criterio de elección de la muestra. Al respecto del tamaño, hay cálculos matemáticos que nos pueden determinar con fiabilidad el mínimo de personas a tener en cuenta en una muestra, admitiendo un error determinado o “alfa” (por ejemplo, con un alfa del 5%, es decir, con un noventa y cinco por ciento de probabilidad, el resultado de la encuesta es XXX), aunque si queremos la máxima fiabilidad cuanto mayor sea la muestra menor alfa, siempre, claro está, que el criterio de elección sea el correcto. Respecto la independencia de la muestra, no hay un criterio matemático al respecto, es una decisión del entrevistador; cuanto más objetiva sea tal decisión, mejor.

Retomando el tema anterior, si bien una muestra de dos millones versus ocho de población no es representativa en cuanto a inferir el resultado a la población total, sí que es un síntoma claro de que algo importante pasa, y es inútil negarlo afirmando que la mayoría que no haya ido a manifestarse está en contra de tal cuestión. Argumentos así son pueriles y carentes de rigor científico aunque desgraciadamente sean demasiadas veces titulares en la prensa, provocando desinformación. La actualidad está llena de ejemplos así, seamos serios, por favor.