jueves, 5 de octubre de 2017

El papel de las muestras en Estadística

Podemos entender la Estadística como la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos necesarios, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones sobre dicha población.

Consideramos población o universo al conjunto de todos los elementos (individuos, objetos o fenómenos) que son objeto de nuestro estudio estadístico. 

Lo que ocurre es que, en muchas ocasiones, es muy complicado realizar el estudio sobre toda la población por alguno de los siguientes motivos:
  • Porque la población es muy numerosa y sería muy laborioso obtener los datos de todos sus elementos.
  • Porque sería muy costoso económicamente realizar el estudio con todos los individuos.
  • Porque al realizar dicho estudio desaparecen los objetos estudiados y, al acabar el proceso, no tendríamos individuos. Por ejemplo, estamos estudiando el número de horas que pueden estar encendidas las bombillas de un cierto modelo. Si realizamos el estudio sobre todas las bombillas existentes nos quedaríamos sin ninguna porque todas acabarían fundidas. El estudio sería muy preciso pero no tendríamos bombillas para vender...
Es por este motivo por el que frecuentemente decidimos realizar el estudio sobre una parte de la población a la que denominamos muestra




Como puedes observar en el gráfico anterior, la muestra seleccionada debe ser representativa del total de la población (hay tornillos de todos los tipos, marrones, naranjas, blancos...), puesto que después de analizar los datos de la muestra y extraer conclusiones sobre ella, pretendemos generalizar (inferir) dichas conclusiones a toda la población.

El proceso que sigue la Estadística Inferencial sería, pues, el siguiente:


El muestreo es el proceso que se sigue para seleccionar un conjunto de individuos de una población con el fin de estudiarlos y poder caracterizar el total de la población.


El proceso de selección de la muestra es fundamental para que el estudio estadístico sobre la población sea correcto.
Existen numerosos métodos para realizar muestreos estadísticos. Suele elegirse aquel que se considera que es el más adecuado para el estudio que queremos realizar.


El muestreo es útil gracias a que podemos acompañarlo de un proceso inverso, que llamamos generalización o inferencia.
Pero, la generalización de los resultados de una muestra a una población conlleva aceptar que cometemos cierto error, tal y como ilustra el siguiente esquema:


Afortunadamente, el error que cometemos al generalizar resultados puede acotarse gracias a la estadística. Para ello usamos dos parámetros: 
  • El margen de error, que es la máxima diferencia que esperamos que haya entre el dato observado en la muestra y el dato real en la población.
  • El nivel de confianza, que es el nivel de certeza que tenemos de que realmente el dato real esté dentro del margen de error.

Entonces, ¿qué tamaño de muestra necesito usar para estudiar cierta población? 
Depende del tamaño de la población y del nivel de error que esté dispuesto a aceptar. Cuanta más precisión exijamos, mayor tamaño de muestra necesito. Si quiero tener una certeza absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que ser tan grande como mi universo.
Pero el tamaño de la muestra tiene una propiedad fundamental que explica porqué el muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad podría resumirse como sigue: "a medida que estudio poblaciones mayores, el tamaño de muestra que necesito cada vez representa un porcentaje menor de dicha población". Observa el siguiente cuadro en el que nos indica el tamaño de muestra necesaria para tener un error del 5% con un nivel de confianza del 95%:

Los datos anteriores nos dicen que por grande que sea la población (o universo), con 385 personas puedo estudiar cualquier dato con el mismo nivel de error (margen de 5%, confianza de 95%). Por esta razón el muestreo es tan poderoso: nos permite hacer afirmaciones altamente precisas de una gran cantidad de individuos a través de un parte muy pequeña de los mismos.

Según lo que acabamos de ver, los estudios estadísticos realizados con rigor son altamente fiables. La estadística no se equivoca, son las personas que hacen estudios estadísticos las que se equivocan, en muchos casos de forma deliberada, para obtener conclusiones que son favorables a sus intereses.


Resumimos a continuación las principales ventajas e inconvenientes de usar muestreo frente a estudiar toda la población.

Ventajas:
  • Necesitamos estudiar menos individuos por lo que necesitaremos menos recursos (tiempo y dinero).
  • La manipulación de datos es mucho más simple. Si con una muestra de 1.000 personas tengo suficiente, ¿para qué quiero analizar un fichero de millones de registros?
Inconvenientes:
  • Introducimos error (controlado) en el resultado, debido a la propia naturaleza del muestreo y a la necesidad de generalizar resultados.
  • Tenemos el riesgo de introducir sesgos debido a una mala selección de la muestra. Por ejemplo, si la forma en que seleccionamos individuos para la muestra no es aleatoria, los resultados sobre la población pueden verse seriamente afectados.

No hay comentarios:

Publicar un comentario