Selección de la muestra, determinación del universo

Una muestra es un conjunto de unidades, una porción del total, que nos representa la conducta del universo en su conjunto. Una muestra, en un sentido amplio, no es más que eso, una parte del todo que llamamos universo y que sirve para representarlo.

Sin embargo, no todas las muestras resultan útiles para llevar a cabo un trabajo de investigación. Lo que se busca al emplear una muestra es que, observando una porción relativamente reducida de unidades, se obtengan conclusiones semejantes a las que lograríamos si estudiáramos el universo total.

Cuando una muestra cumple con esta condición, es decir, cuando nos refleja en sus unidades lo que ocurre en el universo, la llamamos muestra representativa.

Por lo tanto, una muestra representativa contiene las características relevantes de la población en las mismas proporciones en que están incluidas en tal población. Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo, aunque para ello debamos añadir un cierto margen de error en nuestras proyecciones.

Las fuentes de datos pueden ser personas, situaciones o hechos que se observan directamente, o materiales bibliográficos de diversa naturaleza. Las llamamos unidades de datos y, a su conjunto, a la suma de todas las unidades, se le da el nombre de universo o población.

Podríamos decir que una población o universo es, entonces, el conjunto de todas las cosas que concuerdan con una determinada serie de especificaciones. En general, toda investigación puede considerarse como una búsqueda de los datos apropiados que permitan resolver ciertos problemas de conocimiento. Estos datos son obtenidos a través de un conjunto de unidades que constituyen el universo relevante para la investigación.

Existen universos que resultan demasiado amplios para el investigador, pues éste no tienen ni el tiempo ni los recursos para abordar el estudio de cada una de las unidades que lo componen (el conjunto de ciudadanos de un país, la flora de una región o las innumerables galaxias). Para resolver este inconveniente, se acude a la operacionalización del universo mediante la extracción de muestras.

Las muestras pueden ser clasificadas, en una primera división en probabilísticas y no probabilísticas. En las muestras probabilísticas, la característica fundamental es que todo elemento del universo tiene una determinada probabilidad de integrar la muestra, y esa probabilidad puede ser calculada matemáticamente con precisión.

En las muestras no probabilísticas ocurre lo contrario y el investigador no tiene idea del error que puede estar introduciendo en sus apreciaciones. Las muestras no probabilísticas más usadas son:

Muestra accidental
Es aquella que se obtiene sin ningún plan preconcebido; las unidades elegidas resultan producto de circunstancias fortuitas. Si entrevistamos a los primeros 50 transeúntes que pasan por cierta calle o medimos la profundidad del mar a lo largo de un trayecto entre dos puntos cualesquiera, estaremos en presencia de una muestra accidental; los datos obtenidos podrán o no representar al universo en estudio.

El investigador no puede saber hasta qué punto sus resultados podrán proyectarse, con confiabilidad, hacia el conjunto más amplio que desea conocer.

Muestra por cuotas
Consiste en predeterminar la cantidad de elementos de cada categoría que habrán de integrar la muestra. Así podemos asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100 individuos, asumiendo que ésa es la distribución de la población total.

Por más que esa presunción llegue a ser válida, no deja de existir cierta arbitrariedad en este modo de proceder, por lo que la rigurosidad estadística de las muestras por cuotas se reduce considerablemente.

Muestra intencional
Las unidades se eligen en forma arbitraria, designando a cada unidad según características que para el investigador resulten de relevancia. Se emplea, por lo tanto, el conocimiento y la opinión personal para identificar aquellos elementos que deben ser incluidos en la muestra. Se basa, primordialmente, en la experiencia de alguien con la población.

Estas muestras son muy útiles y se emplean frecuentemente en los estudios de caso, por más que la posibilidad de generalizar conclusiones a partir de ellas, sea en rigor nula. En algunas oportunidades se usan como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.

Muestras aleatorias
Como dijimos, en ellas cada uno de los elementos del universo tiene una probabilidad determinada y conocida de ser seleccionado. Los procedimientos más usuales para la obtención de muestras aleatorias son:

Azar simple
Este procedimiento se inicia confeccionando una lista de todas las unidades que configuran el universo, numerando correlativamente cada una de ellas. Luego, mediante cualquier sistema (tabla de números al azar, programas de computación), se van sorteando al azar estos números hasta completar el total de unidades que deseamos que entren en la muestra.

De este modo, la probabilidad que cada elemento tienen de aparecer en la muestra es exactamente la misma. Si cada uno de los elementos que integran la población no tiene la misma posibilidad de ser elegido, se habla entonces de una muestra viciada. Este método nos garantiza una selección completamente aleatoria, pero resulta muy lento y costoso, pues nos obliga a elaborar listas completas de todas las unidades de interés, lo que a veces es sencillamente imposible.

Por este motivo, sólo se emplea cuando los universos son relativamente pequeños. Este método no será adecuado si, por ejemplo, queremos sacar una muestra de todas las personas analfabetas que existen en un país. En cambio, si nuestra intención es extraer una muestra del universo de todos los alumnos que ingresan a una universidad en un determinado año, resultará muy adecuado.

Azar sistemático
También se requiere de un listado completo de las unidades que integran el universo en estudio.

Muestras por conglomerados
Esta técnica tiene utilidad cuando el universo que se requiere estudiar admite ser subdividido en universos menores de características similares a las del universo total. Se procede a subdividir el universo en un número finito de conglomerados y, entre ellos, se pasa a elegir algunos que serán los únicos que se investigarán; esta elección puede realizarse por el método del azar simple o por el del azar sistemático.

Una vez cumplida esta etapa, puede efectuarse una segunda selección, dentro de cada uno de los conglomerados elegidos, para llegar a un número aún más reducido de unidades muestrales.
La ventaja de esta técnica es que obvia la tarea de confeccionar el listado de todas las unidades del universo. Su desventaja mayor radica en que, al efectuarse el muestreo en dos etapas, los errores muestrales de cada una se van acumulando, lo que da un error mayor que para los métodos anteriores.

La técnica de conglomerados suele utilizarse cuando queremos extraer muestras de los habitantes de un conjunto geográfico amplio, por ejemplo, una gran ciudad o un conjunto de pueblos, por lo que se procede a tomar cada pueblo o grupo de manzanas como un conglomerado independiente; del mismo modo, se la utiliza para conocer las reservas forestales y marinas, para estudiar las estrellas y otros casos semejantes.

Muestras estratificadas
Este método supone que el universo puede desagregarse en sub – conjuntos menores, homogéneos internamente pero heterogéneos entre sí. Cada uno de estos estratos se toma luego como un universo particular, de tamaño más reducido, y sobre él se seleccionan muestras según cualquiera de los procedimientos anteriores.

Por ejemplo, si quisiéramos estudiar las actitudes políticas de los estudiantes de una universidad, podríamos subdividir en estratos de acuerdo con el tipo de estudios que cursen, suponiendo que estas actitudes van a ser diferentes entre quienes siguen Ingeniería, Letras, Medicina u otras carreras. Luego, efectuaríamos un muestreo dentro de cada sub – universo así definido para, finalmente, realizar un análisis integrando los resultados de todas las sub – muestras.

Tanto en el muestreo estratificado como en el de conglomerados, la población se divide en grupos bien definidos. Usamos el muestreo estratificado cuando hay una amplia variación entre los grupos. Usamos el muestreo por conglomerados en el caso opuesto: cuando hay una variación considerable dentro de cada grupo, pero los grupos son esencialmente similares entre sí.