Recolección de datos estadísticos

Los datos pueden provenir de observaciones reales o de registros elaborados con otros propósitos.

Por ejemplo, con fines de facturación e informes médicos, un hospital registra el número de pacientes que utilizan los servicios de rayos X. Esta información puede organizarse para producir datos que los especialistas en estadística puedan describir e interpretar.

Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones razonadas acerca de las causas y, por tanto, de los efectos probables de ciertas características en situaciones dadas.

Cuando los datos se ordenan de manera compacta y útil, los responsables de tomar decisiones pueden obtener información confiable sobre el entorno y usarla para tomar decisiones inteligentes.

Los expertos en estadística recogen datos de una muestra y utilizan esta información para hacer inferencias sobre la población que representa esa muestra. Así, una población es un todo y una muestra es una fracción o segmento de ese todo.

Los datos pueden organizarse de muchas maneras. Organizar los datos tiene como fin permitirnos ver rápidamente algunas de las características de los datos recogidos. Buscamos cosas como el alcance (los valores mayor y menor), patrones evidentes, alrededor de qué valores tienden a agruparse los datos, qué valores aparecen con más frecuencia, etc.

Cuanta más información de este tipo podamos obtener de una muestra, mejor entenderemos la población de la cual proviene, y mejor será nuestra toma de decisiones.

Debemos tomar en cuenta que:

– Los datos no necesariamente son información
– Tener más datos no necesariamente produce mejores decisiones.
– La meta es resumir y presentar los datos de manera útil para apoyar la toma de decisiones efectiva y ágil.

La razón por la que los datos deben organizarse es ver si existe un patrón en ellos, patrones como el valor más grande y el más pequeño, o el valor alrededor del cual parecen agruparse.

Si los datos provienen de una muestra, se suponen representativos de la población de la que se tomaron. Todos los buenos estadísticos (y usuarios de datos) reconocen que usar datos sesgados o incompletos conduce a malas decisiones.

Fuente: Apuntes de Estadística de la FCA de la UNAM