Relación de conceptos
- Variables: es una característica que, al ser medida en diferentes individuos o unidades de análisis, es susceptible de adoptar diferentes valores o diferentes respuestas.
- Cuantitativas: aquellas cuyos valores son numéricos. Estas se dividen en cuantitativas discretas y Cuantitativas continuas.
- Cualitativas: aquellas cuyos valores son del tipo categórico, es decir, que indican categorías o son «nombres».
- Unidad de análisis: se refiere a cada uno de los sujetos que son objeto de investigación.
- Valores categóricos: respuestas categóricas que toma la variable cuando es medida.
- Valores numéricos: respuestas numéricas que toma la variable cuando es medida.
- Nominal: nombra el valor de la variable e identifica distintas categorías sin seguir un orden específico. El concepto “nominal” sugiere que su uso es etiquetar o nombrar.
- Ordinal: además de nombrar el valor de la variable, también asigna un orden a los datos. Esto implica que un número de mayor cantidad tiene un más alto grado de atributo en comparación con un número menor, pero las diferencias entre los rangos pueden no ser iguales.
- Intervalo: mide las variables de manera numérica y permite establecer distancias entre los individuos.
- Razón: es la escala numérica más sofisticada y permite la mayor profundidad en el análisis estadístico. En ella, el cero significa ausencia de la característica, lo que lleva a influir en los resultados promedio. Se pueden establecer relaciones y proporciones entre las unidades de análisis.
- Escala Likert: es una escala psicométrica, comúnmente utilizada en cuestionarios y es la escala de uso más amplio en encuestas para la investigación, principalmente en ciencias sociales.
- Escala Guttman: se basa en el principio de que algunos ítems indican en mayor medida la fuerza o intensidad de la actitud. Califica de 1 a 5, siendo 1 lo menos intenso y 5 lo más intenso.
- Escala diferencial semántico: consiste en una serie de adjetivos extremos que califican el objeto de actitud, ante las cuales se solicita la reacción del sujeto. Se califica al objeto de actitud con un conjunto de adjetivos bipolares, también con calificación de 1 a 5, en donde 1 califica lo negativo y 5 califica lo positivo.
- Estadística: estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
- Descriptiva: permiten caracterizar el comportamiento de cada una de las variables que fueron medidas en el grupo de estudio o población.
- Inferencial: permiten demostrar que existe efecto de una variable denominada independiente sobre otra variable denominada dependiente.
- Investigación cuantitativa: es deductiva, las preguntas de investigación e hipótesis se plantean antes de recolectar y analizar los datos.
- Análisis de la información: se buscan las relaciones lógicas de esos datos, utilizando los conocimientos científicos generados por otros investigadores.
- Clasificación de la información: al agrupar los resultados de las observaciones en término de las veces que éstos se repiten, da lugar a las llamadas «series de frecuencias» o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, según que los caracteres de estudio se refieran a atributos o variables respectivamente.
- Graficación de la información: es la representación en figuras de los datos clasificados.
- Indicadores: los conceptos teóricos que define con exactitud esta variable.
- Población: también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones.
- Medidas de tendencia central: estadígrafos descriptivos como la moda, la media y la mediana, que miden la tenencia de los datos hacia el centro.
- Medidas de dispersión: estadígrafos descriptivos como la varianza, la desviación estándar, el coeficiente de variación y el rango, que determinan la variabilidad de los datos en la población.
- Medidas de posición: estadígrafos descriptivos como los cuartiles, deciles y percentiles, que definen qué proporción de la población puede tener un valor máximo.
- Medidas de forma: estadígrafos descriptivos como el coeficiente de asimetría y el coeficiente de curtosis que determinan cómo se distribuyen los datos en una curva denominada curva normal.
- Media, Mediana, Moda: Medidas de tendencia central.
- Varianza, Desviación estándar, rango, coeficiente de variación: medidas de dispersión.
- Cuartiles, deciles, percentiles: medidas de posición.
- Coeficiente de asimetría, coeficiente de curtosis: medidas de forma.
- Paramétrica: es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales.
- No paramétrica: es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.
- ANOVA: análisis de Varianza, que desagrega en fuentes de variación que influyen sobre la respuesta de la variable independiente. Método aplicado como prueba de hipótesis
- Prueba t: se aplica cuando la población estudiada sigue una distribución normal pero el tamaño muestral es demasiado pequeño como para que el estadístico en el que está basada la inferencia esté normalmente distribuido, utilizándose una estimación de la desviación típica en lugar del valor real.
- Tukey: Prueba de comparaciones múltiples. Se basa en la construcción de intervalos de confianza de las diferencias por pares. Si estos intervalos incluyen al 0, entonces no se rechaza la hipótesis nula.
- Duncan: Prueba de comparación de rangos múltiples. Se prueban las diferencias entre las medias empezando con la media más grande contra la segunda más grande, y así sucesivamente, comparando en cada caso con un valor crítico obtenido por tablas.
- Chi cuadrado: es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.
- Intervalos de confianza: intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional.
- Mann Whitney: es una prueba no paramétrica aplicada a dos muestras independientes.
- Kruskall wallis: es un método no paramétrico para probar si un grupo de datos proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los datos reemplazados por categorías.
Escalas de medición: necesidad y función
La escala de medida de una característica tiene consecuencias en la manera de la presentación de la información y el resumen. La escala de medición –grado de precisión de la medida de la característica– también determina los métodos estadísticos que se usan para analizar los datos (Christensen, 1990). Dependiendo del tipo de variable cualitativa o cuantitativa que se tenga, se pueden tener diferentes escalas de medición.
De acuerdo con los valores que toman, las variables asumen escalas de medición o asignación de ciertos resultados siguiendo unas reglas determinadas (Manotas, 1997). Por ejemplo: se ha determinado que para la variable “género”, los resultados que se pueden obtener según la regla son sólo dos: femenino o masculino.
Las escalas de medición más comunes son: nominal, ordinal, intervalo y razón.
Escala de medición nominal
Nombra el valor de la variable e identifica distintas categorías sin seguir un orden específico. El concepto “nominal” sugiere que su uso es etiquetar o nombrar. Para el procesamiento de datos los nombres pueden ser remplazados por números, pero en ese caso, el valor cuantitativo de los números dados es irrelevante. Los únicos tipos de comparaciones que se pueden hacer con este tipo de variables son los de igualdad o diferencia. Las comparaciones “mayor que” o “menor que” no existen entre nombres, así como tampoco operaciones tales como la adición, la substracción, etc. (Cochran, 2001).
Ejemplos: estado marital; género; raza; credo religioso; afiliación política; lugar de nacimiento; el número de seguro social; el sexo; los números de teléfono; entre otros.
Escala de medición ordinal
Además de nombrar el valor de la variable, también asigna un orden a los datos. Esto implica que un número de mayor cantidad tiene un más alto grado de atributo en comparación con un número menor, pero las diferencias entre los rangos pueden no ser iguales (Cochran, 2001). Ejemplos: la dureza de los minerales; los resultados de una carrera de caballos; actitudes como preferencias o prejuicio; el nivel socioeconómico; orden de llegada de los corredores; entre otros.
Escala de medición de intervalo
Mide las variables de manera numérica y permite establecer distancias entre los individuos (Cochran, 2001). Ejemplos: la fecha de nacimiento; la temperatura ambiental; las puntuaciones de una prueba; la escala de actitudes; las puntuaciones de IQ; conjuntos de años; entre otros.
Escala de medición de razón
Es la escala numérica más sofisticada y permite la mayor profundidad en el análisis estadístico. En ella, el cero significa ausencia de la característica, lo que lleva a influir en los resultados promedio. Se pueden establecer relaciones y proporciones entre las unidades de análisis (Cochran, 2001). Ejemplo: un niño que pesa 12 kg tiene el doble de peso que uno que pesa 6 kg.
Los niveles de medición en la estadística descriptiva e inferencial
La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis (Christensen, 1990). Las escalas de medición de intervalo y de razón son las más características de las variables cuantitativas, para las cuales se aplican la mayor cantidad de procedimientos estadísticos. En estas se puede calcular medidas de tendencia central como el promedio, la mediana y la moda; medidas de dispersión como la varianza, la desviación estándar, el rango y el coeficiente de variación; medidas de posición como los cuartiles, los deciles y los percentiles y medidas de forma como el coeficiente de asimetría y el coeficiente de curtosis.
Todos estos estadígrafos son calculados desde la estadística descriptiva, pues ellos permiten caracterizar el comportamiento de cada una de las variables que fueron medidas en el grupo de estudio o población.
Si el propósito de la investigación busca una profundidad explicativa en los resultados, entonces debe hacerse uso de la estadística inferencial, la cual utiliza como base la estadística descriptiva con todos sus estadígrafos, y luego aplica pruebas estadísticas que permiten demostrar que existe efecto de una variable denominada independiente sobre otra variable denominada dependiente.
Con base en lo anterior, podemos concluir que la estadística es una herramienta que utiliza la investigación de enfoque cuantitativo, pues permite validar la hipótesis y convertirla en teoría. O sea, hace el proceso de generación de conocimiento científico mediante el uso del método científico con todos sus pasos, que dan rigor científico a los resultados de investigación.
A continuación, se muestran unos cuadros resúmenes sobre el análisis estadístico más frecuentemente aplicado de acuerdo al tipo de variables que se tengan y a la relación o asociación que se busque entre las variables.
Cuadro 1. Pruebas estadísticas descriptivas más frecuentes de acuerdo con la escala de medición de la variable de
estudio
Tipo de descripción | Escala de la variable o asociación de variables | Método o técnica estadística |
---|---|---|
Variables individuales | Categóricas (nominal y ordinal) | – Frecuencias Proporciones – Gráficas de barras – Gráfica de pastel |
Variables individuales | Numéricas (intervalo y razón) | – Frecuencias en clases Medidas de tendencia central – Medidas de dispersión – Medidas de posición – Medidas de forma |
Asociación entre variables | Categórica con Categórica | – Tablas de contingencia – Gráfico de barras – Prueba de Kendall – Prueba de Kramer – Correlación de Spearman |
Asociación entre variables | Categórica con Numérica | – Tablas con clasificación categórica. – Medidas de tendencia central en cada categoría. – Medidas de dispersión en cada categoría. |
Asociación entre variables | Numérica con Numérica | – Diagrama de dispersión – Correlaciones – Regresión lineal |
Cuadro 2. Pruebas estadísticas inferenciales más frecuentes de acuerdo con la escala de medición de la variable de estudio
Tipo de descripción | Escala de la variable o asociación de variables | Método o técnica estadística |
---|---|---|
Variables individuales | Categórica nominal | – Prueba Z para proporciones poblacionales. – Prueba X2 para varias proporciones en una población. – Intervalos de confianza para proporciones. |
Variables individuales | Categórica ordinal | – Prueba binomial para la mediana. – Intervalos de confianza para proporciones. |
Asociación entre variables | Muestras grandes con distribución normal | – Prueba “t” para un promedio poblacional. – Intervalos de confianza para el promedio. |
Asociación entre variables | Muestras pequeñas sin distribución normal | – Prueba binomial para la mediana. – Intervalos de confianza para el promedio. |
Cuadro 3. Pruebas estadísticas para estudios comparativos más frecuentes de acuerdo con la escala de medición de la variable de estudio
Tipo de descripción | Escala de la variable o asociación de variables | Método o técnica estadística |
---|---|---|
Independientes (sin control de factores de confusión) | Nominal | – Prueba exacta de Fisher. – Prueba de X2. – Cálculo de riesgo relativo. – Modelos logísticos o logarítmicos lineales. |
Independientes (sin control de factores de confusión) | Ordinal | – Prueba U de Mann Whitney (dos poblaciones). – Prueba de Kruskall Wallis (dos o más poblaciones). – Modelos logarítmico-lineales. |
Independientes | Razón | – Prueba “t” (dos poblaciones). – Análisis de varianza para la prueba F (para más de dos poblaciones). – Pruebas de comparación de medias: Tukey o Dunncan. – Regresión múltiple. |
Dependientes con bloques o igualación de atributos (con control de factores de confusión) | Nominal | – Prueba de Mcnemar. – Prueba de Mantel Haenzel. – Prueba de X2 para cada nivel de confusión. – Modelo logarítmicos. – Modelos logísticos y logarítmicos lineales. |
Dependientes con bloques o igualación de atributos (con control de factores de confusión) | Ordinal | – Prueba de Friedman. – Prueba de Wilcoxon para rangos señalados. – Modelos logarítmicos- lineales. |
Dependientes con bloques o igualación de atributos (con control de factores de confusión) | Razón | – Prueba “t” apareada. – Análisis de varianza. – Prueba Tukey. – Regresión múltiple. |