Prueba de Ji Cuadrada para independencia en una encuesta boba hecha en Twitter

Antes que nada, entiendo que los reactivos no fueron quizá los más adecuados, que pude haber especificado más de dos niveles en cada una de las variables, y que la muestra no es ni remotamente aleatoria.

Básicamente quería contar con datos reales (no inventados) sobre dos variables categóricas para ejemplificar el uso de la prueba ji-cuadrada para independencia. Elegí una matriz de 2x2 para ejemplificar también la corrección por continuidad.

Se me ocurrió explorar si el hecho de que nos caigan bien los alemanes/Alemania se relaciona con nuestro juicio de que las exigencias de indemnización hechas por Grecia son justas.

Estadísticamente, si usted no sabe muy bien de qué hablo...

Explicación estadística

Una variable categórica es cuando asignamos cada caso, u observación, en una categoría (o clasificación) de varias posibles, pero sólo en una. Por ejemplo, el lugar de residencia: uno vive en cualquiera de los estados del país. O municipios del estado, o delegaciones si es el DF, etc. El otro ejemplo frecuente, el sexo: hombre o mujer (SÓLO es un ejemplo, no se altere nadie). Una variable categórica, o nominal, puede variar en dos niveles (hombre o mujer, águila o sol, sí o no, muerto o vivo, etc.), en tres o en más (entidad de la república donde se vive: 32 niveles. O marca de refresco: Coca-Cola, Pepsi, Big Cola, Nuke-Cola: 4 niveles, etc.).

Si tenemos dos variables categóricas, puede ser que ambas estén variando juntas. Es decir, que la variación de una esté relacionada con la variación de la otra. O no: que ambas varíen de forma independiente una de la otra. Por ejemplo, supongamos que queremos saber si el hecho de ser o no foreveralone está relacionado con si usamos Twitter o no. Tenemos dos variables: foreveralonez y uso de Twitter. Ambas varían de forma dicotómica: sí o no (podemos evaluarlas para incrementar los niveles, pero esa es otra historia). Pero puede ser que el hecho de usar Twitter no tenga nada que ver con nuestra condición de foreveralone (y viceversa). Otro ejemplo: podríamos querer evaluar si vivir en Puebla, el EdoMex, el DF o Morelos se relaciona con nuestro odio por PRI, PAN o PRD (suponiendo que se puede odiar mucho sólo a uno de los tres). Encuestamos personas de todos los estados antes mencionados (eligiendo a los encuestados mediante métodos que garanticen la equivalencia inter-sujetos), y analizamos si vivir en uno u otro estado está relacionado con odiar más al PRI, PAN o PRD.

Ahora, para saber si la probabilidad de que las variables varíen (jojo) juntas es menor a lo esperado por puro azar, usamos un método estadístico llamado Prueba Ji Cuadrada. Sin entrar en mucho detalle, dicha prueba compara la frecuencia de casos por categoría contra la frecuencia de los casos si éstos ocurrieran con proporciones estables, independientes de las categorías. Es decir, evalúa si las variables están relacionadas o no, analizando la probabilidad de que puedan variar juntas por puro azar. La prueba intenta demostrar que las dos variables son independientes (hipótesis nula, o H0).

Dicho lo anterior...

RESULTADOS

Con un total de 21 respuestas computables (n=21) , estos son los resultados.

Tabla de contingencia
                                                 LA DEMANDA ES JUSTA
                                           SÍ                                  NO
SIMPATÍA     SÍ               4                                       11
CON
ALEMANIA   NO             3                                       3

Es decir, hubieron 4 encuestados que se perciben como simpatizantes de Alemania, y creen que la exigencia es justa, 11 que simpatizan con Alemania y creen que las exigencias no son justas, y así sucesivamente.
En la siguiente imagen pongo el conteo crudo, la tabla de contingencia, y el cálculo manual de la prueba ji Cuadrada.  Nótese que también están calculadas las frecuencias marginales (la suma de frecuencias por fila y columna, marcadas como M1 y M2).



La fórmula que está hasta arriba es con lo que se calcula la Ji Cuadrada (X^2): frecuencias observadas menos esperadas, al cuadrado, sobre esperadas. Se calcula para cada casilla. Al final, se suman todas las probabilidades.

Ahora,  la prueba compara el valor obtenido (X^2 OBT) contra la probabilidad crítica establecida en la distribución Ji Cuadrada, para k grados de libertad y varios niveles de significancia (otra vez, sin entrar en mucho detalle: grados de libertad son los datos que "permitimos" que varíen libremente, mientras que el nivel de significancia es la probabilidad más allá de la cual no estamos dispuestos a aceptar que las cosas pasan por puro azar. En ciencias de la conducta, solemos establecerla en 5 casos de cada 100, o 0.05). los grados de libertad se calculan como número de columnas menos 1 por número de filas menos 1: (c-1)(f-1).

Sin embargo, cuando los grados de libertad son iguales a 1 (como en el caso de este ejemplo, y cualquiera que sea una tabla de contingencia 2X2), o las frecuencias observadas en alguna casilla son menores a 5, la probabilidad calculada por la prueba tiende a ser errónea (por razones que es largo explicar). Para corregir ese error, se usa la "corrección por continuidad", o corrección de Yates. Consiste en restar 0.5 al valor absoluto de la diferencia entre frecuencias observada y esperada. Y nuestro ejemplo cumple las dos condiciones para aplicar la corrección de Yates.

Además, dado que Ji Cuadrada calcula la discrepancia entre una muestra empírica y una muestra teórica, es necesario conocer las frecuencias esperadas. Como eso no se conoce, se estima a partir de los marginales: se asume que la frecuencias esperadas serían aquellas que sigan las proporciones de los datos acumulados para filas y columnas.

Con la prueba corregida, el valor de Ji Cuadrada obtenida es de 0.262.

Por lo tanto, la probabilidad crítica (X^2 CRIT) para gl=1 grados de libertad, y un nivel de significancia α=0.05 es de 3.84. Debido a que X^2 OBTes menor que X^2 CRIT, se acepta la hipótesis nula: las dos muestras SON INDEPENDIENTES.

Obtenemos exactamente los mismos resultados si los analizamos en SPSS. ¡Faltaba más! :)




INTERPRETACIÓN

La prueba nos dice que ambas variables no están relacionadas de forma significativa y, a pesar de lo que la simple inspección pudiera sugerir, no existe una relación entre considerar las demanda como justas y la sensación subjetiva de simpatía hacia los alemanes.

Es posible que incrementando el número de encuestados, la tendencia alcance significancia. Nunca lo sabremos.

FIN






Comentarios