Tablas Contingencia

Tablas Contingencia

En muchas ocasiones, los n elementos de una muestra tomada de una población pueden clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los dos métodos de clasificación son estadísticamente independientes. Supóngase que el primer método de clasificación tiene r niveles, y que el segundo tiene c niveles. O sea <m>O_ij</m> la frecuencia observada para el nivel i del primer método de clasificación y el nivel j del segúndo método de clasificación. En general, los datos aparecerán como se muestra en la siguiente tabla. Una tabla de este tipo usualmente se conoce como tabla de contingencia r x c.

Columnas

{estadistica_no_parametrica

El interés recae en probar la hipótesis de que los dos métodos de clasificación renglón-columna son independientes. Si se rechaza esta hipótesis, entonces se concluye que existe alguna interacción entre los dos criterios de clasificación. Los procedimientos de prueba exactos son difíciles de obtener, pero puede obtenerse un estadístico de prueba aproximado válido para n grande.

Sea <m>p_ij</m> la probabilidad de que un elemento seleccionado al azar caiga el la ij-ésima celda, dado que las dos clasificaciones son independientes. Entonces, <m>p_ij=u_i v_j</m>, donde <m>u_i</m> es la probabilidad de que un elemento seleccionado al azar pertenezca al renglón de la clase i, y vj es la probabilidad de que un elemento seleccionado pertenezca a la columna de la clase j. Ahora bien, si se supone independencia, los estimadores de <m>u_i y v_j</m> son:

<m>hat u_i = 1/n sum{j-1}{sigma}{O_ij}</m>

<m>hat v_j = 1/n sum{i-1}{v}{O_ij}</m>

 Por lo tanto, la frecuencia esperada de la celda es:

<m>E_ij=n hat u_1 hat v_j = 1/n sum{j-1}{sigma}{O_ij}sum{i-1}{v}{O_ij} </m>

Entonces, para n grande, el estadístico

<m>x^2 = sum{j-1}{sigma}{} sum {i-1}{v} {} {(O_ij-E_ij)^2}/E_ij</m>

tiene una distribución aproximada ji-cuadrada con (r-1)(c-1) grados de libertad si la hipótesis nula es verdadera. Por consiguiente, la hipótesis de independencia debe rechazarse si el valor del estadístico de prueba <m>X^2</m> calculado es mayor que <m>X^2</m> crítico o de tabla.


Mis sitios nuevos:
Emprendedores
Politica de Privacidad