Los universos, las desigualdades y las encuestas

Hay un principio humano que dice que no se puede tratar igual a los que son desiguales. Lo mismo sirve para la estadística. Cuando se dice que un grupo, un “universo” es semejante, es decir que sus unidades (las que sean) son iguales, tienen que ser así, o si no se trata de universos que no lo son.

Pero si definiéramos un universo de fruta, con diversas manzanas, higos, plátanos y mangos como homólogo, no tendría sentido en cuanto a su uniformidad. Son diferentes frutas, con diferentes características.

Pues bien, para las encuestas, los universos a entrevistar, deben ser semejantes. Y si de un presunto universo, digamos los ciudadanos con derecho a voto en el país, seleccionamos una muestra, difícilmente será representativa.

¿Por qué?

Las empresas encuestadoras seleccionan sus muestras en base a los distritos electorales, o por poblaciones, y también por estratos sociales-económicos, de todo el país. Pero la diferencia entre ellos es enorme, y la representatividad de una muestra tomada así, al azar, es, cuando mucho, mínima. Y cuando se van al detalle de seleccionar domicilios (si es el caso), también la representatividad de la muestra es insignificante.

Suponiendo (sin conceder) que la encuestadora selecciona técnicamente digamos 1,200 domicilios para entrevistar sobre preferencias electorales y opiniones, muestreando sobre un supuesto universo con enormes diferencias, la validez deja mucho que desear. Y luego la gente se pregunta el por qué las diferentes encuestas (con muestreo aleatorio) dan resultados tan diferentes.

Si, por ejemplo, se hace un muestreo aleatorio de domicilios en el Distrito Federal, y se visitan cien de ellos (como parte de una encuesta nacional), los resultados dependerán de las delegaciones que se elijan (supuestamente al azar, claro), cuyas preferencias electorales predominantes son muy diferentes, y por tanto la probabilidad de tener resultados válidos será de pequeña a inválida.

Así, si resulta que las entrevistas se harán en hogares de las delegaciones Benito Juárez o Miguel Hidalgo, los resultados no serán representativos de las delegaciones Cuauhtémoc o Iztapalapa, y viceversa.

Las encuestas telefónicas tienen un margen de error implícito en la selección de la muestra, aunque en teoría ésta sea matemáticamente correcta. Para empezar, quedan fuera todas las personas que no tiene teléfono.

Los muestreos aleatorios, por mejor técnica que tengan para seleccionar, se estarán haciendo en un universo que no es semejante en sus variables, entidades federativas, ciudades, colonias y más. No quiero decir que los datos en general no sean válidos por necesidad, sino que su validez es muy relativa.

Así, los márgenes de error y los niveles de confianza técnicos, resultan altos para una encuesta, pero el universo seleccionado no es realmente tal. Se trata de variables que hacen que el muestreo tenga sólo validez relativa, como he dicho, pues el universo de votantes es muy desigual, territorial y socialmente hablando.

Por supuesto que cuando, independientemente de la muestra, las llamadas tendencias tienen preferencias muy notorias, las encuestas tenderán a dar una visión válida de las mismas, pero siempre habrá márgenes de error por la definición del universo, estadísticamente hablando.

En fin, ¿diferencias importantes entre encuestas electorales? Nada raro, y ni siquiera tienen que ser “cuchareadas”, compradas, simplemente el muestreo aleatorio falló. Y allí están los resultados tan dispares. Y si le sumamos las trampas en el proceso de encuestar y reportar resultados, que existen a veces, peor aún.

@siredingv

Deja un comentario

Asegúrese de introducir toda la información requerida, indicada por un asterisco (*). No se permite código HTML.