netorivasnet-Columbus-Dispatch: Entendiendo las Encuestas Durante la Campaña Política

*Rigoberto Chinchilla

¿Por qué nos preocupamos tanto de los resultados de “X” o “Y” encuesta si solo 1500 o tal vez 2000 personas han sido entrevistadas en una población de 7 millones? ¿Qué significa “Confianza” en una encuesta? ¿Qué significa un “empate técnico”? ¿Qué significa el margen de error? ¿Cuáles son las pistas para desconfiar de los resultados? ¿Cómo las encuestas pueden ser manipuladas fácilmente?

La clave de la validez de una encuesta comienza por escoger la muestra, estadísticamente se ha demostrado que una BUENA muestra de 1500 a 2000 personas en una población del tamaño de El Salvador es suficiente para medir las preferencias de TODOS los 7 millones de Salvadoreños. ¿Y Qué es una “buena muestra”?: En palabras técnicas, una buena muestra es aquella que se ha escogido aleatoriamente y en una cantidad suficiente.

Aleatoriamente significa que se han usado técnicas (Software especializado hace esto) que aseguran que en la muestra toda la población está representada EQUITATIVAMENTE o más técnicamente hablando que cada ciudadano de la población de El Salvador tuvo EXACTAMENTE la misma probabilidad de ser escogido en el proceso como parte de la muestra.

Como un ejemplo obvio de falta de aleatoriedad (mala muestra) sería que los encuestadores solo se vayan a los barrios de la gente de clase media o que solo se vayan a las zonas marginales. O que los encuestadores solo se vayan al centro histórico de la capital a preguntar las preferencias electorales. Una buena muestra asegura proporcionalidad y aleatoriedad de todo tipo de ciudadano salvadoreño: de dinero, pobres, profesionales, técnicos, amas de casa, jóvenes universitarios etc. Si la muestra no es bien planeada los resultados no son confiables. Esta es la primera pista para dar validez a una encuesta y debemos asumir o exigir que se nos explique como la muestra fue diseñada: Los encuestadores deben revelar la metodología de aleatorización y nos aseguren que la muestra fue científicamente planeada.

¿Y qué es la “confianza” en una encuesta? por ejemplo cuando nos dicen que la encuesta tienen “95% de confiabilidad”. La confianza no tiene nada que ver con que confiemos en una u otra institución que hizo la encuesta, ni tampoco tiene que ver con probabilidad de que esta sea “cierta”. Mucho menos “confianza” tiene que ver con el carácter de los encuestadores o los que interpretan resultados.

La confianza en una medida que toma en cuenta el tamaño de la muestra: Por ejemplo una BUENA muestra de 2000 personas es más confiable que una BUENA muestra de 1500 personas, entre más grande es la (BUENA) muestra más grande será la “confianza” de los resultados. Pero el tamaño de la muestra NO es el único factor en calcular la “confianza” de una encuesta. Hay factores muy técnicos relacionados con la forma de la distribución probabilística y otros fuera del alcance de este artículo, pero nos concentraremos en el significado del término “confianza”.

La confianza tampoco es una probabilidad, es decir no podemos interpretar que una confianza de 95% significa que el candidato que va ganando por ejemplo tiene 95% de probabilidad de que “X” o “Y” candidato va a ganar. La confianza solo dice algo como lo siguiente en términos sencillos: Si volviéramos a sacar (hipotéticamente) una segunda BUENA muestra muestra de 1500 personas (o 2000 etc.), y una tercera, y una cuarta…….y hasta cien veces (por dar un ejemplo), 95 VECES obtendríamos los mismos márgenes de error y solo 5 VECES obtendríamos márgenes de error diferentes que pudieran darle otro sentido a las interpretaciones de los resultados. Es decir NO lo haremos cien veces (¡Porque es muy caro!) pero si lo hiciéramos 100 veces, 95 veces obtendríamos márgenes parecidos.

Los márgenes de error (margen de error) están relacionados con la “confianza” y es algo mucho más simple de entender. Un margen de error de 3 puntos porcentuales solo significa que los resultados pueden estar hasta 3 puntos porcentuales arriba o hasta 3 puntos porcentuales debajo de la media reportada y son parte del intervalo de confianza (o la “confianza”) por ejemplo si Quijano tiene 45% de las preferencias, podría ser que en realidad tenga entre 42% y 48% y esto se llama INTERVALO DE CONFIANZA que como ya mencionamos será 95% “confiable”. En realidad un término más correcto para la “confianza” es llamarlo “Intervalo(o margen) de confianza”. Noten que el error en puntos porcentuales viene del hecho de que se ha encuestado a una muestra y no a toda la población.

El empate técnico se da entonces cuando ambos intervalos de confianza se “cruzan” o tienen porciones en común. Por ejemplo si Sánchez tiene un 48% de preferencia con tres puntos porcentuales de error, su intervalo de confianza será entre un 45% y un 51% lo que cruza el margen de Quijano (entre 42% y 48%) y entonces están técnicamente empatados estadísticamente hablando es por esto que por lo general ya muy cerca de la elecciones se INCREMENTA el número de encuestados.

Por ejemplo si cuadruplicamos el número de encuestados los márgenes de confianza se reducen cerca de la mitad y esto podría hacer que ya no se crucen los mismos y claramente mostrar el candidato vencedor. Para el ejemplo anterior si entrevistamos a 6000 personas en lugar de 1500 (Asumiendo las preferencias se mantienen intactas una vez aumentamos las personas en la muestra), Sánchez tendría un intervalo de confianza de 1.5 puntos porcentuales alrededor de 48% entre (46.5% y 49.5%) y Quijano tendría alrededor de 45% entre (43.5% y 46.5%) en este caso es claro que ya los intervalos ya no se cruzan (excepto en el límite inferior de Sánchez) y tendríamos una preferencia clara.

Una encuesta puede estar “amañada” no necesariamente porque no fue aleatoria sino por preguntas mal diseñadas o encuestadores que no las hacen propiamente o parcializados hacia a uno u otro candidato. El diseño de la pregunta es tan importante como la aleatoriedad. Una pregunta cargada, puede dar al traste con el diseño aleatorio. Hasta el tono de la pregunta puede tirar a la basura los resultados. Por ejemplo si usted le pregunta en un tono neutral a una persona “¿Votaría por Quijano para presidente?” podría tener (ya en toda la muestra) un resultado ligeramente diferente si usted entona la pregunta en un tono sospechoso o en uno como queriendo implicar sorpresa o extrañeza.

Finalmente una encuesta se puede manipular sencillamente seleccionado los datos de lo que nos gustaría y desechando los datos que no se quieren escuchar es por esto que estas deben ser hechas por encuestadores muy bien entrenados, por profesionales de la estadística honestos en sus cálculos y conclusiones y por instituciones profesionales en esta ciencia, de preferencia NEUTRALES a los partidos políticos participantes. “Los datos pueden ser torturados lo suficiente hasta confesar lo que queremos” (Ronald Coase)

*Profesor Asociado Universidad de Illinois (Eastern)

netorivasnet-Columbus-Dispatch

Thursday, November 21, 2013

Entendiendo las Encuestas Durante la Campaña Política

0 comments:

Post a Comment

Search

Blog Archive

Labels