El problema de las encuestas en las elecciones

Gonzalo Mena es Florence Nightingale fellow en Comp Stats y Machine Learning en la Universidad de Oxford, post-doc de Harvard, PhD en Estadística de la Universidad de Columbia e ingeniero matemático de la Universidad de Chile. Y amablemente quiso colaborar con el Fintualist esta semana.

Gonzalo Mena es @mena_gonzalo en twitter

El tema de los errores de las encuestas es muy importante, y no se trata de un asunto técnico simplemente, sino que se encuentra en la intersección de la política, la técnica y la "episteme". Hoy día, Donald Trump, dentro de todas sus falsedades, algo medianamente cierto decía sobre que las encuestas se habían equivocado y favorecían principalmente a Biden.

Independiente del resultado final (que ya es claro), las encuestas más creíbles le daban una victoria holgada a Biden. Y debido a que había muchos pronósticos, es posible juzgarlas en tanto a la predicción misma (Biden/Trump en cada estado, etc.) como a la probabilidad que asignaban a cada evento. En ambos casos las encuestas quedaron muy "al debe" porque sub-dimensionaron la probabilidad de ganar del innombrable.

El punto de las encuestas es ayudar a mitigar la maldita/bendita incertidumbre, porque eso nos permite poder anticipar escenarios y prepararnos ante ellos. La lección del 2016 fue que las encuestas no estaban capturando adecuadamente una proporción importante del electorado y lo que nos dijeron era que este año se habían mejorado. Pero los sesgos persistieron.

El problema de las encuestas es difícil de arreglar, porque es el mismo que corresponde a nuestra concepción habitual o "moderna" del mundo. De que hay que ver para creer. De que hay que tener evidencia. Del sesgo del sobreviviente. De la paradoja de la inspección (de que el sólo hecho de ver una ampolleta significa que tiene un tiempo de vida mayor al nominal).

Todo lo anterior tiene sentido, y oponerse a ello tiene las catastróficas consecuencias del negacionismo y la conspiranoia. Pero al mismo tiempo, el dogmatismo de "creer en la evidencia" puede implicar una incapacidad en poder dar cuenta apropiadamente de escenarios latentes, que son posibles pero no se han realizado aún.

Este problema es el mismo que se manifestó con el Coronavirus; al principio la gente no lo tomaba en serio porque la cantidad de contagios y muertos parecía muy pequeña. Y sí, es el mismo problema que nos lleva eventualmente a sub-dimensionar los efectos colaterales del virus y que no se ven inmediatamente (pobreza, desempleo, depresión, y todo lo que eso implica). Y de hecho, es el mismo problema que lleva al actual ministro de salud, Enrique Paris, a descartar que la letalidad del virus se relacione con la pobreza, porque no se ha demostrado.

Quizás hubiese sido mejor que las encuestas en vez de favorecer todas a Biden hubieran dicho "en verdad no lo sé". Como estadístico, puedo decir con lástima que no tenemos la suficiente infraestructura metodológica y teórica como para plantear ese tema.

Día de las elecciones y resultados.

Cuando llegó el día de las elecciones, Sebastián Edwards pronosticó en la televisión que Biden ganaría con facilidad esa noche. Pero en vez de asumir dignamente su error como vaticinador de elecciones, dedicó su tiempo a ofrecer explicaciones ex post de por qué los votos para Biden fueron menos de lo esperado por encuestas sistemáticamente sesgadas. Le echó la culpa a un partido democrático que, según él, se ha vuelto muy elitista al preocuparse por las minorías y políticas de identidad, planteando una falsa oposición entre la economía y el respeto a la diversidad.

Estoy de acuerdo de la importancia de los temas económicos y del rol del estado de proveer de garantías (salud, educación) en una época de cambios tecnológicos tan precipitados que terminan por mermar el bienestar de las personas en situación más desmejorada, representadas principalmente en los estados rojos del Rust Belt, etc (ver deaths of despair o opioid crisis, por ejemplo).

Pero eso no implica que la actitud progresista de promover conceptos de aceptación de minorías, inclusividad, etc., sea la causa de que el margen sea estrecho. Quizás, citando la navaja de Occam, la razón es que simplemente el margen no se puede modificar tanto por el peso de la historia: la gente en ciertos lugares tiende a votar más por Trump y en otros por Biden, y punto. Si el alto voto de Trump fuera una expresión de descontento hacia una "elite liberal", entonces ¿cómo explicar que Biden haya aún así ganado en Detroit, en el Bronx o en Los Angeles?

La votación pro-Biden fue baja respecto a las proyecciones. Pero eso es una indicación de que las proyecciones (que se compró Edwards) están mal, y eso tiene que ver a fenómenos que ni siquiera se entienden bien, como lo de los "votantes silenciosos" pro-Trump, que tienden a no participar en las encuestas.

No significa que la gente pobre esté castigando a los demócratas porque no se están enfocando en las cosas realmente importantes.