Saturday, June 28, 2008

De anécdotas, estadísticas y conclusiones apresuradas

No conozco a nadie que haya votado a Cristina Fernandez en las últimas elecciones para presidente. Entonces es evidente que ha habido fraude.

No, no voy a hablar de política, y de hecho podía haber elegido un ejemplo más neutral para ilustrar el tema de este artículo, como por ejemplo, una reunión social donde alguien sostenía que la mayoría, o al menos una minoría apreciable de la población argentina tenía un título universitario. Ella, médica, no podía aceptar que menos del diez por ciento de la población tuviera uno, porque claro, la mayoría de sus conocidos y amigos tenía uno (y uno de médico, para más señas).


No es que ella fuera tonta, sino que estaba siendo víctima de un sesgo cognitivo bastante común: preferimos anécdotas a estadísticas, aún cuando las primeras no describen adecuadamente la realidad cuando hablamos de conjuntos muy grandes. Como en este blog abogamos por el pensamiento crítico y sostenemos que cualquier afirmación debe ser fundamentada, voy a tratar de fundamentar el por qué conviene estar alerta de este sesgo para así poder evitarlo (y por que conviene evitarlo)


Como sostiene John Allen Paulos al analizar la relación entre anécdotas y estadísticas, tanto las anécdotas como las estadísticas nos brindan información: las anecdotas incluyen muchos detalles de pocos sujetos (en sentido amplio: personas, animales, objetos) y utilizando estadísticas podemos conocer pocos detalles acerca de muchos sujetos. La descripción del primer día de clases de un niño nos dice mucho acerca de su caracter, gustos, temores, expectativas y otros aspectos de su personalidad, mientras que el ingreso medio per cápita de un país nos dice mucho acerca de la capacidad de compra de todos sus habitantes.


El problema empieza cuando pretendemos que con pocos casos sabemos mucho de la situación completa. El afirmar que una determinada generalización es cierta es, en términos más formales, sostener que existe una correlación entre dos o más variables. Así, por ejemplo, cuando sucumbimos a alguna de las ilusiones del patriotismo, que, como todos sábemos, no tienen término, estamos sosteniendo que existe una correlación, pongamos, entre las variables 'nacionalidad' e 'inteligencia'.


No es difícil demostrar formalmente (no lo haremos aquí, entre otras cosas porque es el objetivo de este blog y excede con mucho las capacidades del autor el ponerse a explicar matemáticas) que las correlaciones son menos confiables conforme el número de variables a correlacionar se acerca al número de casos de la muestra. Paulos ,en el paper enlazado más arriba, nos propone un ejemplo para ilustrar intuitivamente este fenómeno, donde correlaciona dos variables (inteligencia y timidez) usando dos sujetos de muestra.


Podemos conjeturar qué es lo que nos hace pensar de esta manera. Somos producto de una evolución de millones de años, la mayor parte de la cual se dio en condiciones muy diferentes a las que nos construimos estos últimos pocos cientos de años. Para nuestros antepasados, hasta hace tal vez pocos miles de años, el pequeño grupo de personas, la pequeña porción de la tierra y los pocos animales diferentes que veía una vez eran una porción representativa de los que verían por el resto de su vida, e incluso, de los que de una manera u otra ejercerían alguna influencia en su vida. Nuestro cerebro se moldeó en una época donde confundir anécdotas con estadísticas, generalizando rapidamente, era una ventaja competitiva que permitía tomar decisiones rapidamente.


Hoy enfrentamos una situación muy distinta, donde los sujetos y sistemas con los que estamos relacionados son muchos más de los que podemos imaginar ( se puede intentar lo complicado que es imaginarse un grupo de dos millones y medio de personas, por ejemplo... cuantas canchas de fútbol llenarían si se utiliza también el campo de juego? cuanto ocuparían si hicieran una manifestación ). En las sociedades en las que vivimos, un porcentaje ínfimo de personas constituye, en términos absolutos, una cantidad que nos parecerá enorme. Como los humanos solemos rodearnos de personas parecidas a nosotros (en nuestro trabajo compartimos el tiempo con gente de similares gustos y formación, nuestra familia suele parecerse a nosotros, buscamos parejas que se nos parezcan, vamos a clubes y asociaciones donde nos sentimos a gusto), completamos el cuadro con el sesgo de disponibilidad: elaboramos nuestras conclusiones tomando como base lo que observamos en un entorno que, aún cuando sea amplio, es ínfimo comparado con la totalidad y que además ha sido elegido a nuestra imagen y semejanza.


No es que todas las generalizaciones sean malas. Las generalizaciones nos permiten desarrollar vacunas, antibióticos, políticas sociales, incluso hasta a veces nos permiten comunicarnos. Solamente, tal vez, deberíamos recordar que llegar a una buena generalización (una buena generalización es aquella en la que podemos confiar ya que ha sido elaborada evitando los sesgos que mencionamos arriba) cuesta mucho trabajo y que las generalizaciones erróneas son terriblemente peligrosas.


Una buena descripción de los sesgos cognitivos que nos atormentan se puede encontrar en el libro Don't Believe Everyhing you Think (Six mistakes we make in thinking) de Thomas Kidda.

No comments: