Queremos encontrar la verdad, no importa dónde se encuentre. Pero para hacerlo necesitamos tanto de la imaginación como del escepticismo. No tendremos miedo de especular, pero seremos cuidadosos en distinguir entre especulación y hechos.

Carl Sagan, primer capítulo de Cosmos.

Correlación no implica causalidad

Es común observar que cuando sucede un evento, a menudo hay una causa subyacente que lo provocó.

Sin embargo, suele ser muy complicado determinar con certeza cuál fue la causa del evento. Por ejemplo, cuando se estudian los patrones de enfermedad en una población, es común observar correlaciones entre diferentes variables, como el consumo de ciertos alimentos y el riesgo de desarrollar ciertas enfermedades. Sin embargo, esto no necesariamente implica que una variable sea la causa de la otra.

Para entender por qué es importante distinguir entre causa y correlación, primero debemos entender qué significa cada uno de estos conceptos.

La causa es la razón por la que un evento sucede. Si notas que una vela se ha apagado, puedes suponer que la causa fue que se ha consumido toda la cera o que alguien la apagó de un soplido.

La correlación, por otro lado, es simplemente una relación entre dos variables. ¿Siempre que se termina la cera de una vela o alguien sopla la llama, esta se apaga? Todo indica que sí, ya que ambas variables están correlacionadas.

Entonces, ¿por qué es importante distinguir entre causa y correlación? En el mundo complejo en el que vivimos, es común que existan casi infinitas variables que estén relacionadas de alguna manera, pero no todas implican causalidad de los sucesos con los que se relacionan.

Distinguir entre causa y correlación

Existen dos razones principales por las que es fundamental distinguir entre causa y correlación.

La primera es que nos permite identificar y entender las verdaderas causas de los eventos que observamos. Si no distinguimos entre causa y correlación, es fácil cometer el error de atribuir la causa de un evento a una variable que en realidad no es la causa. Vamos con un ejemplo.

Según la gráfica que tienes justo abajo, para enfriar el planeta, simplemente tenemos que hacer que la gente se eche a la mar a vivir la vida pirata. Parece que ambas variables están estrechamente ¿correlacionadas?

Imagen: PiratesVsTemp.svg: RedAndr / Osado (CC).

El patrón que nos muestra la gráfica deja poco lugar a dudas: según baja el número de piratas, desciende la temperatura global del planeta. Pero cómo ya te puedes imaginar; el descenso de piratas no tiene nada que ver con el cambio climático. Más bien se trata de una correlación estadística azarosa. Existen una multitud de variables más que esa gráfica no ha tenido en cuenta y que, a simple vista, nos puede llevar a conclusiones equivocadas. En cambio, el aumento de gases de efecto invernadero, la deforestación, la agricultura intensiva o el cambio de patrones de consumo, sí que podrían ser algunas de las causas que están relacionadas con el enfriamiento de nuestro planeta.

Este ejemplo clásico de los piratas y el calentamiento global surgió del estudio que fue llevado a cabo por Bobby Henderson, el creador de la Iglesia pastafari. ¿Su objetivo? Combatir los argumentos de los creacionistas. Estos últimos tienden a correlacionar todo con la misma causa: Dios. Henderson representó la temperatura global de la Tierra en función del número de piratas en el mundo. Un poco trol, pero bastante efectivo su razonamiento. Lo que quería demostrar es que se puede relacionar dos hechos muy fácilmente e inventarse la causa del uno sobre el otro.

La segunda razón por la que es importante distinguir entre causa y correlación es que nos permite hacer predicciones precisas y tomar decisiones informadas. Si atribuimos la causa de un evento a una variable equivocada, es muy probable que nuestras predicciones y decisiones también sean incorrectas. Siguiendo el ejemplo anterior, podríamos sacar conclusiones muy alejadas de la realidad y esperar que la temperatura del planeta se regulase simplemente por fomentar de nuevo la piratería en pleno siglo XXI. Quizás este ejemplo te parezca ridículo, pero es una buena forma de entender algunas de las causas —nunca mejor dicho— de todas las malas decisiones que podemos tomar —o que otros pueden tomar— por no hacer un correcto análisis y distinción entre causalidad y correlación.

En un mundo lleno de datos y con tantas personas y acciones azarosas, no es raro que nos encontremos casualidades como la del siguiente gráfico.

Imagen: tylervigen.com

La correlación parece clara. Cuantas más películas hace Nicolas Cage, más gente muere ahogada en las piscinas. Por favor, Nico, si lees esto, retírate ya y ahórranos a todos el sufrimiento.

Fuera bromas, esta correlación tiene muy poco de causalidad y mucho de casualidad. Con estos ejemplos, espero que empieces a entender de lo que te estoy hablando.

Vale sí, estos ejemplos rozan la absurdidad. Casi cualquiera que conozca este concepto será capaz de diferenciar causalidad y correlación. Pero no todas las noticias son tan fáciles de detectar de un primer vistazo. Te animo a que hagas una búsqueda rápida de las noticias de hoy. Más de la mitad, se les asigna una causa-efecto errónea. O al menos, sin contrastar como es debido.

Ahora extrapola todos esos errores a las decisiones que pueden tomar empresas, gobiernos o tú mismo, simplemente por haber hecho una mala lectura de los datos. No confundas causalidad con casualidad.

Distinguir entre causa y correlación

Una de las formas más comunes de distinguir causa y correlación es a través de la experimentación. Cuando realizamos un experimento, podemos “controlar” todas las variables que no estamos interesados y observar cómo cambia la variable de interés. Imagina que quieres conocer la relación de los alimentos que consumes y el riesgo de parecer una determinada enfermedad. Para ello, podrías llevar a cabo un experimento en el que dividieses a un grupo de personas en dos subgrupos: uno que consuma esos alimentos y otro que no los consuma. Si observamos un aumento del riesgo de enfermedad solo en el grupo que consumió los alimentos, manteniendo el resto de variables igual que el otro grupo, podemos deducir que el consumo de esos alimentos es la causa del aumento del riesgo de enfermedad.

Otra forma de distinguir entre causa y correlación es a través del análisis de datos y la estadística. A través del uso de técnicas estadísticas, podemos evaluar la fuerza y la dirección de la relación entre dos variables y determinar si es probable que una variable sea la causa de la otra.

Sin embargo, es importante tener en cuenta que la correlación no siempre implica causalidad, y es posible que haya otras variables que no hemos considerado que podrían estar influyendo en la relación entre las dos variables.

En resumen, es fundamental aprender a distinguir entre causa y correlación porque te permite identificar y entender las verdaderas causas de los eventos, hacer predicciones precisas y mejores decisiones.

David.

PD: En esta web puedes encontrar relaciones azarosas cómo la que te he mencionado arriba de Nicolas Cage.