Corrélation ne veut pas dire causalité
Ce proverbe nous rappelle que si deux événements évoluent en même temps, l'un n'est pas toujours la cause de l'autre.
Il arrive que deux valeurs semblent être liés, augmentant ou diminuant conjointement. Notre esprit a une tendance naturelle et bien compréhensible de déduire directement que l'une de ces valeurs agit forcément sur l'autre. Or, ce n'est pas toujours le cas.
Il est parfois très difficile de déceler les raisons d'une corrélation.
Par exemple, on remarque que la corrélation ci-dessus fonctionne encore même en proportion relative /hab.
La raison est que :
1) Il se trouve que les cigognes nichent plus volontiers sur les toits des maisons de campagne que sur les toits d'immeubles de ville
2) Il se trouve que le taux de natalité est plus important en milieu rural que en milieu urbanisé.
Du coup le taux de natalité est corrélé avec le taux de cigogne/habitant.
EXEMPLES FACILES :
Présence d'une variable de confusion évidente :
● La corrélation peut aussi être juste un hasard :
Le site spurious-correlations utilise de grosses bases de données pour trouver des valeurs démographiques qui ont l'air d'évoluer ensemble. Exemple :
EXEMPLE MOYEN :
Une étude a fait passer un questionnaire auprès de plus de 7000 couples mariés. On remarque que plus un homme accorde de temps aux tâches ménagères, moins il a de relations sexuelles.(voir l'étude originale en pdf)
Tous ces médias laissent entendre qu'il y a une causalité [+ de ménage = - de sexe ]
● Faire la vaisselle nuit à l'activité sexuelle (Libération)
● Faire le ménage ou faire l'amour, les hommes doivent choisir (Le Parisien)
● Plus un homme fait le ménage, moins il fait l’amour (La Dépeche)
● Le ménage, un tue-l'amour pour les hommes (Le Figaro)
Ces médias sont à la recherche de nouvelles sensationnalistes et n'ont pas hésité à faire des titres laissant entendre que faire le ménage diminue vos chances de faire l'amour.
Ils sont tous tombés dans le même piège intellectuel et n'ont pas décelé qu'il existait une variable de confusion.
Dans ce sondage, les heures de ménage et le nombre de rapports sexuels sont seulement déclaratives, donc il ne met en évidence que le fait selon lequel les maris avec les idées les plus conservatrices sont à la fois :
- moins enclins à déclarer qu'ils font le ménage
- et plus enclins à déclarer qu'ils font l'amour souvent.
Présenté ainsi, le résultat n'a rien de sensationnaliste et il correspond tout à fait à ce nous connaissons par ailleurs.
Voici une des rare analyse correcte de cette étude.
EXEMPLE DIFFICILE :
On remarque que les pays où la consommation d'alcool est la plus importante sont aussi les pays où l'espérance de vie est la plus longue. Pouvons-nous en déduire que la consommation d'alcool augmente l'espérance de vie ?
● Qui boira vivra! (Slate)
● Boire de l’alcool est bon pour votre santé (Express)
En fait, la consommation d'alcool tend plutôt à diminuer l'espérance de vie, mais il existe en fait une variable de confusion : la richesse du pays.
Dans les pays riche à la fois on consomme plus d’alcool, et on vit plus longtemps grâce à une meilleure nutrition et un meilleur système de santé. Les effets négatifs ne l’alcool ne suffisent pas retourner cette tendance.
Sources :
Synthèse documentaire Alcool et statistiques, Association Nationale pour la Prévention de l'Alcoolisme
Alcool : effets sur la santé, Expertise collective INSERM, Institut National de la Santé et de la Recherche Médicale
Alcool, Tabac, Mortalité, Francisco Munoz-Perez & Alfred Nizard, Population & Sociétés N°254
Cum hoc ergo propter hoc (En latin : avec ceci, donc à cause de ceci)
Wikipedia Cum hoc ergo propter hoc
L'effet Cigogne (Proposé par Henri Broch : en référence à l'exemple de l'illustration ci-dessus.)
CORTECS : L'Effet Cigogne
Il arrive que deux valeurs semblent être liés, augmentant ou diminuant conjointement. Notre esprit a une tendance naturelle et bien compréhensible de déduire directement que l'une de ces valeurs agit forcément sur l'autre. Or, ce n'est pas toujours le cas.
Il est parfois très difficile de déceler les raisons d'une corrélation.
Par exemple, on remarque que la corrélation ci-dessus fonctionne encore même en proportion relative /hab.
La raison est que :
1) Il se trouve que les cigognes nichent plus volontiers sur les toits des maisons de campagne que sur les toits d'immeubles de ville
2) Il se trouve que le taux de natalité est plus important en milieu rural que en milieu urbanisé.
Du coup le taux de natalité est corrélé avec le taux de cigogne/habitant.
Lorsqu’on constate une corrélation entre A et B tous ces cas sont possibles :
EXEMPLES FACILES :
Il y a une corrélation mais pas de causalité
Présence d'une variable de confusion évidente :
● Le fait de dormir avec des chaussures
augmente les chances de se réveiller avec un mal de tête.
L'un ne cause pas l'autre. Une explication plus vraisemblable est que ces deux événements vont souvent ensemble car ils font suite à des soirées trop arrosées…
augmente les chances de se réveiller avec un mal de tête.
L'un ne cause pas l'autre. Une explication plus vraisemblable est que ces deux événements vont souvent ensemble car ils font suite à des soirées trop arrosées…
● À l'école primaire, les élèves avec les plus grands pieds
font moins de fautes d'orthographe.
Les élèves les plus âgés ont à la fois de plus grands pieds et sont meilleurs en orthographe.
font moins de fautes d'orthographe.
Les élèves les plus âgés ont à la fois de plus grands pieds et sont meilleurs en orthographe.
● La corrélation peut aussi être juste un hasard :
Le site spurious-correlations utilise de grosses bases de données pour trouver des valeurs démographiques qui ont l'air d'évoluer ensemble. Exemple :
EXEMPLE MOYEN :
Un cas classique d'une mauvaise analyse dans les médias
Une étude a fait passer un questionnaire auprès de plus de 7000 couples mariés. On remarque que plus un homme accorde de temps aux tâches ménagères, moins il a de relations sexuelles.(voir l'étude originale en pdf)
Tous ces médias laissent entendre qu'il y a une causalité [+ de ménage = - de sexe ]
● Faire la vaisselle nuit à l'activité sexuelle (Libération)
● Faire le ménage ou faire l'amour, les hommes doivent choisir (Le Parisien)
● Plus un homme fait le ménage, moins il fait l’amour (La Dépeche)
● Le ménage, un tue-l'amour pour les hommes (Le Figaro)
Ces médias sont à la recherche de nouvelles sensationnalistes et n'ont pas hésité à faire des titres laissant entendre que faire le ménage diminue vos chances de faire l'amour.
Ils sont tous tombés dans le même piège intellectuel et n'ont pas décelé qu'il existait une variable de confusion.
Dans ce sondage, les heures de ménage et le nombre de rapports sexuels sont seulement déclaratives, donc il ne met en évidence que le fait selon lequel les maris avec les idées les plus conservatrices sont à la fois :
- moins enclins à déclarer qu'ils font le ménage
- et plus enclins à déclarer qu'ils font l'amour souvent.
Présenté ainsi, le résultat n'a rien de sensationnaliste et il correspond tout à fait à ce nous connaissons par ailleurs.
Voici une des rare analyse correcte de cette étude.
EXEMPLE DIFFICILE :
Un cas de causalité inversée
On remarque que les pays où la consommation d'alcool est la plus importante sont aussi les pays où l'espérance de vie est la plus longue. Pouvons-nous en déduire que la consommation d'alcool augmente l'espérance de vie ?
● Qui boira vivra! (Slate)
● Boire de l’alcool est bon pour votre santé (Express)
En fait, la consommation d'alcool tend plutôt à diminuer l'espérance de vie, mais il existe en fait une variable de confusion : la richesse du pays.
Dans les pays riche à la fois on consomme plus d’alcool, et on vit plus longtemps grâce à une meilleure nutrition et un meilleur système de santé. Les effets négatifs ne l’alcool ne suffisent pas retourner cette tendance.
Sources :
Synthèse documentaire Alcool et statistiques, Association Nationale pour la Prévention de l'Alcoolisme
Alcool : effets sur la santé, Expertise collective INSERM, Institut National de la Santé et de la Recherche Médicale
Alcool, Tabac, Mortalité, Francisco Munoz-Perez & Alfred Nizard, Population & Sociétés N°254
Autres formulations de ce proverbe
Cum hoc ergo propter hoc (En latin : avec ceci, donc à cause de ceci)
Wikipedia Cum hoc ergo propter hoc
L'effet Cigogne (Proposé par Henri Broch : en référence à l'exemple de l'illustration ci-dessus.)
CORTECS : L'Effet Cigogne