Home
L’usage des statistiques

L’usage des statistiques

Un des principes de base pour l’évaluation statistique d’un résultat scientifique — quel qu’en soit le domaine — est la courbe « normale » ou « gaussienne ». Ayant une forme qui ressemble à une cloche, cette courbe représente le comportement théoriquement prévu pour un échantillonnage important d’événements aléatoires.


Par exemple, admettons que nous jetions 100 fois une pièce ne possédant aucun défaut. Intuitivement, nous comprenons que pour les piles (ou les faces), le résultat cumulatif le plus probable serait 50; un résultat de 55 (ou 45) est moins probable, et un résultat de 30 (ou 70) très improbable, mais non pas impossible. Plus le résultat est improbable, et plus nous sommes fondés à considérer qu’il signifie quelque chose, au lieu de refléter le hasard seul.

Les valeurs de la probabilité ou de l’improbabilité sont exprimées précisément par une mesure — celle de l’écart-type — qui décrit la distance entre le résultat obtenu et l’expectative théorique (cette dernière de 50, soit le milieu de la courbe). En parapsychologie comme dans le plupart des domaines scientifiques, les résultats d’une expérimentation sont acceptés comme « statistiquement significatifs » lorsqu’il n’y a pas plus de 5 chances sur 100 (ce qui correspond à une probabilité p de 5% soit p = 0,05 ce qui s’écrit p = .05) que ces mêmes résultats aient été trouvés par les fluctuations du hasard. Cette valeur de p=.05 représente approximativement deux écarts-type de l’expectative théorique ou ligne de base du hasard – ce qui correspond, dans notre exemple, aux scores de 60 et 40. Les résultats de 65 et 35, se trouvant à 3 écarts-type, représentent une improbabilité de 99.7% donc p = .003 (soit 3 chances sur 1000 que les résultats soient dus au hasard.) Ainsi, plus la valeur de p diminue, plus l’expérience est significative.

Il faut remarquer que plus le nombre d’essais augmente, plus les fluctuations normales du hasard ont tendance à se neutraliser et à se rapprocher de la ligne de base du hasard. Ainsi, une petite déviation de cette ligne, trouvée sur un très grand nombre d’essais, peut signifier un grand effet. Pour atteindre par exemple 3 écarts-type, il faut obtenir, sur 100 essais, 65 piles (soit 65%), mais sur 1000 essais il suffit de 547 piles, soit 54,7%. Lorsque le p devient très faible, par exemple, p = .000001, nous l’exprimons de façon rapide par p = 10-6.

Il n’est donc pas nécessaire, pour les tests psi avec des cartes Zener, d’avoir des résultats positifs à chaque essai pour démontrer la réalité d’un phénomène psi: il suffit de démontrer que la moyenne des succès dans une expérimentation s’écarte de l’expectative théorique de façon statistiquement significative (avec p<.05). Evidemment, plus le nombre de succès dépasse la moyenne de 5 par série de 25 essais, et plus les résultats peuvent être alors attribués avec confiance aux facultés psi du sujet et non au hasard.