L'IRM détecte le QI

Philippe Gouillou - 27 mars 2023 - MàJ : 28 mars 2023 -https://douance.org/qi/qi-irm.html
Kirkegaard & Fuerst (2023) ont trouvé par machine learning sur des données neurologiques (IRM) une corrélation de 0,51 avec le QI, et même 0,61 en ajoutant la prise en compte de l'origine.

Téléchargez l'article en Format EPUB Téléchargez l'article en Format PDF

center

SOMMAIRE : Synthèse — Commentaires — Traduction de l'abstract — Références — Liens — Historique des modifications — Notes

Synthèse de l'étude

Kirkegaard & Fuerst (2023) ont utilisé le machine learning (apprentissage automatique) à partir de plus de 50 000 valeurs neurologiques pour détecter l'origine et le QI de presque 12 000 enfants américains. Ils ont atteint ß = 0,51 pour le QI, soit 3 à 4 fois plus qu'en utilisant le simple volume du cerveau (ß = 0,15).

L'échantillon

L'échantillon ABCD (version 3.1) comprenait 11 826 enfants américains (52,2% de garçons et 47,8% de filles) d'âge moyen de 10,7 ans (σ = 1) :

center twothird fullmd

Ce qui correspond à la distribution théorique1 :

center twothird fullmd

où on remarque que la courbe du total (en vert) est une courbe unimodale : elle ne montre pas qu'elle est composée de l'addition de plusieurs populations,

soit en pourcentages :

center twothird fullmd

où on remarque le plus grand écart-type des Autres : les courbes des Blancs et des Autres se croisent à un QI théorique de 167, malgré le fait qu'il y ait plus de 4 fois plus d'Autres que de Blancs dans l'échantillon.

Les variables

52 766 variables de fichiers IRM provenant de l'étude ABCD ont été utilisées. Les auteurs précisent cependant que :

"Ces variables étaient souvent fortement corrélées (par exemple, le volume cortical des hémisphères droit et gauche), de sorte que la dimensionnalité effective est bien inférieure à ce que suggère le nombre total."
Kirkegaard & Fuerst (2023)2

Les résultats

Parmi les nombreux résultats obtenus, le plus important semble être celui sur la capacité de l'apprentissage automatique sur des données IRM à détecter le QI quelle que soit l'origine de la personne :

"Cette étude a révélé plusieurs éléments intéressants. Tout d'abord, nous avons constaté qu'un simple algorithme d'apprentissage automatique adapté à un grand nombre de variables IRM était capable de prédire l'intelligence avec une grande précision (ß = 0,51). Ce résultat a été obtenu en s'appuyant uniquement sur un modèle linéaire additif avec un degré de pénalisation approprié. Cette validité élevée contraste avec celle du volume cérébral qui, dans cet ensemble de données, était de ß = 0,15. La validité relativement faible du volume cérébral est probablement due à la faible moyenne d'âge (10 ans) de l'échantillon. L'ABCD étant une étude longitudinale qui suivra les jeunes jusqu'à l'âge de 18 ans, il sera possible de déterminer dans un avenir proche si la validité du volume cérébral augmente avec l'âge."
Kirkegaard & Fuerst (2023)3


Commentaires de l'auteur Emile O.W. Kirkegaard

Depuis la première publication de cette synthèse, un des auteurs, Emil O. W. Kirkegaard, a mis en ligne sur son blog une présentation de cette étude. Sa conclusion est :

  • En utilisant un vaste ensemble de données récentes contenant des données neurologiques de premier ordre provenant de l'IRM, nous avons pu confirmer les recherches héréditaires existantes sur la relation entre les mesures cérébrales et l'intelligence.
  • La précision de ce modèle était étonnamment élevée, mais une partie de ce résultat était liée à des facteurs de confusion liés à l'ascendance, qui avaient également été étudiés par d'autres chercheurs. L'utilisation du sous-échantillon blanc des données suffit à éliminer cette confusion, mais il faut se méfier des différences de variance dans les échantillons de test.
  • Les écarts raciaux apparaissent dans ces prédictions modernes de l'intelligence basées sur des données cérébrales lorsque le modèle n'a jamais vu de personne non blanche, et ils sont assez importants.
  • Le modèle IRM peut expliquer environ un tiers des écarts d'intelligence observés (36 % pour les Noirs et les Blancs).
  • L'hypothèse de Spearman étendue a été observée, selon laquelle les charges g (des prédicteurs de l'IRM) sont liées positivement aux différences entre les groupes (écarts entre Noirs et Blancs, entre Hispaniques et Blancs) et aux validités des scores polygéniques (héritabilités).
  • Le paradigme de la recherche héréditaire continue d'être productif, générant des résultats nouveaux et intéressants dans les données modernes.
    Kirkegaard (2023)4


Commentaires personnels

Cette étude confirme encore une fois que le QI correspond bien à une caractéristique biologique : sans même chercher à déterminer son origine on peut le mesurer chez les enfants avec une corrélation assez bonne (0,51) à partir de données obtenues par imagerie neuronale.

Il faudra dans une dizaine d'années refaire la même étude sur le même échantillon pour voir si cette corrélation augmente ou diminue une fois que ces enfants auront achevé leur croissance.


Traduction de l'abstract

"Nous avons utilisé les données de l'étude sur le développement cognitif du cerveau des adolescents [ABCD (Adolescent Brain Cognitive Development)] pour créer un prédicteur multimodal de l'intelligence basé sur l'IRM. Nous avons appliqué l'algorithme du réseau élastique à plus de 50 000 variables neurologiques. Nous avons constaté que la race peut confondre les modèles lorsqu'un échantillon d'entraînement multiracial est utilisé, car les modèles apprennent à prédire la race et utilisent la race pour prédire l'intelligence. Lorsque le modèle est entraîné sur des Blancs non hispaniques uniquement, le prédicteur basé sur l'IRM a une précision de modèle hors échantillon de r = 0,51, ce qui est 3 à 4 fois supérieur à la validité du volume du cerveau entier dans cet ensemble de données. Cette validité s'est généralisée à travers les principaux groupes raciaux définis par la société. Ce prédicteur explique environ 37% de la relation entre la classification des Noirs et des Hispaniques et l'intelligence."5
Kirkegaard & Fuerst (2023)


Références

Kirkegaard, E. O. W., & Fuerst, J. (2023). A Multimodal MRI-based Predictor of Intelligence and Its Relation to Race/Ethnicity. Mankind Quarterly, 63(3), 374–397 doi:10.46469/mq.2023.63.3.2


Liens


Historique des modifications

Date Historique
28 mars 2023 Ajout Commentaire de l'auteur Emil O. W. Kirkegaard
27 mars 2023 1ère Mise en ligne


Notes


  1. Images générées sur Microsoft Excel avec la formule : LOI.NORMALE.N(QI;Moyenne;Ecart-Type;FAUX) * N pour un QI de 40 à 160 (±4σ) avec N étant le nombre de personnes de chaque groupe. 

  2. Traduction depuis :

    "These variables were often highly correlated (e.g., right and left hemisphere cortical volume), so the effective dimensionality is far less than suggested by the total number."
    Kirkegaard & Fuerst (2023)

  3. Traduction depuis :

    "This study found many things of interest. First, we found that a simple machine learning algorithm fit on a large number of MRI variables was able to predict intelligence with high accuracy (ß=.51). This was achieved when relying only on an additive, linear model with an appropriate amount of penalization. This high validity contrasts with that of brain volume, which in this dataset was B=. 15. The relatively low validity of brain volume is probably due to the low average age (10 years) of the sample. Because the ABCD iS a longitudinal study which will follow the youth until 18 years of age, it will be possible to determine in the near future if the validity of brain volume increases with age."
    Kirkegaard & Fuerst (2023)

  4. Traduction depuis :

    - Using a large modern dataset with top tier neurological data from MRI, we were able to confirm existing hereditarian-minded research on the relationship between brain measures and intelligence.
    - The accuracy of this model was surprisingly high, but some of this was related to ancestry confounding that had also previously been explored by other researchers. Using the White subsample of the data is sufficient to remove this, but beware of variance differences in test samples.
    - Race gaps show up on these modern predictions of intelligence based on brain data where the model has never seen a non-White person, and they are quite large.
    - The MRI-model can account for about a third of the observed intelligence gaps (36% for Black-White).
    - The extended Spearman's hypothesis was seen whereby g-loadings (of the MRI predictors) relates positively to group differences (Black-White, Hispanic-White gaps), and polygenic score validities (heritabilities).
    - The hereditarian research paradigm keeps being productive, generating new and interesting results in modern data.
    Kirkegaard (2023)

  5. Traduction depuis :

    "We used data from the Adolescent Brain Cognitive Development Study to create a multimodal MRI-based predictor of intelligence. We applied the elastic net algorithm to over 50,000 neurological variables. We find that race can confound models when a multiracial training sample is used, because models learn to predict race and use race to predict intelligence. When the model is trained on non-Hispanic Whites only, the MRI-based predictor has an out-of-sample model accuracy of r =.51, which is 3 to 4 times greater than the validity of whole brain volume in this dataset. This validity generalized across the major socially-defined racial/ethnic groupings (White, Black, and Hispanic). There are race gaps on the predicted scores, even though the model is trained on White subjects only. This predictor explains about 37% of the relation between both the Black and Hispanic classification and intelligence."
    Kirkegaard & Fuerst (2023)