2390 shaares
449 results
tagged
stats
Sur la significativité statistique. Il y a des pointeurs vers des articles intéressants sur les problèmes de faux positifs. Et le graphe est rigolo, même s'il n'amuse pas Andrew Gelman.
Une autre équivalence que je stocke ici. Lorsque l'on calcule la divergence de Kullback leibler entre deux distributions normales multivariées, la divergence résultante correspond à la distance de Mahalanobis.
Indiqué dans Bar-Hen & Daudin, 1995, Generalization of the Mahalanobis distance in the mixed case, Journal of Multivariate Analysis, 53, 332-342.
Indiqué dans Bar-Hen & Daudin, 1995, Generalization of the Mahalanobis distance in the mixed case, Journal of Multivariate Analysis, 53, 332-342.
Je stocke ça ici parce que j'en ai marre de passer des heures à chercher une preuve de cette équivalence à chaque fois.
Lorsque l'on dispose d'un tableau X contenant le codage disjonctif complet d'une variable qualitative, et un vecteur y contenant des proportions des différentes catégories, la distance de Mahalanobis entre le vecteur y et la distribution des unités dans X est une distance du Chi-deux. Montrant ainsi la pertinence de l'utilisation de la distance de Mahalanobis pour les variables qualitatives.
C'est démontré dans
Greenacre (2007) Correspondence analysis in practice, second edition, Taylor & Francis, p. 270.
Lorsque l'on dispose d'un tableau X contenant le codage disjonctif complet d'une variable qualitative, et un vecteur y contenant des proportions des différentes catégories, la distance de Mahalanobis entre le vecteur y et la distribution des unités dans X est une distance du Chi-deux. Montrant ainsi la pertinence de l'utilisation de la distance de Mahalanobis pour les variables qualitatives.
C'est démontré dans
Greenacre (2007) Correspondence analysis in practice, second edition, Taylor & Francis, p. 270.
Oh mais ça m'a l'air intéressant ça! On a de l'info environnementale à échelle fine (e.g. pixels de 100 mètres) et de l'info sur la distribution d'une espèce grossière (genre présence dans un gros quadrat), et on veut une carte de distribution à l'échelle fine. Le gars dit que c'est possible et publie la solution. Bidouillage immonde ou pas? j'ai pas lu, mais incontestablement, c'est à garder sous le coude.
La science ne s'autocorrige pas. TL;DR. Mais à lire un jour
Très intéressant. Une étude sur la surinterprétation des données:
Extrait:
"My final example is a wonderful study by psychologist Craig Bennett and colleagues, who found statistically significant correlations in a functional MRI scan of a dead salmon. They were using the same sort of analysis that non-joking political scientists use in making claims such as "Red Brain, Blue Brain: Evaluative Processes Differ in Democrats and Republicans," but the difference is that Bennett and his colleagues are open about the fact that these imaging studies have hundreds of thousands of degrees of freedom. The salmon study is beautiful because everyone knows a dead fish can't be thinking, but it's still possible to find patterns if you look hard enough."
J'ai récupéré ledit article. Un poster en fait, qui est encore plus drôle. Extraits savoureux de l'article:
"The salmon was shown a series of photographs depicting human individuals in social situations with a specified emotional valence. The salmon was asked to determine what emotion the individual in the photo must have been experiencing (...) "
Ils font en même temps une IRM du cerveau du saumon mort, et ils ajustent pour chaque voxel un modèle prédisant la réponse hémodynamique. Et font un test par pixel. Sans correction de test multiple. Et ils trouvent des structures! J'aurai bien aimé voir la tête des membres de l'équipe technique à qui on a demandé de montrer les photos pornos à un saumon mort, pendant qu'ils analysaient ses réactions :-)
Extrait de Bennett et al (2009) Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: An argument for multiple comparisons correction.
Extrait:
"My final example is a wonderful study by psychologist Craig Bennett and colleagues, who found statistically significant correlations in a functional MRI scan of a dead salmon. They were using the same sort of analysis that non-joking political scientists use in making claims such as "Red Brain, Blue Brain: Evaluative Processes Differ in Democrats and Republicans," but the difference is that Bennett and his colleagues are open about the fact that these imaging studies have hundreds of thousands of degrees of freedom. The salmon study is beautiful because everyone knows a dead fish can't be thinking, but it's still possible to find patterns if you look hard enough."
J'ai récupéré ledit article. Un poster en fait, qui est encore plus drôle. Extraits savoureux de l'article:
"The salmon was shown a series of photographs depicting human individuals in social situations with a specified emotional valence. The salmon was asked to determine what emotion the individual in the photo must have been experiencing (...) "
Ils font en même temps une IRM du cerveau du saumon mort, et ils ajustent pour chaque voxel un modèle prédisant la réponse hémodynamique. Et font un test par pixel. Sans correction de test multiple. Et ils trouvent des structures! J'aurai bien aimé voir la tête des membres de l'équipe technique à qui on a demandé de montrer les photos pornos à un saumon mort, pendant qu'ils analysaient ses réactions :-)
Extrait de Bennett et al (2009) Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: An argument for multiple comparisons correction.
Plein de ressources sur le bayésien non paramétrique
Le théorème de la limite centrale expliqué aux enfants avec des lapins et des dragons. Marrant
pas vu, mais à voir
La politique du bonhomme: un papier pour lequel le code n'est pas disponible ne vaut rien. Il n'existe pas
Une belle critique de la régression lasso utilisée à tort et à travers
Quand on prépare un cours pour R, et qu'on est pas sûr que malgré les recommandations, il n'y aura pas un clampin qui n'aura pas installé tous les packages, ya ça pour récupérer tous les packages et dépendances.
Tiens un article sur les stats pour les sciences participatives. À récupérer.
Un SMBC lié à l'interprétation des graphes
Un papier qui m'a l'air tout ce qu'il y a de plus intéressant!
Tiens? un package pour apprendre les concepts importants en statistique
Quelques mots sur maxent en tant que mathématiquement équivalent aux GLM. À lire
Qu'est-ce qu'un bon modèle. À voir.
Des bouquins de stats en open-access
Le débat continue