2353 shaares
Contribution de Bob O'Hara sur la mesure de la qualité d'ajustement dans un GLM, sur R-SIG-Ecology. Avec un lien vers un de ses articles.
décidément, ce matin, il y a des choses intéressantes. À lire.
À récupérer et à lire.
Un plaidoyer pour arrêter d'utiliser des abbréviations pour les titres de journaux dans les listes de citations. Rapport qu'à l'époque digitale, c'est pas une bonne idée d'avoir plusieurs identifiants pour le même journal, que ça introduit des sources de confusions pour les bibliothécaires, et que ça crée un esprit de corps. Bon, c'est pousser les choses un peu loin, mais c'est vrai que le gain d'utiliser des abréviations est moins important maintenant que tout est digital.
À récupérer et à lire
Une explication claire de la différence entre du et ls, et pourquoi les deux commandes ne renvoient pas toujours les mêmes résultats
Appliquer des labels automatiquement sous gmail. Pratique pour gérer les flux rss.
Un service du W3C pour vérifier la validité des flux RSS et Atom
Ma prochaine lecture, quand j'aurai fini game of thrones.
p. 301 de "Perfectly reasonable deviations (from the beaten track). Richard P. Feynman:
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
Marrant. En même temps, en lisant la source, le gars qui propose d'inclure dans tous les papiers la citation suivante de façon routinière est sérieux:
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
Non, on n'utilise pas que 10% de son cerveau.
À garder sous le coude, pour le cas où certains articles seraient introuvables. C'est toujours la plaie de chercher des papiers derrière des paywall, surtout quand on n'est pas en milieu universitaire!
hin hin
très intéressant: un post de Roger D. Peng au sujet d'un tweet de Jan de Leeuw: "As long as statistics continues to emphasize assumptions, models, and inference it will remain a minor subfield of data science.", suivi d'un second tweet: "Statistics is the applied science that constructs and studies techniques for data analysis."
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
À lire...
Marre de chercher ça à chaque fois: la loi de student peut être vue comme un mélange de loi normales y_i de moyenne mu et de variance V_i, avec V_i suivant une loi inverse Chi-deux de paramètres nu et sigma^2:
y~N(mu,V_i)
V_i ~ inv-chi2(nu, sigma^2)
À noter, p. 304 du Bayesian Data Analysis, Gelman s'appuie sur ce modèle pour présenter la parameter expansion comme moyen d'améliorer la convergence des paramètres dans le MCMC.
y~N(mu,V_i)
V_i ~ inv-chi2(nu, sigma^2)
À noter, p. 304 du Bayesian Data Analysis, Gelman s'appuie sur ce modèle pour présenter la parameter expansion comme moyen d'améliorer la convergence des paramètres dans le MCMC.
Faut vraiment que je me mette à STAN...
Ouh mais ça m'a l'air TRÈS intéressant! cette approche semble répondre à une interrogation de longue date. Les modèles mixtes, utilisés de façon routinière pour modéliser des tendances d'évolution, ont un problème: ils supposent que tous les individus de la population ont la même tendance +/- un bruit. Ce qui est absurde: dans un cadre écologique par exemple, une espèce peut voir ses effectifs augmenter dans telle unité spatiale, et diminuer dans telle autre. Supposer une homogénéité de comportement des tendances à priori m'a toujours paru un peu violent, mais que faire d'autre. Cette approche semble répondre à cette interrogation. Après, la question est dans quelle mesure la topologie de ces CART pour données longitudinales est-elle stable? parce qu'en général, les CART, hein...
Bref, à lire, et dès que le problème se reposera, à tester (et si j'ai un creux dans le boulot, un ti coup de monte carlo pour voir ce que ça raconte).
Bref, à lire, et dès que le problème se reposera, à tester (et si j'ai un creux dans le boulot, un ti coup de monte carlo pour voir ce que ça raconte).
Open science framework. À regarder de plus près un jour.