2396 shaares
À suivre: l'application d'une distribution à entropie maximale pour l'estimation d'une probabilité (i.e. sur intervalle restreint)
Alors ÇA c'est du site utile. Pour tester les expressions régulières, dans les recherches/remplacements
Très intéressant: il est possible de définir le comportement d'emacs "on a per-file-basis", c'est-à-dire de définir une taille de fill-column, un mode, etc. propre à chaque fichier en définissant ça dans chaque fichier. J'en aurai surement l'usage un jour.
Contribution de Bob O'Hara sur la mesure de la qualité d'ajustement dans un GLM, sur R-SIG-Ecology. Avec un lien vers un de ses articles.
décidément, ce matin, il y a des choses intéressantes. À lire.
À récupérer et à lire.
Un plaidoyer pour arrêter d'utiliser des abbréviations pour les titres de journaux dans les listes de citations. Rapport qu'à l'époque digitale, c'est pas une bonne idée d'avoir plusieurs identifiants pour le même journal, que ça introduit des sources de confusions pour les bibliothécaires, et que ça crée un esprit de corps. Bon, c'est pousser les choses un peu loin, mais c'est vrai que le gain d'utiliser des abréviations est moins important maintenant que tout est digital.
À récupérer et à lire
Une explication claire de la différence entre du et ls, et pourquoi les deux commandes ne renvoient pas toujours les mêmes résultats
Appliquer des labels automatiquement sous gmail. Pratique pour gérer les flux rss.
Un service du W3C pour vérifier la validité des flux RSS et Atom
Ma prochaine lecture, quand j'aurai fini game of thrones.
p. 301 de "Perfectly reasonable deviations (from the beaten track). Richard P. Feynman:
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
Marrant. En même temps, en lisant la source, le gars qui propose d'inclure dans tous les papiers la citation suivante de façon routinière est sérieux:
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
Non, on n'utilise pas que 10% de son cerveau.
À garder sous le coude, pour le cas où certains articles seraient introuvables. C'est toujours la plaie de chercher des papiers derrière des paywall, surtout quand on n'est pas en milieu universitaire!
hin hin
très intéressant: un post de Roger D. Peng au sujet d'un tweet de Jan de Leeuw: "As long as statistics continues to emphasize assumptions, models, and inference it will remain a minor subfield of data science.", suivi d'un second tweet: "Statistics is the applied science that constructs and studies techniques for data analysis."
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
À lire...
Marre de chercher ça à chaque fois: la loi de student peut être vue comme un mélange de loi normales y_i de moyenne mu et de variance V_i, avec V_i suivant une loi inverse Chi-deux de paramètres nu et sigma^2:
y~N(mu,V_i)
V_i ~ inv-chi2(nu, sigma^2)
À noter, p. 304 du Bayesian Data Analysis, Gelman s'appuie sur ce modèle pour présenter la parameter expansion comme moyen d'améliorer la convergence des paramètres dans le MCMC.
y~N(mu,V_i)
V_i ~ inv-chi2(nu, sigma^2)
À noter, p. 304 du Bayesian Data Analysis, Gelman s'appuie sur ce modèle pour présenter la parameter expansion comme moyen d'améliorer la convergence des paramètres dans le MCMC.
