Les bookmarks de Clem

Réponse intéressante de Ben Bolker, reposant sur le package lmperm, permettant l'ajustement de modèles linéaires avec test par permutation. À creuser, un jour.

stats

May 15, 2018 at 10:08:32 GMT+2 · permalink

·

https://stackoverflow.com/questions/24739097/r-trend-estimation-for-short-time-series

How to make a shaded relief in R

Un shaded relief sous R. S'appuie sur le package metR du gars sur github

R · stats

May 14, 2018 at 13:11:22 GMT+2 · permalink

·

https://eliocamp.github.io/codigo-r/2018/02/how-to-make-shaded-relief-in-r/

Aki's favorite scientific books (so far) - Statistical Modeling, Causal Inference, and Social Science

Liste des livres de stats préférés de Aki Vehtari. Ceux que je connais sont effectivement incontournables. Me reste à lire les autres !

stats

May 14, 2018 at 12:57:53 GMT+2 · permalink

·

http://andrewgelman.com/2018/05/14/aki_books/

[1805.01124] A Coefficient of Determination (R2) for Linear Mixed Models

Ah ? Ça m'intéresse

alire · stats

May 5, 2018 at 14:50:58 GMT+2 · permalink

·

https://arxiv.org/abs/1805.01124

[1804.06788] Validating Bayesian Inference Algorithms with Simulation-Based Calibration

Semble intéressant, à lire donc.

bayesienne · stats

April 19, 2018 at 09:21:00 GMT+2 · permalink

·

https://arxiv.org/abs/1804.06788

Is this outbreak over?

Quand un outbreak se termine-t-il ?

ecologie · stats

April 16, 2018 at 20:55:26 GMT+2 · permalink

·

https://reconlearn.netlify.com/post/practical-outbreakend/

optimization - Step-by-step example of reverse-mode automatic differentiation - Cross Validated

Super illustration de l'approche. L'exemple de ffriend est limpide.

math · stats

April 15, 2018 at 18:08:05 GMT+2 · permalink

·

https://stats.stackexchange.com/questions/224140/step-by-step-example-of-reverse-mode-automatic-differentiation

The Multivariable Chain Rule - HMC Calculus Tutorial

La règle de dérivation en chaîne multivariée, utilisée pour la /reverse mode algorithmic differentiation/, à son tour utilisée dans STAN.

Rapidement, si z = h(x,y), et si (i) x = f(t) et (ii) y = g(t), alors (dz/dt) = (dh/dx)*(dx/dt) + (dh/dy)*(dy/dt)

Bonne explication du pourquoi.

math · stats

April 15, 2018 at 18:00:12 GMT+2 · permalink

·

https://www.math.hmc.edu/calculus/tutorials/multichainrule/

Re: R2 measure in mixed models?

Intéressant scepticisme de Douglas Bates concernant la généralisation du R2 au cas des modèles mixtes.

mixte · modèle · stats

April 14, 2018 at 17:38:28 GMT+2 · permalink

·

http://thread.gmane.org/gmane.comp.lang.r.lme4.devel/3281

Getting Genetics Done: Using the "Divide by 4 Rule" to Interpret Logistic Regression Coefficients

Un petit "truc" rigolo tiré de Gelman et Hill : dans une régression logistique, la pente de la courbe est maximisée pour a + bX = 0.

Alors la dérivée de exp(a+bX)/(1+exp(a+bX)) à cet endroit de pente maximale vaut b*exp(a+bX)/((1+exp(a+bX))^2.

Alors, lorsque la pente de cette courbe maximale est b*exp(0)/(1+exp(0))^2 = b/4.

Autrement dit, si on a une régression logistique avec une pente de b, alors on divise b par 4, et on a une approximation de la différence max de la proba que y=1 pour chaque augmentation de une unité de X.
Par exemple, si le coefficient de régression vaut 0.8, alors une augmentation de une unité de x vaut une augmentation de 0.8/4=0.2 de la proba de y=1.

Bien sûr, l'approximation marche mieux quand la proba prédite est proche de 0.5, et soit quand beta est proche de 0, soit quand x varie peu (voir le commentaire de Ben Bolker).

Peut toujours servir.

stats · truc

April 13, 2018 at 21:30:32 GMT+2 · permalink

·

http://www.gettinggeneticsdone.com/2010/12/using-divide-by-4-rule-to-interpret.html

[1804.02921] Distributional Regression Forests for Probabilistic Precipitation Forecasting in Complex Terrain

"In many classical models this only captures the location of the distribution but over the last decade there has been increasing interest in distributional regression approaches modeling all parameters including location, scale, and shape."

Il existe des méthodes de modélisations distributionelles, mais elles supposent que l'on connaît déjà les prédicteurs pertinents. Il y a des méthodes de sélection des prédicteurs, mais qui ne permettent pas la modélisation distributionnelle. D'où des arbres et forêts distributionnels. M'a l'air rigolo cette histoire.

predictive · stats

April 11, 2018 at 11:44:29 GMT+2 · permalink

·

https://arxiv.org/abs/1804.02921

This is what “power = .06” looks like. Get used to it. - Statistical Modeling, Causal Inference, and Social Science

Graphe important. Quand l'effet est faible et que le bruit est important (donc quand la puissance est faible, ici de 0.06), se focaliser sur les effets significatifs conduit à des effets dont la magnitude est 9 fois plus importante que l'effet réel et qui ont une chance sur quatre d'avoir le mauvais signe.
En lien avec l'article précédent dans mon shaarli : plus une étude est caractérisée par du bruit, moins on peut avoir confiance dans les effets significatifs.

gelman · stats

April 10, 2018 at 12:19:00 GMT+2 · permalink

·

http://andrewgelman.com/2014/11/17/power-06-looks-like-get-used/

The "What does not kill my statistical significance makes it stronger" fallacy - Statistical Modeling, Causal Inference, and Social Science

"So, we’ve seen from statistical analysis that the “What does not kill my statistical significance makes it stronger” is a fallacy: Actually, the noisier the study, the less we learn from statistical significance."
Le truc, c'est que quand il y a beaucoup de bruit dans une étude, un résultat significatif tendra à indiquer un effet dont la magnitude tendra à être plus importante que l'effet réel, et dont le signe peut même aller dans le mauvais sens.

gelman · stats

April 10, 2018 at 12:15:24 GMT+2 · permalink

·

http://andrewgelman.com/2017/02/06/not-kill-statistical-significance-makes-stronger-fallacy/