Les bookmarks de Clem

optimization - Step-by-step example of reverse-mode automatic differentiation - Cross Validated

Super illustration de l'approche. L'exemple de ffriend est limpide.

math · stats

April 15, 2018 at 18:08:05 GMT+2 · permalink

·

https://stats.stackexchange.com/questions/224140/step-by-step-example-of-reverse-mode-automatic-differentiation

The Multivariable Chain Rule - HMC Calculus Tutorial

La règle de dérivation en chaîne multivariée, utilisée pour la /reverse mode algorithmic differentiation/, à son tour utilisée dans STAN.

Rapidement, si z = h(x,y), et si (i) x = f(t) et (ii) y = g(t), alors (dz/dt) = (dh/dx)*(dx/dt) + (dh/dy)*(dy/dt)

Bonne explication du pourquoi.

math · stats

April 15, 2018 at 18:00:12 GMT+2 · permalink

·

https://www.math.hmc.edu/calculus/tutorials/multichainrule/

Re: R2 measure in mixed models?

Intéressant scepticisme de Douglas Bates concernant la généralisation du R2 au cas des modèles mixtes.

mixte · modèle · stats

April 14, 2018 at 17:38:28 GMT+2 · permalink

·

http://thread.gmane.org/gmane.comp.lang.r.lme4.devel/3281

Getting Genetics Done: Using the "Divide by 4 Rule" to Interpret Logistic Regression Coefficients

Un petit "truc" rigolo tiré de Gelman et Hill : dans une régression logistique, la pente de la courbe est maximisée pour a + bX = 0.

Alors la dérivée de exp(a+bX)/(1+exp(a+bX)) à cet endroit de pente maximale vaut b*exp(a+bX)/((1+exp(a+bX))^2.

Alors, lorsque la pente de cette courbe maximale est b*exp(0)/(1+exp(0))^2 = b/4.

Autrement dit, si on a une régression logistique avec une pente de b, alors on divise b par 4, et on a une approximation de la différence max de la proba que y=1 pour chaque augmentation de une unité de X.
Par exemple, si le coefficient de régression vaut 0.8, alors une augmentation de une unité de x vaut une augmentation de 0.8/4=0.2 de la proba de y=1.

Bien sûr, l'approximation marche mieux quand la proba prédite est proche de 0.5, et soit quand beta est proche de 0, soit quand x varie peu (voir le commentaire de Ben Bolker).

Peut toujours servir.

stats · truc

April 13, 2018 at 21:30:32 GMT+2 · permalink

·

http://www.gettinggeneticsdone.com/2010/12/using-divide-by-4-rule-to-interpret.html

[1804.03665] An information-theoretic, all-scales approach to comparing networks

Une approche permettant de comparer des graphes.

graphes · maths

April 13, 2018 at 21:11:07 GMT+2 · permalink

·

https://arxiv.org/abs/1804.03665

Graphab

Connaissais pas. Permet de modéliser des continuités écologiques.

bleues · graphab · trames · TVB · vertes

April 13, 2018 at 15:36:24 GMT+2 · permalink

·

https://sourcesup.renater.fr/graphab/fr/home.html

[1804.03732] Contest models highlight inefficiencies of scientific funding

C'est pas la première fois que je vois ça : la suggestion d'une loterie pour attribuer les financements. À suivre.

science

April 13, 2018 at 09:40:11 GMT+2 · permalink

·

https://arxiv.org/abs/1804.03732

Generating Executable ASCII art

Démarche pour générer de l'art ASCII exécutable sous R. Marrant

R

April 12, 2018 at 13:02:04 GMT+2 · permalink

·

https://coolbutuseless.bitbucket.io/2018/04/12/generating-executable-ascii-art/

GitHub refond entièrement Gist, son outil de partage de morceaux de code

Tout le monde utilise ça en ce moment. Connaissais pas.

github

April 12, 2018 at 09:02:16 GMT+2 · permalink

·

https://www.nextinpact.com/news/76069-github-refond-entierement-gist-son-outil-partage-morceaux-code.htm

Lessons and Examples

Il est rigolo ce site qui explique l'utilisation de purrr.

R · tidyverse

April 11, 2018 at 22:03:15 GMT+2 · permalink

·

https://jennybc.github.io/purrr-tutorial/

Sending Messages With Gmailr

Délire ! On peut envoyer des mails avec R !

mail · R

April 11, 2018 at 21:52:14 GMT+2 · permalink

·

https://cran.r-project.org/web/packages/gmailr/vignettes/sending_messages.html

Graphs

Un site de référence pour ggplot2. Assez génial.

ggplot · R

April 11, 2018 at 21:40:50 GMT+2 · permalink

·

http://www.cookbook-r.com/Graphs/

Revisitation analysis uncovers spatio‐temporal patterns in animal movement data - Bracis - - Ecography - Wiley Online Library

Un nouveau package sous R pour l'analyse de mouvements. Basé sur l'analyse de récursion. M'a l'air pas mal du tout, mais pour le moment, j'ai lu qu'en diagonale.

mouvement · R

April 11, 2018 at 12:28:07 GMT+2 · permalink

·

https://onlinelibrary.wiley.com/doi/10.1111/ecog.03618

[1804.02921] Distributional Regression Forests for Probabilistic Precipitation Forecasting in Complex Terrain

"In many classical models this only captures the location of the distribution but over the last decade there has been increasing interest in distributional regression approaches modeling all parameters including location, scale, and shape."

Il existe des méthodes de modélisations distributionelles, mais elles supposent que l'on connaît déjà les prédicteurs pertinents. Il y a des méthodes de sélection des prédicteurs, mais qui ne permettent pas la modélisation distributionnelle. D'où des arbres et forêts distributionnels. M'a l'air rigolo cette histoire.

predictive · stats

April 11, 2018 at 11:44:29 GMT+2 · permalink

·

https://arxiv.org/abs/1804.02921

This is what “power = .06” looks like. Get used to it. - Statistical Modeling, Causal Inference, and Social Science

Graphe important. Quand l'effet est faible et que le bruit est important (donc quand la puissance est faible, ici de 0.06), se focaliser sur les effets significatifs conduit à des effets dont la magnitude est 9 fois plus importante que l'effet réel et qui ont une chance sur quatre d'avoir le mauvais signe.
En lien avec l'article précédent dans mon shaarli : plus une étude est caractérisée par du bruit, moins on peut avoir confiance dans les effets significatifs.

gelman · stats

April 10, 2018 at 12:19:00 GMT+2 · permalink

·

http://andrewgelman.com/2014/11/17/power-06-looks-like-get-used/

The "What does not kill my statistical significance makes it stronger" fallacy - Statistical Modeling, Causal Inference, and Social Science

"So, we’ve seen from statistical analysis that the “What does not kill my statistical significance makes it stronger” is a fallacy: Actually, the noisier the study, the less we learn from statistical significance."
Le truc, c'est que quand il y a beaucoup de bruit dans une étude, un résultat significatif tendra à indiquer un effet dont la magnitude tendra à être plus importante que l'effet réel, et dont le signe peut même aller dans le mauvais sens.

gelman · stats

April 10, 2018 at 12:15:24 GMT+2 · permalink

·

http://andrewgelman.com/2017/02/06/not-kill-statistical-significance-makes-stronger-fallacy/

UW Interactive Data Lab | Papers

De l'intérêt de viridis comme palette par défaut, intérêt mesuré par des études sur la perception.

colors · palette · R

April 10, 2018 at 10:23:39 GMT+2 · permalink

·

http://idl.cs.washington.edu/papers/quantitative-color/

rCarto/osrm: Shortest Paths and Travel Time from OpenStreetMap with R

Package intéressant !

github · R

April 9, 2018 at 14:15:49 GMT+2 · permalink

·

https://github.com/rCarto/osrm

antuki (Kim A.)

Une personne intéressante à suivre, semble-t-il. Son package COGugaison est un package toujours bon à garder sous le coude, pour identifier les changements de noms, de code, etc des communes françaises.

github · R

April 9, 2018 at 09:12:34 GMT+2 · permalink

·

https://github.com/antuki

The viridis color palettes

La palette viridis comme palette de couleur idéale.

colors · couleurs · R

April 8, 2018 at 13:41:40 GMT+2 · permalink

·

https://cran.r-project.org/web/packages/viridis/vignettes/intro-to-viridis.html