2353 shaares
A lire
Article intéressant. Il réussit à me convaincre... à passer aux pipes. Je suis dans le même cas que lui, et je me retrouve dans ses arguments. Mais comme les commentaires le soulignent (y compris lui-même), on a pas mal à y gagner, en termes cognitifs, de flexibilité et de performance. Le rejet est surtout lié à nos vieilles habitudes.
Bon.
Ok, je vais peut-être m'y mettre. Pas pour les packages ou les fonctions (même Wickham tend à le décourager), mais pour l'exploratoire au quotidien.
À suivre
Bon.
Ok, je vais peut-être m'y mettre. Pas pour les packages ou les fonctions (même Wickham tend à le décourager), mais pour l'exploratoire au quotidien.
À suivre
Excellente explication du principe de l'évaluation non-standard sous R, qui permet aux fonctions d'accéder non seulement aux valeurs des objets passés en arguments, mais aussi les expressions associées. M'a l'air pas mal ce bouquin, il est sur ma liste de lecture...
C'est aussi mon cas. À chaque fois que j'essaie de bouger de ça, je me retrouve à passer plus de temps à essayer de comprendre le tidyverse que le bon vieux base R. J'ai peut-être tort.
Je vais essayer de voir si ça vaut vraiment le coup de bouger. Perso, j'ai un peu la flemme, vu que je suis bien efficace en base R, mais si ça permet de gagner encore en efficacité, pourquoi pas ?
À suivre...
Je vais essayer de voir si ça vaut vraiment le coup de bouger. Perso, j'ai un peu la flemme, vu que je suis bien efficace en base R, mais si ça permet de gagner encore en efficacité, pourquoi pas ?
À suivre...
À lire
Perspective intéressante. Perso, mon expérience d'Arch Linux se rapproche plus de celle de Jan Van Uytven dans les commentaires : "Arch is great until it breaks, and it will break. If you want to deepen your Linux skills at debugging and repair, or just deepen your knowledge, there's no better distribution. But if you're just looking to get things done, Debian/Ubuntu/Fedora is a more stable option."
C'est exactement comme ça que j'ai ressenti Arch. Depuis, je suis sous Debian.
C'est exactement comme ça que j'ai ressenti Arch. Depuis, je suis sous Debian.
Marrant ce blog. Elle regarde quelles sont les graines les plus utilisées pour générer des nombres aléatoires. Sans surprise, des 1234, 12, 10, etc. Mais d'autres valeurs plus surprenantes, comme 13121098, visiblement choisie pour un cours coursera et réutilisée par tous ceux qui suivent le cours... Ou 42 mais là on sait pourquoi.
Au passage, je m'abonne au RSS.
Au passage, je m'abonne au RSS.
Intéressant : un article sur RQGIS qui montre les possibilités du package. Pas mal du tout...
Ayant eu à réinstaller tous mes packages R récemment, je stocke ici le code utilisé :
install.packages(c("adehabitatHS", "raster", "maptools","rgdal","spatstat","knitr","ggplot2","xtable","splancs",
"sp","MCMCglmm","devtools","rjags","coda","igraph","openssl","rpanel","gsl","adehabitat",
"RgoogleMaps","devtools","rgeos","ggmap","RODBC", "tidyverse","sf","lme4","rgeos","car","ggplot2","stringr","lubridate"), dep=TRUE)
library(devtools)
install_github("ClementCalenge/oncfsMisc")
install_github("ClementCalenge/metroponcfs")
install_github("ClementCalenge/scankd")
install_github("ClementCalenge/scsl")
install_github("ClementCalenge/roedeer3sites")
install_github("thomasp85/gganimate")
install.packages(c("adehabitatHS", "raster", "maptools","rgdal","spatstat","knitr","ggplot2","xtable","splancs",
"sp","MCMCglmm","devtools","rjags","coda","igraph","openssl","rpanel","gsl","adehabitat",
"RgoogleMaps","devtools","rgeos","ggmap","RODBC", "tidyverse","sf","lme4","rgeos","car","ggplot2","stringr","lubridate"), dep=TRUE)
library(devtools)
install_github("ClementCalenge/oncfsMisc")
install_github("ClementCalenge/metroponcfs")
install_github("ClementCalenge/scankd")
install_github("ClementCalenge/scsl")
install_github("ClementCalenge/roedeer3sites")
install_github("thomasp85/gganimate")
L'article associé a l'air génial. À lire absolument.
Le but : utiliser du machine learning sur des données de crimes liés à la drogue identifiés par la police dans le passé pour identifier les zones où ces crimes vont se produire dans le futur.
Le piège : biais de collecte monstrueux; au lieu d'identifier de nouvelles zones où ces problèmes se produisent, l'algo est "tiré" en direction des quartiers où ces problèmes ont déjà été identifiés. Donc l'algo envoie la police dans des zones déjà super-surveillées, et passe à côté des nouvelles zones les plus dangereuses.
"Predictive policing makes policing even more unfair than it already is".
Le piège : biais de collecte monstrueux; au lieu d'identifier de nouvelles zones où ces problèmes se produisent, l'algo est "tiré" en direction des quartiers où ces problèmes ont déjà été identifiés. Donc l'algo envoie la police dans des zones déjà super-surveillées, et passe à côté des nouvelles zones les plus dangereuses.
"Predictive policing makes policing even more unfair than it already is".
Un autre lien sur git
Je cherche à encourager les collègues à utiliser git pour leur projet, mais comme ils sont tous sous windows, je cherche des bons tutos pour windows qui pourraient les motiver. Celui-là m'a l'air pas mal...
À creuser...
À creuser...
Revenir à un ancien commit, définir master là, et placer les commits les plus récents sur une branche annexe, pour mémoire.
Sympa. Via Mathieu.
Apparemment, il existe des méthodes stats permettant de modéliser des trajets sur une sphère (par exemple des migrations d'animaux, des trajets d'ouragans, etc.). Je ne connaissais pas.
Bon, pas besoin pour le moment, mais c'est bon de savoir que ça existe.
Bon, pas besoin pour le moment, mais c'est bon de savoir que ça existe.
Un nombre premier dont la représentation en binaire est une girafe. Marrant.
Une autre source sur pourquoi la surdispersion ne peut pas être estimée avec des variables binaires. A noter, je ne suis pas complètement d'accord quand il dit que la surdispersion n'a pas de sens. Hadfield indique pour illustrer ce point qu'il y a une différence entre 5% des patients d'un hôpital ayant 100% de chances de mourir, et tous les patients ayant chacun 5% de chances de mourir, même si le glm ne pourra pas faire la différence entre les deux... pourtant le premier cas est un cas extrême de surdispersion.
Excellente réponse de Ben Bolker sur la gestion de la sur/sous-dispersion avec des variables binaires, pas toujours possible à estimer (avec références). Sur ce sujet voir aussi les "course notes" fournies comme vignette du package MCMCglmm par Jarrod Hadfield.