2369 shaares
39 results
tagged
statistique
Via Mathieu. Ça à l'air bien intéressant!
Un gars qui râle contre l'arrivée de la "data science" dans le milieu des affaires. Et contre cet effet de mode.
Autant je peux comprendre l'agacement des gars qui voient passer un effet de mode par an, autant je suis d'accord avec lui -- de façon générale -- sur sa liste de points. autant certains de ses arguments sont fallacieux, comme
"if there were a particular activity devoted to studying data, then there might be some virtue in the term “data science.” And indeed there is such an activity, and it already has a name: it is a branch of mathematics called statistics. It doesn’t need a name upgrade, or if it does, we should call it Statistics 2.0."
Certes, la statistique est une branche des mathématiques, mais pas l'analyse de données!!!
Autant je peux comprendre l'agacement des gars qui voient passer un effet de mode par an, autant je suis d'accord avec lui -- de façon générale -- sur sa liste de points. autant certains de ses arguments sont fallacieux, comme
"if there were a particular activity devoted to studying data, then there might be some virtue in the term “data science.” And indeed there is such an activity, and it already has a name: it is a branch of mathematics called statistics. It doesn’t need a name upgrade, or if it does, we should call it Statistics 2.0."
Certes, la statistique est une branche des mathématiques, mais pas l'analyse de données!!!
À lire aussi
Pour assurer le caractère reproductible d'une analyse/modélisation: inclure toutes les fonctions dans un package, les documenter avec Roxygen, stocker les données dans le répertoire data, et mettre l'analyse en tant que telle dans une vignette. Pas idiot du tout. J'avais déjà l'habitude de faire mes analyses sous forme de rapport, mais sur le fond, je vais essayer de faire ces analyses comme ça. Je suis super motivé.
Intéressant. J'aime bien ce blog.
Une belle explication du paradoxe de Simpson
Une distribution linux pour statisticiens.
Une belle défense de l'exploratoire. Il est toujours bon de rappeler que l'approche exploratoire est intéressante
Très intéressant
Tiens? des random forests pour très gros jeux de données: parallélisation au max, ou comment ramener un temps de calcul de 3 heures à 5 minutes.
À garder sous le coude
À garder sous le coude
Un nouveau format d'échange de données
Eh ben décidément, c'est la fête des vidéos. Et centré sur l'écologie.
Critique assez violente des modèles basés sur les presence only data. Basé sur son papier: Inference from presence-only data; the ongoing controversy
qui est lui-même une critique de l'article de Royle et al. "Likelihood analysis of species occurrence probability from presence-only data for modelling species distributions"
À voir
Critique assez violente des modèles basés sur les presence only data. Basé sur son papier: Inference from presence-only data; the ongoing controversy
qui est lui-même une critique de l'article de Royle et al. "Likelihood analysis of species occurrence probability from presence-only data for modelling species distributions"
À voir
Tony O'Hagan interview Dennis Lindley. Sur l'ensemble de sa carrière, sur l'histoire de la stat bayésienne, etc. Ses rencontres avec Savage, etc.
Très intéressant.
Voir aussi les liens associés: spiegelhalter, taleb, efron, etc. Pas mal de videos à voir. Une mine!
Très intéressant.
Voir aussi les liens associés: spiegelhalter, taleb, efron, etc. Pas mal de videos à voir. Une mine!
Tiens? encore quelqu'un qui découvre les écueils de l'utilisation non raisonnée des stats. Ya même une partie sur le hamster.
Sur le théorème de bayes
Expliquer n'est pas prédire. Ce gars est spécialiste de ça, et présente un paquet de ressources sur la question. À creuser en détail quand j'aurai le temps (à noter, il y a des liens vers des discussions sur stackoverflow)
Le blog de thomas Lumley. À garder sous le coude et explorer un jour où j'aurai le temps
Une introduction aux STEM: exploration des patrons spatio-temporels de distribution des espèces. De loin, ça a l'air pas mal comme approche. En tous cas dans l'objectif. Récupéré (Fink2010.pdf).
À creuser.
Un jour.
Oui, je sais.
À creuser.
Un jour.
Oui, je sais.
Une version de R normalement plus rapide que le R normal. Des tests effectués sur R-SIG-geo indiquent que cette version est bien plus rapide que le R d'origine. À garder sous le coude.