2369 shaares
189 results
tagged
science
Apparemment, ce n'est pas si simple: le big data existe qu'on le veuille ou non. Pour le moment, le truc est mobilisé par les informaticiens, mais les stateux devraient aussi s'intéresser à la chose. Pour le moment, la rupture est claire. Mais à l'avenir? "The goal is to prepare members of our profession to collaborate on Big Data problems". On va y venir, on n'y coupera pas...
Comme l'indique l'auteur: "We know statistical thinking—our understanding of modeling, bias, confounding, false discovery, uncertainty, sampling, and design—brings much to the table. We also must be prepared to understand other ways of thinking that are critical in the Age of Big Data and to integrate these with our own expertise and knowledge."
Ça me fait penser aux données GPS et au SIG en écologie: pendant longtemps, ça a été très à la mode, la révolution, on pouvait plus rien faire sans utiliser ça. Ensuite, retour de balancier, comme on savait pas quoi en faire on a commencé à se dire que c'était pas la solution. Et maintenant, des solutions apparaissent, et on se rend compte que ça permet de répondre à certaine question et pas à d'autres... et on devient plus raisonnable
Là, c'est un peut pareil: on a des bouquin du genre: "Big Data: A Revolution That Will Transform How We Live, Work, and Think", tout le monde qui le vend à toutes les sauces, et quand on aura compris qu'on peut faire de la belle merde avec ça, on reviendra à des questions plus raisonnables... mais tout aussi pertinentes.
Bon ben d'accord, je vais lancer une veille là-dessus... à rapprocher de la veille sur les sciences participatives, ce sont les mêmes questions qui se posent!
Comme l'indique l'auteur: "We know statistical thinking—our understanding of modeling, bias, confounding, false discovery, uncertainty, sampling, and design—brings much to the table. We also must be prepared to understand other ways of thinking that are critical in the Age of Big Data and to integrate these with our own expertise and knowledge."
Ça me fait penser aux données GPS et au SIG en écologie: pendant longtemps, ça a été très à la mode, la révolution, on pouvait plus rien faire sans utiliser ça. Ensuite, retour de balancier, comme on savait pas quoi en faire on a commencé à se dire que c'était pas la solution. Et maintenant, des solutions apparaissent, et on se rend compte que ça permet de répondre à certaine question et pas à d'autres... et on devient plus raisonnable
Là, c'est un peut pareil: on a des bouquin du genre: "Big Data: A Revolution That Will Transform How We Live, Work, and Think", tout le monde qui le vend à toutes les sauces, et quand on aura compris qu'on peut faire de la belle merde avec ça, on reviendra à des questions plus raisonnables... mais tout aussi pertinentes.
Bon ben d'accord, je vais lancer une veille là-dessus... à rapprocher de la veille sur les sciences participatives, ce sont les mêmes questions qui se posent!
Ben vinzou, les gars ils ont quand même fait très fort...
via le hollandais volant.
via le hollandais volant.
Waaaaaa cébo.
(via le hollandais volant)
(via le hollandais volant)
J'ai l'impression de lire mon histoire à moi dans ce billet. Sauf que moi, je faisais pas de rugby, mais sinon, sur le principe c'est exactement ça, c'est à la fac que j'ai commencé à aimer aller en cours.
Je suis complètement d'accord avec l'auteur qui indique:
"Une maladie toute française est de croire que notre futur est inscrit dans les astres du parcours scolaire. Si vous n’êtes pas dans les clous pendant les années allant de la 4é à la terminale, si pour des raisons diverses et variées vous dérivez et bien point de salut, vous voilà stigmatisés à jamais."
C'est tellement vrai!
Je suis complètement d'accord avec l'auteur qui indique:
"Une maladie toute française est de croire que notre futur est inscrit dans les astres du parcours scolaire. Si vous n’êtes pas dans les clous pendant les années allant de la 4é à la terminale, si pour des raisons diverses et variées vous dérivez et bien point de salut, vous voilà stigmatisés à jamais."
C'est tellement vrai!
Tiens? cette stratégie de faire des annexes bien détaillées qui raconte des histoires avec des articles qui les résument ne fait pas l'unanimité. En ce qui me concerne, quand on oblige les auteurs a écrire des articles de quelques milliers de mots, je trouve qu'il y a un moment où les annexes commencent à remplacer l'article: elles seules permettent la reproductibilité.
La cuvée Ig-Nobel 2014 est arrivée
8.7% des projets ANR soumis sont acceptés!
Je suis bien content d'être sorti de ce système...
Je suis bien content d'être sorti de ce système...
Bon, et puis je stocke ce post ici, il semble être un peu incontournable en ce moment, et tout le monde en parle, surtout depuis la présentation de Ben Bolker à l'ISEC à Montpellier. La notion de machisme statistique décrit la tendance à vouloir écraser le lecteur sous un arsenal monstrueux de statistiques compliquées et incompréhensibles. C'est ce bloggeur qui a introduit la notion, et qui est très à la mode en ce moment en écologie.
Un peu d'éthymologie:
Courbe sigmoïde: ça vient de la lettre grecque sigma qui produit le son S, et S est la forme de la courbe. Zont été la chercher loin celle-là.
Logarithme: vient de logos (rapport, proportion) et arithmos (nombre), inventé par John Napier au XVIème siècle.
Logistique: inventé par Verhulst au XIXème siècle, sans raison, mais apparemment, en grec ça veut dire calcul, et jusqu'au XVIIIème logistique était synonyme de logarithme. Plus après Verhulst.
Me coucherai moins con.
Courbe sigmoïde: ça vient de la lettre grecque sigma qui produit le son S, et S est la forme de la courbe. Zont été la chercher loin celle-là.
Logarithme: vient de logos (rapport, proportion) et arithmos (nombre), inventé par John Napier au XVIème siècle.
Logistique: inventé par Verhulst au XIXème siècle, sans raison, mais apparemment, en grec ça veut dire calcul, et jusqu'au XVIIIème logistique était synonyme de logarithme. Plus après Verhulst.
Me coucherai moins con.
Un plaidoyer pour arrêter d'utiliser des abbréviations pour les titres de journaux dans les listes de citations. Rapport qu'à l'époque digitale, c'est pas une bonne idée d'avoir plusieurs identifiants pour le même journal, que ça introduit des sources de confusions pour les bibliothécaires, et que ça crée un esprit de corps. Bon, c'est pousser les choses un peu loin, mais c'est vrai que le gain d'utiliser des abréviations est moins important maintenant que tout est digital.
p. 301 de "Perfectly reasonable deviations (from the beaten track). Richard P. Feynman:
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
"In physics the truth is rarely perfecly clear, and that is certainly universally the case in human affairs. Hence, what is not surrounded by uncertainty cannot be the truth".
Une très belle citation que je me garde sous le coude ici
Marrant. En même temps, en lisant la source, le gars qui propose d'inclure dans tous les papiers la citation suivante de façon routinière est sérieux:
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
My salary, grants, promotions, professional standing, and career all depend on publishing significant findings frequently. I declare these incentives have in no way influenced the integrity of the present research.
Non, on n'utilise pas que 10% de son cerveau.
très intéressant: un post de Roger D. Peng au sujet d'un tweet de Jan de Leeuw: "As long as statistics continues to emphasize assumptions, models, and inference it will remain a minor subfield of data science.", suivi d'un second tweet: "Statistics is the applied science that constructs and studies techniques for data analysis."
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
Ce que Roger D Peng interprête, à tort à mon avis comme le fait que la statistique n'est qu'un sous-champ mineur de la "data science" (incluant biométrie, psychométrie, etc.). C'est pas normal, ça devrait être le contraire, i.e. la data science devrait être un sous-champs de la statistique "What should be is that statistics should include the field of data science. Honestly, that would be beneficial to the field of statistics and would allow us to provide a home to many people who don't necessarily have one ". Le fait est qu'être à la frontière n'est pas toujours simple, mais d'un autre côté, je ne suis pas d'accord avec le point de vue de Roger D Peng. La statistique est une discipline des mathématiques, il est normal que le statisticien fonctionne en mathématicien. Je ne pense pas que la stat devrait englober la data science. Pour moi, ce serait aller trop loin (en exagérant un peu, ce serait un peu équivalent au physicien convaincu que la science physique devrait englober toutes les autres sciences).
Par contre, je trouve bien que des gens comme Jan de Leeuw souligne que le rôle du stateux n'est pas seulement de développer des techniques pour l'inférence. L'exploratoire fait aussi partie du champs de la statistique.
À parcourir absolument. Le bouquin est disponible gratuitement, apparemment, du coup je vais récupérer ça.
Encore un serveur de preprint, figures, etc. pour les écolos (entre autre).
Edit: en fait, c'est un fourre-tout où on peut stocker tout un tas de trucs, incluant des préprints, des jeux de données, des vidéos, des figures, des candidatures à des offres de financements, etc.
Pas sûr que ce soit super utile. À voir.
Edit: en fait, c'est un fourre-tout où on peut stocker tout un tas de trucs, incluant des préprints, des jeux de données, des vidéos, des figures, des candidatures à des offres de financements, etc.
Pas sûr que ce soit super utile. À voir.
Un autre point de vue sur l'affaire Facebook. La clef de la critique: l'expérience n'a pas été approuvée par un comité d'éthique comme c'est le cas d'ordinaire en psychologie.
L'auteur indique "Unfortunately, we cannot undo the harm that potentially has been caused by this research. Considering the sample size (over 600,000) and the reported significant effect of the experimental manipulation, it is possible that vulnerable participants were harmed".
C'est vrai que, comme le disait un autre blogger (http://junkcharts.typepad.com/numbersruleyourworld/2014/06/the-facebook-experiment-controversy.html), toute opération publicitaire, tout discours politique est en soi une opération de manipulation psychologique dont il ne doit pas être compliqué de montrer l'effet non seulement sur les émotions, mais même sur les actes d'une population.
Mais d'un autre côté, ce que souligne ce gars avec raison est qu'il y a des règles scientifiques auxquelles on ne doit pas déroger même quand on s'appelle Facebook. Et l'obligation de passage d'une expérience en psychologie devant un comité d'éthique en est une. Mettre en œuvre ce genre d'expérience à grande échelle sans l'aval d'un comité d'éthique est une pratique discutable, non parce que cette expérience est en elle-même plus criticable que les pratiques politiques ou commerciales habituelles, mais parce qu'elle a une visée scientifique et qu'elle doit donc se plier aux règles scientifiques conçues pour éviter les dérives.
L'auteur indique "Unfortunately, we cannot undo the harm that potentially has been caused by this research. Considering the sample size (over 600,000) and the reported significant effect of the experimental manipulation, it is possible that vulnerable participants were harmed".
C'est vrai que, comme le disait un autre blogger (http://junkcharts.typepad.com/numbersruleyourworld/2014/06/the-facebook-experiment-controversy.html), toute opération publicitaire, tout discours politique est en soi une opération de manipulation psychologique dont il ne doit pas être compliqué de montrer l'effet non seulement sur les émotions, mais même sur les actes d'une population.
Mais d'un autre côté, ce que souligne ce gars avec raison est qu'il y a des règles scientifiques auxquelles on ne doit pas déroger même quand on s'appelle Facebook. Et l'obligation de passage d'une expérience en psychologie devant un comité d'éthique en est une. Mettre en œuvre ce genre d'expérience à grande échelle sans l'aval d'un comité d'éthique est une pratique discutable, non parce que cette expérience est en elle-même plus criticable que les pratiques politiques ou commerciales habituelles, mais parce qu'elle a une visée scientifique et qu'elle doit donc se plier aux règles scientifiques conçues pour éviter les dérives.
Dans la série "articles originaux dans plos one". Quand on monte un escalier, le monter deux marches à la fois permet d'atteindre un *taux* de dépense d'énergie plus élevé qu'une marche à la fois. En d'autres termes, c'est plus fatiguant. Mais comme la montée est plus longue en prenant une marche à la fois, au total, la *quantité* d'énergie dépensée est supérieure dans le cas une marche à la fois. Moralité, pour maigrir, on monte les escaliers une marche à la fois.
Tiens? un point de vue intéressant sur l'expérience de manipulation à grande échelle de Facebook. L'auteur ne comprend pas pourquoi une telle controverse, dans la mesure où ce genre de manipulation est menée à grande échelle par n'importe quel politicien de base ou par n'importe quelle entreprise de pub. Et en pire: alors que l'expérience Facebook ne visait qu'à manipuler les émotions, les politiciens et boites de pub cherchent à manipuler émotions, comportement action.
Bon, de toutes façons, ils sont chez eux ils font ce qu'ils veulent. Moi chuis pas sur facebook et je m'en porte pas plus mal.
Bon, de toutes façons, ils sont chez eux ils font ce qu'ils veulent. Moi chuis pas sur facebook et je m'en porte pas plus mal.