2353 shaares
Bon à savoir
Intéressant
Intéressant. Et surtout, quelques références fournies sur le sujet.
Nooooon? marrant.
Et vlan.
à lire
Tiens, Guillaume Chapron cité par the guardian.
J'aime bien.
Une histoire de la data science dans le milieu des affaires. À noter le point sur lequel tout le monde s'accorde, les pour comme les contre:
"there’s no clear definition of data science. (...) there are as yet no standards for data science curriculum content"
OK. Bon ben c'est quand même un peu éloigné de mes thématiques.
Je ne sais pas si je vais poursuivre cette veille.
"there’s no clear definition of data science. (...) there are as yet no standards for data science curriculum content"
OK. Bon ben c'est quand même un peu éloigné de mes thématiques.
Je ne sais pas si je vais poursuivre cette veille.
Un gars qui râle contre l'arrivée de la "data science" dans le milieu des affaires. Et contre cet effet de mode.
Autant je peux comprendre l'agacement des gars qui voient passer un effet de mode par an, autant je suis d'accord avec lui -- de façon générale -- sur sa liste de points. autant certains de ses arguments sont fallacieux, comme
"if there were a particular activity devoted to studying data, then there might be some virtue in the term “data science.” And indeed there is such an activity, and it already has a name: it is a branch of mathematics called statistics. It doesn’t need a name upgrade, or if it does, we should call it Statistics 2.0."
Certes, la statistique est une branche des mathématiques, mais pas l'analyse de données!!!
Autant je peux comprendre l'agacement des gars qui voient passer un effet de mode par an, autant je suis d'accord avec lui -- de façon générale -- sur sa liste de points. autant certains de ses arguments sont fallacieux, comme
"if there were a particular activity devoted to studying data, then there might be some virtue in the term “data science.” And indeed there is such an activity, and it already has a name: it is a branch of mathematics called statistics. It doesn’t need a name upgrade, or if it does, we should call it Statistics 2.0."
Certes, la statistique est une branche des mathématiques, mais pas l'analyse de données!!!
By "Data Science", we mean almost everything that has something to do with data: Collecting, analyzing, modeling...... yet the most important part is its applications --- all sorts of applications. (...)
The Journal of Data Science publishes research works on a wide range of topics that involving understanding and making effective use of field data --- i.e., all aspects of applied statistics. We prefer applied research and emphasis is on the relevance of the underlying problem rather than pure mathematical depth. We prefer papers with solid applications and real cases. Detailed technical proof, particularly those that push to the extreme, is not required. The papers published in the Journal of Data Science will cover a wide range of spectrum, as can be seen from the affiliations of the members of our editorial board.
La distinction avec la statistique appliquée est quand même fine. "Data science" me paraît être un nouveau terme appliqué à un métier très ancien. Ce qui colle assez bien avec l'article "fondateur" de Cleveland. C'est en fait un point de vue sur ce métier, et pas un nouveau métier. Tout comme le triangle de la biométrie est la vision lyonnaise de la biométrie, mais que l'école lyonnaise n'en est pas l'inventrice.
Cela dit l'article de Cleveland est très intéressant, et souligne, à travers ce concept de data science, un concept de statistique appliquée assez proche de celui de biométrie à l'école lyonnaise. J'ai l'impression que ce terme de data science est à la statistique appliquée ce que le triangle de la biométrie est à la biométrie: un point de vue sur la façon dont il faudrait l'étudier, l'utiliser, etc. Comme on le voit ici, ça couvre aussi l'échantillonnage ("collecting"), mais c'est surtout centré sur la donnée, incluant également et surtout les données dont on n'a pas contrôlé la collecte (type de données souvent délaissé par la stat théorique).
Je commence à y voir plus clair.
Edit: oui, en y réfléchissant, j'en reviens à ma première impression: la data science est à la science ce que la biométrie est à la biologie. On ne peut pas appeler ça de la statistique, la statistique est une branche des mathématiques. Appeler ça "statistiques appliquées" a trop tendance à mettre de côté la "subject matter" pour le centrer sur le côté math. Et à ignorer le côté informatique. Ce que l'école lyonnaise appelle la biométrie serait de la "data science" appliquée à la biologie. Donc, retour au point de départ. La meilleure description est donc donnée ici: http://learnitdaily.com/what-is-a-data-scientist/
The Journal of Data Science publishes research works on a wide range of topics that involving understanding and making effective use of field data --- i.e., all aspects of applied statistics. We prefer applied research and emphasis is on the relevance of the underlying problem rather than pure mathematical depth. We prefer papers with solid applications and real cases. Detailed technical proof, particularly those that push to the extreme, is not required. The papers published in the Journal of Data Science will cover a wide range of spectrum, as can be seen from the affiliations of the members of our editorial board.
La distinction avec la statistique appliquée est quand même fine. "Data science" me paraît être un nouveau terme appliqué à un métier très ancien. Ce qui colle assez bien avec l'article "fondateur" de Cleveland. C'est en fait un point de vue sur ce métier, et pas un nouveau métier. Tout comme le triangle de la biométrie est la vision lyonnaise de la biométrie, mais que l'école lyonnaise n'en est pas l'inventrice.
Cela dit l'article de Cleveland est très intéressant, et souligne, à travers ce concept de data science, un concept de statistique appliquée assez proche de celui de biométrie à l'école lyonnaise. J'ai l'impression que ce terme de data science est à la statistique appliquée ce que le triangle de la biométrie est à la biométrie: un point de vue sur la façon dont il faudrait l'étudier, l'utiliser, etc. Comme on le voit ici, ça couvre aussi l'échantillonnage ("collecting"), mais c'est surtout centré sur la donnée, incluant également et surtout les données dont on n'a pas contrôlé la collecte (type de données souvent délaissé par la stat théorique).
Je commence à y voir plus clair.
Edit: oui, en y réfléchissant, j'en reviens à ma première impression: la data science est à la science ce que la biométrie est à la biologie. On ne peut pas appeler ça de la statistique, la statistique est une branche des mathématiques. Appeler ça "statistiques appliquées" a trop tendance à mettre de côté la "subject matter" pour le centrer sur le côté math. Et à ignorer le côté informatique. Ce que l'école lyonnaise appelle la biométrie serait de la "data science" appliquée à la biologie. Donc, retour au point de départ. La meilleure description est donc donnée ici: http://learnitdaily.com/what-is-a-data-scientist/
Il s'agit ici de l'interview d'un journaliste aux compétences statistiques (Wikipédia le présente comme un statisticien, lui ne se définit pas comme ça). Pas grand chose à dire, si ce n'est sur la fin:
When asked that “Data science is the term of the day. Do you think there is a difference between data science and statistics? Silver replied, “I think data-scientist is a sexed up term for a statistician”, the reaction from the audience was for most, one of instantaneous laughter and applause. “Statistics is a branch of science. Data scientist is slightly redundant in some way and people shouldn’t berate the term statistician.”
cf. mon Edit ici: http://caloine.ouvaton.org/shaarli/?m5lWrQ
Les statisticiens voient la data science comme un sous-champs de leur domaine. Il me semble que c'est une erreur, j'ai plutôt le sentiment que la statistique n'est que l'une des composantes de la data science (les autres étant la subject matter, l'informatique, la pédagogie, etc.).
When asked that “Data science is the term of the day. Do you think there is a difference between data science and statistics? Silver replied, “I think data-scientist is a sexed up term for a statistician”, the reaction from the audience was for most, one of instantaneous laughter and applause. “Statistics is a branch of science. Data scientist is slightly redundant in some way and people shouldn’t berate the term statistician.”
cf. mon Edit ici: http://caloine.ouvaton.org/shaarli/?m5lWrQ
Les statisticiens voient la data science comme un sous-champs de leur domaine. Il me semble que c'est une erreur, j'ai plutôt le sentiment que la statistique n'est que l'une des composantes de la data science (les autres étant la subject matter, l'informatique, la pédagogie, etc.).
Sophisme fréquent: présenter une vision erronée de la théorie adverse, et attaquer cette vision erronée.
Marrant aussi
Marrant.
Les chamois femelles grandissent plus vite quand ils sont chassés, à priori.
J'aime bien ce genre de choses.
Putain, ça c'est du conseil utile. Je n'y avais jamais pensé: définir ça dans le .emacs:
(setq backup-directory-alist `(("." . "~/.saves")))
Et ça évite d'avoir des backups de partout.
Je suis un âne.
(setq backup-directory-alist `(("." . "~/.saves")))
Et ça évite d'avoir des backups de partout.
Je suis un âne.
Ben tiens, il est là leur papier.
Ou quel impact l'utilisation d'un mauvais modèle aura-t-il sur le decision making.
À lire
À lire