2381 shaares
Aucune relation entre la qualité de l'enseignement (qui va déterminer les chances de succès à l'examen) et la satisfaction des étudiants concernant leur enseignement.
Bon à savoir
Bon à savoir
C'est génial: un matheux (médaille Fields) lance un nouveau canard, discrete analysis, qui sera un "overlay journal". L'idée? Le journal va simplement consister en un ensemble de liens vers des versions de papiers mises sur ArXiv. On met le papier sur arxiv, on soumet le papier au journal, ils font la review, et quand ils acceptent, ils mettent simplement le lien vers arxiv. Les auteurs doivent simplement utiliser LaTeX.
Coût de l'opération: 10$ demandés à l'auteur.
Les matheux ont toujours été à la pointe... si seulement ça pouvait se développer dans d'autres domaines.
Coût de l'opération: 10$ demandés à l'auteur.
Les matheux ont toujours été à la pointe... si seulement ça pouvait se développer dans d'autres domaines.
Première tentative d'ajustement de modèle bayésien sous STAN... échec: STAN ne permet pas l'ajustement de modèles avec des variables cachées entières (e.g. un effectif détecté comme réponse, un effectif réel comme paramètre). Ce qui rétrospectivement semble assez logique, quand on connaît le principe du Monte Carlo Hamiltonien. La seule solution est de marginaliser le paramètre entier quand on en a un... Ce qui n'est pas toujours simple à réaliser. Enfin, dans le cas présent, je n'ai pas le choix, mon modèle est caractérisé par un mélange moisi avec un sampler de Gibbs, et je pense que le fait de m'appuyer sur un paramètre latent entier n'y est pas pour rien.
Edit: le manuel de Stan, section 11.3, évoque les modèles de CMR. Il présente deux cas de figure:
* l'estimateur de Lincoln-Petersen de la taille de population N à partir d'animaux marqués à une première occasion de capture, puis recapturés à une deuxième occasion. Dans ce cas, on peut traiter le modèle en prenant N comme paramètre continu.
* le modèle de Cormack-Jolly-Seber, dans lequel on a une variable latente z_i(t) pour chaque animal i qui prend la valeur 1 si l'animal est vivant au temps t et 0 sinon. Pour pouvoir ajuster ce modèle, il faut marginaliser pour se débarrasser du paramètre.
Oui, donc Stan, uniquement quand on a des paramètres continus (éviter les variables latentes discrètes genre effectif réel non observé).
Edit: le manuel de Stan, section 11.3, évoque les modèles de CMR. Il présente deux cas de figure:
* l'estimateur de Lincoln-Petersen de la taille de population N à partir d'animaux marqués à une première occasion de capture, puis recapturés à une deuxième occasion. Dans ce cas, on peut traiter le modèle en prenant N comme paramètre continu.
* le modèle de Cormack-Jolly-Seber, dans lequel on a une variable latente z_i(t) pour chaque animal i qui prend la valeur 1 si l'animal est vivant au temps t et 0 sinon. Pour pouvoir ajuster ce modèle, il faut marginaliser pour se débarrasser du paramètre.
Oui, donc Stan, uniquement quand on a des paramètres continus (éviter les variables latentes discrètes genre effectif réel non observé).
À retenir:
find . -name "toto.*"
cherche les fichiers toto.* récursivement dans le répertoire courant.
find . -name "toto.*"
cherche les fichiers toto.* récursivement dans le répertoire courant.
Conseils pour stocker efficacement des tableaux sur un ordi.
Oui, c'était un peu ce qu'on craignait au moment de la création de l'agence...
If we have data, let's look at data. If all we have are opinions, let's go with mine.
Une belle citation, reprise comme slogan par l'ASA.
Une belle citation, reprise comme slogan par l'ASA.
Dans la série j'apprends un nouveau concept math chaque jour: la quasi-convexité. La fonction f est quasi-convexe si pour tout trio de point x<z<y, f(z) < max(f(x),f(y)).
La quasi-concavité, c'est le contraire. La loi normale est quasi-concave.
La quasi-concavité, c'est le contraire. La loi normale est quasi-concave.
Un post marrant sur les raisons qui amènent à une sursimplification de la réalité et aux hypothèses irréalistes dans le développement mathématique.
La crise des réfugiés, c'est d'abord en Syrie (8 millions de déplacés à l'intérieur du pays), puis un exode de 4 millions de personnes, dont moins de 300000 en Europe, le reste, en Irak/Liban/Turquie...
Les dernières photos supéfiantes de Pluton (via le hollandais volant)
Commence à sentir mauvais cette histoire...
Une carte de la localisation des 3000 milliards d'arbres sur la planète (Via Mathieu).
Ah ben dis, j'avais pas vu passer... XKCD a lancé une étude sur le big data, pour visiblement dénoncer l'approche. À suivre ici pour quand les résultats seront publiés!
Quand Disney vend un DVD, ils ont une méthode moisie pour empêcher de ripper le DVD: ils mettent 99 titres sur le DVD, et il n'y en a qu'un seul de bon. Comme ça, ça décourage l'utilisateur qui ne peut le ripper.
Moi j'ai pas de lecteur DVD pour ma TV, mais j'ai une prise USB, donc faut que je rippe. La solution: lancer le dvd avec VLC, lancer le film, et quand il tourne, regarder dans Playback->Title pour identifier le bon.
Moi j'ai pas de lecteur DVD pour ma TV, mais j'ai une prise USB, donc faut que je rippe. La solution: lancer le dvd avec VLC, lancer le film, et quand il tourne, regarder dans Playback->Title pour identifier le bon.
Une présentation intéressante d'Olivier Gimenez sur l'analyse des données de sciences participatives.
"Once the current honeymoon period of data science comes to an end - the statistician will again come to the fore. This was due in part to the importance of experiment design and the fact that probability theory is the best way of dealing with uncertainty"
Je stocke ça ici pour l'avenir. Un théorème très rigolo que l'on retrouve à plusieurs endroits dans la littérature: si Y est une variable aléatoire caractérisée par une distribution de probabilité quelconque, et U une variable aléatoire uniforme [0,1], alors X=Y*U suit une distribution unimodale. Toujours.
C'est fou ça. Sous R, démonstration:
y=c(rnorm(50000),rnorm(50000, mean=100)) ## Un truc bien bimodal
u=runif(100000)
hist(y)
hist(y*u)
J'ai pas trouvé l'article de Khintchine démontrant cette propriété d'unimodalité, mais de toutes façons je ne l'aurais pas lu: il est en russe. Je stocke ça ici, j'en aurai sûrement besoin un jour.
Edit: En fait, c'est même pire que ça: toutes les distributions univariées unimodales admettent une représentation sous cette forme (produit Y*U). Voir le théorème 2 dans l'article de Shepp 1962 (http://www-stat.wharton.upenn.edu/~shepp/publications/2.pdf)
Edit 2: voir aussi une description assez intuitive de ce théorème dans :
Jones, M. 2002. On Khintchine's theorem and its place in random variate generation. The American Statistician 56
C'est fou ça. Sous R, démonstration:
y=c(rnorm(50000),rnorm(50000, mean=100)) ## Un truc bien bimodal
u=runif(100000)
hist(y)
hist(y*u)
J'ai pas trouvé l'article de Khintchine démontrant cette propriété d'unimodalité, mais de toutes façons je ne l'aurais pas lu: il est en russe. Je stocke ça ici, j'en aurai sûrement besoin un jour.
Edit: En fait, c'est même pire que ça: toutes les distributions univariées unimodales admettent une représentation sous cette forme (produit Y*U). Voir le théorème 2 dans l'article de Shepp 1962 (http://www-stat.wharton.upenn.edu/~shepp/publications/2.pdf)
Edit 2: voir aussi une description assez intuitive de ce théorème dans :
Jones, M. 2002. On Khintchine's theorem and its place in random variate generation. The American Statistician 56
Ya des dérives inquiétantes quand même...
La conclusion qui tue: "These facts are not up to discussion. I am right and you are wrong".