2369 shaares
164 results
tagged
R
Maintenant, il faut enregistrer les routines C dans les packages R. Bonne explication de comment faire.
Des zoulies palettes pour faire des zoulies cartes sous R. Ça nous changera de l'éternel terrain.colors()
Intéressant: un package qui permet de manipuler du pdf dans R. Assez bluffant.
J'ignorais également : si x est une liste x[[c(2,3)]] est identique à x[[2]][[3]]
En outre, si x est une matrice à n lignes et p colonnes, et si i est une autres matrice à r lignes et deux colonnes (la première colonne correspondant aux indices de lignes et la seconde aux indices de colonne), alors x[i] va renvoyer un vecteur contenant les r éléments décrits dans i (i.e. c(x[i[1,1], i[1,2]], x[i[2,1], i[2,2]], etc.)).
Je savais pas.
En outre, si x est une matrice à n lignes et p colonnes, et si i est une autres matrice à r lignes et deux colonnes (la première colonne correspondant aux indices de lignes et la seconde aux indices de colonne), alors x[i] va renvoyer un vecteur contenant les r éléments décrits dans i (i.e. c(x[i[1,1], i[1,2]], x[i[2,1], i[2,2]], etc.)).
Je savais pas.
Tiens un nouvel IDE pour R spécialisé dans la modélisation écologique. A voir...
Ah tiens, ya un papier sur le package. À lire.
Sans déconner... De Yihui Xie, un package permettant de faire des présentations directement depuis R.
Ce mec est génial...
Ce mec est génial...
L'explication de l'évaluation vue par le tidyverse. Via Mathieu.
Une explication sympa de substitute sous R
Via Mathieu. Ya deux-trois graphiques qui laissent rêveurs... à creuser plus en détail.
Ah ben voilà, maintenant, je comprends ce qui se passe avec mon programme: la réponse de sds est limpide.
J'ai écrit un programme qui lit des raster, les affiche avec un plotRGB, met un point avec un buffer dessus, sauve l'image, et vire les raster. À la fin, un coup de rm(), un coup de gc(), et on répète ça sur un bon millier de cartes.
Pourtant, toutes les 10 cartes, on a:
Error: cannot allocate vector of size 9.6 Mb
Et après, on a beau tourner le truc dans tous les sens, plus moyen de faire quoi que ce soit. Et quand je regarde l'environnement, il est vide, ou quasi.
Trois fonctions par ci par là, un data.frame de 30 lignes, une vingtaine de tout petits objets, mais ne constituant pas un 1Mo de mémoire bouffée. Quasi-vide quoi. Et non seulement l'environnement est vide, mais la mémoire sous linux n'est qu'à moitié remplie (i.e. pas des masses de programmes tournant en même temps). Et pourtant, je peux pas allouer un vecteur, même de taille modeste: plus de place. C'était surréaliste. Là, l'explication de sds est limpide:
"The R garbage collector is imperfect in the following (not so) subtle way: it does not move objects (i.e., it does not compact memory) because of the way it interacts with C libraries (...). This means that if you take turns allocating small chunks of memory which are then discarded and larger chunks for more permanent objects (this is a common situation when doing string/regexp processing), then your memory becomes fragmented and the garbage collector can do nothing about it: the memory is released, but cannot be re-used because the free chunks are too short.
The only way to fix the problem is to save the objects you want, restart R, and reload the objects. "
Eh ben, moi j'ai pas le cul sorti des ronces comme dirait l'autre...
J'ai écrit un programme qui lit des raster, les affiche avec un plotRGB, met un point avec un buffer dessus, sauve l'image, et vire les raster. À la fin, un coup de rm(), un coup de gc(), et on répète ça sur un bon millier de cartes.
Pourtant, toutes les 10 cartes, on a:
Error: cannot allocate vector of size 9.6 Mb
Et après, on a beau tourner le truc dans tous les sens, plus moyen de faire quoi que ce soit. Et quand je regarde l'environnement, il est vide, ou quasi.
Trois fonctions par ci par là, un data.frame de 30 lignes, une vingtaine de tout petits objets, mais ne constituant pas un 1Mo de mémoire bouffée. Quasi-vide quoi. Et non seulement l'environnement est vide, mais la mémoire sous linux n'est qu'à moitié remplie (i.e. pas des masses de programmes tournant en même temps). Et pourtant, je peux pas allouer un vecteur, même de taille modeste: plus de place. C'était surréaliste. Là, l'explication de sds est limpide:
"The R garbage collector is imperfect in the following (not so) subtle way: it does not move objects (i.e., it does not compact memory) because of the way it interacts with C libraries (...). This means that if you take turns allocating small chunks of memory which are then discarded and larger chunks for more permanent objects (this is a common situation when doing string/regexp processing), then your memory becomes fragmented and the garbage collector can do nothing about it: the memory is released, but cannot be re-used because the free chunks are too short.
The only way to fix the problem is to save the objects you want, restart R, and reload the objects. "
Eh ben, moi j'ai pas le cul sorti des ronces comme dirait l'autre...
Délire! dans knitr, dans les options d'un chunk, on peut définir les lignes du chunk qu'on veut afficher et celles qu'on ne veut pas afficher!!!!
Trop classe!
Trop classe!
Pas mal de choses intéressantes...
Le gars à beaucoup d'excellents arguments pour préférer = à <- sous R. Il arriverait presque à me convaincre. Je dis presque parce que plus d'une fois, les recommandations d'usage sous R se sont terminées par une obligation incontournable. Il y a 15 ans, les développeurs du package ade4 avaient codé l'intégralité du package en utilisant l'underscore comme opérateur d'assignation. Et boum, ça a été interdit. Ça faisait quelque temps que c'était pas recommandé par les développeurs de R. Ya fallu bosser un peu pour corriger ça...
Depuis, je suis discipliné, j'obéis aux recommandations...
Depuis, je suis discipliné, j'obéis aux recommandations...
Un package pour R qui contient de l'ascii art d'animaux qui disent ce qu'on leur demande de dire.
Apparemment, le gars fait un résumé de tout ce qu'il a vu dans les confs useR, et note les points intéressants. Et il fait ça à chaque fois qu'il y va.
Faut que je prenne le temps de creuser tout ça.
Faut que je prenne le temps de creuser tout ça.
Un site qui permet d'évaluer l'impact d'un programmeur dans le domaine scientifique en fonction de trois critères:
* Nombre de citations dans des papiers open access (l'algo n'a pas accès aux papiers derrière un paywall)
* Réutilisation du code par d'autres (basé sur l'algo pagerank de google)
* Nombre de téléchargements
Le site est décrit dans un article de nature: http://www.nature.com/news/the-unsung-heroes-of-scientific-software-1.19100
Apparemment, l'auteur va chercher à ajouter une nouvelle métrique basée sur le nombre de discussions sur internet qui citent un package. Le site indique également que l'on pourra bientôt faire le lien avec l'orcid.
À suivre, donc!
* Nombre de citations dans des papiers open access (l'algo n'a pas accès aux papiers derrière un paywall)
* Réutilisation du code par d'autres (basé sur l'algo pagerank de google)
* Nombre de téléchargements
Le site est décrit dans un article de nature: http://www.nature.com/news/the-unsung-heroes-of-scientific-software-1.19100
Apparemment, l'auteur va chercher à ajouter une nouvelle métrique basée sur le nombre de discussions sur internet qui citent un package. Le site indique également que l'on pourra bientôt faire le lien avec l'orcid.
À suivre, donc!
Sinon, pour chercher dans R, ya ça.
Edit: j'avais pas vu les onglets au sommets des résultats de la recherche, c'est génial, on peut explorer les différents types de résultats, bouquins, articles, etc.
Edit: j'avais pas vu les onglets au sommets des résultats de la recherche, c'est génial, on peut explorer les différents types de résultats, bouquins, articles, etc.
Un site très intéressant que je ne connaissais pas, conçu pour chercher des fonctions dans les 11000 packages de CRAN. Super bien conçu, avec statistiques de téléchargement. On y apprend que adehabitatHR est mon package le plus téléchargé avec 450 téléchargements directs mensuels en moyenne, adehabitatMA le plus téléchargé indirectement (via le biais des dépendances vers d'autres packages) avec plus de 1000 téléchargements mensuels, et qu'il reste en moyenne 190 personnes qui continuent à télécharger chaque mois l'ancienne version d'adehabitat, et ce malgré toutes mes mises en garde sur le fait que j'arrêtais de le maintenir...
Le site contient aussi des historiques de téléchargement, des diagrammes de dépendances et de reverse dependances. Il est participatif, et il y a moyen de s'inscrire pour améliorer les aides.
Et moyen d'exécuter les exemples sans lancer R, directement sur le site. Pas mal.
Vu la difficulté qu'il y a souvent à chercher dans les fonctions de R, je pense que le gars qui a fait ça a tapé très fort.
Le site contient aussi des historiques de téléchargement, des diagrammes de dépendances et de reverse dependances. Il est participatif, et il y a moyen de s'inscrire pour améliorer les aides.
Et moyen d'exécuter les exemples sans lancer R, directement sur le site. Pas mal.
Vu la difficulté qu'il y a souvent à chercher dans les fonctions de R, je pense que le gars qui a fait ça a tapé très fort.
Intéressant: une communauté de gens qui partagent plein de trucs autour des couleurs, notamment des palettes.
Encore plus intéressant, le package colourlovers sous R permet d'importer facilement ces palettes sous R.
Encore plus intéressant, le package colourlovers sous R permet d'importer facilement ces palettes sous R.