La production de connaissance scientifique s’axe en quatres étapes :
🗒️ Concevoir des protocoles de récolte de données efficaces, compréhensibles et beaux.
💡 Comprendre et prendre les bonnes décisions pour une analyse de données cohérente avec la question de recherche et le protocole.
🗝 Transmettre en transformant des données et les analyses en histoires à impact.
⚙️ Automatiser et optimiser des processus répétitifs en organisant mieux la gestion des données.
Je partage ici mon évolution, mes projets et ce qui fait sens pour moi dans mon activité.
Voilà un petit mémo de réflexes sympa à acquérir avec R pour être un peu plus efficace et plus reproductible dans tes analyses de données !
🎉 Pour la première fois, je suis officiellement partenaire d’un projet de recherche ! 🕓 Parfois, j’interviens de façon ponctuelle comme consultante, mais souvent, mes collaborations de recherche durent plusieurs mois ou années.
😄 Cette photo pleine de sourires, c’était à la fin d’une session de formation d’initiation à la programmation avec R dans l’entreprise eRcane, située à Sainte-Clotilde et qui fait de la recherche et développement autour des enjeux de la canne à sucre réunionnaise.
🤫 L’effet Dunning-Kruger n’existe peut-être pas C’est le titre de la dernière vidéo d’Hygiène Mentale. C’est clairement une de mes chaînes préférées et c’est un petit événement quand une nouvelle vidéo sort.
Je fouinais les ressources d’une fresque du facteur humain à laquelle j’ai participé récemment… Quand j’ai vu mes passions réunies dans une image, ça a fait 🤯 Je te partage les questionnements que j’ai eus à la découverte de cette figure et comment j’y réponds (de manière toute subjective).
Une fois que tu as ton premier rapport, ça va te mettre littéralement 5 minutes pour le publier !
Quand j’ai commencé à travailler avec R, je n’imaginais absolument pas la puissance d’une communauté opensource. Ça va faire environ une dizaine de fois maintenant…
🎨 Petite astuce pour choisir tes couleurs sans galérer et les intégrer dans tes graphiques faits avec ggplot. 🤩 J’ai découvert récemment le package paletteer via le site de Yan Holtz
💡 Tu connais les antisèches de R ? Le principe, c’est 1 ou 2 pages remplies de fonctions de R d’un package donné, rangées de manière organisée et visuelle pour
🤯 Prise de conscience du mois dernier : je connais et je maîtrise 1% des outils statistiques que je suis en capacité de percevoir. 🎢 Ça fait 6 ans que les statistiques font partie de mon métier et chaque jour, je prends un peu plus de recul (parfois, juste, je recule 😂).
🥺 La QVCT, jusqu’au mois dernier, je ne savais pas du tout ce que ça voulais dire. Quoi ? Encooooore un sigle ??? ☀️ Il s’agit de la qualité de vie au travail !
Quel rapport entre une armoire à Lego et des cartes contenant les étapes pour faire une omelette ?
Je te partage cette photo que j’ai faite il y a un mois parce qu’elle me rappelle ma joie de ce jour.
Un tuto pour savoir 1/ comment installer R, si c’est la première fois et 2/ comment mettre à jour… tout ce qu’il faut mettre à jour.
🗨️ 💬 Je discutais avec une fille qui est en troisième. Au lycée, elle voudrait prendre l’option biologie, mais elle ne pense pas choisir l’option maths. 🤷♀️ Depuis la réforme du lycée, c’est possible de choisir une matière scientifique (comme la physique-chimie ou la biologie) SANS faire de maths à côté.
Chaque fonction (et même chaque objet en réalité) a une page d’aide associée. Cette documentation est hyper utile !
Récemment, je me suis retrouvée avec un jeu de données correspondant à des piégeages d’insectes où les observations sans insectes piégés n’ont pas été notées. Ici, j’explique comment utiliser la fonction complete() du package tidyr pour ajouter les lignes manquantes et les remplir avec des zéros (où ce que tu veux !).
Je n’ai pas du tout envie d’étaler tout ce que j’ai fait pendant ces quatre ans. J’ai plutôt envie de célébrer là où j’en suis.
🎲 J’ai créé un petit jeu en ligne ! 👩💻 Quand je présente le logiciel RStudio à des personnes qui ne le connaissent pas encore (si, si ça existe !), j’aime beaucoup illustrer les différentes sous-fenêtres (il y en a beaucoup) avec une analogie culinaire 🍽️
💬 “Comment me rassurer pour savoir si j’obtiendrai bien les résultats attendus en travaillant avec toi ?” Un futur client me pose cette question la semaine dernière, dans le cadre d’un accompagnement R et stats.
Oh une PÉPITE, trouvée sur LinkedIn la semaine dernière ! Préparez-vous, je sens que je vais réutiliser cette image assez souvent.
J’observe que ce qui figure dans les dossiers de financement des projets de recherche correspond rarement à ce qui se passe dans la réalité, une fois que ledit financement est décroché. J’interroge des chercheur.es pour savoir ce qu’ils et elles en pensent.
Je suis en week-end avec ma maman. Elle a déniché de la peinture. La seule inspiration que je trouve, c’est R.
J’ai besoin d’aide pour savoir ce qu’il ne faut surtout pas oublier au démarrage d’un projet de sciences participative.
Aujourd’hui, je suis intervenue dans un collège pour parler de mon parcours devant quatre classes de 3ᵉ et 4ᵉ. Pour parler de la place des maths dans ma vie en tant que femme.
J’ai adoré collaborer avec Antoine Drouillard. Ce que je retiens surtout, c’est que chaque avancée, chaque échange fut amical, enrichissant et enthousiasmant.
Mes deux conférences d’octobre ont été enregistrées. Alors, déjà, c’est compliqué de parler devant mon écran à une assemblée réunie en présentiel… que je ne vois pas. Mais en plus…
Je veux déterminer une prévalence. J'ai un simple formulaire en ligne ou en papier. Qu'est-ce que j'en fais ? Où je l'envoie ? Comment faire pour choisir mes individus ?
Je suis en train de concevoir le projet qui me tient le plus à cœur depuis que j’ai découvert le milieu de la recherche expérimentale, il y a 5 ans. Il s’agit d’une formation pour clarifier son protocole expérimental en utilisant des outils de co-construction et d’intelligence collective.
Imagine-toi à un rassemblement officiel et un peu classe. J’ai une annonce !
En statistiques, la robustesse d’un estimateur est sa capacité à ne pas être perturbé par une modification dans une petite partie des données ou dans les paramètres du modèle. En écologie et en biologie, la résilience écologique est la capacité à retrouver un fonctionnement ou un développement normal après avoir subi une perturbation.
J’interviens le mardi 10 octobre aux Rencontres annuelles du Groupe de Recherche EcoStat et le 19 octobre à une conférence organisée par les R-Ladies Paris.
La simplexité est l’art de rendre simples, lisibles, compréhensibles les choses complexes. Youpi, que j’aime ce mot que je ne connaissais pas.
Je me suis plantée. Ça m’arrive souvent ! Mais en fait, ça me va.
C’est quoi le plus important dans la science pour toi ? Prends deux minutes pour y songer.
Tu démarres un nouveau projet de recherche et tu es en train de créer ton protocole expérimental et de réfléchir à comment tu vas saisir tes données. Tu repenses à d’autres projets que tu as suivis de près ou de loin. Et il y a quelque chose qui te chiffonne.
De plus en plus souvent, lors de la phase de demande de subvention d’un projet de recherche, un document particulier est demandé, le Plan de Gestion de Données.
Mon petit test de troc a bien fonctionné ! Je propose trois rendez-vous aléatoires par mois.
Pour ajouter des images dans un ggplot, je m’entraine sur des reines d’abeilles !
Je suis en train de co-créer un groupe d’entrepreuneur(e)s formatrices. Nous avons passé l’audit QUALIOPI au début du mois et nous attendons avec impatience le verdict !
Créé des rapports automatisés avec R. Je lance une 2ᵉ session de formation sur Rmarkdown les 5 et 6 juillet 2023 !
Pour beaucoup de formateurs/formatrices, les supports sont ce qu’il y a de plus précieux et c’est très important de les garder le plus secret possible.
Je m’en vais faire une balade de deux mois. Souhaite-moi un bon voyage.
Il est temps que je te parle de comment s’est déroulée ma première formation en pédagogie active, ludique et participative.
Le chemin avec R, il est infini. Et plus on s’y laisse prendre, plus il devient magnifique. R à plusieurs, c’est 1000 fois plus enrichissant !
Jeudi 23 février 2023, je donne une conférence.
Un chercheur / une chercheuse, j’ai plutôt envie de définir ce mot comme quelqu’un qui expérimente et qui se donne le droit à l’erreur.
Je sors ma première formation en pédagogie active le 7 février 2023. Et j’ai vraiment hâte de la tester !
Russel Lenth, crée du CODE pour que les utilisateurs VOIENT les pièges, mais SURTOUT ne les mettent pas sous le tapis
J’ai choisi de donner 1% de mon chiffre d’affaires de 2022 à R Foundation, la Société Française de Statistique et Time for the Planet.
Commençons 2023 en poésie. J’ai demandé à Chat GPT de faire quelques quatrains sur la “danse des p-valeurs”
Je suis fière de travailler avec des gens qui m’inspirent, avec qui je partage des valeurs similaires. C’est ce qui me nourrit le plus au quotidien. Ce qui me fait kiffer ma vie d’indépendante.
Trois raisons d’avoir envie de collaborer avec moi !
documenté, et accompagné de son protocole expérimental
L’idée reçue que base R est plus efficace en temps de calcul que les fonctions du tidyverse persiste.
Avec La Raffinerie, nous avons réfléchi collectivement comment mesurer le bien-être du groupe. Comme premier test grandeur nature, nos animatrices du jour, Kat et Anne, ont décidé de proposer un jeu…
J’ai toujours adoré les histoires. Mon parti pris, c’est de raconter une histoire la plus rationnelle possible et qui suit la démarche scientifique. Mais, quoi qu’il arrive, mon histoire ne sera, ne pourra jamais être une histoire absolument vraie.
Ce n’est pas au moment où toutes les données sont saisies qu’il faut commencer à s’inquiéter de comment on va les analyser…
Comment faire pour vérifier que les prérequis sous-jacents des modèles paramétriques sont bien validés et comment faire pour l’expliquer aux autres.
Je suis en train de comprendre pourquoi j’ai tant de mal à parler d’écologie alors que c’est au cœur de mon métier de tous les jours.
Dans son dernier article, la biostatisticienne Claire Della explique ce que sont les moyennes marginales.
Tutoriel pour lire les graphiques issus de la fonction pwpp()
du package emmeans et interpréter le résultat d’un test de comparaisons multiples.
J’aimerais tant que le monde doute davantage.
Le vulva plot, voilà une idée originale pour produire de l’art à partir d’R !
Pour rester authentique, j’ai aussi envie de vous montrer des choses un peu moins jolies. Un peu moins utiles. Un peu plus personnelles.
Pour aider un autre gentil être humain à m’aider, je lui fournis un exemple minimal reproductible.
Analyse de 3 enquêtes qui ont été réalisées par le GDS Reunion auprès des apiculteurs de la Réunion
Je vous partage une mini-histoire écrite et illustrée par mon amie Laura Hedon. J’aime énormément son univers, alors, en plus, quand elle parle de maths, ça me fait craquer !
J’ai pris des vacances !
Je me demande pourquoi je ne communique pas davantage sur l’écologie… Pourtant, en y regardant à deux fois, il me semble que tous mes projets DoAna sont en lien avec cette science.
Voici quelques changements qui ont été apportés dans la dernière version R 4.2 et qui peuvent vous concerner.
Je suis surprise d’avoir été choisie, enjouée de partager mon métier de cœur, emplie de gratitude pour cette formidable organisation.
Les différents traitements que je veux comparer ont-ils un effet statistiquement différent sur la variable que je suis en train de mesurer dans telles conditions ? Quand on se pose ce genre de question, le type d’analyse statistique approprié est la comparaison multiple de moyennes.
Quoi de mieux que la science participative pour étudier les foules ?
Sans elles, on peut obtenir des interprétations aussi absurdes que L’humain moyen a un testicule.
J’ai participé à un atelier sur les modèles d’occupation. On cherche à estimer une carte d’occupation d’une espèce donnée ou bien sa dynamique d’occupation. L’enjeu principal, c’est comment interpréter les choses quand l’espèce n’est pas observée sur un site.
Le 1er avril, DoAna a fêté ses 2 ans ! Le 1er avril, c’est la fête de l’esprit critique, parce que c’est un jour où l’on se préoccupe un peu plus de la source et de la qualité des informations que l’on capte.
J’ai un secret, une super force de l’ombre qui me permet d’incarner l’entrepreneuse que je suis réellement.
Chacun(e) peut proposer un atelier sur son activité. Pour ma part, les stats scientifiques étant un domaine légèrement technique, je suis penchée sur l’approche la plus visuelle de mon métier pour espérer transmettre son côté ludique. Devinez laquelle est-ce ?
Je vous présente ma dernière trouvaille R ! Les graphiques interactifs sont des graphiques html qui interagissent automatiquement avec l’utilisateur.
Le Schtroumpf grognon en moi me souffle souvent : j’aime pas les camemberts !
Application web du suivi épidémiologique des agrumes face au HLB à la Réunion.
Il parait que je suis une femme de méthodes. J’adore m’organiser pour fluidifier un enchaînement d’action. Expérimenter des méthodes existantes, me les approprier, les modifier éventuellement, les transmettre.
Je défends l’art du doute et j’ai deux choses à vous partager !
La réforme du lycée de 2019 a causé quelques dégâts pour les maths.
Me revoilà sur un de mes thèmes préférés “comment s’attacher à bien représenter ses données”. C’est très délicat comme sujet. Je me creuse souvent beaucoup beaucoup la tête pour cette raison avant de publier des résultats. Et puis, bon, j’aime bien mettre les pieds dans le plat, alors je vais utiliser l’exemple de la vaccination COVID-19.
Vous en êtes sûr. Voilà. Personne n’a JA-MAIS eu votre problème dans R. Bon, il va falloir vous-même formuler votre question.
Comment demander de l’aide à Internet quand rien ne va plus ?
J’aime bien le nouveau format d’article de Claire Della Vedova, biostatisticienne de son état. Elle y récapitule les bons plans, astuces et nouvelles fonctionnalités de R qu’elle a trouvé dans le mois.
Je me suis envolée. Hop, je ne suis plus couvée, j’ai sorti mes ailes toutes neuves et… décollage !
Il y a un an et demi environ, j’écrivais un article pour montrer comment dessiner des barres d’erreur avec ggplot dans R. Je me suis rendue compte que je me suis trompée. Après vous avoir montré comment créer des barres d’erreur, j’ai maintenant envie d’expliquer pourquoi vous ne devriez PAS en faire.
Charlotte, Jennifer, Isabelle et moi-même avons démystifié l’entrepreneuriat lors d’un atelier qui a eu lieu à La Raffineriele 19 novembre !
Introduction simple et illustrée pour comprendre l’utilité des comparaisons de moyennes
Introduction simple et illustrée pour comprendre à quoi servent les tests ANOVA
Application shiny pour modéliser les dégâts du chardon commun dans les grandes cultures
Application shiny pour modéliser les dégâts de la mouche des fruits sur le chouchou à la Réunion
Cartes interactives de la température et pluviométrie mensuelle sur plusieurs années.
Quelles sont les stats de ce site ?
De l’utilité d’un outil R-shiny pour illustrer l’analyse théorique d’un modèle minimaliste
Application web de sciences participatives pour explorer le butinage des abeilles à la Réunion.
Comment représenter des données et des plages temporelles avec ggplot2
Passage du format court au format long et inversement pour avoir des données tidy
Application web pour explorer le signal temporel à différentes échelles d’évolution dans des ensembles de séquences ADN hétérochrones.
Extrait d’une analyse destinée à comparer des protéines impliquées dans la croissance des microtubules.
Contenu d’une formation d’initiation à R
et aux statistiques.
Comment intégrer des barres d’erreur dans les graphiques avec ggplot2