LNG-1100 • Problèmes techniques

Méthodes expérimentales et analyse de données

Date de publication

15 novembre 2023

Modifié

16 novembre 2023

Problèmes fréquents

  1. L’installation de tidyverse ne fonctionne pas. C’est le problème le plus important, vu qu’on utilise cette extension pendant le cours. Lisez attentivement le message d’erreur dans la console. Collez le message sur Google ou sur ChatGPT et expliquez-lui le problème. Si vous utilisez Windows, l’installation de RTools peut être nécessaire. C’est nécessaire d’installer tidyverse pour compléter le cours. Donc, il faut régler le problème. Sinon, vous devrez utiliser la version en ligne de RStudio.
  2. Je ne peux pas trouver les fichiers de données. C’est le deuxième problème le plus important. Consultez le tutoriel sur l’organisation des fichiers.
  3. Le code ne marche pas! Voici quelques origines de ce type de problème :
    • lisez le message d’erreur attentivement et collez-le sur Google/ChatGPT s’il n’est pas clair;
    • R n’est pas capable de trouver les objets ou les fichiers que votre code utilise. Dans ce cas-là, il faut s’assurer que vous avez créé l’objet pertinent avant de l’utiliser dans votre code;
    • votre code n’est pas correct. Vérifier les lettres majuscule/minuscule, les parenthèses, les noms des variables, etc. Si vous utilisez un code de référence (p. ex., nos pages supplémentaires), comparez attentivement les codes; cherchez des fautes de frappe, etc.;
    • Si vous êtes 100% certain que votre code est correct, vous pouvez essayer de redémarrer R (Session > Restart R);
    • vous pouvez certainement coller votre code sur ChatGPT pour trouver le problème. C’est la dernière option : vous devez essayer de trouver les problèmes vous même (c’est une compétence très importante). Il faut également garder à l’esprit que certains types de problèmes dépendent de votre structure de fichiers. Donc, ChatGPT ne sera pas capable de vous aider dans ce type de situation.
  4. Mes références ne sont pas affichées dans le document (Quarto). Vérifiez votre préambule et assurez-vous que votre fichier de références bib est correct, notamment sans guillemets.
  5. Il y a des codes bizarres en tête de mon document Quarto. Le modèle pour nos projets suppose un format pdf pour le rapport final. Par conséquent, il y a quelques lignes dans le préambule qui spécifient le document pdf. Si vous changez le format vers html pour compiler le document plus rapidement, les codes seront là. Ce n’est pas un problème. Vous pouvez masquer les lignes en question, ou vous pouvez les supprimer lors de l’utilisation de la version html. Avant de soumettre votre version pdf, il faut les ajouter nouvellement (utilisez le modèle).
  6. Une erreur qui n’existait pas auparavant. Par exemple : Error in select(...). Si on charge plus d’une extension qui contient des fonctions de noms identiques, on peut arriver à ce type de problème. C’est le cas ici : tidyverse a une fonction appelée select() (c’est une fonction de l’extension dplyr, chargée avec tidyverse). Quand on parle des modèles logistiques, on utilise souvent la fonction invlogit() de l’extension arm. Cette extension contient aussi une fonction select() (!), qui sera priorisée par R. C’est pourquoi vous avez ce type de problème. Pour régler le problème, il y a deux options : déchargez arm en exécutant detach("package:arm", unload = TRUE) ou ajoutez le préfixe dplyr:: à la fonction select() : dplyr::select(). Cela clarifie que vous voulez utilisez la fonction select() de l’extension dplyr.
  7. J’ai un problème pour importer un fichier csv. Si vous avez un fichier csv, il faut vérifier quel type de séparation de colonnes le fichier utilise. S’il utilise une virgule, on utilise la fonction read_csv(); s’il utilise un point-virgule, read_csv2(). N’utilisez jamais Excel pour visualiser votre fichier csv avant de l’importer dans RStudio pour éviter des problèmes.

Raccourcis utiles

Fonction Raccourci Mac Raccourci Windows
Exécuter une ligne Cmd + Enter Ctrl + Enter
Ajouter le pipe Cmd + Shift + M Ctrl + Shift + M
Enregistrer le document Cmd + S Ctrl + S
Exécuter tout le script Cmd + Shift + Enter Ctrl + Shift + Enter
Nettoyer la console ^ + L Ctrl + L
Compiler un doc Qmd Cmd + Shift + K Ctrl + Shift + K

Consultez la liste complète ici.

Aides-mémoire

Fonctions

Voici les principales fonctions utilisées dans le cours — ces fonctions viennent de l’extension tidyverse.

Exploration

  • read_csv() ou read_csv2() : importer les fichiers csv qui utilisent , ou ; pour séparer les colonnes. La classe de l’objet en question sera tibble (un type spécifique de tableau en R)
  • glimpse() : visualiser toutes les colonnes d’un tableau en format de liste
  • mutate() : ajouter ou modifier des colonnes
  • select() : sélectionner ou enlever des colonnes
  • arrange() : ordonner les données en fonction d’une ou plusieurs variables
  • rename() : renommer des colonnes
  • filter() : filtrer les données (c’est-à-dire sélectionner des lignes)
  • pivot_longer() : transformer le tableau (wide-to-long transformation)
  • summarize() : créer des résumés à partir des données
  • group_by() : grouper les données en fonction des variables
  • .by() : alternative à group_by(). On utilise .by comme un argument dans quelques fonctions (mutate(), summarize(), etc.)

Visualisation

  • ggplot() : la première couche d’une figure
  • geom_boxplot() : des boîtes à moustaches
  • stat_summary() : les moyennes + les barres d’erreurs standard
  • geom_point() : un nuage des points
  • labs() : la couche des étiquettes dans une figure

Analyse

  • lm() : une régression linéaire
  • glm() : une régression logistique
  • summary() : le résumé d’un modèle1

Opérateurs relationnels

  • == (deux =) : indique si deux valeurs sont identiques
  • != (! = sans espace) : indique si deux valeurs sont différentes
  • = ou <- (< - sans espace) : attribue des valeurs à un objet
  • |> (| > sans espace) ou %>% : le pipe enchaîne des opérations
  • %in% : vérifie la présence des valeurs dans un objet. Par exemple, 5 %in% c(1, 3, 5) renvoie TRUE
  • ! : la négation d’une opération. Par exemple, !5 %in% c(1, 3, 5) renvoie FALSE, vu que ce n’est pas vrai que 5 n’est pas dans le vecteur
  • & : utilisé pour évaluer deux éléments (c’est-à-dire le « et » logique). L’opérateur est vrai si les deux opérandes de chaque côté sont vrai : 5 > 3 & 3 > 4 renvoi FALSE
  • | : utilisé pour évaluer deux éléments (c’est-à-dire le « ou » logique). L’opérateur est vrai si au moins un des opérandes de chaque côté sont vrai : 5 > 3 | 3 > 4 renvoie TRUE

Bonus

  • if_else() : une expression conditionnelle
  • as_factor() : transformer un vecteur (une colonne) en facteur fct
  • str_c() : combiner des caractères (texte)
  • clean_names() : standardiser les noms des colonnes dans un tableau (il faut charger l’extension janitor)

Copyright © 2024 Guilherme Duarte Garcia

Notes de bas de page

  1. On peut utiliser la fonction summary() avec plusieurs types d’objet en R.↩︎