Ressources
Ici vous trouverez le Portuguese Stress Lexicon, des scripts et des tutoriels sur une série de sujets, notamment l’analyse de données et la phonologie.
“Pensar es olvidar diferencias, es generalizar, abstraer” (Borges)
Général
Voici quelques scripts que j’ai développés avec R, ainsi que des informations sur les outils que j’utilise normalement (Méthode de travail). Ces scripts sont là pour complémenter les tutoriels R que j’ai développés au cours des années.
Données
Le Portuguese Stress Lexicon est un projet développé durant mon doctorat. C’est un lexique complet contenant les non-verbes du portugais codés phonologiquement. Étant donné son format tidy data, le lexique peut être facilement analysé. Le Talian corpus project est un projet conjoint avec Natália B. Guzzo. Le talien est une langue sous-étudiée du sud du Brésil. Notre objectif est de développer un corpus accessible pour que d’autres puissent l’utiliser dans leur recherche.
- Portuguese Stress Lexicon
- Talian corpus project (en cours)
Méthodes de recherche en linguistique
Vous trouverez « Comment visualiser des voyelles avec R » ci-dessous. Il s’agit d’un bref tutoriel sur ggplot2
— peut-être l’extension la plus puissante pour visualiser des données. Vous trouverez aussi un tutoriel sur web scraping qui utilise des données du polonais comme exemple, et un tutoriel sur la syllabation avec Regex. Le script autoPraat
: Automating Praat experiments combine de différents ensembles de données et génère des fichiers csv
qui sont prêts pour l’analyse statistique (tidy data). Je l’ai utilisé plusieurs fois et il m’a permis d’économiser de nombreuses heures de travail.
- Web scraping avec R
- Syllabation avec Regex
autoPraat
: Automating Praat experiments- Analyse de données avec R
- Ordinal models in R (HLS 2022), avec Scott Perry, University of Alberta
Si vous voulez apprendre R, ma première recommandation est R for data science, de Wickham et ses collègues ; pour la statistique générale, Statistical Rethinking, de Richard McElreath (voyez les chaînes YouTube ci-dessous).
L’objectif de ces applis est de rendre des concepts abstraits plus intuitifs. Je les utilise souvent dans mes cours de méthodes de recherche. Les applis spécifiques à la phonologie peuvent être remplacées par mon extension R Fonology.
Préparation des documents
Ma recommandation pour les étudiants de 3e cycle est fréquemment d’apprendre LaTeX et BibTeX le plus tôt possible. Je reconnais, toutefois, que tout le monde ne veut pas les utiliser ; et tout le monde n’a pas besoin d’apprendre ce langage. J’utilise LaTeX depuis 2013, donc j’ai décidé d’inclure LaTeX et phonologie dans mon site web.
Portugais
Ma langue maternelle est le portugais (brésilien). Voici ses deux plus anciennes grammaires.
- Première grammaire du portugais (1536)
- Fernão Doliueira; from Biblioteca Nacional de Portugal
- Deuxième grammaire du portugais (1540)
- João de Barros; from Biblioteca Nacional de Portugal
La vie dans les cycles supérieurs
Il y a beaucoup de choses à apprendre avant de commencer nos études aux 2e et 3e cycles. Plusieurs articles très utiles ont été écrits sur ce sujet, et je recommande fortement le livre ci-dessous.
- Lisez ce livre de Jason Brennan
- Quelques conseils pour les étudiants de 2e et 3e cycles
Voici une liste des outils, sites web, livres, et projets développés par différents chercheurs. Les sujets vont de général à spécifique, mais le point central est évidemment la linguistique.
- Raisonnement fallacieux
- Regression Modeling for linguistic data: livre numérique de Sonderegger (McGill)
- Improving your statistical inferences: e-book by Daniël Lakens
- R for Data Science: livre complet sur R de Wickham et ses collègues
- Detexify: dessiner le symbole \(\LaTeX\) que vous voulez
- L’alphabet phonétique international
- L’API interactif
- L’API interactif (plus détaillé)
- L’API + l’anatomie
- IPAify de K. Ryan (transcription phonétique de l’anglais)
- Pink Trombone : synthèse vocale
- Carte des langues basée sur le nombre de locuteurs
- Familles linguistiques (Europe)
tidygutenbergr
(œuvres du Project Gutenberg)- All Things Linguistic
- Language Log
- Omniglot: The online encyclopedia of writing systems and languages
- Native Land Digital
- World Atlas of Linguistic Structures
- Grambank
- Dictionnaire CMU
- Buckeye Corpus
- Atlas sonore des langues régionales de France
- Phoible
- Fonds de données linguistiques du Québec
- Friends Don’t Let Friends Make Bad Graphs
Je suis abonné à trop de chaînes YouTube, donc j’ai beaucoup de recommandations. La liste ci-dessous est divisée selon les sujets qui m’intéressent.
Statistique
- Statistical rethinking (playlist avec les lessons de Richard McElreath). À mon avis, le meilleur cours de statistique si vous êtes déjà familiarisé avec les concepts de base. Par conséquent, son livre (même titre) est ma première recommandation si vous cherchez un livre de statistique plus général.
Langage & linguistique
Général
- McGill Office for Science and Society
- Chaîne de Simon Clark (la vie quotidienne d’un étudiant en doctorat)
- VSauce
- 3Blue1Brown (si vous aimez la matématique et les animations visuelles)
- Physics Girl
- Great art explained
- Half as interesting
- Wendover
- ASAP Science
- MKBHD
- OverLeaf/ShareLatex
- The Nerdwriter
Copyright © 2024 Guilherme Duarte Garcia