Accéder directement au contenu Accéder directement à la navigation
Poster

Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles

Résumé : Les chercheurs en acquisition des langues étrangères s’interrogent sur la manière dont les apprenants développent des compétences de communication dans une langue autre que leur langue maternelle. Ils cherchent notamment à comprendre comment on peut passer d’une compétence minimale (variété de base, Perdue et al. 1993), à une compétence avancée, voire quasi-native (Bartning, Hancock & Forsberg Lundell, 2012 ; Donaldson, 2012). Si des facteurs internes (motivation, aptitudes des apprenants) peuvent expliquer le développement, le milieu d’apprentissage (en classe ou en immersion) peut fonctionner comme un catalyseur. Ainsi, de nombreuses études commencent à voir le jour sur l’apprentissage en immersion (Freed, 1995 ; Kinginger2009 ; Mitchell, McManus, & Tracy-Ventura, 2017), souvent à partir de données transcrites de l’oral. C’est ce processus de transformation – d’un enregistrement oral vers une transcription écrite – que nous souhaitons étudier, afin de mieux comprendre la variation dans les transcriptions ainsi que les sources de cette variation. Le projet PROLINGSA (Linguistic Progress during Study Abroad) est une étude longitudinale de 12 mois qui vise à caractériser l’impact du séjour à l’étranger sur le développement linguistique. Nous avons suivi et filmé lors d’entretiens semi-guidés cinq étudiants francophones ayant effectué un séjour Erasmus+ de neuf mois au Royaume-Uni ou en Irlande. Deux investigatrices (l’une francophone, l’autre anglophone) se sont relayées pour effectuer les cinq entretiens en anglais, sur une période d’un an. La durée totale d’enregistrement est de 12 heures. Nous cherchons à savoir si l’immersion favorise le développement linguistique, et nous interrogeons sur les éléments qui sous-tendent la dynamique du développement (constitution d’un réseau social, motivations…). Afin de pouvoir exploiter ces données et répondre aux questions de recherche, nous avons transcrit les données sous CLAN. Une équipe de huit transcripteurs anglophones, francophones et ukrainien, avec des degrés d’expertise divers (3 enseignantes chercheuses et 5 étudiants de Master), se sont attelés à la tâche, aidés par un manuel de transcription adapté de MacWhinney (2000). Chaque transcription a été relue par l’un des membres experts de l’équipe. Il est toutefois apparu rapidement que malgré nos tentatives d’harmonisation, des variations importantes subsistaient dans les transcriptions finales. Même si Mondada (2007) considère que la variation est inhérente au processus de transcription, et qu’elle présente un caractère irrémédiable, nous nous demandons (1) comment faire en sorte que la variabilité dans les transcriptions ne soit pas un obstacle à l’exploitation du corpus et (2) comment valoriser la variation et en faire un moteur pour la recherche et la formation à la recherche. Nous nous pencherons en particulier sur la transcription d’un même enregistrement par des transcripteurs francophones, anglophones et ukrainien afin d’évaluer l’influence de la langue maternelle sur les choix de transcription ; nous présenterons ensuite le travail d’harmonisation effectué au sein de l’équipe pour aboutir à un corpus multimodal cohérent et exploitable. Nous concluons en rappelant que la transcription collaborative appelle l’explicitation transparente des choix effectués, et une sensibilisation des membres de l’équipe à l’impact des choix de transcription sur les possibilités d’analyse des données. Une formation des transcripteurs aux enjeux de la transcription; enfin, tout particulièrement dans le cas de l'anglais, il est essentiel de prêter une attention particulière à la transcription des formes inaccentuées.
Type de document :
Poster
Liste complète des métadonnées

https://hal-univ-montpellier3-paul-valery.archives-ouvertes.fr/hal-03303903
Contributeur : Pascale Leclercq <>
Soumis le : mercredi 28 juillet 2021 - 11:36:23
Dernière modification le : vendredi 30 juillet 2021 - 04:06:34

Fichier

posterV3.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-03303903, version 1

Collections

Citation

Pascale Leclercq, Amanda Edmonds, Elisa Sneed German, Emily Paige, Sandra Heyde, et al.. Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles. Colloque International du Réseau d'Acquisition des Langues Secondes (Réal2), Jul 2021, Toulouse, France. ⟨hal-03303903⟩

Partager

Métriques

Consultations de la notice

14

Téléchargements de fichiers

15