Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles

Pascale Leclercq; Amanda Edmonds; Elisa Sneed German; Emily Christen Paige; Sandra Heyde; Vladyslav Gilyuk; Katia Makhlouf

Poster De Conférence Année : 2021

Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles

(1) , (1) , (1) , , , ,

Pascale Leclercq

Fonction : Auteur
PersonId : 743494
IdHAL : pascale-leclercq
ORCID : 0000-0002-3113-5261

Etudes montpelliéraines du monde anglophone

Amanda Edmonds

Fonction : Auteur
PersonId : 743493
IdHAL : amanda-edmonds

Etudes montpelliéraines du monde anglophone

Elisa Sneed German

Fonction : Auteur
PersonId : 746166
IdHAL : elisa-sneed-german

Etudes montpelliéraines du monde anglophone

Emily Christen Paige

Fonction : Auteur

Sandra Heyde

Fonction : Auteur

Vladyslav Gilyuk

Fonction : Auteur

Katia Makhlouf

Fonction : Auteur

Résumé

Les chercheurs en acquisition des langues étrangères s’interrogent sur la manière dont les apprenants développent des compétences de communication dans une langue autre que leur langue maternelle. Ils cherchent notamment à comprendre comment on peut passer d’une compétence minimale (variété de base, Perdue et al. 1993), à une compétence avancée, voire quasi-native (Bartning, Hancock & Forsberg Lundell, 2012 ; Donaldson, 2012). Si des facteurs internes (motivation, aptitudes des apprenants) peuvent expliquer le développement, le milieu d’apprentissage (en classe ou en immersion) peut fonctionner comme un catalyseur. Ainsi, de nombreuses études commencent à voir le jour sur l’apprentissage en immersion (Freed, 1995 ; Kinginger2009 ; Mitchell, McManus, & Tracy-Ventura, 2017), souvent à partir de données transcrites de l’oral. C’est ce processus de transformation – d’un enregistrement oral vers une transcription écrite – que nous souhaitons étudier, afin de mieux comprendre la variation dans les transcriptions ainsi que les sources de cette variation. Le projet PROLINGSA (Linguistic Progress during Study Abroad) est une étude longitudinale de 12 mois qui vise à caractériser l’impact du séjour à l’étranger sur le développement linguistique. Nous avons suivi et filmé lors d’entretiens semi-guidés cinq étudiants francophones ayant effectué un séjour Erasmus+ de neuf mois au Royaume-Uni ou en Irlande. Deux investigatrices (l’une francophone, l’autre anglophone) se sont relayées pour effectuer les cinq entretiens en anglais, sur une période d’un an. La durée totale d’enregistrement est de 12 heures. Nous cherchons à savoir si l’immersion favorise le développement linguistique, et nous interrogeons sur les éléments qui sous-tendent la dynamique du développement (constitution d’un réseau social, motivations…). Afin de pouvoir exploiter ces données et répondre aux questions de recherche, nous avons transcrit les données sous CLAN. Une équipe de huit transcripteurs anglophones, francophones et ukrainien, avec des degrés d’expertise divers (3 enseignantes chercheuses et 5 étudiants de Master), se sont attelés à la tâche, aidés par un manuel de transcription adapté de MacWhinney (2000). Chaque transcription a été relue par l’un des membres experts de l’équipe. Il est toutefois apparu rapidement que malgré nos tentatives d’harmonisation, des variations importantes subsistaient dans les transcriptions finales. Même si Mondada (2007) considère que la variation est inhérente au processus de transcription, et qu’elle présente un caractère irrémédiable, nous nous demandons (1) comment faire en sorte que la variabilité dans les transcriptions ne soit pas un obstacle à l’exploitation du corpus et (2) comment valoriser la variation et en faire un moteur pour la recherche et la formation à la recherche. Nous nous pencherons en particulier sur la transcription d’un même enregistrement par des transcripteurs francophones, anglophones et ukrainien afin d’évaluer l’influence de la langue maternelle sur les choix de transcription ; nous présenterons ensuite le travail d’harmonisation effectué au sein de l’équipe pour aboutir à un corpus multimodal cohérent et exploitable. Nous concluons en rappelant que la transcription collaborative appelle l’explicitation transparente des choix effectués, et une sensibilisation des membres de l’équipe à l’impact des choix de transcription sur les possibilités d’analyse des données. Une formation des transcripteurs aux enjeux de la transcription; enfin, tout particulièrement dans le cas de l'anglais, il est essentiel de prêter une attention particulière à la transcription des formes inaccentuées.

Domaines

Linguistique

Fichier principal

posterV3.pdf (798.57 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Pascale Leclercq : Connectez-vous pour contacter le contributeur

https://univ-montpellier3-paul-valery.hal.science/hal-03303903

Soumis le : mercredi 28 juillet 2021-11:36:23

Dernière modification le : mardi 21 décembre 2021-15:42:01

Archivage à long terme le : vendredi 29 octobre 2021-18:49:48

Dates et versions

hal-03303903 , version 1 (28-07-2021)

Identifiants

HAL Id : hal-03303903 , version 1

Citer

Pascale Leclercq, Amanda Edmonds, Elisa Sneed German, Emily Christen Paige, Sandra Heyde, et al.. Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles. Colloque International du Réseau d'Acquisition des Langues Secondes (Réal2), Jul 2021, Toulouse, France. ⟨hal-03303903⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-MONTP3 EMMA

155 Consultations

59 Téléchargements

Comment construire un corpus multimodal cohérent : Etude de la variabilité de la transcription d’un extrait filmé par des transcripteurs de différentes langues maternelles

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager