Une approche-pilote en dialectologie computationnelle du réseau dialectal haïtien à partir des données de l’ALCH (Atlas Linguistique du CréoleHaïtien de D.Fattier) - Université Paul Valéry Montpellier 3 Accéder directement au contenu
Communication Dans Un Congrès Année : 2023

Une approche-pilote en dialectologie computationnelle du réseau dialectal haïtien à partir des données de l’ALCH (Atlas Linguistique du CréoleHaïtien de D.Fattier)

Résumé

La classification des variétés dialectales du créole haïtien n’a jusqu’à maintenant jamais fait l’objet d’une approche quantitative. Nous proposons ici d’explorer les données de l’ALCH (Atlas linguistique du créole haïtien) de Dominique Fattier (1998), à l’aide de la distance d’édition ou algorithme de Levenshtein, à l’aide de l’application Gabmap (Levenshtein 1966 ; Nerbonne & al. 2005, 2011). Nous avons écarté deux points d’enquête trop peu nourris en données (les points 12 et 13 : Bonga et Léogane, au sud-est de l’aire), et avons dessiné cette carte sur My Map (Google), afin d’analyser les données à l’aide du logiciel de dialectométrie automatisée accessible gratuitement en ligne : Gabmap (v. https://dev.clarin.nl/node/14345). Nous avons réuni un ensemble de données relevant de deux paramètres, pour une analyse dialectométrique : la phonologie (dont la morphonologie pronominale) et le lexique. Nous avons subdivisé les données phonologiques en variables, telles que les formes courtes vs formes longues – cf. Fils-René 2022 –, les primarisations et divers métaplasmes, les palatalisations, et obtenu des « scores » de différences interponctuelles par l’application Gabmap, qui compte les ajouts, les modifications et les suppressions dans les chaînes de caractères au sein de gabarits CVCV, en ce qui concerne la phonologie. En ce qui concerne le lexique, l’analyse procède de manière catégorielle, en enregistrant les scores d’écarts entre lexies différentes. Les premiers résultats, pour un échantillonnage de plus de 20 cartes, à titre exploratoire, donnent les analyses factorielles de la figure 2 infra. On voit sur ces premiers résultats en termes de positionnement multiscalaire s’opposer clairement dans les deux cas de figure (paramètres de la phonologie et du lexique) le nord vs le sud du domaine, de manière catégorielle, surtout en ce qui concerne la phonologie. On remarque que pour ce critère relevant des systèmes fermés, le nord (nuage très clairsemé, en haut du schéma de gauche) est bien plus hétérogène que le centre et le sud, car ses points, de 1 à 5, sont très dispersés, tandis que le sud est plus homogène, car rassemblé dans un bloc compact, en bas du schéma. De même pour les points 6, 8 et 7, du sous-dialecte central, qui semble inclure deux variétés : Dessaline (point 6) et Saint Marc (point 8) d’une part, Hinche (point 7) d’autre part. En ce qui concerne le lexique (système ouvert), la tendance est inverse : les points du nord sont plutôt regroupés en un nuage compact en haut du schéma, tandis que le sud et le centre apparaissent très dispersés, en bas du schéma. Tous ces faits militent dans un sens, sur le plan de l’interprétation de l’écologie des relations sociales entre les diverses communautés constituant le réseau dialectal haïtien, tel que saisi par l’ALCH : le nord rural, agricole, est constitué de communautés nettement segmentées, sur le plan géographique, en fonction des ressources et des traditions agraires, tandis que le centre et surtout le sud, bien plus urbain et orienté vers le commerce et les services, présente une structure plus labile (autrement dit, plus de variation, plus d’interactions tous azimuts). On s’interrogera par conséquent sur les réseaux sociolinguistiques (Milroy 1980) qui sous-tendent ou ont pu déterminer ces configurations, sur les plans synchronique et diachronique. Dans la mesure des données disponibles, on tentera d’explorer les résultats à l’aide d’algorithmes plus englobants, tels que la moyenne de groupe simple vs pondérée et le voisin le plus éloigné (cf. Prokić & Nerbonne 2008), afin de saisir la dialectique entre dialecte « éponyme » (nord vs centre et sud, etc.) et « dialecte invisible » (structures géolinguistiques de profondeur) – cf. Nerbonne & Kretzschmar, 2003 – afin de mieux saisir les dynamiques liées aux quatre réseaux de traits définis pour l’axe 2 du colloque Colef : réseaux GU, Typologiques, aréaux (adstrats) et relevant de la phylogenèse multisource.
Klasifikasyon varyete dyalektal kreyòl ayisyen an poko janm fè yon apwòch quantitative jiska prezan. Nou pwopoze isit la eksplore done ki soti nan ALCH (Atlas Lengwistik Kreyòl Ayisyen) Dominique Fattier (1998), lè l sèvi avèk distans editè oswa algorithm Levenshtein, ak aplikasyon Gabmap (Levenshtein 1966; Nerbonne & al. 2005, 2011). Nou te jete de pwen sondaj ki gen twò piti done (pwen 12 ak 13: Bonga ak Léogane, nan sid-lès zòn nan), epi nou te trase kat sa a sou My Map (Google), pou nou analize done yo avèk dyalektomi otomatik. lojisyèl ki disponib gratis sou entènèt: Gabmap (v. https://dev.clarin.nl/node/14345). Nou te rasanble yon seri done ki gen rapò ak de paramèt, pou yon analiz dyalectometric: fonoloji (ki gen ladan mòfonoloji pronominal) ak leksik. Nou sibdivize done fonolojik yo an varyab, tankou fòm kout vs fòm long - cf. Fils-René 2022 -, primarizasyon ak divès metaplasm, palatalizasyon, ak jwenn "nòt" nan diferans entèponktyèl pa aplikasyon an Gabmap, ki konte adisyon, modifikasyon ak efase nan fisèl karaktè nan modèl CVCV, osi lwen ke fonoloji se konsène. Konsènan leksik la, analiz la kontinye nan yon fason kategorik, lè li anrejistre nòt diferans ki genyen ant diferan leksi. Premye rezilta yo, pou yon echantiyon ki gen plis pase 20 kat, sou yon baz eksplorasyon, bay analiz faktori yo nan figi 2 anba a. Nou ka wè sou premye rezilta sa yo an tèm de pozisyon miltiskalè ke gen yon opozisyon klè nan de ka yo (paramèt fonoloji ak leksik) ant nò ak sid domèn nan, nan yon fason kategorik, sitou nan domèn fonoloji. Nou remake ke pou kritè sa a ki gen rapò ak sistèm fèmen, nò a (nwaj trè ra, nan tèt dyagram ki sou bò gòch la) pi etewojèn pase sant la ak sid la, paske pwen li yo, soti nan 1 a 5, yo trè gaye, pandan ke sid la se pi plis omojèn, paske rasanble nan yon blòk kontra enfòmèl ant, nan pati anba a nan dyagram nan. Menm bagay la tou pou pwen 6, 8 ak 7, sou dyalèk santral la, ki sanble gen de varyete: Desalin (pwen 6) ak Sen Marc (pwen 8) yon bò, Hinche (pwen 7) sou lòt. An sa ki konsène leksik la (sistèm ouvè), tandans nan opoze: pwen nò yo pito gwoupe nan yon nwaj kontra enfòmèl ant nan tèt dyagram nan, alòske sid la ak sant la parèt trè gaye, nan pati anba a nan dyagram nan. . Tout reyalite sa yo milite nan yon sans, an tèm de entèpretasyon ekoloji relasyon sosyal ant divès kominote ki konstitye rezo dyalèk ayisyen an, jan ALCH la te kaptire: nò seksyon riral, nò agrikòl la fòme ak kominote ki byen segmenté, jeyografikman. daprè resous ak tradisyon agrè, alòske sant la e sitou sid la, ki pi plis iben epi ki oryante sou komès ak sèvis, prezante yon estrikti ki pi lab (sa vle di, plis varyasyon, plis entèraksyon tout-wonn). Se poutèt sa, nou pral kesyone rezo sosyolengwistik yo (Milroy 1980) ki kache oswa ki ka detèmine konfigirasyon sa yo, sou nivo senkronik ak dyakronik. Nan limit done ki disponib yo, nou pral eseye eksplore rezilta yo lè l sèvi avèk algoritm ki pi anglobe, tankou mwayèn gwoup ki senp vs pondéré ak vwazen ki pi lwen (cf. Prokić & Nerbonne 2008), pou nou ka konprann dyalèktik ki genyen ant "eponim". ” dyalèk (nò kont sant ak sid, elatriye) ak “dyalèk envizib” (estrikti jeolengwistik pwofondè) – cf. Nerbonne & Kretzschmar, 2003 - yo nan lòd yo pi byen konprann dinamik yo ki lye ak kat rezo karakteristik yo defini pou aks 2 nan kolòk la Colef: GU, Typological, areal (adstrata) rezo ak ki gen rapò ak filogenesis milti sous.
Leonard & Rene DM CH donnees ALCH de Fattier.pdf (5.07 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04050646 , version 1 (29-03-2023)

Identifiants

  • HAL Id : hal-04050646 , version 1

Citer

Jean Léo Léonard, René, Junior-Fils. Une approche-pilote en dialectologie computationnelle du réseau dialectal haïtien à partir des données de l’ALCH (Atlas Linguistique du CréoleHaïtien de D.Fattier). Colef2023 : Contacts de langues et de cultures dans les espaces francophones, Léonard, Jean Léo; Steuckardt, Agnès; Diwersy, Sascha; Govain, Renauld; Alén Garabato, Carmen, Mar 2023, Montpellier, France. ⟨hal-04050646⟩
64 Consultations
67 Téléchargements

Partager

Gmail Facebook X LinkedIn More