[Corpora-List] PhD Position in Linguistic and NLP (in French)

Thierry Charnois thierry.charnois at lipn.univ-paris13.fr
Fri Jun 3 14:04:10 CEST 2016


Appel à candidature pour une thèse de Doctorat en Sciences du Langage et Informatique (en vue d'une demande de financement doctoral « double culture »)

candidature à envoyer avant le 9 juin 2016 date limite à thierry Charnois thierry.charnois at lipn.univ-paris13.fr et Dominique Legallois dominique.legallois at univ-paris3.fr

Sujet : localisation textuelle des unités linguistiques dans le discours littéraire

Dans un article de 1981, Lafon proposait un modèle statistique permettant de « calculer » la place des unités linguistiques dans un texte ; il s'agissait d'examiner l'organisation séquentielle des formes, et non plus leurs seules dimensions fréquentielles. Etaient opposées les formes apparaissant, dans certaines régions du texte, « en rafales », aux formes dites « régulières », c'est-à-dire disséminées de façon homogène dans tout le texte. D'autres approches, dans des paradigmes différents, considèrent que les unités (généralement lexicales) ont tendance à « préférer » telle ou telle position dans la phrase, dans le paragraphe, dans le chapitre, etc. Ainsi, M.Hoey (2005) parle de colligation textuelle pour désigner cette propriété qu'auraient les lexèmes d'être préférentiellement employés dans telle région du texte. Récemment, un outil a été réalisé pour observer en corpus de tel phénomène (WordSkew de M. Barlow).

L'objet d'analyse de la thèse est la localisation textuelle des unités dans le discours littéraire, autrement dit la topologie textuelle. A partir d'une structuration prédéfinie d'un texte (structuration que l'on peut faire varier lors de l'analyse), il s'agit de mettre au point une méthode informatisée donnant la possibilité d'identifier les concordances ou corrélations entre unités/types d'unités et positions dans les textes, d'observer les modes d'organisation (répartition en rafales ou monotones, mais d'autres modes sont peut-être repérables), les variations possibles entre textes. Les unités considérées seront, outre les formes lexicales et les lemmes, les unités non discrètes comme les segments répétés ou les motifs (Quiniou et al. 2012, Legallois et al. 2016), c'est-à-dire des segments lexico-grammaticaux schématiques. Il s'agit également de proposer des interprétations de ces concordances et modes d'organisation : quelles sont, pour le spécialiste du texte, les significations de telle configuration topologique et comment les intégrer à une sémantique des textes ? Si ce type de concordance existe, est-il constitutif d'une norme particulière ? L'analyse portera sur plusieurs corpus littéraires, dont le corpus de textes versifiés Anamètre (http://www.crisco.unicaen.fr/verlaine/), et un corpus de nouvelles d'auteurs du 19e siècle.

Le candidat aura une formation en sciences humaines (littérature, sciences du langage) et possédera de solides compétences en linguistique de corpus et informatique (Tal ou fouille de données).

La candidature sera soumise à l'appel pour financement doctoral « Double culture » de l'Université Sorbonne Paris cité: http://www.univ-paris3.fr/actualites-de-l-ed-268-69610.kjsp Les pièces demandées sont les suivantes : - CV, - Lettre de motivation (orientée par rapport au sujet proposé) - Relevé de notes de Master 1 et 2

Etablissements d'enseignement supérieur où sera inscrit le doctorant : Université Paris 3 Sorbonne Nouvelle, Université Paris 13

- Ecole doctorale principale : ED268 Langage et langues : description, théorisation, transmission, Paris 3 http://www.univ-paris3.fr/actualites-de-l-ed-268-69610.kjsp - Ecole doctorale secondaire : ED Galilée 146, Paris 13

- Laboratoires où s'effectuera la thèse : Laboratoire Clesthia (Paris 3) Laboratoire LIPN (Paris 13) le doctorant travaillera également en interaction avec le laboratoire LATTICE (Paris 3) et en relation avec le laboratoire Crisco (Caen).

- Directeurs de la thèse : Th. Charnois (Professeur en Informatique, Paris 13) D. Legallois (Professeur en sciences du langage, Paris 3) Candidature à envoyer à thierry Charnois thierry.charnois at lipn.univ-paris13.fr et Dominique Legallois dominique.legallois at univ-paris3.fr

- Références : Hoey M. (2005) Lexical Priming : A New Theory of Words and Language. London, Routledge Lafon P. (1981) « Statistiques des localisations des formes d'un texte », Mots, vol.2, n°1, p. 155-188 Legallois D., Charnois Th. et Poibeau Th. (2016), « Repérer les clichés dans les romans sentimentaux grâce à la méthode des « motifs » », Lidil, n°53 Quiniou S., Cellier P., Charnois Th., Legallois D. (2012) « Fouille de données pour la stylistique : cas des motifs séquentiels émergents ». Journées Internationales d'Analyse Statistique des Données Textuelles (JADT'12), Jun 2012, Liège, Belgique. pp.821-833, 2012. -------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 7058 bytes Desc: not available URL: <https://mailman.uib.no/public/corpora/attachments/20160603/426d998c/attachment.txt>



More information about the Corpora mailing list