[Corpora-List] Fwd: [clcs-sdl-chercheurs] Corpus SERMO en ligne

Angus Grieve-Smith grvsmth at panix.com
Wed Sep 5 01:30:08 CEST 2018


-- Angus B. Grieve-Smith grvsmth at panix.com

-------- Original Message -------- From: SKUPIEN DEKENS Carine <carine.skupien-dekens at unine.ch> Sent: August 31, 2018 6:18:53 AM EDT To: SIDF Liste <sidf-liste at googlegroups.com>, "clcs-sdl-chercheurs at univ-lorraine.fr" <clcs-sdl-chercheurs at univ-lorraine.fr>, "staff at vals-asla.ch" <staff at vals-asla.ch>, UHLIG Marion <marion.uhlig at unifr.ch>, Linguistique Info <info.linguistique at unine.ch>, "TEI-L at LISTSERV.BROWN.EDU" <TEI-L at LISTSERV.BROWN.EDU>, "corpus-ecrits-request at groupes.renater.fr" <corpus-ecrits-request at groupes.renater.fr>, Fisier Info <fisier.info at gmail.com>, "corpora at uib.no" <corpora at uib.no>, "corpora-request at uib.no" <corpora-request at uib.no>, "parislinguists at yahoogroupes.fr" <parislinguists at yahoogroupes.fr>, "notify at diskursanalyse.net" <notify at diskursanalyse.net>, ListeModyco-tous <modyco-tous at u-paris10.fr> Subject: [clcs-sdl-chercheurs] Corpus SERMO en ligne

English version below

Madame, Monsieur, chère et cher collègue,

Nous avons le plaisir de vous annoncer le lancement de la version définitive du corpus SERMO. Vous trouverez sur le site http://sermo.unine.ch un corpus de 62 sermons protestants francophones, édités pour la plupart à Genève, entre 1550 et 1750, représentant 600571 tokens. Ces textes ont été tokenisés, lemmatisés et étiquetés, et permettent des requêtes dans différents domaines, comme l'histoire du livre, de l'imprimerie, la théologie, l'histoire des idées, la littérature moderne, la linguistique de corpus et la linguistique diachronique. Rechercher la graphie moderne et trouver toutes les graphies anciennes qui y correspondent ; rechercher des citations bibliques, selon leur référence, ou la bible source dont ils sont tirés ; établir une base de collocation pour des lemmes ou des tokens choisis ; visualiser les résultats des requêtes... Par exemple, voici l'évolution du nombre de phrases commençant par une conjonction de coordination en 1550 et 1750 : [Distribution basé sur: $classification_desc] De nombreux tutoriels sont à votre disposition pour apprendre à faire des requêtes plein-texte, par concordancier, par fréquence, etc. Les textes, les résultats et les outils sont tous téléchargeables gratuitement. Pour toute question ou renseignement, vous pouvez vous adresser à moi. Toute l'équipe SERMO, Cinthia Meli, Magdalena Augustyn, Ljiljana Dolamic et moi-même, vous souhaitons beaucoup de belles découvertes dans l'exploration du corpus SERMO. Avec nos salutations les meilleures,

Pour l'équipe SERMO, [cid:image002.jpg at 01D44124.C7746870]Carine Skupien Dekens (dir.)

Professeure titulaire Institut de Langue et civilisation françaises Université de Neuchâtel Faubourg de l'Hôpital 61-63 CH-2000 NEUCHATEL

Ladies and gentlemen, dear colleagues, We are pleased to announce the launch of the final version of the SERMO corpus. On the website http://sermo.unine.ch you will find a corpus of 62 French Protestant sermons, published mostly in Geneva between 1550 and 1750 consisting of 600571 tokens. These texts have been tokenized, lemmatized and tagged to offer a possibility of queries in different fields, such as the history of books, printing, theology, history of ideas, modern literature, corpus linguistics and diachronic linguistics. Searching for modern spelling and finding corresponding old spelling; searching for biblical citations, according to their reference or the source Bible from which they were drawn; establishing a collocation database for selected lemmas or tokens; visualising query results ... For example, here is the evolution of the number of sentences starting with a coordination conjunction from 1550 to 1750: [Distribution basé sur: $classification_desc] Large numbers of tutorials are at your disposal to learn how to perform full-text queries, concordance or frequency lists, etc. The texts, the results and the tools are all downloadable for free. For any question or information, feel free to contact me. The whole SERMO team (Cinthia Meli, Magdalena Augustyn, Ljiljana Dolamic and myself) wishes you a lot of discoveries in the exploration of the SERMO corpus. With our best regards

[cid:image002.jpg at 01D44124.C7746870]Carine Skupien Dekens (dir.)

Professeure titulaire Institut de Langue et civilisation françaises Université de Neuchâtel Faubourg de l'Hôpital 61-63 CH-2000 NEUCHATEL

++41 (0)32.718.18.72 Portable : 076.431.41.58 https://libra.unine.ch/Publications/citation/Carine_Skupien_Dekens

-------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 13784 bytes Desc: not available URL: <https://mailman.uib.no/public/corpora/attachments/20180904/4b06c09a/attachment.txt>



More information about the Corpora mailing list