[Corpora-List] Call for Participations - ContribuLing 2021 - Online Event 3/4 June 2021 (Presentations & Workshops)

Damien Nouvel damien at nouvels.net
Tue Jun 1 10:16:09 CEST 2021


Our online event will be held on Thursday / Friday: please subscribe if you consider attending!

*ContribuLing 2021 (English) (French / Spanish versions below)*

https://meta.wikimedia.org/wiki/ContribuLing/en

There are significant differences when it comes to the digitisation and computational processing of languages, which are the reflection of the availability of language-specific linguistic resources. In turn, this significantly impacts existing tools, whether they serve to build or collect data - speech recognition, OCR software, data collection (in some specific languages) or whether they are used to process data (search engines, encyclopedias, language learning, chatbots).

Given the situation, numerous projects have been launched over the last few years to make it easier to produce and share linguistic resources. The latter are mostly geared towards data collection, e.g. speech or text corpora, dictionaries, glossaries or grammars. As tools dedicated to automatic processing of languages need any type of data, not necessarily specialized, any speaker is legitimate to contribute enriching databases for its language. One of the major challenges is to allow everyone easy access to linguistic resource platforms.

The ContribuLing event - a joint contribution of INALCO, Wikimedia, BULAC and UQAM - will take place on June 3rd/4th, 2021 (a fully online event) and will offer presentation or workshop sessions regarding contributive platforms.

Registration is free, but mandatory:
>
https://framaforms.org/contribuling-2021-inscription-registration-inscripcion-1621001258

You may find the program at the bottom of this message. Presentations and workshops will use Zoom, time for discussion is planned and will take place on SpatialChat to f acilitate free discussion. Details are available online on the dedicated web page, including description of the presented platforms and languages. Participants who have registered will receive a message with details to connect and attend sessions.

*ContribuLing 2021 (Français)*

https://meta.wikimedia.org/wiki/ContribuLing/fr

La disponibilité des ressources numériques dans une langue a un impact indéniable sur la qualité des outils de traitement informatique disponibles, autant pour la création et l'acquisition de nouvelles données

(saisie / OCR / reconnaissance de parole) que pour leur traitement (moteurs de recherche, encyclopédies, apprentissage des langues, chatbots, etc).

De nombreux projets ont été initiés ces dernières années pour faciliter la contribution et le partage de ressources linguistiques. La plupart des plateformes visent la collecte de données linguistiques, telles que des corpus oraux ou écrits, des dictionnaires et lexiques, des grammaires. Les outils de traitement automatique des langues ayant besoin de données de tout type et non nécessairement spécialisées, tout locuteur est légitime pour contribuer à enrichir les bases de données pour sa langue. Actuellement, un des enjeux est de permettre à tou·te·s de contribuer efficacement sur ces plateformes.

L'événement ContribuLing, co-organisé par l'INALCO, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin 2021 (entièrement en ligne) propose des sessions de présentations et/ou d'ateliers à propos des plateformes contributives.

L'inscription est gratuite, mais obligatoire :
>
https://framaforms.org/contribuling-2021-inscription-registration-inscripcion-1621001258

Le programme se trouve en bas de cet email. Les présentations et ateliers seront réalisés avec Zoom, plusieurs moments d'échanges sont prévus et auront lieu avec SpatialChat afin de permettre des discussions libres. Les détails sont accessibles en ligne sur la page web, dont des descriptions des plateformes présentées et des langues concernées. Les participants inscrits sur le formulaire recevront un email avec les détails pour se connecter et assister aux sessions.

*ContribuLing 2021 (Español)*

https://meta.wikimedia.org/wiki/ContribuLing/es

La disponibilidad de recursos digitales en una lengua tiene un impacto indiscutible sobre la calidad de las herramientas de tratamiento informático para esa lengua, tanto para la creación y adquisición de nuevos datos (entrada de [auto]texto, OCR, reconocimiento de voz) como para su procesamiento (motores de búsqueda, enciclopedias, aprendizaje de lenguas, chatbots, etc).

Ante esta situación, en los últimos años se han iniciado numerosos proyectos para facilitar la contribución y el intercambio de recursos lingüísticos. Varias plataformas ya permiten a los usuarios compartir datos lingüísticos como corpus orales o escritos, diccionarios y léxicos, gramáticas, etc. Las herramientas de procesamiento automático de lenguas necesitan datos de todo tipo, no necesariamente especializados; por consiguiente cada hablante es legítimo para contribuir a enriquecer las bases de datos de su lengua. Por ello, uno de los retos actuales es permitir que todos puedan contribuir eficazmente en estas plataformas.

El evento ContribuLing, coorganizado por el INALCO, Wikimedia, la BULAC y la UQAM los días 3 y 4 de junio de 2021 en línea, propone presentaciones y / o talleres sobre plataformas colaborativas.

La inscripción es gratuita, pero obligatoria :
>
https://framaforms.org/contribuling-2021-inscription-registration-inscripcion-1621001258

El programa se encuentra abajo de este correo. Las presentaciones y los talleres serán en Zoom, habrá posibilidad de comunicar con lxs participantes en SpatialChat. Los detalles son accesibles en línea en la página web, incluidas las descripciones de las plataformas presentadas. Los participantes inscritos en el formulario recibirán un correo con los detalles para conectarse y asistir a las sesiones.

*Program (UTC+2)*

- Thursday the 3rd of June

* 13h00 Opening Session

* 13h30 Lingua Libre (https://lingualibre.org)

* 14h00 Wikidata Lexemes (779 languages)

* 15h00 Wikimedia Incubator (ISO 639 languages)

* 15h30 Kumoontun (Español, Inglés, Ayöök, Maya Popti’, Tének)

* 16h30 Nierika Red Social (Español / Inglés)

* 16h30 Idemi Africa (https://idemi.africa / French, Fon, Minan, Yoruba, Pular, Swahili, Lingala) - Friday the 4th of June

* 13h00 Endangered languages in the Wiktionnaire (6200, Gaulois, Lorrain)

* 13h30 Tacawit (Tacawit)

* 14h00 Occitan (Occitan)

* 15h00 WikiPron (https://pypi.org/project/wikipron / 215 languages)

* 15h30 Living dictionaries (https://livingdictionaries.app / 200 living dictionaries)

* 16h30 Wikisource (72+ languages)

* 16h30 Multilingual Wikidata properties (Wikidata languages)

* 18h00 Closing Session

*Organising Committee*

Adélaïde Calais (Wikimedia France) Claire Camberlein (BULAC) Johanna Cordova (INALCO ERTIM) Hugo Lopez (Wikimedia France / LinguaLibre) Damien Nouvel (INALCO ERTIM) Lucas Prégaldiny (Wikimédia France / Lingua Libre) Fatiha Sadat (UQAM) Anass Sedrati (Wikimedia Maroc) Emma Vadillo Quesada (Wikimedia France / LinguaLibre) -------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 8281 bytes Desc: not available URL: <https://mailman.uib.no/public/corpora/attachments/20210601/33995e8e/attachment.txt>



More information about the Corpora mailing list