[Corpora-List] ContribuLing 2021 - Call for Proposals

Damien Nouvel damien at nouvels.net
Tue Apr 20 10:33:32 CEST 2021


*ContribuLing 2021 (English) (French / Spanish versions below)*

There are significant differences when it comes to the digitisation and computational processing of languages, which are the reflection of the availability of language-specific linguistic resources. In turn, this significantly impacts existing tools, whether they serve to build or collect data - speech recognition, OCR software, data collection (in some specific languages) or whether they are used to process data (search engines, encyclopedias, language learning, chatbots).

Given the situation, numerous projects have been launched over the last few years to make it easier to produce and share linguistic resources. The latter are mostly geared towards data collection, e.g. speech or text corpora, dictionaries, glossaries or grammars. One of the major challenges is to allow everyone easy access to linguistic resource platforms.

The ContribuLing project (https://meta.wikimedia.org/wiki/ContribuLing) - a joint contribution of INALCO, Wikimedia, BULAC and UQAM - will take place on June 3rd/4th, 2021, either online or in Paris/Montreal depending on the situation. Its aim is to offer linguistic resource platform managers an opportunity to lay out their specs and stage workshops that will enable would-be users to contribute.

ContribuLing's main goal is to ensure that the largest possible number of contributors can use the platforms. An additional benefit will be to allow the emergence or the development of user groups who share the same tools or platforms. Emphasis will not be laid on producing data sets but on enabling attendees to do so.

To offer some ContribuLing presentation/workshop, please send a draft poposal - 2 pages max. - by April 23rd to contribuling at framalistes.org . Your proposal should provide the following info: - name(s), forename(s), credentials of workshop organisers - time needed for workshop - platform name - language used for workshop - platform languages currently available - size of platform data - platform and lingusitic data type of licence - bird's eye-view of tool - 10 lines - linguistic or programing requisites - platform access mode -online, login ... - specific needs for workshop - any info for seamless workshop organisation

Using the above info, ContribuLing's organising committee will look into the proposals and offer the selected platform managers time slots with a view to setting some tentative schedule. Once the schedule has been agreed on, the ContribuLing project will reach out to would-be participants. The project will consist of presentations of tools and platforms that can contribute to improving how they are designed and used. Language-specific workshops will help would-be contributors to use tools and platforms in relation to specific languages.

*ContribuLing 2021 (Français)*

La disponibilité des ressources numériques dans une langue a un impact indéniable sur la qualité des outils de traitement informatique disponibles, autant pour la création et l'acquisition de nouvelles données

(saisie / OCR / reconnaissance de parole) que pour leur traitement (moteurs de recherche, encyclopédies, apprentissage des langues, chatbots, etc).

Face à ce constat, de nombreux projets ont été initiés ces dernières années pour faciliter la contribution et le partage de ressources linguistiques. Il existe ainsi de nombreuses plateformes permettant la collecte directe de données linguistiques, telles que des corpus oraux ou écrits, des dictionnaires et lexiques, des grammaires, etc. Les outils de traitement automatique des langues ayant besoin de données de tout type et non nécessairement spécialisées, tout locuteur est légitime pour contribuer à enrichir les bases de données pour sa langue. Ainsi, actuellement, un des enjeux est de permettre à tou·te·s de contribuer efficacement sur ces plateformes.

L'événement ContribuLing (https://meta.wikimedia.org/wiki/ContribuLing), co-organisé par l'INALCO, Wikimedia, la BULAC et l'UQAM les 3 et 4 juin 2021 entièrement en ligne (ou si la situation le permet, également en présentiel à Paris et à Montréal), propose aux plateformes d’organiser des conférences sur la création et l’utilisation des outils qu’elles ont mis en place, ainsi que des ateliers à destination des participant·e·s, permettant de former de potentiel·le·s contributeur·rice·s.

Il s'agit en premier lieu de permettre au plus grand nombre de prendre en main ces plateformes pendant ces journées, afin qu'elles·ils puissent par la suite contribuer en ligne. Nous espérons également que cet événement permettra de constituer ou renforcer des communautés d'utilisateur·rice·s autour des outils et des plateformes présentées. Les ateliers n'auront pas vocation à constituer des jeux de données au cours de ces journées, mais d'apporter aux participant·e·s la capacité de le faire par la suite.

Pour proposer une présentation ou un atelier lors de ces journées, nous vous prions de bien vouloir nous envoyer votre proposition (maximum deux pages) avant le 23 avril 2021 à l'adresse contribuling at framalistes.org avec, autant que possible, les informations suivantes : - noms, prénoms, affiliation des organisateur-rice-s de l'atelier, - durée envisagée de l'atelier, - nom de la plateforme contributive, - langue dans laquelle sera présenté l'atelier, - langues actuellement prises en charge par la plateforme, - volume des données déjà présentes sur la plateforme, - licence de la plateforme (code) et des données linguistiques collectées, - description sommaire de l'outil (10 lignes), - modalités d'accès à la plateforme (en ligne, authentification, etc.), - prérequis de compétences en informatique et/ou en linguistique, - moyens nécessaires à l'organisation de l'atelier, - autres informations liées à la bonne organisation de l'atelier.

À partir de ces informations, le comité d'organisation de ContribuLing examinera les propositions d'ateliers et proposera aux ateliers retenus des plages horaires afin d'établir un programme sur les deux journées concernées, l'annonce de l'événement sera alors diffusée plus largement.

*ContribuLing 2021 (Español)*

La disponibilidad de recursos digitales en una lengua tiene un impacto indiscutible sobre la calidad de las herramientas de tratamiento informático para esa lengua, tanto para la creación y adquisición de nuevos datos (entrada de [auto]texto, OCR, reconocimiento de voz) como para su procesamiento (motores de búsqueda, enciclopedias, aprendizaje de lenguas, chatbots, etc).

Ante esta situación, en los últimos años se han iniciado numerosos proyectos para facilitar la contribución y el intercambio de recursos lingüísticos. Varias plataformas ya permiten a los usuarios compartir datos lingüísticos como corpus orales o escritos, diccionarios y léxicos, gramáticas, etc. Las herramientas de procesamiento automático de lenguas necesitan datos de todo tipo, no necesariamente especializados; por consiguiente cada hablante es legítimo para contribuir a enriquecer las bases de datos de su lengua. Por ello, uno de los retos actuales es permitir que todos puedan contribuir eficazmente en estas plataformas.

El evento ContribuLing (https://meta.wikimedia.org/wiki/ContribuLing), coorganizado por el INALCO, Wikimedia, la BULAC y la UQAM tendrá lugar los días 3 y 4 de junio de 2021 en línea (o si la situación lo permite, también en presencial en París y Montreal). Se ofrece a los representantes de plataformas colaborativas la oportunidad de organizar conferencias sobre ésas (utilización, método de trabajo, comunidad, etc), así como proporcionar a los participantes talleres de formación a su utilización colaborativa.

El objetivo principal es que el mayor número posible de personas se familiarice con las herramientas de estas plataformas dentro del marco de este evento, de manera que luego puedan contribuir en línea. También esperamos que este encuentro permita constituir o fortalecer comunidades de usuarios en torno a las herramientas y plataformas presentadas. Es de notar que los talleres no tendrán como objetivo constituir bases de datos durante estos días, sino proporcionar a los participantes la posibilidad de hacerlo posteriormente.

Para proponer una presentación y/o un taller, les invitamos a enviar su propuesta (máximo dos páginas) antes del 23 de abril de 2021 al correo contribuling at framalistes.org con, en la medida de lo posible, las informaciones siguientes: - nombre, apellido, afiliación de los organizadores del taller, - duración prevista del taller, - nombre de la plataforma contribuyente, - idioma en el que se presentará el taller, - idiomas actualmente soportados por la plataforma, - volumen de datos ya presente en la plataforma, - licencia de la plataforma (código) y de los datos lingüísticos recogidos, - breve descripción de la herramienta (10 líneas), - métodos de acceso a la plataforma (en línea, autenticación, etc.), - si se requieren conocimientos informáticos y/o lingüísticos para el uso de la plataforma, - recursos necesarios para la organización del taller, - cualquier otra información necesaria para la buena organización del taller.

A partir de estos datos, el comité organizador de ContribuLing examinará las propuestas de talleres y propondrá franjas horarias para los proyectos seleccionados, con el fin de establecer en conjunto un programa completo. Más adelante, éste se difundirá ampliamente.

*Organising Committee*

Adélaide Calais (Wikimedia France) Claire Camberlein (BULAC) Johanna Cordova (INALCO ERTIM) Hugo Lopez (Wikimedia France / LinguaLibre) Damien Nouvel (INALCO ERTIM) Thérèse Ottawa (Wikimedia Canada) Lucas Prégaldiny (Wikimédia France / Lingua Libre) Fatiha Sadat (UQAM) Anass Sedrati (Wikimedia Maroc) Emma Vadillo Quesada (Wikimedia France / LinguaLibre) -------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 10894 bytes Desc: not available URL: <https://mailman.uib.no/public/corpora/attachments/20210420/bfdf64b3/attachment.txt>



More information about the Corpora mailing list