[Corpora-List] Summer School /Escola de Verão - Approaches to NLP in Portuguese / Aspectos de PLN em Português

Belinda Maia bmaia
Fri Apr 24 15:07:17 CEST 2009


Apologies for multiple postings

Summer School

29 June ? 3 July

Approaches to Natural Language Processing in Portuguese

Present resources and tools > future research

This Summer School aims to provide a forum for the presentation and discussion of various aspects of natural language processing in Portuguese in a way that we hope will appeal to the spectrum from general linguists interested in computational resources for their research, through those engaged in NLP research, to those in information extraction or management.

The group of specialists who will take part in the presentations and discussions include

Alberto Simões (Univ. Minho)

Anabela Barreiro (CLUP)

Belinda Maia (FLUP)

Bogdan Babych (Univ. Leeds)

Cristina Mota (UTL)

Daniela Braga (Microsoft)

Diana Santos (SINTEF)

Francisco Couto (FCUL)

Isabel Galhano Rodrigues (FLUP)

José João Almeida (Univ. Minho)

Mário Silva (FCUL)

Paula Carvalho (FCUL)

Paulo Gomes (FCUC)

Pavel Brazdil (FEP)

PROVISIONAL PROGRAMME

Day 1 Introduction and Linguistic tools and resources

9.00 ? 9.30 Registration

9.30 ? 11.00 Introductory session

Linguistics & Information technology ? points of contact and divergence

11.00-11.30 Coffee break

11.30 -12.30

Part-of speech tagging ? possibilities and problems

12.30-14.30 ? Lunch

14.30 -16.30

Morphosyntactic, phrasal and syntactic annotation - theories

16.30-17.00 Coffee break

17.00 -19.00

Morphosyntactic, phrasal and syntactic annotation ? applications and exercises

Day 2 - Linguistic tools and resources for Portuguese

9.00 ? 10.00

Syntactic analysis > linguistic ?patterns? > treebanks ? theories

10.00 -11.00 Syntactic analysis > linguistic ?patterns? > treebanks ? presentation of examples

11.00 ? 11.30 Coffee break

11.30 ? 12.30

Syntactic analysis > linguistic ?patterns? > treebanks ? presentation of examples

12.30-14.30 Lunch

14.30-16.30

Syntactic analysis > collection of linguistic patterns > treebanks ? exercises

16.30-17.00 Coffee break

17.00 ? 19.00

Creating and using corpora for specific research

Day 3 - Applications of computational linguistics to research

9.00 ? 10.00

Machine translation ? different approaches

10.00 ? 11.00

Machine translation as an application of computational linguistics

11.00-11.30 Coffee break

11.30- 12.30

Machine translation ? directions for future research

12.30-14.30 Lunch

14.30- 16.30

Semantics ? experiments with semantic analysis and tagging in general language

16.30-17.00 Coffee break

17.00-19.00

Future research in linguistics using computationally organized resources ? panel of experts

Day 4 Information technology and language

9.0 ? 10.00

Using language for data mining and information retrieval ? general introduction

10.00 ? 11.00

Ontologies, terminologies, word clouds - theories

11.00-11.30 Coffee break

11.30- 12.30

Named Entity recognition ? theories

12.30-14.30 Lunch

14.30- 16.30

Named Entity recognition ? practice and exercises

16.30-17.00 Coffee break

17.00-19.00

Information technology and language ? applications ? panel of experts

Day 5 Applying NLP - Workshops

Possible topics for discussion

Forensic linguistics

Multi-word expressions

Comparable corpora

Ontology building

Opinion mining

Paraphrasing

Rhetorical Discourse Theory

Style editors

Text type identification

Text-to-Speech technology

Full Early-bird registration until 30 May 2009 = 250?

After 30 May = 300?

Individual days = 80?

For more information consult http://cl.up.pt

Escola de Verão

29 de Junho - 3 de Julho de 2009

Centro de Linguística da Universidade do Porto (CLUP)

Aspectos do Processamento da Linguagem Natural em português

? Recursos e ferramentas existentes > investigação futura

Esta Escola de Verão oferece um fórum para a apresentação e debate de vários aspectos do processamento da linguagem natural (PLN) em português, vocacionado a um leque de alunos variados: desde aqueles que precisam de recursos e ferramentas computacionais para investigação em linguística geral, até aos que se dedicam ao PLN e mesmo apenas a engenharia informática.

O grupo de especialistas que participarão nas apresentações de debates incluirá:

José João Almeida (Univ. Minho)

Bogdan Babych (Univ. Leeds)

Anabela Barreiro (CLUP)

Daniela Braga (Microsoft)

Pavel Brazdil (FEP)

Paula Carvalho (FCUL)

Francisco Couto (FCUL)

Gaël Dias (Univ. Beira Interior)

Paulo Gomes (FCUC)

Belinda Maia (FLUP)

Isabel Galhano Rodrigues (FLUP)

Diana Santos (SINTEF)

Mário Silva (FCUL)

Alberto Simões (Univ. Minho)

e outros a anunciar.

O número máximo de estudantes será 30, por isso, os interessados devem preencher a ficha de pré-inscrição até 15 de Maio, e terão resposta até 22 de Maio.

O programa incluirá apresentações e debates sobre os tópicos seguintes:

· Corpos e florestas (?treebanks?) existentes

· Anotação de corpos

o Que tipo de corpo ? monolingue, paralelo, comparável, escrito, falado, multimédia?

o Que anotação ? lexical, morfológica, morfosintáctica, sintagmática, sintáctica, semântica, pragmática, multimédia?

· Uso de corpos para análise linguística:

o Que aspecto - sincrónico, diacrónico, contrastivo, comparativo?

· Tradução automática como aplicação de PLN

· Redes lexicais ('wordnets'), ontologias, terminologias, redes semânticas

· Reconhecimento de entidades mencionadas e a sua aplicação

· Prospecção de dados textuais (?Text mining?, ?Information Retrieval?, ?Classification? and extraction)

O último dia da Escola será dedicado a diversas apresentações de investigação em curso sobre os seguintes tópicos:

· Construção de ontologias

· Corpos comparáveis

· Editores de estilo

· Expressões multi-palavras

· Identificação do género textual

· Linguística forense

· Mineração de opiniões

· Paráfrases

· Tecnologia Texto > Fala

Inscrições:

Até 30 Maio: 250?

Depois de 30 de Maio: 300?

Dias individuais: 80?

Para mais informação, consulte a página do CLUP - http://cl.up.pt/

-------------- next part -------------- A non-text attachment was scrubbed... Name: not available Type: text/html Size: 31493 bytes Desc: not available Url : https://mailman.uib.no/public/corpora/attachments/20090424/885884b6/attachment.txt



More information about the Corpora mailing list