[Corpora-List] last Call for papers "Empirical data and language resources" workshop (SLI Malta 2015)

Isabella Chiari isabella.chiari at uniroma1.it
Tue Feb 17 16:36:25 CET 2015


Dear Corpora list members, we would like to remind you that February 28th 2015 is the deadline for proposals for the workshop that will be held within the Conference of SLI (SocietÓ di Linguistica Italiana) in Malta 24-26 September 2015. Below you can find both the English and Italian call. Best regards, Isabella Chiari and Elisabetta Jezek

Empirical Data and Lexical Resources The availability of linguistic data in electronic format has grown exponentially over the last 10 years and has greatly stimulated the development of techniques for their statistical analysis. In spite of this, the discussion about the use of data in building linguistic resources, in lexicographic practice, and in the development of language models remains open and controversial (Hanks 2012, De Marneffe and Potts in press). Also, the inherent limitations of using specific corpora for lexical analysis are rarely made explicit.

Data has also played a central role in the design of lexicographic works and in linguistic research. Different kinds of data have been used in order to build language resources. Only in lexicographic works data can derive from different sources (Chiari 2012): a) introspections: a.1) lexicographer’s introspection; a.2) ordinary user introspection; b) dictionary usage data: b.1) analysis of questionnaires on the use of dictionaries; b.2) analysis of users’ behavior in experimental situations; b.3) analysis of users’ behavior in real situations; c) references: c.1) descriptions provided in other lexicographic works (mono or plurilingual); c.2) descriptions given in reference works like grammars, teaching and instruction materials, descriptive scientific publications; d) attestation: d.1) analysis of usage examples extracted by selections of texts; d.2) analysis of usage examples extracted from existing or ad hoc reference corpora in order to become the empirical base of the lexicographic work.

We invite contributions that focus on the relationship between empirical data and lexical resources (data bases, dictionaries, terminologies, computational lexicons, annotated corpora etc.) and problematize the empirical value and limitations of the sources that can be considered “data” in lexicology and how these sources may contribute to the development of a lexical model. How may linguistic data inform lexical models encompassing the representation of the meaning of words, of the semantic and lexical relations between words, of the relationship between semantic, syntactic and collocational behavior and the interplay between lexical knowledge, commonsense knowledge and pragmatics of language use?

ABSTRACT SUBMISSIONS

Authors should submit an anonymized abstract of at most 2 pages of content (4.000 characters). The submissions should be sent to: sliworkshoplr at gmail.com

IMPORTANT DATES

Submissions due: 28 February 2015 Notification: 15 March 2015 Workshop: 25 September 2015 (SLI Malta 2015, Sept 24-26 2015 http://www.um.edu.mt/events/congressosli2015)

ORGANIZERS

Isabella Chiari (UniversitÓ Sapienza di Roma) Elisabetta Jezek (UniversitÓ Di Pavia)

PROGRAM COMMITTEE

Silvia Bernardini (UniversitÓ di Bologna e Forlý) Marco Biffi (Accademia della Crusca) Federica Casadei (UniversitÓ della Tuscia, Viterbo) Isabella Chiari (UniversitÓ Sapienza di Roma) Ulrich Heid (Universitńt Stuttgart) Elisabetta Jezek (UniversitÓ di Pavia) Alessandro Lenci (UniversitÓ di Pisa) Maria Pia Lo Duca (UniversitÓ di Padova) Francesco Urzý (Parlamento Europeo)

REFERENCES

De Marneffe Marie-Catherine and Christopher Potts, Forth. Developing linguistic theories using annotated corpora. In Nancy I. and J. Pustejovsky, eds., The Handbook of Linguistic Annotation. Chiari, I. 2012. Il dato empirico in lessicografia: dizionari tradizionali e collaborativi a confronto, Bollettino di Italianistica. Per Tullio De Mauro, II, pp. 94-125. Hanks, 2012 P. Lexical Analysis: Norms and Exploitations, The MIT Press. Jezek E. (2006). Argument Structure, Verb Patterns and Dictionaries. In: C. Marello (et al.). Euralex XII Proceedings. Torino, UniversitÓ di Torino, 30 agosto -2 settembre 2006, p. 1169-1180, Edizioni dell'Orso.

*** ITALIAN ***

Empirical Data and Lexical Resources Nonostante la disponibilità di dati linguistici in formato elettronico sia cresciuta in modo esponenziale negli ultimi 10 anni, stimolando lo sviluppo di tecniche per la loro analisi statistica, la discussione riguardo al loro utilizzo nella costruzione di risorse linguistiche, nella pratica lessicografica (tradizionale e computazionale) e in generale nella elaborazione di modelli del linguaggio resta aperta e controversa (Hanks 2012, De Marneffe and Potts in stampa), così come spesso sono insufficientemente esplicitati i limiti dell’uso di specifici corpora per l’analisi lessicale.

Il dato ha da sempre costituito un elemento centrale nel disegno di opere lessicografiche e nella ricerca linguistica. Come è noto, sono stati tuttavia di volta in volta privilegiati diversi tipi di dati. Per quanto riguarda la sola pratica lessicografica, si possono individuare ad es. (Chiari 2012): a) l’introspezione: a.1) l’introspezione del lessicografo; a.2) l’introspezione dell’utente ordinario; b) l’uso del dizionario: b.1) l’analisi di questionari sull’uso dei dizionari; b.2) l’analisi del comportamento di utenti in situazioni sperimentali; b.3) l’analisi del comportamento di utenti in situazioni reali; c) i riferimenti: c.1) la descrizione proposta in altre opere lessicografiche (mono o plurilingui); c.2) la descrizione proposta in opere di riferimento come grammatiche, lavori didattici e pubblicazioni scientifiche descrittivi; d) le attestazioni: d.1) l’analisi di esempi d’uso selezionati o casuali tratti da selezioni di testi; d.2) l’analisi di esempi d’uso estratti da corpora di riferimento esistenti o costruiti ad hoc per fornire la base empirica dell’opera lessicografica.

Si sollecitano contributi teorici o applicativi che focalizzino l’attenzione sul rapporto tra dati empirici e risorse lessicali (banche dati, dizionari, terminologie, lessici computazionali, corpora annotati, ecc.), e che affrontino e problematizzino dal punto di vista metodologico il valore empirico e i limiti delle diverse fonti che possono essere considerate ‘dato’ in lessicologia e sul modo in cui queste fonti contribuiscono a definire la rappresentazione del lessico di una lingua. Come il dato linguistico, inteso in senso ampio, contribuisce a dar forma a diverse rappresentazioni e modelli del significato delle parole e delle loro relazioni semantiche e lessicali, della connessione tra dimensione semantica e comportamento sintattico e collocazionale (Jezek 2006), della relazione tra conoscenza lessicale, conoscenza del mondo e dimensione pragmatica dell’uso linguistico?

PROPOSTE DI CONTRIBUTO

Le proposte di contributo, da 2 cartelle (4.000 caratteri), dovranno pervenire entro il 28 febbraio 2015 in forma anonima all’indirizzo: sliworkshoplr at gmail.com

SCADENZE

Invio proposte: 28 febbraio 2015 Comunicazione esito: 15 marzo 2015 Workshop: 25 settembre 2015 (Malta, Convegno SLI 24-26 settembre 2015)

ORGANIZZATORI

Isabella Chiari (UniversitÓ Sapienza di Roma) Elisabetta Jezek (UniversitÓ di Pavia)

COMITATO DI SELEZIONE

Silvia Bernardini (UniversitÓ di Bologna e Forlý) Marco Biffi (Accademia della Crusca) Federica Casadeim(UniversitÓ della Tuscia, Viterbo) Isabella Chiari (UniversitÓ Sapienza di Roma) Ulrich Heid (Universitńt Stuttgart) Elisabetta Jezek (UniversitÓ di Pavia) Alessandro Lenci (UniversitÓ di Pisa) Maria Pia Lo Duca (UniversitÓ di Padova) Francesco Urzý (Parlamento Europeo)

RIFERIMENTI BIBLIOGRAFICI

De Marneffe Marie-Catherine and Christopher Potts, Forth. Developing linguistic theories using annotated corpora. In Nancy I. and J. Pustejovsky, eds., The Handbook of Linguistic Annotation. Chiari, I. 2012. Il dato empirico in lessicografia: dizionari tradizionali e collaborativi a confronto, Bollettino di Italianistica. Per Tullio De Mauro, II, pp. 94-125. Hanks, 2012 P. Lexical Analysis: Norms and Exploitations, The MIT Press. Jezek E. (2006). Argument Structure, Verb Patterns and Dictionaries. In: C. Marello (et al.). Euralex XII Proceedings. Torino, UniversitÓ di Torino, 30 agosto -2 settembre 2006, p. 1169-1180, Edizioni dell'Orso.



More information about the Corpora mailing list