Metodi Statistici per la Linguistica Computazionale

Universita' Ca Foscari

Massimo Poesio

 


Lunedi' 29 Settembre - Venerdi' 3 Ottobre 2003

Ca' Garzoni


Indirizzo Web: cswww.essex.ac.uk/staff/poesio/Courses/Venezia/Stat_NLP


Come e dove contattare il docente

Programma del corso

Testi


Descrizione del corso

Questo corso e' un'introduzione ai metodi statistici nella linguistica computazionale. Dopo aver introdotto i motivi per l'usodi queste tecniche, nel corso verranno introdotti alcuni concetti base  di probabilita'  e statistica e metodi per l'uso dei corpora, l'uso degli n-grammi per applicazioni come la predizione della parola successiva, il tagging con metodi statistici, l'acquisizione del lessico, e tempo permettendo, le grammatiche probabilistiche ed il parsing statistico. .

Docente

Massimo Poesio poesio at essex dot ac dot uk


Ufficio: Ca' Garzoni

Telefono: 041-234 94 64

 

Orario del corso:

Lunedi' - Venerdi', 10:30-13:00, 14:30-17:00 (lezioni); 17:00-18:00 (laboratori)



Syllabus


Programma

Classe

Argomento

Testi

1

[29 Settembre]

Metodi statistici in Linguistica: motivazioni. 

Corpora ed annotazione. 

Fondamenti di probabilita' e statistica.

 

Prima esercitazione: Fondamenti di probabilita'.

Abney (1995)


Krenn & Samuelsson

 

 

 

2

[30 Settembre]

Predizione delle parole, N-grammi, smoothing.

 

Spelling correction, Bayesian inference, il Noisy Channel Model

 

Laboratorio 1: Text Processing in Linux, simple n-gram computation.

Jurafsky & Martin, capitolo 6.

 

Jurafsky & Martin, capitolo 5

 

Ken Church: N-grams.

3

[1 Ottobre]

POS tagging: Tagsets.  Brill tagger. HMM tagging.

 


Jurafsky & Martin, capitolo 8.



4

[2 Ottobre]

Valutazione di sistemi NLP.

 

Il lessico. WordNet.  Metodi per la disambiguazione lessicale: Lesk, Naive Bayes,  Yarowski. Metodi per l'acquisizione di informazione lessicale, Latent Semantic Analysis. 

Jurafsky & Martin, capitolo 16 e 17. 

 

Manning and Schuetze, capitoli 7 e 8.

5

[3 Ottobre]

Grammatiche probabilistiche e parsing statistico.

 

Jurafsky & Martin, capitolo 12.



Testi:

Krenn, B. and Samuelsson, C. The Linguist's Guide to Statistics (Don't Panic).

Jurafsky, D. e Martin, J. Speech and Language Processing.  Prentice-Hall, 2000.

Manning and Schuetze, Foundations of Statistical NLP, MIT Press

 

Links utili:

Chris Manning - Resources for Statistical NLP

WordNet