|
Metodi
Statistici per la Linguistica Computazionale
Universita' Ca Foscari
Massimo Poesio
|
|
Lunedi' 29 Settembre - Venerdi' 3 Ottobre 2003
Ca'
Garzoni
Indirizzo Web:
cswww.essex.ac.uk/staff/poesio/Courses/Venezia/Stat_NLP
Come e dove contattare il docente
Programma del corso
Testi
Descrizione del
corso
Questo
corso e' un'introduzione ai metodi statistici nella linguistica
computazionale. Dopo aver introdotto i motivi per l'usodi queste tecniche,
nel corso verranno introdotti alcuni concetti base di probabilita'
e statistica e metodi per l'uso dei corpora, l'uso degli n-grammi per
applicazioni come la predizione della parola successiva, il tagging con
metodi statistici, l'acquisizione del lessico, e tempo permettendo, le
grammatiche probabilistiche ed il parsing statistico. .
Docente
Massimo Poesio
poesio at essex dot ac dot uk
Ufficio: Ca' Garzoni
Telefono:
041-234 94 64
Orario
del corso:
Lunedi' - Venerdi', 10:30-13:00,
14:30-17:00 (lezioni); 17:00-18:00 (laboratori)
Syllabus
Programma
|
Classe
|
Argomento
|
Testi
|
|
1
[29 Settembre]
|
Metodi
statistici in Linguistica: motivazioni.
Corpora
ed annotazione.
Fondamenti di
probabilita' e statistica.
Prima
esercitazione: Fondamenti di probabilita'.
|
Abney
(1995)
Krenn
& Samuelsson
|
|
2
[30 Settembre]
|
Predizione
delle parole, N-grammi, smoothing.
Spelling
correction, Bayesian inference, il Noisy Channel Model
Laboratorio
1: Text Processing in Linux, simple n-gram computation.
|
Jurafsky
& Martin, capitolo 6.
Jurafsky
& Martin, capitolo 5
Ken
Church: N-grams.
|
|
3
[1 Ottobre]
|
POS
tagging: Tagsets. Brill tagger. HMM tagging.
|
Jurafsky
& Martin, capitolo 8.
|
|
4
[2 Ottobre]
|
Valutazione
di sistemi NLP.
Il
lessico. WordNet. Metodi per la disambiguazione lessicale:
Lesk, Naive Bayes, Yarowski. Metodi per l'acquisizione di informazione
lessicale, Latent Semantic Analysis.
|
Jurafsky & Martin, capitolo 16 e 17.
Manning
and Schuetze, capitoli 7 e 8.
|
|
5
[3 Ottobre]
|
Grammatiche
probabilistiche e parsing statistico.
|
Jurafsky
& Martin, capitolo 12.
|
Testi:
Krenn,
B. and Samuelsson, C. The Linguist's Guide to Statistics (Don't Panic).
Jurafsky,
D. e Martin, J. Speech and Language Processing.
Prentice-Hall, 2000.
Manning
and Schuetze, Foundations of Statistical NLP, MIT Press
Links
utili:
Chris
Manning - Resources for Statistical NLP
WordNet
|