Uno dei problemi che deve affrontare la comunità dei ricercatori nel campo dell’NLP in Italia è la cronica scarsezza di risorse linguistiche comuni e riutilizzabili.
Il 2007, dopo Evalita (la gara di valutazione di programmi di analisi sintattica, i cui risultati sono ora disponbiili), porta una seconda buona notizia, l’avvio del progetto Senso Comune.
Leggendo quanto riportato sulla pagina web, ci sentiamo di essere ottimisti:
“Senso Comune è il progetto per la costruzione di una base di conoscenza linguistica dell’italiano.
La base di conoscenza verrà acquisita con la cooperazione dei parlanti attraverso il Web.
Sarà una risorsa a disposizione di tutti, sia per la consultazione online che per l’uso nei sistemi informatici.”
L’idea sembra vincente da due punti di vista:
– si immagina una realizzazione cooperativa della risorsa (sfruttando il più semplice e efficace degli strumenti 2.0, il wiki)
– ci si pone l’obiettivo di creare una risorsa aperta e disponibile a tutti
E’ chiaro che di lavoro da fare ce n’e’ molto, e che lunga e tortuosa è la strada per arrivare a mantenere le promesse ambiziose descritte, per esempio, in questo articolo di Repubblica. Tuttavia, è un buon inizio…