Uno dei problemi che deve affrontare la comunità dei ricercatori nel campo dell’NLP in Italia è la cronica scarsezza di risorse linguistiche comuni e riutilizzabili.

Il 2007, dopo Evalita (la gara di valutazione di programmi di analisi sintattica, i cui risultati sono ora disponbiili), porta una seconda buona notizia, l’avvio del progetto Senso Comune.

Leggendo quanto riportato sulla pagina web, ci sentiamo di essere ottimisti:

“Senso Comune è il progetto per la costruzione di una base di conoscenza linguistica dell’italiano.
La base di conoscenza verrà acquisita con la cooperazione dei parlanti attraverso il Web.
Sarà una risorsa a disposizione di tutti, sia per la consultazione online che per l’uso nei sistemi informatici.”

L’idea sembra vincente da due punti di vista:

– si immagina una realizzazione cooperativa della risorsa (sfruttando il più semplice e efficace degli strumenti 2.0, il wiki)

– ci si pone l’obiettivo di creare una risorsa aperta e disponibile a tutti

E’ chiaro che di lavoro da fare ce n’e’ molto, e che lunga e tortuosa è la strada per arrivare a mantenere le promesse ambiziose descritte, per esempio, in questo articolo di Repubblica. Tuttavia, è un buon inizio…