I contenuti generati e condivisi sui social media sono risorse irrinunciabili per comprendere le opinioni degli utenti e avere una visione accurata dello stato emotivo della rete.
Il motore semantico alla base di Blogmeter segue gli sbalzi di umore attraverso tecnologie di interpretazione automatica del linguaggio (Natural Language Processing) e di classificazione delle opinioni espresse in rete (Sentiment Analysis).

Il processo di comprensione automatica delle opinioni realizzato dal nostro tool di Sentiment Analysis si articola in tre fasi: l’esame di porzioni di testo e indicatori testuali come la punteggiatura, l’estrazione del mood positivo e negativo dai messaggi mediante la previa analisi del testo e la classificazione dei documenti secondo una polarità positiva, negativa o mixed. Al calcolo della polarità il motore semantico di Sentiment Analysis associa, inoltre, un punteggio che descrive l’intensità con cui l’opinione è espressa nel documento (High, Medium, Low).


Se da un lato la varietà e versatilità del linguaggio lo rendono il principale mezzo di espressione dei nostri stati d’animo, dall’altro questa sua complessità pone difficili sfide all’interpretazione automatica.
Per affrontare queste difficoltà il nostro team di esperti ha sviluppato nel corso degli anni due tipologie di risorse linguistiche: lessici del sentiment e insiemi di regole sintattico-semantiche. Nel primo caso si tratta di risorse che arricchiscono un’ampia raccolta di parole ed espressioni multiparola con informazioni sulla loro valenza polare (positiva o negativa) e sulle emozioni che comunicano (gioia, tristezza, paura, rabbia, ecc.).

Per garantire la massima precisione di analisi, le risorse lessicali integrano un sistema capace di selezionare la corretta polarità delle espressioni linguistiche a seconda del dominio semantico di applicazione e del contesto linguistico d’uso. In questo modo, ad esempio, parole come lento e veloce che in un dominio musicale non avranno una valenza polare, “la canzone che inzia è lenta“, saranno particolarmente rilevanti in un dominio tecnologico “il pc che ho comprato è lento“.

La comprensione automatica di espressioni emotive complesse avviene invece attraverso l’applicazione di regole sintattico-semantiche capaci di interpretare fenomeni linguistici come la negazione “non c’è niente di positivo“, l’inversione di polarità “privo di bellezza“, la quantificazione “mi sento poco bene“, la polarità in alcuni usi di parole solitamente neutre “diminuzione dei prezzi” e “aumento dei prezzi” e, viceversa, l’annullamento della polarità in usi di parole solitamente polari come straordinario in “riunione straordinaria” e “apertura straordinaria“.

Vanessa Nardone – linguista computazionale