Abordări bazate pe învățare automată pentru analiza multi-nivel a sentimentelor din recenziile În limba Română

Analiza sentimentelor a devenit din ce în ce mai relevantă în mediile comerciale, datorită impactului crescut al recenziilor asupra deciziilor de cumpărare în ultimii ani. Această cercetare examinează detaliat eficacitatea abordărilor de învățare automată și învățare profundă în analiza sentimentelor, utilizând recenziile în limba română ca studiu de caz, pentru a evalua utilitatea lor practică. Studiul include o analiză detaliată pe mai multe niveluri, acoperind documentul, propoziția și aspectul. Contribuțiile principale ale lucrării constau în explorarea detaliată a modelelor multiple de analiză a sentimentelor la trei niveluri textuale diferite și îmbunătățirile aduse modelelor standard. De asemenea, este introdus un set de date echilibrat, conținând recenzii românești din douăsprezece categorii de produse.

Rezultatele arată că, la nivelul documentului, tehnicile de învățare profundă supravegheată oferă cele mai bune performanțe, în special un model de rețea neuronală convoluțională care obține o valoare AUC de 0,93 pentru clasificarea binară și un scor mediu ponderat F1 de 0,77 într-o clasificare multiplă cu cinci clase țintă), deși necesită mai multe resurse. La nivelul propoziției, se obțin rezultate favorabile, în ciuda complexității crescute a identificării sentimentelor, modelul cel mai performant fiind regresia logistică, cu un scor mediu ponderat F1 de 0,77 într-o sarcină de clasificare a polarității cu trei clase. La nivelul aspectului, se remarcă rezultate promițătoare atât în extracția termenilor de aspect, cât și în detectarea categoriilor de aspect, sub formă de clustere de cuvinte coerente și ușor de interpretat, încurajând astfel explorarea ulterioară a analizei sentimentelor bazate pe aspecte pentru limba română.

Articol publicat în:  Multidisciplinary Digital Publishing Institute (MDPI)

ro_RO
Scroll to Top