Onderzoek Alexander Hogenboom en Flavius Frasincar leidt tot P*-publicatie

Het wetenschappelijke artikel “Using Rhetorical Structure in Sentiment Analysis” van Alexander Hogenboom en Flavius Frasincar, econometristen aan Erasmus School of Economics (co-auteurs Franciska de Jong en Uzay Kaymak), is onlangs geaccepteerd voor publicatie in Communications of the ACM, een van de meest prestigieuze tijdschriften op het gebied van informatietechnologie en met een P*- kwalificatie op de ERIM Journals List. ​

In het artikel doen Hogenboom en Frasincar verslag van hun onderzoek naar een geautomatiseerde benadering voor het achterhalen van meningen in teksten door middel van de analyse van de retorische structuur van teksten. Met meer dan twee miljard prosumenten, dat wil zeggen, gebruikers die zowel data produceren als consumeren, is het Web uitgegroeid tot een van de invloedrijkste informatiebronnen. Tegenwoordig wordt in een vijfde deel van alle tweets en in een derde deel van alle blogberichten een product of een merk besproken. De huidige stroom van door gebruikers geproduceerde content over producten en merken en het feit dat Hogenboom en Frasincar in staat zijn de geuite meningen in deze content automatisch te analyseren, kan zeer gunstig zijn voor zowel bedrijven als consumenten. Door in real time te achterhalen welke meningen ten grondslag liggen aan teksten, kunnen bedrijven op basis daarvan hun strategieën op het gebied van marketing en public relations aanscherpen. Tegelijkertijd kunnen consumenten op die manier toegang krijgen tot actuele en eerlijke meningen van andere consumenten.

 

Rhetorical Structure Theory

In tegenstelling tot de meeste bestaande benaderingen, die gebaseerd zijn op een bag-of-words-model om de polariteit van tekst te bepalen, gaan de onderzoekers in hun werk uit van de retorische structuur van tekst om meer inzicht te verkrijgen in de mening die erin naar voren wordt gebracht. Daarbij passen ze de werkwijze van de Rhetorical Structure Theory toe. Deze benadering leidt tot een boomachtige weergave van een tekst, met kernen die verwijzen naar belangrijke informatie uit de tekst en satellieten die minder relevante informatie weergeven. Alexander Hogenboom en Flavius Frasincar maken gebruik van een optimalisatiealgoritme voor deeltjeszwermen om te bepalen wat het belang is van kernen en satellieten in verschillende soorten retorische relaties voor het overbrengen van de mening van een tekst. Daarmee kan tegelijkertijd de positie van tekstsegmenten in de hiërarchische retorische structuur van de tekst worden meegewogen. De uitgevoerde experimenten, waarin een reëel corpus van Engelse filmrecensies werd gebruikt, tonen aan dat een fijnmazige, diepe analyse van de retorische structuur een significant betere analyse van meningen mogelijk maakt dan het traditionele bag-of-words-model en ook nauwkeuriger is dan een oppervlakkige, grofkorrelige analyse van de retorische structuur van een tekst. Daarnaast laten de onderzoekers zien dat de analyse van de retorische structuur op zinsniveau accurater is voor de analyse van meningen dan een analyse op paragraaf- of tekstniveau.

Meer informatie

Ronald de Groot, +31 10 408 17 62 en mobiel +31 6 53 64 18 46, email: rdegroot@ese.eur.nl

Vergelijk @count opleiding

  • @title

    • Tijdsduur: @duration
Vergelijk opleidingen