Hoppa till huvudinnehåll
RISE logo

Studier av opinioner och samhällen i webbdata

Projektet utvecklar och tillämpar språkteknologiska verktyg för att bedöma validitet, tillförlitlighet och representativitet i textdata som hämtas från Internet. Syftet med verktygen är att validera och underlätta användningen av webbdata som ett komplement till traditionella opinionsundersökningar.

Användningen av språkteknologiska verktyg tillämpade på webbdata har gett forskare inom humaniora och samhällsvetenskap nya innovativa sätt att studera det ständigt föränderliga offentliga opinionslandskapet. Detta användande av webbdata ger dock upphov till diverse frågor som rör urvalskriterier, hanterandet av mätfel, och förekomsten av fördomar i textdata på Internet.

Projektet syftar till att validera användningen av webbdata som ett komplement till traditionella opinionsundersökningar. Vi gör detta genom att först svara på frågan "Vilken textdata finns faktiskt tillgänglig på Internet?". Vi samlar sedan in textdata med hjälp av traditionella undersökningsexperiment för att svara på frågan "Hur ser representativa data verkligen ut?" Slutligen utvecklar vi beräkningsmetoder som kan svara på frågor som "Är denna textinformation relevant för mina ändamål?", "Är denna textinformation tillförlitlig?" Och "Är denna textinformation representativ för en befolkning"?

Resultatet av det föreslagna projektet kommer att bidra med nya verktyg och metoder för att möjliggöra användandet av webbdata som ett komplement till traditionella opinionsundersökningar.


Sammanfattning

Projektnamn

Studier av opinion i webbdata

Status

Pågående

Område

Data Science

RISE roll i projektet

Deltagare

Projektstart

Varaktighet

2021

Partner

University of Bergen, the University of Gothenburg, GESIS Leibniz Institute for the Social Sciences, Södertörn University