Uiterlijk
1 september 2012 wil het Meertens Instituut van start gaan met het
zogenaamde TINPOT-project: een afstudeerproject van 6 maanden naar
Taal, Identiteit, Netwerken en Produktgeruchten Op Twitter, dat moet
resulteren in een module met analyse-software en één gezamenlijke
of twee afzonderlijke master-scripties.
Het Meertens
Instituut zoekt voor dit afstudeerproject
TINPOT:
A. Een
master-student/stagiair op het gebied van computer
science met programmeer-ervaring en kennis van natural language
processing
B. Een
master-student/stagiair op het gebied van (socio)linguistiek,
etnologie, antropologie of culturele studies
C. Een
student-assistent in de geesteswetenschappen die kan annoteren en
testgegevens kan evalueren
Omschrijving van het
project TINPOT
(Taal,
Identiteit, Netwerken en Produktgeruchten Op Twitter):
Veel onderzoek op
het Meertens Instituut staat van oudsher in het teken van
veranderlijkheid, zoals onderzoek naar dialectvariatie, jongerentaal
en mondelinge overlevering van verhalen en liederen. Met de
digitalisering van de samenleving wordt het steeds aantrekkelijker om
analyses toe te passen op grote hoeveelheden digitale data die al
voorhanden zijn. Twitter als sociaal medium herbergt een enorm
reservoir aan talige data en informeert van seconde tot seconde over
sociaal gedrag en meningen/oordelen. Het commerciële
bureau Teezir, waarmee wordt samengewerkt, doet in opdracht van
bedrijven reeds onderzoek naar produktreputaties in sociale media.
Er kan aan de hand
van een grote hoeveelheid trainingsdata een module ontwikkeld worden
die in staat is om op basis van associaties die taalgebruik oproepen
uit te maken in welke leeftijdscategorie iemand valt, en of men een
man of een vrouw is. Uit metadata valt op te maken hoe groot iemands
netwerk is, en aan tweetgedrag of iemand een opinieleider of een
trendvolger is. Vervolgens kunnen produktgeruchten gevolgd worden van
begin tot eind. Produktgeruchten behoren ten dele tot de
volksverhalen die we broodjeaapverhalen noemen (bijv. over beton in
eikenhouten meubelen, kankerverwekkende toegevoegde E-stoffen,
slachtafval in fricadellen, regenwormen in hamburgers van McDonald's,
schadelijke straling van mobiele telefoons of zendmasten etc.). De
module kan dan analyseren in welke groepen bepaalde produktgeruchten
circuleren (leeftijdsgroepen, mannen, vrouwen) en langs welke
netwerken en kanalen. Er kan een sentimentanalyse worden losgelaten
op de produktgeruchten: welke positieve of negatieve oordelen worden
er geveld? Hoe stabiel blijven de geruchten? Is het steeds een
kwestie van letterlijk retweeten, of veranderen mensen de boodschap
of voegen ze een commentaar toe (bijv. lol of een mededeling met een
#)? De variatie van mededelingen op Twitter vertoont zekere
overeenkomsten met variatie in de mondelinge overlevering van
geruchten.
De analyses bieden meer
zicht op hoe produktgeruchten zich verspreiden, in welke groepen,
wiens mening belangrijk gevonden wordt, welke imago's er aan
produkten verbonden zijn en hoe de geruchten kunnen veranderen. Het
onderzoek kan leiden tot aanbevelingen hoe bedrijven zich
kunnen/moeten wapenen tegen bepaalde negatieve geruchten.
Voor de module is nog geen
voorwerk gedaan, maar er bestaan bij Teezir al wel technieken om
produktgeruchten te monitoren.
Het project staat
gepland als een stage en afstudeerproject voor 6 maanden. Er wordt
een module ontwikkeld en getraind, die de volgende stappen kan maken
op basis van een grote hoeveelheid Nederlandstalige tweets:
- analyse taal op
leeftijdscategorie
- analyse taal op geslacht
- analyse op attitude:
opinieleider of trendvolger
- analyse van het netwerk
- volgen van
produktgeruchten (langs welke groepen en kanalen gaan de verhalen,
welke sentimenten spelen er, welke variatie ontstaat er?)
De deliverable is
een verrijkende module bij een bestaande commerciële tool van
Teezir. De module kan gebruikt worden voor onderzoek aan de
Universiteit Twente, het Meertens Instituut en bij Teezir.
Meer informatie over de
gezochte studenten:
ad. A. De
master-student op het gebied van computer
science, met programmeer-ervaring en
kennis van natural language processing,
text mining
en information retrieval,
loopt voor 6 maanden stage op het Meertens Instituut, uiterlijk vanaf
1 september. De student ontwikkelt i.s.m. de begeleiders en de hierna
genoemde student een analyse-module voor Twitter en schrijft daarover
een master-scriptie. De stagevergoeding bedraagt 1000 euro bruto per
maand bij een fulltime stage.
ad. B. De master-student
op het gebied van (socio)linguistiek, etnologie, antropologie of
culturele studies loopt voor 6 maanden stage op het Meertens
Instituut, uiterlijk vanaf 1 september. De student helpt i.s.m. de
begeleiders en de hiervoor genoemde student mee een analyse-module
voor Twitter te ontwikkelen en schrijft over de onderzoeksresultaten
een master-scriptie. De stagevergoeding bedraagt 1000 euro bruto per
maand bij een fulltime stage.
ad. C. Een
student-assistent in de geesteswetenschappen die kan annoteren en
testgegevens kan evalueren, die uiterlijk 1 september kan beginnen.
De module wordt getraind op een bestaand corpus aan tweets, en voert
vervolgens analyses uit op nieuwe tweets. Voor 6 maanden zorgt de
student voor annotaties bij de test-tweets (koppelen van tweets aan
geslacht, leeftijd, volgers, retweets, produktgeruchten) en evalueert
de resultaten van analyses op nieuw materiaal (kloppen de analyses
van geslacht, leeftijd, volgers, retweets, produktgeruchten?). Het
schrijven van een master-scriptie is in dit geval niet vereist. De
verdiensten bedragen 1800 euro bruto per maand bij een fulltime
aanstelling.
De begeleiders zijn:
Theo Meder (Meertens
Instituut)
Dolf Trieschnigg (Meertens
Instituut, Universiteit Twente)
Dong Nguyen (Meertens
Instituut, Universiteit Twente)
Marc van Oostendorp
(Meertens Instituut, Universiteit Leiden)
Leonie Cornips (Meertens
Instituut, Universiteit Maastricht)
Thijs Westerveld (Teezir)
Dit team wordt desgewenst
aangevuld met scriptiebegeleiders van de universiteit(en)
Voor meer informatie kan
men contact opnemen met Theo Meder: 020-4628558 of
Theo.Meder@Meertens.knaw.nl
Sollicitatiemails met
motivatie, en CV inclusief specificatie van academische opleiding(en)
en cursussen, kunnen ook naar Theo.Meder@Meertens.knaw.nl gestuurd
worden.
Deadline: donderdag 12
juli 2012.