BAANBREKEND ONDERZOEK NAAR DAT IS WAT ZE ZEI

De verrassende effectiviteit en levensduur van de nu legendarische dat is wat zij zei grap, onlangs weer populair gemaakt met de hulp van help Het kantoor , heeft meer dan miljoenen mensen voorzien van een reflexmatige reactie op een informeel gesprek. Het heeft nu een nieuw niveau van sociale betekenis bereikt, door serieus taalkundig onderzoek te inspireren. Het komt in de vorm van een onderzoekspaper genaamd Dat is wat ze zei: Double Entender-identificatie , geschreven door twee studenten informatica, Chloe kiddon en Yuriy Bruno .

In hun paper schetst het paar hun creatie van de Dubbelzinnigheid via zelfstandig naamwoordoverdracht of DEviNT aanpak die automatisch identificeert dat is wat ze zei (TWSS) grappen. Ze noemen hun aanpak metaforische analyse, die een geheel eigen dubbele betekenis heeft, en is gebaseerd op het wegen van bepaalde woorden als sexier dan andere. Het team heeft verschillende sexy zelfstandige naamwoorden en werkwoorden gewogen en vervolgens hun algoritme uitgevoerd.

In hun onderzoek ontdekte het paar ook enkele interessante regels voor TWSS-grappen. Bijvoorbeeld het risico om een TWSS-grap verkeerd op te roepen. Uit hun studie:

In een sociale omgeving zijn de kosten om te zeggen wat ze ongepast zei bijvoorbeeld hoog, terwijl de kosten om het niet te zeggen wanneer het gepast was, te verwaarlozen zijn.

Om dit aan te pakken en betere resultaten te behalen, gebruikte het team een leeralgoritme. Dit zorgde er onder andere voor dat het aantal fout-positieven 100 keer hoger was dan het aantal fout-negatieven.

Na DEviNT door een reeks vooraf geïdentificeerde TWSS-grappenmateriaal en willekeurige citaten te hebben geleid. In hun test gebruikten ze 1,5 erotische zinnen en 57.000 niet-erotische zinnen. Het team zegt een slagingspercentage van meer dan 71,4% te hebben behaald. Hoewel dat misschien niet veel lijkt, zegt het team dat ze met een grotere dataset resultaten zouden verwachten die dichter bij 99,5% liggen. Bovendien leverde DEviNT enkele interessante resultaten op. Nogmaals, uit het onderzoek:

DEviNT retourneerde 28 van dergelijke zinnen (allemaal gelijk voor hoogstwaarschijnlijk een TWSS), waarvan 20 echte positieven. Echter, 2 van de 8 valse positieven zijn in feite TWSS's (ondanks de negatieve testgegevens): Ja, geef me alle room en hij is weg. en ja, maar zijn gaatje stinkt soms echt.

Sommigen zullen misschien afbreuk doen aan dit onderzoek en het gewoon een leeuwerik noemen en van weinig waarde. Dit zou een low-blow-aanval zijn, omdat zelfs de onderzoekers hun werk omschrijven als een moeilijk probleem met het begrijpen van natuurlijke taal. (Dat is wat zij zei.)

( nieuwe wetenschapper via De ontsnapper )