Verhuisd



Let op: Neder-L is verhuisd naar www.neerlandistiek.nl

maandag 23 november 2015

Recursie en evolutie van taal



Vorige week besteedde Marc van Oostendorp in een blogpost aandacht aan een recent artikel in Trends in Cognitive Sciences van onder andere de Utrechtse taalkundigen Martin Everaert en Riny Huijbregts. Onder die blogpost ontstond nogal wat discussie. In het onderstaande bericht reageert Huijbregts op het commentaar van Mark Dingemanse (Max Planck Instituut) en Gosse Bouma (Groningen). 

De kritiek van Mark Dingemanse (hier voortaan MD genoemd) richt zich uitsluitend op evolutie van taal. Evolutie is in ons artikel geen hoofdmoot. Het komt slechts tweemaal voor in de hoofdtekst (sommige “outstanding questions” stellen vragen die soms deels betrekking hebben op evolutie, maar dat zijn vragen voor de toekomst).

De eerste keer (p4) wordt gezegd dat verschillende modules van taal (i.c. cognitieve en sensomotorische systemen) hun eigen evolutionaire geschiedenis hebben en dat mede daarom de koppeling van cognitie en perceptie/articulatie in natuurlijke taal een niet-triviaal en interessant probleem is. Deze stelling is behoorlijk algemeen en niet bepaald schokkend. Zouden er werkelijk biologen of anderen met enig inzicht in taal zijn die hier anders over zouden kunnen denken….?     

De tweede keer (p12) komt evolutie van taal voor in één enkele zin. Het is deze zin en deze zin alleen (“The evolutionary puzzle, therefore, lies in working out how this apparent discontinuity arose, demonstrating how the basic property fits this discontinuity both to the known evolutionary facts and evolutionary theory”) die MD heeft aangezet tot een reactie die m.i. misleidend is maar vooral irrelevant.

Taal is complex en evolutie van taal is een wezenlijk groot probleem. Deelcomponenten van taal kennen (geheel of deels) verschillende evolutionaire ontwikkelingen voor verschillende aspecten. Daarom zal beter inzicht in de aard van taal (het fenotype taal) hopelijk bijdragen tot een snellere oplossing van het evolutie vraagstuk van taal als dit überhaupt mogelijk blijkt. Taal is zoals gezegd complex met vele kenmerken, maar één zo’n kenmerk is “discrete oneindigheid” (discrete infinity). Andere eigenschappen worden niet ontkend maar deze ene eigenschap wordt hier belicht. Taal is “discreet” want zinnen zijn opgebouwd uit woorden en woordgroepen: er zijn 5-woord zinnen maar geen 2.5-woord zinnen, of 1.25-woord zinnen, of 0.625 woord-zinnen, etc. Taal is geen “continuous” systeem. Taal is ook “oneindig” want er bestaat geen langste welgevormde zin. Neem een willekeurige welgevormde zin. Deze zin kun je met dezelfde regels zonder deze ook maar iets te veranderen langer maken (bv. “… let op die vrouw d’r baas”           => “… let op die vrouw d’r baas z’n dochter”  => “… let op die vrouw d’r baas z’n dochter d’r vriend” => “… let op die vrouw d’r baas z’n dochter d’r vriend z’n hond”). Er is geen niet-willekeurige grens op lengte.

Dit recursieve vermogen dat verantwoordelijk is voor discrete oneindigheid is inderdaad slechts een van de zeer vele aspecten van natuurlijke taal. Wij zeggen niet dat met deze eigenschap alles gezegd wordt over taal. Maar het is een kenmerk dat heel speciaal is en menselijke taal onderscheidt van de vele communicatiesystemen van andere dieren. De fameuze “waggle dance” van bijen of het navigatie systeem van mieren zijn bv. niet “discreet.” Het recursieve karakter betreft hier continue systemen (differentiatie en integratie). Bovendien is niet elke discrete recursie relevant. Wat typisch voor natuurlijke taal is is “phrase-structural” recursie: woordgroepen en de hierarchische structuur van deze woordgroepen. Een specifiek voorstel voor het genereren van deze structuren is de operatie Merge. Dit is gewoon een empirische hypothese die dit aspect van taal verklaart (wij noemen dit de “Basic Property”), en die aan de basis ligt van veel probleemoplossend vermogen. Wij zeggen dat dit aspect typisch is voor menselijke taal, dat dit aspect ons onderscheidt van dieren. MD zegt dat er andere onderscheidende kenmerken zijn en dat mensen in tegenstelling tot dieren oogwit hebben, kunnen gebaren en Huh? kunnen zeggen. Dat is allemaal waar, maar so what…? Misschien zijn deze unieke eigenschappen nuttig voor het gebruik van taal, communicatie, maar geen enkel structureel aspect van taal valt af te leiden uit deze “discontinuiteiten” (als ze dit al zijn). Zeker nog wat meer oogwit en we verplaatsen het werkwoord niet meer….? Yeah, dream on…! De vergelijking oogwit/recursie loopt overigens mank op het punt waar het hier om gaat. Waarom zou bv. een graduele evolutie van oogwit onmogelijk zijn? Of het verlies van een staart bij de grote apen? Dit zijn geen discontinuiteiten in de relevante zin maar momenten op een continue schaal: minder/meer oogwit, beweging, staart. Er is echter geen minder/meer recursie. Dat is precies het punt dat gemist wordt.

Evolutie van taal is interessant en blijft een formidabel probleem. Maar (en dit is belangrijk) elke uitkomst laat onverlet de boodschap van ons artikel. We zien menselijke taal als deel van de biologische werkelijkheid. Taal is deels een biologisch systeem en dat deel, ons taalvermogen, wordt typisch gekenmerkt door gevoeligheid voor hierarchische structuur van woordgroepen. Structuur is primair en lineaire volgorde is secundair (maar noodzakelijk voor expressie, en alleen voor expressie). Deze asymmetrie heeft natuurlijk gevolgen voor de definitie van menselijke taal, en benaderingen van taalverwerving, taalgebruik en evolutie van taal. Maar het taalvermogen van de moderne mens kan bestudeerd worden zonder enige bekommernis om de evolutie ervan. Dat is eigenlijk standaard het geval (er zijn interessante uitzonderingen zoals Gehrings Pax6 onderzoek naar de ontwikkeling van het oog). Soms kan een empirisch resultaat aanleiding geven tot een pregnante vraag. Zoals hier. De vraag is simpel. Hoe ziet een graduele evolutie voor een alles-of-niets kenmerk er uit? Er bestaat niet zoiets als halve recursie. De stap van 1, 2, 3, ….., 999999 naar onbepaald groot is hetzelfde als de stap van 1, 2, 3 naar onbepaald groot want de recursieve stap moet in al deze gevallen op een ander moment maar op dezelfde manier gemaakt worden. De eerste route is niet meer gradueel dan de tweede. De overgang verloopt altijd “catastrofaal.”

Chomsky en andere generatieve linguisten zeggen niet dat “taal” plotseling is ontstaan (“Big Bang”) zoals sommigen, bv. Russel Gray, directeur van MPI Jena, maar ook anderen niet ophouden te beweren. Dit zijn onzinnige beweringen die alleen iets zeggen over de sociowetenschappelijke status van taalgelieerde disciplines. We geven enkel argumenten voor een recursieve operatie die hierarchisch gestructureerde woordgroepen oplevert. Naast alle andere culturele, pragmatieke, communicatieve en de zillion andere aspecten die MD wil onderzoeken (ga vooral je gang en leef je uit) is recursiviteit gewoon een aspect dat ook hij onder ogen moet zien. Dat ene aspect geeft echter WEL aanleiding tot een niet oninteressante vraag naar evolutie van taal. Wij zeggen enkel dat wij niet inzien hoe DIT aspect (namelijk recursiviteit) gradueel kan zijn ontwikkeld. Een vraag die MD kennelijk wel intrigeert maar hem en anderen met stomheid slaat. Huh?

Discussie wordt wat mij betreft zinvol als MD zou kunnen aantonen dat recursie in menselijke taal niet bestaat (en hij de “onbegrensde” hierarchische structuur van woordgroepen anders dan met computationele mechanismen kan verantwoorden), of tenminste dat er een graduele evolutie van recursie mogelijk is. Maar misschien vraag ik hier wel te veel…

Gosse Bouma geeft m.i. wel zeer interessante informatie. Zijn aandeel in de discussie geeft (het begin van) kwantitatieve steun voor het Poverty of Stimulus (POS) probleem van parasitaire gaten: Hoe kunnen we rijke en uniforme kennis vergaren op grond van uiterst beperkt, mager en gefragmenteerd taalaanbod? Of, Hoe komt het dat onze kennis van taal veel verder reikt dan onze summiere talige ervaring? Wij hebben duidelijke intuities, zelfs over dingen die wij mogelijk nooit eerder gehoord hebben. De dozijn relevante echte voorbeelden gevonden in een 4.5 milliard woorden tellend corpus zijn te schaars om taalverwerving zinvol te kunnen zien als het leren van het ene woord na het andere, en de ene constructie na de andere. Dit laatste is het naïve idee van een andere MPI directeur, Tomasello, en consorten, weerlegd in o.a. het zorgvuldige werk van Charles Yang, maar blijkbaar een onuitroeibaar relict van het empirisme. Marc van Oostendorp rekent ons voor dat deze constructies “eigenlijk” niet voorkomen in het empirische taalaanbod voor een realistisch model van taalverwerving. Een kind heeft mogelijk 125 jaar nodig om deze zinnen tegen te komen. Maar dit dozijn zinnen is zeker niet voldoende in een realistisch verwervingsmodel. Deze constructies zijn namelijk minder dan 0,000005% van het taalaanbod. We gaan er hierbij van uit dat de gemiddelde zinslengte 20 woorden bedraagt. Een onwaarschijnlijk hoog gemiddelde, dus het percentage zal nog lager uitvallen. Wel is het zo dat Gosse slechts één combinatie van twee voorzetsels gecontroleerd heeft. Ervan uitgaande dat er zo’n 50-100 combinaties maximaal mogelijk zijn, komen we dan uit op een percentage van hooguit 0.00025 – 0.0005. De conclusie lijkt gerechtvaardigd dat parasitaire constructies virtueel afwezig zijn in het taalaanbod. We hebben kennis van deze constructies zonder ze ooit geleerd te hebben, mogelijk zonder ze zelfs ooit te zijn tegengekomen. Dit is een fascinerende uikomst die krachtig steun verleent aan het idee dat er een soort-bepaald (uniek menselijk) en domein-specifiek (uniek talig) systeem moet zijn dat taalverwerving mogelijk maakt. De biologische kern van taal.

Interessant is dat het bestaan van deze constructies al op theoretische gronden voorspeld is (Lectures on Government and Binding, p. 333). Zoiets is redelijk zeldzaam, zelfs in de natuurwetenschappen… Een empirisch zeldzaam voorkomende verschijnsel waarvan het bestaan op conceptuele gronden verklaard wordt en dat het POS probleem voor taalverwerving duidelijk illustreert. Een echt probleem dat tot de verbeelding spreekt en zeker de aandacht verdient van de taalkunde en de andere cognitieve wetenschappen. In een ruimer verband is een echte “eye opener” het werk van Randy Gallistel, een gedragspsycholoog en neurocognitief onderzoeker met waardevolle ideeën over leerbaarheid, het “Poverty of Stimulus” probleem, en de neurobiologie van het geheugen en computationele brein. Verplichte literatuur voor iedereen met serieuze of minder serieuze belangstelling voor taal en taalverwerving.

C.R. Gallistel. 1999. The replacement of general-purpose learning models with adaptively specialized learning modules. In: The Cognitive Neurosciences, ed. M. Gazzaniga, pp. 1179–91. Cambridge, MA: MIT  Press.
C.R. Gallistel & A. King. 2009. Memory and the Computational Brain: Why Cognitive Science Will Transform Neuroscience. New York: Wiley/Blackwell
C.R. Gallistel & L. Matzel. 2013. The neuroscience of learning: beyond the Hebbian synapse.  Annu. Rev.  Psychol. 64: 169-200

7 opmerkingen:

  1. Dank voor deze bijdrage! Het verbaast me dat er zoveel aandacht wordt besteed aan mijn denkbeeldige denkbeelden over recursie — daar heb ik niets over gezegd, juist omdat het TiCS-artikel er ruimschoots op inging. Het ging mij juist om het grotere plaatje waarin het voorstel van de auteurs uiteindelijk toch zal moeten passen.

    Het wordt saai om de analogie met Lenski's werk te herhalen, maar voor de duidelijkheid, daar zat dus een volkomen sympathieke lezing van het TiCS-artikel achter: stel dat het voorstel van de auteurs hout snijdt (vgl: stel dat Lenski's team inderdaad de alles-of-niets verandering heeft ondekt die E. coli in staat stelt van citraat te leven), dan nog zal ons begrip van de rol en evolutie van recursie uiteindelijk ook geïntegreerd moeten worden in het grotere biologische en culturele raamwerk waarin taal zich onlosmakelijk bevindt (vgl: die ene verandering in E. coli is niets waard zonder transport- en verwerkingsmechanismen voor citraat, waarvan we de evolutie dus óók moeten willen begrijpen). De aansluiting bij dat grotere plaatje is wat mist in het TiCS-artikel.

    Er worden een hoop stromannen in vlammen gezet in Huijbregts' respons. Dat is prima, zolang maar duidelijk is dat ze niet zijn ontsproten aan mijn verbeelding. Ik hoor gewoon bij de mensen met een serieuze belangstelling in onderzoek dat bouwstenen aanlevert voor een cumulatieve wetenschap van taal en taalevolutie — in de volle breedte.

    BeantwoordenVerwijderen
  2. Menselijke taal is niet recursief.

    De meeste dingen in menselijke taal die met recursie zijn te beschrijven zijn ook met iteratie te beschrijven. Het enige waarvoor je recursie nodig hebt is onbeperkte center embedding, en dat is iets wat mensen niet kunnen. Center embedding meer dan een paar niveaus diep kunnen mensen niet produceren noch begrijpen.

    Menselijke taalverwerking is een lineair proces. Een mens heeft niet vier keer meer tijd nodig om een zin te begrijpen die twee keer zo lang is. De verwerkingssnelheid is rechtlijnig, ongeacht de lengte van zinnen. Dat lukt niet met recursie.

    BeantwoordenVerwijderen
    Reacties
    1. In het oorspronkelijke artikel (hierboven een link) worden een aantal argumenten gegeven waarom de structuur van menselijke zinnen complexer is dan die van een lineaire string. Het staat natuurlijk ieder vrij om dat niet te lezen, of te zeggen dat "de meeste (!) dingen" ook met iteratie beschreven kunnen worden. Maar op een zinnige manier bijdragen aan de discussie doet dat niet.

      Verwijderen
    2. Laat ik het duidelijker zeggen. De meeste dingen die met recursie zijn te beschrijven, waarvan verondersteld wordt dat menselijke taal die bevat, laten zich ook met iteratie beschrijven. De enige (!) uitzondering is onbeperkte center embedding. Het is een hardnekkige misvatting dat menselijke taal dat zou hebben.

      Het oorspronkelijke artikel waarnaar verwezen wordt is helaas niet voor iedereen vrij te lezen.

      Verwijderen
    3. Dank voor de vriendelijke woorden nav mijn opmerkingen vorige week (de voorbeelden vond ik overigens mbv Peter Kleiwegs gereedschap).

      Ondertussen lieten de r-pronouns me niet los. Ten eerste omdat dit soort samensmelten van functies met 'er' veel vaker voorkomt en niet beperkt is tot extractie uit een PP. Zin (3) kun je bv analyseren als een geval waar een 'passief er' en een ' prepositioneel er' zijn samengesmolten. Dat 2 soorten 'er' hier samenkomen blijkt verder uit (4): 'passief' en 'existentieel er' kan zinsinitieel verschijnen, maar 'prepositioneel er' niet.

      (1) De regering spreekt er over
      (2) Er wordt over een oplossing gesproken
      (3) Er wordt over gesproken
      (4) *Er spreekt de regering over

      Dit is natuurlijk precies 'Bechs probleem'. Zou het niet kunnen dat de voorbeelden uit het Trends in CogSci artikel te verklaren zijn met dezelfde verklaring die voor (3) geldt? (Wat dat dan ook moge zijn.)

      Er is nog iets geks met zinnen als 'Ik ben er speciaal voor naartoe gereden'. Wanneer dit een pronominalisatie is van een zin als 'Ik ben speciaal voor het klimaat naar de Provence gereden', dan verwijst 'er' tegelijkertijd naar twee verschillende entiteiten. Merk op dat dit in 'klassieke' parasitic gap constructies niet het geval is. Als semanticus zou je hier flink hoofdpijn van kunnen krijgen.

      Tenslotte is het wonderlijk dat we alleen voorbeelden kunnen vinden met 'voor naartoe'. Wat maakt dat de combinatie van deze twee voorzetsels wel een (toegegeven: gering) aantal voorbeelden oplevert, terwijl iedere andere combinatie die ik kan verzinnen alleen maar false hits lijkt op te leveren. Extractie uit PPs is frequent, zinnen met twee voorzetselgroepen zijn frequent, en dus zou je verwachten dat de combinatie van beide toch ook met een zekere frequentie optreedt. Misschien komt het doordat vrijwel ieder voorzetsel ook scheidbaar deel van een werkwoord kan zijn (dat verklaart de false hits), waardoor zoeken naar goede voorbeelden lastig wordt (tot we een automatische parser hebben die parasitic gaps aankan ;-)). Maar het kan ook zijn dat 'er (speciaal) voor naartoe' iets idiomatisch heeft waardoor dit proces toch minder productief is dan gedacht.

      Verwijderen
    4. Ik denk dat er ook voorbeelden zijn met 'doorheen,' zoals 'Dit is daar speciaal voor doorheen gehaald,' en met andere omsluitende voorzetsels: 'Dit is daar speciaal voor tussendoor gevlochten.'

      Dat 'er speciaal voor' kent misschien minder variatie, maar ik kan me wel iets voorstellen als 'Ik ben daar speciaal mee overheen gelopen.'

      Marginaal blijft het allemaal, dat is waar. Maar er lijkt toch wel iets structureels aan te zitten.

      Verwijderen
    5. N.a.v. Gosse Bouma's opmerkingen het volgende. Zinnen als "Er wordt aan gewerkt" zijn inderdaad voorbeelden van Bechs Probleem. Er zijn twee soorten van uitgebreide "oplossingen" voor dit en andere voorbeelden van BP. De een vind je in Hans Bennis z'n proefschrift ("haplologie") en de ander vind je in Jan Models hoofdstuk 11 van mezelf ("localiteitsbeperkingen"). Dit voorbeeld van zoeven is geen "parasitair gat" omdat in dat geval sprake moet zijn van meer dan een variabele gebonden door een enkele operator. Maar er moet wel een algemene verklaring zijn. Je hebt helemaal gelijk als je zegt dat een voorbeeld als "Ik ben er helemaal mee naar toe gevlogen" een semanticus hoofdpijn zal bezorgen. Wees gerust. Ook syntactici slapen hier niet van. Daarom speelde precies deze zinnen ook een rol in TiCS. Het probleem werd ook genoemd: de covariante lezing van "echte" PG is hier afwezig. Maar het kan nog veel gekker. Naast PG en BP zijn er nog andere "marginale" constructies met eenduidige oordelen (laten ook zien dat haplologie hier niet de juiste verklaring kan zijn naast wh-zinnen als "Waar ben je speciaal voor naar toe gereden?"). Ik was al veel eerder van plan hier een lezing over te houden. En Tin 2016 is hiervoor de eerste gelegenheid. Titel: "Binding Unleashed"

      Verwijderen

Opmerking: alleen leden van deze blog kunnen een reactie plaatsen.