Verhuisd



Let op: Neder-L is verhuisd naar www.neerlandistiek.nl

vrijdag 30 oktober 2015

Is het Nederlands triviaal?

Door Marc van Oostendorp

De Britse wiskundige Alex Bellos schreef gisteren in The Guardian een artikel dat ook in Nederland enig stof deed opwaaien. In dat stuk besprak Bellos het feit dat de Engelse spelling triviaal is: als je ieder woord ziet als een vermenigvuldiging, en iedere letter als een variabele in die vermenigvuldiging, dan kun je bewijzen dat de waarde van iedere letter gelijk is aan 1.

Neem bijvoorbeeld de woorden aisle en isle, zegt Bellos. Die spreek je op dezelfde manier uit, en dus kun je zeggen aisle=isle. Omdat je ieder woord ziet als een vermenigvuldiging van de letters, krijg je dan:

  • axixsxlxe = ixsxlxe
Maar dan staat er dus eigenlijk: ax(isle) = isle. Dat is alleen waar als a staat voor 1. Die truc kun je ook voor allerlei andere letters uithalen: plumb en plum klinken ook hetzelfde, dus volgens deze redenering staat de b ook voor 1.  Voor andere letters is het iets bewerkelijker. Voor de c observeer je eerste dat scent en cent hetzelfde klinken. Daaruit volgt dat s gelijk is aan 1. Daarna besef je dat sent en cent ook hetzelfde klinken. Daaruit volgt dat c=s, en omdat s=1 dus ook c=1.

Al in 1993 heeft een groep wiskundigen laten zien dat je op deze manier kunt uitrekenen dat iedere letter in het Engels en het Frans gelijk staat aan 1. Dat is de definitie van triviaal

De vraag doet zich nu natuurlijk voor: is het Nederlands ook zo triviaal?
De vraag werd gesteld op dit leuke wiskundige weblog, en de Taalprof probeerde hem te beantwoorden op zijn eigen weblog. Zoals ik in het commentaar daaronder zeg, denk ik dat zijn bewijs niet helemaal klopt, en uiteindelijk kom ik niet verder dan de volgende letters:

t (want red=redt)
d (want pat=pad)
c (want rock=rok)
k (want rocken=rokken)
r (want verrassen=verassen)
l (want grill=gril)
n (want rasse=rassen)
m (want impasse=inpassen)
q (want qat=kat)
p (want kampt=kamt)
b (want lab=lap)

Een zekere Jutt voegt daar nog een aantal letters aan toe:

e: re = ree -> e = 1
o: doodde = dode -> o = 1 (want d = 1)
a: laadde = lade -> a = 1 (want d = 1)
j: hij = hei -> j = 1 (want e = 1)
s: rees = race -> s = c = 1 (want a = e = 1)
h: shock = sjok -> h = j = 1 (want c = 1)
g: lag = lach -> g = h = 1 (want c = 1)
w: kou = kauw -> w = 1 (want o = a = 1)
x: boxer = bokser -> x = ks = 1
y: yen = jen -> y = j = 1
z: lezer = laser -> z = s = 1 (want e = a = 1)

Maar nu kunnen we toevoegen:

v (want wreed=vreet, en v=d=t=1)
f (want lef=lev)

Ik dacht oorspronkelijk dat het Nederlands niet triviaal zou zijn, maar we hebben hiermee al 22 van de 26 letters triviaal verklaard. De i en de zijn nog problematisch. Je zou ze kunnen oplossen als je een beetje structuralistisch met de sjwa rommelt:

u (want hut=het)
i (want katterig=katterug)

Maar ik vind dat toch minder bevredigend.

Zoals ik vrijwel zeker weet dat het Italiaans of het Spaans helemaal niet triviaal zijn. Daarvoor hebben die talen teveel een één-op-één relatie van klank en letter. Er zijn in het Italiaans bijvoorbeeld eigenlijk geen 'onuitgesproken' letters, en ook nauwelijks letters die op dezelfde manier worden uitgesproken als een andere letter. En dan valt het hele systeem in duigen. Het Frans en het Engels hebben allebei juist relatief veel verschillende manieren om dezelfde klank te schrijven én veel onuitgesproken letters in allerlei woorden.

We hebben hiermee dus een eenvoudige rekenkundige maat in handen van hoe fonologisch de spelling van een bepaalde taal is, die we kunnen uitdrukken met de eenvoudige formule:

φ = Λ / (λ+Λ)

Hierin staat Λ voor het totaal aantal letters in de taal en λ voor het aantal letters dat triviaal is. Hoe meer van dat soort letters, des te kleiner de maat φ, dus omgekeerd: hoe groter φ, des te duidelijker drukt het alfabet het klanksysteem van de taal uit. De waarde kan variëren tussen 1 (heel fonologisch systeem) en 1/2 (triviaal systeem). Het Nederlands heeft vooralsnog een φ van 0,52.

De trivialiteitsindex kan zelfs nog een échte toepassing hebben. Er wordt immers wel beweerd dat er in talen als het Italiaans minder mensen kampen met dyslexie dan in talen als het Engels. Je zou nu kunnen meten of er een correlatie bestaat tussen φ en het aantal dyslectici in de bevolking.

10 opmerkingen:

  1. Ik heb ook nog iets beter nagedacht, maar uit roux=roe volgt dat ux=e, en u en e zijn al 1. Dus u is ook 1. En uit het feit dat Oirschot=oorschot ("schot in het oor") volgt i=1.

    BeantwoordenVerwijderen
    Reacties
    1. Dag Peter-Arno,
      Ik heb dit ook al aan Marc gestuurd, maar misschien interesseert het jou ook:
      - voor de i: 'heer' - 'heir'
      - voor de u: 'leus' - 'löss'
      Groet,
      Freek.

      Verwijderen
  2. Er is wel nog iets fundamenteels mis met die formule als maat voor de spelling, want er is niet in verdisconteerd dat letters voor verschillende klanken kunnen staan. De trivialiteit bv van de e bewijs je door een woordpaar waarin de e voor /e/ staat, maar de /e/ kan voor (ten minste) twee andere klanken staan.

    BeantwoordenVerwijderen
    Reacties
    1. In mijn laatste reactie bedoelde ik met de tweede /e/ natuurlijk de letter e.

      Verwijderen
    2. Dat is een goed punt. Je moet dus eigenlijk ook nog het omgekeerd doen: bepalen in hoeverre symbolen in fonetische transcripties 'triviaal' zijn als je de spelling als uitgangspunt neemt.

      Verwijderen
  3. Ik geloof dat we nog iets bewezen hebben. We hebben uit de uitspraakgelijkheid van gespelde woorden (bijvoorbeeld DODE=DOODDE) afgeleid dat alle letters de waarde 1 hebben. Maar daaruit zou dan eigenlijk moeten volgen dat alle woorden de waarde 1 hebben, dus dat AAP=NOOT bijvoorbeeld. En dat klopt niet. Dus, er is geen andere conclusie dan dat het uitgangspunt (woorden zijn vermenigvuldigingen van letters en uitspraak is een indicatie voor gelijkheid) onjuist is.

    BeantwoordenVerwijderen
    Reacties
    1. Het probleem zit in de dubbelzinnigheid van het =-teken. In DOODDE=DODE betekent X=Y: X en Y zijn homoniem. Maar in e=1 betekent X=Y: de variable X heeft de waarde Y. Doordat je die dingen door elkaar kunt halen krijg je jouw probleem. In echte wiskunde zijn ambigue symbolen daarom natuurlijk niet toegestaan.

      Verwijderen
  4. Het Italiaans kent toch ook gewoon onuitgesproken letters? De -h wordt op zich vrij handig gebruikt om de dubbelzinnige c en g minder dubbelzinnig te maken, maar het blijft gedoe, en het gebruik van de h- bij het werkwoord voor "hebben" is ook wat onnodig. Ook de s en de z zijn dubbelzinnig. Wat te denken van de combinatie -gl-? De -i- is ook dubbelzinnig: soms een klinker, soms een halfklinker, soms een medeklinker (in combinaties als ciao). Met -e- en -o- worden ook weer twee klanken aangegeven, trouwens, maar ze zijn iets minder makkelijk weg te strepen. Al kan in sandhi natuurlijk een hoop.

    Het valt me vaker op dat de Italiaanse spelling wat wordt overschat, alsof ze een toonbeeld van duidelijkheid en regelmaat zou zijn. Dat valt nogal tegen in de praktijk.

    BeantwoordenVerwijderen
    Reacties
    1. De h heeft na een g en een c wel degelijk altijd een functie voor de klank. Uit HO=O volgt inderdaad wel dat h=1. De andere dingen die je noemt lijden misschien tot equivalentieklassen, maar niet tot trivialiteit. Vooralsnog lijkt de φ van het Italiaans me 0,96.

      Verwijderen
  5. Deze reactie is verwijderd door de auteur.

    BeantwoordenVerwijderen

Opmerking: alleen leden van deze blog kunnen een reactie plaatsen.