maandag 17 september 2018

Informatie-architectuur bij Wordpress

Over hoe een artikelendatabase van fysiek naar virtueel zou moeten gaan.

Fysiek
Artikelen staan in een papieren catalogus op één vaste plek op één wijze gesorteerd. De inhoudsopgave met hoofdstukken en paragrafen laat de wijze van sorteren zien. Vaak is er nog een index op onderwerp. Als er meerdere artikelen zijn over hetzelfde onderwerp dan staan de artikelen in deze index opgesomd per onderwerp met het paginanummer en eventueel het hoofdstuk en de paragraaf waar het te vinden is.

Polyhiërarchie
Afbeelding van P. Laubheimer
Groen streepje is door mij toegevoegd
Van fysiek naar virtueel in 3 stappen:
  1. Je kunt een artikel op meerdere plaatsen tegelijk zetten door ze te labelen. Zoals de index van de papieren catalogus dat doet, maar dan met elk artikel aanklikbaar in plaats van met de plek (paginanummer, hoofdstuk, paragraaf) waar het staat.
  2. Je kunt artikelen op meerdere wijzen sorteren. Op onderwerp en op auteur bijvoorbeeld.
  3. Je kunt verzamelingen artikelen specifieker maken door labels te combineren: Toon alle artikelen met dìt onderwerp van díe auteur. Het groene streepje in de figuur hiernaast.
In plaats van op te zoeken in de inhoudsopgave of index op welk paginanummer je een artikel kunt vinden is er virtueel een navigatiemenu waar je door te klikken naar de artikelen geleid wordt. Paginanummers bestaan niet meer.


Wordpress leek dezelfde stappen te maken:
  1. Wordpress startte in 2004 veelbelovend met de optie dat je een artikel in meerdere categorieën tegelijk kon zetten. Categorieën werden als een label aan het bericht geplakt. De eerste stap was gezet!
  2. In 2007 kwam de optie tagondersteuning. Dit hield in dat je labels kon plakken aan de artikelen. Dit kwam naast de categorieën die je ook als labels aan de artikelen kon plakken. Stap 2 was gezet! Je kon sorteren op categorie èn met tags.
  3. De laatste stap, het groene streepje in de figuur, is er (nog) niet. Ik wilde met mijn blog Nageluk overstappen naar Wordpress omdat ik in de veronderstelling was dat je categorieën bij Wordpress kon filteren met tags maar dat is niet zo.
Ondanks dat Wordpress de juiste stappen leek te maken van een fysieke naar een virtuele artikelendatabase zie je in praktijk dat de meeste Wordpresswebsites de artikelen nog steeds op één vaste wijze gesorteerd hebben en de tags niet of niet goed gebruiken. Omdat het volgende gebeurde:
  1. Categorieën kon je weliswaar als labels aan een artikel plakken, maar de categorieën werden nog steeds in een boomstructuur* gezet. Voor de bezoeker werd één vast pad uitgestippeld, van hoofdcategorie naar subcategorie. Zoals een papieren catalogus is ingedeeld in hoofdstukken en paragrafen.
  2. Op een andere wijze sorteren deed men al via de hoofdcategorie en subcategorie. Het onderwerp als hoofdcategorie en de auteur als subcategorie bijvoorbeeld. Het artikel van Pietje over dieren werd geplaatst in de subcategorie dieren->Pietje. Tags hoefden daarom niet ingezet te worden om op een andere wijze te sorteren. Wel werden ze ingezet voor woorden waarop men gevonden wilde worden. Dat was een zoekwoordentruc met goede resultaten. Reden waarom men er zoveel mogelijk woorden neer plempte. Enkelvoud naast meervoud, verkleinwoordjes, synoniemen, taalfouten enzovoort. Dieren, dier, diertjes, diertje, beesten, beest, beestjes, beestje, Pietje, Piedje, Piet en meer. Toen de zoekwoordentruc na verloop van tijd niet meer scoorde ging men tags weglaten. Een actueel gegeven advies van Wordpress-specialisten is om één sorteringswijze te gebruiken, categorieën OF tags. Omdat beide dubbelop is.
  3. Filteren met tags voegt niets toe in deze situatie. De diepte kun je immers al in via de boomstructuur met zijn hoofd- en subcategorieën. En tags werden niet meer gebruikt of bestonden uit dezelfde termen die gebruikt werden voor de categorieën.
Wat hield de "vooruitgang" tegen?
De kern van het probleem is mijn inziens dat men categorieën in een boomstructuur is blijven plaatsen. Het had een polyhiërarchie** moeten worden; meerdere sorteringen naast elkaar waarin de bezoeker zelf de ene sortering met een andere kan combineren.
Daar bovenop kwamen de SEOexperts die bleven hameren op deze boomstructuur. Een goede boomstructuur zou nodig zijn om bezoekers en Google te kunnen vertellen met een broodkruimel in welke hoofdcategorie en subcategorie een artikel te vinden is. De broodkruimel geeft de plek aan waar iets staat, vergelijkbaar met het hoofdstuk en de paragraaf van de papieren catalogus. Probleem van de broodkruimel is dat een artikel vaak op meerdere plekken te vinden is in die boomstructuur. Om toch een vaste plek te kunnen duiden kwamen ze op de proppen met de voorkeurscategorie. En de andere plekken werden weggemoffeld met het canonical attribuut.
Ik heb dat nooit begrepen:
  • Waarom moet je uitleggen waar een artikel te vinden is als er al een link staat naar dat artikel?
  • Waarom moet je uitleggen waar een artikel te vinden is als men het al gevonden heeft?
  • Waarom moet je vertellen dat het ergens anders staat dan waar men het gevonden heeft?
  • Waarom zou je andere vindplaatsen weg moffelen?
  • Waarom moet je broodkruimels strooien vanaf de home naar de plaats van bestemming als men met 1 klik terug kan keren naar de home? Om precies hetzelfde pad terug te kunnen volgen? Misschien wil men niet naar de home maar verder rondkijken. Misschien wil men liever langs een ander pad terug.

Voor een blog, waar artikelen in chronologische volgorde worden gepubliceerd en gearchiveerd, kun je verwijzen naar de publicatie-datum als je een vaste plek in de url wilt duiden. Zoals je bij de papieren catalogus verwijst naar het paginanummer.
Wordpress is een prima pakket zolang je niet gaat hannessen met een boomstructuur, broodkruimels, voorkeurscategorieën en canonicals. Gebruik de categorieën voor de hoofdindeling (op onderwerp bijvoorbeeld) en de tags voor andere sorteringen (op auteur bijvoorbeeld). Zet verder geen broodkruimels in de url, dan hoef je de andere broodkruimels die naar hetzelfde artikel leiden ook niet weg te "canonicallen" met een voorkeurscategorie.

Bij een webwinkel heeft een chronologisch archief daarentegen weinig waarde voor de bezoeker en kun je het beter weglaten: Een artikel staat in een webwinkel op meerdere plaatsen tegelijk, er is geen vaste plek om door te geven aan de bezoeker.
Ik heb in 2002 mijn webwinkel gebouwd met de artikelen op een vaste plek en op één manier gecategoriseerd. Ik wilde graag de artikelen in meerdere categorieën tegelijk laten zien (artikel labelen met de categorieën) en ik wilde graag mijn winkel op meerdere manieren indelen; op soort artikel en op thema (labels konden van alles duiden, het soort artikel, een kleur, een thema, een categorie). Als mijn collectie groter was geweest, dan had ik nog labels met elkaar willen kunnen combineren (filteren).
Mijn wens destijds voor de artikelendatabase van een webwinkel; De categorie wordt een label en met dit label kun je filteren. Dat verhaal lees je hier.

WooCommerce
Eind september 2011 werd WooCommerce gelanceerd. Webwinkelsoftware gebaseerd op Wordpress mèt een filteroptie! (Er bestaan meerdere winkelplugins op Wordpress, dit is de bekendste en inmiddels de standaard).
In 2012 ging ik op zoek naar andere software voor mijn webwinkel omdat ik nog steeds niet de categorieën kon labelen. De reclamekreet "nu met nog betere canonicals" was destijds voor mij doorslaggevend om niet voor WooCommerce te kiezen. Als er canonicals zijn, dan zullen ze nog wel vastgeroest zitten in zo'n boomstructuur met voorkeurscategorieën vreesde ik. Dat bleek te kloppen. WooCommerce heeft:
- Categorieën = labels die in een boomstructuur staan.
- Tags = labels.
- Filters = labels waarmee je kunt filteren.
Als ik webwinkeliers vraag naar wat het verschil nu precies is tussen een categorie en een tag, dan weten ze het niet. Als ik vraag waarom ze merk als categorie hebben èn als filter zeggen ze omdat ze de categorieën ook willen kunnen filteren op merk. Als ik vraag waar die voorkeurscategorie voor nodig is weten ze het meestal niet, een enkeling antwoordt dat die nodig is voor de broodkruimel in de url. Als ik vraag waarom ze een megamenu gebruiken dan is het om de weg te wijzen naar de plekken waar de producten staan. Als ik vraag waarom je alleen via merk de diepte in kan bij schakelmateriaal antwoorden ze dat je nu eenmaal een keuze moet maken anders wordt het megamenu te groot. Verder gebruikt niemand alle 3 de opties (categorieën, tags en filters) tegelijkertijd.
Overigens zitten zover ik weet álle aanbieders van webwinkelsoftware nog vastgeroest in boomstructuren. Mijn verbazing daarover lees je hier.

Ben je tot hier gekomen met lezen? Dankjewel!
Ben je de draad van mijn verhaal kwijtgeraakt? Stop dan hier met lezen!

Mijn ervaring is dat mensen geïrriteerd raken omdat ze het niet snappen, omdat ze het anders geleerd hebben, omdat SEO-experts het omgekeerde beweren, omdat ze het al jarenlang zo doen of omdat ze zich alleen een lineaire, tweedimensionale ordening kunnen voorstellen zoals een papieren catalogus die heeft.
Ik ben niet talig ingesteld. Ik weet pas sinds kort dat deze materie onder "informatie-architecteur" valt en dat de structuren aangeduid worden met mono- en polyhiërarchie. Ik heb heel weinig over het onderwerp gelezen. Omdat er in 2002 toen ik me erin verdiepte nog niets over geschreven was en ik later gelijk afhaakte zodra men over structuur, hiërarchie, voorkeurscategorieën of canonicals begon. Bovendien kan ik geen Engelse teksten lezen zonder vertaalknop, en die was er de eerste jaren niet. Ik ken de vaktermen dus niet. Dit blog heet niet voor niets autodidact.

Klik op de afbeelding voor een vergroting. Het is een printscreen met zoekopdracht 'monohiërarchie'.

* Boomstructuur; een hiërarchie die lineair vertakt. Elk onderliggend item kan maar op 1 manier naar de bovenliggende laag. De juiste term is monohiërarchie. Woorden die ik ervoor gebruik(te); lineaire hiërarchie, lineaire structuur, tweedimensionale structuur, 'artikelen categoriseren' en taxonomie.

* Polyhiërarchie; elk onderliggend item kan via meerdere paden naar de bovenliggende laag. Een artikel staat op meerdere plaatsen tegelijk. Ik gebruik(te) er onder andere de term driedimensionale structuur voor.
Overigens zou ik in deze fase eerder het woord polysortering gebruiken. En polyhiërarchie reserveren voor hoofd- en sublabels. Maar dat is een stapje verder waar ik niet eens over durf te beginnen zolang er nog zovelen geloven dat je een monohiërarchie moet hebben om voorkeursbroodkruimels te kunnen maken.