maandag 5 september 2011

Google taxonomie

Om als webwinkel je producten zichtbaar te maken in Google-shopping moet je een datafeed aanleveren. Google wil graag dat je je producten indeelt. Liefst via de officiƫle Google taxonomie. Voor sommige productgroepen is/wordt dat zelfs een verplichting. Ik heb de taxonomie doorzocht op verkleedkleren, verkleedkleding en carnavalskleding. Deze woorden kwamen niet voor. Wel vond ik katten- en hondenkleding. En via "speelgoed > educatief speelgoed" kwam ik terecht bij mierenboerderijen. Ehhhh mierenboerderijen?

Dat bracht mij bij mijn stokpaardje: "Het is beter om producten te labelen dan ze in een structuur te zetten". Zie ook mijn eerdere posts over labels.
Ik kan het eigenlijk niet geloven. Google -notabene Google- gebruikt strings ipv tags om producten in te delen. Een structuur, een vastgelegd pad ipv labels. Hoe is het mogelijk?

Overlap
Producten zullen altijd op meerdere plaatsen staan in een hierarchische indeling. Suiker zal staan bij de bakspullen, het broodbeleg en bij de koffie- en thee. Google shopping staat dit toe, dat is het probleem niet. Maar een indeling via strings wordt hierdoor veel groter en complexer dan een indeling via tags.

Nog meer overlap
Als je werkt met strings ontstaat er overlap doordat je een vaste volgorde hebt. Er ontstaan meerdere strings voor hetzelfde. "Sportkleding > dames > tennis" naast "Sport > tennis > kleding > dames".

Detaillering
Hoe diep ga je met detailleren? Oftewel hoeveel woorden mag je gebruiken in de string? Zet je een kabouterpak bij "carnavalsartikelen" of ga je de diepte in met "carnavalsartikelen > kleding > thema kabouter". Er bestaan nog geen richtlijnen voor. Er ontstaan korte en lange strings voor hetzelfde. Bij tags speelt deze vraag niet. Elk gewenst kenmerk kan opgenomen worden.

Zoekmachines en klanten
Klanten zullen de taxonomie niet gebruiken. Die zoeken met trefwoorden. Kijk maar naar Wikipedia, ik vermoed dat er niet veel mensen zijn die de categorische indeling daar gebruiken om iets op te zoeken. Daaruit volgt dat een zoekmachine dat ook niet zal doen. Een zoekmachine volgt de bezoeker.

Een uniforme indeling is een utopie. Als je importeert betaal je invoerrechten. Er wordt al jaren gewerkt aan een eenduidige indeling voor deze invoerrechten. Producten zouden een vaste tariccode moeten hebben. Toch is er geregeld discussie over waar een product onder valt. Mijn verkleedkleding bijvoorbeeld. Valt dat onder speelgoed van textiel? Of is het een seizoensartikel voor de carnaval? Of een schertsartikel? Daar zou ik me niet druk over hoeven te maken ware het niet dat er verschillende tarieven aan de verschillende tariccodes vasthangen.

Uniforme tags zijn makkelijker bereikbaar dan uniforme strings. Je ziet nu al dat Google taalfouten eruit filtert en met synoniemen opkomt voor woorden. Enkelvoud/meervoud wordt herkend. Google zal op de lange duur bepalen met welke termen (tags) je gaat zoeken. Dus als jij kinderpartijtje zoekt vraagt ie bedoel je kinderfeestje?

Dit is in het kort waarom ik niet begrijp waarom juist Google met een hierarchische productindeling komt voor Google shopping? Iemand?