dinsdag 29 mei 2012

Vermijd het gebruik van het canonical-attribuut

Canonical, wat is dat?
Een canonical is een verwijzing naar een andere url. Dit attribuut zegt tegen Google dat de bezochte url een duplicaat betreft en waar het origineel te vinden is. Het origineel is de voorkeursurl en daar moeten "de punten" naartoe. Het is iets anders dan een 301-redirect. Een 301 is een adreswijziging; deze pagina is verhuisd naar een andere url. Ook met een 301 neem je "de punten" van de oude url mee naar de nieuwe url. Bestaande externe links naar de oude url gaan via deze adreswijziging naar de nieuwe url.
Bij een canonical blijft de url in je balk staan. Met een 301 verspringt ie automatisch naar de nieuwe url. Beide opties zorgen ervoor dat de url waarop de verwijzing staat uit de indexering van Google verwijderd wordt zodat daar geen pagina's met dezelfde inhoud meer staan.

Google en de canonical
Verschillende urls voor dezelfde inhoud heeft als nadeel dat "de punten" verdeeld worden. I.p.v. één sterke pagina ontstaan er meerdere, zwakkere en exact dezelfde pagina's. De reden waarom er een verwijzing op moet.
Google geeft de voorkeur aan een 301. In de SEO-startersgids staat letterlijk: "Als u merkt dat mensen verschillende URL’s gebruiken om dezelfde inhoud te bekijken, kunt u een 301-omleiding instellen voor de URL’s die niet de voorkeursversie zijn en deze omleiden naar de voorkeurs-URL. Als dit niet mogelijk is, kunt ook een canonieke URL of het rel=“canonical” link element gebruiken".

Misleiding door de canonical
Een canonical is niet zichtbaar voor de bezoeker. Je zegt tegen de bezoeker je bent op dit adres (de url die weergegeven wordt) en, verborgen voor de bezoeker, zeg je tegen Google dat het toch een ander adres is. Als je uitgaat van het principe dat Google de bezoeker volgt dan is de canonical een truc uit de SEO-trukendoos.

Voorkomen van de canonical
Allereerst moet duplicate content zoveel mogelijk voorkomen worden. Verder moet je urls zo min mogelijk veranderen. Dan zijn er ook geen verwijzingen nodig. Toch zullen urls soms wijzigen, omdat er anders geordend wordt, omdat je -zoals men dat noemt- SEOvriendelijke urls wilt hebben, omdat je naar een ander domein verhuisd enz. Bij een gewijzigde url gebruik je de 301-redirect.
Anders wordt het als je met opzet duplicate content laat staan. Bijvoorbeeld als je het pad in de url weergeeft. Als je artikelen op meerdere manieren te bereiken zijn ontstaan er verschillende paden en dus meerdere urls voor hetzelfde. Dit kun je oplossen door het pad niet weer te geven in de url.

Misbruik van de canonical
Het grootste gevaar van de canonical schuilt echter in de mogelijkheid om hem te misbruiken voor niet-identieke inhoud. Dat gebeurt veelvuldig*. De bezoeker ziet verschillende pagina's, maar tegen Google wordt gezegd dat het allemaal dezelfde pagina betreft. Die ene pagina wordt beter gerankt, maar al die andere pagina's worden niet geïndexeerd en kunnen niet meer gevonden worden via Google.
Bij anders gesorteerde pagina's (een sortering op prijs, een sortering op populariteit e.d.) wordt vaak een canonical gezet. Dergelijke pagina's hebben echter functie voor de bezoeker en dus ook voor Google. Vindbaarheid wordt o.a. bepaald door de ranking, maar vele andere factoren hebben invloed. 10 verschillende (maar wel op elkaar lijkende) laaggerankte pagina's kunnen samen voor meer bezoekers zorgen dan 1 sterk gerankte pagina.

Conclusie
De canonical dient zoveel mogelijk voorkomen te worden. Gebruik waar mogelijk de 301-redirect en voorkom duplicate content. Misbruik de canonical niet voor pagina's die niet-identiek zijn.

* Mijn webwinkelhost heeft ooit, met de beste bedoelingen overigens, SEO-cowboys ingehuurd. Toen verschenen ineens overal canonicals. En paden in de urls. Ik had destijds ongeveer 30, redelijk gerankte, overzichtspagina's. Zorgvuldig opgebouwd via het navigatie-menu in combinatie met een uitgebreide catalogus. Al die overzichtspagina's zijn weggecanonicald (uit de indexering gegooid) omdat er een verwijzing richting de hele collectie opgezet was. Die hele-collectie-pagina kreeg inderdaad een boost. Maar mijn bezoekersaantallen werden meer dan gehalveerd!
Mede daardoor weet ik wat een canonical is en heb ik gelijk een hekel aan dit attribuut gekregen. Zelfs zo erg dat ik destijds niet overgestapt ben op Wordpress met een shopplugin. Wordpress heeft een, door mij zo fel begeerde, tagging-optie, en een optie tot weglaten van pad in de url. Maar in een recensie die ik destijds las stond "nu met nog betere canonicals......"