Google Nieuws alleen geschikt voor zoekmachine onvriendelijke websites?
Hebben we net met trots de nieuwe website gelanceerd, waarbij we rekening hebben gehouden dat de URL-structuur zoekmachine- en gebruikersvriendelijk is, krijgen we van Google Nieuws te horen dat de nieuwe website niet kan worden opgenomen in de index:
Hallo Marco,Bedankt voor uw vraag met betrekking tot opname in Google Nieuws. Na enig onderzoek hebben we vastgesteld dat ons systeem enkele van uw artikelen niet kan doorzoeken vanwege het formaat van hun URL’s. De artikel-URL moet een getal bevatten van ten minste drie cijfers, anders kan het artikel niet door Google Nieuws worden doorzocht.
Zo zal onze nieuwscrawler geen artikelen selecteren met de volgende URL’s:
http://www.marketingfacts.nl/berichten/ilsenl_converteert_het_beste/
http://www.marketingfacts.nl/berichten/postbank_start_proef_met_skype1/Deze pagina’s zou de crawler wel doorzoeken:
http://www.marketingfacts.nl/berichten/ilsenl_converteert_het_beste/112233
http://www.marketingfacts.nl/berichten/123546postbank_start_proef_met_skype1/Een voorbeeld van een site die we wel kunnen doorzoeken is http://english.chosun.com. U zult zien dat elk artikel op deze site een unieke URL heeft.
Onze excuses voor deze beperking van ons systeem. Laat het ons weten als u van uw kant veranderingen kunt doorvoeren die ons in staat stellen uw inhoud te doorzoeken.
Met vriendelijke groet,
Het Google-team
Ben benieuwd welke ‘briljante programmeur’ dit heeft bedacht maar het is werkelijk te zot voor woorden. Dan maar geen Google Nieuws!
Gepost in: Usability & Design, Zoekmachine marketing
35 Reacties
Roel
Kun je niet gewoon 123 achter de URL zetten? Zo lijkt de site te voldoen aan de eis en de URL werkt gewoon. De URL is dan uniek (het getal niet, maar die eis zie ik niet terug in het schrijven).
geplaatst op 22-02-2006 om 08:30 uur
Simon
Of de datum:
http://www.marketingfacts.nl/berichten/22/02/06/google_nieuws_alleen_geschikt_voor_zoekmachine_onvriendelijke_websites/
Ze hebben wel een punt, als jij 2 artikelen dezelfde titel geeft heb je een probleem volgens mij met deze URL-structuur... ;)
geplaatst op 22-02-2006 om 08:59 uur
Wilbert
Het klinkt inderdaad wel vreemd. Ik denk dat wat Simon aangeeft ook niet mogelijk is. Je URL zal altijd uniek zijn, dus wat is het probleem?
geplaatst op 22-02-2006 om 09:03 uur
Marco Derksen, Upstream
Simon, EE geeft in dat geval het tweede artikel automatisch een volgnummer.
Het voorstel dat je geeft waarin gebruik wordt gemaakt maakt van meerdere subdirectories levert een slechtere score op in zoekmachines als Google dus heeft niet mijn voorkeur. Of zeg ik nu iets dat niet juist is? SEO-experts, wat denken jullie hiervan?
geplaatst op 22-02-2006 om 09:04 uur
Arnout Veenman
De huidige url's zijn juist niet zoekmachine of nieuwscrawler vriendelijk, maar alleen voor de gebruiker van de zoekmachines, wat bovenstaande e-mail letterlijk bewijst. Een nieuwscrawler moet het verschil tussen nieuws en reguliere pagina's kunnen opmerken en het verschil tussen een permalink en verschillende overzichts pagina's. Vanuit het perspectief van een marketeer in eerste instantie totaal onlogisch, maar als programmeur kan ik je zeggen dat als je deze beperking niet zou hebben dat de nieuwscrawler nog velen malen gecompliceerder zou moeten zijn.
geplaatst op 22-02-2006 om 09:06 uur
Roel
Als de normale url's blijven werken en je alleen de url's met nummer opgeeft aan Google news is er toch geen man overboord?
geplaatst op 22-02-2006 om 09:07 uur
Joost
Dus http://www.gwx.nl/archive/2006/02/21/meten_met_twee_maten zou bijvoorbeeld wel werken, omdat er cijfers instaan? Wat een kutsysteem =] Nou, mijn site is dus Google Nieuws-proof, al zal ik wel niet opgenomen worden.
Bravo voor de nieuwe site trouwens!
geplaatst op 22-02-2006 om 09:10 uur
Sander Duivestein
Marco,
Als het goed is heeft ieder item op Marketingfacts een uniek nummer (zit in je database, primary key veld), waarom knal je die niet aan het einde van je url? Probleem opgelost. Waarschijnlijk 2 regels code aanpassen.
geplaatst op 22-02-2006 om 09:35 uur
Carl Mangold, 24/7 World.net
Nu.nl heeft dit probleem opgelost door de op cijfers gebaseerde URL simpelweg aan te vullen met een (voor het systeem nietszeggende) paginabeschrijving:
http://www.nu.nl/news/680309/91/Bob_Stumpel_stopt_met_roken.html
geplaatst op 22-02-2006 om 09:37 uur
Simon
@Marco: Ah, dan is EE nog beter dan ik dacht...
En ook weer minder: heb ik met mijn reactie iets stuk gemaakt? Alle reacties na mij zijn vet... EE heeft van een < br >
een <b r=""> (wtf?) gemaakt... :}
Maar waarom geeft /22/02/06/ ervoor een slechte score in zoekmachines? Ik ben geen SEO expert maar ik weet dat heel veel weblog(systemen) deze structuur gebruiken.
geplaatst op 22-02-2006 om 09:43 uur
Anders Floor, Connexxion
@Arnout
Als mede-programmeur ben ik het hier niet mee eens. Elke url die op dit weblog begint met http://www.marketingfacts.nl/berichten/ zijn nieuwsartikelen. Dat is zo'n simpel en makkelijk te implenteren gegeven dat ik niet snap dat Google met zoiets eenvoudigs geen rekening heeft gehouden. Ze beoordelen nieuwe bronnen voor hun nieuwscrawler met de hand, dus zo moeilijk kan het niet zijn.
Bovendien: wat doet de huidige nieuwscrawler met statische pagina's waarin nummers in de url zijn verwerkt?
geplaatst op 22-02-2006 om 09:55 uur
Onno
Ik neem aan dat het CMS ook in staat is om artikel id gebaseerde pagina's uit te spugen? Waarom dan niet een tweede voorpagina maken die buiten beeld van de menselijke lezers is, maar die je wel bij Google nieuws aanmeldt?
geplaatst op 22-02-2006 om 09:58 uur
Jelmer Voogel
Ik snap eigenlijk niet waarom je geen artikel id's in de url hebt (zie eerdere reacties) want dan gebruik je dus de titel om het artikel uit de database te halen. Deze methode lijkt me niet handig, wanneer de url ook maar 1 letter korter wordt gemaakt werkt het hele systeem niet meer, zeker bij herplaatsen van rss zal dat nog wel eens gebeuren met lange urls.
Op WaarMaarRaar.nl heb ik een modrewrite indeling waar zowel het artikel id als de titel zijn verwerkt. bv: http://www.waarmaarraar.nl/pages/re/1231/Winnaar_grootste_jackpot_ooit_is_spoorloos.html
Ik kan me niet voorstellen dat dit slecht zou zijn voor de zoekmachines.
geplaatst op 22-02-2006 om 10:03 uur
Jelmer Voogel
Wanneer je de url korter maakt of letters vervangt krijg je het laatste artikel uit de db te zien.
geplaatst op 22-02-2006 om 10:05 uur
Anders Floor, Connexxion
"Wanneer je de url korter maakt of letters vervangt krijg je het laatste artikel uit de db te zien."
Als je cijfers in een telefoonnummer vervangt krijg je ook iemand anders aan de telefoon. Lijkt me logisch.
Wat het "onhandige" betreft, dit valt wel mee. Wanneer je achteraf als schrijver de titel van een artikel aanpast, blijft de URL onveranderd. Het enige probleem zou kunnen zijn dat de woorden in de url niet overeenkomen met de nieuwe titel maar aangezien titels in de praktijk praktisch nooit worden gewijzigd, lijkt dat me niet zo'n probleem.
geplaatst op 22-02-2006 om 10:20 uur
Robert
@Jelmer
Bij nu.nl is dat niet het geval. Het tekst gedeelte van de URL kan je aanpassen, maar juiste atrikel wordt nog steeds getoond.
zie:
http://www.retecool.com/comments.php?id=13776_0_1_30_C
geplaatst op 22-02-2006 om 10:57 uur
BasW
Dit is toch oud nieuws? Ik heb die vraag, dan ivm de Amerikaanse Google News, al maanden geleden zien circuleren. Nu kun je dit natuurlijk heel gemakkelijk oplossen door de URL van ieder artikel even uit te breiden met de publicatiedatum, dus: "/de_naam_of _url_220206".
Lijkt me niet zo moeilijk om dit op te lossen, toch?
Ander punt van aandacht is dat Google Nieuws alleen de artikelen van één van mijn sites oppikte als dit een 'lees meer' link bevatte, hou dit even in de gaten, en anders is het een kwestie van een mailtje naar Google, over het algemeen wordt daar adequaat op gereageerd.
geplaatst op 22-02-2006 om 10:59 uur
Willem
Marco, in EE kun je ook url's met nummertjes genereren hè.
Als je hulp nodig hebt, geef maar een gil, dan kan ik evt wel helpen.
Raar btw, dat ze nummertjes nodig hebben, Telegraaf werkt toch ook niet met URL's waar nummers in zitten?
Groet,
Willem
geplaatst op 22-02-2006 om 11:09 uur
Zesser
Als optie zou je de feedburner-url kunnen gebruiken... die heeft een ID en je kunt meteen zien op welke artikelen geklikt wordt;)
geplaatst op 22-02-2006 om 11:12 uur
Bart Noppen
Wat is dat nu voor BS, een website waar ik recent aan meewerkte werd sinds vorige week opgenomen in Google News en de url's bevatten helemaal geen cijfers ?!
geplaatst op 22-02-2006 om 14:28 uur
Marco Derksen, Upstream
Bart, kun je aangeven om welke website dat ging?
geplaatst op 22-02-2006 om 14:39 uur
Remi van Beekum
We hebben het ID van een artikel uit de url gehaald en vervangen door de titel om een aantal redenen. Het is mooier, duidelijker, geeft een mooier resultaat in de zoekmachines en scoort beter. (keywords in url helpen beter te scoren)
We zouden zowel het nummer als de titel in de url kunnen gebruiken, maar dat is totaal onlogisch. Zowel de titel als het id zijn uniek en daarmee kun je dus in de database het betreffende bericht opzoeken. Waarom dan beide gebruiken?
Er is in mijn ogen geen enkele reden om die nummers in de url op te nemen. Zowel voor gebruikers als zoekmachines voegt dat simpelweg niets toe. Alleen voor Google News is het een voordeel.
Maar inmiddels zijn ruimn 20.000 pagina’s van de nieuwe site geïndexeerd. Passen we de url nu weer aan, dan moeten die allemaal opnieuw geïndexeerd worden waardoor het langer duurt voordat we weer goed vindbaar zijn.
Er zijn volgens mij 2 mogelijke oplossingen:
- 2 varianten van de url’s gebruiken, en de versie met nummer aan de SE aanbieden. Maar dat is zo onlogisch dat ik dat een slecht idee vind.
- Vanaf nu bij nieuwe artikelen het nummer toevoegen, maar bij oude niet.
Die laatste is misschien een optie al moeten we even kijken of dat in de praktijk uit te voeren is.
Maar eigenlijk vind ik het een enorme tekortkoming van Google News. Elk artikel heeft nu een unieke url en die is gewoon indexeerbaar en uniek identificeerbaar (bij de organische resultaten is er ook geen spiderprobleem). Je mag dus van Google verwachten dat ze dit op termijn op zullen lossen.
Verder vraag ik me af of Google News MarketingFacts veel bezoekers op zal leveren. Ik zie nu vaak dat als bron voor een nieuwsartikel een blog wordt gebruikt. Even later pakken de ‘grote jongens’ (de kranten) het zelfde nieuws op, en dan worden zij als bron gebruikt. Zij krijgen dus het gros van de traffic en niet de blogs.
geplaatst op 22-02-2006 om 15:41 uur
wowbagger
Het Google News verhaal klinkt me ietwat ongeloofwaardig in de oren, gewoon omdat het een rare eis is.
Even inhakend op trefwoordgebruik voor Googlevriendelijke URL's:
Heel verstandig, alleen is een underscore om de trefwoorden te scheiden niet de beste keuze.
Hier
http://www.joomlaseo.net/The-News/Search-Engine-SEO-Articles/underscores-or-dashes.html
staat het kort uitgelegd.
geplaatst op 22-02-2006 om 16:13 uur
martijn
"..2 varianten van de url’s gebruiken.." zou ik voorzichtig mee zijn mbt duplicaat-filters van Google
Als het mogelijk is zou ik voor de variant kiezen "vanaf nu bij nieuwe artikelen het nummer toevoegen" en anders helemaal opnieuw indexeren, zoveel maakt het toch niet uit als je een week later goed vindbaar bent?
geplaatst op 22-02-2006 om 16:59 uur
Bart Noppen
Marco, ik heb je een mailtje gestuurd.
geplaatst op 22-02-2006 om 17:18 uur
Anders Floor, Connexxion
Goed, dus nu moeten we de url gaan aanpassen vanwege een "programmeersfout" van Google News. Hoe lang duurt het voordat de boel opnieuw overhoop gegooid moet worden? Omdat bijvoorbeeld Flickr, Technorati, Del.ic.io.us, Yahoo of de zaterdagmiddagweblogzoekmachine van tante Katrijn uit Heerhugowaard niet met een standaard (!) url-structuur overweg kunnen?
De groeten met je Google News, zou ik zeggen.
geplaatst op 22-02-2006 om 20:19 uur
michiel
@remi
De woorden in de url zijn relatief onbelangrijk, zie ook http://www.seomoz.org/articles/search-ranking-factors.php . Volgens deze lijst zo belangrijk als de "meta keywords" tag.
@wowbagger
Underscores in de url helpen inderdaad niet, integendeel, woorden verbonden met een underscore worden als één geheel gezien. Woorden verbonden met een minus teken worden gezien als twee aparte woorden. Google prefereert het minus teken. Als je in Google zoekt op bijvoorbeeld zoekmachine_marketing, staat marketingfacts op 2, laat je de underscores weg staat marketingfacts niet meer in de resultaten. Zie ook http://www.mattcutts.com/blog/dashes-vs-underscores/.
Mijn advies is om bij nieuwe artikelen id's aan de url's toe te voegen.
geplaatst op 23-02-2006 om 00:08 uur
Anders Floor, Connexxion
"Google prefereert het minus teken"
Ik vind dit een interessante discussie maar hoe goed ik ook zoek, ik kan hier alleen natte-vinger-meningen van so-called "experts" over vinden. Zijn er ook bronnen die deze stelling enigzins wetenschappelijk onderbouwen?
"Als je in Google zoekt op bijvoorbeeld zoekmachine_marketing, staat marketingfacts op 2, laat je de underscores weg staat marketingfacts niet meer in de resultaten."
Wil je hiermee nou beweren dat Marketingfacts in het laatste geval op nummer 2 zou staan als het minus-teken gebruikt zou zijn in plaats van een underscore in de url? Net zeg je nog dat de url praktisch geen rol van betekenig speelt.
Overigens: zoekmachinemarketing is één woord.
geplaatst op 23-02-2006 om 01:33 uur
Paul Molenaar
Zo proberen wij al een tijdje een antwoord te krijgen waarom een site als - laten we zeggen - Tubantia meer getoond wordt op news.google.nl dan Nu.nl... Voor mij nog volkomen onverklaarbaar.
geplaatst op 23-02-2006 om 16:22 uur
Barry
Hmm, dus als ik het goed begrijp heeft
1. Marketingfacts geen unieke nummers in de URL
2. Marketingfacts geen 'dashes' maar underscores in de URL.
Goed werk Traffic4u ;-)
geplaatst op 27-02-2006 om 13:49 uur
Jan
Op Medicalfacts.nl hebben we ons geschikt naar de wensen van Google. Het heeft resultaat gehad want we zijn nu te vinden op Google Nieuws. Er staan nu slechts 4 artikelen in, terwijl er veel meer gepost is. Ik ben er nog niet achter wat het algoritme van google is.
Als unieke nummer gebruiken wij een samenstalling van de datum & tijd bijvoorbeeld http://www.medicalfacts.nl/20060301111100344.html
geplaatst op 01-03-2006 om 11:36 uur
Marco Derksen, Upstream
Jan, zou aardig zijn als je ons ook kunt laten weten wat het aan traffic oplevert en daarmee of het de moeite waard is om de URL-structuur aan te passen.
geplaatst op 01-03-2006 om 11:44 uur
Jan
Als statistiekenjunkie houd ik de boel natuurlijk goed in de gaten. Met de huidige 4 artikelen zal het niet al teveel traffic opleveren vermoed ik, maar ik zal tzt een update geven.
geplaatst op 01-03-2006 om 11:56 uur
Jan
Ik heb inmiddels even naar de statistieken van herkomst van bezoekers, m.b.v. google analytics.
Google 74,8%
Feeds4all 2,8%
Ilse 2,3%
Planet 0,6%
Bloglines 0,3%
Google News 0,08%
Technorati 0,04%
Vooralsnog geen reden om Google Nieuws te gaan implementeren.
geplaatst op 01-03-2006 om 12:27 uur
Jan
Nogmaals een korte update over google nieuws. Vandaag is het bericht Telemonitoring verkort Gezondheidszorg opgenomen in Google Nieuws onder de kop gezondheid. In 13 uur is het artikel al 102 keer gelezen. Voor medicalfacts.nl is dit een enorm groot aantal.
Verbazingwekkend is het dat de link vanaf google bestaat uit vraagtekens (http://www.medicalfacts.nl/article.php?story=20060507224039270), waarvan Google eerst aangaf dat de syntax niet goed was.
geplaatst op 08-05-2006 om 10:51 uur
Plaats een reactie
Log in zodat je (in het vervolg) nóg sneller kunt reageren