Gebruikmaken van de Google Data Mine

Heb je vandaag gegoogeld? Heb je deze pagina bereikt door "googlen"?

Als dat zo is, heb je de toekomst gezien en ben je er deel van, zelfs als je het je nog niet realiseert. In feite is er bij Google veel meer aan de hand dan alleen zoeken. Ik ga het hebben over wat Google doet, weet - en wat je moet doen en weten om er het maximale uit te halen.

$config[code] not found

Het is waar dat Google vooral bekend staat om zijn krachtige zoekmachine, die put uit een enorme database van webpagina's, video's, afbeeldingen, aandelenkoersen, telefoonnummers, adressen en andere brokken media en gegevens om relevante informatie te bieden - allemaal in de tijd die nodig is om een sleutel te raken.

De naam van 's werelds grootste zoekmachine is synoniem geworden voor het zoeken op internet. Het is zelfs een werkwoord geworden in onze dagelijkse taal (hoewel Google het niet leuk vindt dat we het op die manier gebruiken): we "google" autobeoordelingen, het huidige adres van onze jeugdvriend, en, in vluchten van grootsheid en grootsheid, onszelf.

Het is gemakkelijk om te vergeten dat we niet alleen zijn als we zoeken. Alles wat we doen binnen de Google-omgeving (en enkele dingen die we daar buiten doen) worden vastgelegd, opgeslagen en geanalyseerd. Als u eenmaal weet dat een bedrijf zoveel gegevens beschikbaar heeft, duurt het niet lang voordat u zich realiseert dat al deze informatie voor veel meer dan alleen een prettige zoekervaring kan worden gebruikt.

Als u de potentiële kracht van Google volledig wilt begrijpen, kunt u even achteroverleunen en bekijken hoe Google iets gedetailleerder werkt. Hoe Google werkt

Voor de toevallige zoeker is het niet meteen duidelijk hoe Google zo snel op internet zoekt en met zulke goede resultaten. Het geheim is dat wanneer je een query intypt ze helemaal niet op internet zoeken; in plaats daarvan zoekt Google naar een database die voortdurend groeit en up-to-date is, 24 uur per dag, 7 dagen per week.

Dit alles gebeurt zonder enige menselijke tussenkomst. Kleine programma's die 'spiders' of 'crawlers' worden genoemd, volgen onafhankelijk de links van de ene pagina naar de andere, zoals een spin de threads van zijn web volgt. Terwijl de spinnen door webpagina's kruipen, verzamelen ze informatie over elke zin, afbeelding, telefoonnummer en alle andere dingen die ze kunnen tegenkomen. Ze scannen elke pagina die ze bezoeken, indexeren de trefwoorden en onthouden links naar en van de pagina. Vervolgens wordt deze informatie opgeslagen in een enorme database. Dezelfde links en pagina's worden steeds opnieuw gecrawld, zodat de informatie van Google actueel blijft.

Google rangschikt pagina's met behulp van de informatie die de spiders verzamelen. Inbegrepen in dit rangschikkingsproces zijn de volgende:

zoekwoordfrequentie en locatie (meer trefwoorden op prominentere locaties zijn beter);

de leeftijd van de pagina (hoe beter de pagina is, hoe beter);

het aantal pagina's dat naar een pagina linkt (hoe meer links hoe beter).

Er zijn nog andere factoren die Google overweegt, maar deze worden geheim gehouden om diegenen te belemmeren die het systeem willen spelen en hoge scores willen behalen zonder echt nuttige informatie te verstrekken. Als u het overdrijft en uw pagina eenvoudigweg voorziet van overbodige informatie, lijsten met zoekwoorden en ongewenste koppelingen, zal Google u bestraffen of zelfs uw site uit de database verwijderen. Het is duidelijk dat er een goed evenwicht moet worden gevonden. Die balans van factoren op de pagina is evenveel kunst als wetenschap.

Hoe beter een pagina scoort op basis van deze criteria, hoe hoger deze scoort in de zoekresultaten. De hoogst gerangschikte pagina's verschijnen op de eerste pagina van een Google-zoekopdracht; aangezien de meeste Google-gebruikers nooit voorbij die eerste pagina gaan, krijgen die hoog gerangschikte pagina's een onevenredig groot aantal internetverkeer.

Dit alles om te zeggen dat wanneer u een zoekopdracht uitvoert op Google, deze zo snel kan reageren omdat deze op dat moment niet probeert het hele internet te doorzoeken; het raadpleegt zijn zeer georganiseerde en geprioriteerde database. Maar nog belangrijker dan het maken van bliksemsnelle zoekopdrachten, dit betekent dat Google een enorme opslagplaats heeft van gegevens over wat er op internet staat en, wat nog belangrijker is, wie wat gebruikt, wanneer en voor welk doel.

Wat weet Google?

Google "weet" veel, eigenlijk. Google houdt zoekopdrachten bij en bewaart zelfs een bestand voor uw specifieke zoekopdrachten op basis van uw IP-adres of Google-login. Dat geeft ze een klein venster in je geest, onthullend wat je interesseert, je zorgen baart, je opwindt en je bang maakt. Dit alleen al is krachtige marketinginformatie.

Als u die database zou kunnen gebruiken, zou u in staat zijn om gedetailleerde profielen op te stellen over individuen - hun interesses, koopgedrag, gezondheidsproblemen, familieproblemen en meer. U kunt tekens vinden die suggereren of een bedrijf slaagt of faalt, of het een fusie of overname overweegt en naar welke productlijnen het kan uitbreiden. U kunt historische trends volgen in verkiezingen, economie, gezondheidszorg en een aantal andere gebieden met aanzienlijke sociale, financiële en politieke waarde.

Als u bovendien, bewust of onbewust, gebruikmaakt van andere Google-services, geeft u nog steeds meer informatie. Ze scannen Gmail, halen dezelfde informatie uit uw correspondentie als uw zoekopdrachten, evenals wie uw vrienden en bijdragers zijn. Als u documenten deelt via Google-documenten, weten ze met wie u werkt en met welke projecten. Google Checkout voegt gegevens toe over uw aankooppatronen, uw bestedingspatroon en uw budget.

Er is ook informatie die u naar Google verzendt zonder dat u er zich van bewust bent dat u dit doet. Google verzamelt, net als andere internetdiensten, uw IP-adres en mogelijk uw MAC-adres. Uw IP-adres vertelt hen ongeveer waar u zich in de wereld bevindt, en uw MAC-adres is een unieke handtekening voor uw machine; Zo kunnen ze bijhouden of u altijd dezelfde machine gebruikt, hoeveel machines u gebruikt, enzovoort. Dus, niet alleen weet Google waar je naar op zoek bent en met wie je communiceert, het bedrijf weet ook waar je bent en welke computer of machines je gebruikt.

Laten we natuurlijk een stapje terug doen en toegeven dat bijna elke website toegang heeft tot sommige of al deze informatie. IP-adressen worden bijvoorbeeld regelmatig verzameld om te verdedigen tegen hackers en denial-of-service-aanvallen. Informatie over waar je terechtkomt op iemands site, wanneer je aankomt en vertrekt, en waar je vandaan komt en naar toe gaat, zijn alle standaardwebstatistieken beschikbaar voor zelfs de kleinste persoonlijke site.

Wat Google anders maakt, is de enorme omvang en diversiteit aan services, waardoor het een grotere verscheidenheid aan informatie van veel meer mensen kan verzamelen.

Wanneer je hoeveelheid informatie van honderden stukjes gegevens naar miljarden gaat, heb je inzicht dat niemand anders dat doet. Wat Google echt krachtig maakt, is dat het mensen in meer contexten dan wie ook kan observeren. Google houdt je in de gaten, ook als je niet op je computer bent. Google Maps biedt foto's met een hoge resolutie van de meeste Verenigde Staten en enkele andere delen van de wereld. Waarschijnlijk is uw huis te zien op Google Maps en als u toevallig de tuin zou overspoelen wanneer de satelliet voorbij vloog, kunt u uzelf misschien ook zien in uw meest rattige korte broek!

Wat Google kan doen

Er zijn een aantal vrij voor de hand liggende toepassingen voor de database van Google. AdWords is op dit moment misschien de populairste en meest zichtbare.

Elke keer dat u een zoekopdracht uitvoert op Google, zijn de eerste paar vermeldingen bovenaan de pagina en de vermeldingen aan de rechterkant 'gesponsorde links', betaalde advertenties die zijn gekocht door mensen die denken dat gebruikers die een zoekopdracht als de uwe uitvoeren, geïnteresseerd zouden zijn in hun goederen en diensten. Deze techniek heeft zich verspreid naar andere webpagina's. Dit verklaart de 'Ads by Google'-naam die u ziet door relevante advertenties weer te geven voor de pagina's van andere websites.

Het is duidelijk dat de verkoop van deze advertentieruimte een uitstekende bron van inkomsten is voor Google. In 2007 bracht Google meer dan $ 16 miljard aan inkomsten binnen, waarmee Google tot nu toe de grootste inkomstenbron van Google is. Ter vergelijking: de Google-datastore is een goudmijn die nauwelijks is aangeboord.

Tot nu toe zijn de Google-functies die we hebben gezien vooral gericht op het reageren op de huidige markttendensen. Mensen raken ergens in geïnteresseerd - de nieuwe versie van de X-Box, een online elektricien, Super Bowl-memorabilia, enzovoort - en Google is gepositioneerd om mensen te helpen contact te leggen met hun potentiële klanten.

Echter, met voldoende informatie kan een bedrijf als Google meer doen dan alleen bliksemsnel op het heden reageren. Het kan ook de toekomst zien, of zelfs de toekomst creëren. Voordat je denkt dat dit slechts een paranoïde science-fiction dagdroom is, geef het onderwerp wat aandacht.

Laten we een eenvoudig geval nemen. Stel dat u een programma instelt voor het noteren van zoekopdrachten die geen pagina's met een hoge rangorde weergeven - mislukte zoekacties die de zoeker geen echt nuttige informatie bieden. Het programma dat deze fouten bijhoudt, noteert wat de zoeker wilde en plaatst die mislukte zoekopdrachten in categorieën.

Kijkend naar die vergelijkingen, wat als Google merkt dat er een groot aantal mislukte zoekopdrachten zijn die allemaal te maken hebben met het vinden van een doe-het-zelf superstore in Thermopolis, WY. Iets meer omkijken, en ik heb een lijst met plaatsen waar er veel mislukte doe-het-zelf-zoekacties naar superstore locators zijn. Die lijst zou ongelooflijk waardevol zijn voor een bedrijf dat doe-het-zelfzaken concurreert (geen namen noemen, maar denk aan die grote oranje pakhuizen in elke wijk: zouden ze het niet willen weten?).

Ze wisten niet alleen dat er geen doe-het-zelfwinkel was, maar dat een bepaald aantal mensen op zoek was naar zo'n winkel. En ze zouden waarschijnlijk een idee hebben van wat ze daar hoopten te kopen: apparaten, bouwmaterialen, gasgrills, etc. Dit is een pijnloos marktonderzoek, netjes gesorteerd en automatisch geanalyseerd door Google.

Op dezelfde manier zou deze informatie kunnen worden gebruikt om potentiële kopers voor een bepaald product te identificeren, criminelen die zich bezighouden met kinderpornografie op te sporen en potentiële dieven te vangen die een huis of winkel huisvesten. Het kan ontwikkelaars helpen bij het kiezen van sites voor nieuwe huizen en winkels, waarschuwt u voor zwaar weer in uw regio, zoekt geregistreerde kiezers en leert over hun gewoonten en interesses, en helpt de IRS mensen te vinden die vals spelen tegen hun belasting. Er kunnen ook interpretatiefouten zijn: een heleboel zoekopdrachten over kanker in een kleine stad kan veel kankerpatiënten betekenen, maar het kan net zo goed betekenen dat er een medische school is.

Zoals u ziet, kunnen we sommige van de gebruiken van deze informatie toejuichen en anderen afwijzen. Maar ze zijn allemaal mogelijk en gebruiken allemaal dezelfde basistechnieken. Je kunt bijna alles vinden wat je wilt, je moet gewoon weten hoe je het moet zoeken.

In mijn volgende artikel zullen we een kijkje nemen naar wat dit allemaal betekent voor u als individu … en als een ondernemer. Ga naar: de Google Data Mine en uw bedrijf.

* * * * *

Over de auteur: Hamlet Batista is president van NEMedia S.A, een leverancier van SEO-automatiseringssoftware die ondernemers en kleine bedrijven helpt de kwaliteit van hun natuurlijke zoekverkeer te vergroten, terwijl ze zich concentreren op wat ze het beste doen. Hamlet's blog, Hamlet Batista dot Com, onderzoekt het meest geavanceerde SEO-onderzoek, maar ook strategieën en tactieken die je een voorsprong kunnen geven op je concurrenten.
17 Opmerkingen ▼