I det siste har jeg jobbet med å utvikle verktøy som skal gjøre hverdagen enklere for webmastere med en del sider å administrere og overvåke. Når man begynner å få mange websider, er det enkelt å miste oversikten over hvordan web-imperiet utvikler seg over tid. For min del betyr dette å kombinere statistikk fra Google Analytics, Google AdSense, Tradedoubler, Google, Yahoo, OpenX/Google AdManager og så videre. Målet er å kun ha en side hvor du trenger å gå for å få oppdatert statistikk på hele nettverket.
Dette er selvsagt en veldig ambisiøs plan, men jeg skal prøve å få integrert så mye som mulig. Så langt har jeg brukt Analytics-data, SERP statistikk fra Yahoo og Google, og pagerank. Ut av ferdige moduler jeg har funnet, og andre “sitescrapers” og kodesnutter jeg selv har skrevet, har jeg fått lagd en prototype som jeg tror har virkelig potensiale.
Hele systemet er kodet i PHP, med mySQL-database i bakgrunnen. Selvsagt bruker jeg CakePHP fremfor å styre med alt fra bunnen av. I tillegg har jeg tatt i bruk Blueprint CSS Framework for første gang, som jeg er veldig godt fornøyd med. For å få et enkelt rammeverk for å strukturere sider med, og få et godt utgangspunkt, anbefales det på det varmeste. Men over til det spennende, systemet selv. Jeg vil bruke skjermbilder for å forklare nåværende funksjonalitet (de fleste sider vil være skjult for å hindre snoking).
Implementert funksjonalitet

Over ser vi en utsnitt av oversiktssiden, hvor alle registrerte sider vises, sammen med en liten beskrivelse, URL og administrasjonsmuligheter. Vi ser også lenker til detaljert rapport og et øyeblikksbilde av siden, som vi skal se på videre.


Her ser vi øyeblikkelig mer interessant statistikk, og selv om det kan være overveldende i starten, bør man lære å elske statistikk! Som tidligere, vises grunnleggende informasjon om siden, men i tillegg får man en oversikt over hvor mange sider som er indeksert i Yahoo og Google, hvor mange lenker til siden Yahoo har funnet (indeksert), nåværende PageRank og trafikken for den siste uken. Et lite bilde av siden er også med, generert ved hjelp av websnapr. Så har vi selvsagt utfyllende statistikk over trafikken, funnet ved hjelp av Google Analytics, og beskrevet ved hjelp av Google Charts.
Eksempelet over er fra siden Forever Conan, en nyhetsside for Age of Conan. Som dere ser har trafikken på siden fulgt populariteten til AoC ganske godt…

Så går vi over på øyeblikksbildet, som kobler seg opp til Google Analytics direkte og laster ned statistikken for å generere denne siden. Den inneholder også mer informasjon, men dette er det meste spennende. Øverst har vi trafikken for den siste uken, mens nedenfor har vi topplister over referals (hvor trafikken kommer fra, både søkemotorer og websider), nøkkelordene som blir brukt i søkemotorene for å finne siden og de sidene som mottar mest trafikk. En ekstra detalj er at vi finner Pagerank for alle de ti mest populære sidene, og får dermed litt mer informasjon om hvordan denne er fordelt på siden, og hvordan det påvirker trafikken.

Dette er kanskje den mest nyttige siden for strategisk planlegging videre, og viser utrolig mye informasjon. For hver side viser den besøkstall for siste uke og måned, forandringen fra forrige uke og måned, nåværende og tidligere Pagerank, indekserte sider i Yahoo og Google og lenker inn, samt prosentvis endring fra tidligere. Det hele er farget med grønn, gul og rødt for positiv, nøytral og negativ utvikling for å gi rask oversikt over sider som går bra og som trenger utvikling. På grunn av veldig lite data om indeks i Google og Yahoo, er alle disse gule i dette tilfellet, men det vil forandre seg automatisk i fremtiden. Oppdatering av indeksen, med min test-portefølje på 30 domener, tar i underkant av 1 minutt hver dag, og kan kjøres automatisk som cron-jobb.

Så har vi selve juvelen for en SEO CEO (tre-bokstavers-forkortelser er nesten like viktig å elske som statistikk). En enkel trafikkoversikt for hele porteføljen. Den viser utviklingen i trafikk (både besøk, søkemotortrafikk og sidevisninger) for siste uke, siste to uker, siste måned og siste to måneder, samt en graf med samme informasjon og tilbake et helt år. Her også vist med pene farger, for å gjøre det enkelt å se hvordan det går. Som vi ser er alle tall positive i denne porteføljen, og det går derfor godt fremover. Over tabellen er det en ny tabell som viser totalt antall indekserte sider, totalt antall innlenker og fordelingen pagerank i hele porteføljen.
Videre utvikling
Selvsagt kan jeg ikke gi meg med dette, selv om dette var det jeg i utgangspunktet satte ut for å gjøre. Nå trenger jeg ikke lenger å manuelt holde orden på alt dette. En side gir meg total oversikt over utviklingen på sidene mine. Jeg må ha mer statistikk, helst så elegant og oversiktlig som mulig. Jeg har allerede lagt til funksjonalitet for å hente whois-informasjon om alle domenene, og trenger bare lage en oversikt for å vise utløpsdatoer og registrar-informasjon.
Trafikkdata
Det er fortsatt flere sider å lage med trafikkdata fra Google Analytics. En av disse blir en toppliste, la oss kalle det en intern Alexa-liste, men oversikt over hvilke sider som har mest trafikk, søkemotorbesøk, sidevisninger, indekserte sider, innlenker og pagerank. Piler som viser hvilke som går opp og ned er selvsagt også viktig.
Annonsører og inntekter
Data fra AdSense, Tradedoubler og andre annonsenettverk må selvsagt være med. De største og de jeg bruker mest vil jeg lage egne sider for, hvor statistikk over inntekter i forhold til trafikk og så videre vises. Jeg er usikker på om jeg vil få til å knytte dette opp mot spesielle sider som er registrert i systemet, fordi det ikke er noen generisk, logisk lenke mellom sidene og statistikken fra annonsørene. AdSense har channels som er mulig å knytte opp mot sider, men om dette er hensiktsmessig vet jeg enda ikke.
Det er heller ikke avgjort om jeg vil høste denne informasjonen automatisk eller om det blir å laste ned CSV-dokumentene og deretter laste de opp. Det siste er nok mest aktuelt, da det blir vanskelig å gjøre systemet allment tilgjengelig om man må oppgi passord og brukernavn til alle annonsenettverk man er medlem i. Mulig jeg implementer begge deler, slik at jeg iallefall slipper å gjøre det, og jeg satser på å stole på meg selv.
OpenX
En langt mer aktuell og medgjørlig måte å gjøre det på, er å høste denne informasjonen ut av OpenX. På denne måten unngår man alle problemer med forskjellige annonsører, og man har selv kontroll på informasjonen som ligger i OpenX. Man kan til og med integrere deler av OpenX i dette system, som gjør at det straks blir enda mer slagkraftig. Det gjør at man kan knytte sammen annonse-informasjon med trafikkdata, og gir store muligheter for mye spennende statistikk.
Nøkkelord-informasjon
Jeg har store planer om å kunne knytte nøkkelord (søkefraser) opp til de forskjellige sidene i systemet, og vise rangering på dette søkeordet i Google. Jeg har allerede koden klar for å sjekke google for SERP (Search Engine Result Page)- informasjon. Deretter er det store muligheter for å få en ny stor seksjon statistikk som knytter sammen SERP-posisjon og trafikk, og analysere denne over tid.
Nøkkelord-undersøkelse
Google har gitt oss store muligheter for å undersøke trafikken på forskjellige nøkkelord med sine AdWords-verktøy. Dette gjør også at man kan klare å høste dette (om man tar hensyn til captchaen), og sammenligne med egne nøkkelord og de man får trafikk på, og hvordan man rangerer. Det er også mulig å sjekke hvor mange andre som konkurrerer om dette nøkkelordet med enkle googlesøk (som derfor kan automatiseres).
Innlenker
Siden vi allerede har informasjon om lenkene inn til sidene våre, kan vi også kjøre et mer avansert søk, ved å sjekke sidene og finne hvilke fraser som blir brukt til nettstedet vårt. Det er også mulig å hente denne informasjonen fra Google Webmastertools, om jeg finner ut at jeg skal integrere det. Det vil også gi mye gratis informasjon om SERP-rangeringer og indekserte sider i Google (link:mydomain.com lyver).
Domene-undersøkelse
Hvis du finner et domene du er interessert i å kjøpe, enten det er til salgs eller er tilgjengelig på grunn av at tidligere eier valgte å ikke fornye det, kan det være mye av denne statistikken som er interessant. Det samme gjelder konkurrenter innen din niche/mikroniche, og det er selvsagt mulig å integrere informasjon og rangeringsoversikt for domener man selv ikke eier. Man vil selvsagt ikke få mulighet til å få tilgang til trafikkdata fra Analytics.
Innhold, konkurrenter og innlenker
Det er mer å gjøre om man virkelig vil med litt website-scraping. Det er mulig å generere innhold automatisk, enten gjennom RSS-feeds eller gratis databaser. Det er mulig å identifisere konkurrenter og etterforske hvordan deres taktikk fungerer og hvordan de gjør det. Det er mulig å bygge innlenker automatisk eller iallefall finne potensielle steder å bygge innlenker automatisk. Det å bygge innlenker automatisk begynner vel å nærme seg faretruende BlackHat. Uansett, det er mye man kan gjøre automatisk.
Utgivelse snart?
Vel, det kan jeg vel si at det ikke blir. Trolig kommer jeg til å ha en lukket beta-testperiode, hvor utvalgte sjeler kan få mulighet til å teste funksjonaliteten etter hvert som den blir tilgjengelig. Jeg er også usikker på om jeg kommer til å frigi koden eller kun utvikle en versjon som jeg vil tilby tilgang til. Potensielt begge deler om jeg finner tid til det. Men det skal jeg ikke garantere, legg meg til i din RSS-leser, så holder jeg deg oppdatert. Nyhetene kommer ikke så ofte, men det er da aldri grunnløs svada (om du ikke ser på mine 40-timers spill som svada da).