Kāpēc atšķiras dažādus web statistiku sistēmu rezultāti?
Visu pirms gribu pateikt/atzīt, ka esmu ieslīcis web statistikas analīzes valdzinājumā. Lasu grāmatas, blogus, pētu visu, kas vien pagadās. Reiz man kāds cilvēks jautāja, kāpēc viņam pamatīgi atšķiras cipari iekš TUNT un GA. Toreiz nemācēju nekādīgi atbildēt uz jautājumu, bet tagad esmu palicis nedaudz gudrāks un varu padalīties ar atbilžu variantiem.
Sākšu ar to, ka visiem, kuriem ir hostings, noteikti ir arī kaut kada servera lapas statistika, un tā drošvien nesakrīt ar Google Analytics statiem. Kādēļ tas tā ir? ;)
Servera softs var ieskaitīt +1 tad, kad pat netiek ielādēta lapa, bet javascripts (GA) to nedarīs, tas pieskaita tikai tad kad tiek ielādēs pats javascripts, parasti tas tiek nolikts lapas (koda) apakšā, tādējādi tikai pie pilna lapas ielādē būs +1.
Nākamais, servera statika logo visus pageview, bet Google Analytics jeb/vai javascriptveidīgs skaitīklis skaita tikai tos pageview, kuros tas ir izvietots. Tātad nonākam pie slēdziena, ka servera statistika logo (ieraksta) katru 404 errora lapas rādījumu ka arī citas, kas neattiecas uz lietu (administrācija piem).
Pavecas un pastulbas servera statistikas ņem vērā tādu lietu kā IP adrese (+ user agent ID). Mēs taču dzīvojam kurā gadsimtā? Daudziem no mums varētu būt vienāda ip adrese un vienāda darba stacija (piemēram darbā).
Serveris noķers arī robotus, kas ložņā pa lapu (Google Analytics nekad nenoķers nevienu robotu, jo tie neizpilda javascriptus).
Un pats svarīgākais. Sistēmām var atšķirties apmeklējuma laiks. Google Analytics, tas ir 30min. Respektīvi, ja mēs palietojam lapu (+1 pie visita), tad 30min nelietojam, un tad atkal ieejam, tad atkal ieskaitas +1. Jo lielāka atšķirība starp šo apmeklējuma laiku, jo iespējams vairāk atšķirsies apmeklējuma skaits. Ne mazāk svarīga lieta ir: ko sistēma uzskata par apmeklējumu no Googles, vai tas jau es ieiešu 30min laikā kādā lapā caur googles meklētājrezultātiem man ieskaitīts divus vai vienu apmeklējumu.
Runājot par gemius. Domāju (jo neesmu gemius klients), ka rezultāti atšķiras no GA, vai kādas citas sistēmas, datu lietderīguma filtrācijas dēļ. Gemius var skaitīt apmeklējumu tikai no noteikta reģionā – teiksim Latviju, vai Baltijas reģionu, tādējādi tas var sniegt pamatotu informāciju, ko Latvijas iedzīvotāji visvairāk apmeklē etc.
Paļauties uz apgalvojumu, ka GA vai gemius ievāc dažādus datus (clickstream šajā gadījumā) nevar, jo noteikti pēc noklusējuma ievāc vienu un to pašu. Ja konkrēti zinātu, kā gemius veicu datu filtrāciju, tad, uzstādot šādus pašus filtrus GA, mēs iegūtu līdzīgus rezultātus.
Tweet11 Responses to “Kāpēc atšķiras dažādus web statistiku sistēmu rezultāti?”
Comments
Read below or add a comment...
Trackbacks
-
[...] nombres blogaa atradu komiksu par droshiibu internetaa. [...]
-
[...] šajā sērijā: Kāpēc atšķiras dažādus web statistiku sistēmu rezultāti? Maksas reklāmas rezultāti un nedaudz par bounce rate [...]
-
[...] Māris ir sācis rakstīt par statistiku web lapās un to rezultātiem, detalizētāk skaidrojot Google Analytics, ar ko sācis jau aizrauties.Man bija interesanti [...]
Runā, ka Gemius saskaita vairāk kā Google Analytics.
Njā. Man W-presa statistikas plugins parasti rāda divreiz vairāk kā GA, bet gadās arī otrādāk.. :/
Tīri lapas apmeklējuma statistiku var arī visai inteliģenti skaitīt servera pusē, lapas ģenerējošam skriptam strādājot kopā ar servera aplikāciju, jēdzīgi izstrādāta šāda statistika būs ar kārtu precīzāka. Nu kaut vai es lietoju NoScript ar visai paranoiskiem iestatījumiem no viena kompīša, kas automātiski nozīmē, ka JS un dajebkādos client-side risinājumos atkarīgi statistikas vācēji aplaužas un nepieskaita manu apmeklējumu, bet to vienkārši varētu pieskaitīt servera pusē. Ir problēmas ar to, kā servera pusē nošķirt atsevišķus lietotājus
(nozuda komenta beigas kaut kā mistiski :))
…
tātad ir problēma servera pusē vācot statistiku, kā atšķirt, ka šis ir viens lietotājs, bet šis cits lietotājs no tā paša provaidera(IP), taču kaut kādā apvienojumā ar sesijām un client side skriptiem(javascript) situācijās, kurās client side skripti ir atļauti, šis noteikti būtu labāks.
Kapēc tad visi statistikas servisi lieto tikai client side skriptus? tādēļ, ka mainīt server side skriptus ir karai aplikācijai stipri individuāls pasākums, tātad šāda tipa statistikas pievienošana būtu ar kārtu laikietilpīgāka->dārgāka.
Paldies par garo komentāru :)
Un tomēr mūsdienās visi izvēlās pārsvārā js (un to dažreiz papildina server-side statistika). Ja lapā ir reģistrēts lietotāji, tad lai izsekotu, ko tie dara, visvieglāk ir ar javascriptu nevis serverside. Un ja ir jāuzlabo skritptiņš, jānosaka, ko ievākt vēl no lietotāja, tad js ir vieglāk norādīt ko.
Papildus tam, es gribu teikt, ka tikai apmeklējuma statistika vairs nespēlē lomu, tā ir pagātne, vajag daudz vairāk. Mūsdienās mēs visi gribam dabūt daudz vairāk laukā. Kur klients spiež, kāda poga viņu labāk piesaista, zila vai zaļa piemēram. Šādas lietas var visvieglāl izmērīt ar JS.
Jautājums, cik % lieto NoScript visādas lietas? 0.001% (blackhalt? :D)?
Servera statistikai ir viena laba lieta, manā skatījumā, jamiem ir vesela kaudze datu (clickstream) ko var interpretēt kā grib. Piemēram GA vai jebkurai citai js, kas nehostējas uz vietas, iepriekš jādefinē atskaites (ar visiem filtriem etc.), un tad to arī dabūs neko vairāk.
Paldies no kāda cilvēka :)
Un vēl .js kods un ka arī imagefails atrodas amerika. kamer 20Kb js + 10Kb imagefails ieladesies vel jāgaida. Analytics rada līdz 30% mazāk reālos apmeklejumus ne ka tas ir. Gemius rada vairāk jo tad atrodas Polijā. Jā runāt par nopietno analizi piemērām “cik bija pardotas prēces” jāizmanto kau ko kas ir tuvak – labāk uz savo serveri :)
ar ko tad tie domāts ‘servera statistika logo’? Log failā ir gandrīz viss, kas ir konfigaa. Cik man zināms, servera logus ķemmē ar awststats u.c progām, kas tā pat šķiro unikālos, ip, utt.