流量統(tǒng)計原理主要有兩種:傳統(tǒng)的基于日志文件統(tǒng)計和當前較為流行的基于腳本(JavaScript等)統(tǒng)計。
基于日志文件的統(tǒng)計
通過分析網(wǎng)站后臺的日志文件來統(tǒng)計訪客的瀏覽和點擊行為。這種方法的優(yōu)點是簡單方便,無需修改網(wǎng)頁代碼,可以收集網(wǎng)絡(luò)爬蟲數(shù)據(jù)等。缺點是網(wǎng)站日志包含所有日志數(shù)據(jù),需預(yù)處理來提升數(shù)據(jù)質(zhì)量;而且無法統(tǒng)計到頁面緩存導(dǎo)致的緩存瀏覽數(shù)據(jù)。
基于腳本的統(tǒng)計
此方法需要在網(wǎng)站的html代碼中嵌入一段腳本(JavaScript等)用于統(tǒng)計訪客的瀏覽等行為。這種方法的優(yōu)點是技術(shù)難度低,只需嵌入腳本代碼,無需配置服務(wù)器;能夠快速獲取點擊、響應(yīng)等數(shù)據(jù)并方便展現(xiàn);不需要擔心緩存帶來的影響,數(shù)據(jù)的準確度較高。缺點主要是無法統(tǒng)計網(wǎng)絡(luò)爬蟲的信息。當前主流的流量分析系統(tǒng)絕大部分采用此種方法收集數(shù)據(jù),包括百度統(tǒng)計和谷歌分析等。以下為網(wǎng)站分析工具的JavaScript收集數(shù)據(jù)流程圖:
轉(zhuǎn)載請保留原文地址: http://m.frontstepsmusic.com/show-219.html