网站日志数据分析

你的位置:南京晓磊SEO > SEO基础知识 > 网站日志数据分析

网站日志数据分析

SEO基础知识 yang, yang 1年前 (2018-02-28) 115浏览

网站日志数据分析。南京seo优化

19


1、网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer、WPS表格等
117.26.203.167 – – [02/May/2011:01:57:44 -0700] “GET/index.php HTTP/1.1″ 500 19967 “-” “Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)”
分析:
117.26.203.167访问ip;
02/May/2011:01:57:44 -0700访问日期 -时区;
GET/index.php HTTP/1.1根据HTTP/1.1协议抓取(域名下)/index.php这个页面(GET表示服务器动作);
500服务器响应状态码;
服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重定向。404则代表所访问的页面已经不存在了,网站优化,或者说访问的url根本就是个错误的。500则是服务器的错误。
19967表示抓取了19967个字节;
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar表示访问者使用火狐浏览器及Alexa Toolbar等访问端信息;
2、如果你的日志里格式不是如此,则代表日志格式设置不同。
3、很多日志里可以看到 200 0 0和200 0 64则都代表正常抓取。
4、抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好。
5、有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。
6、我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。
7、蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页。

(Visited 7 times, 7 visits today)

网站日志数据分析

借东风SEO外包服务恭候您的咨询,微信:2979249611
(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:网站日志数据分析https://www.seoshouye.com/laizi/262.html

发表评论

中国赞表情 摊手表情 吃瓜表情 笑哭表情 偷笑表情 衰表情 汗表情 思考表情 费解表情 抓狂表情 晕表情 流泪表情 疑问表情 嘻嘻表情 吃惊表情 鼓掌表情