[原创]访问统计、流量解释(关键词:访问统计、流量总和、统计软件、robots.txt、蜘蛛、流量)
一、为何主机控制面板的本月流量数字远大于站点访问统计中本月每日流量的总和?
答:请从以下三方面进行核实:
1.本月流量是主站+子站的流量总和,如果您的虚拟主机开设了子站,请注意将子站的流量也统计进去;
2.访问统计中的:浏览器流量 与 非浏览器流量 二者需要相加;非浏览器流量一般是由于mp3等被迅雷等软件下载或搜索引擎的蜘蛛程序读取所引起的。
3.部分型号的主机是使用了CDN技术的,如集群主机、港台主机、双线主机等。使用了CDN技术的部分的流量在访问统计中不会体现出来。
控制面板中一般会有相应的显示,如:流量总计:15G 已经使用:2.0G (其中1G由CDN承载)。
二、为什么后台的访问统计与别的统计软件(如cnzz等)的数据差别很大?
答:我司统计软件是分析记录整个网站访问日志,即所有访问过的网页文件、图片文件、CSS文件等全部记录并且统计下来;而其他第三方统计(如cnzz)往往是基于在网页上插入统计代码,没有统计代码的文件的流量第三方统计是统计不到的。比如一个100M的rar压缩文件被迅雷下载100次,cnzz等统计不到的。所以两者统计结果有差别,而且有些结果很大。
三、为什么后台流量与访问统计中流量的结果不一致?
答:正常情况下,用户购买我司虚拟主机后,登录管理中心所显示的流量使用额与“访问统计”功能中显示的流量是一致的,但当用户使用了我司CDN技术或购买的是集群主机后,则两者之间可能会有相当大的差距,后台流量将远大于“访问统计”显示的流量。
出现这种情况的原因是,我司CDN技术实现了访问与数据中心分离,用户的访问大部分将被指向CDN结点而非数据中心服务器,仅那种无法缓存的文件(如ASP/PHP程序)才会直接到原始数据中心获取,像图片/flash/css等则直接在CDN结点上获取。我司后台显示的“流量统计”是包含了所有CDN结点上的流量,而“访问统计”中仅统计的是数据中心所产生的流量,因为大部分访问将被CDN缓存,所以两者统计结果将出现较大差距,即“后台流量统计”必将大于“访问统计”所显示的流量。
四、如何禁止掉搜索引擎蜘蛛的访问(robots.txt)?
答:在根目录下面建立robots.txt(小写)文件,通过这个文件禁止掉搜索引擎蜘蛛的访问。具体方法:
例如要禁止百度蜘蛛访问
User-agent: *
Disallow:
User-agent: baiduspider
Disallow: /
首先是User-agent,每个搜索引擎都有自己的User-agent,比如Google的为 Googlebot,百度的为 baiduspider ,可能区分大小写,其他相对应的应该到搜索引擎的帮助页面去查询一下。 * 是一个通配符,通配所有的搜索引擎,Disallow: 项目表示禁止访问的位置,第一个Disallow:后面为空,表示没有禁止访问的项目,也就是允许所有的搜索引擎收录。但如果要添加例外,还可以添加一行 User-agent: baiduspider,表示下面的规则仅适合百度蜘蛛,百度蜘蛛的规则是Disallow: / ,也就意味着禁止收录该域名下所有的网页。
特别提示:一般情况下不建议禁止搜索引擎蜘蛛的访问,禁止蜘蛛访问后您的网站可能被百度等取消收录,这会导致你的网站访问量减少,损失潜在的客户。
五、我的站为什么流量会那么高?
答:网站流量高,意味着您的网站访问量大、受客户欢迎。如果有异常流量,请在控制面板中查看“访问统计”和“流量分析”,比较每天的IP和页面访问量有多大,是否正常;文件类别、url网址是否有大量被访问情况;非浏览器流量值是否很大,如果有请检查是否被盗链或者文件有被直接下载情况;搜索引擎网站的机器人使用流量是否异常;检查网站是否有MP3、rar、zip等类型文件被大量访问情况。
我司成立9年来,累计服务超过20万家网站。所有网站的流量都是基于访问日志,通过我司自行开发的软件统计出流量,显示在“流量统计”中;同时采用国外第三方软件公司awstats的日志分析软件,显示在“访问统计”中。我们也提供了网站的原始日志供客户自行下载分析,所有网站的日志和流量都是透明的。
|
|||
>> 相关文章 | |||