自1987年中国发出第一封电子邮件以来,中国互联网产业的发展已经将近20年。中国的互联网市场也已发展成为仅次于美国的世界第二大市场。网民规模已超过1.3亿(年报),中文成为互联网第二大语言。在传统互联网行业(新闻、搜索引擎、电子邮件等)保持高速增长的同时,各种新兴的互联网服务行业(如网络视频、WEB2.0、博客网络)也在风起云涌,丰富了互联网服务的应用领域。
网络的快速发展也使得信息的共享和获取更加方便快捷。如何收集和汇总网站的信息,作为我们决策的依据,一直是国内企业关注的焦点。但我们也应该看到,在国内互联网市场快速增长的同时,对相关网络流量的评估和分析却一直滞后。尤其是缺乏权威、整洁的网站流量综合排名机构,使得中国网站长期依赖国外网站流量分析机构的统计数据。
所谓第三方网站流量排名服务,就是通过一个完全中立的第三方平台监控所有网站的流量,并使用自己的一套算法来评估网站流量。依次。网站流量的统计、排名、调查、分析和推广在中国早已存在,但混乱且极不规则。不仅没有统一的标准,大家也根据自己的理解来定义术语。因此,大家在讨论和讨论中缺乏必要的沟通基础。国际上有这方面比较成功的案例。这是一个通过发布世界网站排名来吸引注意力的网站。成立于1996年4月,1999年被亚马逊收购。他们的目标是让冲浪者共享虚拟世界的资源,参与更多的资源。组织。作为业务单位,国外数据仅供参考。国外公司更注重对流量的深入分析,而不是简单的排名。但是,在中国,公司的排名早已被业界视为标准,那么它是否适合中国网站对流量排名的需求呢?事实上,2006年以来中国的网站排名数据越来越受到质疑,原因如下:在中国,公司的排名早已被业界视为标准网站排名,那么它是否适合中国网站对流量排名的需求?事实上,2006年以来中国的网站排名数据越来越受到质疑,原因如下:在中国,公司的排名早已被业界视为标准,那么它是否适合中国网站对流量排名的需求?事实上,2006年以来中国的网站排名数据越来越受到质疑,原因如下:
1、对中国互联网了解不足
互联网虽然提倡“连接无极限”,但并不代表不受国界和地域的影响。语言、文化、习俗、意识形态、经济基础等因素的差异,会导致不同地区网民的上网习惯、浏览取向、网络消费习惯的差异,最终体现在不同地区的网站流量特征上. 例如:在国外很受欢迎的维基百科网站,基本上只限于国内的小群体。而在国内知名度很高的纯社区网站(如百度贴吧、天涯、猫铺等)在国外的知名度远不及国内。又如:国内网友有“看文章评论”的习惯,而且经常会有网站发表文章,导致流量大幅增加seo优化,但这种情况在国外很少发生,所以网站排名必须结合当地特点制定标准。长期以来对中国互联网现状缺乏了解,与国内互联网行业缺乏沟通,2007年8月,按照自己的标准,单方面大幅降低中国网站排名就是一个明显的例子.
2. 统计模型的固有缺陷
统计方法也存在明显的缺陷。任何网站的统计一般有两种方法:一种是客户统计(我们称之为K统计)和由此产生的客户排名(我们称之为K排名);二是网站统计(我们称之为K排名)。W统计)和网站端排名(即W排名)据此得出。K统计的方法是在网友的电脑上安装一个统计插件。插件可以自动记录网友浏览网页的行为,比如登录了哪些网站,打开了哪些网页,打开网页的时间等。这些记录会被统计插件自动保存。中并存储。发送到流量统计平台,平台会根据自己的算法统计所有网友终端发回的记录,计算网站的流量排名。属于这种模式。可见K统计是一种抽样统计方式,结果的好坏完全取决于安装统计插件的网友数量。外挂网民的地域分布和横向分布)非常关键。W统计即网站端统计,即在网站服务器上安装相应的统计软件,记录所有客户的访问量,对访问量进行统计分析。这两类方法在统计学上各有特点,但也有各自的局限性。我们可以从以下主要方面进行比较:
在方法评估方面,客户统计(K统计),网站统计(W统计)
对真实流量进行采样,只记录大概的比例就可以记录当天的总流量
流量忠诚度可以统计流量忠诚度。无法判断统计IP是否来自多个用户。
或者不同的IP是否代表一个用户,
因此,无法计算流量忠诚度。
对用户的跟踪分析可以长期进行,但无法跟踪网民的访问行为。
只要安装统计插件的用户在线,只会记录当天的访问记录
统计错误率低和高
由此可以看出,客户端统计的优势在于对流量的深入分析,尤其是针对不同特征的网民群体(如企业用户群体)的个性化分析,而网站端的统计是在宏观交通统计中。有先天优势。我们可以用一种直观的方式来说明这两种方法的优点。假设在一个人满为患的场所,网站统计可以统计声音的分贝水平,而客户端则分析不同人群主要说什么。如果将这两种方法结合起来,将大大提高网站流量排名的准确性和深度。
3. 统计样本的局限性
让我们再次分析模式。如前所述,在数据客户端统计模式下,数据源都是安装了统计插件的网友。由于统计插件本身对网友的实用价值不大,为了鼓励网友积极安装,一般都打包成实用软件。统计插件是浏览器工具栏( ),可以为普通网民提供搜索引擎服务。不过工具栏没有中文版,产品设计对中国网友来说不太实用。因此,在中国积极安装的中国网民大多是网站管理员和互联网专业人士,以提高他们网站的排名。这些群体在中国1亿网民中只占很小的比例,但他们的上网行为被抽样统计为中国网民的常见行为。一般来说,作为一种抽样统计模型网站排名,统计样本必须均匀分布,不仅是地域性的关键词优化,而且网络操作水平、知识水平、职业背景等都必须均匀分布,否则统计结果会受到严重影响。统计抽样存在严重偏差。
4、作弊处理标准不符合中国互联网特点
2007年8月,中国网站数据调整,导致中国网站排名大幅下降。确实有作弊网站,但也有很多网站被“流量杀死”。中国拥有世界第二大网民市场,在世界500强网站中,中国网站仅占一小部分,甚至一些韩日网站排名领先于中国网站。主要原因是有一个反作弊机制,有自己定制的标准,任何数据增长不符合这个机制的网站都在被打压的范围内。反作弊是保证排名公平的重要措施,但必须考虑不同国家的互联网文化。