相空间

2007-06-11

没法盲测

上周,正望咨询发布了《2007年中文搜索质量盲测评估报告》,随后评估报告的评估报告就不断地涌现。其中一些极度弱智的评估当然没有什么评论的价值,但也有一些评论,却是切中要害。

比如且听风吟提 出的问题:“在数千万计的搜索引擎用户中选取“2740人”作为分层抽样样本,误差之大可想而知”。正望的这份评估报告只选择了不到3000人的样本量, 相对于搜索引擎用户群体而言,样本量太小,另一方面,正望在免费公开的材料中,也没有提到抽样的方法。这两个因素直接导致整个采样丧失其统计学意义。且听 风吟所指出的,正是这份盲测评估报告的致命伤。

小子不才,也发现了盲测的一个致命伤,这个致命伤甚至从根本上否定了中文搜索引擎盲测存在的意义。我在这里玩了几下之后发现,只要有百度参与,真正的盲测就根本不可能实现。如果参与盲测的用户愿意,按照我提供的方法,他可以很轻松地从并列的若干种搜索结果中找出百度所提供的结果,然后根据自己的偏好做出有倾向性的选择。

下图是我尝试的结果:

百度 谷歌 搜索引擎盲测

区分百度结果的方法很简单,那就是使用疾病的名字作为关键词搜索,如果搜索结果中前三位全部是医院、诊所或者药物的信息,那么这一组搜索结果一定是百度提供的,反之,如果搜索结果中前三位有至少一条是关于疾病本身的信息,那么这一组搜索结果一定不是百度提供的。

我在上面十次测试中使用的关键词分别是:

强直性脊柱炎抑郁症牛皮癣股骨头坏死系统性红斑狼疮脊髓灰质炎过敏性哮喘乙肝糖尿病脱发

大 量广告信息挤占搜索结果固然会造成搜索体验的急剧下降,在这种情况下,盲测用户选择百度对手的搜索结果也是一种必然,但是当我们讨论盲测评估作为一种统计 手段的有效性的时候,就不能不考虑“伪盲测”对统计结果的影响了。 如果评估者希望消除“伪盲测”对测评结果的影响,唯一可行的办法是限定关键词的范围,将盲测限定在那些没有商业价值,广告竞争不激烈的关键词,但是限定关 键词的范围,又会将测评者的影响引入到评估结果中。

由此,我得出的结论是,任何有百度参与的搜索引擎用户体验盲测,都是没有统计意义的。
2006-10-24

参加盲测游戏,按照秘笈赢大奖!

雅虎推出了一个盲测游戏,还有奖。
总结了一下游戏的秘笈
首先要选择你更喜欢雅虎,而不是百度
然后点击进入热词挑战
进入热词挑战之后会出现一个词表
记住,在这个词表里面选病的名字,什么乙肝,糖尿病,帕金森,不孕不育都可以
实在不成就选补肾药特效药一针见效之类的内容
之后就会出现一左一右两个搜索结果
仔细观察搜索结果,哪个广告多,那一准是百度的
什么?哪位说广告认不出来?你不会看啊!
这时候点选广告少的那个为雅虎的结果
按咱这个秘笈
百发百种,屡试不爽

看洒家的战绩
2006-06-21

维基百科 百度百科:谁是真正的草根

百度百科上线两个月了,自从上线以来,百度百科一直以“草根百科”的形象示人,它的运营者和拥趸们声称:相比于美国血统的中文维基百科,百度百科会吸引更多中国网民的参与,它更草根,它更适合中国网民的使用习惯,它会更受欢迎,它会更成功。拥趸们更进一步指出:维基百科是精英的游戏,它在中国注定失败,wikipedian们只有摒弃门户之见,落草去百度百科,才是唯一的正途。

问题在于,百度百科是真正的草根吗?

它不是!百度百科如《中国大百科全书》、《大英百科全书》一样是只属于精英的。

百度百科虽然采取了类似wiki的开放式编辑系统,虽然如所有的wiki一样允许使用者自由添加和更改内容,但是它和所有真正的wiki本质的区别在于, 它对抄袭和拷贝采取纵容鼓励的态度。这样做的直接结果就是,百度百科那22万条内容,几乎全部是“草根参与者”们抄袭来的,草根们在这里体验到的,只有拷贝的成功与喜悦,粘贴的成功与喜悦,赚取积分的成功与喜悦;永远也不会感受到百度百科所标榜的亲手撰写百科全书的成就与喜悦

最终的结果,是百度百科用积分这根胡萝卜,诱骗草根们放弃了开放式编辑系统赋予他们的,自己编写百科全书的权利。中文互联网仍然延续原有的格局:80%有价值的内容由20%的精英贡献,而另外80%的参与者只是负责把这些内容四处搬运。

所以,百度的草根,是形式上的草根,是伪草根。它的实际作用只是进一步维护和强化少数精英在中文互联网世界强势地位。

问题还在于,维基百科是精英的游戏吗?

它不是!维基百科才是真正草根的百科全书

维基百科的参与者是普通人,他们是半夜跑去食堂看球的大学生;他们是上课时偷偷看漫画的高中生;他们是每天去幼儿园接儿子回家的爸爸;他们是骑自行车下班顺道买菜的小职员。相比于抱着胳膊装酷的李彦宏,这些人才是真正的草根。
     

维基百科所做的,只是让这些小人物知道,我也能亲手写出百科全书,我们自己查阅资料,自己整理材料,自己动笔书写,自己按下快门拍照,一样能撰写出精美完整的百科全书条目。看看这里的中山市科举,人们不能不惊叹,原来普通人也能做得到。

让小人物重拾话语权,这才是真正的草根

话说到这里,不能不重提老调:百度对中国网民的蔑视。

在百度眼里,中国网民是贪婪、懒惰、低能的,撰写百科全书只是极少数精英才具备的能力。为了扩张自己公司的实力,为了所谓的用户粘性,百度针对最广大贪 婪、懒惰、低能的中国网民推出百度百科:因为他们贪婪,所以用积分刺激,为了迁就他们的懒惰和低能,便对抄袭不闻不问。于是百度获得了可观的流量,培养了 忠实的用户群体,而中国网民却像那温吞水里的青蛙,慢慢放弃了独立撰写文章的能力,也慢慢丧失了对抄袭行为最基本的道德判断,于是中国网民愈发贪婪、懒 惰、低能,百度愈发肆无忌惮地蔑视和利用中国网民。

中国网民不是不可以改变的,维基百科做到了,它让人们知道,自己应该承担的权利和义务,它让人们看到,自己也有撰写文章的能力。

一个网站,应该承担他的社会责任。
2006-06-19

不带这么糟践人的!

在google上不去的日子,百度的刘建国告诉人们,Google是精英的,百度是草根的,google只会去做一些稀奇古怪的产品,百度却是在满足中国网民的实际需要。

中国网民的实际需要是什么?另一个百度的人告诉说,中国网民是很可爱的:他 们使用互联网的习惯和其他国家不太一样.他们喜欢简单和送到眼前,所看即所得,不需要等待和复杂的点击.在大部分人眼里,搜索引擎是什么定义他们并不知 道,他们只想要例如以下这些东西:当做一道宫爆鸡丁的菜的时候,想知道具体步骤;当自己早上刷牙发现老是出血,想知道原因;想知道什么时候去秦皇岛旅游最 合适;想知道高考往年都有哪些录取分数线;等等等等.这些东西在搜索引擎上无法得到完全的答案,即使有结果,他们也不知道是正确还是错误的.但是他们认 为,这些问题在搜索引擎上能找到答案。

难怪google的产品都是稀奇古怪的,难怪百度在满足中国网民的实际需要。原来在百度眼里,中国网民就是如此一副白痴加无赖的形象:

中国网民理解不了那稀奇古怪的Google earth,只有百度的地图,才能满足中国网民的需要

中国网民根本就没有能力写出wikipedia的条目,只有放任抄袭的百度百科,才能满足中国网民的需要

中国网民没有时间观念,Google calendar那样的产品压根就没有任何用途

中国网民喜欢被流氓插件强奸,装卸自如的Google tollbar远远不如百度搜霸符合中国网民的使用习惯

中国网民漠视版权,只有同样漠视版权的百度MP3才能满足他们的需求

可不带这么糟践人的啊!

都是人,都是上网的人,凭什么在你们眼里中国网民使用互联网的习惯就和其他国家的人不一样?是谁把善良、勇敢、勤劳、智慧的中国人民变成了贪婪、懒惰、怯 懦、弱智的中国网民?这一切,还不是百度、新浪、搜狐、腾讯这些主导中国互联网的企业们,你们一手引导出来的!就是这些企业本身对著作权的漠视、对用户权 利的漠视、对用户种种不良行为乃至违法行为的迁就、默许纵容和鼓励,一步步塑造出了这样一群用户,塑造出了这样的国情。

到现在百度这样的企业又跳出来带着轻蔑的口吻说,中国网民很可爱,他们很白痴,他们需要的是我们这样的服务,你们那些把中国网民当人看的外国公司,你们玩不转。

吃人家,用人家,毁人家,坑人家,最后还糟践人家。 一个企业真的不能无耻成这样
分页共1页 1