《社交网络》中Facemash算法分析

6 sec read

在电影《社交网络》的开始有这么一段,扎克博格由于被女友甩了,所以需要做一个网站(www.facemash.com),用来推选哈佛最漂亮的女生。网站的逻辑非常的简单,就是系统从照片库中随机挑出两幅女生照片,选择两者较“美”者。就是这么一个网站在上线两小时(周末凌晨两点到四点)内点击量达到了2万2千次,从而导致了哈佛网络的瘫痪。(备注:最近华中科技大学女生的照片也被类似的放到了网上评比,并且使用山寨的域名www.hust-facemash.com)

信息的关注应该注意到,上述功能中涉及到一个排名规则,是由扎克博格那位同学提供的,他把公式写在了窗户上,如下截图:

上面的公式主要作用作用是用来对进行女生的分数进行评比,从而确定哪些是最优质女生。不过让人遗憾的是电影中给出的这个公式是错误的公式,真正的公式应该如下:

即分数线下方是1+10的幂次,而非10的倍数。上诉的排名公式并非扎克博格等人原创,而是出自匈牙利裔美国物理学家Arpad Elo,这算法叫作: Elo Rating ,最初应用于国际象棋排名,现在也广泛应该于足球、篮球等运动。中文称为等级分排名。

下面就来对算法进行解读,Arpad Elo认为:

  1. 参赛选手在每次比赛中的表现成正态分布;后来普遍认为Logistic逻辑斯蒂)分布更为合理。
  2. 在一局比赛中,赢的一方被认为表现较好,输的一方被认为表现较差;若平局,则双方表现大致相当。

公式中出现的

Ea/Eb为选手A/B的期望值,即A/B选手获胜的概率。当选手A和B进行比赛时,可根据公式算出两选手的期望表现。

Ra/Rb为选手A/B当前的等级分排名。

如果选手的表现比期望要好,那么此选手的排名应该上升。相反,若表现不如期望,则排名会下降。

Sa为选手A本局的得分(1或0),K为常数,数值越大比分变动越快,在大师级象棋赛中通常取16。用这个公式来计算出选手A本局比赛后的等级分排名。

另外关于Logistic的分布图如下:

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

根据需求选择最佳客户旅程分析平台

越来越多的营销人员和客户体验专业人士正在寻找最佳的客户旅程分析平台,以便在个人层面上大规模地了解并与个人客户互
14 sec read

什么是 Customer Journey Analytics…

如果您发现自己在问“什么是客户旅程分析?”,那么您并不孤单。客户旅程分析是指客户与多个渠道之间以及随着时间的推
4 sec read

什么是In-DBMS Analytics?

多年来,数据分析在某种意义上一直是一种”移动”的体验。企业将他们想要分析的数据从数据库
0 sec read

2 Replies to “《社交网络》中Facemash算法分析”

发表评论

电子邮件地址不会被公开。 必填项已用*标注