标点符(钱魏 Way)

路径规划常见算法整理

Dijkstra算法 Dijkstra 算法是一种用于计算带权有向图中单源最短路径(SSSP:Single-Source Shortest Path)的算法。其解决的问题是:给定图 G 和源顶点 v,找到从 v 至图中所有顶点的最短路径。Dijkstra 算法 …

列式储存数据库:ClickHouse

ClickHouse是俄罗斯第一大搜索引擎Yandex开发的列式储存数据库。据说,这个列式储存数据库的性能大幅超越了很多商业MPP数据库软件,比如Vertica(HP Vertica成为MPP列式存储商业数据库的高性能代表,Facebook就 …

基于AARRR模型进行App体系化的数据分析

从流量经济到粉丝经济 迄今为止,大多数公司只关注三件事:流量、用户、收入。他们关注的是通过大批流量的入口,招来大批用户,然后再带来大量收入,或者换言之,这是一种“流量经济”。但现在,如上面所述人群差 …

大数据分析查询引擎Impala

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处 …

淘宝SPM流量跟踪体系的研究

一、什么是SPM SPM是淘宝社区电商业务(xTao)为外部合作伙伴(外站)提供的一套跟踪引导成交效果数据的解决方案。下面是一个跟踪点击到宝贝详情页的引导成交效果数据的SPM示例:http://detail.tmall.com/item. …

开源的列存储数据库:MonetDB

MonetDB是一个开源的面向列的数据库管理系统。MonetDB被设计用来为较大规模数据(如几百万行和数百列的数据库表)提供高性能查询的支持。MonetDB最初由荷兰阿姆斯特丹大学的Peter Boncz和Martin Kersten等人创建 …