Surus 简介 Surus 是 NetFlix 开源的 UDFs,是基于 pig 和 hive 的数据分析工具。Surus 中的功能能够解决多种多样的问题,例如评分预测模型、异常检测与模式匹配等。目前开源的 UDF 功能主要包括两个,包括 ScorePM…
Impala是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。已有的 Hive 系统虽然也提供了 SQL 语义,但由于 Hive 底层执行使用的是 MapReduce 引…