数据收集

Chukwa:开源分布式数据收集系统

Chukwa 是一个开源的用于监控大型分布式系统的数据收集系统。它构建在 hadoop 的 hdfs 和 ma

分布式日志系统:Scribe

Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。它能够从各种日志源

如何获取用户访问过哪些网站

如何获取用户历史访问过的网站在分析用户使用习惯或者使用环境等都起来很重要的作用,比如说通过用户历史访问的网站类