根据训练样本中是否包含标签信息,机器学习可以分为监督学习和无监督学习。聚类算法是典型的无监督学习,其训练的样本中值包含样本的特征,不包含样本的标签信息。在聚类算法中。利用样本的特征,将具有相似属性的…
感谢关注我的个人博客! 关于本人 姓名:钱魏Way 简介:当前就职于一家在线旅游公司,工作岗位为数据产品经理策略产品经理。一直想做的事情是从数据中发现价值,并推动工具化的变现。 当前主要关注的内容: 各…
Impala是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。已有的 Hive 系统虽然也提供了 SQL 语义,但由于 Hive 底层执行使用的是 MapReduce 引…