钱魏Way

524篇文章

机器学习聚类算法之K-Means

根据训练样本中是否包含标签信息,机器学习可以分为监督学习和无监督学习。聚类算法是典型的无监督学习,其训练的样本中值包含样本的特征,不包含样本的标签信息。在聚类算法中。利用样本的特征,将具有相似属性的…

机器学习, 法→原理 ·

关于本人关于本站

感谢关注我的个人博客! 关于本人 姓名:钱魏Way 简介:当前就职于一家在线旅游公司,工作岗位为数据产品经理策略产品经理。一直想做的事情是从数据中发现价值,并推动工具化的变现。 当前主要关注的内容:…

志→目标, 自我提升 ·

学而时习之,不亦说乎!

子曰:学而时习之,不亦说乎!有朋自远方來,不亦乐乎!人不知而不愠,不亦君子乎! 上学时,对这句话的理解是:“孔子说,经常学习,不也喜悦吗?从远方来了朋友,不也快乐吗?别人不了解我也不怨恨,不也是君子吗…

志→目标, 自我提升 ·

数据分析查询引擎Impala初探

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理…

器→工具, 开源项目 ·