监督机器学习的关键方面之一是模型评估和验证。当您评估模型的预测性能时,过程必须保持公正。为了制作训练数据(training samples)和测试数据(testing samples),常使用 sklearn 里面的 sklearn.model_selectio…
数据应用一般会有采集、加工、存储、计算及可视化这几个环节。其中采集作为源头,在确保全面、准确、及时的前提下,最终加工出来的指标结果才是有价值的。而埋点作为一种重要的采集手段,可以将用户行为信息转化为…
当下的互联网产品更多的将产品的好坏与商业上的成功与否画上等号,而实际情况是,有些能赚很多钱的项目,比如小额借贷,并非是好的产品。有些不赚钱的项目,比如维基百科也并非差的产品。 个人理解好的产品往往是…
SWOT分析 SWOT的全称是:Strengths(优势)、Weakness(弱势)、Opportunity(机会)、威胁(Threats)。而SWOT分析法这个词有些误导,因为SWOT并不是一种分析方法。SWOT只是一种获取信息的手段,以便你后续的分析…
最近工作中遇到关于酒店尾房的相关的内容,依稀记得曾经火过一段日子的"今夜酒店特价",但先前都没有研究过到底是为何会失败,于是网上找了一些资料做了些简单的整理。 今夜酒店特价的商业模式 每晚18:00开始以低…
APP唤醒与场景还原 在App投放推广中,唤醒用户是常见的运营策略。想要让用户重新活跃起来,转化用户的行为,必须从场景上还原用户的路径,从根本上找到用户增长的奥秘。 在这个广告漫天的时代,相信大多数用户在使…
定时任务的基础知识 首先,我们先了解下什么是定时任务?定时器有非常多的使用场景,大家在平时工作中应该经常遇到,例如生成月统计报表、财务对账、会员积分结算、邮件推送等,都是定时器的使用场景。定时器一般有…
关于指标体系的搭建,网上可以找到很多方法论。方法论本身没有什么问题,但很多时候实践出来的结果并没有预想的那么好。主要障碍是当按照指标体系搭建完成报表后,你会发现这些报表实际对业务的帮助非常的小。这就…
Hive简介 Hive由Facebook实现并开源,是基于Hadoop的一个数据仓库工具。可以将结构化的数据映射为一张数据库表并提供HQL(Hive SQL)查询功能。底层数据是存储在HDFS上,Hive的本质是将SQL语句转换为MapReduce任务运…
针对APP的黑产,我们提到部分用户会通过改变IP来绕过风控策略。更改IP比较方便的方法是使用代理IP或VPN。 在检测APP安全性是需要对是否使用代码和VPN做判断。以下为整理的一些代码供参考。 Android判断是否使用…