在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,主要分为:监督学习,非监督学习,半监督学习和强化学习。监督学习主要用于回归和分类;半监督学习主要用于分类,回归,半监督聚类;无…
日常生活中,生物识别技术已经是多数智能手机的标配,大多数手机具备人脸识别、指纹识别等功能,目前的指纹识别技术已经非常成熟。但我们今天要聊的并不是生物识别技术中的指纹识别,而是浏览器指纹。很多人对这项…
在听《字谈字畅》节目的时候了解到了一个新的概念:中文拼音正词法。 《中文拼音正词法基本规则》是中华人民共和国国家标准GB/T16159—1996,1996-01-22国家技术监督局发布,1996-07-01实施。以下为摘录内容: 总…
对于深度学习或机器学习模型而言,我们不仅要求它对训练数据集有很好的拟合(训练误差),同时也希望它可以对未知数据集(测试集)有很好的拟合结果(泛化能力),所产生的测试误差被称为泛化误差。度量泛化能力的…
监督机器学习的关键方面之一是模型评估和验证。当您评估模型的预测性能时,过程必须保持公正。为了制作训练数据(training samples)和测试数据(testing samples),常使用 sklearn 里面的 sklearn.model_selectio…
数据应用一般会有采集、加工、存储、计算及可视化这几个环节。其中采集作为源头,在确保全面、准确、及时的前提下,最终加工出来的指标结果才是有价值的。而埋点作为一种重要的采集手段,可以将用户行为信息转化为…
APP唤醒与场景还原 在App投放推广中,唤醒用户是常见的运营策略。想要让用户重新活跃起来,转化用户的行为,必须从场景上还原用户的路径,从根本上找到用户增长的奥秘。 在这个广告漫天的时代,相信大多数用户在使…
关于指标体系的搭建,网上可以找到很多方法论。方法论本身没有什么问题,但很多时候实践出来的结果并没有预想的那么好。主要障碍是当按照指标体系搭建完成报表后,你会发现这些报表实际对业务的帮助非常的小。这就…
Hive简介 Hive由Facebook实现并开源,是基于Hadoop的一个数据仓库工具。可以将结构化的数据映射为一张数据库表并提供HQL(Hive SQL)查询功能。底层数据是存储在HDFS上,Hive的本质是将SQL语句转换为MapReduce任务运…
针对APP的黑产,我们提到部分用户会通过改变IP来绕过风控策略。更改IP比较方便的方法是使用代理IP或VPN。 在检测APP安全性是需要对是否使用代码和VPN做判断。以下为整理的一些代码供参考。 Android判断是否使用…