分类: 术→技巧

Word2Vec自然语言情感分析实战

情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观…

数据, 术→技巧 ·

多层全连接神经网络与情感分析

全连接神经网络 全连接神经网络是一种最基本的神经网络结构,英文为Full Connection,所以一般简称FC。FC的准则很简单:神经网络中除输入层之外的每个节点都和上一层的所有节点有连接。 上图是一个双隐层的…

卷积神经网络TextCNN与情感分析

在“卷积神经网络”中我们探究了如何使用二维卷积神经网络来处理二维图像数据。在之前的语言模型和文本分类任务中,我们将文本数据看作是只有一个维度的时间序列,并很自然地使用循环神经网络来表征这样的数据。其实…

数据可视化之箱形图

箱形图简介 箱形图(英文:Box plot),又是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值…

数据, 术→技巧 ·

Scikit-Learn中的异常检测算法

Sklearn提供了一些机器学习方法,可用于奇异(Novelty)点或异常(Outlier)点检测,包括OneClassSVM、Isolation Forest、Local Outlier Factor (LOF) 等。其中OneClassSVM可用于Novelty Detection,而后两者可用于…

时序异常检测实战:酒店价格

数据准备 这里使用的是公开的Expedia 个性化酒店搜索中的部分数据。数据介绍: 列名 数据类型 描述 srch_id Integer 搜索ID date_time Date/time 搜索时间 site_id Integer Expedia…

数据, 术→技巧 ·

时间序列异常检测算法综述

异常的分类 时间序列的异常检测问题通常表示为相对于某些标准信号或常见信号的离群点。虽然有很多的异常类型,但是我们只关注业务角度中最重要的类型,比如意外的峰值、下降、趋势变化以及等级转换(level shifts…

分层时间记忆算法HTM

分层时间记忆算法(Hierarchical Temporal Memory),全称HTM Cortical Learning Algorithms是由Numenta公司发表的新一代人工智能算法。HTM算法旨在模拟新大脑皮层的工作原理,将复杂的问题转化为模式匹配与预测。正…

频繁项集算法Eclat

Equivalence Class Transformation(Eclat)是频繁项挖掘和关联性分析的另外一种常用的算法,与Apriori和FP-growth不同的是,Eclat采用垂直数据格式。所谓的垂直数据格式,就是从对原有数据进行倒排。 Apriori算法…

数据, 术→技巧 ·

格兰杰因果关系检验

格兰杰因果关系检验简介 格兰杰因果关系检验(英语:Granger causality test)是一种假设检定的统计方法,检验一组时间序列x是否为另一组时间序列y的原因。它的基础是回归分析当中的自回归模型。回归分析通常只能…

数据, 术→技巧 ·