所有文章

深度学习之循环神经网络RNN

循环神经网络 RNN 简介 传统的神经网络是层与层之间是全连接的,但是每层之间的神经元是没有连接的(其实是假设各个数据之间是独立的),这种结构不善于处理序列化的问题。比如要预测句子中的下一个单词是什么,这…

法→原理, 深度学习 ·

Word2Vec自然语言情感分析实战

情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观…

数据, 术→技巧 ·

多层全连接神经网络与情感分析

全连接神经网络 全连接神经网络是一种最基本的神经网络结构,英文为 Full Connection,所以一般简称 FC。FC 的准则很简单:神经网络中除输入层之外的每个节点都和上一层的所有节点有连接。 上图是一个双隐层的前…

卷积神经网络TextCNN与情感分析

在“卷积神经网络”中我们探究了如何使用二维卷积神经网络来处理二维图像数据。在之前的语言模型和文本分类任务中,我们将文本数据看作是只有一个维度的时间序列,并很自然地使用循环神经网络来表征这样的数据。其实…

数据可视化之箱形图

箱形图简介 箱形图(英文:Boxplot),又是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。箱形图于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、…

数据, 术→技巧 ·

Scikit-Learn中的异常检测算法

Sklearn 提供了一些机器学习方法,可用于奇异(Novelty)点或异常(Outlier)点检测,包括 OneClassSVM、IsolationForest、LocalOutlierFactor(LOF) 等。其中 OneClassSVM 可用于 Novelty Detection,而后两者可用…

时序异常检测实战:酒店价格

数据准备 这里使用的是公开的Expedia个性化酒店搜索中的部分数据。数据介绍: 列名 数据类型 描述 srch_id Integer 搜索ID date_time Date/time 搜索时间 site_id Integer Expedia不同的站点(例如:Expedi…

数据, 术→技巧 ·

Expedia异常检测系统Adaptive Alerting

Adaptive Alerting(AA)是Expedia开源的异常检测项目,整个项目也是完整一套监控体系,包括事件处理恢复操作都在内。系统设计主要在如何方便集成不同的异常检测算法和评估方法,然后根据指标的情况来路由和触发重…

器→工具, 开源项目 ·

时间序列异常检测算法综述

异常的分类 时间序列的异常检测问题通常表示为相对于某些标准信号或常见信号的离群点。虽然有很多的异常类型,但是我们只关注业务角度中最重要的类型,比如意外的峰值、下降、趋势变化以及等级转换(level shifts)…

Python异常检测包:PyOD

异常检测 (anomaly detection),也叫异常分析 (outlier analysis 或者 outlier detection) 或者离群值检测,在工业上有非常广泛的应用场景: 金融业:从海量数据中找到“欺诈案例”,如信用卡反诈骗,识别虚假信…

器→工具, 开源项目 ·