术→技巧 – 第 48 页

分类：术→技巧

Python网络请求库Requests使用技巧

Requests 库是用来在 Python 中发出标准的 HTTP 请求。它将请求背后的复杂性抽象成一个漂亮，简单的 API，以便你可以专注于与服务交互和在应用程序中使用数据。 Requests POST/GET 参数常用参数见下表： Reque…

术→技巧, 研发 · 2020-10-14

Python异常重试解决方案

数据抓取时，经常遇到由于网络问题导致的程序异常，一开始的做法只是记录了错误内容，并对错误内容再进行后期处理。这里整理了一些更好的异常重试方法或机制。初始版本： def crawl_page(url): pass def l…

术→技巧, 研发 · 2020-10-14

HTML网页解析提取工具lxml和XPath

在数据抓取过程中，经常遇到需要解析HTML中的内容，常用的是用正则表达式，今天主要介绍lxml工具及xpath的语法。 lxml简介 lxml是一款高性能Python XML库，它天生支持XPath 1.0、XSLT 1.0、定制元素类，甚至Python…

器→工具, 开源项目, 术→技巧, 研发 · 2020-10-14

条件随机场CRF及CRF++安装与使用

条件随机场(conditional random field, CRF)是用来标注和划分序列结构数据的概率化结构模型。言下之意，就是对于给定的输出，标识序列Y和观测序列X，条件随机场通过定义条件概率P(Y|X)，而不是联合概率分布P(X,Y)来…

器→工具, 工具软件, 数据, 术→技巧, 机器学习, 法→原理, 自然语言处理 · 2020-10-14

最小熵原理确认词向量维度

随着NLP的发展，像Word2Vec、Glove这样的词向量模型，正逐渐地被基于Transformer的BERT等模型代替，不过经典始终是经典，词向量模型依然在不少场景发光发热，并且仍有不少值得我们去研究的地方。本文来关心一个词向…

数据, 术→技巧, 法→原理, 自然语言处理 · 2020-10-13

Python中文简繁繁简转换

中文繁体、简体的差异，在NPL中类似英文中的大小写，但又比大小写更为复杂，比如同样为繁体字，大陆、香港和台湾又不一样。 OpenCC（Open Chinese Convert) OpenCC是一个开源的中文繁简转化项目，支持词汇级别的…

数据, 术→技巧 · 2020-10-13

Python字符串模糊匹配库FuzzyWuzzy

在计算机科学中，字符串模糊匹配（fuzzy string matching）是一种近似地（而不是精确地）查找与模式匹配的字符串的技术。换句话说，字符串模糊匹配是一种搜索，即使用户拼错单词或只输入部分单词进行搜索，也能够找…

数据, 术→技巧 · 2020-10-12

航空公司客户价值分析模型LRFCM

谈到用户分类模型，最被谈及的应该就是RFM模型了。大部分人常把RFM模型挂在嘴边，而在实际使用中的却很难真正的利用起来。这里暂时不去讨论RFM是好是坏。今天的介绍的是另外一个拓展的模型：航空公司客户价值分析模…

数据, 术→技巧, 运营 · 2020-10-12

酒店标签化销售的机会与挑战

什么是酒店标签化销售酒店客房产品标签化的销售（Attribute-Based Selling，简称“ABS”）并不是给酒店打上标签然后进行销售。而是将现有客房价值点的拆分，用户根据不同价值点的组合预订酒店。当旅行者进行酒店预订…

产品, 术→技巧 · 2020-10-12

价格歧视在酒店收益管理中的运用

一次旅行，我们在登机后，可能会发现邻座乘客的价格与自己都不相同；一场电影，我们在进场后，可能会发现旁边的观众票价和自己全都不一样；一家酒店，我们在经营时，可能每天每间房的价格都会出现变化。在酒店管…

术→技巧, 运营 · 2020-10-12

分类目录

分类：术→技巧

Python网络请求库Requests使用技巧

Python异常重试解决方案

HTML网页解析提取工具lxml和XPath

条件随机场CRF及CRF++安装与使用

最小熵原理确认词向量维度

Python中文简繁繁简转换

Python字符串模糊匹配库FuzzyWuzzy

航空公司客户价值分析模型LRFCM

酒店标签化销售的机会与挑战

价格歧视在酒店收益管理中的运用

热门文章：

互联网黑灰产产业链初探

通俗易懂理解数据库概念

统计学中的数值变换

界面设计和游戏设计中的认知负荷

理解认知偏差

Facebook Prophet使用与调参实践

探索性数据分析详解

机器学习算法之LightGBM

网站URL设计远没那么简单

分类： 术→技巧

热门文章：

分类：术→技巧