搜索引擎停用词

为节省存储空间和提高搜索效率,搜索引擎在索引页面或处理搜索请求时会自动忽略某些字或词,这些字或词即被称为Stop Words(停用词)。

Stop Words大致为如下三类:

  1. 应用十分广泛,在Internet上随处可见的词,比如“Web”一词几乎在每个网站上均会出现,对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率。
  2. 语气助词、副词、介词、连接词等,通常自身并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”、“在”之类。
  3. 受某种人为因素,搜索引擎屏蔽的词。

了解Stop Words,在网页内容中适当地减少Stop Words出现的频率,可以有效地帮助提高关键词密度,而在网页Title中避免出现Stop Words往往能够让我们优化的关键词更突出。

部分中文停用词和英文Stop Words下载:http://www.box.net/shared/yo2j2t8y19

微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

基于供需的Airbnb动态定价策略

什么是Airbnb动态定价 所谓的Airbnb动态定价其实就是根据市场上的供应需求调整Airbnb上房价的单位

机器学习如何重塑价格优化

设定合适价格的挑战 为商品或服务设定合适的价格是经济学理论中的一个老问题。一家公司可能会寻求最大化每一个单销售

机器学习价格优化前的数据准备

关于机器学习的定价有一些很好的理论,特别是“正确”的数据对于建立一个成功的机器学习模型的重要性。但实际上,我们

2 Replies to “搜索引擎停用词”

Niu Shine Shine进行回复 取消回复

电子邮件地址不会被公开。 必填项已用*标注