SEO

百度站长俱乐部空间服务器相关问题

百度对使用海外空间的中文网站有歧视吗? 百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策
标点符
3 sec read

百度站长俱乐部域名相关问题

网站是否在信产部备案,这是不是会成为影响网站收录和排名的一个因素?百度是否会抓取域名注册人的相关whois信息
标点符
8 sec read

百度站长俱乐部301跳转相关问题

百度对301重定向的反应很慢?将一个旧的URL进行301重定向处理,百度反应很慢?而且旧的URL会在相当一段时
标点符
3 sec read

Windows XP使用XAMPP安装Awstats

想要在自己的电脑上安装awstats进行离线日志数据分析,目前使用的是Windows XP,以下是具体安装方法
标点符
1 min read

减少雅虎蜘蛛的抓取频率的方法

如果雅虎的蜘蛛爬行来得太多,抓取频繁了,会影响百度与、谷歌等蜘蛛爬行的来访次数。百度蜘蛛比较智能,如果他发现你
标点符
9 sec read

基于网页框架和规则的网页噪音去除方法

一、相关概念 1.1 网页噪音概述 网页噪音是指在一个页面内与页面主题无关的区域及项。网页噪声可分为以下几类:
标点符
42 sec read

中文分词算法概述

一、中文分词技术综述 1、全文检索技术 所谓全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立
标点符
4 sec read

网页正文信息抽取新方法

一、基于中文标点符号和HTML 树 结构的网页正文信息抽取方法H TML  ( hyper text mark
标点符
31 sec read

基于网页分块的搜索引擎排序算法改进

一、传统搜索引擎排序算法 1. 1  搜索引擎排序算法概述 搜索引擎查询的结果按照一定的规则排序供用户查看,
标点符
25 sec read

基于标签密度的自适应正文提取方法

一、标签密度和锚文本密度 HTML 网页源码中主要包括文本和标签两大元素,并且它们是混合共存的。根据标签的作用
标点符
17 sec read

一种提高搜索引擎检索质量的网页解析法

目前的搜索引擎采用以关键字检索为基础的检索技术。即搜索引擎按关键字对整个网页进行索引和检索。在这种处理方法中,
标点符
24 sec read

基于标签路径聚类的文本信息抽取算法

1、 网页预处理 可以通过以下3 个预处理规则来过滤网页中的不可见噪声和部分可见噪声:仅删除标签本身;删除标签本身及其相应的起始与结束标签包含的HTML 文本;对HTML 标签进行修正和配对,删除源码中的乱码。
标点符
1 min read