标点符(钱魏 Way)

简析搜索引擎中网络爬虫的搜索策略

随着互联网的兴起及发展,人们获取信息的途径由传统方式逐渐被网络替代。 起初人们主要通过浏览网页来获取所需信息, 但随着Web不断庞大用这种方式来寻找自己所需的信息变得越来越困难。现在大多数的人很大程度上依赖于搜索引擎来帮助自己获取有用信息,因此搜索引擎技术作为最典型的Web信息获取技术 其发展直接影响人们获取信息的质量。 自从1994 年4 月世界上第一个Web 检索工具Web Crawler 问 […]

Google Panda 更新那点事

在开始阅读这篇文章之前,您需要知道的是,任何针对英文Google 的算法调整最终会迁移至中文Google,类似的算法调整在不久的时间内百度也会跟进,所有提升搜索引擎用户体验的工作不管哪个搜索引擎都会去做。 在开始将Google Panda 之前,我们先来了解下Google Panda 的来历。09年的时候Google进行了咖啡因(Google Caffeine)的更新,主要解决了谷歌的抓取和索引速 […]

使用Google Analytics跟踪搜索引擎的抓取记录

由于Google Analytics是基于javascript创建的,所以在正常情况下Google Analytics是无法跟踪到搜索引擎蜘蛛的爬行轨迹的。但是通过对google analytics原理的学习,你就可以自己动手去实现跟踪爬虫轨迹。方法和前面的使用Google Analytics跟踪手机站流量类似。很早以前也发表了一篇使用PHP跟踪爬虫轨迹的文章,很简单的代码实现,大家也可以做参考。 […]

国内搜索引擎关键词的解析方法

以下为国内搜索引擎的一些规则,共需要对来源地址进行解析的朋友使用。主要是针对解析来源关键词。

除此之外,百度的来源URL中还可以解析到上次的搜索词: http://www.baidu.com/s?bs=one&f=8&wd=two&inputT=1719 此内容仅供专业人士使用~

百度搜索研发部:页面价值

搜索引擎每天处理着数以亿计的查询请求,每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候,通过查询返回的网页结果,这些需求被满足了,我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言,页面的价值是指什么,我们为什么要研究页面价值,技术上怎样判断页面的价值呢?本文将逐一回答这些问题。 一、 什么页面价值。 前面我们说了,某个页面满足了某一用户的特定需求,就体现 […]

一种基于用户兴趣的搜索引擎输入信息处理方法

0 引言 随着网民使用互联网熟练程度的不断增加以及互联网技术的不断发展,搜索引擎技术两个主要的发展方向是实现个性化和智能化搜索[1]。个性化搜索主要是通过跟踪分析用户的搜索行为,充分地利用这些信息来提高用户的搜索效率;智能化搜索主要体现在以下两方面,一是对搜索需求信息的理解,二是系统具有自适应、自调节的能力。 目前的搜索引擎主要是采用以关键字输入为基础的检索[2,3],用户输入检索关键字向搜索引擎 […]

基于PageRank算法的搜索引擎优化策略

在介绍Google等搜索引擎最常用的PageRank搜索结果排名算法的基础上,详细阐述了各种网页链接结构对基于PageRank算法的网站搜索引擎排名结果可能产生的影响,并分析了实际应用中网站针对PageRank算法的各种优化策略,讨论了各自的优点。

影响百度区域性搜索结果的因素有哪些?

在SEOWHY的老大夫唯的引导下,最近对关键词地域性的研究貌似挺热的。于是我也来凑个热闹,说一下我的观点,本文不是为了得出某种结论或观点,而是和大家一起从另一种角度去思考SEO问题。以下为百度站长俱乐部中先前网友的提问: 网友提问:百度是不是针对地区性的搜索提高了地方性网站的权重?(竞价存在这样的问题,我这里问的是自然搜索)。这种情况也是偶尔见到,想问下,这个现象是不是随着发展 会逐渐显现明显? […]

怎样抓取关键词查询量:百度指数的分析

获取百度指数中每个关键词的查询量,可能是很多做SEO或PPC的朋友们一直想做的事,但是百度指数并不是那么容易的被抓取,主要是他的查询并不是走的一般的HTTP协议,而是AMF协议,导致给数据抓取造成了一些麻烦。下面就一起来分析到底百度是如何进行查询数据的。 百度指数的趋势分析Flash(http://index.baidu.com/fla/TrendAnalyser.swf)采用了一种股市(stoc […]

SEO基础: 改进大型站点的搜索营销

您的 Web 站点有多大?数千个页面?数百万个页面?如果页面数量超过几千个,那么在搜索引擎优化方面就会遇到在小型站点中没有的特殊问题。我们来谈谈如何对大型站点进行成功的 SEO。 大型 Web 站点对 SEO 提出了一些新挑战。如果您能够将整个 Web 团队集合在一间会议室中,那么您的站点还不算大。您或许拥有一家非常成功的企业,但是您的问题不同于我们这个四部分的 SEO 系列所探讨的问题。 在 第 […]