Google Search Appliance 关键字匹配

利用关键字匹配,您可以在自己网站上宣传特定网页。 例如,如果某个部门将要发布新的“运营”网页,而该网页应在进行某类查询时返回,则您可以在特定搜索字词(例如运营)与这一新网页间建立关联,从而将用户定向到这一新的网页。 在查询包含字词

Google Search Appliance 集合

抓取工具访问您在抓取并编制索引 > 抓取网址页输入的网址和网址格式并为其编制索引。结果索引是您在抓取并编制索引 > 集合页看到的默认集合 (default_collection)。   管理员可以创建作为完整索引子集的文档集合。 每个集合都是由一组网址格式定义

Google Search Appliance 抓取频度调节

在“抓取频度调节”页上,您可以对不同网址的抓取时间进行微调。 您可以增加对新闻文档的抓取频度,而减少对存档文档的抓取频度。 在服务器文档对 GET 请求中的 If-Modified-Since 标头响应不正确时,您也可以重新抓取那些在正常情况下不会被重新抓取的网

Google Search Appliance 主机负载计划

抓取网址的数量上限 您的许可指定了您可以抓取的网址的上限。 不过,如果您的网址尚未达到许可所规定的上限,您可以为想要抓取的网址指定较小的数量上限。 如果您输入的数字小于许可指定的总页数上限,您可以提高系统性能。 在您点击保存时间表和

Google Search Appliance 文档日期

Google Search Appliance 文档日期

利用文档日期页,您可以按文档中的日期来排列和显示搜索结果。 您可以在此页定义 Search Appliance 为文档编制索引时所用的规则。 Search Appliance 可从文档的标题、正文、网址或元标记中提取日期,也可从 HTTP 服务器返回的最后修改日期中提取日期。 默认情

Google Search Appliance 对“robots.txt”文件的访问权

如果网络服务器配置为要求对所有 HTTP 或 HTTPS 请求进行身份验证,请确保创建格式与“/robots.txt”文件匹配的身份验证规则。 为了遵循“漫游器排除协议”,抓取工具将会检索 /robots.txt。如果结果是获得 HTTP 401(需要身份验证)响应代码,抓取工具将无法

Google Search Appliance 抓取时间表

在指定要抓取的网址并配置了用于抓取的服务器之后,可以通过抓取并编制索引 >  抓取时间表页选择抓取模式,对于预定抓取模式,可以指定抓取您的服务器的次数。 抓取模式 Search Appliance 具有以下抓取模式: 持续抓取。 如果您想让抓取工具自动查

Google Search Appliance 勿抓取以下格式的网址

 以下内容为Google Search Appliance 勿抓取以下格式的网址自带配置,了解搜索引擎不抓取哪些网址,才能避免自己生成的网址不被搜索引擎接受,同事如果自己想要不让搜索引擎收入某些页面,也可以在URL中使用某些特殊的符号等。 # The following are popular filetyp

Google Search Appliance 有效网址格式规则

当您指定网站上应该或不应该抓取的网址时,或在建立基于网址的集合时,网址应符合下列有效格式。 有关详情,请参阅在 Search Appliance 文档网站上发布的 Constructing URL Patterns(构建网址格式)(仅提供英语版本)。 1.任一包含主机/路径分隔斜线的网址子

Google Search Appliance 抓取与编制索引

在您开始抓取网络内容前,您需要指定一个或多个起始位置。 您可以通过指定要遵循的网址格式和要避免的网址格式来控制和优化抓取幅度。 如果要抓取指定的网址,那么这个网址必须符合仅跟踪和抓取以下格式的网址框中的“至少一个”网址格式,并且“

Page 2 of 8«12345»...Last »