标点符(钱魏 Way)

Google Search Appliance 搜索日志

搜索日志记录了从索引获取信息的用户请求。 您可以生成并导出这一信息,然后将其输入喜欢的日志分析软件或报告软件。 下面是搜索日志可提供的信息的一些示例: 用户执行了哪些类型的查询? 用户点击了用户界面的哪些部分? 为用户提供服务的速度如何? 用户得到所需结果了吗? 您需要通过配置相关查询、关键字匹配、查询扩展或单一框功能帮助用户查找相关信息吗? 您能够在设备中保留最多 100 个覆盖所有集合的搜索日 […]

Google Search Appliance 抓取队列

抓取队列是设备等待抓取的网址以及已到抓取时间的网址的集合。 该信息可帮助您确定在恰当时间是否正在抓取特定主机,以及为什么来自某文档的信息比其他信息要新,等等。 由于抓取队列会在抓取工具处理新信息的过程中不断更改,因此该队列是动态的。 所以,抓取队列快照显示的是当前状况,但不是将来发生的情况的确切预测。 在您获取抓取队列快照之后,队列可能会更改。 请注意,创建抓取队列快照会占用大量资源,因此会降低抓 […]

Google Search Appliance 查询扩展

查询扩展可让 Search Appliance 自动向用户的搜索查询添加额外字词,以返回更多相关结果。 使用查询扩展时,Search Appliance 可扩展两类字词: 用户给出的词的同词干词。 例如,如果用户查找“engineer”,Search Appliance 能向查询中添加“engineers”。 一个或多个以空格分隔的字词(与用户提供的词互为同义词或与密切相关)。 例如,如果用户搜索 […]

Google Search Appliance 过滤器

通过服务 > 前端 > 过滤器页,按前端限制用户的搜索。 您可以使用以下过滤器和策略: 域 – 将搜索限制在一个或多个域名(并非 IP 地址) 语言 – 将搜索限制在所有语言或所选择的一组语言 文件类型 – 将搜索限制在一个或多个文件类型,例如 HTML、PDF 等等 元标记 – 按元标记中的值和值类型过滤搜索 查询扩展策略 &#8211 […]

Google Search Appliance 相关查询

您可以使用“相关查询”将替代字词或短语与指定的搜索字词关联起来。 当用户输入指定的搜索字词时,替代字词将作为建议显示出来。 用户可以点击建议的替代字词开始另一次搜索。 例如,如果用户搜索“Mark Twain”,搜索结果将建议搜索“Sam Clemens”。 如果用户搜索“File Transfer Protocol”,搜索结果将建议搜索“FTP”。 除非您使用 XSLT 样式表修改文本,否则相关 […]

Google Search Appliance 关键字匹配

利用关键字匹配,您可以在自己网站上宣传特定网页。 例如,如果某个部门将要发布新的“运营”网页,而该网页应在进行某类查询时返回,则您可以在特定搜索字词(例如运营)与这一新网页间建立关联,从而将用户定向到这一新的网页。 在查询包含字词运营时,会返回该新网页的链接,并且该链接会显示在搜索结果旁边(如同文字广告一样)。 如果网页尚未成为“生产索引”的一部分,或者指向网页的链接很少,从而造成网页在结果列表中 […]

Google Search Appliance 集合

抓取工具访问您在抓取并编制索引 > 抓取网址页输入的网址和网址格式并为其编制索引。结果索引是您在抓取并编制索引 > 集合页看到的默认集合 (default_collection)。   管理员可以创建作为完整索引子集的文档集合。 每个集合都是由一组网址格式定义,其中涵盖了该集合中文档的网址。 您也可以导入某个以前从系统导出的集合配置。   集合让您的用户得以搜索索引的特定部分。 例如, […]

Google Search Appliance 抓取频度调节

在“抓取频度调节”页上,您可以对不同网址的抓取时间进行微调。 您可以增加对新闻文档的抓取频度,而减少对存档文档的抓取频度。 在服务器文档对 GET 请求中的 If-Modified-Since 标头响应不正确时,您也可以重新抓取那些在正常情况下不会被重新抓取的网址。 频繁抓取 您可能有经常更改的内容,更新频率为每小时一次,甚至每几分钟一次。 在抓取并编制索引 > 抓取频度调节页上,您可以指定 […]

Google Search Appliance 主机负载计划

抓取网址的数量上限 您的许可指定了您可以抓取的网址的上限。 不过,如果您的网址尚未达到许可所规定的上限,您可以为想要抓取的网址指定较小的数量上限。 如果您输入的数字小于许可指定的总页数上限,您可以提高系统性能。 在您点击保存时间表和主机负载按钮后,系统最多比您指定数量多抓取约 10% 的内容。 系统抓取的网址要稍微多一些,这样在清除重复后,页数与您指定的上限将非常接近。 请注意: 如果您将此框保留 […]

Google Search Appliance 文档日期

利用文档日期页,您可以按文档中的日期来排列和显示搜索结果。 您可以在此页定义 Search Appliance 为文档编制索引时所用的规则。 Search Appliance 可从文档的标题、正文、网址或元标记中提取日期,也可从 HTTP 服务器返回的最后修改日期中提取日期。 默认情况下,会在 HTTP 标头针对所有文档返回的最后修改日期字段中查找日期。 文档日期搜索还会在非 HTML 文件的正文 […]