标点符(钱魏 Way)

Google Search Appliance 集合

抓取工具访问您在抓取并编制索引 > 抓取网址页输入的网址和网址格式并为其编制索引。结果索引是您在抓取并编制索引 > 集合页看到的默认集合 (default_collection)。  

管理员可以创建作为完整索引子集的文档集合。 每个集合都是由一组网址格式定义,其中涵盖了该集合中文档的网址。 您也可以导入某个以前从系统导出的集合配置。  

集合让您的用户得以搜索索引的特定部分。 例如,您可以创建产品集合或人力资源集合,以便实现仅对您索引中的产品或人力资源部分进行搜索。  

Search Appliance 的集合数量上限是 1500,超过这个集合数目可能导致服务失败。 重置索引可解决此问题。  

默认集合  

除了您创建的集合,在默认情况下,Search Appliance 还会针对以下内容创建集合:  

  • 完整索引(您可以自行选择是否对用户公开)
  • 基于语言的网页,支持仅搜索特定语言的网页
  • 元标记 – 支持仅搜索具有特定元标记名称或名称值对的网页
搜索集合

对单个集合的搜索结果与完全索引搜索有相同的相关性排名。 因为它被限制为搜索单个集合的内容,所以只是搜索内容的不同。  

使用页面布局助手,您可以自动修改搜索表单,从而纳入按集合搜索菜单。  

对集合进行搜索:  

要将搜索过程限制到已定义的集合,需要向搜索查询的网址中添加以下内容:  

&site=COLLECTION_NAME  

示例:  

在集合“Human_Resources:”中对“度假”的搜索:  

http://www.google.cn/search?q=度假&output=xml&client=yoursite&site=human_resources  

该搜索仅返回 Human_Resources 集合的网址中的度假结果。  

在集合“Development”和“Marketing”中搜索“产品”:  

http://www.google.cn/search?q=产品&output=xml&client=yoursite&site=(development)|(marketing)  

对于“product”的搜索结果来自于 Development 或 Marketing 集合。  

有关详情,请参阅公共 Search Appliance 文档网页上的“搜索协议参考”中的“过滤”部分。

码字很辛苦,转载请注明来自标点符《Google Search Appliance 集合》

评论