抓取工具访问您在抓取并编制索引 > 抓取网址页输入的网址和网址格式并为其编制索引。结果索引是您在抓取并编制索引 > 集合页看到的默认集合 (default_collection)。
管理员可以创建作为完整索引子集的文档集合。 每个集合都是由一组网址格式定义,其中涵盖了该集合中文档的网址。 您也可以导入某个以前从系统导出的集合配置。
集合让您的用户得以搜索索引的特定部分。 例如,您可以创建产品集合或人力资源集合,以便实现仅对您索引中的产品或人力资源部分进行搜索。
Search Appliance 的集合数量上限是 1500,超过这个集合数目可能导致服务失败。 重置索引可解决此问题。
默认集合
除了您创建的集合,在默认情况下,Search Appliance 还会针对以下内容创建集合:
- 完整索引(您可以自行选择是否对用户公开)
- 基于语言的网页,支持仅搜索特定语言的网页
- 元标记 – 支持仅搜索具有特定元标记名称或名称值对的网页
对单个集合的搜索结果与完全索引搜索有相同的相关性排名。 因为它被限制为搜索单个集合的内容,所以只是搜索内容的不同。
使用页面布局助手,您可以自动修改搜索表单,从而纳入按集合搜索菜单。
对集合进行搜索:
要将搜索过程限制到已定义的集合,需要向搜索查询的网址中添加以下内容:
&site=COLLECTION_NAME
示例:
在集合“Human_Resources:”中对“度假”的搜索:
http://www.google.cn/search?q=度假&output=xml&client=yoursite&site=human_resources
该搜索仅返回 Human_Resources 集合的网址中的度假结果。
在集合“Development”和“Marketing”中搜索“产品”:
http://www.google.cn/search?q=产品&output=xml&client=yoursite&site=(development)|(marketing)
对于“product”的搜索结果来自于 Development 或 Marketing 集合。
有关详情,请参阅公共 Search Appliance 文档网页上的“搜索协议参考”中的“过滤”部分。










该日志还没有评论。