标点符(钱魏 Way)

Google Search Appliance 搜索日志

搜索日志记录了从索引获取信息的用户请求。 您可以生成并导出这一信息,然后将其输入喜欢的日志分析软件或报告软件。

下面是搜索日志可提供的信息的一些示例:

  • 用户执行了哪些类型的查询?
  • 用户点击了用户界面的哪些部分?
  • 为用户提供服务的速度如何?
  • 用户得到所需结果了吗?
  • 您需要通过配置相关查询、关键字匹配、查询扩展或单一框功能帮助用户查找相关信息吗?

您能够在设备中保留最多 100 个覆盖所有集合的搜索日志。

日志的格式是公用日志格式 (Common Log Format, CLF) 的简单扩展。 文件对于每个请求包含单独的一行。 一行由若干个以空格分隔的令牌组成:

主机 — [日期时间] 请求状态字节结果时间

  • 主机: 客户机的 IP 地址。
  • 日期: 请求的日期和时间,采用以下格式:
    • 日期 = [天/月/年:小时:分钟:秒 区域]
    • 天 = 2*位数字
    • 月份 = 3*个字母
    • 年度 = 4*位数字
    • 小时 = 2*位数字
    • 分钟 = 2*位数字
    • 秒 = 2*位数字
    • 区域 = (+' | -‘) 4*位数字
  • 请求: 来自客户机的请求行,包含在双引号 (“) 内。
  • 状态: 返回客户端的由三位数字组成的状态代码。
  • 字节: 返回到客户端的字节数。
  • 结果: 返回到客户端的搜索结果数。
  • 时间: 完成此请求所用的总时间(秒)

您可以搜索日志,以查找包含特定字符串的所有行。

请注意: 在指定时区方面,Search Appliance 不再遵循 POSIX 标准。 它采用指定本地时间与格林尼治标准时间差别的时差制。 这样,日本的时区应该指定为 GMT+9,因为它比格林尼治标准时间快 9 个小时。

对日志数据的维护为期 90 天。

导出“高级搜索报告”:

“高级搜索报告”中的每个条目表示用户在 Search Appliance 用户界面(搜索页或结果页)上的一次点击。 每个条目由以下项的值组成:

  • 以百分之一秒为单位的点击时间
  • 做出点击的用户的 IP 地址
  • 会话 ID 的占据位置,始终为空
  • 点击类型,如下表所述
  • 点击起始页(用户点击得到的结果页)
  • 点击排名(用户点击得到的结果页的排名)
  • 点击数据,通常为空
  • 查询(返回结果的用户查询)
  • 用户点击的网址

下面的例子显示了高级搜索报告中的一个条目:

121331555476,172.18.75.121, ,onebox,0,0,,hobo,http://www.tropo.com/

下表描述了 Search Appliance 内置的点击类型:

点击类型 说明
高级 搜索页上的高级搜索链接
advanced_swr 对其他文字的高级搜索
c 搜索结果
缓存 结果页上的缓存文档
集群 结果页上的集群标签
db 结果页上的数据库内容
desk.groups 搜索页顶部的论坛链接
desk.images 搜索页顶部的图片链接
desk.local 搜索页顶部的本地链接
desk.news 搜索页顶部的资讯链接
desk.web 搜索页顶部的网络链接
帮助 搜索页上的搜索提示链接
关键字匹配 结果页上的关键字匹配
徽标 超链接徽标
nav.next 导航,下一页
nav.page 导航,特定页
nav.prev 导航,上一页
单一框 结果页上的单一框
sitesearch 结果页上的“更多结果来自…链接”
排序 结果页上的排序链接
拼写 拼写建议
同义词 结果页上的相关查询
其他 未注解链接

您还可以为前端创建点击类型。 有关详情,请参阅 公共 Search Appliance 文档网页上的“创建搜索体验:最佳实践”。

定义搜索日志

生成搜索日志

  1. 显示集合搜索日志菜单中,指定您希望涵盖其搜索查询的具体集合。
  2. 日志的名称最多能包含 20 个字母数字类字符、连字符和下划线。 名称不能以连字符开始。
  3. 确定内容的具体时间范围。
  4. 点击生成日志

虽然设备并不会阻止您创建多个并行的日志,但是建议您最好不要这样做。 为了实现最佳效果,请每次创建一个日志。

码字很辛苦,转载请注明来自标点符《Google Search Appliance 搜索日志》

评论