标点符(钱魏 Way)

百度搜索研发部:日志分析方法概述

日志在计算机系统中是一个非常广泛的概念,任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志的内容、规模和用途也各不相同,很难一概而论。本文讨论的日志处理方法中的日志,仅指Web日志。其实并没有精确的定义,可能包括但不限于各种前端Web服务器——apache、lighttpd、tomcat等产生的用户访问日志,以及各种Web应用程序自己输出的日志。 在Web日志中,每条日志通常代表着用 […]

awstats高级应用之扩展报表

日志分析工具Awstats的强大就在于它可以设置扩展。之遥你稍微懂一点Perl的正则表达式,你就可以让awstats无比强大。 Awstats的扩展设置,其实就是设定自定义报表。要给你的日志分析添加自定义报表,只需要修改awstats.domain.conf文件中的Extra Section。以下为自带的说明: #—————— […]

Windows XP使用XAMPP安装Awstats

想要在自己的电脑上安装awstats进行离线日志数据分析,目前使用的是Windows XP,以下是具体安装方法,供其他人参考。 为了能使awstats有个访问环境首先安装XAMPP,XAMPP的下载地址为:http://www.apachefriends.org/zh_cn/xampp.html,具体XAMPP的安装方法不在这里详述了。我安装到了E:\xampp。 接下来为了可以正常的执行awst […]

WEB日志的作用和缺陷

Avinash Kaushik将点击流数据的获取方式分为4种:log files、web beacons、JavaScript tags和packet sniffers,其中包嗅探器(packet sniffers)比较不常见,最传统的获取方式是通过WEB日志文件(log files);而beacons和JavaScript是目前较为流行的方式,Google Analytics目前就是采用beac […]

WEB日志格式及分析工具

WEB日志是网站分析和网站数据数据整理最基础的数据,了解其格式和组成将有利于更好地进行数据的收集、处理和分析。 一、日志格式类型 目前常见的WEB日志格式主要由两类,一类是Apache的NCSA日志格式,另一类是IIS的W3C日志格式。NCSA格式又分为NCSA普 通日志格式(CLF)和NCSA扩展日志格式(ECLF)两类,目前最常用的是NCSA扩展日志格式(ECLF)及基于自定义类型的Apach […]

AWStats-分析网站日志工具

AWStats是一个功能强大的免费服务器日志分析工具,它可以记录 Web/Mail/FTP的浏览者的IP、PV、UV、访问者操作系统、访问者浏览器、系统繁忙时间、搜索引擎来源、关键词来源、蜘蛛访问、错误链接等信息。 AWStats相比Webalizer具有的优势: 友好的用户界面:多语言支持,支持简体中文 良好的跨平台支持:AWStats基于Perl,可运行在GNU/Linux或Windows上( […]