<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>标点符 &#187; 网站分析</title>
	<atom:link href="http://www.biaodianfu.com/category/sem/web-analytics/feed" rel="self" type="application/rss+xml" />
	<link>http://www.biaodianfu.com</link>
	<description>编译自己的互联网生活</description>
	<lastBuildDate>Thu, 29 Jul 2010 04:58:14 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0</generator>
		<item>
		<title>从WEB日志到点击流</title>
		<link>http://www.biaodianfu.com/weblog-to-clickstream.html</link>
		<comments>http://www.biaodianfu.com/weblog-to-clickstream.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 17:27:29 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[日志]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2422</guid>
		<description><![CDATA[我们平常在看网站分析相关文章的时候，时常会看到“点击流(Clickstream)”这个词，点击流数据是网站分析的主要来源。那么究竟什么是点 击流数据，它又来源于何处，为什么它是网站分析的基础数据？关于这些问题的系统解释，推荐阅读《点击流数据仓库》这本书，这里先对这几个问题做下简单的回 答。 首先，点击流来源于何处？可能从文章标题就可以看出来了，点击流数据来源于网站日志，其实就是用户日常浏览你的网站时产生的日志信息。那为什么不直接叫网站浏览日志，而叫点击流数据呢？可以先看一下下面这张图： 从图上可以看出点击流这个概念更注重用户浏览网站的整个流程，网站日志中记录的用户点击就像是图上的“点”，而点击流更像是将这些“点”串起来形成的“线”。也可以把“点”认为是网站的Page，而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的，它可以比网站日志包含更多的信息，从而使基于点击流数据统计得到的结果更加丰富和高效。 那么点击流数据是如何从WEB日志中扩展出来的呢？其实很简单，只要有Sessionid和站内Referrers就可以将这些“点”串联起 来。其中Sessionid唯一地标识一条点击流，再通过Referrers确定这个Session中页面被依次访问的顺序，那么这条线就可以轻松地画出 来了。 通常我们会分两张表（数据库中）或两种格式的文件（文件系统中）来记录点击流数据，一张记录“点”的信息，另一张记录“线”的信息： 线（Session）的信息：Sessionid（唯一标识符）、访问来源（Referrers）、进入页面 （Entrance）、离开页面（Exit）、开始时间（Begin Time）、结束时间（End Time）、访问时长（Time on Site）、访问页面数（Depth of Visit）、访问用户（Cookie）…… 有没有发现，当你拥有这些信息时，很多网站分析度量的计算变简单了：来源（Sources）、进入页面（Entrances）、离开页面 （Exits）可以直接获得，平均访问时间和平均浏览页面数也可以通过简单计算得到，连Bounce Rate的计算也变得简单了，只要选择那些访问页面数为1的“线”就行。 点（Page）的信息：URL、点击时间（Hit Time）、页面停留时间（Time on Page）、位于Session的第几步（Step），Sessionid（在关系数据库中可以用于跟Session表的外键关联）…… 其实点的信息被简化了，当然你可以添加更多的信息，比如页面响应状态码，冗余访问用户的Cookie等。但是这里多了一个有意思的信息—— Step，这个是基于Session的，通过Step你可以发现其实你已经追踪到了用户的访问足迹，这个信息在梳理网站的流程、计算转化率 （Conversion Rate）的时候非常有用，也可以基于它做用户行为分析。其实这就是点击流，并没有那么复杂，但是可以注意到，当WEB日志转化成点击流数据的时候，很多网站分析度量的计算变得简单了，这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量。 原文链接：http://webdataanalysis.net/data-collection-and-preprocessing/weblog-to-clickstream/]]></description>
			<content:encoded><![CDATA[<p>我们平常在看网站分析相关文章的时候，时常会看到“点击流(Clickstream)”这个词，点击流数据是网站分析的主要来源。那么究竟什么是点 击流数据，它又来源于何处，为什么它是网站分析的基础数据？关于这些问题的系统解释，推荐阅读《点击流数据仓库》这本书，这里先对这几个问题做下简单的回 答。</p>
<p>首先，点击流来源于何处？可能从文章标题就可以看出来了，点击流数据来源于网站日志，其实就是用户日常浏览你的网站时产生的日志信息。那为什么不直接叫网站浏览日志，而叫点击流数据呢？可以先看一下下面这张图：</p>
<p><img class="alignnone size-full wp-image-2423" title="clickstream" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/clickstream.png" alt="" width="399" height="194" /></p>
<p>从图上可以看出<strong>点击流这个概念更注重用户浏览网站的整个流程，网站日志中记录的用户点击就像是图上的“点”，而点击流更像是将这些“点”串起来形成的“线”。</strong>也可以把“点”认为是网站的Page，而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的，它可以比网站日志包含更多的信息，从而使基于点击流数据统计得到的结果更加丰富和高效。</p>
<p>那么点击流数据是如何从WEB日志中扩展出来的呢？其实很简单，只要有Sessionid和站内Referrers就可以将这些“点”串联起 来。其中Sessionid唯一地标识一条点击流，再通过Referrers确定这个Session中页面被依次访问的顺序，那么这条线就可以轻松地画出 来了。</p>
<p>通常我们会分两张表（数据库中）或两种格式的文件（文件系统中）来记录点击流数据，一张记录“点”的信息，另一张记录“线”的信息：</p>
<p>线（Session）的信息：Sessionid（唯一标识符）、访问来源（Referrers）、进入页面 （Entrance）、离开页面（Exit）、开始时间（Begin Time）、结束时间（End Time）、访问时长（Time on  Site）、访问页面数（Depth of Visit）、访问用户（Cookie）……</p>
<p>有没有发现，当你拥有这些信息时，很多网站分析度量的计算变简单了：来源（Sources）、进入页面（Entrances）、离开页面 （Exits）可以直接获得，平均访问时间和平均浏览页面数也可以通过简单计算得到，连Bounce  Rate的计算也变得简单了，只要选择那些访问页面数为1的“线”就行。</p>
<p>点（Page）的信息：URL、点击时间（Hit Time）、页面停留时间（Time on Page）、位于Session的第几步（Step），Sessionid（在关系数据库中可以用于跟Session表的外键关联）……</p>
<p>其实点的信息被简化了，当然你可以添加更多的信息，比如页面响应状态码，冗余访问用户的Cookie等。但是这里多了一个有意思的信息—— Step，这个是基于Session的，通过Step你可以发现其实你已经追踪到了用户的访问足迹，这个信息在梳理网站的流程、计算转化率 （Conversion Rate）的时候非常有用，也可以基于它做用户行为分析。其实这就是点击流，并没有那么复杂，但是可以注意到，当WEB日志转化成点击流数据的时候，很多网站分析度量的计算变得简单了，这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量。</p>
<p>原文链接：http://webdataanalysis.net/data-collection-and-preprocessing/weblog-to-clickstream/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/weblog-to-clickstream.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>淘宝网信用评价模型分析</title>
		<link>http://www.biaodianfu.com/taobao-credit-evaluation-model.html</link>
		<comments>http://www.biaodianfu.com/taobao-credit-evaluation-model.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 17:06:15 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[信用]]></category>
		<category><![CDATA[淘宝]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2411</guid>
		<description><![CDATA[在网络购物市场迅猛发展的同时，网络购物的交易信用问题日益突出，成为网络购物双方最关注的焦点之一。在C2C 交易中，由于参与者一般为个人或小型企业，他们知名度小，交易双方彼此不了解，其行为也难以进行有效地约束，因此在交易过程中最易出现欺诈行为。现有的网络购物网站信用评价模型都较为简单，虽然在 一定程度上得到普及，但不能很好地反映用户真实的信用水平。本文以“淘宝网”为例，建立有效、实用的网络购物网站信用评价模型并进行实证分析。模型分为两 部分，一部分是淘宝网商的信用反馈评价指标体系的设计，反映评价者的主观意愿，其中运用AHP方法确定各指标权重；另一部分是综合考虑其他对信用评价有重 要影响的因素，和信用反馈评价指标体系集结成为基于多影响因素的淘宝网商信用评价模型。最后，结合本文提出的信用评价模型和“淘宝网”的实际情况，提出了 “评价即加分”的信用评价规则。 一、 C2C电子商务中的信任问题 C2C电子商务平台从诞生起就面临着突出的信任问题，产生的主要原因如下: 信息不对称 信任作为一种交换媒介或价值运动的特殊形式与信息密切相关。信息技术在给C2C市场带来沟通便利的同时也为虚假信息的制造提供了方便，丰富的信息在给交易 者提供更多决策支持的同时也增加了虚假信息误导其做出非理性决策的可能性。因此，信息不对称问题严重阻碍着交易双方信任关系的建立｡ 时间差 在C2C平台进行交易时，交易双方往往是诺言在先兑现在后、约定在前完成约定在后｡有了时间差就有了风险，从而给交易者带来了信任的问题。 匿名制 网络是个虚拟的环境，交易者在网上是匿名的。匿名能够保护个人隐私，是在线交易吸引用户的一个重要方面，但同时匿名也产生了网络欺诈的空间，降低了交易者对网上交易的信任度。 二、现有C2C网络购物网站信用评价模型分析 目 前，许多C2C网络购物网站纷纷建立了各自的信用评价体系，各个网站的信用评价规则有所不同。从评价内容方面，大致分为两类：一类只有“好”、“中”、 “差”三种评价，另一类则具有简单评价指标；从积分规则方面：一类采用累计值的方法，一类采用平均值的方法；从买卖家身份方面：一类网站采用“所有评价一起积分”的制度，一类网站则采用“买卖信用值分离”的制度。 国内C2C网络购物网站大多采用 “好”、“中”、“差”信用评价方法，该评价方法具有操作便捷的优点，很快得到普及，但是在评价标准的制定方面却显得十分模糊。如国内最大的两个C2C网 络购物网站——“易趣网”和“淘宝网”。具有简单评价指标的信用评价体系由于评价内容较为具体，有效地减少了评价者评判的主观性，同时使评价更具有针对 性，使卖家更能明确哪项指标下的信用还需要加强和改进。如“中关村在线”中的商家信用评价。这两种评价方式除了打分外，一般都可以进行评价留言，使卖家更清楚买家对自己的产品和服务的评价，也便于其他潜在买家更好地了解该卖家的信用反馈。 现有的信用评价模型比较简单，在一定程度上得到普及。但是仍存在以下不足，如： 对买家身份验证的不足：对卖家身份，一般C2C网络购物网站都有一套身份验证的机制，但为吸引更多买家，对买家身份的验证则简单很多，有些甚至不需要进行验证； 现有指标评分只是评价者对被评价者的一个主观评分，没有一个可以客观反映交易状况的评价指标体系，用户无法了解历史评价者对交易中各因子(例如对被评价者态度､商品质量､商品价格､配送速度等)的具体评分，从而不利于新的交易者作出客观的交易决策｡ 评价等级设计不准确：信用评价等级设计过于简单，仅设“好评”、“中评”、“差评”三档，评价的规则尺度因人而异，无法理性度量； 信用评价没有考虑时间因素：现有的信用评价模型仅起到记录流水账的作用，没有考虑不同历史时期的信用值对信用的不同影响； 信用评价缺乏对评价用户信用的考虑：信用度高的评价用户做出的评价更具有可信性，对被评用户的信用影响应该更大； 信用评价缺乏对交易金额的考虑：没有对交易金额进行考虑，不能反映实际情况，同时也为信用炒作提供可能； 信用评价率较低：“淘宝网”的评价率是60%-70%，美国eBay的评价率为50%-60%，目前的网络购物信用评价率较低，影响了评价真实性。 三、淘宝网商信用反馈评价指标体系的建立 1.淘宝网商信用反馈评价指标体系指标的确定 通过对C2C网络购物信用风险的分析，在电子商务信用评价理论和服务评价理论（SERVQUAL 和ZPM 提出的E-SERVQUAL）的基础上，综合了国内外学者对于电子商务信用模型的研究成果，并结合C2C网络购物的特点，建立如下淘宝网商信用反馈评价指标体系： 以上指标体系为理论指标体系，考虑到“淘宝网”上的实际数据获取和评价方评价的准确性，同时根据“淘宝网”最新关于物流公司服务单独评价的规定，将以上理论指标体系进行简化，得出淘宝网商的信用反馈评价实证指标体系，如下表所示： 2.淘宝网商信用反馈评价指标体系权重的确定 本文运用AHP方法确定淘宝网商（卖家）信用反馈评价实证指标体系中各指标的权重。通过对“淘宝网”的实际数据调研和相关专家的建议，构造判断矩阵，最终得出各指标权重如下表： 四、基于多影响因素的淘宝网商信用评价模型 1.基于多影响因素的淘宝网商信用评价模型影响因素分析 在淘宝网商信用反馈评价指标体系的基础上，构建基于多影响因素的信用评价模型。参照累加信任值模型，引入交易价格、评价时间、评价方信用值、防欺诈因子因素，使基于多影响因素的淘宝网商信用评价模型不但考虑买家反馈评价的主观内容，还考虑影响信用值的客观因素。 交易价格 目前的在线信用评价模型中，每次交易引起的信用增加值是相同的，即加1或减1，而与交易价格无关，这为信用欺诈提供了可能。一些卖家在开店初期出售一些价格 低的产品，迅速积累信用，到后期转而销售一些高价格的产品从而骗取消费者的信任。另外一些卖家在进行交易时，要求买家本来一次可以购买结算的产品分成多次 来拍卖，从而获取不当的信用积分。本文将交易价格因素融入信用模型中，以降低信用欺诈行为给信用值计算带来的负面影响。 评价时间 信用是在一段时期上的概念，不是时间点上的概念。信用的形成是一个随时间变化的积累过程，信用评价在不同时期不具有简单的累加性。通常近期的信用反馈评价要 比早期的评价更能反映因交易用户行为变化所引起的信用波动，也更具有参考价值。因此，在计算给卖家的信用值时，应该考虑信用反馈评价的时间权重。 评价方信用值 现 有的信用评价模型在计算用户的信用值时，都没有考虑评价方的信用值。为了增加信用值，交易双方有时会串通相互给予高分信用评价，所以信用值高的用户做出的 信用反馈评价相对于信用值低的用户更具有参考价值。因此，引入评价方信用值因素，可以有效防范信用值较低的用户，通过虚假交易，相互评分来提升信用，以谋 求高额收益。 [...]]]></description>
			<content:encoded><![CDATA[<p>在网络购物市场迅猛发展的同时，网络购物的交易信用问题日益突出，成为网络购物双方最关注的焦点之一。在C2C   交易中，由于参与者一般为个人或小型企业，他们知名度小，交易双方彼此不了解，其行为也难以进行有效地约束，因此在交易过程中最易出现欺诈行为。现有的网络购物网站信用评价模型都较为简单，虽然在 一定程度上得到普及，但不能很好地反映用户真实的信用水平。本文以“淘宝网”为例，建立有效、实用的网络购物网站信用评价模型并进行实证分析。模型分为两 部分，一部分是淘宝网商的信用反馈评价指标体系的设计，反映评价者的主观意愿，其中运用AHP方法确定各指标权重；另一部分是综合考虑其他对信用评价有重 要影响的因素，和信用反馈评价指标体系集结成为基于多影响因素的淘宝网商信用评价模型。最后，结合本文提出的信用评价模型和“淘宝网”的实际情况，提出了 “评价即加分”的信用评价规则。</p>
<p>一、 C2C电子商务中的信任问题</p>
<p>C2C电子商务平台从诞生起就面临着突出的信任问题，产生的主要原因如下:</p>
<ol>
<li>信息不对称  信任作为一种交换媒介或价值运动的特殊形式与信息密切相关。信息技术在给C2C市场带来沟通便利的同时也为虚假信息的制造提供了方便，丰富的信息在给交易 者提供更多决策支持的同时也增加了虚假信息误导其做出非理性决策的可能性。因此，信息不对称问题严重阻碍着交易双方信任关系的建立｡</li>
<li>时间差 在C2C平台进行交易时，交易双方往往是诺言在先兑现在后、约定在前完成约定在后｡有了时间差就有了风险，从而给交易者带来了信任的问题。</li>
<li>匿名制 网络是个虚拟的环境，交易者在网上是匿名的。匿名能够保护个人隐私，是在线交易吸引用户的一个重要方面，但同时匿名也产生了网络欺诈的空间，降低了交易者对网上交易的信任度。</li>
</ol>
<p>二、现有C2C网络购物网站信用评价模型分析</p>
<p>目 前，许多C2C网络购物网站纷纷建立了各自的信用评价体系，各个网站的信用评价规则有所不同。从评价内容方面，大致分为两类：一类只有“好”、“中”、 “差”三种评价，另一类则具有简单评价指标；从积分规则方面：一类采用累计值的方法，一类采用平均值的方法；从买卖家身份方面：一类网站采用“所有评价一起积分”的制度，一类网站则采用“买卖信用值分离”的制度。<br />
国内C2C网络购物网站大多采用  “好”、“中”、“差”信用评价方法，该评价方法具有操作便捷的优点，很快得到普及，但是在评价标准的制定方面却显得十分模糊。如国内最大的两个C2C网 络购物网站——“易趣网”和“淘宝网”。具有简单评价指标的信用评价体系由于评价内容较为具体，有效地减少了评价者评判的主观性，同时使评价更具有针对 性，使卖家更能明确哪项指标下的信用还需要加强和改进。如“中关村在线”中的商家信用评价。这两种评价方式除了打分外，一般都可以进行评价留言，使卖家更清楚买家对自己的产品和服务的评价，也便于其他潜在买家更好地了解该卖家的信用反馈。<br />
现有的信用评价模型比较简单，在一定程度上得到普及。但是仍存在以下不足，如：</p>
<ol>
<li>对买家身份验证的不足：对卖家身份，一般C2C网络购物网站都有一套身份验证的机制，但为吸引更多买家，对买家身份的验证则简单很多，有些甚至不需要进行验证；</li>
<li>现有指标评分只是评价者对被评价者的一个主观评分，没有一个可以客观反映交易状况的评价指标体系，用户无法了解历史评价者对交易中各因子(例如对被评价者态度､商品质量､商品价格､配送速度等)的具体评分，从而不利于新的交易者作出客观的交易决策｡</li>
<li>评价等级设计不准确：信用评价等级设计过于简单，仅设“好评”、“中评”、“差评”三档，评价的规则尺度因人而异，无法理性度量；</li>
<li>信用评价没有考虑时间因素：现有的信用评价模型仅起到记录流水账的作用，没有考虑不同历史时期的信用值对信用的不同影响；</li>
<li>信用评价缺乏对评价用户信用的考虑：信用度高的评价用户做出的评价更具有可信性，对被评用户的信用影响应该更大；</li>
<li>信用评价缺乏对交易金额的考虑：没有对交易金额进行考虑，不能反映实际情况，同时也为信用炒作提供可能；</li>
<li>信用评价率较低：“淘宝网”的评价率是60%-70%，美国eBay的评价率为50%-60%，目前的网络购物信用评价率较低，影响了评价真实性。</li>
</ol>
<p>三、淘宝网商信用反馈评价指标体系的建立</p>
<p>1.淘宝网商信用反馈评价指标体系指标的确定</p>
<p>通过对C2C网络购物信用风险的分析，在电子商务信用评价理论和服务评价理论（SERVQUAL 和ZPM 提出的E-SERVQUAL）的基础上，综合了国内外学者对于电子商务信用模型的研究成果，并结合C2C网络购物的特点，建立如下淘宝网商信用反馈评价指标体系：</p>
<p><img class="alignnone size-full wp-image-2412" title="taobao-credit" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/taobao-credit.jpg" alt="" width="483" height="419" /></p>
<p>以上指标体系为理论指标体系，考虑到“淘宝网”上的实际数据获取和评价方评价的准确性，同时根据“淘宝网”最新关于物流公司服务单独评价的规定，将以上理论指标体系进行简化，得出淘宝网商的信用反馈评价实证指标体系，如下表所示：</p>
<p><img class="alignnone size-full wp-image-2413" title="taobao-credit-2" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/taobao-credit-2.jpg" alt="" width="505" height="269" /></p>
<p>2.淘宝网商信用反馈评价指标体系权重的确定<br />
本文运用AHP方法确定淘宝网商（卖家）信用反馈评价实证指标体系中各指标的权重。通过对“淘宝网”的实际数据调研和相关专家的建议，构造判断矩阵，最终得出各指标权重如下表：</p>
<p><img class="alignnone size-full wp-image-2414" title="taobao-credit-3" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/taobao-credit-3.jpg" alt="" width="643" height="267" /></p>
<p>四、基于多影响因素的淘宝网商信用评价模型</p>
<p>1.基于多影响因素的淘宝网商信用评价模型影响因素分析</p>
<p>在淘宝网商信用反馈评价指标体系的基础上，构建基于多影响因素的信用评价模型。参照累加信任值模型，引入交易价格、评价时间、评价方信用值、防欺诈因子因素，使基于多影响因素的淘宝网商信用评价模型不但考虑买家反馈评价的主观内容，还考虑影响信用值的客观因素。</p>
<ol>
<li> 交易价格 目前的在线信用评价模型中，每次交易引起的信用增加值是相同的，即加1或减1，而与交易价格无关，这为信用欺诈提供了可能。一些卖家在开店初期出售一些价格 低的产品，迅速积累信用，到后期转而销售一些高价格的产品从而骗取消费者的信任。另外一些卖家在进行交易时，要求买家本来一次可以购买结算的产品分成多次 来拍卖，从而获取不当的信用积分。本文将交易价格因素融入信用模型中，以降低信用欺诈行为给信用值计算带来的负面影响。</li>
<li> 评价时间 信用是在一段时期上的概念，不是时间点上的概念。信用的形成是一个随时间变化的积累过程，信用评价在不同时期不具有简单的累加性。通常近期的信用反馈评价要 比早期的评价更能反映因交易用户行为变化所引起的信用波动，也更具有参考价值。因此，在计算给卖家的信用值时，应该考虑信用反馈评价的时间权重。</li>
<li>评价方信用值 现 有的信用评价模型在计算用户的信用值时，都没有考虑评价方的信用值。为了增加信用值，交易双方有时会串通相互给予高分信用评价，所以信用值高的用户做出的 信用反馈评价相对于信用值低的用户更具有参考价值。因此，引入评价方信用值因素，可以有效防范信用值较低的用户，通过虚假交易，相互评分来提升信用，以谋 求高额收益。</li>
<li>访欺诈因子 为了防止信用炒作，“淘宝网”制定了一系列交易规则，如下： 发布纯信息，即无独立载体信息；包含但不仅限于如下情况：减肥秘方、赚钱方法、会员招募、商品知识介绍、免费信息以及购物体验介绍等等。 发布免费获取、低价商品；包含但不仅限于如下情况：无偿从发行方获得的优惠券或资格权、免费商品、软件下载、电子刊物（凡是通过网络传输的一切电子商 品）、电子邮件地址邀请等；1元以下虚拟类商品（不包括：Q币/收费Q秀/点卡按元充/游戏货币；Q币/收费Q秀/点卡按元充/新手卡不能低于0.1 元）；1元及1元以下服务类商品等等。</li>
</ol>
<p>由此看出“淘宝网”针对交易金额的信用炒作规定发布免费或低于l元及以下的产品为信用炒作。同时，一般情 况下，如果一笔交易的交易价格低于邮寄费用，交易方会认为这笔交易不划算，所以当交易价格低于邮寄费用时，也认为存在信用炒作。综合以上因素，基于多影响 因素的淘宝网商信用评价模型的结构如下图所示：</p>
<p><img class="alignnone size-full wp-image-2415" title="taobao-credit-framework" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/taobao-credit-framework.jpg" alt="" width="590" height="309" /></p>
<p>2.基于多影响因素的淘宝网商信用评价模型的定义和表示</p>
<p>定义1：卖家为s，N（s）表示卖家s的交易伙伴集合。</p>
<p>定义2：给定卖家 s，在时间[t-1，t]内，设b为s的交易伙伴，即b∈N（s），则p（b，s）为卖家s和买家b的交易价格；tb∈[t-1，t]，tb为买家评价的 时间；f（b，s）为买家b给予卖家s的信用反馈评分；rt（s）为卖家当前的信用值，rt（b）为买家当前的信用值；α为防欺诈因子。</p>
<p>根据以上定义，给出如下的基于多影响因素的淘宝网商信用评价模型，即在给定时间t，卖家的信用值rt（s）计算方法如公式(1)：</p>
<p><img class="alignnone size-full wp-image-2416" title="rts" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/rts.jpg" alt="" width="661" height="92" /></p>
<p>其中wt（b）表示评价者的信用值权重。评价者的信用值不同，做出的评价应赋予不同的权重，如下表所示：</p>
<p><img class="alignnone size-full wp-image-2417" title="credit-value" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/credit-value.jpg" alt="" width="298" height="233" /></p>
<p>v（b,s）为交易价格的权重函数。由于较贵的产品交易量相对较少，如果只按交易次数来确定信用值的变化存在不合理性，所以引入交易价格权重，交易价格越大，权重越大，可表示为：</p>
<p><img class="alignnone size-full wp-image-2418" title="vbs" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/vbs.jpg" alt="" width="195" height="79" /></p>
<p>其中p（b，s）为卖家s和买家b的交易价格，V为平均交易价格，V=200。</p>
<p>u（tb）为评价时间的权重，根据评价时间的不同，交易者做出的评价应赋予不同的权重，如下表所示：</p>
<p><img class="alignnone size-full wp-image-2419" title="utb" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/utb.jpg" alt="" width="253" height="213" /></p>
<p>α为防欺诈因子，z为本次交易的邮寄费用，根据“淘宝网”交易规则，规定如公式(2)：</p>
<p><img class="alignnone size-full wp-image-2420" title="a" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/a.jpg" alt="" width="564" height="82" /></p>
<p>3.“淘宝网”信用反馈评价规则</p>
<p>根据本文提出的基于多影响因素的淘宝网商信用评价模型，结合“淘宝网”的实际用户评价情况，为提高“淘宝网”的信用评价率，提出以下信用评价规则：为鼓励买家进行信用评价，规定买家每对“淘宝网商信用反馈评价指标体系”中的一项指标进行评价，则在相应卖家的 互评中信用值增加0.05分，简称“评价有加分”。对于买家没有进行评价的指标，系统默认为“一般”。假设买家A对卖家B的n项信用指标进行评价，则在卖 家B对买家A的互评中，买家A的实际分数为：卖家B对买家A的评分+n*0.05。</p>
<p>五、结语</p>
<p>本文提出的信用评价模型不能绝对准确地反映用户的信用值，但较“淘宝网”现有的信用评价模型，提出了一些改进意见。总之，信用评价的影响因素有很多，尤其是在怎么有效防范信用炒作等行为以及消除其对信用评价的不良影响方面，还需要进一步的研究。</p>
<p><span style="color: #ff0000;">本文内容来源于互联网，出处未知。</span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/taobao-credit-evaluation-model.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>session和cookie的区别</title>
		<link>http://www.biaodianfu.com/session-and-cookie.html</link>
		<comments>http://www.biaodianfu.com/session-and-cookie.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 14:24:47 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[Cookie]]></category>
		<category><![CDATA[session]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2400</guid>
		<description><![CDATA[session和cookie是网站浏览中较为常见的两个概念，也是比较难以辨析的两个概念，但它们在点击流及基于用户浏览行为的网站分析中却相当关键。 session和cookie的最大区别在于session是保存在服务端的内存里面，而cookie保存于浏览器或客户端文件里面；session是基于访问的进程，记录了一个访问的开始到结束，当浏览器或进程关闭之后，session也就“消失”了，而cookie更多地被用于标识用户，它可以是长久的，用于用户跟踪和识别唯一用户（Unique Visitor）。 关于session session被用于表示一个持续的连接状态，在网站访问中一般指代客户端浏览器的进程从开启到结束的过程。session其实就是网站分析的访问（visits）度量，表示一个访问的过程。 session的常见实现形式是会话cookie（session cookie），即未设置过期时间的cookie，这个cookie的默认生命周期为浏览器会话期间，只要关闭浏览器窗口，cookie就消失了。实现机 制是当用户发起一个请求的时候，服务器会检查该请求中是否包含sessionid，如果未包含，则系统会创造一个名为JSESSIONID的输出 cookie返回给浏览器（只放入内存，并不存在硬盘中），并将其以HashTable的形式写到服务器的内存里面； 当已经包含sessionid是，服务端会检查找到与该session相匹配的信息，如果存在则直接使用该sessionid，若不存在则重新生成新的 session。这里需要注意的是session始终是有服务端创建的，并非浏览器自己生成的。 但是浏览器的cookie被禁止后session就需要用get方法的URL重写的机制或使用POST方法提交隐藏表单的形式来实现。 这里有一个很关键性的注意点，即session失效时间的设置，这里要分两方面来看：浏览器端和服务端。对于浏览器端而言，session与访问进程直接相关，当浏览器被关闭时，session也随之消失；而服务器端的session失效时间一般是人为设置的，目的是能定期地释放内存空间，减小服务器压力，一般的设置为当会话处于非活动状态达20或30分钟时清除该 session，所以浏览器端和服务端的session并非同时消失的，session的中断也并不一定意味着用户一定离开了该网站。目前Google Analytics和Omniture都定义当间隔30分钟没有动作时，算作一次访问结束，所以上图中session的最后一步不只是离开，也有可能是静 止、休眠或者发呆的状态。 还有一点需要注意，就是现在的浏览器好像趋向于多进程的session共享，即通过多个标签或页面打开多个进程访问同一网站时共享一个 session cookie，只有当浏览器被关闭时才会被清除，也就是你有可能在标签中关闭了该网站，但只要浏览器未被关闭并且在服务器端的session未失效前重新开启该网站，那么就还是使用原session进行浏览；而某些浏览器在打开多页面时也可能建立独立的session，IE8、Chrome默认都是共享 session的，在IE8中可以通过菜单栏中的文件-&#62;新建会话来建立独立session的浏览页面。 关于Cookies cookie 是一小段文本信息，伴随着用户请求和页面在Web服务器和浏览器之间传递。用户每次访问站点时，Web应用程序都可以读取cookie包含的信息。 session的实现机制里面已经介绍了常见的方法是使用会话cookie（session cookie）的方式，而平常所说的cookie主要指的是另一类cookie——持久cookie（persistent cookies）。持久cookie是指存放于客户端硬盘中的 cookie信息（设置了一定的有效期限），当用户访问某网站时，浏览器就会在本地硬盘上查找与该网站相关联的cookie。如果该cookie 存在，浏览器就将它与页面请求一起通过HTTP报头信息发送到您的站点，然后在系统会比对cookie中各属性和值是否与存放在服务器端的信息一致，并根据比对结果确定用户为“初访者”或者“老客户”。 持久cookie一般会保存用户的用户ID，该信息在用户注册或第一次登录的时候由服务器生成包含域名及相关信息的cookie发送并存放到客户端的硬盘文件上，并设置cookie的过期时间，以便于实现用户的自动登录和网站内容自定义。 Apache自带的mod_usertrack模块可以在用户首次来到当前网站的时候给用户种下一个唯一的cookie（较长时间过期），这个 cookie是用户首次来当前网站的IP地址加上一个随机字符串组成的。同时在自定义WEB日志中在最后增加%{cookie}n字段可以实现 cookie在apache日志中的输出，用于数据统计与用户跟踪。 原文地址：http://webdataanalysis.net/reference-and-source/session-and-cookie/]]></description>
			<content:encoded><![CDATA[<p>session和cookie是网站浏览中较为常见的两个概念，也是比较难以辨析的两个概念，但它们在点击流及基于用户浏览行为的网站分析中却相当关键。</p>
<p>session和cookie的最大区别在于session是保存在服务端的内存里面，而cookie保存于浏览器或客户端文件里面；session是基于访问的进程，记录了一个访问的开始到结束，当浏览器或进程关闭之后，session也就“消失”了，而cookie更多地被用于标识用户，它可以是长久的，用于用户跟踪和识别唯一用户（Unique Visitor）。</p>
<p><strong>关于session</strong></p>
<p>session被用于表示一个持续的连接状态，在网站访问中一般指代客户端浏览器的进程从开启到结束的过程。session其实就是网站分析的访问（visits）度量，表示一个访问的过程。</p>
<p><img class="alignnone size-full wp-image-2401" title="session" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/session.png" alt="" width="490" height="140" /></p>
<p>session的常见实现形式是会话cookie（session  cookie），即未设置过期时间的cookie，这个cookie的默认生命周期为浏览器会话期间，只要关闭浏览器窗口，cookie就消失了。实现机 制是当用户发起一个请求的时候，服务器会检查该请求中是否包含sessionid，如果未包含，则系统会创造一个名为JSESSIONID的输出 cookie返回给浏览器（只放入内存，并不存在硬盘中），并将其以HashTable的形式写到服务器的内存里面； 当已经包含sessionid是，服务端会检查找到与该session相匹配的信息，如果存在则直接使用该sessionid，若不存在则重新生成新的 session。这里需要注意的是session始终是有服务端创建的，并非浏览器自己生成的。</p>
<p>但是浏览器的cookie被禁止后session就需要用get方法的URL重写的机制或使用POST方法提交隐藏表单的形式来实现。</p>
<p>这里有一个很关键性的注意点，即session失效时间的设置，这里要分两方面来看：浏览器端和服务端。对于浏览器端而言，session与访问进程直接相关，当浏览器被关闭时，session也随之消失；而服务器端的session失效时间一般是人为设置的，目的是能定期地释放内存空间，减小服务器压力，一般的设置为当会话处于非活动状态达20或30分钟时清除该 session，所以浏览器端和服务端的session并非同时消失的，session的中断也并不一定意味着用户一定离开了该网站。目前Google  Analytics和Omniture都定义当间隔30分钟没有动作时，算作一次访问结束，所以上图中session的最后一步不只是离开，也有可能是静 止、休眠或者发呆的状态。</p>
<p>还有一点需要注意，就是现在的浏览器好像趋向于多进程的session共享，即通过多个标签或页面打开多个进程访问同一网站时共享一个 session  cookie，只有当浏览器被关闭时才会被清除，也就是你有可能在标签中关闭了该网站，但只要浏览器未被关闭并且在服务器端的session未失效前重新开启该网站，那么就还是使用原session进行浏览；而某些浏览器在打开多页面时也可能建立独立的session，IE8、Chrome默认都是共享 session的，在IE8中可以通过菜单栏中的文件-&gt;新建会话来建立独立session的浏览页面。</p>
<p><strong>关于Cookies</strong></p>
<p>cookie 是一小段文本信息，伴随着用户请求和页面在Web服务器和浏览器之间传递。用户每次访问站点时，Web应用程序都可以读取cookie包含的信息。</p>
<p>session的实现机制里面已经介绍了常见的方法是使用会话cookie（session cookie）的方式，而平常所说的cookie主要指的是另一类cookie——持久cookie（persistent cookies）。持久cookie是指存放于客户端硬盘中的 cookie信息（设置了一定的有效期限），当用户访问某网站时，浏览器就会在本地硬盘上查找与该网站相关联的cookie。如果该cookie  存在，浏览器就将它与页面请求一起通过HTTP报头信息发送到您的站点，然后在系统会比对cookie中各属性和值是否与存放在服务器端的信息一致，并根据比对结果确定用户为“初访者”或者“老客户”。</p>
<p>持久cookie一般会保存用户的用户ID，该信息在用户注册或第一次登录的时候由服务器生成包含域名及相关信息的cookie发送并存放到客户端的硬盘文件上，并设置cookie的过期时间，以便于实现用户的自动登录和网站内容自定义。</p>
<p>Apache自带的mod_usertrack模块可以在用户首次来到当前网站的时候给用户种下一个唯一的cookie（较长时间过期），这个 cookie是用户首次来当前网站的IP地址加上一个随机字符串组成的。同时在自定义WEB日志中在最后增加%{cookie}n字段可以实现 cookie在apache日志中的输出，用于数据统计与用户跟踪。</p>
<p>原文地址：http://webdataanalysis.net/reference-and-source/session-and-cookie/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/session-and-cookie.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WEB日志的作用和缺陷</title>
		<link>http://www.biaodianfu.com/effect-of-weblog.html</link>
		<comments>http://www.biaodianfu.com/effect-of-weblog.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 14:13:03 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[日志]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2398</guid>
		<description><![CDATA[Avinash Kaushik将点击流数据的获取方式分为4种：log files、web beacons、JavaScript tags和packet sniffers，其中包嗅探器（packet sniffers）比较不常见，最传统的获取方式是通过WEB日志文件（log files）；而beacons和JavaScript是目前较为流行的方式，Google Analytics目前就是采用beacons+JavaScript来获取数据的，我们可以来简单看一下传统的网站日志和 beacons+JavaScript方式各自的优缺点： WEB日志文件 优势：简单方便，不需要修改网页代码，可以自定义日志格式；较多的现成的日志分析工具的支持（AWStats、Webalizer等）；获取网络爬虫数据的唯一途径；可以收集底层数据供反复的分析。 缺陷：数据的质量较低，网站日志包含所有日志数据，包括CSS、图片、脚本文件的请求信息，所以过滤和预处理来提升数据质量必不可少；页面缓存导致浏览无日志记录，这个是比较致命的。 beacons+JavaScript 优势：只需要在页面代码中操作，不需要配置服务器；数据的获取有较高的可控性，可以只在需要统计的页面植入代码；能够获取点击、响应等数据；不需要担心缓存等的影响，数据的准确度较高；可用第三方cookie实现多网站跟踪比较。 缺陷：当浏览器禁止接收图片或者禁用JS时，都可能导致数据获取的失败；只在应用服务层操作，无法获取后台的数据；对图片、文件等请求信息的获取难度相对较大；过多地JS可能导致页面性能的下降，虽然这方面的影响一般可以忽略。 无论通过何种方式，最终数据都是通过日志文件来记录的，只是通过JS可以更容易控制想要获取的数据，并通过在URL带参数的方式记录到日志文件中共解析和统计。所以底层的数据形式无非就是记录在日志文件中的那几项，在WEB日志格式一文中，已经对网站日志的类型和组成做了基本的介绍，这里就不再解析了。 IP一般在为记录cookie的情况下被用于识别唯一用户的标准。 session被用于标识一个连续的访问，用户统计visits这个度量；而cookie主要用于用户识别，也是统计Unique Visitor的依据。 另外还有一种特殊的网站日志，即记录服务器的提示、警告及错误信息，这类日志可以被用于分析用户的错误。 日志的不准确性 WEB日志在技术层面的获取方式及各类外部因素的影响使基于网站日志的数据分析会存在许多的不准确性，下面来介绍下WEB日志中那些项目可能造成数据的不准确，以及造成这些缺陷的原因。 客户端的控制和限制 由于一些浏览网站的用户信息都是有客户端发送的，所以用户的IP、Agent都是可以人为设置的；另外cookie可以被清理，浏览器出于安全的设置，用户的可以在访问过程中限制cookie、referrer的发送。这些都会导致用户访问数据的丢失或者数据的不准确，而这类问题目前很难得到解 决。 缓存 浏览器缓存、服务器缓存、后退按钮操作等都会导致页面点击日志的丢失及referrer的丢失，目前主要的处理方法是保持页面信息的不断更新，可以在页面中添加随机数。当然如果你使用的JavaScript的方法，那么就不需要担心缓存的问题。 跳转 一些跳转导致referrer信息的丢失，致使用户的访问足迹中断无法跟踪。解决方法是将referer通过URL重写，作为URL参数带入下一页面，不过这样会是页面的URL显得混乱。 代理IP、动态IP、局域网（家庭）公用IP IP其实准确性并不高，现在不止存在伪IP，而且局域网共享同一公网IP、代理的使用及动态IP分配方式，都可能使IP地址并不是与某个用户绑定的，所以如果有更好的方法，尽量不要使用IP来识别用户。 session的定义与多cookie 不同的网站对session的定义和获取方法可能差异，比如非活动状态session的失效时间、多进程同时浏览时sessionid的共享等，所以同一个网站中session的定义标准必须统一才能保证统计数据的准确。cookie的不准确一方面是由于某些情况下cookie无法获取，另一 方面是由于一个客户端可以有多个cookie，诸如chrome、Firefox等浏览器的cookie存放路径都会与IE的cookie存放路径分开， 所以如果你是用不同的浏览器浏览同一网站，很有可能你的cookie就是不同的。 停留时间 停留时间并不是直接获取的，而是通过底层日志中的数据计算得到的，因为所有日志中的时间都是时刻的概念，即点击的时间点。这里不得不提的是一个session的最后一个页面的停留时间是无法计算得到的，可以来看一下停留时间的计算过程：假设一个用户在一个session里面依次点击了A-&#62;B-&#62;C这3个页面，并在点完C之后关闭了浏览器，或者长时间的禁止导致了 session的中断。那么我们可以从日志中获得的数据为3个页面的点击时间（HitTime），假设A、B、C点击时间分别为HTA、HTB、HTC，那么A和B页面的停留时间（StayTime）就可以通过计算得到：STA= HTB-HTA，STB= HTC- HTB，而因为我们无法获取session结束的时间，所以STC是无法通过计算得到的，所以一般session最后页面的停留时间是0，而session得停留时间，即一次访问的时间（Time on site）是HTC- HTA，其实是从打开第一个页面到打开最后一个页面的时间间隔，也是不准确的。 另外，我们也无法获知用户在浏览一个页面的时候到底做了什么，是不是一直在阅读博客上的文章或者浏览网站上展示的商品，用户也有可能在期间上了个厕所、接了通电话或者放空的片刻，所以计算得到的停留时间并不能说明用户一直处于Engagement的状态。 原文链接：http://webdataanalysis.net/data-collection-and-preprocessing/effect-of-weblog/]]></description>
			<content:encoded><![CDATA[<p>Avinash Kaushik将点击流数据的获取方式分为4种：log files、web beacons、JavaScript  tags和packet sniffers，其中包嗅探器（packet sniffers）比较不常见，最传统的获取方式是通过WEB日志文件（log  files）；而beacons和JavaScript是目前较为流行的方式，Google  Analytics目前就是采用beacons+JavaScript来获取数据的，我们可以来简单看一下传统的网站日志和 beacons+JavaScript方式各自的优缺点：</p>
<p><strong>WEB日志文件</strong></p>
<ul>
<li>优势：简单方便，不需要修改网页代码，可以自定义日志格式；较多的现成的日志分析工具的支持（AWStats、Webalizer等）；获取网络爬虫数据的唯一途径；可以收集底层数据供反复的分析。</li>
<li>缺陷：数据的质量较低，网站日志包含所有日志数据，包括CSS、图片、脚本文件的请求信息，所以过滤和预处理来提升数据质量必不可少；页面缓存导致浏览无日志记录，这个是比较致命的。</li>
</ul>
<p><strong>beacons+JavaScript</strong></p>
<ul>
<li>优势：只需要在页面代码中操作，不需要配置服务器；数据的获取有较高的可控性，可以只在需要统计的页面植入代码；能够获取点击、响应等数据；不需要担心缓存等的影响，数据的准确度较高；可用第三方cookie实现多网站跟踪比较。</li>
<li>缺陷：当浏览器禁止接收图片或者禁用JS时，都可能导致数据获取的失败；只在应用服务层操作，无法获取后台的数据；对图片、文件等请求信息的获取难度相对较大；过多地JS可能导致页面性能的下降，虽然这方面的影响一般可以忽略。</li>
</ul>
<p>无论通过何种方式，最终数据都是通过日志文件来记录的，只是通过JS可以更容易控制想要获取的数据，并通过在URL带参数的方式记录到日志文件中共解析和统计。所以底层的数据形式无非就是记录在日志文件中的那几项，在<a href="http://www.biaodianfu.com/web-log-format.html" target="_blank">WEB日志格式</a>一文中，已经对网站日志的类型和组成做了基本的介绍，这里就不再解析了。</p>
<p>IP一般在为记录cookie的情况下被用于识别唯一用户的标准。</p>
<p>session被用于标识一个连续的访问，用户统计visits这个度量；而cookie主要用于用户识别，也是统计Unique Visitor的依据。</p>
<p>另外还有一种特殊的网站日志，即记录服务器的提示、警告及错误信息，这类日志可以被用于分析用户的错误。</p>
<ul>
<li><strong>日志的不准确性</strong> WEB日志在技术层面的获取方式及各类外部因素的影响使基于网站日志的数据分析会存在许多的不准确性，下面来介绍下WEB日志中那些项目可能造成数据的不准确，以及造成这些缺陷的原因。</li>
<li><strong>客户端的控制和限制</strong> 由于一些浏览网站的用户信息都是有客户端发送的，所以用户的IP、Agent都是可以人为设置的；另外cookie可以被清理，浏览器出于安全的设置，用户的可以在访问过程中限制cookie、referrer的发送。这些都会导致用户访问数据的丢失或者数据的不准确，而这类问题目前很难得到解 决。</li>
<li><strong>缓存</strong> 浏览器缓存、服务器缓存、后退按钮操作等都会导致页面点击日志的丢失及referrer的丢失，目前主要的处理方法是保持页面信息的不断更新，可以在页面中添加随机数。当然如果你使用的JavaScript的方法，那么就不需要担心缓存的问题。</li>
<li><strong>跳转</strong> 一些跳转导致referrer信息的丢失，致使用户的访问足迹中断无法跟踪。解决方法是将referer通过URL重写，作为URL参数带入下一页面，不过这样会是页面的URL显得混乱。</li>
<li><strong>代理IP、动态IP、局域网（家庭）公用IP </strong>IP其实准确性并不高，现在不止存在伪IP，而且局域网共享同一公网IP、代理的使用及动态IP分配方式，都可能使IP地址并不是与某个用户绑定的，所以如果有更好的方法，尽量不要使用IP来识别用户。</li>
<li><strong>session的定义与多cookie</strong> 不同的网站对session的定义和获取方法可能差异，比如非活动状态session的失效时间、多进程同时浏览时sessionid的共享等，所以同一个网站中session的定义标准必须统一才能保证统计数据的准确。cookie的不准确一方面是由于某些情况下cookie无法获取，另一 方面是由于一个客户端可以有多个cookie，诸如chrome、Firefox等浏览器的cookie存放路径都会与IE的cookie存放路径分开， 所以如果你是用不同的浏览器浏览同一网站，很有可能你的cookie就是不同的。</li>
<li><strong>停留时间</strong> 停留时间并不是直接获取的，而是通过底层日志中的数据计算得到的，因为所有日志中的时间都是时刻的概念，即点击的时间点。这里不得不提的是一个session的最后一个页面的停留时间是无法计算得到的，可以来看一下停留时间的计算过程：假设一个用户在一个session里面依次点击了A-&gt;B-&gt;C这3个页面，并在点完C之后关闭了浏览器，或者长时间的禁止导致了 session的中断。那么我们可以从日志中获得的数据为3个页面的点击时间（HitTime），假设A、B、C点击时间分别为HT<sub>A</sub>、HT<sub>B</sub>、HT<sub>C</sub>，那么A和B页面的停留时间（StayTime）就可以通过计算得到：ST<sub>A</sub>= HT<sub>B</sub>-HT<sub>A</sub>，ST<sub>B</sub>= HT<sub>C</sub>- HT<sub>B</sub>，而因为我们无法获取session结束的时间，所以ST<sub>C</sub>是无法通过计算得到的，所以一般session最后页面的停留时间是0，而session得停留时间，即一次访问的时间（Time on site）是HT<sub>C</sub>- HT<sub>A</sub>，其实是从打开第一个页面到打开最后一个页面的时间间隔，也是不准确的。</li>
<li> 另外，我们也无法获知用户在浏览一个页面的时候到底做了什么，是不是一直在阅读博客上的文章或者浏览网站上展示的商品，用户也有可能在期间上了个厕所、接了通电话或者放空的片刻，所以计算得到的停留时间并不能说明用户一直处于Engagement的状态。</li>
</ul>
<p>原文链接：http://webdataanalysis.net/data-collection-and-preprocessing/effect-of-weblog/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/effect-of-weblog.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>用品牌或产品&#8221;黏&#8221;性来细分市场</title>
		<link>http://www.biaodianfu.com/use-brand-or-product-sticky-segment-market.html</link>
		<comments>http://www.biaodianfu.com/use-brand-or-product-sticky-segment-market.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 13:37:49 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[品牌]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2386</guid>
		<description><![CDATA[一、市场细分方法 目前，有为数众多的市场细分变量被用来作为消费者市场细分的依据，这些细分变量可以单独使用，也可以结合使用，这样一来便形成了变量集合。多变量细分又可分为分层细分和整合细分，应用chaid软件以树形图方式展现的结果是分层细分的典型代表，我们所熟悉的聚类分析则属于整合细分方法。整合细分的优点在于可以从多个并行角度描述顾客特征，本文讨论的转换模型就是一种多变量整合分析方法。 二、转换模型的概念 转换模型根据消费者和某个品牌或产品种类的关系来细分群体。通常，最简单的分类是将消费者划分为使用者和非使用者，转换模型在这一基础上对两个群体作了进一步细分。当然，市场细分的方法有很多种，包括运用人口统计学变量、心理变量、地理变量等作为划分标准，但基于消费者和品牌联系强度的分类方法似乎用的很少。 转换模型针对品牌（或产品种类）引入了“黏性”这一概念，将某品牌的用户划分为不同黏度的细分群体。与此同时，非使用者也依据其争取的难易程度作了细分。从概念上来描述，转换模型由以下这些要素组成： 用户 目标品牌的用户通常被归入以下四个细分群体之一： 稳固型－特定的产品领域之中，在未来不太可能改变消费模式的用户。 普通型－在短期内不太可能改变消费模式，但在中长期有转变的可能性。 边缘型－在品牌黏度方面低于普通型用户，其中已有一些消费者在考虑其他品牌。 易转换型－某品牌的用户中最容易流失的群体。 非用户 非用户同样被归入以下四个细分群体之一： 容易争取型－这部分消费者对目标品牌的偏好超过了现用品牌，所以尽管目前没有发生品牌转换行为，但在心理上已做好了转换的准备。 左右摇摆型－在这部分消费者看来，目标品牌和现用品牌具有同等的吸引力。 轻度背离型－偏好取向和现用品牌联系在一起，但对现用品牌的黏度低于重度背离型。 重度背离型－强烈偏好现用品牌，所以从近期来看，争取这部分消费者的可能性最小。 转换模型的应用同样是建立在收集数据的基础上，较常用的数据收集方法包括邮寄问卷、电话访问、一对一的面访等，其中面访是最适宜的数据收集方法。在实际操作的时候，通常需要被访者回答一组问题，这组问题基本上涵盖了以下四个维度： 需求满足度 在特定产品领域的购买介入度 对其他品牌的态度 现场决策犹疑程度 需求满足度 需求满足度指的是消费者的使用某品牌后的体验，其需求得到满足的程度。显然，对某品牌的满意度越低，品牌黏度也越低。需要注意的是，满意度是测量品牌黏度的一个必要的指标，但如果只用这一个指标来预测消费者的转换行为是不够的，其原因可以由第二个维度来解释。 在特定产品领域的购买介入度 在 这里，购买介入度的含义侧重于品牌选择的重要性。我们知道，某种产品在日常生活中占有的地位越重要，消费者可以忍受不满的限度也越高。同样的道理，如果某 种产品居于相对次要的地位，对某个品牌表示满意的消费者也可能在下次购买时转向其他品牌，比如一个定价更为便宜的品牌。 对其他品牌的态度 用 满意度来预测转换行为并不完善的另一个原因可以用这一维度来解释。一个消费者可能对当前使用的品牌极其不满，但如果他认为其他品牌更糟糕，那么转换行为就 不太会发生。同样的道理，消费者可能对现用品牌很满意，但相比之下认为其他品牌更好一些，那转换行为也可能发生。所以，消费者对竞争品牌持有的态度应是形 成现用品牌黏度的重要因素之一。 现场决策犹疑程度 该维度指的是消费者以往在作选择时，是否容易被现场提供的品牌分散注意力。一些消费者很少迟疑，不会轻易改变原有的消费模式，另外一些消费者面对众多的品牌变得拿不定主意，一时之间很难下决心。现场决策所表现出来的犹疑不定对现用品牌的黏度将产生直接的影响。 借助数学中的突变理论（具体的类型为蝴蝶突变*），根 据被访者对以上四个维度问题的回答，运用一定的算法之后，可以将被访者划分为不同的群体。举个简单的例子，如果某个被访者对现用品牌非常满意，品牌选择对他而言有着重要的意义（也就是说，在特定的产品领域中购买介入度较高），在品牌态度方面现用品牌被认为明显好于其他竞争品牌，在现场选择时忠于一定的模 式，该被访者将归入稳固型用户。 三、研究“黏度”的意义 度量“黏性”不仅仅是一个理论概念，黏度较高的群体对于市场营销而言，有着重要的意义，这是因为，相比较黏度较低的群体： 他们更容易被说服重复购买某品牌 他们对竞争品牌的宣传更具免疫力 当遇到常用的品牌（产品）缺货的情况，他们不会轻易接受其他品牌 他们对于价格的敏感度较低 他们支撑了特定的产品领域中和他们维持高强度关系品牌的较大的市场份额 最重要的是，黏度通常和未来的购买行为联系在一起 有些人可能会认为很难区分“忠诚度”和“黏性”这两个概念，按照我们的定义，忠诚度指的是消费行为，通过消费者以往的购买行为来测量。而黏度考量的重点在于消费者和品牌之间的关系强度。如果消费者对现用品牌黏度较高，那他也是该品牌的忠诚群体。 另一方面，以往忠于某品牌的消费者并不一定属于黏度较高的群体。例如，某品牌采取的低价策略，它的用户中绝大部分是价格敏感者，就购买动机而言，这些消费者 其实并不忠诚于所购买的品牌。尽管保持高频购买，一旦市场上出现了价格更为便宜的品牌，他们便会随即转向。所以，黏度高的群体是忠诚的，但忠诚的消费者未必是黏度高的。 四、转换模型的应用领域 转换模型被广泛应用于产品和概念测试、广告测试以及持续的品牌良性发展监测等领域。 产品和概念测试 根据以往的调查经验，在产品和概念测试中，被访者对购买可能性过分夸大是一种常见的现象，例如，在一次牙膏产品的概念测试中，访问过程中共出示了四种产品概念测试卡，以5级量表表达购买意愿，结果发现，不论测试的是何种概念，得到的回答均呈现在高分段过于集中的特点。 在 这一案例中如运用转换模型，重点测量的将是受访者对于现用产品的黏度，具体收集的数据有：在各种维度上对现用牙膏产品的评价、购买牙膏的介入度、现用产品 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>一、市场细分方法</strong></p>
<p>目前，有为数众多的市场细分变量被用来作为消费者市场细分的依据，这些细分变量可以单独使用，也可以结合使用，这样一来便形成了变量集合。多变量细分又可分为分层细分和整合细分，应用chaid软件以树形图方式展现的结果是分层细分的典型代表，我们所熟悉的聚类分析则属于整合细分方法。整合细分的优点在于可以从多个并行角度描述顾客特征，本文讨论的转换模型就是一种多变量整合分析方法。</p>
<p><img class="alignnone size-full wp-image-2387" title="shichang-xifeng-fangfa" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/shichang-xifeng-fangfa.jpg" alt="" width="501" height="286" /></p>
<p><strong>二、转换模型的概念</strong></p>
<p>转换模型根据消费者和某个品牌或产品种类的关系来细分群体。通常，最简单的分类是将消费者划分为使用者和非使用者，转换模型在这一基础上对两个群体作了进一步细分。当然，市场细分的方法有很多种，包括运用人口统计学变量、心理变量、地理变量等作为划分标准，但基于消费者和品牌联系强度的分类方法似乎用的很少。</p>
<p>转换模型针对品牌（或产品种类）引入了“黏性”这一概念，将某品牌的用户划分为不同黏度的细分群体。与此同时，非使用者也依据其争取的难易程度作了细分。从概念上来描述，转换模型由以下这些要素组成：</p>
<p><strong>用户</strong> 目标品牌的用户通常被归入以下四个细分群体之一：</p>
<ul>
<li>稳固型－特定的产品领域之中，在未来不太可能改变消费模式的用户。</li>
<li>普通型－在短期内不太可能改变消费模式，但在中长期有转变的可能性。</li>
<li>边缘型－在品牌黏度方面低于普通型用户，其中已有一些消费者在考虑其他品牌。</li>
<li>易转换型－某品牌的用户中最容易流失的群体。</li>
</ul>
<p><strong>非用户</strong> 非用户同样被归入以下四个细分群体之一：</p>
<ul>
<li>容易争取型－这部分消费者对目标品牌的偏好超过了现用品牌，所以尽管目前没有发生品牌转换行为，但在心理上已做好了转换的准备。</li>
<li>左右摇摆型－在这部分消费者看来，目标品牌和现用品牌具有同等的吸引力。</li>
<li>轻度背离型－偏好取向和现用品牌联系在一起，但对现用品牌的黏度低于重度背离型。</li>
<li>重度背离型－强烈偏好现用品牌，所以从近期来看，争取这部分消费者的可能性最小。</li>
</ul>
<p>转换模型的应用同样是建立在收集数据的基础上，较常用的数据收集方法包括邮寄问卷、电话访问、一对一的面访等，其中面访是最适宜的数据收集方法。在实际操作的时候，通常需要被访者回答一组问题，这组问题基本上涵盖了以下四个维度：</p>
<ul>
<li>需求满足度</li>
<li>在特定产品领域的购买介入度</li>
<li>对其他品牌的态度</li>
<li>现场决策犹疑程度</li>
</ul>
<p><strong>需求满足度</strong></p>
<p>需求满足度指的是消费者的使用某品牌后的体验，其需求得到满足的程度。显然，对某品牌的满意度越低，品牌黏度也越低。需要注意的是，满意度是测量品牌黏度的一个必要的指标，但如果只用这一个指标来预测消费者的转换行为是不够的，其原因可以由第二个维度来解释。</p>
<p><strong>在特定产品领域的购买介入度</strong></p>
<p>在 这里，购买介入度的含义侧重于品牌选择的重要性。我们知道，某种产品在日常生活中占有的地位越重要，消费者可以忍受不满的限度也越高。同样的道理，如果某 种产品居于相对次要的地位，对某个品牌表示满意的消费者也可能在下次购买时转向其他品牌，比如一个定价更为便宜的品牌。</p>
<p><strong>对其他品牌的态度</strong></p>
<p>用 满意度来预测转换行为并不完善的另一个原因可以用这一维度来解释。一个消费者可能对当前使用的品牌极其不满，但如果他认为其他品牌更糟糕，那么转换行为就 不太会发生。同样的道理，消费者可能对现用品牌很满意，但相比之下认为其他品牌更好一些，那转换行为也可能发生。所以，消费者对竞争品牌持有的态度应是形 成现用品牌黏度的重要因素之一。</p>
<p><strong>现场决策犹疑程度</strong></p>
<p>该维度指的是消费者以往在作选择时，是否容易被现场提供的品牌分散注意力。一些消费者很少迟疑，不会轻易改变原有的消费模式，另外一些消费者面对众多的品牌变得拿不定主意，一时之间很难下决心。现场决策所表现出来的犹疑不定对现用品牌的黏度将产生直接的影响。</p>
<p>借助数学中的<strong>突变理论</strong>（具体的类型为蝴蝶突变*），根 据被访者对以上四个维度问题的回答，运用一定的算法之后，可以将被访者划分为不同的群体。举个简单的例子，如果某个被访者对现用品牌非常满意，品牌选择对他而言有着重要的意义（也就是说，在特定的产品领域中购买介入度较高），在品牌态度方面现用品牌被认为明显好于其他竞争品牌，在现场选择时忠于一定的模 式，该被访者将归入稳固型用户。</p>
<p><strong>三、研究“黏度”的意义</strong></p>
<p>度量“黏性”不仅仅是一个理论概念，黏度较高的群体对于市场营销而言，有着重要的意义，这是因为，相比较黏度较低的群体：</p>
<ul>
<li>他们更容易被说服重复购买某品牌</li>
<li>他们对竞争品牌的宣传更具免疫力</li>
<li>当遇到常用的品牌（产品）缺货的情况，他们不会轻易接受其他品牌</li>
<li>他们对于价格的敏感度较低</li>
<li>他们支撑了特定的产品领域中和他们维持高强度关系品牌的较大的市场份额</li>
<li>最重要的是，黏度通常和未来的购买行为联系在一起</li>
</ul>
<p>有些人可能会认为很难区分“忠诚度”和“黏性”这两个概念，按照我们的定义，忠诚度指的是消费行为，通过消费者以往的购买行为来测量。而黏度考量的重点在于消费者和品牌之间的关系强度。如果消费者对现用品牌黏度较高，那他也是该品牌的忠诚群体。</p>
<p>另一方面，以往忠于某品牌的消费者并不一定属于黏度较高的群体。例如，某品牌采取的低价策略，它的用户中绝大部分是价格敏感者，就购买动机而言，这些消费者 其实并不忠诚于所购买的品牌。尽管保持高频购买，一旦市场上出现了价格更为便宜的品牌，他们便会随即转向。所以，黏度高的群体是忠诚的，但忠诚的消费者未必是黏度高的。</p>
<p><strong>四、转换模型的应用领域</strong></p>
<p>转换模型被广泛应用于产品和概念测试、广告测试以及持续的品牌良性发展监测等领域。</p>
<p><strong>产品和概念测试</strong></p>
<p>根据以往的调查经验，在产品和概念测试中，被访者对购买可能性过分夸大是一种常见的现象，例如，在一次牙膏产品的概念测试中，访问过程中共出示了四种产品概念测试卡，以5级量表表达购买意愿，结果发现，不论测试的是何种概念，得到的回答均呈现在高分段过于集中的特点。</p>
<p>在 这一案例中如运用转换模型，重点测量的将是受访者对于现用产品的黏度，具体收集的数据有：在各种维度上对现用牙膏产品的评价、购买牙膏的介入度、现用产品 相对于某种概念测试产品的偏好强度以及现场决策时的犹疑程度，然后在细分群体的基础上（对现有产品黏度较低的受访者更有可能尝试使用新产品），对某种概念 产品潜在消费群体的规模作出更贴近实际情况的评估。以下是一组通过直接询问购买可能性和运用转换模型获得的可能争取的群体规模的数据对照：</p>
<p><img class="alignnone size-full wp-image-2388" title="zhijiexunwen-vs-moxinyuce" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/zhijiexunwen-vs-moxinyuce.jpg" alt="" width="512" height="327" /></p>
<p>25％的受访者声称肯定会购买测试卡片一描述的牙膏新产品，然而转换模型预测的结果是只有5％的受访者可以被界定为该产品最容易争取的潜在用户。</p>
<p>引入转换模型之后，由于能够区分出黏度较高和较低的两个群体，通过对照分析有助于了解新产品受欢迎或不受欢迎的真正原因，由此可以对新产品作出更为准确的诊断分析。</p>
<p><strong>广告测试</strong></p>
<p>当 我们进行广告测试时（尤其是事后测试），其中一个关键的环节是将用户和非用户分开考察，这是因为用户较之非用户更有可能注意到所使用品牌的广告，而且，用户在理解广告内容时更容易按照自己的认知结构重新组织广告片段。转换模型将用户和非用户的分类法作了延伸，在比较不同细分群体对广告的认知和理解时同样会 有差异。在以下的例子中可以看到，黏度较高的群体有更高的几率接受到现用品牌的广告，同样，非用户中容易争取的群体也表现出这种特点。</p>
<p>按照我们以往的理解，广告对消费者的影响应是单向的。也就是说，广告确立的目标是向目标群体传递品牌和产品信息，其影响目标群体的过程通常遵循品牌认知、品 牌态度乃至最终的购买行为这样一种模式，但消费者和广告之间似乎存在着一种交互影响，当然这种影响依赖于消费者和品牌间所维持的关系的强度。</p>
<p><strong>五、转换模型应用案例</strong></p>
<p>以下是一个关于酒类产品的案例，在这个案例中，运用转换模型将品牌A的用户和非用户细分后，具体构成如下图所示：</p>
<p><img class="alignnone size-full wp-image-2389" title="moxinzhuanhuan" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/moxinzhuanhuan.jpg" alt="" width="530" height="318" /></p>
<p>在图中，“容易被攻击”的群体是将边缘型和易转换型两类用户合并在一起，“开放”的群体是将容易争取型和左右摇摆型两类非用户群体作了合并。</p>
<p>我们需要了解为什么会有11％的用户和品牌之间建立了较强的联系，同时如何防止10％的易受攻击的用户转向其他品牌。为此，研究的重点分为两个方面，其一是在每个细分群体中，有哪些因素对品牌偏好产生了驱动作用；另一方面，测量品牌A相对于竞争品牌在这些重要维度上的表现。</p>
<p>为了解决上述问题，我们将用到“多元回归”和“提及次数份额”这两种方法。</p>
<p>多元回归是以品牌偏好得分为因变量，属性维度上的得分为自变量，建立自变量和因变量之间的回归方程，由此得到的回归方程的系数代表了各种属性对于品牌整体偏好的影响。在回归系数的基础上，我们可以将所有属性按照重要程度进行排序。</p>
<p>“提及次数份额”是一种相对简单的测量方法，具体的算法是某种属性维度上提到品牌A的次数除以所有品牌提及次数总和后得到的比值，通过这一数值可以看出品牌A相对其他品牌的表现。</p>
<p>运用这两种方法对数据进行处理之后，我们来看一下在品牌A在“稳固型”用户心目中的形象，具体而言，哪些是驱动该群体品牌偏好的重要属性，同时品牌A在这些重要属性上有何种表现。</p>
<p><img class="alignnone size-full wp-image-2390" title="A1" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/A1.jpg" alt="" width="608" height="393" /></p>
<p>图形显示，在一些相对重要的维度上，在“稳固型”用户看来，品牌A都胜过其他品牌。</p>
<p>再来看品牌A在“易受攻击型”用户中的形象。</p>
<p><img class="alignnone size-full wp-image-2396" title="A2" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/A2.jpg" alt="" width="574" height="439" /></p>
<p>图形显示，品牌A在两个维度（产品属性1和饮酒动机2）上的表现超过了竞争品牌，但这两个属性并不是影响品牌偏好的决定性因素。相反，在产品属性2和品牌个性2这样一些最具影响力的维度上，品牌A被认为逊色于竞争品牌。</p>
<p>简而言之，由于品牌A在不太相关的属性上表现相对强势，而在一些重要属性上处于下风，由此削弱了品牌A和这部分消费者之间的联系。</p>
<p>“易受攻击型”和“稳固型”用户的区别主要体现在两个方面：首先，他们追求的是不同的利益点；其次，在一些关键属性上，他们有截然不同的感受。</p>
<p>针对上述情况，我们可以给出两种对策：第一种是在品牌A的薄弱环节方面（比如产品属性2和品牌个性2）有所提升，由于需要改变品牌在消费者心目中已确立的形象，在实际操作的时候可能会较为困难。第二种是加强品牌A的优势属性和品牌偏好的联系，这种对策从影响消费者需求的角度出发，使品牌A在优势属性方面的价值得到充分体现，同时确保品牌A在不同时期的形象保持前后一致性。</p>
<p><span style="color: #ff0000;">本文转载自网络，原文出错未知。</span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/use-brand-or-product-sticky-segment-market.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>数据分析的基本流程</title>
		<link>http://www.biaodianfu.com/web-data-analysis-circuit.html</link>
		<comments>http://www.biaodianfu.com/web-data-analysis-circuit.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 13:07:57 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[数据分析]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2383</guid>
		<description><![CDATA[网站数据分析没有规范的分析流程容易使最后的结果逻辑混乱或者偏离原来的主题，所以一套规范的流程能够使网站分析更加清晰和有效。 网站分析其实就是一个发现问题、分析问题的解决问题的过程。问题的发现可以来源于多方面：网站运营中遇到的问题、用户的反馈和抱怨、日常统计数 据的表现异常等；分析问题的过程就是根据遇到的问题运用合理的方法对其进行解释，这也是本站重点探讨的方向；而最后的解决问题则是最为关键的一点，也是目 前最被忽视的一点，目前的网站分析工作往往在找到问题后无法落实到寻求最优的解决方案并执行和解决问题这一点上，即使采取了相应的措施也无法进行持续的反馈，并从根本真正地解决问题，很多只是针对一时的举措，而解决问题的过程恰好是最能体现公司执行力的时候，如果没有最终解决问题或者实现优化，那么网站分析就没有丝毫的价值。 随着互联网的不断发展成熟，网站的发展趋势将更加规范化、精细化，更加注重用户体验，今后的网站建设很重要的一点就是网站的质量管理，所以这里 就借用质量管理里面的六西格玛中的DMAIC循环来梳理一下网站数据分析的流程，DMAIC是PDCA质量环的改进，这里将其核心设置为“用户体验”，因为不同网站会有不同的目标，而提高“用户体验”可以说是所有网站的共同目标。 正如上图所示，基于DMAIC循环，网站数据分析的流程也可以用这5步来实现： 定义（Define） 原意是识别和确定用户需求，定义任务的目标和意义。对于网站数据分析来说，可以表述为确定这次分析所针对的问题是什么，分析最终需要达到何种目的，对网站有何实际的意义，同时需要确定分析的范围，及规划本次分析工作的进度和质量控制。 测量（Measure） 原意是收集数据，量化分析。对于网站数据分析来说，同样也是一个手机和获取数据的过程，尽量获得完整、真实、准确的数据，做好数据的预处理工作，便于分析工作的开展。 分析（Analyze） 原意是使用数据统计和分析的方法找到问题的本质。分析不只是对数据的简单统计描述，其结果不应该是一张报表和趋势图这么简单，分析的本质应该是 从表面的数据中找到问题的本质，最后需要第一步针对的问题进行归纳和总结。同时需要注意的是分析要紧跟“定义”，不能偏离问题的范围和本质。 改进（Improve） 原意是找到最优的解决方案，是问题得到解决或者使问题的负面影响降到最低。个人认为这一步是最为关键的一步，也是目前很多网站分析工作中较为忽 视的一步，很多网站分析只是呈现结果，缺少解决问题的方案，这就相当于找到了管道的漏水点却任由其漏水而不作处理，任何不付诸实践的分析结果都是废纸，毫 无意义。同时这一步也是最考验网站执行力的一个步骤。 控制（Control） 原意是监控改进的结果，使相同问题不再重现。这一步无疑是目前最被忽略的一步，很多改进方案实施之后根本不会再去关注反馈情况，而有些改进方案 治标不治本，就像网站的访问量无法通过一两次的推广活动通过本质上的提升，关键还在于网站本身的质量，推广活动可能让数据在短期内获得提升，但想要保持长 期地增长还是需要不断地优化和改进。所以“控制”要的是持续的反馈和监控，并不断寻找能从最根本上解决问题的最优方案。 所以，网站建设是一个循序渐进的过程，很多网站数据分析也是长期的，不断监视、跟踪并改进，而DMAIC循环也正体现了这个概念，通过不断地网站分析来提高网站质量，提高用户体验。 原文链接：http://webdataanalysis.net/personal-view/circuit-of-web-data-analysis/]]></description>
			<content:encoded><![CDATA[<p>网站数据分析没有规范的分析流程容易使最后的结果逻辑混乱或者偏离原来的主题，所以一套规范的流程能够使网站分析更加清晰和有效。</p>
<p>网站分析其实就是一个发现问题、分析问题的解决问题的过程。问题的发现可以来源于多方面：网站运营中遇到的问题、用户的反馈和抱怨、日常统计数 据的表现异常等；分析问题的过程就是根据遇到的问题运用合理的方法对其进行解释，这也是本站重点探讨的方向；而最后的解决问题则是最为关键的一点，也是目 前最被忽视的一点，目前的网站分析工作往往在找到问题后无法落实到寻求最优的解决方案并执行和解决问题这一点上，即使采取了相应的措施也无法进行持续的反馈，并从根本真正地解决问题，很多只是针对一时的举措，而解决问题的过程恰好是最能体现公司执行力的时候，如果没有最终解决问题或者实现优化，那么网站分析就没有丝毫的价值。</p>
<p>随着互联网的不断发展成熟，网站的发展趋势将更加规范化、精细化，更加注重用户体验，今后的网站建设很重要的一点就是网站的质量管理，所以这里 就借用质量管理里面的六西格玛中的DMAIC循环来梳理一下网站数据分析的流程，DMAIC是PDCA质量环的改进，这里将其核心设置为“用户体验”，因为不同网站会有不同的目标，而提高“用户体验”可以说是所有网站的共同目标。</p>
<p><img class="alignnone size-full wp-image-2384" title="DMAIC" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/DMAIC.png" alt="" width="412" height="416" /></p>
<p>正如上图所示，基于DMAIC循环，网站数据分析的流程也可以用这5步来实现：</p>
<p><strong>定义（Define）</strong></p>
<p>原意是识别和确定用户需求，定义任务的目标和意义。对于网站数据分析来说，可以表述为确定这次分析所针对的问题是什么，分析最终需要达到何种目的，对网站有何实际的意义，同时需要确定分析的范围，及规划本次分析工作的进度和质量控制。</p>
<p><strong>测量（Measure）</strong></p>
<p>原意是收集数据，量化分析。对于网站数据分析来说，同样也是一个手机和获取数据的过程，尽量获得完整、真实、准确的数据，做好数据的预处理工作，便于分析工作的开展。</p>
<p><strong>分析（Analyze）</strong></p>
<p>原意是使用数据统计和分析的方法找到问题的本质。分析不只是对数据的简单统计描述，其结果不应该是一张报表和趋势图这么简单，分析的本质应该是 从表面的数据中找到问题的本质，最后需要第一步针对的问题进行归纳和总结。同时需要注意的是分析要紧跟“定义”，不能偏离问题的范围和本质。</p>
<p><strong>改进（Improve）</strong></p>
<p>原意是找到最优的解决方案，是问题得到解决或者使问题的负面影响降到最低。个人认为这一步是最为关键的一步，也是目前很多网站分析工作中较为忽 视的一步，很多网站分析只是呈现结果，缺少解决问题的方案，这就相当于找到了管道的漏水点却任由其漏水而不作处理，任何不付诸实践的分析结果都是废纸，毫 无意义。同时这一步也是最考验网站执行力的一个步骤。</p>
<p><strong>控制（Control）</strong></p>
<p>原意是监控改进的结果，使相同问题不再重现。这一步无疑是目前最被忽略的一步，很多改进方案实施之后根本不会再去关注反馈情况，而有些改进方案 治标不治本，就像网站的访问量无法通过一两次的推广活动通过本质上的提升，关键还在于网站本身的质量，推广活动可能让数据在短期内获得提升，但想要保持长 期地增长还是需要不断地优化和改进。所以“控制”要的是持续的反馈和监控，并不断寻找能从最根本上解决问题的最优方案。</p>
<p>所以，网站建设是一个循序渐进的过程，很多网站数据分析也是长期的，不断监视、跟踪并改进，而DMAIC循环也正体现了这个概念，通过不断地网站分析来提高网站质量，提高用户体验。</p>
<p>原文链接：http://webdataanalysis.net/personal-view/circuit-of-web-data-analysis/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/web-data-analysis-circuit.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>电子商务与RFM模型</title>
		<link>http://www.biaodianfu.com/rfm-model.html</link>
		<comments>http://www.biaodianfu.com/rfm-model.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 12:18:00 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[用户模型]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2376</guid>
		<description><![CDATA[RFM作为一种客户分类方法，RFM分析模型起初主要用于直复营销(Direct Marketing)领域，目的是提高老客户交易的次数。随着RFM分析模型的不断丰富和发展，它更多用于监测客户消费行为异动和防范重要客户流失等方面。 根据美国数据库营销研究所Arthur Hughes的研究，客户数据库中有三个神奇的要素：最近一次消费(Recency)；消费频率(Frequency)；消费金额(Monetary)。 最近一次消费是指用户上一次购买的时间，理论上，上一次消费时间越近的顾客应该是比较好的顾客，对提供即时的商品或是服务也最有可能 会有反应。因为最近一 次消费指标定义的是一个时间段，并且与当前时间相关，因此是一直在变动的。最近一次消费对营销来说是一个重要指标，涉及吸引客户，保持客户，并赢得客户的 忠诚度。 消费频率是顾客在一定时间段内的消费次数。最常购买的消费者，忠诚度也就最高，增加顾客购买的次数意味着从竞争对手处偷取市场占有 率，由别人的手中赚取营业额。根据这个指标，我们又把客户分成五等分，这个五等分分析相当于是一个“忠诚度的阶梯”(loyalty ladder)，其诀窍在于让消费者一直顺着阶梯往上爬，把销售想像成是要将两次购买的顾客往上推成三次购买的顾客，把一次购买者变成两次的。 消费金额是对电子商务网站产能的最直接的衡量指标，也可以验证“帕雷托法则”(Pareto’s Law)——公司80％的收入来自20％的顾客。 RFM分析技术主要依据上述三个参数预测客户将来的行为，对客户进行分类，找出客户交易的规律和趋势，方便企业采取相应的营销策略防止大客户流失，最终达到增量销售的目的。RFM具有模型简单、便于理解和操作、成本较低、易于实现等优点，使用者不需要具备专门的统计知识，也不需要建立复杂的数学模型，使用 EXCEL、ACCESS或数据库管理软件简单编程即可自动得出结果。 数据获取与分析 在从数据库中提取相关数据之前，首先需要确定数据的时间跨度，根据网站销售的物品的差异，确定合适的时间跨度。如果经营的是快速消费品，如日用品，可以确定时间跨度为一个季度或者一个月；如果销售的产品更替的时间相对久些，如电子产品，可以确定时间跨度为一年、半年或者一个季度。在确定时间跨度 之后就可以提取相应时间区间内的数据，其中： 最近一次消费(Recency)，取出来的数据是一个时间点，需要由当前时间点-最近一次消费时间点来作为该度量的值，注意单位的选择和统一，无论以小时、天为单位； 消费频率(Frequency)，这个指标可以直接在数据库中COUNT用户的消费次数得到； 消费金额(Monetary)，可以将每位客户的所有消费的金额相加(SUM)求得。 获取三个指标的数据以后，需要计算每个指标数据的均值，分别以AVG(R)、AVG(F)、AVG(M)来表示，最后通过将每位客户的三个指标与均值进行比较，可以将客户细分为8类： Recency Frequency Monetary 客户类型 ↑ ↑ ↑ 重要价值客户 ↑ ↓ ↑ 重要发展客户 ↓ ↑ ↑ 重要保持客户 ↓ ↓ ↑ 重要挽留客户 ↑ ↑ ↓ 一般价值客户 ↑ ↓ ↓ 一般发展客户 ↓ ↑ ↓ 一般保持客户 ↓ [...]]]></description>
			<content:encoded><![CDATA[<p>RFM作为一种客户分类方法，RFM分析模型起初主要用于直复营销(Direct Marketing)领域，目的是提高老客户交易的次数。随着RFM分析模型的不断丰富和发展，它更多用于监测客户消费行为异动和防范重要客户流失等方面。</p>
<p>根据美国数据库营销研究所Arthur Hughes的研究，客户数据库中有三个神奇的要素：最近一次消费(Recency)；消费频率(Frequency)；消费金额(Monetary)。</p>
<ul>
<li><strong>最近一次消费</strong>是指用户上一次购买的时间，理论上，上一次消费时间越近的顾客应该是比较好的顾客，对提供即时的商品或是服务也最有可能 会有反应。因为最近一  次消费指标定义的是一个时间段，并且与当前时间相关，因此是一直在变动的。最近一次消费对营销来说是一个重要指标，涉及吸引客户，保持客户，并赢得客户的 忠诚度。</li>
<li><strong>消费频率</strong>是顾客在一定时间段内的消费次数。最常购买的消费者，忠诚度也就最高，增加顾客购买的次数意味着从竞争对手处偷取市场占有 率，由别人的手中赚取营业额。根据这个指标，我们又把客户分成五等分，这个五等分分析相当于是一个“忠诚度的阶梯”(loyalty  ladder)，其诀窍在于让消费者一直顺着阶梯往上爬，把销售想像成是要将两次购买的顾客往上推成三次购买的顾客，把一次购买者变成两次的。</li>
<li><strong>消费金额</strong>是对电子商务网站产能的最直接的衡量指标，也可以验证“帕雷托法则”(Pareto’s Law)——公司80％的收入来自20％的顾客。</li>
</ul>
<p>RFM分析技术主要依据上述三个参数预测客户将来的行为，对客户进行分类，找出客户交易的规律和趋势，方便企业采取相应的营销策略防止大客户流失，最终达到增量销售的目的。RFM具有模型简单、便于理解和操作、成本较低、易于实现等优点，使用者不需要具备专门的统计知识，也不需要建立复杂的数学模型，使用  EXCEL、ACCESS或数据库管理软件简单编程即可自动得出结果。</p>
<p><strong>数据获取与分析</strong></p>
<p>在从数据库中提取相关数据之前，首先需要确定数据的时间跨度，根据网站销售的物品的差异，确定合适的时间跨度。如果经营的是快速消费品，如日用品，可以确定时间跨度为一个季度或者一个月；如果销售的产品更替的时间相对久些，如电子产品，可以确定时间跨度为一年、半年或者一个季度。在确定时间跨度 之后就可以提取相应时间区间内的数据，其中：</p>
<ul>
<li><strong> </strong>最近一次消费(Recency)，取出来的数据是一个时间点，需要由当前时间点-最近<em>一次</em>消费时间点来作为该度量的值，注意单位的选择和统一，无论以小时、天为单位；</li>
<li><strong> </strong>消费频率(Frequency)，这个指标可以直接在数据库中COUNT用户的消费次数得到；</li>
<li><strong> </strong>消费金额(Monetary)，可以将每位客户的所有消费的金额相加(SUM)求得。</li>
</ul>
<p>获取三个指标的数据以后，需要计算每个指标数据的均值，分别以AVG(R)、AVG(F)、AVG(M)来表示，最后通过将每位客户的三个指标与均值进行比较，可以将客户细分为8类：</p>
<table border="1" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td width="114" valign="top"><strong>Recency</strong><strong> </strong></td>
<td width="114" valign="top"><strong>Frequency</strong></td>
<td width="114" valign="top"><strong>Monetary</strong></td>
<td width="114" valign="top"><strong>客户类型</strong></td>
</tr>
<tr>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">重要价值客户</td>
</tr>
<tr>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">重要发展客户</td>
</tr>
<tr>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">重要保持客户</td>
</tr>
<tr>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">重要挽留客户</td>
</tr>
<tr>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">一般价值客户</td>
</tr>
<tr>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">一般发展客户</td>
</tr>
<tr>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↑</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">一般保持客户</td>
</tr>
<tr>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">↓</td>
<td width="114" valign="top">一般挽留客户</td>
</tr>
</tbody>
</table>
<p>——“↑”表示大于均值，“↓”表示小于均值</p>
<p><strong>结果的展示</strong></p>
<p>RFM模型包括三个指标，无法用平面坐标图来展示，所以这里使用三维坐标系进行展示，一种X轴表示<strong>Recency</strong>，Y轴表示<strong>Frequency</strong>，Z轴表示<strong>Monetary</strong>，坐标系的8个象限分别表示8类用户，根据上表中的分类，可以用如下图形进行描述：</p>
<p><img class="alignnone size-full wp-image-2379" title="RFM-model" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/RFM-model.png" alt="" width="541" height="372" /></p>
<p>RFM分析也存在着一定的缺陷，它只能分析有交易行为的用户，而对访问过网站但未消费的用户由于指标的限制无法进行分析，这样就无法发现潜在的客户。所以 在分析电子商务网站的用户时，由于网站数据的丰富性——不仅拥有交易数据，而且可以收集到用户的浏览访问数据，可以扩展到更广阔的角度去观察用户，这方面 的定量分析会在之后的网站用户分析中进行详细叙述。</p>
<p>原文链接：http://webdataanalysis.net/web-quantitative-analysis/e-commerce-rfm/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/rfm-model.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WEB日志格式及分析工具</title>
		<link>http://www.biaodianfu.com/web-log-format.html</link>
		<comments>http://www.biaodianfu.com/web-log-format.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 10:28:42 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[访问日志]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2372</guid>
		<description><![CDATA[WEB日志是网站分析和网站数据数据整理最基础的数据，了解其格式和组成将有利于更好地进行数据的收集、处理和分析。 一、日志格式类型 目前常见的WEB日志格式主要由两类，一类是Apache的NCSA日志格式，另一类是IIS的W3C日志格式。NCSA格式又分为NCSA普 通日志格式（CLF）和NCSA扩展日志格式（ECLF）两类，目前最常用的是NCSA扩展日志格式（ECLF）及基于自定义类型的Apache日志格 式；而W3C扩展日志格式（ExLF）具备了更为丰富的输出信息，但目前的应用并不广泛，所以这里主要介绍的是NCSA扩展日志格式（ECLF）。 二、常见日志格式的组成 这是一个最常见的基于NCSA扩展日志格式（ECLF）的Apache日志样例： 58.61.164.141 – &#8211; [22/Feb/2010:09:51:46 +0800] “GET / HTTP/1.1″ 206 6326 ” http://www.google.cn/search?q=webdataanalysis” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)” 可以看到这个日志主要由以下几个部分组成： 访问主机（remotehost） 显示主机的IP地址或者已解析的域名。 标识符（Ident）由identd或直接由浏览器返回浏览者的EMAIL或其他唯一标示，因为涉及用户邮箱等隐私信息，目前几乎所有的浏览器就取消了这项功能。 授权用户（authuser）用于记录浏览者进行身份验证时提供的名字，如果需要身份验证或者访问密码保护的信息则这项不为空，但目前大多数网站的日志这项也都是为空的。 日期时间（date）一般的格式形如[22/Feb/2010:09:51:46 +0800]，即[日期/月份/年份:小时:分钟:秒钟 时区]，占用的的字符位数也基本固定。 请求（request）即在网站上通过何种方式获取了哪些信息，也是日志中较为重要的一项，主要包括以下三个部分： 请求类型（METHOD）常见的请求类型主要包括GET/POST/HEAD这三种； 请求资源（RESOURCE）显示的是相应资源的URL，可以是某个网页的地址，也可以是网页上调用的图片、动画、CSS等资源； 协议版本号（PROTOCOL）显示协议及版本信息，通常是HTTP/1.1或HTTP/1.0。 状态码（status）用于表示服务器的响应状态，通常1xx的状态码表示继续消息；2xx表示请求成功；3xx表示请求的重定向；4xx表示客户端错误；5xx表示服务器错误。 传输字节数（bytes）即该次请求中一共传输的字节数。 来源页面（referrer）用于表示浏览者在访问该页面之前所浏览的页面，只有从上一页面链接过来的请求才会有该项输出，如果是新开的页面则该项为空。上例中来源页面是google，即用户从google搜索的结果中点击进入。 用户代理（agent）用于显示用户的详细信息，包括IP、OS、Bowser等。 三、日志格式扩展 apache日志格式可以自定义来配置其输出格式，常见的基于NCSA扩展日志格式（ECLF）自定义添加的包括域名（domain）和cookie。其中域名在一个网站拥有二级域名或者子域名时，可以更好地区分日志；而cookie可以作为用户的身份标识。其他具体的自定义信息详见：Custom Log Formats 四、导入日志数据到MySQL中 访问分析是SEO的一项重要工作，但统计、分析工具毕竟功能是针对大众的，很多时候SEO需要一些特定的数据，是统计分析软件、程序所不能提供的。这样，直接的Web日志分析就是最合适的了，日志中会记录每一个访问情况，只要按自己的意愿提取、组合，就能得到想要的数据。使用SQL语句分析是最方便的，需要什么样的数据，只要使用相应的SQL命令就能实现。 导入Web日志到MySQL数据库的实现 1、修改Apache日志格式 修改Web日志格式为： Logformat combined %&#62;a,%ui,%un,[%tl],&#8221;%rm %ru [...]]]></description>
			<content:encoded><![CDATA[<p>WEB日志是网站分析和网站数据数据整理最基础的数据，了解其格式和组成将有利于更好地进行数据的收集、处理和分析。</p>
<p><strong>一、日志格式类型</strong></p>
<p>目前常见的WEB日志格式主要由两类，一类是Apache的NCSA日志格式，另一类是IIS的W3C日志格式。NCSA格式又分为NCSA普 通日志格式（CLF）和NCSA扩展日志格式（ECLF）两类，目前最常用的是NCSA扩展日志格式（ECLF）及基于自定义类型的Apache日志格 式；而W3C扩展日志格式（ExLF）具备了更为丰富的输出信息，但目前的应用并不广泛，所以这里主要介绍的是NCSA扩展日志格式（ECLF）。</p>
<p><strong>二、常见日志格式的组成</strong></p>
<p>这是一个最常见的基于NCSA扩展日志格式（ECLF）的Apache日志样例：</p>
<blockquote><p>58.61.164.141 – &#8211; [22/Feb/2010:09:51:46 +0800] “GET /  HTTP/1.1″ 206 6326 ” http://www.google.cn/search?q=webdataanalysis”  “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)”</p></blockquote>
<p>可以看到这个日志主要由以下几个部分组成：</p>
<p><strong>访问主机</strong>（remotehost） 显示主机的IP地址或者已解析的域名。</p>
<p><strong>标识符</strong>（Ident）由identd或直接由浏览器返回浏览者的EMAIL或其他唯一标示，因为涉及用户邮箱等隐私信息，目前几乎所有的浏览器就取消了这项功能。</p>
<p><strong>授权用户</strong>（authuser）用于记录浏览者进行身份验证时提供的名字，如果需要身份验证或者访问密码保护的信息则这项不为空，但目前大多数网站的日志这项也都是为空的。</p>
<p><strong>日期时间</strong>（date）一般的格式形如[22/Feb/2010:09:51:46 +0800]，即[日期/月份/年份:小时:分钟:秒钟 时区]，占用的的字符位数也基本固定。</p>
<p><strong>请求</strong>（request）即在网站上通过何种方式获取了哪些信息，也是日志中较为重要的一项，主要包括以下三个部分：</p>
<ul>
<li><strong> </strong>请求类型（METHOD）常见的请求类型主要包括GET/POST/HEAD这三种；</li>
<li><strong> </strong>请求资源（RESOURCE）显示的是相应资源的URL，可以是某个网页的地址，也可以是网页上调用的图片、动画、CSS等资源；</li>
<li><strong> </strong>协议版本号（PROTOCOL）显示协议及版本信息，通常是HTTP/1.1或HTTP/1.0。</li>
</ul>
<p><strong>状态码</strong>（status）用于表示服务器的响应状态，通常1xx的状态码表示继续消息；2xx表示请求成功；3xx表示请求的重定向；4xx表示客户端错误；5xx表示服务器错误。</p>
<p><strong>传输字节数</strong>（bytes）即该次请求中一共传输的字节数。</p>
<p><strong>来源页面</strong>（referrer）用于表示浏览者在访问该页面之前所浏览的页面，只有从上一页面链接过来的请求才会有该项输出，如果是新开的页面则该项为空。上例中来源页面是google，即用户从google搜索的结果中点击进入。</p>
<p><strong>用户代理</strong>（agent）用于显示用户的详细信息，包括IP、OS、Bowser等。</p>
<p><strong>三、日志格式扩展</strong></p>
<p>apache日志格式可以自定义来配置其输出格式，常见的基于NCSA扩展日志格式（ECLF）自定义添加的包括<strong>域名（domain）</strong>和<strong>cookie</strong>。其中域名在一个网站拥有二级域名或者子域名时，可以更好地区分日志；而cookie可以作为用户的身份标识。其他具体的自定义信息详见：<a href="http://httpd.apache.org/docs/2.0/mod/mod_log_config.html#formats" target="_blank">Custom Log Formats</a></p>
<p><strong>四、导入日志数据到MySQL中</strong></p>
<p>访问分析是SEO的一项重要工作，但统计、分析工具毕竟功能是针对大众的，很多时候SEO需要一些特定的数据，是统计分析软件、程序所不能提供的。这样，直接的Web日志分析就是最合适的了，日志中会记录每一个访问情况，只要按自己的意愿提取、组合，就能得到想要的数据。使用SQL语句分析是最方便的，需要什么样的数据，只要使用相应的SQL命令就能实现。</p>
<p>导入Web日志到MySQL数据库的实现</p>
<p>1、修改Apache日志格式</p>
<p>修改Web日志格式为：</p>
<blockquote><p>Logformat combined %&gt;a,%ui,%un,[%tl],&#8221;%rm %ru HTTP/%rv&#8221;,%Hs,%h&#8221;,&#8221;%{User-Agent}&gt;h&#8221;,%Ss:%Sh</p></blockquote>
<p>SQL需要导入的内容有特定的分隔符，Apache的日志默认是以空格分隔的，而有些内容（如状态码中的 200 610）也包含空格，这就无法准确的导入。将日志格式修改为以逗号分隔，就能准确的导入了。还可以根据自己的需要，取消日志格式中不需要的内容，减少日志文件大小。</p>
<p>2、建立MySQL数据表</p>
<blockquote><p>drop table if exists weblog;<br />
create table weblog (<br />
id int unsigned auto_increment PRIMARY KEY not null,<br />
l_date date,<br />
l_time time,<br />
c_ip varchar(15),<br />
s_ip varchar(15),<br />
s_port varchar(5),<br />
method varchar(10),<br />
path varchar(255),<br />
query varchar(255),<br />
status varchar(3),<br />
domain varchar(50),<br />
system varchar(200)<br />
);</p></blockquote>
<p>注：上面只是一个MySQL数据表结构范例，没有与上一步日志格式对应，请勿直接复制使用！</p>
<p>新建一个数据库，数据表结构与日志格式对应起来。</p>
<p>3、导入日志到MySQL中</p>
<blockquote><p>LOAD DATA INFILE  &#8217;/日志位置/日志文件&#8217;  INTO TABLE weblog FIELDS TERMINATED BY &#8216;,&#8217;;</p></blockquote>
<p>weblog 对应上面的数据表名。</p>
<p>另外，乐思蜀从网上找到一个将IIS日志导入到MySQL数据库的.pl程序，需要的<a href="http://www.box.net/shared/dnjdq4a6zc">点这里下载</a>（Readme.txt为使用说明）。</p>
<p>五、常用日志分析工具</p>
<p>1.awstats</p>
<p>2.analog</p>
<p>3.webalizer</p>
<p>4.PHPMyVisites</p>
<p>本文参考：</p>
<p>http://webdataanalysis.net/reference-and-source/weblog-format/</p>
<p>http://www.lesishu.com/net/import-weblog-to-mysql/</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/web-log-format.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>互联网成功案例：聪明点</title>
		<link>http://www.biaodianfu.com/smarter.html</link>
		<comments>http://www.biaodianfu.com/smarter.html#comments</comments>
		<pubDate>Sun, 11 Jul 2010 15:09:13 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[Adsense]]></category>
		<category><![CDATA[Adwords]]></category>
		<category><![CDATA[CPS]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2279</guid>
		<description><![CDATA[今天要介绍的是一个叫做聪明点（smarter.com）的网站，中文站是smarter.com.cn，说他牛X，一下子还真看不出来。没有华丽的UI设计，只有一个个朴素的产品列表页产品介绍页面。但是就是这样一个看着不起眼的普通的搜索引擎，却赚了比大把大把的钞票。 这个网站以1万美元从美国起家，06年做到了4000万美元，最后在08年7月以3.52亿美元的价格卖给了美 国第二大网络广告商ValueClick。 为什么这么不起眼的网站可以赚到那么多钱，答案其实很简单，但是如果要操作起来却非常非常的困难。购物搜索其实只是他的表面形式，使用购物搜索主要是为了扩充网站的信息。赚钱的主要途径中使用Google Adwords来赚钱Google Adsense的收入。通过关键词的差价，用庞大的数据量来获取巨额利润。网站上的电脑广告点击一下可能要几美元，但是他们从adwords购买的与电脑相关的关键词可能每次点击只要几美分，然后这些流量被导入到他们的购物搜索引擎上，其中的一定比例会点击他们的adsense广告。这个比例有多高？在2007年时80%。这个数据绝对震撼所有的站长。 07年7月，Google在全球封杀Adwords赚取Adsense收入这种模式，聪明点的大客户Adsense账户也被封掉，因为过去发展那几年财务报表非常牛，曹家宏就把公司以3.52亿美元的高价卖给了ValueClick。 现在来分析他们到底牛在什么地方： 一、Adwords、SEO、 Adsense这三方面的优化水平，它们是世界一流的。 曹家宏玩搜索引擎到底有多牛？来看看他的履历：1997年开始在美国做互联网，1999年担任Overture产品和市场副总裁，Overture 被认为是“点击付费”与“竞价排名”、“内容关联广告”的鼻祖，百度推出的竞价排名服务也是完全借鉴了Overture的业务模式。2003 年，Overture被雅虎以16.3 亿美元的价格收购。 这个开发互联网上最早的一套竞价排名系统的人，对Adwords研究当然是相当的深，同样它们玩SEO功夫更是不在话下，它们每天通过SEO带来的免费流量也是超级巨大的，懂得SEO策略的人，看一下这个网站的链接构架，URL、关键词布局这几点，立刻就知道其水平了。对于赚取Adsense的水平，看看人家的收入，自然也是世界顶级水平的。 二、执行力够狠，管理能力够强， 运营水平够牛。 玩Adwords、SEO、Adsense好的人很多，但是能够玩出这么大规模的人没几个。 执行力够狠。聪明点是上百人做了一系列网站，网页数量是上千万的，执行力越狠才能越赚钱，如果你现在赚的不够多，那是因为你对自己还不够狠。 管理能力够强。聪明点开发了一套系统来控制自己的Adwords 投放，检测回报率等等，并且将上百人明确分工来运营。 运营水平够牛。聪明点从一开始，都是世界级的运营策略，每个热门语言一个网站，每年增长都非常迅速，就算2007年Adsense账号被封，还能及时卖出一个好价格，这运营水平绝对是世界大牛。 赚钱本质很简单，但是表现形式你可以根据自己的需要来设计，但是不要局限在表现形式和概念上。你要做的是搞明白表面形式和赚钱本质。 聪明点在卖掉之前，他表面形式是一个购物搜索引擎，但是他赚钱的方式确实用SEO和Adwords来赚Adsense 的收入，卖掉之后呢？ 电子商务发展越来越成熟，赚取各类电子商务网站的CPS广告佣金也是一个越来越大的收入。用Adwords和SEO来赚取CPS佣金，也将成为一种趋势。 本文参考自王通的《一个搜索引擎高手的网站》，原文链接：http://www.ufoer.com/post/417.html]]></description>
			<content:encoded><![CDATA[<p>今天要介绍的是一个叫做聪明点（smarter.com）的网站，中文站是smarter.com.cn，说他牛X，一下子还真看不出来。没有华丽的UI设计，只有一个个朴素的产品列表页产品介绍页面。但是就是这样一个看着不起眼的普通的搜索引擎，却赚了比大把大把的钞票。</p>
<p>这个网站以1万美元从美国起家，06年做到了4000万美元，最后在08年7月以3.52亿美元的价格卖给了美 国第二大网络广告商ValueClick。</p>
<p>为什么这么不起眼的网站可以赚到那么多钱，答案其实很简单，但是如果要操作起来却非常非常的困难。购物搜索其实只是他的表面形式，使用购物搜索主要是为了扩充网站的信息。赚钱的主要途径中使用Google Adwords来赚钱Google Adsense的收入。通过关键词的差价，用庞大的数据量来获取巨额利润。网站上的电脑广告点击一下可能要几美元，但是他们从adwords购买的与电脑相关的关键词可能每次点击只要几美分，然后这些流量被导入到他们的购物搜索引擎上，其中的一定比例会点击他们的adsense广告。这个比例有多高？在2007年时80%。这个数据绝对震撼所有的站长。</p>
<p>07年7月，Google在全球封杀Adwords赚取Adsense收入这种模式，聪明点的大客户Adsense账户也被封掉，因为过去发展那几年财务报表非常牛，曹家宏就把公司以3.52亿美元的高价卖给了ValueClick。</p>
<p>现在来分析他们到底牛在什么地方：</p>
<p><strong>一、Adwords、SEO、 Adsense这三方面的优化水平，它们是世界一流的。<br />
</strong><br />
曹家宏玩搜索引擎到底有多牛？来看看他的履历：1997年开始在美国做互联网，1999年担任Overture产品和市场副总裁，Overture  被认为是“点击付费”与“竞价排名”、“内容关联广告”的鼻祖，百度推出的竞价排名服务也是完全借鉴了Overture的业务模式。2003 年，Overture被雅虎以16.3 亿美元的价格收购。</p>
<p>这个开发互联网上最早的一套竞价排名系统的人，对Adwords研究当然是相当的深，同样它们玩SEO功夫更是不在话下，它们每天通过SEO带来的免费流量也是超级巨大的，懂得SEO策略的人，看一下这个网站的链接构架，URL、关键词布局这几点，立刻就知道其水平了。对于赚取Adsense的水平，看看人家的收入，自然也是世界顶级水平的。</p>
<p><strong>二、执行力够狠，管理能力够强， 运营水平够牛。</strong></p>
<p>玩Adwords、SEO、Adsense好的人很多，但是能够玩出这么大规模的人没几个。</p>
<ol>
<li>执行力够狠。聪明点是上百人做了一系列网站，网页数量是上千万的，执行力越狠才能越赚钱，如果你现在赚的不够多，那是因为你对自己还不够狠。</li>
<li>管理能力够强。聪明点开发了一套系统来控制自己的Adwords 投放，检测回报率等等，并且将上百人明确分工来运营。</li>
<li>运营水平够牛。聪明点从一开始，都是世界级的运营策略，每个热门语言一个网站，每年增长都非常迅速，就算2007年Adsense账号被封，还能及时卖出一个好价格，这运营水平绝对是世界大牛。</li>
</ol>
<p>赚钱本质很简单，但是表现形式你可以根据自己的需要来设计，但是不要局限在表现形式和概念上。<strong>你要做的是搞明白表面形式和赚钱本质</strong>。</p>
<p>聪明点在卖掉之前，他表面形式是一个购物搜索引擎，但是他赚钱的方式确实用SEO和Adwords来赚Adsense 的收入，卖掉之后呢？  电子商务发展越来越成熟，赚取各类电子商务网站的CPS广告佣金也是一个越来越大的收入。用Adwords和SEO来赚取CPS佣金，也将成为一种趋势。</p>
<p>本文参考自王通的《一个搜索引擎高手的网站》，原文链接：http://www.ufoer.com/post/417.html</p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/smarter.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>A/B测试终极指南</title>
		<link>http://www.biaodianfu.com/a-b-testing.html</link>
		<comments>http://www.biaodianfu.com/a-b-testing.html#comments</comments>
		<pubDate>Fri, 02 Jul 2010 00:07:43 +0000</pubDate>
		<dc:creator>标点符</dc:creator>
				<category><![CDATA[网站分析]]></category>
		<category><![CDATA[统计]]></category>

		<guid isPermaLink="false">http://www.biaodianfu.com/?p=2226</guid>
		<description><![CDATA[A / B测试不是一个时髦名词。现在很多有经验的营销和设计工作者用它来获得访客行为信息，来提高转换率。然而， A / B测试与SEO不同的是，人们都不太知道如何进行网站分析和可用性分析。他们并不完全明白它是什么或如何更有效的使用它。本文将为你提供有史以来最好的A / B测试教程。 什么是A/B测试? A / B测试的核心就是：确定两个元素或版本（A和B）哪个版本更好，你需要同时实验两个版本。最后，选择最好的版本使用。 网络上的A / B测试，即你设计的页面有两个版本（A和B），A为现行的设计（称为控制） ， B是新的设计。比较这两个版本之间你所关心的数据（转化率，业绩，跳出率等） 。最后，您选择效果最好的版本。 测试哪些东西? 你要选择什么去测试取决于你的目标。例如，如果你的目标是增加顾客数量，那么您可能测试下列内容：注册表单数量，字段类型要求，隐私政策等。在这种情况下A / B测试的目标是要弄清楚什么阻止了游客注册。需要填写的表单的数量？用户的隐私？还是该网站做了让游客不信任的事情？所有这些问题都可以通过一个个A/B测试获得答案。 每一个A / B测试内容都是独一无二的，单通常测试一下这些内容： 行动按钮的措辞，大小，颜色和位置， 标题或产品说明， 表单的数量和字段类型， 网站的布局和风格， 产品定价和促销活动， 着陆和产品页面上的图片， 页面上文字的长度（少Vs多）。 一旦你决定要测试什么，下一步当然是要选择一个合适的测试工具。如果你想要一个基础的免费工具，可以使用Google Website Optimizer。如果你想要功能更加强大的工具，可以使用Visual Website Optimizer  。其他的一些选择都是可以的，建立试验在所有工具中都很相似，所以我们只需讨论一种即可。 你可以通过两种方法建立A / B测试： 在页面测试加载前替换元素 如果你测试的是页面上的单个元素，如注册按钮，然后需要在测试工具中设置按钮。当测试时，在A / B工具将在页面给用户前随机替换按钮。 重定向到另一页面 如果你想通过A / B测试整个页面，比如说，一个绿色的主题和一个红色主题，那么你就需要创建和上传新的页面。例如，如果您的主页是 http://www.example.com/index.html，那么你需要创建另外一个页面 http://www.example.com/index1.html。当测试运行时，您的测试工具将一部分访问者重定向到第二个网址。 一旦您使用了上面的两种变换方法，下一步是建立您的转换目标。通常，你会得到一个JavaScript代码，您可以复制并粘贴到一个需要游客到达的目标网页。例如，如果您有一个电子商务网站，你正在测试的“立即购买“按钮的颜色，然后您的转换目标将是购买成功后的“谢谢您“页面。 在转换事件发生的同时，在A / B测试工具，记录了哪种页面显示给了访问者。经过足够数量的游客，您可以确定哪个页面带来了最多的转化！建立和运行的A [...]]]></description>
			<content:encoded><![CDATA[<p>A / B测试不是一个时髦名词。现在很多有经验的营销和设计工作者用它来获得访客行为信息，来提高转换率。然而， A / B测试与SEO不同的是，人们都不太知道如何进行网站分析和可用性分析。他们并不完全明白它是什么或如何更有效的使用它。本文将为你提供有史以来最好的A / B测试教程。</p>
<p><strong>什么是A/B测试?</strong></p>
<p>A / B测试的核心就是：确定两个元素或版本（A和B）哪个版本更好，你需要同时实验两个版本。最后，选择最好的版本使用。</p>
<p><img class="alignnone size-full wp-image-2227" title="ab-testing" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/ab-testing.png" alt="" width="498" height="381" /></p>
<p>网络上的A / B测试，即你设计的页面有两个版本（A和B），A为现行的设计（称为控制） ， B是新的设计。比较这两个版本之间你所关心的数据（转化率，业绩，跳出率等） 。最后，您选择效果最好的版本。</p>
<p><strong>测试哪些东西?</strong></p>
<p>你要选择什么去测试取决于你的目标。例如，如果你的目标是增加顾客数量，那么您可能测试下列内容：注册表单数量，字段类型要求，隐私政策等。在这种情况下A / B测试的目标是要弄清楚什么阻止了游客注册。需要填写的表单的数量？用户的隐私？还是该网站做了让游客不信任的事情？所有这些问题都可以通过一个个A/B测试获得答案。</p>
<p>每一个A / B测试内容都是独一无二的，单通常测试一下这些内容：</p>
<ul>
<li>行动按钮的措辞，大小，颜色和位置，</li>
<li>标题或产品说明，</li>
<li>表单的数量和字段类型，</li>
<li>网站的布局和风格，</li>
<li>产品定价和促销活动，</li>
<li>着陆和产品页面上的图片，</li>
<li>页面上文字的长度（少Vs多）。</li>
</ul>
<p>一旦你决定要测试什么，下一步当然是要选择一个合适的测试工具。如果你想要一个基础的免费工具，可以使用<a href="http://www.google.com/websiteoptimizer">Google Website Optimizer</a>。如果你想要功能更加强大的工具，可以使用<a href="http://visualwebsiteoptimizer.com/">Visual Website Optimizer</a>  。其他的一些选择都是可以的，建立试验在所有工具中都很相似，所以我们只需讨论一种即可。</p>
<p>你可以通过两种方法建立A / B测试：</p>
<ul>
<li><strong>在页面测试加载前替换元素</strong><br />
如果你测试的是页面上的单个元素，如注册按钮，然后需要在测试工具中设置按钮。当测试时，在A / B工具将在页面给用户前随机替换按钮。</li>
<li><strong>重定向到另一页面</strong><br />
如果你想通过A / B测试整个页面，比如说，一个绿色的主题和一个红色主题，那么你就需要创建和上传新的页面。例如，如果您的主页是 http://www.example.com/index.html，那么你需要创建另外一个页面 http://www.example.com/index1.html。当测试运行时，您的测试工具将一部分访问者重定向到第二个网址。</li>
</ul>
<p>一旦您使用了上面的两种变换方法，下一步是建立您的转换目标。通常，你会得到一个JavaScript代码，您可以复制并粘贴到一个需要游客到达的目标网页。例如，如果您有一个电子商务网站，你正在测试的“立即购买“按钮的颜色，然后您的转换目标将是购买成功后的“谢谢您“页面。</p>
<p>在转换事件发生的同时，在A / B测试工具，记录了哪种页面显示给了访问者。经过足够数量的游客，您可以确定哪个页面带来了最多的转化！建立和运行的A / B测试，其实很简单。</p>
<p><strong>该做什么和不该做什么</strong></p>
<p>虽然A / B测试是超级简单的概念，但是请记住，以下这些都只是我自己的经验。</p>
<p><strong>注意事项</strong></p>
<ul>
<li>不要分开你的测试情况。始终两个版本同时进行测试。如果您第一星期测试第一版本，第二星期测试第二个版本，你就错了。有可能B版本带来的流量更糟糕，但是带来了更好的业绩，因为两个版本之间的流量始终存在不一样。</li>
<li>不要结束得太早。有一个概念叫做“统计信心“ ，无论你的测试结果明显的。如果你只有少数转换或游客，它都无法确定最终的结果。大多数A / B测试工具都有报告统计，但如果你是手动测试，你可以使用 <a href="http://visualwebsiteoptimizer.com/ab-split-significance-calculator/">在线计算器</a>。</li>
<li>不要让常客惊讶。如果你正在测试网站的一部分。包括新访客和常客，不要使他们觉得震惊。尤其不要因为哪些可能不会最终实施变化。</li>
<li>不要让你的直觉推翻了测试结果。在A / B测试的结果往往是令人惊讶的或直观的。在一个绿色为主题的网站，一个明显的红色按钮有可能成为赢家。即使红色按钮不容易吸引注意。您要测试的目标是一个更好的转换率，而不是美学，所以在得到测试借过钱不要拒绝任何尝试。</li>
</ul>
<p><strong>需要做的</strong></p>
<ul>
<li>知道运行测试多久。结束太早，可能会使你花了时间但是没有得到有意义的结果。结束太晚也不好，因为效果不佳的页面可能影响你的转化和业绩。使用一个<a href="http://visualwebsiteoptimizer.com/ab-split-test-duration/">计算器</a>，来确定测试多久以后来结束它。</li>
<li>将相同的页面呈献给同一个访客。您的工具应该有一个记忆访问者已经看到的页面的功能。这样可以防止向同一用户显示一不同的价格或不同的促销优惠。</li>
<li>让您的A / B测试在整个网站保持一致。如果你正在测试的登录按钮在多个地点出现，然后一个访问者应在所有的地方看到同样的变化。在页面1显示一个样子，在页面2显示两外一个样子，会使试验结果被干扰。</li>
<li>做很多的A / B测试。让我们面对现实吧：你的第一个A / B测试可能会无效。但是不要绝望。一个A / B测试只能有三个结果：没有结果，不好的结果和好的结果。优化转换率的关键是要做大量的A / B测试，把所有的好的结果拼接起来，最终推动业绩。</li>
</ul>
<p><strong>经典A/B测试案例研究</strong></p>
<p>这里有一些如何进行A/B测试的案例研究。</p>
<p><a href="http://37signals.com/svn/posts/1525-writing-decisions-headline-tests-on-the-highrise-signup-page">Writing Decisions: Headline Tests on the Highrise Sign-Up Page</a> 37Signals测试他们的价格页面的标题。最终发现， “30-Day Free Trial on All Accounts “比原来的“Start a Highrise Account. “多产生30 ％以上的订单。</p>
<p><img class="alignnone size-full wp-image-2228" title="hrhq-signuphead-30day60sec" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/hrhq-signuphead-30day60sec.png" alt="" width="530" height="140" /></p>
<p><a href="http://dustincurtis.com/you_should_follow_me_on_twitter.html">“You Should Follow Me on Twitter Here”</a> (Dustin Curtis) 这是一个用来测试召唤用户在Twitter上关注自己的试验。. Dustin 发现提示文字是“You should follow me on Twitter here” 的效果是“I’m on Twitter.” 173%</p>
<p><span><img class="alignnone size-full wp-image-2229" title="dustin" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/dustin.png" alt="" width="488" height="59" /></span></p>
<p><a href="http://carsonified.com/blog/design/human-photos-double-your-conversion-rate/">Human Photos Double Conversion Rates</a> 从两个不同的A / B测试将在网站上增加转换率的人的照片：一个令人令人惊讶的结论，A/B测试两张图片，将真人照片放在网站上会获得一倍的转化。研究说明，我们潜意识被照片吸引了。</p>
<p><img class="alignnone size-full wp-image-2230" title="human" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/human.png" alt="" width="415" height="184" /></p>
<p><a href="http://www.fourhourworkweek.com/blog/2009/08/12/google-website-optimizer-case-study/">Google Website Optimizer Case Study: Daily Burn, 20%+ Improvement</a> (Tim Ferriss) 一个将用户选择减少的变化使转化提高了20%，最终的版本在细节和文字上更易吸引目光。</p>
<p><img class="alignnone size-full wp-image-2231" title="gymnii" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/gymnii.jpg" alt="" width="300" height="241" /></p>
<p><a href="http://visualwebsiteoptimizer.com/split-testing-blog/ab-test-case-study-how-two-magical-words-increased-conversion-rate-by-28/">Two Magical Words Increased Conversion Rate by 28%</a> “It’s free” 这个单词增加了注册按钮点击次数的28%, 测试结果表明，在行动召唤上一些很小的变化会带来令人惊讶的结果。</p>
<p><img class="alignnone size-full wp-image-2232" title="its-free-shot" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/its-free-shot.png" alt="" width="440" height="70" /></p>
<p><a href="http://dmix.ca/2010/05/how-we-increased-our-conversion-rate-by-72/">Changing the Sign-Up Button from Green to Red</a> 依靠A / B测试， CareLogger把注册按钮从绿色修改为红色增加了34％转换率！</p>
<p><img class="alignnone size-full wp-image-2233" title="get-started" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/get-started.png" alt="" width="580" height="122" /></p>
<p><a href="http://www.getelastic.com/single-vs-two-page-checkout/">Single page vs. multi-step checkout</a> 如果你有一个在线商店，很常见的就是支付流程。这个A / B测试发现，多个支付流程比单个支付流程完成的销售更好。</p>
<p><img class="alignnone size-full wp-image-2234" title="getelastic" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/getelastic.jpg" alt="" width="300" height="283" /></p>
<p><a href="http://www.lukew.com/ff/entry.asp?1007">&#8220;Mad Libs&#8221; style form increases conversion 25-40%</a> 打败传统的智慧，此A / B测试发现一<em>段风格</em>形式输入字段比传统形式的布局更好。</p>
<p><img class="alignnone size-full wp-image-2235" title="madlibs" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/madlibs.gif" alt="" width="558" height="164" /></p>
<p><a href="http://carsonified.com/blog/business/the-business-case-for-ab-testing/">Complete redesign of product page increased sales by 20%</a> 一个软件产品的公司重新设计他们的产品页给它一个现代的外观和增加信任模块。最终结果：他们成功地增加20 ％的总销售额。本案例研究证明了设计对销售的影响。</p>
<p><img class="alignnone size-full wp-image-2236" title="aquasoft" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/aquasoft.png" alt="" width="450" height="291" /></p>
<p><a href="http://www.marketingexperiments.com/blog/research-topics/response-capture-case-study.html">Marketing Experiments response capture case study – triple digit increase in conversions</a> 通过优化邮件地址获取提高了258 ％。重点是消除所有的干扰，并要求游客只需提供电子邮件地址。使用亚马逊礼品卡让他/她的完成个人资料。</p>
<p><img class="alignnone size-full wp-image-2237" title="marketing-experiments" src="http://www.biaodianfu.com/wp-content/uploads/2010/07/marketing-experiments.jpg" alt="" width="300" height="225" /></p>
<p><strong>A/B</strong><strong>测试工具</strong></p>
<p>有许多侧重点，价位和功能不同的A / B测试工具，这里是一些：</p>
<ul>
<li><a href="http://www.google.com/websiteoptimizer">Google Website Optimizer</a><br />
搜索巨头提供的免费A/B测试工具。一个很好的入门级工具，但是没有一些先进的功能。</li>
<li><a href="http://www.bingocardcreator.com/abingo/">A/Bingo</a> and <a href="http://vanity.labnotes.org/">Vanity</a><br />
基于Ruby on Rails开发的服务器组件。需要编程和代码集成。</li>
<li><a href="http://visualwebsiteoptimizer.com/">Visual Website Optimizer</a><br />
一个易于使用的A / B测试工具，包含一些先进的功能，如所见即所得的编辑器，单击地图，访问者分割和标签等。</li>
<li><a href="http://unbounce.com/">Unbounce</a> and <a href="http://performable.com/">Performable</a><br />
集成着陆页设计的A / B测试工具。</li>
<li><a href="http://vertster.com/">Vertster</a>, <a href="http://sitespect.com/">SiteSpect</a>, <a href="http://www.webtrends.com/products/optimize.aspx">Webtrends Optimize</a> and <a href="http://www.omniture.com/en/products/conversion/testandtarget">Omniture’s Test&amp;Target</a><br />
企业级测试工具。</li>
</ul>
<p><strong>一些深入研究的A/B测试资料</strong></p>
<p>如果你已经读到这里，那么A / B测试大概已经激起你的兴趣。在这里，有一些非常好的A/B测试资源。</p>
<p><strong>寻找你下一个A/B测试的灵感</strong></p>
<ul>
<li><a href="http://whichtestwon.com/">Which Test Won?</a><br />
一个猜测那种情况会最终胜利的游戏。</li>
<li><a href="http://www.conversion-rate-experts.com/articles/101-google-website-optimizer-tips/">101 A/B Testing Tips</a><br />
大量的A/B测试技巧和方法。</li>
<li><a href="http://abtests.com/">ABtests.com</a><br />
一个可以分享和阅读A/B测试结果的地方。</li>
<li><a href="http://visualwebsiteoptimizer.com/ideafox.php">A/B Ideafox</a><br />
搜索引擎的A / B和多变量的案例研究。</li>
</ul>
<p><strong>一些介绍性文章</strong></p>
<ul>
<li><a href="http://elem.com/~btilly/effective-ab-testing/">Effective A/B Testing</a><br />
By Ben Tilly.</li>
<li><a href="http://exp-platform.com/Documents/GuideControlledExperiments.pdf">Practical Guide to Controlled Experiments on the Web</a> (PDF)<br />
From Microsoft Research.</li>
<li><a href="http://20bits.com/articles/an-introduction-to-ab-testing/">Introduction to A/B Testing</a><br />
From the 20bits blog</li>
</ul>
<p><strong>A/B</strong><strong>测试中的数学</strong></p>
<ul>
<li><a href="http://20bits.com/articles/statistical-analysis-and-ab-testing/">Statistics for A/B Testing</a><br />
From the 20bits blog.</li>
<li><a href="http://www.evanmiller.org/how-not-to-run-an-ab-test.html">How Not to Do A/B Testing</a></li>
<li><a href="http://visualwebsiteoptimizer.com/split-testing-blog/what-you-really-need-to-know-about-mathematics-of-ab-split-testing/">What You Should Know About the Mathematics of A/B Testing</a><br />
From my own blog.</li>
<li><a href="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html">Easy Statistics for AdWords A/B Testing, and Hamsters</a></li>
<li><a href="http://www.cennydd.co.uk/2009/statistical-significance-other-ab-test-pitfalls/">Statistical Significance and Other A/B Test Pitfalls</a></li>
</ul>
<p>原文地址：<a href="http://www.smashingmagazine.com/2010/06/24/the-ultimate-guide-to-a-b-testing/">http://www.smashingmagazine.com/2010/06/24/the-ultimate-guide-to-a-b-testing/</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.biaodianfu.com/a-b-testing.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>
