标点符(钱魏 Way)

数据挖掘在旅游营销中的应用

目前,中国的旅游企业面临着一个竞争非常激烈的经营环境。在现有的需求中获得足够的市场份额是每个企业非常关心的问题。酒店的亏损经营、旅行社的微利经营实际上预示着通过低价竞争获取市场份额的营销策略在中国已经走到了尽头。在这种状况下,迫切要求我们采取
一种切实有效的非价格竞争策略。价格战的根本原因是不能提供差异化的产品和差异化的营销。新经济建立在信息技术的基础之上,追求差异化、个性化、网络化和速度化。在这种时代背景下,将数据挖掘技术应用于旅游营销无疑是一种有益的尝试。

一、什么是数据挖掘

数据挖掘(Data Mining,简称DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

目前数据挖掘技术广泛应用于金融领域,在市场营销、工程与科学研究、产品制造以及司法等领域也展开了一些应用。在市场营销领域的应用是利用数据挖掘技术进行市场定位和消费者分析,辅助制定市场策略。由于管理信息系统和P O S系统在商业尤其是零售业的广泛普及,特别是条形码技术的使用,可以收集到大量关于顾客购买情况的数据,并且数据量在不断激增。利用数据挖掘技术,通过对顾客历史数据的分析,可以得到关于顾客购买行为的一般特征,对提高企业的竞争力及促销是大有帮助的,从而为商业决策提供依据。

数据挖掘技术不同于传统的MIS(管理信息系统)或DSS(决策支持系统)。其研究重点放在了传统方法所难以解决的问题之上,通过定量分析的方法来衡量一些具体的指标,从而进行定性分析。

二、旅游业需要数据挖掘技术

1、企业当前MIS或DSS的低ROI(投资回报率)

传统的MIS或DSS由于相关技术的限制,往往只能自动完成普通员工的日常工作,提高已有过程的效率和收集数据,即使是专为高层管理人员设计的系统(如经理信息系统),其辅助决策的能力也令人怀疑。收集了大量数据却不能有效地利用它,而且企业为此进行了巨额投资,直到出现了数据挖掘技术,那些隐藏在大量原始数据(rawdata)背后的有用信息才被发现和利用.

2、大企业在低价竞争者面前束手无策

目前旅游业的低价竞争现象在航空、酒店、旅行社等行业非常普遍,四、五星级酒店在二、三星级酒店价位上销售。很明显,在供大于求或需求在短期内不会有明显增加的市场环境下,客户是稀缺资源,企业只能在“一方得到,一方失去”的游戏规则下竞争,不幸的是大家只会使用低价竞争策略。应用数据挖掘技术,可以使在某一范围内最先实施这项技术的几个企业获得竞争优势,从行动迟缓的竞争对手那里赢得客户,并且可以借助数据挖掘技术来提高客户的忠诚度,以后其他竞争对手要想重新获得失去的客户就非常难了。20世纪70年代末出现的由卫星连接的全球计算机饭店预订网络,由假日饭店最先开发并投入使用,全球范围内的游客任何时候都可以预订假日饭店集团遍布全球的分销网点的房间,这项技术的应用方便了客户,从而锁定了客户,为企业带来了绝对领先的竞争优势。在今天,“数据挖掘”就是这样的技术。

从以上两点来看,数据挖掘技术在解决企业当前存在的问题以及发展都有重要作用,所以,旅游业完全有必要尽早应用该项技术。

三、数据挖掘技术在旅游营销中的应用

数据挖掘利用各种分析工具(或分析方法)在海量数据中抽取出潜在的、不为人知的有用信息、模式和趋势。数据挖掘分析方法主要有:分类(Classification)、估值(Estimation)、预言(Pre-diction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化(Description and Visualization)。

就旅游营销的基本原理或核心原理而言,它与其它领域中的营销是一致的,但就旅游需求的性质和旅游供给行业的经营特点而言,旅游营销又有着一定的特殊性。任何一次对旅游目的地的访问都是由多种要素组合起来的,一般包括:食、住、行、游、购、娱。这就意味着一次完整的旅游是多个单独产品组合而成,那么研究产品之间的有机组合对旅游营销有着重要的意义。

旅游业是典型的服务行业,旅游产品在生产和消费上的不可分性、易折损性、不可储存性,在客观上要求产品供给者必须准确及时地了解消费者的需求,利用IT技术快速、自动地对客户进行细分,找出那些最具价值的客户,并通过一系列促销活动保持住原有客户,吸引潜在客户。

基于以上几点原因,下文着重于以下两个方面:

1.关联规则用于交叉营销

交叉营销就是指向现有的客户提供新的产品和服务的营销过程,如某些购买了某家旅行社推出的“世界之窗一日游”的客户,或许对该旅行社推出的“澳门四日游”更感兴趣,他们或许会向你打听有关情况,或许到一些旅游网站去搜寻这些信息。此时,若经营者发现了这一动向,便可以根据数据加以分析、判断“世界之窗——澳门七日游”的可行性。但往往经营者根本不知道这些情况,或者即使隐约发现了类似信息,也无法据此来做出有效的行动。同样的道理对于一个整体旅游产品,游客往往会对吃、住或对所游览的某些景点颇有怨言,甚至投诉,其中的原因不一定全是导游的错,或许整个产品组合根本就不适合游客的消费偏好。

以上两个问题共同的特点在于,旅游产品之间的关联性非常重要,无论其替代性或是互补性都直接影响了客户的全部感受。产品A和B之间的相互关系是否有规律可循呢?关联规则就是通过量化的数字描述产品A的出现对产品B的出现有多大影响。

用四个属性来描述关联规则:可信度—P(B|A)、支持度—P(A∩B)、期望可信度P—(B)、作用度——P(B|A)P(B)。其中P表示某一事件出现的概率。

可信度是对关联规则的准确度的衡量,支持度是对关联规则重要性的衡量。支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。有些关联规则可信度虽然很高,但支持度却很低,说明该关联规则实现的机会很小,因此也不重要。期望可信度
描述了在没有产品A的作用下,产品B本身的支持度;作用度描述了产品A对产品B的影响力的大小。作用度越大,说明产品B受产品A的影响越大。一般情况,有用的关联规则的作用度都应该大于1,只有关联规则的可信度大于期望可信度,才说明A的出现对B的出现有促进作用,也说明了它们之间某种程度的相关性;如果作用度不大于1,则此关联规则也就没有意义了。

在关联规则的四个属性中,支持度和可信度能够比较直接衡量关联规则的性质。任意给出事件中的两个产品,它们之间都存在关联规则,只不过属性值有所不同。如果不考虑关联规则的支持度和可信度,那么在事件数据库中可以发现无穷多的关联规则,事实上,人们一般只对满
足一定的支持度和可信度的关联规则感兴趣。因此,为了找到在实际应用中有意义的关联规则,需要给定两个阈值:最小支持度和最小可信度,前者规定了关联规则必须满足的最小支持度;后者规定了关联规则必须满足的最小可信度。一般称满足一定要求的(如较大的支持度和
可信度)的规则为强规则(Strong rules)。

以上方法从数学的角度而言很简单,但在现实中却并不容易实现。如由于消费旅游产品一般均需消耗较长时间,判断两个产品是先后出现还是同时出现便比较困难。这里设计了一个简单的例子来说明整个解决方案。假设有五位客户的数据如下表:

此时,B的期望可信度P(B):0.2,客户1和2均消费了产品A和B,判断的关键在于设计一个时间间隔,如10天,来判断两个产品是先后出现还是同时出现。由此产生下表:

由此得出:支持度P(A∩B)=0.4;可信度P(B|A)=0.6;作用度P(B| A)/P(B)=3。假如我们规定:最小支持度为0.4,最小可信度为0.4,那么该事件满足这一条件,但还不是强规则。这时,需要根据具体情况来分析是否开发新产品,如分析其成本、风险等指标,从而作出判断。

发现有意义的关联规则要经过三个步骤:(1)建立数据仓库;(2)给定最小支持度和最小可信度,通过相应数据挖掘软件获得关联规则;(3)可视化分类结果,并结合实际对关联规则做出评估。

2.分类器和聚类用于客户细分

市场细分往往是市场营销工作的第一步,是有效地规划、预算和控制营销活动的基础。但在市场细分过程常常是分了很多类别,却无法拿出有力的证据支持我们确定某个目标市场。关于分类,数据挖掘技术提供了两类方法来确立精确的营销目标。一种是分类器(classifier),通
过有监督学习来建立细分的技术(由于是根据预先设想的细分特征值来进行细分,所以叫有监督学习)。另一种是聚类(clusting),通过无监督学习来建立细分的技术,聚类技术能够抽取数据之间的某些共性。

在已有数据的基础上形成一个分类函数或构造出一个分类模型就是分类器(classifier).该函数或模型把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于市场细分。构造一个分类器,需要有一个训练样本数据集作为输入。分类器又分3种:决策树分类器、选择树
分类、证据分类器。许多数据挖掘软件主要使用决策树分类器,这个过程类似于通过一个植物的特征来辨认植物。决策树生成器从一个“训练集”中生成决策树,比如我们得到了如图1所录的决策树(一般,某个软件直观地显示出这样的决策树出来,以供决策),我们可以将年轻、未婚、年薪lO万之多的客户群作为营销目标。

聚类分析经常使用模糊数学方法,这样的方法称为模糊聚类,是现代数学方法中模糊数学的重要研究领域。首先对样本数据库中数据的各项属性进行量化,通过一个衡量指标来决定分类的粗细,指标值越大所分类别越多,指标值越小所分类别越少。有如下一个简单的数据库。

第一步:数据标准化,将相应属性值转化成数字;第二步:建立模糊相似矩阵;第三步:聚类,根据大小不同的分类指标值作出分类。

以上过程你只需输入数据并给出指标值,计算机便会自动给出分类结果,但结果并不会告诉你哪一个分类是你想要的,你必须根据行业特征和经验来判断某个分类更具有价值。

以上仅从两个方面探讨了数据挖掘技术在旅游营销中的应用,随着该项技术自身的不断发展,以及人们在管理活动中的不断摸索,数据挖掘在旅游营销中的应用将逐步成熟起来。如今,中国的旅游市场正处于产品同质化、竞争白热化的阶段,留住一个客户比发展一个客户更重要,利用数据挖掘这类新技术提高企业的客户服务质量、发现市场、不断推出新的旅游产品,从而使本企业的产品严格区别于其他企业,建立旅游产品品牌形象,最终吸引和留住高价值的客户。

参考文献:

  1. (美)菲利普·科特勒.营销管理·分析、计划、执行和控制(第九版).上海人民出版社,1999.
  2. (美)罗纳德·S·史威福特.客户关系管理·加速利润和优势提升.中国经济出版社.2002.
  3. (美)AlexBerson StephenSmith KurtThearling.构建面向CRM的数据挖掘应用.人民邮电出版社,麦格劳-希
    尔国际公司,2001.
  4. (英)维克多·米德尔顿.旅游营销学.中国旅游出版社.2001.
  5. (美)史蒂芬·哈格等.信息时代的管理信息系统第2版.机械工业出版社,麦格劳.希尔国际公司,2000.
  6. (美)W ·H·Inmon.数据仓库.机械工业出版社,2000.
  7. 魏小安.旅游热点问题实说.中国旅游出版社.2001.

本文作者:曾凡涛 武汉大学商学院旅游管理系讲师 熊元斌 武汉大学商学院旅游管理系教授、经济学博士

码字很辛苦,转载请注明来自标点符《数据挖掘在旅游营销中的应用》

评论