一、什么是用户模型? Persona([pə:'səunə]):(Persona是用户模型的的简称)是虚构出的一个用户用来代表一个用户群。一个persona可以比任何一个真实的个体都更有代表性。一个代表典型用户的persona的资料有性别、年纪、收入、地域、情感、所有浏览过的URL
在电子商务网站上有了交易行为之后,用户就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些用户,我们可以基于网站的运营数据
一、基于中文标点符号和HTML 树 结构的网页正文信息抽取方法H TML ( hyper text markup language) 是超文本标记语言, 是基于标准通用标记语言(SGML) 的一个庞大的文档处理系统. SGML 的基本思想是采用描述标记( Tag) 来提供描述文档结构的附加信息. HTML 利用SGML 定
一、传统搜索引擎排序算法 1. 1 搜索引擎排序算法概述 搜索引擎查询的结果按照一定的规则排序供用户查看, 这种规则就是搜索引擎排序算法. 目前几种比较通用的搜索引擎排序算法有Direct Hit 排序算法、PageRank、排名竞价服务和词频位置加权排序算法.Di
一、标签密度和锚文本密度 HTML 网页源码中主要包括文本和标签两大元素,并且它们是混合共存的。根据标签的作用可以将H TML 标签分为容器型标签和描述型标签。通过每一对容器型标签中所包括的标签数与总文本数的比(标签密度) 和锚文本数与总文本数
一、什么是工作分解结构? 工作分解结构(Work Breakdown Structure,简称WBS)跟因数分解是一个原理,就是把一个项目,按一定的原则分解,项目分解成任务,任务再分解成一项项工作,再把一项项工作分配到每个人的日常活动中,直到分解不下去为止。 即
一、什么是Flash Cookies? Cookies是一种保存在电脑上的文本文件,它可以用来记录访客的登录ID、使用偏好、习惯,以便更好地为访客提供个性化服务、方便访客的使用。但是在客户端Cookie里保存数据是不稳定的,因为用户可能随时会清除掉浏览器的Cookie,在
目前的搜索引擎采用以关键字检索为基础的检索技术。即搜索引擎按关键字对整个网页进行索引和检索。在这种处理方法中,所有出现在网页中的字词都被用作索引项, 但实际的网页中常常包含大量的与网页主题无关的文字。例如,图1 和图2 是以“河北人民
1、 网页预处理 可以通过以下3 个预处理规则来过滤网页中的不可见噪声和部分可见噪声: 仅删除标签本身; 删除标签本身及其相应的起始与结束标签包含的HTML 文本; 对HTML 标签进行修正和配对,删除源码中的乱码。 2、区域噪音的处理 为了
Crazy Egg提供的网页热点追踪服务,对于目前越来越流行的用户体验/以用户为中心的设计思维来说,这样的服务非常实用。网页热点追踪服务有很多种方式,其中之一就是通过鼠标的移动和点击来统计用户对于每个网页中内容的重视程度。在很多时候,人们在