PHP中文高速分词的原理和源码

一、正向最大匹配算法和反向最大匹配算法的缺点 正向最大匹配算法:从左到右将待分词文本中的几个连续字符与词表匹配

基于网页框架和规则的网页噪音去除方法

一、相关概念 1.1 网页噪音概述 网页噪音是指在一个页面内与页面主题无关的区域及项。网页噪声可分为以下几类:

中文分词算法概述

一、中文分词技术综述 1、全文检索技术 所谓全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立

《Getting Real》:回归现实

Getting Real简介: Getting Real是关于省略所有表达现实(图表,曲线,矩形,箭头,统计图

机票预订可用性测试之错误与出错页

一、提供清晰的出错总结 用户在填写表单时会出错,这是很正常的事。但是处理这些错误时每个在线的流程非常重要的一个

机票预订可用性测试之预订流程页

一、在预订过程中提供联系电话 有些旅行者不习惯在线上完成全部的搜索和预订流程。他们可能只在网上搜索想要的结果,

机票预订可用性测试之搜索结果页

一、 提供一个清晰的结果页 通常,搜索结果页会提供大量的信息——清晰并且高效的组织和呈现这些信息给访问者就十分

机票预订可用性测试之航班搜索页

一、 提供一个设计清晰的“第一步” 很多访问者来到一个旅游站点并不是想闲逛­,他们通常已经有了一个明确的目的地

梁剑:网易评论系统的前世今生

网易跟贴,也就是新闻后面的网友评论,在同类产品中长期处于领头地位。“无跟贴,不新闻”的口号简单直接的刻画出了互

BLENDS客户管理模型

BLENDS模式是客户战略中一个常用的实践工具,它是用于提高客户满意度,挽留客户的重要手段。在每一个企业的营销

如何跟踪你学到的东西

大多数人在12到24小时内忘记他们刚学到的东西。如果你正在阅读这篇文章,有很大的可能你明天就忘了。我们的大脑像

图片验证码的识别技术

这里有最简单的一类验证码:他们有固定的背景颜色,相同的字符颜色和字体,字符的坐标位置也是固定的。对于这类验证码