网页正文信息抽取新方法

一、基于中文标点符号和HTML 树 结构的网页正文信息抽取方法H TML  ( hyper text mark

31 sec read

基于网页分块的搜索引擎排序算法改进

一、传统搜索引擎排序算法 1. 1  搜索引擎排序算法概述 搜索引擎查询的结果按照一定的规则排序供用户查看,

25 sec read

2010年统计用区划代码和城乡划分代码

最新县及县以上行政区划代码(截止2009年12月31日)代码从左至右的含义是: 第一、二位表示省(自治区、直辖

3 sec read

网站点击热力图的技术实现

一、捕捉用户点击行为 这部分需要Javascript来实现。为了不陷入浏览器兼容的泥潭,可以选择JQuery:

17 sec read

基于标签密度的自适应正文提取方法

一、标签密度和锚文本密度 HTML 网页源码中主要包括文本和标签两大元素,并且它们是混合共存的。根据标签的作用

17 sec read

项目管理之工作分解结构

一、什么是工作分解结构? 工作分解结构(Work Breakdown Structure,简称WBS)跟因数分

7 sec read

用户数据跟踪之Flash Cookies

一、什么是Flash Cookies? Cookies是一种保存在电脑上的文本文件,它可以用来记录访客的登录I

26 sec read