Python分词模块推荐:结巴中文分词

就是前面说的中文分词,这里需要介绍的是一个分词效果较好,使用起来像但方便的Python模块:结巴。 一、结巴中
10 sec read

1.01法则与0.99法则

最近一张日本某小学里贴的一张励志公式的海报异常的火爆,海报中写着1.01的365次方是37.8,0.99的36
0 sec read

代码重构:HTML与语义化

在前端开发过程中,很多人谈到“模块化”,很少人特别关注“语义化”,简单的说大多数人更关注功能的实现,而忽视了实
13 sec read

怎样像Google一样有效的开会

开会在现有的公司运作中越来越声名狼藉,原因是真正能通过会议这个形式取得什么成果非常的少。曾经看过这样一幅漫画:
13 sec read

在XAMPP上建立多个域名的站点

XAMPP默认安装完毕后,站点文件默认放在/xampp/htdocs/ 文件下,并且可以通过http://lo
49 sec read

给XAMPP中的MySQL设置密码

安装完XAMPP后,MySQL的默认账号为root,密码为空,非常的不安全,解决办法是给MySQL设置密码。具
6 sec read

再说中文分词技术

一、什么是中文分词 众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连
1 sec read

产品经理的考核与评级

一个叫“产品经理”的大学毕业生与一个同样叫“产品经理”的,有着4-5年工作经验的人,做的事情、需要的能力肯定不
5 sec read

敏感词过滤技术之AC自动机

Aho-Corasick自动机算法(简称AC自动机)1975年产生于贝尔实验室。该算法应用有限自动机巧妙地将字
5 sec read

平方根倒数速算法中的神奇数字:0x5f3759df

Quake III 公开源码后,有人在game/code/q_math.c里发现了这样一段代码。它的作用是将一
16 sec read

神奇的暴雪哈希算法

暴雪公司的魔兽、星际等游戏都一样一个非常大的MPQ文件,该文件存储了游戏中的大部分数据,想要把这些文字找出来,
14 sec read

Vmware安装Fedora 18 注意事项

以下为我使用VMware安装Fedora中出现的问题及解决方案,整理出来供其它遇到相同问题的人参考。 1、Fe
3 sec read