拼音输入法词库解析

21 sec read

目前类似搜狗输入法、百度输入法等最大的亮点是有较好的词库,而这些词库除了用在搜索上还可以用在及其场景,比如说分词。目前每种输入法的词库都有自己的格式,今天我们就来研究下,如何反编译这些词库,将这些词库使用到其他的场景。

搜狗输入法词库解析

搜狗输入法提供的词库下载下来是scel格式的,在使用前把他转成txt,以下为转换方法:

其他参考资料:

百度输入法词库解析

其他参考资料:

QQ拼音输入法

JAVA版本:https://github.com/xuantuan58/dict4cn/blob/cc9baa288cfb2ad3ce16ae104656b4c8ff2f371d/importer/src/QQPinyinQpydReader.java

C# 版本:https://github.com/studyzy/imewlconverter/blob/master/IME%20WL%20Converter/IME%20WL%20Converter/IME/QQPinyin.cs

其他参考资料:

常见输入法词库下载地址

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

使用implicit搭建实时推荐系统

Implicit简介 Implicit是一个开源的系统过滤项目,其包含多种流行的推荐算法,主要应用场景是针对隐
1 min read

使用Python下载文件的几种方法

在使用Python进行数据抓取的时候,有时候需要保持文件或图片等,在Python中可以有多种方式实现。今天就一
22 sec read

含C/C++代码包Anaconda安装问题

上篇文章主要讲了libffm在Windows系统下安装遇到的问题,今天在Linux环境下的Anaconda中安
1 min read

2 Replies to “拼音输入法词库解析”

发表评论

电子邮件地址不会被公开。 必填项已用*标注