拼音输入法词库解析

目前类似搜狗输入法、百度输入法等最大的亮点是有较好的词库,而这些词库除了用在搜索上还可以用在及其场景,比如说分词。目前每种输入法的词库都有自己的格式,今天我们就来研究下,如何反编译这些词库,将这些词库使用到其他的场景。

搜狗输入法词库解析

搜狗输入法提供的词库下载下来是scel格式的,在使用前把他转成txt,以下为转换方法:

其他参考资料:

百度输入法词库解析

其他参考资料:

QQ拼音输入法

JAVA版本:https://github.com/xuantuan58/dict4cn/blob/cc9baa288cfb2ad3ce16ae104656b4c8ff2f371d/importer/src/QQPinyinQpydReader.java

C# 版本:https://github.com/studyzy/imewlconverter/blob/master/IME%20WL%20Converter/IME%20WL%20Converter/IME/QQPinyin.cs

其他参考资料:

常见输入法词库下载地址

微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

WordPress LaTeX插件更换记录

由于自己的博客要插入很多的公式,所以需要依赖LaTeX插件来帮忙实现。先前一直使用的是WP QuickLaTe

Docker容器内多用户版JupyterHub支持GPU

前一篇文章介绍了Docker下安装多用户版的JupyterHub,但安装完毕后会遇到一个问题:Docker内无

使用Docker安装多用户版的JupyterHub

宿主服务器使用的是Ubuntu 18.04,需要注意的是Docker目前不支持Ubuntu 19.10。如要在

2 Replies to “拼音输入法词库解析”

发表评论

电子邮件地址不会被公开。 必填项已用*标注