所有文章

Python对象持久化存储工具pickle

Pickle Python中有个序列化过程称为pickle,它能够实现任意对象与文本之间的相互转化,也可以实现任意对象与二进制之间的相互转化。也就是说,pickle可以实现Python对象的存储及恢复。 序列化(picking):把变量从…

磁盘阵列RAID种类及对比

单机时代,采用单块磁盘进行数据存储和读写的方式,由于寻址和读写的时间消耗,导致I/O性能非常低,且存储容量还会受到限制。另外,单块磁盘极其容易出现物理故障,经常导致数据的丢失。因此大家就在想,有没有一种…

器→工具, 工具软件 ·

Python XML文件格式的解析

XML指可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。XML被设计用来传输和存储数据。 Python有三种常见的XML解析方式:SAX(simple API for XML)、DOM(Document Obj…

术→技巧, 研发 ·

Python JSON/JSONP数据解析

JSON简介 JSON即JavaScript Object Notation,它是一种轻量级的数据交换格式,非常适合于服务器与JavaScript的交互。 在普通的Web应用中,开发者经常为XML的解析伤透了脑筋,无论是服务器端生成或处理XML,还是…

术→技巧, 研发 ·

基于AIML的Python聊天机器人搭建

AIML简介 AIML全名为 Artificial Intelligence Markup Language(人工智能标记语言),是一种创建自然语言软件代理的 XML 语言,是由 Richard S. Wallace 博士和 Alicebot 开源软件组织于 1995-2000 年间发明创造的…

Python读写Excel表格

在使用Python处理数据的时候,经常会需要处理Excel中的数据。现在基本上都使用Pandas读取Excel中的数据,但是除了Pandas以外,还有一些Python包可以满足对Excel数据的读取。 在开始之前,先学习下Excel中涉及到…

器→工具, 开源项目 ·

使用Scikit-Learn提取文本特征

文本分析是机器学习算法的主要应用领域。由于大部分机器学习算法只能接收固定长度的数值型矩阵特征,导致文本字符串等并不能直接被使用,针对此问题 Scikit-Learn 提供了将文本转化为数值型特征的方法,今天就一起…

数据, 术→技巧 ·

Python处理文本中的控制字符

先前在使用Python进行抓取的时候,遇到读取数据的错误。经过分析发现原来返回的HTML中包含控制字符(原来防爬虫还可以这么干,控制字符在抓取程序中容易引起报错,但是在浏览器中呈现给用户的时候确没有什么影响)…

字符编码问题及Python解决方案

程序开发中最容易遇到,最烦,最恶心的问题是什么?字符编码问题!本文期望通过最详尽的梳理来解决这个问题。 什么是编码? 计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二…

MySQL InnoDB行记录格式

在早期的 InnoDB 版本中,由于文件格式只有一种,因此不需要为此文件格式命名。随着 InnoDB 引擎的发展,开发出了不兼容早期版本的新文件格式,用于支持新的功能。为了在升级和降级情况下帮助管理系统的兼容性,以…