PHP Simple HTML DOM Parser

6 sec read

PHP Simple HTML DOM Parser和前面的介绍的htmlSQL一样,是用来解析html/xml文件的类‘

PHP Simple HTML DOM Parser的特性和要求有:

相当简单的方式操作HTML

  • 要求PHP 5 以上
  • 支持无效的HTML
  • 类似jQuery的选择器来查找元素
  • 单行代码就可以从HTML页面抓取内容

其中支持无效的HTML很有用,网络上能严格通过w3c验证的网站太少了,大部分网站的很多标签都非封闭的,而大部分DOM解析器都是以XML方式处理,而XML对标签的封闭就要求很严格了,因此大部分网页无法使用这种函数来处理。

官方网址:http://simplehtmldom.sourceforge.net/

中文手册:http://phpdom.comsing.com/

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

北大开源分词工具pkuseg

pkuseg简介 pkuseg是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。pkus
1 min read

使用Python进行中文繁简转换

中文繁体、简体的差异,在NPL中类似英文中的大小写,但又比大小写更为复杂,比如同样为繁体字,大陆、香港和台湾又
1 min read

Python因子分解库:fastFM

FastFM简介 FastFM的主要特点是将是将因子分解封装成scikit-learn API接口,核心代码使
2 min read

发表评论

电子邮件地址不会被公开。 必填项已用*标注