OCR(Optical Character Recognition,光学字符识别)是一种技术,用于将印刷或手写文本从图像、扫描的文档或照片中识别并转换为机器可读的文本格式。其主要目的是将非结构化的图像数据转化为可编辑、可搜索的文本…
Slugify 是一个将字符串转换为 URL 友好格式的过程或工具。通常在创建网页地址(URL)时,需要将标题或其他文本转换为一种只包含字母、数字和连字符的格式,这样的字符串称为“slug”。Slugify 的过程会移除或替换掉…
在前面的文章中,介绍了分布式全局唯一ID生成方案,本次需要分享的是使用Python来生成唯一标识符。在Python中,唯一标识符(Unique Identifiers)通常用于标识对象或数据的唯一性,以确保在特定上下文中每个实体都…
在先前的文章Obsidian 使用之 Markdown 中介绍下 Markdown 语法。今天要梳理的是如何在 Python 中解析和处理 markdown 语法。Python 有几个流行的 Markdown 处理包,可以帮助你将 Markdown 转换为 HTML、PDF,或用…
标准库中的电子邮件 Python标准库中有几个模块专门用于处理电子邮件的创建、解析、发送和接收。 smtplib:用于发送电子邮件。实现了SMTP(Simple Mail Transfer Protocol)协议。允许通过邮件服务器发送邮件。…
Altair简介 Python包Altair是一个基于Vega和Vega-Lite构建的声明式数据可视化库。它通过简洁的语法和直观的API,使得创建具有交互性的统计图表变得简单而直观。 主要特点 声明式语法:Altair使用声明式语法来…
OS:操作系统接口 os模块是Python标准库中的一个核心模块,提供了与操作系统进行交互的功能。它允许Python程序执行操作系统级别的任务,例如文件和目录操作、环境变量管理、进程管理等。os模块的功能因操作系统而异…
在先前的文章中Python JSON/JSONP 数据解析,涉及到的 Python 自带的 JSON 和 SimpleJson 的简单介绍。这次主要梳理了一些比较流程的 Python 序列化与反序列化工具。 pickle pickle 是 Python 标准库中的一个模块…
在Python中,URL解析库可以在多种场景中使用,以下是一些常见的使用场景: Web爬虫和数据抓取:在编写网络爬虫时,需要解析HTML页面中的URL,以便抓取和访问其他页面。需要处理相对URL和绝对URL之间的转换。 构…
虽然这似乎有悖常理,但遗忘实际上有一个生物学优势,对人类的整体认知能力有益。我们的大脑不断处理和存储信息,因此清除不必要或不相关的信息为新的记忆和学习腾出空间非常重要。遗忘过程对于我们适应和应对新体…