分类: 研发

Pandas Dataframe数据美化输出

在 Pandas 中,DataFrame.head() 方法默认输出一个格式化的表格,这在 Jupyter Notebook 或终端中查看时通常已经比较可读。但是,如果你希望以更好的文本格式输出,尤其是在需要将输出嵌入到其他文档或日志中时, …

数据, 术→技巧, 研发 ·

前端技术WebAssembly的初探

什么是 WebAssembly? WebAssembly(简称 Wasm)是一种用于在 Web 浏览器中运行二进制代码的技术。它是由 W3C WebAssembly 工作组开发的开放标准,旨在提供一种高效、安全的方式来在浏览器中执行代码。WebAssembly …

术→技巧, 研发 ·

Python开源搜索引擎库Whoosh

Whoosh简介 Whoosh是一个用纯Python编写的开源搜索引擎库,专为实现快速和高效的全文搜索而设计。它不依赖于外部库或服务,易于嵌入到Python应用程序中,适合需要全文索引和搜索功能的场景。Whoosh的设计灵活且易于…

术→技巧, 研发 ·

PostgreSQL多版本并发控制MVCC

多版本并发控制(MVCC,Multi-Version Concurrency Control)是PostgreSQL中实现并发控制的一种机制。MVCC允许多个事务同时访问数据库,而不会产生锁定冲突。这种机制通过维护数据的多个版本,提供了一种高效的方法…

术→技巧, 研发 ·

技术选型:选择无聊的技术

新技术总是让工程师兴奋不已。新的编程范式、新的编程语言、不同的库、不同的数据库。我们总是在寻找新奇并渴望学习,但用户并不关心你的公司使用什么技术。只要你的产品有效,他们就会很高兴。 《Choose Boring T…

Java微服务框架Airlift

Airlift简介 Airlift是一个高性能的Java框架,用于构建分布式系统和微服务。它主要由Presto/Trino社区创建和维护,最初是为支持这些分布式SQL查询引擎的运行而设计的。随着时间的推移,Airlift已被广泛用于构建各…

术→技巧, 研发 ·

Python执行时间的可视化

在前面的文章Python标准库之性能优化 中学习到了统计 Python 代码执行时间的工具。今天要学习的是一些其他的工具。 SnakeViz SnakeViz 简介 SnakeViz 是一个用于可视化 Python 代码性能分析结果的工具。它是基于 Py…

术→技巧, 研发 ·

Python读写MDict词典文件

MDX/MDD 文件格式简介 MDX 和 MDD 是字典程序 MDict 使用的文件格式,其中 MDX 文件用于存放定义,而 MDD 用于存放其他资源文件,比如图片,发音,虽然存放的内容是不一样的,但是两种文件的结构是一致的。 MDX 和…

术→技巧, 研发 ·

大数据与Hadoop的生死

现在再写这篇文章感觉有些不合时宜,目前,貌似很少人再讨论大数据,也很少人再讨论Hadoop。整理这篇文章,是为了探寻最新的技术方向。 新技术替代的组件 Hadoop技术栈的许多组件已经被功能更强、性能更高的新技术…

数据, 术→技巧, 研发 ·

微服务与模块化单体架构

什么是微服务? 微服务(Microservices)是一种软件架构风格,将一个应用程序划分为一组小型的、独立运行的服务。每个服务都专注于完成一种特定的功能,可以独立开发、部署和扩展。这种架构与传统的单体应用(Monol…

术→技巧, 研发 ·