所有文章

本地大模型部署方案GPT4All

GPT4All简介 GPT4All 是一个开源项目,旨在使得大型语言模型(LLM)更加可访问和实用。该项目的目标是通过开源的方式提供一个可在本地运行的大型语言模型,使得用户可以在不依赖云服务的情况下利用强大的自然语言…

器→工具, 工具软件 ·

数据处理方法ETL与ELT的区别

ETL(Extract, Transform, Load) 和 ELT(Extract, Load, Transform) 是两种常见的数据集成方法,它们在数据处理的顺序上存在显著差异。 ETL(提取、转换、加载) 过程: 首先从各种数据源中提取数据,…

数据, 术→技巧 ·

内置 ORM支持的数据库EdgeDB

EdgeDB简介 EdgeDB 是一个现代化的数据库系统,结合了关系型数据库的强大功能和 NoSQL 数据库的灵活性。通过其高级查询语言、强类型系统和内置 ORM 功能,EdgeDB 为开发者提供了一种高效的数据操作方式,适合构建…

器→工具, 工具软件 ·

Google分布式系统Dremel

Dremel简介 Dremel 是 Google 开发的一种分布式系统,专为大规模数据分析而设计。它的核心创新在于能够快速查询存储在分布式文件系统中的海量数据,类似于执行 SQL 查询。Dremel 的思想和技术后来被开源项目 Apach…

器→工具, 工具软件 ·

如何高效的执行PDCA循环

什么是PDCA? PDCA循环,又称戴明环(Deming Cycle),是一种用于持续改进流程和解决问题的管理方法。PDCA代表计划(Plan)、执行(Do)、检查(Check)和行动(Act)四个阶段。这一方法被广泛应用于质量管理、项…

术→技巧, 管理 ·

《乔布斯的100条思考》的思考

《砺石商业评论》在乔布斯离世13周年的时候梳理了乔布斯的100条思考,涵盖了他在创新、创业、产品计、管理与人生经验等各个领域的洞见。 关于创新洞见 001.宝丽来创始人埃德温·兰德说过一句话,“能站在人文与…

开源分布式数据库YugabyteDB

YugabyteDB简介 YugabyteDB 是一个开源的分布式 SQL 数据库,旨在为现代云原生应用提供高可用性、强一致性和水平可扩展性。它结合了 NoSQL 数据库的分布式特性和传统关系数据库的 SQL 功能,支持多种工作负载,包…

器→工具, 工具软件 ·

开源多模型数据库SurrealDB

SurrealDB简介 SurrealDB 是一种新兴的开源多模型数据库,旨在简化复杂数据模型的处理,同时提供高性能和可扩展性。它结合了关系型数据库和文档数据库的特性,支持灵活的数据建模和强大的查询能力,非常适合现代应…

器→工具, 工具软件 ·

开源的类Firebase数据库Supabase

Supabase简介 Supabase 是一个开源的后端即服务(BaaS)平台,旨在为开发者提供一个功能强大的后端解决方案,支持快速构建现代 Web 和移动应用。它以 Firebase 为灵感来源,但采用了开源的方式构建,基于 PostgreS…

器→工具, 工具软件 ·

开源ETL工具Singer.io

Singer.io简介 Singer.io 是一个开源的框架,旨在简化数据集成和迁移过程。它提供了一种标准化的方法来提取、转换和加载(ETL)数据,使得开发者可以更容易地在不同的数据源和目标之间移动数据。Singer 通过定义一…

器→工具, 工具软件 ·