分类: 开源项目

正例-无标记学习PU Learning

什么是 PU Learning? PU Learning 的全称是 Positive-Unlabeled Learning,即正例-无标记学习。它是一种在半监督学习范畴内的特殊机器学习设定。 与传统的监督学习(数据有明确的“正例”和“负例”标签)不同…

新闻文章提取工具:newspaper

Newspaper3k Newspaper3k 是一个专门用于新闻文章抓取和内容提取的Python库。该项目由 Lucas Ou-Yang 开发,灵感来源于Requests库的简洁性,底层使用lxml实现高效解析。 核心特性 文章内容提取 自…

器→工具, 开源项目 ·

开源大模型应用开发平台Coze

Coze简介 Coze(中文名“扣子”)是字节跳动推出的一站式AI应用开发平台,旨在降低AI应用开发门槛,让用户无需编程经验即可快速创建、调试和部署各类AI智能体(如聊天机器人、自动化工具等)。以下将从平台定位、核…

器→工具, 开源项目 ·

开源大模型应用开发平台 Dify

Dify 平台概述 Dify 是什么? Dify 是一个开源的 LLMOps(大语言模型运维)平台,旨在帮助开发者与企业通过可视化、低代码的方式,快速构建、部署和管理基于大语言的生成式 AI 应用。其名称来源于 “Define” 和 “M…

器→工具, 开源项目 ·

Python数据应用开发库Taipy

Taipy简介 Taipy是一个开源的Python库,用于构建决策支持系统(Decision Support Systems, DSS)和数据驱动的应用程序。它专注于快速开发、交互性和可扩展性,适合数据科学家、开发人员以及业务用户使用。Taipy提供…

器→工具, 开源项目 ·

分布式NoSQL数据库Couchbase

Couchbase简介 Couchbase是一个高性能、分布式NoSQL数据库,专为现代应用程序的需求而设计。它结合了文档存储和键值存储的优点,提供了灵活的数据模型和强大的查询能力。 核心特性 分布式架构:Couchbase采用无…

分布式存储平台Ceph

Ceph简介 Ceph是一个开源的分布式存储平台,旨在为对象存储、块存储和文件系统提供高度可扩展和高性能的解决方案。Ceph的设计目标是实现高可用性、弹性和自我修复能力,能够在商用硬件上构建大规模存储集群。 核…

器→工具, 开源项目 ·

分布式存储系统Apache Celeborn

Apache Celeborn简介 Celeborn是一个开源的分布式存储系统,专为大数据处理框架而设计。它的名字来源于《魔戒》中的角色,象征着高效和快速。Celeborn主要用于优化数据密集型计算的存储和传输,提供高吞吐量和低延…

器→工具, 开源项目 ·

开源数据可视化框架RAWGraphs

RAWGraphs简介 RAWGraphs是一个开源的数据可视化框架,专为设计师和数据专家设计,旨在将复杂的数据集转换为丰富的可视化图表。它提供了一种简单而灵活的方式来创建定制化的数据可视化,并且不需要编程技能。RAWGra…

文档内容解析抽取工具Apache Tika

Apache Tika简介 Apache Tika是一个用于检测和提取各种文件格式的文本内容和元数据的开源框架。它能够处理多种文件类型,如文本文档、PDF、电子表格、图像、音频和视频文件等,提供了一种统一的接口来访问这些文件…

器→工具, 开源项目 ·