在使用开源的大语言模型或者调用大语言模型API的时候会遇到temperature、top_p、top_k等参数,对于不了解的LLM的原理的人,可能一头雾水,不知道如何设置。 LLM的原理 LLM看似很神奇,但本质还是一个概率问题…
iDice简介 iDice(指标异常归因算法)是一种用于识别与新出现问题(Emerging Issues)相关的有效组合的自动化算法。它通过从海量属性组合中高效地识别出与新兴问题高度相关的有效组合,帮助技术支持工程师快速定位…
什么是计划性报废? 计划性报废是指制造商有意设计产品,使其在一定时间后失效或过时,以促使消费者更换新产品。 计划报废的种类: 系统性计划报废:故意更改系统设计,让产品难以继续使用。例如软件刻意不向…
Taipy简介 Taipy是一个开源的Python库,用于构建决策支持系统(Decision Support Systems, DSS)和数据驱动的应用程序。它专注于快速开发、交互性和可扩展性,适合数据科学家、开发人员以及业务用户使用。Taipy提供…
在 Pandas 中,DataFrame.head() 方法默认输出一个格式化的表格,这在 Jupyter Notebook 或终端中查看时通常已经比较可读。但是,如果你希望以更好的文本格式输出,尤其是在需要将输出嵌入到其他文档或日志中时, …
Zenko简介 Zenko是一个开源的多云数据管理平台,由Scality公司开发和维护。Zenko旨在帮助企业和组织在多个云存储提供商之间实现数据的统一管理和自动化迁移。通过Zenko,用户可以轻松地在AWS S3、Azure Blob Storag…
Vertica简介 Vertica是一款基于列存储的MPP(大规模并行处理)架构的数据库,专为大数据分析而设计。它可以支持存储PB(拍字节)级别的大量结构化数据。 发展历程 起源:HP Vertica最初由Michael Stonebr…
TigerGraph简介 TigerGraph是一种高性能的分布式图数据库,专为处理大规模图数据和复杂的图分析任务而设计。它提供了强大的功能和灵活的查询能力,能够支持实时分析和大规模数据处理。 主要特性 GSQL查询语言:…
OpenDataLake简介 OpenDataLake是一种数据存储和管理架构,旨在以一种开放、灵活和可扩展的方式处理大量的多结构化数据。数据湖的概念是将数据以原始格式存储,以便在需要时进行分析和处理。OpenDataLake的开放性通…
NewSQL 数据库是一类结合了传统关系型数据库(RDBMS)的强一致性和事务支持(ACID),以及 NoSQL 数据库的高扩展性和分布式架构的新型数据库系统。它针对高并发、海量数据处理场景进行了优化,尤其适用于现代互联网…