分类: 术→技巧

大语言模型的Temperature、Top-p、top_k

在使用开源的大语言模型或者调用大语言模型API的时候会遇到temperature、top_p、top_k等参数,对于不了解的LLM的原理的人,可能一头雾水,不知道如何设置。 LLM的原理 LLM看似很神奇,但本质还是一个概率问题…

指标异常归因算法iDice

iDice简介 iDice(指标异常归因算法)是一种用于识别与新出现问题(Emerging Issues)相关的有效组合的自动化算法。它通过从海量属性组合中高效地识别出与新兴问题高度相关的有效组合,帮助技术支持工程师快速定位…

数据, 术→技巧 ·

Pandas Dataframe数据美化输出

在 Pandas 中,DataFrame.head() 方法默认输出一个格式化的表格,这在 Jupyter Notebook 或终端中查看时通常已经比较可读。但是,如果你希望以更好的文本格式输出,尤其是在需要将输出嵌入到其他文档或日志中时, …

数据, 术→技巧, 研发 ·

现代数据架构Open Data Lake (ODL)

Open Data Lake简介 Open Data Lake 是一种数据存储和管理架构,旨在以一种开放、灵活和可扩展的方式处理大量的多结构化数据。数据湖的概念是将数据以原始格式存储,以便在需要时进行分析和处理。Open Data Lake …

数据, 术→技巧 ·

数据处理方法ETL与ELT的区别

ETL(Extract, Transform, Load) 和 ELT(Extract, Load, Transform) 是两种常见的数据集成方法,它们在数据处理的顺序上存在显著差异。 ETL(提取、转换、加载) 过程: 首先从各种数据源中提取数据,…

数据, 术→技巧 ·

如何高效的执行PDCA循环

什么是PDCA? PDCA循环,又称戴明环(Deming Cycle),是一种用于持续改进流程和解决问题的管理方法。PDCA代表计划(Plan)、执行(Do)、检查(Check)和行动(Act)四个阶段。这一方法被广泛应用于质量管理、项…

术→技巧, 管理 ·

异常根因分析方法Adtributor

Adtributor 算法简介 Adtributor 算法是由微软研究院在 2014 年提出的一种用于多维时间序列异常根因分析的方法。它主要用于解决以下问题:当某个关键性能指标 (KPI) 发生异常波动时,如何快速准确地找出导致该异常…

数据, 术→技巧 ·

指标波动归因贡献率计算

指标波动贡献率 指标波动贡献率是一种用于分析和衡量不同因素对某一指标变动影响的统计方法。它在经济学、金融学、市场分析以及其他领域中被广泛应用。通过分析指标波动贡献率,可以更好地理解各个因素在指标变动…

数据, 术→技巧 ·

前端技术WebAssembly的初探

什么是WebAssembly ? WebAssembly(简称 Wasm)是一种用于在 Web 浏览器中运行二进制代码的技术。它是由 W3C WebAssembly 工作组开发的开放标准,旨在提供一种高效、安全的方式来在浏览器中执行代码。WebAssembly…

术→技巧, 研发 ·

Python数据可视化工具bokeh

Bokeh简介 Bokeh 是一个用于创建交互式和可视化丰富的 web 应用程序的 Python 库。它专为需要在现代 Web 浏览器中呈现复杂数据可视化的场景而设计,旨在帮助数据科学家、分析师和开发人员以简洁的方式创建高效和动…