所有文章

DBSCAN经纬度聚类实践

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) 是一种常用于聚类分析的算法,它可以很好地应用于经纬度数据的聚类。这种算法特别适合处理大规模的空间数据集,并且能够识别出噪声点。在先…

数据, 术→技巧 ·

随机数与伪随机数、偶然与必然

曾经一个研发大佬说过这样一句话,大概意思是只要你把需求整理出来,研发就能实现。我想对他说,能否帮忙生成一个随机数? 我们接触到的计算机生成的随机数其实都是都称为“伪随机数”。计算机本质上是确定性的,…

Python学习之函数

Python的函数是一种在编程中用来封装一组操作的机制。函数可以接收输入参数,并根据这些参数执行一系列操作,最后可以返回一个值。使用函数可以提高代码的重用性和可读性。以下为整理的相关资料。 函数的定义 …

器→工具, 编程语言 ·

开源对象存储服务:Minio

Minio简介 Minio 是一个开源的对象存储服务器。对象存储服务(Object Storage Service,OSS)是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选…

器→工具, 开源项目 ·

数据预处理之分箱

什么是分箱? 数据分箱(Data Binning)是一种数据预处理技术,用于将连续变量分组为一系列“箱”或“区间”,以便于分析。其实分箱的概念其实很好理解,它的本质上就是把数据进行分组。分箱就是把数据按特定的规则进…

数据, 术→技巧 ·

开源可视化报表工具:Redash

Redash简介 Redash 是一款开源的数据可视化和协作工具,旨在帮助企业和团队更容易地访问和利用他们的数据。以下是 Redash 的一些主要特点: 数据源支持:Redash 支持多种数据源,包括但不限于 MySQL、Pos…

器→工具, 工具软件 ·

开源可视化报表工具:metabase

metabase简介 Metabase 是一个开源的数据可视化工具,其引入的question概念使得非技术人员能够轻松地创建和共享自定义数据仪表板。Metabase 同时还支持用户通过简单的拖放界面连接到任何数据源,并使用直观的图表…

器→工具, 工具软件 ·

开源可视化报表工具:Superset

Superset简介 Superset 是一个开源的数据可视化和数据探索平台,最初由 Airbnb 开发,后来成为了 Apache 软件基金会的顶级项目。它支持各种类型的数据源,如数据库和 SQL 引擎,并提供了一个易于使用的界面来创建…

器→工具, 工具软件 ·

Docker简明教程

在公司部署算法模型时会涉及到的Docker的使用,于是抽时间整理一些资料,供自己使用。 Docker简介 Docker是一种开源的容器化平台,它使得开发者和系统管理员可以轻松地创建、部署和运行应用程序。Docker使用容器…

器→工具, 工具软件 ·

信息爆炸、推荐、私域与RSS

现在很多人大多数人获取资讯通过头条、抖音,包括很多主流媒体也越来越通过算法为个人推送定制化内容,俗称千人千面,但是这里面可能会存在3个问题: 想看的≠需要的 ≠对自己有益的 被动塑造 (圈养) 信…