曾经一个研发大佬说过这样一句话,大概意思是只要你把需求整理出来,研发就能实现。我想对他说,能否帮忙生成一个随机数? 我们接触到的计算机生成的随机数其实都是都称为“伪随机数”。计算机本质上是确定性的,…
Python的函数是一种在编程中用来封装一组操作的机制。函数可以接收输入参数,并根据这些参数执行一系列操作,最后可以返回一个值。使用函数可以提高代码的重用性和可读性。以下为整理的相关资料。 函数的定义 普…
Minio简介 Minio是一个开源的对象存储服务器。对象存储服务(Object Storage Service,OSS)是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选择…
什么是分箱? 数据分箱(Data Binning)是一种数据预处理技术,用于将连续变量分组为一系列“箱”或“区间”,以便于分析。其实分箱的概念其实很好理解,它的本质上就是把数据进行分组。分箱就是把数据按特定的规则进行…
Redash简介 Redash是一款开源的数据可视化和协作工具,旨在帮助企业和团队更容易地访问和利用他们的数据。以下是Redash的一些主要特点: 数据源支持:Redash支持多种数据源,包括但不限于MySQL、PostgreSQL、Mo…
metabase简介 Metabase 是一个开源的数据可视化工具,其引入的 question 概念使得非技术人员能够轻松地创建和共享自定义数据仪表板。Metabase 同时还支持用户通过简单的拖放界面连接到任何数据源,并使用直观的图表…
Superset简介 Superset是一个开源的数据可视化和数据探索平台,最初由Airbnb开发,后来成为了Apache软件基金会的顶级项目。它支持各种类型的数据源,如数据库和SQL引擎,并提供了一个易于使用的界面来创建和共享仪…
在公司部署算法模型时会涉及到的 Docker 的使用,于是抽时间整理一些资料,供自己使用。 Docker 简介 Docker 是一种开源的容器化平台,它使得开发者和系统管理员可以轻松地创建、部署和运行应用程序。Docker 使用容…
现在很多人大多数人获取资讯通过头条、抖音,包括很多主流媒体也越来越通过算法为个人推送定制化内容,俗称千人千面,但是这里面可能会存在3个问题: 想看的≠需要的≠对自己有益的 被动塑造(圈养) 信息主动检…
在先前的文章中介绍了使用Python解析Nginx日志,今天主要介绍的是使用ELK(Elasticsearch + Logstash + Kibana)来监控Nginx日志。 备注:以下方案占用CPU和内存过大,不适合在云服务器部署。 工具简介 本教程涉…