分类: 开源项目

Python管道工具Pipe

在先前的文章中,我们介绍了Linux中的管道工具,也学习了Scikit-Learn中的Pipeline。今天再来说一下如何在Python中使用管道操作,使得带来逻辑更加简单易懂。 案例展示 任务:给定一个整数数组,编写一个程序…

器→工具, 开源项目 ·

Python虚假数据生成工具Faker

在软件需求、开发、测试过程中,有时候需要使用一些测试数据,针对这种情况,我们一般要么使用已有的系统数据,要么需要手动制造一些数据。在手动制造数据的过程中,可能需要花费大量精力和工作量,而使用Faker生成…

器→工具, 开源项目 ·

机器学习可解释性工具:SHAP

机器学习在很多领域取得了重要的进步,也帮助人减少了不少体力劳动。要训练一个机器学习模型,以及将模型应用在实际场景中,最重要的是数据的收集以及处理。那么,如何使用模型指导数据收集就成了一个重要的问题,…

热门Python Web 框架的盘点

在学习Python过程中,如果学习Web开发,一般会涉及到Web框架,特别是对于新手,除了主流的Django和Flask,一般不会了解还有哪些框架更能适合自己。今天主要从Github的Star数量进行统计,将热门的开源Python Web框架…

Python Web应用的线上部署

想要将Python Web应用部署到线上,目前主流的方案是在Gunicorn/uWSGI前面再加一层Nginx,其中Nginx的主要作用是: 做负载均衡,便于后期服务器的水平扩展,可轻松将应用部署到多台服务器或多个进程中。 缓…

神经网络时间序列预测工具NeuralProphet

NeuralProphet产生背景 大多数时间序列问题需要易于理解的预测。同时,需要有效的预测。这两个愿望导致了一种权衡:可解释性与准确率。准确率的显著提高通常归因于更复杂的模型。然而,复杂性与可解释性存在天然的…

Hive UDF的开发简介

Hive 内置了很多函数,可以参考Hive Built-In Functions。但是有些情况下,这些内置函数还是不能满足我们的需求,这时候就需要UDF出场了。 UDF全称:User-Defined Functions,即用户自定义函数,在Hive SQL编译…

Linux树型结构文件系统

对于每一个Linux学习者来说,了解Linux文件系统的目录结构,是学好Linux的至关重要的一步。深入了解Linux文件目录结构的标准和每个目录的详细功能,对于我们用好Linux系统非常重要。 文件系统的是用来组织和排列…

器→工具, 开源项目 ·

开源分布式查询引擎Presto

Presto是什么? Presto是Facebook开源的MPP(Massive Parallel Processing)SQL引擎,其理念来源于一个叫Volcano的并行数据库,该数据库提出了一个并行执行SQL的模型,它被设计为用来专门进行高速、实时的数据分析…

使用zimg搭建图片服务器

一般的大型网站都会将图片存放在专门的服务器,这样可以很好的提升网站的性能。比较简单的方式是采用云厂商提供的服务,比如七牛云、又拍云等。今天要介绍的是一款开源的实现方案zing。 zimg简介 zimg是一套国人…