分类: 开源项目

分布式日志收集系统Flume

Flume简介 Flume是一个分布式、可靠且高效的系统,主要用于大规模日志数据的收集、聚合和传输。它是Apache软件基金会的一个开源项目,特别适合将大量日志数据从不同的数据源转移到一个集中式的数据存储系统,比如Ha…

大数据存储之HDF5

HDF5简介 HDF5(Hierarchical Data Format version 5)是一种用于存储和管理大规模数据的开放文件格式和软件库。它广泛应用于科学计算、工程、金融等领域,尤其适合存储复杂数据结构和需要高效读写操作的大型数据集…

器→工具, 开源项目 ·

Python大数据处理工具Dask

Dask简介 Dask是一个用于并行计算的Python库,它旨在扩展Python的生态系统,使其能够处理大规模数据计算。Dask通过提供动态任务调度系统和大数据集合(如并行数组、数据帧等),帮助开发者在多核处理器或集群上有效…

Python地理数据分析工具MovingPandas

MovingPandas 是一个用于分析轨迹数据的 Python 库。它在处理和分析移动对象的时空数据方面非常强大,适用于地理信息系统(GIS)、时空数据分析和可视化等领域。它是在热门的地理数据处理库 GeoPandas 的基础上构建…

Python数据可视化之Seaborn

Seaborn简介 Seaborn是一个基于Python的数据可视化库,它建立在Matplotlib库之上,提供了更高级的接口用于绘制统计图形。Seaborn的目标是使复杂的数据可视化工作变得更加简单和直观,同时生成具有吸引力、信息丰富…

交通数据可视化包TransBigData

TransBigData 简介 TransBigData 是一个为交通时空大数据处理、分析和可视化而开发的 Python 包。TransBigData 为处理常见的交通时空大数据(如出租车 GPS 数据、共享单车数据和公交车 GPS 数据)提供了快速而简洁…

Node.JS版本管理工具NVM

NVM简介 NVM(Node Version Manager)是一个命令行工具,用于在一台计算机上方便地安装、切换和管理多个Node.js版本。它最初由Tim Caswell开发,现在由一个社区维护的团队进行更新和维护。NVM主要用于Unix-like系统…

地图可视化工具kepler.gl

kepler.gl简介 Kepler.gl是一个开源的地理空间数据可视化工具,由Uber开发并开源。它旨在帮助用户快速、直观地探索和展示大型地理空间数据集。 主要特点 用户友好界面,提供了一个直观的界面,使用户能够轻松…

DASH使用简明教程

在先前的介绍过快速数据可视化界面工具Streamlit,Dash是一个与之非常类似的工具,个人在使用Streamlit加载地图呈现时遇到响应非常慢的的问题,于是使用了Dash整理使用起来也非常的简单,这里做下简要的分享。 DA…

开源在线SQL工具盘点

在开源可视化报表工具Superset、metabase、Redash时,已经涉及到一部分在线SQL工具的内容,但是其整个整个可视化工具的一部分。今天要介绍的是另外独立的开源在线SQL工具。 在线SQL查询SQL SQLPad SQLPad是一个开源…

器→工具, 开源项目 ·