所有文章

Hive UDF的开发简介

Hive 内置了很多函数,可以参考Hive Built-In Functions。但是有些情况下,这些内置函数还是不能满足我们的需求,这时候就需要UDF出场了。 UDF全称:User-Defined Functions,即用户自定义函数,在Hive SQL编译…

Maven学习之pom.xml文件

Maven是一个强大的Java项目构建工具,基于POM(项目对象模型)文件,可用于项目构建、依赖模块管理和Javadoc生成等。构建工具是软件构建过程自动化的一种工具。一个软件项目的构建通常包含以下几部分: 生成源代…

器→工具, 编程语言 ·

Facebook Prophet使用与调参实践

针对Facebook Prophet的使用,很多年以前就整理过一篇文章《Facebook时间序列预测工具fbprophet》,过了N年以后当重新需要使用这个工具的时候,发现部分内容已经更新,中间的很多细节内容都没有表述清楚。实际使用…

Windows和MacOS的睡眠和休眠

平时下班的时候会将笔记本直接塞书包里。有时候到家拿出来发现非常的烫,给我的感觉是盒盖后电脑还一直在运行,于是花时间研究了下Windows下的睡眠和休眠机制。 官网上Windows的睡眠和休眠状态介绍 睡眠 睡眠…

器→工具, 工具软件 ·

互联网黑灰产产业链初探

黑灰产的英文翻译是Black Market,被定义为通过人工方式或者技术手段实施的操纵网络信息内容,获取违法利益、破坏网络生态秩序的行为。对很多人来说,黑灰产的代名词就是“薅羊毛”。实际上,除了薅羊毛,每个行业都…

术→技巧, 运营 ·

JAVA环境:JDK的安装与配置

JAVA开发与运行环境 Java的开发和运行环境是指在进行Java应用程序开发和执行过程中所需的软件和工具。下面分别介绍Java的开发环境和运行环境: Java开发环境(Java Development Environment): JDK(Java…

Windows下Office版本的选择

家里的电脑比较多,安装了不同的Windows版本,从Windows XP、Win &、 Win8.1、Win 10、Win 11都有。由于Office版本在部分操作系统无法安装,且不同的Office对系统的要求不同。特梳理下不同操作系统下最合适的Of…

器→工具, 工具软件 ·

统计学中的数值变换

我们测得一些数据,要对数据进行分析的时候,会发现数据有一些问题使得我们不能满足我们以前分析方法的一些要求(正态分布、平稳性)为了满足经典线性模型的正态性假设,常常需要使用数值变换,使其转换后的数据接…

数据, 术→技巧 ·

探索性数据分析详解

什么是探索性数据分析? 探索性数据分析(Exploratory Data Analysis,简称EDA) 是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段…

数据, 术→技巧 ·

数据可视化之小提琴图

小提琴图 (Violin Plot) 用于显示数据分布及其概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。中间的黑色粗条表示四分位数范围,从其延伸的幼细黑线代表 95% 置信区间,而白点则为中…

数据, 术→技巧 ·