分类: 术→技巧

国内高铁票价的计算规则

高铁(包括 G、D 字头列车和一部分 C 字头列车)票价的计算是一个比较复杂的问题。它取决于线路的速度等级、里程、递远递减以及折扣等方面。 注意: 以下的讨论均不包含既有线动车组以及除京津城际线以外的…

产品, 术→技巧 ·

Pandas基础教程之替换SQL

对于很多数据分析的同学来说,最熟悉的莫过于SQL(相关SQL教程见产品&运营分析技能培训:Hive SQL),针对数据处理问题,脑海里的第一反应也往往都是SQL,而在日常的工作中往往也需要在Pandas的DataFrame数据上…

数据, 术→技巧 ·

同步WordPress到微信公众号

很早之前就申请了微信公众号,写了几篇就中断了,主要原因是微信提供的公众号不太适合写技术类的文章,比如添加代码片段或LATEX数学公式等。 针对 LATEX数学公式的支持我看反馈论坛上已经提了5~6年了就是没…

术→技巧, 研发 ·

Python模板引擎jinja2

Jinja2简介 Jinja2 是由 Armin Ronacher 开发的,这位开发者也是 Flask 和 Werkzeug 等著名 Python 项目的作者。Jinja2 的设计受到了 Django 模板系统的影响,但在灵活性和性能方面进行了优化。它首次发布于 2008 …

Flask学习之上下文

在 flask 中,视图函数需要知道它执行情况的请求信息(请求的 url,参数,方法等)以及应用信息(应用中初始化的数据库等),才能够正确运行。最直观地做法是把这些信息封装成一个对象,作为参数传递给视图函数。但…

术→技巧, 研发 ·

Flask学习之路由

在Flask中,路由是将URL请求分配到相应的处理程序的方法。每个路由可以映射到一个特定的视图(视图函数或方法)。一个 WEB 应用不同的路径会有不同的处理函数,路由就是根据请求的 URL 找到对应处理函数的过程。在…

术→技巧, 研发 ·

使用Optuna优化LightGBM超参数

在先前的文章,已经很详细的介绍了LightGBM的原理及使用示例。模型的安装与调用本身不会遇到很大的问题,实际使用过程中遇到的最大难题是如何优化超参数。由于没有进行很好的超参数优化导致产生的模型性能存在欠缺…

数据, 术→技巧 ·

Python爬虫工具之Selenium

Selenium简介 Selenium是浏览器的自动化测试工具,与浏览器进行交互,实现对web应用的自动化测试,Selenium包括Selenium IDE, Selenium Webdriver 和 Selenium Grid三个工具。 Selenium IDE (Integrated Deve…

数据, 术→技巧, 研发 ·

使用Optuna优化XGBoost超参数

在之前的文章中,分别介绍了决策树模型XGBoost和贝叶斯优化工具Optuna,在实际使用中还是会多多少少遇到一些问题。今天文章主要针对Optuna优化XGBoost做下梳理。 XGBoost的目标函数 XGBoost提供了多种内置的目标…

数据, 术→技巧 ·

Scikit-Learn学习之管道Pipeline

Scikit-Learn的Pipeline是一个工具,可以将多个数据预处理和建模步骤连接起来,形成一个完整的机器学习工作流。它允许用户通过链式执行多个转换步骤并最终拟合一个模型,从而使代码更加简洁。下面我们将详细介绍Pip…

数据, 术→技巧 ·