机器学习
机器学习基础
特征工程
- 特征转换:
- 数值型:归一化和标准化
- 类别型:类别特征编码
- 文本型:使用Scikit-Learn提取文本特征
- 缺失值处理
- 数据降维:
- 特征选择:
- 数据抽样:
模型调参
模型部署
聚类
- 聚类与分类的不同
- 聚类算法评估指标
- 常见聚类算法
- 一维数据聚类方法
- K-Means及其变种
- K-Medoids
- Mean Shift
- ISODATA
- DBSCAN
- Label Propagation
- Affinity Propagation(AP)
- Hierarchical Clustering
- Spectral clustering
- Fuzzy C-Means
分类
- 分类与回归的区别
- 分类算法评估指标
- 常见分类算法:
回归
关联分析
深度学习
时间序列分析
- 趋势判断
- 常见时间序列预测方法
- 因果分析
- 异常识别
自然语言处理
- 中文分词
- 词性标注
- 词向量
- 文本摘要
- 文本分类
- 语义分析
- 文本相似度
- 情感分析
- 工具
搜索排序
- Lucene
- Elasticsearch
- 排序算法
推荐系统
- 推荐算法之矩阵分解
- 矩阵分解之SVD奇异值分解
- 矩阵分解之交替最小二乘ALS
- 推荐算法之贝叶斯个性化排序 BPR
- 腾讯Item-based CF实时推荐算法
- 腾讯视频实时推荐系统实践
- Python推荐系统库:Surprise
- implicit实现协同过滤实时推荐系统
- 小红书首页feed流推荐逻辑探究
- 抖音推荐机制与算法的研究
- 用户画像的理解与反思
- 用户体系搭建之ID-Mapping
- 推荐系统:从千人千面到千域千面
- 推荐系统之协同过滤
规则引擎
用户画像
图计算&图数据库
数据挖掘
大数据通识
基础概念
数据分析
- 工具软件
- 数据采集:
- 数据获取:
- 数据探索
- SciPy
- Pandas
- 分析实战
- 大数据处理
- 其他信息:
数据可视化
- Maplotlib
- 地理数据可视化
- Streamlit:快速数据可视化界面工具
- 图形展示:
- 表格呈现:
程序开发
C语言
Python
- 语言基础
- 认识Python:起源与发展
- Python改进提案:PEP文档
- PEP 7:C语言风格指南
- PEP 8:Python编码规范
- PEP 257:Docstring书写规范
- PEP 249:Python数据库API规范v2.0
- PEP 333:Python Web服务器Gateway接口 v1.0
- PEP 3333:Python Web 服务器网关接口v1.0.1
- Python数据结构与时间复杂性
- Python 多线程与多进程
- Python模块:容器数据类型Collections
- Python 逻辑判断True/False的坑
- 如何理解Python装饰器
- Python协程与异步
- Python迭代器与生成器
- 深入学习Python import机制
- 深入理解Python with语句
- Python中的if __name__ == ‘__main__’
- Python 内置函数
- Python异常捕获与处理
- Python字符串格式化工具
- Python垃圾回收机制与实现
- Python中break/continue/pass的区别
- Python模块、包、库、框架
- 使用实践
- 文件处理
- 字符处理
- 抓取与爬虫
- Django
- GUI
- 模块与包
PHP
JAVA
HTML
CSS
复杂度算法
数据库
- MySQL
- 如何理解数据库的Schema模式
- 树形结构数据数据库存储方案
- 知乎话题结构数据库设计
- Typecho博客系统数据库设计
- Hive SQL CURRENT_DATE导致的datediff错误
- SQL 日期/时间处理函数
- 分布式全局唯一ID生成方案
加密解密
地理数据与空间索引
- 地理信息系统之瓦片坐标系
- 空间索引之GeoHash
- 空间索引之Uber H3
- 空间索引之 Google S2
- 经纬度转城市反地理查询系统搭建
- 多经纬度坐标中心点计算方法
- 城市运营之商圈商业区数据完善
- 中国行政区划边界GeoJSON数据
- 开源地理数据OpenStreetMap的使用
- 中国基础地理数据(1:100万)
- 经纬度与坐标系转换
- 经纬度距离计算及优化方案
- 国外地理数据问题防范
WEB开发
- 账户与密码
- 网关协议CGI、FastCGI、WSGI的区别
- 富文本编辑器的不同流派
- 网站开发图片格式对比与选择
- 字符串哈希(hash)算法梳理
- Session,Cookie,LocalStorage 与 SessionStorage
- 网站URL设计远没那么简单
- 微信二维码扫码登录的原理
- 通信协议
- RESTful API设计指南
- 二维码原理与使用
APP
- App、小程序、快应用与App Clips
- Android应用:apk文件反编译
- Android逆向之unidbg调用.so文件
- Android反编译之.so文件
- 淘口令的技术实现
- App深度链接与延迟深度链接
- 移动域名解析HTTPDNS
即时通讯
- Web应用中的实时消息技术
- 通讯协议:
- 案例学习:
- 聊天机器人
运维
开源工具
工具软件
硬件
Windows
- Cygwin/MinGW/MSys/WSL区别与联系
- Windows Linux子系统安装Anaconda
- Windows、Manjaro双系统安装
- MongoDB在Windows安装与使用
- 电脑C盘空间空间清理方法
Linux
- 桌面/服务器如何选择Linux发行版?
- Linux终端/图形界面与桌面环境
- Linux安装之swap交换分区大小设置
- Linux系统启动速度优化工具systemd-analyze
- Linux定时任务 Crontab
- Linux防火墙FirewallD与iptables
- Linux软件包管理系统
- Linux软件安装命令,CMMI流程
- Linux终端文件类型与颜色
- Linux下文件的压缩与解压缩
- Linux文件权限查看与修改
- Linux 用户和用户组管理
- Manjaro Linux 安装与使用
- Linux/Windows/Mac OS文件系统
- Linux文件系统inode详解
- Linux树型结构文件系统
- Linux基础知识:显示管理器
MacOS
服务部署
- 磁盘阵列RAID种类及对比
- 私人Git服务器搭建:Gogs/Gitea
- Ubuntu Server 20.04 WordPress环境安装与配置
- 家庭存储:Gen 8 折腾记
- ThinkPad W520装机备忘
- ThinkPad X1 Carbon 2018 三系统安装
- 操作系统可启动U盘制作工具
- 机器学习环境配置:WLS2+Ubuntu+CUDA+cuDNN
产品与设计
字体
商业模式
产品策略与营销
- 基于供需关系的Airbnb动态定价策略
- 弹性定价原理及Uber动态定价模型
- 基于人性弱点的产品营销
- 心理账户在产品营销的应用
- 价格歧视在酒店收益管理中的运用
- 酒店标签化销售的机会与挑战
- 盲盒是变相赌博OR智商税?
- 张小龙、张一鸣谁能笑傲江湖
- 拼多多砍价背后的逻辑
- 八角行为分析法与广告语(SLOGAN)
- 从消费者行为模式到用户增长模型
- 力场分析:获客、转移和留存
- 《旅行青蛙》火爆原因分析
- 好的产品应有正确的价值观
市场营销
用户体验
产品设计
视觉设计
搜索引擎优化
行业知识
产品思考
- 互联网未来是什么?
- Gartner 技术成熟度曲线
- 行程规划产品难在哪里?
- 如何让APP有逛的氛围?
- 内容平台搭建PGC/UGC ?
- App“签到/打卡”功能点的思考
- 重新认识电子表格Excel
- 逆向思维:红白机射击游戏的奥秘
- 《植物大战僵尸》成功的奥秘
自我提升
- 学习与成长
- 管理学
- 哲学:
- 书法
- 其他:
- 读书笔记: