钱魏Way

646篇文章

主题模型LDA(Latent Dirichlet Allocation)初探

在潜在语义分析LSA的文章中对LDA有一些简单的介绍,今天的目标是对LDA进行相对深入的了解,大致搞明白其原理。 LDA简介 在机器学习领域中有2个 LDA: 线性判别分析 (Linear Discriminant Analysis),主要用…

网站URL设计远没那么简单

URI和URL及URN URL大家都比较熟悉,其他两个词就比较陌生了。URI、URL和URN是识别、定位和命名互联网上的资源的标准途径。1989年Tim Berners-Lee发明了互联网(World Wide Web)。WWW被认为是全球互连的实际的和抽…

术→技巧, 研发 ·

家庭存储:Gen 8 折腾记

硬件篇 家里原先的希捷GoAgent Home突然不能使用了(后面确认下来机器没有坏,是电源适配器坏了,话说希捷配的电源适配器真的很容易坏掉。),为了保障数据的安全,于是打算购买一台NAS,对于NAS的要求:支持Raid1…

器→工具, 工具软件 ·

Python模块、包、库、框架

在使用Python的过程中,经常会被模块、库、包、框架这几个概念搞混。今天抽时间对这几个概念做下梳理。 模块(Module) 模块是一种以.py为后缀的文件,在.py文件中定义了一些常量和函数。模块的名称是该.py文件的…

选择的艺术:用数学获取最优选择

生活是所有选择的总和 大到一个国家如何选择合适的领导人和国家战略、一家企业如何选择自己的经营策略和项目方案,小到我们每个人每天选择吃什么、穿什么、用什么,可以说,一切组织和个人的荣耀与衰落,都源自选…

数据, 术→技巧 ·

排序优化算法Learning to Ranking

Learning to Ranking简介 Learning to Rank (LTR)是指一系列基于机器学习的排序算法,最初主要应用于信息检索(Information Retrieval,IR)领域,最典型的是解决搜索引擎对搜索结果的排序问题。除了信息检索以…

Python 日志模块logging的使用

logging模块是Python内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等,相比print,具备如下优点: 可以通过设置不同的日志等级,在release版本中只输出重要信息…

术→技巧, 研发 ·

微信二维码扫码登录的原理

扫二维码登录现在比较常见,比如微信、支付宝等 PC 端登录,并且越来越多的APP支持扫码登录,先前整理过一般扫码登录的原理文章,但是当时梳理的比较简单,这次趁有时间重新进行梳理下。 PC端Cookie + Session 登…

术→技巧, 研发 ·

潜在语义分析LSA初探

什么是潜在语义分析LSA? 潜在语义分析(Latent Semantic Analysis),是语义学的一个新的分支。传统的语义学通常研究字、词的含义以及词与词之间的关系,如同义,近义,反义等等。潜在语义分析探讨的是隐藏在字词…

比t-SNE更好的降维算法UMAP

针对高维数据的降维,先前使用的是t-SNE。无意中接触到umap,发现还是蛮有啥意思的。整理了一些资料供以后深入研究。 UMAP简介 UMAP ,全称uniform manifold approximation and projection,统一流形逼近与投影,…