针对高维数据的降维,先前使用的是t-SNE。无意中接触到umap,发现还是蛮有啥意思的。整理了一些资料供以后深入研究。 UMAP简介 UMAP ,全称uniform manifold approximation and projection,统一流形逼近与投影,…
什么是色彩模式? 当你选择使用设计软件来进行配色时,应该要先了解色彩模式。在photoshop中,色彩模式决定了用来显示和打印文件的颜色。色彩模式是图形设计最基本的知识,每一种模式都有自己的优缺点,都有自己的…
把自己弄得忙忙碌碌,但回头看碌碌无为。无意看到这篇文章,感觉对自己非常有用,记录下来自勉。 设想一下有一个不停工作的小业务员,努力工作并不能帮助他战胜成千上万的竞争对手。时间是有限的商品。一个企业…
阿里巴巴的日志采集体系方案客户端埋点,插件/封装,服务端部署。 JS是Web端(基于浏览器)日志采集技术方案 UserTrack是APP端(无线客户端)日志采集技术方案,是采集并上报App日志的sdk,适用于native原…
SPM跟踪体系 SPM是shopping page mark的简称,指的是导购页面标记。SPM是淘宝社区电商业务(xTao)为外部合作伙伴(外站)提供的一套跟踪引导成交效果数据的解决方案。下面是一个跟踪点击到宝贝详情页的引导成交效…
以下内容是自己十年前整理的,期间翻看了Google Analytics的所有帮助文档,查看了商业版本的Urchin及代码。最终对Google Analytics有了大致了解,并基于实际需求,搭建了一套更加完善的数据跟踪体系,相关资料分享…
什么是Google Search Appliance Google Search Appliance是先前Google销售的一款小型搜索服务器,可以帮助你快速的搭建一套搜索引擎系统。它实际了一款个小型的Google,里面包含的Google的搜索算法等,你可以用它…
什么是Readability? 如果你在网上看到一篇不错的文章想收藏起来稍后再读,却又不想同时保存那一大堆花花绿绿的广告或无关紧要的一些网页元素,那么你可以试试 Readability 了! Readability 是一个颇有特色的“…
在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增ID显然不能满足需求此时一个能够生成全局唯一ID的系统是非常必要的。概括下来…
什么是信息熵? 信息是我们一直在谈论的东西,但信息这个概念本身依然比较抽象。在百度百科中的定义:信息,泛指人类社会传播的一切内容,指音讯、消息、通信系统传输和处理的对象。但信息可不可以被量化,怎样量…