分类: 数据

选择的艺术:用数学获取最优选择

生活是所有选择的总和 大到一个国家如何选择合适的领导人和国家战略、一家企业如何选择自己的经营策略和项目方案,小到我们每个人每天选择吃什么、穿什么、用什么,可以说,一切组织和个人的荣耀与衰落,都源自选…

数据, 术→技巧 ·

排序优化算法Learning to Ranking

Learning to Ranking简介 Learning to Rank (LTR)是指一系列基于机器学习的排序算法,最初主要应用于信息检索(Information Retrieval,IR)领域,最典型的是解决搜索引擎对搜索结果的排序问题。除了信息检索以…

潜在语义分析LSA初探

什么是潜在语义分析LSA? 潜在语义分析(Latent Semantic Analysis),是语义学的一个新的分支。传统的语义学通常研究字、词的含义以及词与词之间的关系,如同义,近义,反义等等。潜在语义分析探讨的是隐藏在字词…

阿里巴巴数据采集方案学习

阿里巴巴的日志采集体系方案客户端埋点,插件/封装,服务端部署。 JS是Web端(基于浏览器)日志采集技术方案 UserTrack是APP端(无线客户端)日志采集技术方案,是采集并上报App日志的sdk,适用于native原…

数据, 术→技巧 ·

解构淘宝SPM/SCM流量跟踪体系

SPM跟踪体系 SPM是shopping page mark的简称,指的是导购页面标记。SPM是淘宝社区电商业务(xTao)为外部合作伙伴(外站)提供的一套跟踪引导成交效果数据的解决方案。下面是一个跟踪点击到宝贝详情页的引导成交效…

数据, 术→技巧, 研发 ·

深入分析Google Analytics原理与实现

以下内容是自己十年前整理的,期间翻看了Google Analytics的所有帮助文档,查看了商业版本的Urchin及代码。最终对Google Analytics有了大致了解,并基于实际需求,搭建了一套更加完善的数据跟踪体系,相关资料分享…

网页正文提取工具Readability

什么是Readability? 如果你在网上看到一篇不错的文章想收藏起来稍后再读,却又不想同时保存那一大堆花花绿绿的广告或无关紧要的一些网页元素,那么你可以试试 Readability 了! Readability 是一个颇有特色的“…

用户旅程分析工具与应用思考

什么是用户旅程分析? 客户旅程分析(Customer Journey Analytics)是指客户随着时间的推移与之交互的每个接触点的编织。用户旅程分析一开始主要由市场营销人员使用,主要分析的用户来源渠道间的变化。随后该方法…

数据, 术→技巧 ·

通过SQL定义用户浏览Session

PC时代,用户问页面时,我们会先检查用户的Cookie中是否存在SessionId,如果不存在,则会通过随机数的方式生成一个SessionId存入Cookie中。如果存在,我们会更新这个Cookie的失效时间(30分钟后)。即只要用户访问…

数据, 术→技巧 ·

小红书首页feed流推荐逻辑探究

小红书是一个分享社区加电商的 APP,主要用户群体为女性。小红书主要包含两大部分: 分享社区:分享精致生活的社区,主要分享内容(笔记)包括美装、穿搭,喜欢去的餐馆,新发现的旅行地点、酒店,最新的母婴…

数据, 术→技巧, 营销 ·