分类: 数据

潜在语义分析LSA初探

什么是潜在语义分析LSA? 潜在语义分析(Latent Semantic Analysis),是语义学的一个新的分支。传统的语义学通常研究字、词的含义以及词与词之间的关系,如同义,近义,反义等等。潜在语义分析探讨的是隐藏在字词…

阿里巴巴数据采集方案学习

阿里巴巴的日志采集体系方案客户端埋点,插件/封装,服务端部署。 JS是Web端(基于浏览器)日志采集技术方案 UserTrack是APP端(无线客户端)日志采集技术方案,是采集并上报App日志的sdk,适用于native原生…

数据, 术→技巧 ·

解构淘宝SPM/SCM流量跟踪体系

SPM 跟踪体系 SPM 是 shopping page mark 的简称,指的是导购页面标记。SPM 是淘宝社区电商业务(xTao)为外部合作伙伴(外站)提供的一套跟踪引导成交效果数据的解决方案。下面是一个跟踪点击到宝贝详情页的引导成…

数据, 术→技巧, 研发 ·

深入分析Google Analytics原理与实现

以下内容是自己十年前整理的,期间翻看了 Google Analytics 的所有帮助文档,查看了商业版本的 Urchin 及代码。最终对 Google Analytics 有了大致了解,并基于实际需求,搭建了一套更加完善的数据跟踪体系,相关资…

网页正文提取工具Readability

什么是Readability? 如果你在网上看到一篇不错的文章想收藏起来稍后再读,却又不想同时保存那一大堆花花绿绿的广告或无关紧要的一些网页元素,那么你可以试试Readability了! Readability是一个颇有特色的“稍后阅…

用户旅程分析工具与应用思考

什么是用户旅程分析? 客户旅程分析(Customer Journey Analytics)是指客户随着时间的推移与之交互的每个接触点的编织。用户旅程分析一开始主要由市场营销人员使用,主要分析的用户来源渠道间的变化。随后该方法被…

数据, 术→技巧 ·

通过SQL定义用户浏览Session

PC时代,用户问页面时,我们会先检查用户的Cookie中是否存在SessionId,如果不存在,则会通过随机数的方式生成一个SessionId存入Cookie中。如果存在,我们会更新这个Cookie的失效时间(30分钟后)。即只要用户访问…

数据, 术→技巧 ·

小红书首页feed流推荐逻辑探究

小红书是一个分享社区加电商的APP,主要用户群体为女性。小红书主要包含两大部分: 分享社区:分享精致生活的社区,主要分享内容(笔记)包括美装、穿搭,喜欢去的餐馆,新发现的旅行地点、酒店,最新的母婴和家…

数据, 术→技巧, 营销 ·

抖音推荐机制与算法的研究

最近公司的部分运营工作涉及到的抖音短视频的宣传。为了达到更好的效果,于是对抖音的推荐机制进行了简单的整理和研究。 通过数据的分析,我们发现在传播效果方面,抖音>小红书>微信朋友圈>新浪微博。…

数据, 术→技巧, 营销 ·

用户画像的理解与反思

用户画像在互联网相关的各个行业都被提及,从产品经理到市场营销再到大数据。感觉自己负责的产品不与用户画像扯上点关系就很Low。但用户画像到底是什么其实没有多少人能说的明白。 在我的理解里,用户画像可以分为…

产品, 数据, 术→技巧 ·