All Stories

Pandas学习笔记之数据类型

Pandas是建立在Numpy上,并与其他第三方库在科学运算环境中有较好兼容性的包。其最大的特色在于提供灵活直
14 sec read

PySpider框架简介及安装

PySpider:一个国人编写的强大的网络爬虫系统并带有强大的WebUI。采用Python语言编写,分布式架构
35 sec read

Windows安装Docker记录

Docker是一种容器技术,可以将应用和环境等进行打包,形成一个独立的、类似于iOS的APP形式的应用。这个应
22 sec read

Windows下安装Tesserocr

在爬虫过程中,经常会遇到各种验证码,大多数验证码是图形验证码,先前的文章中有介绍到破解图形验证码的原理。最简单
15 sec read

Selenium在Windows 上的安装

Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户
35 sec read

Google云平台的用户账户密码设计最佳实践

账户管理、授权和密码管理可能对于许多开发者来说是一个没有得到足够关注的黑暗角落。以下内容是Google与平台总
13 sec read

SQL技巧分享 2018-08-09

以下SQL技巧为最近一周最新掌握的,记录下来以便后期使用。 1、随机抽样数据 HIVE SQL实现:
18 sec read

用户模型之三层身份模型

先前介绍过三户模型,这天要介绍的是三层身份模型,从使用层面,三户模型更加适合交易类网站,三层身份模型可能更加适
3 sec read

全局唯一ID生成方案

在实现大型分布式程序时,通常会有全局唯一ID生成的需求,用来对每一个对象标识一个代号。另外,业务层对于全局唯一
1 min read

Paul Graham 的创业建议

描述创业的13句话 选择好合伙人 快速发布 让你的创意进化 (大多数创意来自实现过程) 理解你的用户 (许多成
19 sec read

什么情况下用户会发生“转移”

最近的工作,有部分内容牵涉到转移,所以找了些资料,看能否从方法论中获得一些灵感。“转移”包括如何从现有的竞争对
5 sec read

享受性质量 HQ

为了支持非任务相关方面的用户体验研究,Hassenzahl等(2002)开发了一份评估享受性质量(Hedoni
3 sec read