《Learn Python The Hard Way》学习笔记

《Learn Python The Hard Way》学习笔记

《learn python the hard way》是一本非常好的Python入门书籍,这是一本需要你一步一步去敲代码去学习的书。   《learn python the hard way》地址:http://learnpythonthehardway.org/book/ 在学习Python之前首先是安装Python运行环境,这里使用的Windows平台,以下为安装步骤:

新闻聚合之Google news模式与 Techmeme模式

新闻聚合之Google news模式与 Techmeme模式

随着网络信息的飞速发展,科技新闻这一重要科技资源形式发挥着越来越重要的作用。如何对海量的科技新闻进行聚合已成为新兴的热点话题。文章介绍了新闻聚合的产生,并将现在广泛使用的新闻聚合模式归纳为:人工编辑组织、Digg、Google news、Techmeme四种

一淘网的系统架构

一淘网的系统架构

一淘网是淘宝推出的一款购物搜索引擎,目前主要是由四部分组成:购物相关资讯的文本搜索-导购、基于opensearch的全网商品搜索-商品、购物社区-淘吧、问答搜索、全网搜索(目前使用的是其他搜索引擎公司的系统、自己公司的也有,但不是默认项)。 导

防采集系统的设计

防采集系统的设计

网络上越来越多的站长在使用采集系统进行网站采集。如何应对这样的采集成为一个很棘手的问题。先前写过一篇怎样防止网站被采集的的文章,但是中间提到的方法感觉不是非常的适用。 正常的搜索引擎抓取页面可以使用robots.txt来进行屏蔽,比如万恶的

Python抓取框架:Scrapy的架构

Python抓取框架:Scrapy的架构

最近在学Python,同时也在学如何使用python抓取数据,于是就被我发现了这个非常受欢迎的Python抓取框架Scrapy,下面一起学习下Scrapy的架构,便于更好的使用这个工具。 一、概述 下图显示了Scrapy的大体架构,其中包含了它的主要组件及系统的数据处理流程

旁敲侧击豆瓣电台的推荐系统

旁敲侧击豆瓣电台的推荐系统

豆瓣电台音乐推荐功能非常的智能,这样的推荐系统是如何创建起来的呢?下面是从知呼上趴下来的一些参考答案,转载到博客,以后自己慢慢消化。 豆瓣电台的私人电台会综合用户在豆瓣上的各种音乐行为做算法推荐。当然考虑最多的是电台本身的“

如何成为一名黑客

看了《黑客与画家》,于是在网上找到了这篇如何成为黑客的教材。记录下来于大家一起学习。本文由:The Duck Typist 翻译。英文原文在这里:http://catb.org/~esr/faqs/hacker-howto.html 如何成为一名 Hacker Eric Steven Raymond Thyrsus Enterprises Copyright © 2001 Eric S. Raymo

获取客户端真实IP方法

在讨论获取客户端IP 地址前,我们首先下弄明白的是以下三个的具体含义:REMOTE_ADDR,HTTP_CLIENT_IP,HTTP_X_FORWARDED_FOR REMOTE_ADDR 是你的客户端跟你的服务器“握手”时候的IP。如果使用了“匿名代理”,REMOTE_ADDR将显示代理服务器的IP。 HTTP_CLIENT_IP 是代理服务

微格式:让网页更加语义化

微格式:让网页更加语义化

微格式(Microformat),是建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式。是把语义嵌入到HTML以便有助于分离式开发而制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法。这种方法依托于

Python语言蕴含的禅机

在python的IDLE(Python GUI)中输入inport this 就可以看到python的禅机。 >>> import this The Zen of Python, by Tim Peters Beautiful is better than ugly. Explicit is better than implicit. Simple is better than complex. Complex is better than complicated. Flat is better than nested. Sparse is better than de

Page 5 of 12« First...«34567»10...Last »