使用Python来检查统计代码是否布置到位

49 sec read

在给网站布置统计代码后,往往需要检查开发人员布置的代码是否到位,采用人力的方式去检查很费时间,于是自己整了一个Python自动检查代码的小程序,现拿出来分享下。

# -*- coding: utf-8 -*-
__author__ = ‘www.biaodianfu.com’
import urllib2 ,gzip, StringIO, re
code = “_gaq.push([‘_setAccount’, ‘UA-123456789-1’]);”
filename = ‘urllist.txt’
checklist = open(filename,’r’)
#urls = checklist.readlines()
urls = [l.strip() for l in checklist.readlines()]
for url in urls:
    page_encode = “utf-8”
    try:
        request = urllib2.Request(url)
        request.add_header(“Accept-encoding”, “gzip”)
        sock = urllib2.urlopen(request)
        page = sock.read()
        if sock.headers.get(‘content-encoding’, None) == ‘gzip’:
            page = gzip.GzipFile(fileobj=StringIO.StringIO(page)).read()
        if not isinstance(page, unicode):
            page = unicode(page, page_encode)
        times = page.count(code)
        print “%s 出现了 %d 次” % (url,times)
    except urllib2.HTTPError,e:
        print url,e.code
checklist.close()

如果要判断_setAccount或其他_gaq中的项是否添加正确,可以采用以下代码。

# -*- coding: utf-8 -*-
__author__ = ‘www.biaodianfu.com’
# -*- coding: utf-8 -*-
import urllib2 ,gzip, StringIO, re
filename = ‘urllist.txt’
checklist = open(filename,’r’)
#urls = checklist.readlines()
urls = [l.strip() for l in checklist.readlines()]
for url in urls:
    page_encode = “utf-8”
    try:
        request = urllib2.Request(url)
        request.add_header(“Accept-encoding”, “gzip”)
        sock = urllib2.urlopen(request)
        page = sock.read()
        if sock.headers.get(‘content-encoding’, None) == ‘gzip’:
            page = gzip.GzipFile(fileobj=StringIO.StringIO(page)).read()
        if not isinstance(page, unicode):
            page = unicode(page, page_encode)
        pattern = re.compile(“‘_setAccount’, ‘(.*?)'”)
        codes = pattern.findall(page)
        account = codes[0].encode(‘utf-8’)
        print “%s Account:%s” % (url,account)
    except urllib2.HTTPError,e:
        print url,e.code
checklist.close()

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

KNN算法实战:验证码的识别

识别验证码的方式很多,如tesseract、SVM等。前面的几篇文章介绍了KNN算法,今天主要学习的是如何使用
3 min read

复合事件处理CEP简介

什么是复合事件处理? 这是一个IT事件爆发的时代,各种IT系统之间或系统内部,每天产生大量事件。系统在关键点打
23 sec read

阿里实时计算Blink核心技术

实时计算in阿里巴巴 实时计算在阿里巴巴内部应用广泛。随着新经济体的出现与发展,技术的革新和用户需求的提升,人
1 min read

2 Replies to “使用Python来检查统计代码是否布置到位”

  1. 很不错,最近正好也在学习python。

    对了,博主你原来的模板很帅,怎么换了?

发表评论

电子邮件地址不会被公开。 必填项已用*标注