分类: 研发

经纬度转城市反地理查询系统搭建

想知道某个经纬度属于哪个城市,通常可以通过地图 API 的接口实现。但是地图服务商的 API 通常会有配额限制。问题来了,能否搭建自己的经纬度反查系统呢? GADM GADM 主页:https://gadm.org/ GADM,全称 Databa…

数据, 术→技巧, 研发 ·

城市运营之商圈商业区数据完善

目前大部分O2O性质的服务(如外卖)都是以城市商圈未中心进行拓展的。在社区运营层面往往也需要商圈的信息,比如咸鱼的“鱼塘”也是基于商圈进行的运营。更加完善的商圈数据,无疑会更好的协助城市运营。由于商圈/商…

术→技巧, 研发, 运营 ·

正则表达式与Python Re模块

re模块是Python标准库中的一个模块,用于执行正则表达式操作。正则表达式是一种强大的工具,用于字符串匹配、查找、替换和解析。re模块提供了丰富的功能,支持复杂的模式匹配和字符串处理。 正则表达式简介 正则…

Python网络请求库Requests使用技巧

Requests 库是用来在 Python 中发出标准的 HTTP 请求。它将请求背后的复杂性抽象成一个漂亮,简单的 API,以便你可以专注于与服务交互和在应用程序中使用数据。 Requests POST/GET 参数 常用参数见下表: Reque…

术→技巧, 研发 ·

Python异常重试解决方案

数据抓取时,经常遇到由于网络问题导致的程序异常,一开始的做法只是记录了错误内容,并对错误内容再进行后期处理。这里整理了一些更好的异常重试方法或机制。 初始版本: def crawl_page(url): pass def l…

术→技巧, 研发 ·

HTML网页解析提取工具lxml和XPath

在数据抓取过程中,经常遇到需要解析HTML中的内容,常用的是用正则表达式,今天主要介绍lxml工具及xpath的语法。 lxml简介 lxml是一款高性能Python XML库,它天生支持XPath 1.0、XSLT 1.0、定制元素类,甚至Python…

Python获取照片Exif信息

什么是 Exif? Exif(Exchangeable image file format)是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据。Exif 信息是镶嵌在 JPEG/TIFF 图像文件格式内的一组拍摄参数,它就好像是傻瓜相机的…

数据, 术→技巧, 研发 ·

SWIG实现Python调用C/C++代码

SWIG简介 SWIG是Simplified Wrapper and Interface Generator的简称,它是一个能将C和C++的程序与其他各种高级语言诸如Perl,Python,Ruby和Tcl进行连结的开发工具。 目前支持的语言: C#-Mono C#-MS.NET D …

术→技巧, 研发 ·

Redis和Memcached的区别

说到Redis就会联想到Memcached,反之亦然。了解过两者的同学有那么个大致的印象:Redis与Memcached相比,比仅支持简单的key-value数据类型,同时还提供list, set, zset, hash等数据结构的存储;redis支持数据的备份…

术→技巧, 研发 ·

深入理解Lucene默认打分算法

当谈论到查询的相关性,很重要的一件事就是对于给定的查询语句,如何计算文档得分。文档得分是一个用来描述查询语句和文档之间匹配程度的变量。如果你希望通过干预Lucene查询来改变查询结果的排序,你就需要对Lucen…

术→技巧, 研发 ·