使用.htaccess来防止图片被盗链

29 sec read

具体操作,在图片目录下放置.htaccess的文件(Windows主机貌似不支持此功能),内容如下

  RewriteEngine on

  RewriteCond %{HTTP_REFERER} !^$ [NC]

  RewriteCond %{HTTP_REFERER} !biaodianfu.com [NC]

  RewriteCond %{HTTP_REFERER} !google.cn [NC]

  RewriteCond %{HTTP_REFERER} !google.com [NC]

  RewriteCond %{HTTP_REFERER} !baidu.com [NC]

  RewriteRule .(jpg|gif|png|bmp|swf|jpeg) /image/replace.gif [R,NC,L]

  RewriteRule ^(.*)$ http:\/\/www.biaodianfu.com\/image\/$1 [L]

对Rewrite规则简单的说明下

  RewriteCond %{HTTP_REFERER} !^$ [NC]

  RewriteCond %{HTTP_REFERER} !biaodianfu.com [NC]

  RewriteCond %{HTTP_REFERER} !google.cn [NC]

  RewriteCond %{HTTP_REFERER} !google.com [NC]

  RewriteCond %{HTTP_REFERER} !baidu.com [NC]

这部分代码是判断是否盗链,即,如果用户不是直接输入,不是来源于Google或者百度就执行下列转向:

  RewriteRule .(jpg|gif|png|bmp|swf|jpeg) /image/replace.gif [R,NC,L]

如果判定以下格式文件(jpg、gif、png、bmp、swf、jpeg)被盗链,就把所有文件用image 目录下的 replace.gif 图片替换掉(需要注意的是替换显示的图片不要放在设置防盗链的目录下)。如果照上面的规则判断出图片请求不是盗链的,就执行以下转向:

  RewriteRule ^(.*)$ http:\/\/image.biaodianfu.com\/image\/$1 [L]

  意思是对目录下所有的请求都转向到目标服务器,比如有个图片原来的 url 是 http://www.biaodianfu/img/logo.gif ,现在就会转到http://image.biaodianfu/image/logo.gif去。在此之前需要把原服务器 img 目录下的文件统统拷贝到图片服务器的 image 目录下,转向才会真正可用。

同样要防止别人盗链只要将文件格式做下改变就可以了。

顺便书名下R、NC 和 L 代表的意思:R 指的是转向,NC 指的是不区分大小写 ,L 的作用是指明本次转向到此结束,后续的转向不受先前判断语句的影响。

另外推荐一个在线生成防止盗链的.htaccess文件的网站:http://www.htmlbasix.com/disablehotlinking.shtml

打赏作者
微信支付标点符 wechat qrcode
支付宝标点符 alipay qrcode

使用Python更换外网IP

在进行数据抓取时,经常会遇到IP被限制的情况,常见的解决方案是搭建代理IP池,或购买IP代理的服务。除此之外,还有一个另外的方法就是使用家里的宽带网络进行抓取。由于家里的宽带每次断开重新连接时都会分配一个新的IP,所以在我们抓取数据的时候,判断 ...
36 sec read

Python多线程与多进程

7 min read

Python Requests 抓取失败时的重试设置

最近在抓取数据的时候,经常遇到连接超时的问题,分析原因居然是DNS污染导致的,为了让程序更加稳健,需要对requests请求实现失败重试的逻辑。
2 min read

Leave a Reply

Your email address will not be published. Required fields are marked *