批量下载google图片的Pytho方法源码
Python教程学习,本文是关于批量下载google图片的Pytho方法源码,希望能帮助到喜欢收集图片的朋友们。这次是以google为例,谷歌的图片搜索每次匹配的结果在200张左右,不会批量下载的朋友需要手动一张张下载十分麻烦的。有了我们这个批量下载google图片的Pytho方法后,效果要事倍功半哦。
批量下载google图片的Pytho方法工作原理
使用firefox浏览器搜索结果,之后保存搜索结果页面.html(比如:filename.html),而后修改脚本中的DIR_TARGET(也就是存放文件夹),最后再来在终端运行本脚本:./test.py filename.html就可以了。
批量下载google图片的Pytho方法源码,作者是用ubuntu10.10、 python2.6.6,下载程序使用了wget,来完成工作的。
需要用到的python方法类库有sys、os、re正则表达式
批量下载google图片的Pytho方法源码如下:
# -*- coding: utf-8 -*-
import sys,os,re
DIR_TARGET="/home/ray/图片/down"
reg=re.compile("((?<=imgurl=)http.*?\.(jpg|gif|png|bmp|jpeg))")
#正则表达式匹配下载地址www.iplaypy.com
fd=file(sys.argv[1],'r')
html=fd.read()
fd.close()
results=reg.findall(html)
if results:
os.chdir(DIR_TARGET)
for one in results:
dlcommand="wget -Nnv %s" %(one[0])
if os.system(dlcommand)==0:
print "Download %s ..." %(one[0])
else:
print "Fail download %s ..." %(one[0])
print "done"
else:
print "empty results"
Python图片下载相关文章推荐
1、Python urllib2爬虫爬取图片下载代码分享2、Python实现自动提取国家地理每日图片
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/code/scripts-shell/ss2521.html
相关文章 Recommend
- • 准备用python做下载器怎么样?需要了解些知识点
- • Python sqlalchemy批量数据插入优化注意事项有哪些
- • 求解决pip安装python库下载超时的有效方法
- • 支持url批量发post请求的python工具是什么?
- • Python for循环中用循环变量批量创建函数功能实现
- • python fabric批量管理多台server执行方法问题
- • python批量抓取二级域名标题的方法
- • 如何获取TED带字幕的视频下载url
- • 如何优化python mongodb批量修改任务
- • 想用Python批量命名文件如何实现?
- • Python requests模块下载文件遇413请求实体过大错误
- • Python scrapy ImagesPipeline图片下载源码纠错
我要分享到:
必知PYTHON教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
必知PYTHON模块 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • 绑定修改网卡绑定关系的python程序
- • 网友用python把IPv4地址变成LITNET-NAT64网段
- • 基于python Selenium的用户登录自动化测试
- • 用python代码科学上Google
- • python论坛自动签到用bs4模块
- • python北京地铁月支出简易计算器
- • 用python查找未注册的域名
- • Windows环境用Python备份MySQL脚本
- • 批量调整图片尺寸的python脚本
- • Python方法获取百度地图数据示例源码
图文精华 RECOMMEND
-
用python代码科学上Google
-
Windows环境用Python备份MySQL脚本
-
批量调整图片尺寸的python脚本
-
Python方法获取百度地图数据示例源
-
控制台进度自动刷新python方法源码
-
web.py能条件判断的页面执行计时方
热点文章 HOT
- web.py能条件判断的页面执行计时方法
- Windows环境用Python备份MySQL脚本
- 从糗事百科下载数据的python方法示例
- 基于python Selenium的用户登录自动化测试
- 解决Python2不支持datetime的json encode问题
- Python完成抓取并写入mysql库的方法
- 一个初学者练手的Python多线程实现下载的
- Python调chrome刷页面完成刷点击量操作