玩蛇网提供最新Python编程技术信息以及Python资源下载!

关于Python爬取网址结构问题及怎么跳过当前文件继续下载图片

下载图片的时候很容易碰到下载了几张之后碰到图片的链接里面含有/时会出现:
FileNotFoundError: [Errno 2] No such file or directory:

例如:
图一:http://gnondgnoqnioandiofnas_swn_ssy_mhtng.jpg
图二:http://asnoqenconvoqenripetn_swn_ssy_mhtng.jpg
图三:http://asdnioqnoqwrqwenoqwr/12345/123/1256.gif

 
for item in download_link:
    urllib.request.urlretrieve(item,folder_path + item[-19:])
    time.sleep(2)
    print('Done')
    

运行到图三的时候就中断了,我的理解是因为图三的地址有/,造成文件夹之后再次进入子文件夹进不去,所以出错。

(1)想请问下怎么样能跳过这个文件,继续下载后面的图片
(2)或者说有什么办法能直接把这个图三直接下载了

粗暴一点,你可以try一下。

urlretrieve第二个参数是文件名,文件名里面是不允许有斜杠的,可以这样做:

urllib.request.urlretrieve(item,folder_path + item.split('/')[-1])

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd14068.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月31日 - 10时47分00秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules