python下载图片脚本_Python实现批量下载图片的方法-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

python下载图片脚本_Python实现批量下载图片的方法

阅读量：6972 次

发布时间：2019-06-27

本文共 2027 字，大约阅读时间需要 6 分钟。

#!/usr/bin/env python

#-*-coding:utf-8-*-'

#Filename:download_file.py

import os,sys

import re

import urllib

import urllib2

base_url = 'xxx'

array_url = list()

pic_url = list()

inner_url = list()

def get_array_url(array_url,base_url):

content = urllib.urlopen(base_url).read()

array_url_a = re.findall(r'/rihan.*?.html',content)

for url in array_url_a:

url_a = 'xxx'+url

#print url_a

array_url.append(url_a)

def get_inner_url(array_url,inner_url):

inner_url.append(array_url)

content = urllib.urlopen(array_url[10]).read()

content = content.replace(" ","")

url_a = re.findall(r'

.*?',content)

for i in url_a:

url = re.findall(r'ahref=\\'.*?.html\\'target',i)

if len(url)>0:

# print url[0]

url_b = re.sub(r'ahref=\\'','',url[0])

# print url_b

url_c = re.sub(r'\\'target','',url_b)

url_c = 'http://xxx/'+re.sub(r'/.*/','',url_c)

inner_url.append(url_c)

del inner_url[1]

# print inner_url

def get_pic_url(pic_url,inner_url,array_url):

content = urllib.urlopen(array_url).read()

pic_url_a = re.findall(r'center.*?.jpg',content)

print 'bbbbbbbbb',len(pic_url_a)

pic_url_a = re.findall(r'http://.*.jpg',pic_url_a[0])

pic_url.append(pic_url_a[0])

j=2

for i in inner_url:

jj = '/'+str(j)+'.jpg'

pic = re.sub(r'/1.jpg',jj,pic_url_a[0])

pic_url.append(pic)

j = j+1

del pic_url[-1]

for i in pic_url:

print i

def urlcallback(a,b,c):

"""

call back function

a,已下载的数据块

b,数据块的大小

c,远程文件的大小

"""

print "callback"

prec=100.0*a*b/c

if 100 < prec:

prec=100

print "%.2f%%"%(prec,)

def download(img_url,file_num):

for img in img_url:

print img

img_name = re.sub(r'http://.*/','',img)

path = 'C:/'+str(file_num)+'/'+img_name

urllib.urlretrieve(img,path,urlcallback)

get_array_url(array_url,base_url)

file_num = 3

#download(pic_url,file_num)

get_inner_url(url,inner_url)

get_pic_url(pic_url,inner_url,url)

'''

for url in array_url:

print url

# get_inner_url(url,inner_url)

# get_pic_url(pic_url,inner_url)

get_inner_url(url,inner_url)

get_pic_url(pic_url,inner_url,url)

download(pic_url,file_num)

file_num = file_num+1

del inner_url[:]

del pic_url[:]

'''

转载地址：http://whhsl.baihongyu.com/

你可能感兴趣的文章

《gradle 用户指南》中文版第2章概述

Dockerfile指令

FFmpeg 学习资料

Redis实现分布式锁

Phonegap 工作原理

连载-第2章嵌入式系统工程设计概述

Vector3.forward

ubuntu-学习笔记之1-9

8086汇编语言(1)虚拟机安装ms-dos 7.1

C#多线程编程之：lock使用注意事项

DI,DIP,IOC的演变历史 <转>

oracle extract()截取时间值函数

[安卓] 10、悬浮窗与获取其他任务信息

JDOM入门实例：读取与创建xml文档

Knockout 新版应用开发教程之"text"绑定

Android 分享微信好友朋友圈

java内存分配研究

第 25 章 Munin

【iOS】在Swift中使用JSONModel

Node.js与Sails~Model数据模型

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-04 22:40:48 当前IP: 18.225.209.24 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我