博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
爬取贴吧好看的桌面图片 -《狗嗨默示录》-
阅读量:4938 次
发布时间:2019-06-11

本文共 618 字,大约阅读时间需要 2 分钟。

#!/usr/bin/env python # _*_coding=utf-8_*_ import urllib.request import re def getHtml(url):     page = urllib.request.urlopen(url)     html = page.read().decode('utf-8')     return html def getImg(html):     reg = r'src="(.+?\.jpg)" pic_ext'     imgre = re.compile(reg)     imglist = re.findall(imgre,html)     x = 0     for imgurl in imglist:         urllib.request.urlretrieve(imgurl,'D://Workspace//Mywork//picture//%s.jpg'%x)         x+=1 html = getHtml("http://tieba.baidu.com/p/2460150866") #html = getHtml("http://blog.jobbole.com/111888/") print(getImg(html))

转载于:https://www.cnblogs.com/LiGoHi/p/7284303.html

你可能感兴趣的文章
Linux-网络连接-(VMware与CentOS)
查看>>
寻找链表相交节点
查看>>
linq 学习笔记之 Linq基本子句
查看>>
[Js]布局转换
查看>>
Java annotation 自定义注释@interface的用法
查看>>
Apache Spark 章节1
查看>>
Linux crontab定时执行任务
查看>>
mysql root密码重置
查看>>
33蛇形填数
查看>>
选择排序
查看>>
SQL Server 数据库的数据和日志空间信息
查看>>
前端基础之JavaScript
查看>>
自己动手做个智能小车(6)
查看>>
自己遇到的,曾未知道的知识点
查看>>
P1382 楼房 set用法小结
查看>>
分类器性能度量
查看>>
docker 基础
查看>>
写一个bat文件,删除文件名符合特定规则,且更改日期在某
查看>>
我的友情链接
查看>>
写Use Case的一种方式,从oracle的tutorial抄来的
查看>>