博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
04-爬取单个英雄联盟英雄的符文图片
阅读量:6085 次
发布时间:2019-06-20

本文共 1663 字,大约阅读时间需要 5 分钟。

业务需求,需要爬取英雄联盟英雄的符文图片,然后在把它们拼接回去。

以下是爬取单个英雄katarina的符文图片到本地的代码,爬取地址为:

要爬取的图片内容为:

 
#!/usr/bin/env python # -*- coding: utf-8 -*- #Author:hejianping #2019/05/21 from bs4 import BeautifulSoup import requests response = requests.get(url='http://www.op.gg/champion/katarina/statistics/mid') print(response.text)  # 查看页面是否下载下来。 soup = BeautifulSoup(response.text,features='html.parser') # 英雄名字 info = soup.find(class_="champion-stats-header-info") name =info.find('h1').text print(name) target = soup.find(class_="tabItem ChampionKeystoneRune-1") #print(target) div_list = target.find_all(class_="perk-page__item") #print(div_list) def mkdir(path):     import os     path = path.strip()     path = path.rstrip("\\")     isExists = os.path.exists(path)     if not isExists:         os.makedirs(path)         print         path + ' 创建成功'         return True     else:         print         path + ' 目录已存在'         return False # 定义要创建的目录 mkpath = "F:\\爬虫\\www.op.gg_champion_statistics\\splider\\" + name + '\\' print(mkpath) # 调用函数 mkdir(mkpath) count = 0 for i in div_list:     img = i.find('img')     if img:         # 图片地址         # print(img.attrs.get('scr'))         img_url = 'http:' + img.attrs.get('src')         print(img_url)  # 官网上的链接少了http: 自己拼接。         # 把图片下载到本地保存起来。         img_response = requests.get(url=img_url)         # import uuid  # 随机起名字。         # file_name = str(uuid.uuid4()) + '.jpg'         # 设置图片存放地址和命名规范。         file_name = mkpath + str(count + 1) + '.jpg'         count = count + 1         with open(file_name,'wb') as f:             f.write(img_response.content)  # .content 返回字节类型

 

 

 

 

转载于:https://www.cnblogs.com/hejianping/p/10916957.html

你可能感兴趣的文章
怎样使窗体中的控件布局统一?
查看>>
Web Service学习笔记:动态调用WebService的方法总结
查看>>
SQL Server 2012将与Hadoop无缝集成
查看>>
有线+无线路由器设置
查看>>
正则表达式入门教程
查看>>
poj1111
查看>>
NYOJ-107 A Famous ICPC Team
查看>>
wubi安装ubuntu后,增加swap大小,优化swap的使用参数-----------让ubuntu健步如飞,为编译android源码准备...
查看>>
基于模糊集理论的一种图像二值化算法的原理、实现效果及代码
查看>>
十三种基于直方图的图像全局二值化算法原理、实现、代码及效果。
查看>>
与众不同 windows phone (44) - 8.0 位置和地图
查看>>
MVC4数据注释与验证 2
查看>>
原生js--异步请求
查看>>
聪明而懒惰的人,才是大将之才
查看>>
goldengate–使用filter+@GETENV在线重新初始化指定的table
查看>>
如果把编程语言比作武器
查看>>
Java之内部类(1) - 为什么需要内部类
查看>>
解剖SQLSERVER 第十一篇 对SQLSERVER的多个版本进行自动化测试(译)
查看>>
JSP 标准标签库(JSTL)之最常用的JSTL标签总结
查看>>
HDInsight HBase概观
查看>>