本文实例讲述了Python爬虫实现抓取京东店铺信息及下载图片功能。分享给大家供大家参考,具体如下:
这个是抓取信息的
from bs4 import BeautifulSoup import requests url = 'https://list.tmall.com/search_product.htm?q=%CB%AE%BA%F8+%C9%D5%CB%AE&type=p&vmarket=&spm=875.7931836%2FA.a2227oh.d100&from=mallfp..pc_1_searchbutton' response = requests.get(url) #解析网页 soup = BeautifulSoup(response.text,'lxml') #.text将解析到的网页可读 storenames = soup.select('#J_ItemList > div > div > p.productTitle > a') #选择出商店的信息 prices = soup.select('#J_ItemList > div > div > p.productPrice > em') #选择出价格的信息 sales = soup.select('#J_ItemList > div > div > p.productStatus > span > em') #选择出销售额的信息 for storename, price, sale in zip(storenames,prices,sales): storename = storename.get_text().strip() #用get_text()方法筛选出标签中的文本信息,由于筛选结果有换行符\n所以用strip()将换行符去掉 price = price.get_text() sale = sale.get_text() print('商店名:%-40s价格:%-40s销售额:%s'%(storename,price,sale)) #使打印出来的信息规范 print('----------------------------------------------------------------------------------------------')
本文标题:Python爬虫实现抓取京东店铺信息及下载图片功能示例-创新互联
浏览地址:https://www.cdcxhl.com/article28/ceocjp.html
成都网站建设公司_创新互联,为您提供手机网站建设、搜索引擎优化、外贸网站建设、关键词优化、做网站、网站制作
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联