请选择 进入手机版 | 继续访问电脑版
微信扫一扫 分享朋友圈

已有 992 人浏览分享

开启左侧

python爬取豆瓣图书新书速递

[复制链接]
992 2
[mw_shl_code=python,true]import requests,os
from bs4 import BeautifulSoup
def GetDesktopPath():
    return os.path.join(os.path.expanduser("~"), 'Desktop')
#resp = requests.get('https://book.douban.com/top250?start=0

')
resp = requests.get('https://book.douban.com/latest?icn=index-latestbook-all

')

#print(resp.text)
soup=BeautifulSoup(resp.text,"lxml")

#获取书名
alldiv = soup.find_all('div', class_='detail-frame')
names=[a.find('a').get_text() for a in alldiv]
print(names)
#获取作者信息
allp=soup.find_all("p",class_="color-gray")
authors=[p.get_text().strip() for p in allp]
print(authors)

#获取评分
starspan=soup.find_all("span",class_="font-small")
scores=[s.get_text().strip() for s in starspan]
print(scores)

#获取简介

sumspan=soup.find_all("p",class_="detail")
sums=[i.get_text().strip() for i in sumspan]
print(sums)
data=""
for name,author,score,sum in zip(names,authors,scores,sums):
    name="书名:"+str(name)+"\n"
    author="作者:"+str(author)+"\n"
    score="评分:"+str(score)+"\n"
    sum="简介:"+str(sum)+"\n"
    data+=name+author+score+sum+"\n"

fileName="豆瓣图书新书速递.txt"
with open(GetDesktopPath()+"\\"+fileName,"w",encoding="utf_8") as f:
    f.write(data+"============")
print("已经爬取完毕 保存到桌面")

[/mw_shl_code]

python爬取豆瓣图书新书速递

python爬取豆瓣图书新书速递


不积跬步,无以至千里

评论 2

japanphone  初级码农Ⅰ  发表于 2018-7-5 12:54:10 | 显示全部楼层
{:4_101:}{:4_101:}{:4_101:}{:4_101:}{:4_101:}

举报 使用道具

回复
daowuya  初级码农Ⅰ  发表于 2018-7-19 15:13:31 | 显示全部楼层

顶顶顶顶顶顶

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0

关注

37

粉丝

1150

主题
热门资讯
网友晒图
图文推荐
  • 联系我们
  • 邮箱:admin@c0ks.com(请把#改成@)
  • 电话:18530790808
  • QQ客服 1031180668
  • 工作时间:周一至周五(早上9点至下午5点)
  • 微信二维码

  • 扫描访问手机版

Archiver|手机版|小黑屋|从零开始

GMT+8, 2020-5-26 01:45 , Processed in 0.106261 second(s), 43 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

  • QQ: 1031180668

    客服电话

    18530790808

    电子邮件

    admin@c0ks.com

    在线时间:8:00-16:00