精易论坛

标题: Python自学记录--爬取豆瓣电影排名 [打印本页]

作者: 菠萝儿    时间: 2021-9-26 18:03
标题: Python自学记录--爬取豆瓣电影排名
  1. #爬取豆瓣电影排名
  2. import re
  3. import urllib.request
  4.   
  5. #确定数量
  6. page=input("请输入您要cha询的数量:")
  7.   
  8. #UA
  9. headers={
  10. "User-Agent":"Mozilla/5.0 \
  11. (Windows NT 10.0; WOW64) AppleWebKit/537.36 \
  12. (KHTML, like Gecko) Chrome/86.0.4240.198 \
  13. Safari/537.36"
  14. }
  15.   
  16. #排名链接
  17. url="https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start=0&limit="+page
  18.   
  19. #获取响应信息
  20. req=urllib.request.Request(url,headers=headers)
  21.   
  22. #读取
  23. data=urllib.request.urlopen(req).read().decode()
  24.   
  25. pat1=r'"rating":\["(.*?)","\d+"\]'
  26. pat2=r'"title":"(.*?)"'
  27.   
  28. pattern1=re.compile(pat1)
  29. pattern2=re.compile(pat2)
  30.   
  31. data1=pattern1.findall(data,re.I)
  32. data2=pattern2.findall(data,re.I)
  33.   
  34. for i in range(len(data1)):
  35.     print("排名:",i+1,"电影名:",data2[i],"豆瓣评分:",data1[i])
  36.    
复制代码



作者: qwe6789    时间: 2021-9-26 20:37





欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4