精易论坛

标题: 【python爬虫】获取豆瓣最新热门电影名称和评分 [打印本页]

作者: waweiggfnh 时间: 2022-12-17 09:31
标题: 【python爬虫】获取豆瓣最新热门电影名称和评分
获取豆瓣最新热门电影名称和评分

2022年12月17日

最新电影
电影名：航海王：红发歌姬，豆瓣评分：7.2
电影名：悲情三角，豆瓣评分：7.5
电影名：吉尔莫·德尔·托罗的匹诺曹，豆瓣评分：8.0
电影名：解放黑奴，豆瓣评分：7.5
电影名：爱在空气中番外篇，豆瓣评分：8.6
电影名：我记得，豆瓣评分：7.2
电影名：亲密，豆瓣评分：8.1
电影名：沼泽深处的女孩，豆瓣评分：7.7
电影名：分手的决心，豆瓣评分：7.6
电影名：名侦探柯南：万圣节的新娘，豆瓣评分：7.4
电影名：黑亚当，豆瓣评分：5.7
电影名：查泰莱夫人的情人，豆瓣评分：6.6
电影名：坠落，豆瓣评分：7.2
电影名：塔尔，豆瓣评分：7.4
电影名：山怪巨魔，豆瓣评分：5.3
电影名：福尔摩斯小姐：伦敦厄运，豆瓣评分：6.5
电影名：明日战记，豆瓣评分：6.3
电影名：晒后假日，豆瓣评分：8.0
电影名：梦乡，豆瓣评分：7.5
电影名：西线无战事，豆瓣评分：8.5
电影名：乐土，豆瓣评分：8.4
电影名：她说，豆瓣评分：7.9
电影名： 6/45，豆瓣评分：7.7
电影名：圣蛛，豆瓣评分：7.3
电影名：地狱尖兵，豆瓣评分：8.1
电影名：世界末日，豆瓣评分：7.0
电影名：鳄鱼莱莱，豆瓣评分：6.8
电影名：危笑，豆瓣评分：6.3
电影名：珀尔，豆瓣评分：7.3
电影名：子弹列车，豆瓣评分：7.9
电影名：共助2：国际，豆瓣评分：7.1
电影名：有史以来最棒的啤酒运送，豆瓣评分：7.8
电影名：巴黎夜旅人，豆瓣评分：8.1
电影名：阿姆斯特丹，豆瓣评分：5.8
电影名：狩猎，豆瓣评分：7.7
电影名：宿敌，豆瓣评分：8.6
电影名：雷神4：爱与雷霆，豆瓣评分：5.4
电影名：天鹅挽歌，豆瓣评分：8.1
电影名：新神榜：杨戬，豆瓣评分：7.0
电影名：海的尽头是草原，豆瓣评分：7.2
电影名：魔法奇缘2：解除魔法，豆瓣评分：6.1
电影名：蜡笔小新：好别致的影分身，豆瓣评分：8.5
电影名：新·奥特曼，豆瓣评分：6.7
电影名：狼狩猎，豆瓣评分：5.8
电影名：余命10年，豆瓣评分：7.1
电影名：看他们如何逃之夭夭，豆瓣评分：6.4
电影名：野蛮人，豆瓣评分：6.8
电影名：妈妈！，豆瓣评分：7.5
电影名：良心护士，豆瓣评分：6.9
电影名：小黄人大眼萌：神偷奶爸前传，豆瓣评分：7.1

python代码如下：

[Python] 纯文本查看 复制代码

import time

from bs4 import BeautifulSoup

import requests





def get_one_page_data():

    global lines

    lines = ''

    global headers

    headers = {

        'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36',

        'referer': 'http://movie.mtime.com/'

    }



    # 获取热门电影列表  UrlDecode解码 %E7%83%AD%E9%97%A8 = 热门

    res = requests.get(

        'https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&page_limit=50&page_start=0',

        headers=headers)

    # print(res.text)

    lines = '最新电影'+ '\r\n'

    for i in range(50):

        title = res.json()['subjects']['title']

        rate = res.json()['subjects']['rate']

        lines = lines + '电影名： ' + title + '， 豆瓣评分：' + rate + '\r\n'



    print(lines)









if __name__ == '__main__':

    get_one_page_data()

作者: hujunchao 时间: 2022-12-17 11:54
为什么复制了代码不能运行后面</i></i> 无法识别

作者: waweiggfnh 时间: 2022-12-18 13:53

hujunchao 发表于 2022-12-17 11:54
为什么复制了代码不能运行后面无法识别

因为精易论坛的这个代码识别有问题，你把尖括号<>改为中括号[]就可以了
作者: 涤尘 时间: 2025-4-11 20:03
感谢分享

欢迎光临精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4