[原]Python爬虫编程思想(87):项目实战--抓取豆瓣电影排行榜
2021-11-28 23:35:00 Author: blog.csdn.net(查看原文) 阅读量:42 收藏

蒙娜丽宁 2021-11-28 22:35:00 1 收藏

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

87 篇文章 4 订阅 ¥29.90 ¥99.00

        本文的例子使用requests下载豆瓣电影Top250排行榜页面的代码,然后使用lxml、XPath和正则表达式对HTML代码进行解析,最后将抓取到的信息保存到SQLite数据库中。

豆瓣电影Top250排行榜页面的URL如下。

https://movie.douban.com/top250

页面效果如图1所示。

豆瓣电影Top250排行榜页面URL的规律与音乐排行榜相同,如第2页、第3页的URL如下:


文章来源: https://blog.csdn.net/nokiaguy/article/details/121599342
如有侵权请联系:admin#unsafe.sh