本文的例子使用requests下载豆瓣电影Top250排行榜页面的代码,然后使用lxml、XPath和正则表达式对HTML代码进行解析,最后将抓取到的信息保存到SQLite数据库中。
豆瓣电影Top250排行榜页面的URL如下。
https://movie.douban.com/top250
页面效果如图1所示。
豆瓣电影Top250排行榜页面URL的规律与音乐排行榜相同,如第2页、第3页的URL如下:
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
87 篇文章 4 订阅 ¥29.90 ¥99.00
本文的例子使用requests下载豆瓣电影Top250排行榜页面的代码,然后使用lxml、XPath和正则表达式对HTML代码进行解析,最后将抓取到的信息保存到SQLite数据库中。
豆瓣电影Top250排行榜页面的URL如下。
https://movie.douban.com/top250
页面效果如图1所示。
豆瓣电影Top250排行榜页面URL的规律与音乐排行榜相同,如第2页、第3页的URL如下: