手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性,庆幸的是发现了一个python爬虫可以在电脑上实行批零下载文件名正确的音频,项目地址如下:
xmlyfetcher用于下载喜马拉雅歌曲资源,可以下载单个音频资源,也可以下载整个专辑. 项目地址:https://github.com/smallmuou/xmlyfetcher
运行之后发现一个小问题,该脚本只能爬取一页的内容,于是写了一个perl脚本循环调用该爬虫,实现一个脚本下载一部作品。
脚本如下,运行前做适当修改(专辑地址、保存路径、页数):
1 |
|