怎么用python爬取喜马拉雅全站音频
喜马拉雅FM是一个知名的音频分享平台,在移动音频行业的市场占有率已达73%,用户规模突破4.8亿,今晚我们就带大家突破层层障碍,探秘喜马拉雅的天籁之音,实现实时抓捕并保存到本地。
在湖滨等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供网站设计制作、成都网站建设 网站设计制作按需求定制开发,公司网站建设,企业网站建设,成都品牌网站建设,全网整合营销推广,成都外贸网站建设,湖滨网站建设费用合理。
开发环境:Windows 、pycharm 、 requests 、 json
知识点:
1、网络反爬技术
2、文件操作
3、数据转换
4、字典、字符串、列表数据类型的使用
同样,我们要求使用火狐浏览器或者Google浏览器;我们接下来要确定几件事:
1、确定网址(喜马拉雅网址)
2、网络请求获取数据(点开我们想要的音频)
3、数据筛选(筛选我们想要的音频)
4、保存数据(保存我们需要的音频)
部分程序如下:
url = “https://www.ximalaya.com/revision/play/album?albumId=291718&psgeNum=1&sort=1&page”
response = requests.get(url,headers=header).text
audio_data = json.loads(response)[“data”][“tracksAudioPlay”]
for audio_in in audio_data:
music_url = audio_info[“src”]
“https://fdfs.xmcdn.com/group61/M05/70/C1/wKgMcFoJCZuw9cSkAB9RrgvYaVU283.m4a”
music_name = music_url.split(“/”)[-1]
.....
完整视频关注公众号(自学的仙叔)或者扫描下面二维码,在公众号中回复“喜马拉雅”拿取资源。
本文分享自微信公众号 - 自学的仙叔(gh_3de5e20d92e5)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
网页题目:怎么用python爬取喜马拉雅全站音频
本文路径:http://pwwzsj.com/article/jshipg.html