python获取NLPIR网站数据
有个自然语言处理的人工智能网站特别有意思,还能快速生成可视化图表,推荐给大家:http://ictclas.nlpir.org/nlpir/
如何爬取这个网站隐藏在背后的数据呢?
我这里演示一下联想词数据的爬取:
创新互联建站专注于企业成都营销网站建设、网站重做改版、鄂州网站定制设计、自适应品牌网站建设、H5场景定制、商城网站建设、集团公司官网建设、成都外贸网站建设公司、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为鄂州等各大城市提供网站开发制作服务。
import requests,json
content=str(input('请输入要查询的文本:'))
url='http://ictclas.nlpir.org/nlpir/index6/getWord2Vec.do'
headers={
'Referer': 'http://ictclas.nlpir.org/nlpir/',
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
data={
'content': content
}
res=requests.post(url,headers=headers,data=data)
res_dic=json.loads(res.text)
w2vlist=res_dic['w2vlist']
for i in range(10):
word=w2vlist[i]
print(word)
这个网站的可视化功能也很强大,一键生成美丽图表~
这是快速生成词云图,用python的话比较麻烦一些,好处是可以进行个性化修改。如果没有太高要求的话,nlpir网站完全可以胜任:
还有很多可视化图表,小伙伴们可以去尝试一下:
网页标题:python获取NLPIR网站数据
分享路径:http://pwwzsj.com/article/gppjoe.html