对python抓取需要登录网站数据的方法详解-创新互联

scrapy.FormRequest

创新互联成立与2013年,先为东源等服务建站,东源等地企业,进行企业商务咨询服务。为东源企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

login.py

class LoginSpider(scrapy.Spider):
 name = 'login_spider'
 start_urls = ['http://www.login.com']
 def parse(self, response):
  return [
   scrapy.FormRequest.from_response(
     response,
     # username和password要根据实际页面的表单的name字段进行修改
     formdata={'username': 'your_username', 'password': 'your_password'},
     callback=self.after_login)]
 def after_login(self, response):
  # 登录后的代码
  pass

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


名称栏目:对python抓取需要登录网站数据的方法详解-创新互联
当前地址:http://pwwzsj.com/article/cdijdp.html