Android端解析html文件-创新互联
使用的是 net.htmlparesr.jericho.Source;包中的Source,需要导入jaricho-html-3.1.jar的外部jar包
当前文章:Android端解析html文件-创新互联
文章转载:http://pwwzsj.com/article/discps.html
一下为用这个包解析豆瓣网站的验证码的代码
我们提供的服务有:成都网站建设、成都网站制作、微信公众号开发、网站优化、网站认证、铁力ssl等。为上千余家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务,是有科学管理、有技术的铁力网站制作公司 1 URL url = new URL("http://www.douban.com/accounts/login");
2 URLConnection conn = url.openConnection();
3 //得到服务器返回的html连接 转化成的html的对象 4 Source source = new Source(conn);
5
6 List inputElements = source.getAllElements("input");
7 for(Element input: inputElements){
8 if("captcha-id".equals(input.getAttributeValue("name"))){
9 String id = input.getAttributeValue("value");
10 String path = "http://www.douban.com/misc/captcha?id="+id+"&size=s";
11 System.out.println("验证码图片的地址为:"+path);
12 }
13 }
当前文章:Android端解析html文件-创新互联
文章转载:http://pwwzsj.com/article/discps.html