urlparse模块(python模块)-创新互联

一、urlparse模块简介

创新互联是一家专业提供津市企业网站建设,专注与成都做网站、网站建设、HTML5、小程序制作等业务。10年已为津市众多企业、政府机构等服务。创新互联专业网络公司优惠进行中。    urlparse模块主要是把url拆分为6部分,并返回元组。并且可以把拆分后的部分再组成一个url。主要有函数有urljoin、urlsplit、urlunsplit、urlparse等。

二、urljoin函数使用

    urljoin主要是拼接URL,它以base作为其基地址,然后与url中的相对地址相结合组成一个绝对URL地址。函数urljoin在通过为URL基地址附加新的文件名的方式来处理同一位置处的若干文件的时候格外有用。需要注意的是,如果基地址并非以字符/结尾的话,那么URL基地址最右边部分就会被这个相对路径所替换。如果希望在该路径中保留末端目录,应确保URL基地址以字符/结尾。

输入代码:

import urlparse

#urljoin函数是合并域名和相对路径的
urljoin = urlparse.urljoin('http://www.sina.cn/cc','file/down.php')
print urljoin

urljoin1 = urlparse.urljoin('http://www.sina.cn/cc/','file/down.php')
print urljoin1

代码运行结果:

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php

三、urlparse函数和urlsplit函数使用

  主要是分析urlstring,返回一个包含5个字符串项目的元组:协议、位置、路径、查询、片段。allow_fragments为False时,该元组的组后一个项目总是空,不管urlstring有没有片段,省略项目的也是空。urlsplit()和urlparse()差不多

输入代码:

import urlparse

url = 'http://www.baidu.com/good/index.php?id=18'

#urlsplit函数是把一个url查分出对应部分
result = urlparse.urlsplit(url)
print result
#显示协议
print result.scheme
#显示域名
print result.netloc
#显示相对路径
print result.path
#显示查询参数
print result.query

代码运行结果:

C:\Python27\python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

SplitResult(scheme='http', netloc='www.baidu.com', path='/good/index.php', query='id=18', fragment='')

http

www.baidu.com

/good/index.php

id=18

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


本文名称:urlparse模块(python模块)-创新互联
当前网址:http://pwwzsj.com/article/doicph.html