推荐书: Python开发最佳实践

Python教程:[18]urlparse模块

分享时@该用户已经被封, 我就能回答你的问题奥!

使用urlparse模块可以对url进行分析,最主要的操作就是拆分和合并url的各个部件,那么url有哪些部件呢?下图列出了所有的部件。你可能不太理解,不要着急,我们在例子中看看每个部分都代表着什么。

  • 引入urlparse模块,这里只引入了urlparse方法,如果你想要用所有的方法,你需要import urlparse
  • 我们将下面的url地址进行拆解,将拆解的结果存放到parsed中
  • 之后,我们通过parsed的各个属性来访问不同的部分
  • 我们看最后输出的结果:通过这样的方法我们可以快速的对url进行操作
  • 所有的源码都写在下面:

  • from urlparse import urlparse

  • parsed = urlparse(‘url地址’)

  • print ‘scheme :’+ parsed.scheme #网络协议

  • print ‘netloc :’+ parsed.netloc #服务器位置(也可呢能有用户信息)

  • print ‘path :’+ parsed.path #网页文件在服务器中存放的位置

  • print ‘params :’+ parsed.params #可选参数

  • print ‘query :’+ parsed.query #连接符(&)连接键值对

  • print ‘fragment:’+ parsed.fragment #拆分文档中的特殊猫

  • print ‘username:’+ parsed.username #用户名

  • print ‘password:’+ parsed.password #密码

  • print ‘hostname:’+ parsed.hostname #服务器名称或者地址

  • print ‘port :’, parsed.port #端口(默认是80

转载请注明来自DataScience.

邮箱: 675495787@qq.com