分享Python网络爬虫过程中编码和解码的一个库

Python进阶者
• 阅读 276

大家好,我是皮皮。

一、前言

前几天在Python白银钻石群【海南菜同学】问了一个Python编码的问题,提问截图如下:

分享Python网络爬虫过程中编码和解码的一个库

原始代码如下:

/show_contract.html?back=%2Fwssc%2Fcontracts.html&contract_id=100934

编码截图如下图所示:

分享Python网络爬虫过程中编码和解码的一个库

二、实现过程

一开始以为不是编码,后来【此类生物】直接看出来了,太强了。

分享Python网络爬虫过程中编码和解码的一个库

其实关于字符串的编码和解码,Python中有个专门的urllib库,【error】分享了它的两个非常重要的方法,分别是编码和解码,如下图所示:

分享Python网络爬虫过程中编码和解码的一个库

所以针对上文中发出来的链接进行解码,得到的就是2个斜杆,如下图所示:

分享Python网络爬虫过程中编码和解码的一个库

原来这个东东在web开发的时候还是蛮常见的呢。

分享Python网络爬虫过程中编码和解码的一个库

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫过程中编码和解码的问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【海南菜同学】提问,感谢【此类生物】、【甯同学】、【error】给出的思路和代码解析,感谢【dcpeng】、【提请问粘给图截报错贴代源码】等人参与学习交流。

点赞
收藏
评论区
推荐文章
Python进阶者 Python进阶者
1年前
我想的是将Date那一列转换成时间格式,怎么破?
大家好,我是皮皮。一、前言前几天在Python白银交流群【Joker】问了一个Pandas处理字符串的问题,提问截图如下:二、实现过程这里【甯同学】给了一个代码,示例代码如下所示:importpandasaspddfpd.readexcel('S当然了,这
Python进阶者 Python进阶者
1年前
盘点一个Python网络爬虫实战问题
大家好,我是皮皮。一、前言前几天在Python钻石交流群【海南菜同学】问了一个Python网络爬虫的选择器提取问题,下图是截图:代码初步看上去好像没啥问题,但是结果就是不对。fromlxmlimportetreeimportrequestsurl"http://zw.hainan.gov.cn/wssc/emalls.html"headers
Python进阶者 Python进阶者
1年前
盘点一个Python网络爬虫过程中中文乱码的问题
大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫中文乱码的问题,提问截图如下:原始代码如下:importrequestsimportparselurl'https://news.p2peye.com/article5147231.html'headers'AcceptLanguage':'zhCN,zh;q
Python进阶者 Python进阶者
1年前
练习爬虫,我想问一下这个xpath语句为啥找不到元素,感谢大佬!
大家好,我是皮皮。一、前言前几天在Python钻石交流群【萤火】问了一个Python网络爬虫的问题,下图是截图:下图是报错截图:二、实现过程这里【error】给了一个代码,如下所示,满足粉丝的需求:用selenium没找到的话,大概率是网页还没渲染出来,代码就运行到了抓取规则,所以抓不到。其实他的匹配规则是可以拿到数据的,只不过用jupyter运行sel
Python进阶者 Python进阶者
1年前
盘点Python网络爬虫过程中xpath的联合查询定位一个案例
大家好,我是皮皮。一、前言前几天在Python钻石交流群【髙鵬】问了一个Python网络爬虫的问题,提问截图如下:原始代码如下:importtimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportBydriverwebdriver.Chrome()drive
Python进阶者 Python进阶者
1年前
Python网络爬虫过程中这个selenium对应的火狐驱动怎么用不了?
大家好,我是皮皮。一、前言前几天在Python最强王者交流群【孤独】问了一个Python网络爬虫处理的问题,提问截图如下:报错截图如下:二、实现过程这里【隔壁山楂】、【此类生物】都看到真实路径和代码中写的不匹配,导致没找到对应的驱动。其实针对驱动选择,常用的方法就是将驱动加入到环境变量,一劳永逸。这里【瑜亮老师】、【此类生物】也指出使用绝对路径去加载驱动
Python进阶者 Python进阶者
1年前
我想在一段文字中扣出关键字附近前后30个字,用正则怎么写?
大家好,我是Python进阶者。一、前言前几天在Python白银交流群【此类生物】问了一个Python数据提取的问题,提问截图如下:!(https://uploadimages.jianshu.io/upload_images/2
Python进阶者 Python进阶者
1年前
我这有个数据集,向取出每天每个国家确诊数量前30的数据,使用Pandas如何实现?
大家好,我是皮皮。一、前言前几天在Python最强王者交流群【此类生物】问了一个Pandas处理的问题,提问截图如下:部分数据截图如下所示:二、实现过程这里【隔壁😼山楂】和【瑜亮老师】纷纷提出,先不聚合location列就可以了。这里【隔壁😼山楂】提供
Python进阶者 Python进阶者
1年前
盘点一个Python中列表合并的问题
大家好,我是Python进阶者。一、前言前几天在Python钻石交流群【海南菜同学】问了一个Python列表合并的问题,提问截图如下:原始代码如下:def cppi():    list1  二、实现过程这里【瑜亮老师】给出了具体的思路,如果两个列表中元素个数相同,可以用zip,然后join,如下所示。最后给了一份代码如下所示:a顺利地解决了粉丝的问题。最后
Python进阶者 Python进阶者
10个月前
Pyecharts是空白的不出图,怎么肥四?
大家好,我是皮皮。一、前言前几天在Python白银群【Lannozhang】问了一个Python作图的问题,这里拿出来给大家分享下。他的代码截图如下:二、实现过程这里【论草莓如何成为冻干莓】、【此类生物】指出拿到的数据需要强转为int类型才可以。其实他本身