python访问百度关键词和链接 - HelloWorld开发者社区

前几天在Python交流群有个同学分享了一份Python网络爬虫代码，用来获取某度关键词和链接的。其实这个需求之前我也写过代码，不过网页结构变化之后，之前的提取器已经失效了，所以代码就作废了。今天这里给再给大家分享一个使用python获取某度关键词的实践。由于某度也是设置反爬安全策略的，所有同一IP下程序运行次数多了也是会被封IP的，所有在访问过程中我们需要加上代理IP，这里推荐使用亿牛云代理。具体的实现方式如下：#! -- encoding:utf-8 --

import requests
import random

# 要访问的目标页面
targetUrl = "http://httpbin.org/ip"

# 要访问的目标HTTPS页面
# targetUrl = "https://httpbin.org/ip"

# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"

# 代理验证信息
proxyUser = "username"
proxyPass = "password"

proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
    "host" : proxyHost,
    "port" : proxyPort,
    "user" : proxyUser,
    "pass" : proxyPass,
}

# 设置 http和https访问都是用HTTP代理
proxies = {
    "http"  : proxyMeta,
    "https" : proxyMeta,
}


#  设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}



resp = requests.get(targetUrl, proxies=proxies, headers=headers)

print resp.status_code
print resp.text今天就只简单的分享下使用python访问百度关键词的示例，之后会给给大家分享使用bs4等方式来来提取百度关键词和链接，也欢迎大家积极尝试，一起学习。若有收获，就点个赞吧

Android进阶之旅-(NDK实战篇之C/C++进阶)

Android进阶之旅-(NDK实战篇之数据结构算法进阶)

热门文章