`
mushme
  • 浏览: 788506 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

获取可用的代理服务器

 
阅读更多
1.找到一个可用的代理服务器源
2.验证并找出可用的代理服务器
以下用python语言编写

从http://www.xicidaili.com/nn/1抓取到代理服务器地址
这个网上说的是高匿,实际不是的,原来的ip还是会被forward过去的。
将代理信息抓取保存到proxy.txt里
#encoding=utf8
import urllib
import urllib.request
import http.cookiejar
from bs4 import BeautifulSoup

User_Agent = 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0'
header = {}
header['User-Agent'] = User_Agent
hosturl = 'http://www.xicidaili.com/nn/1'

request = urllib.request.Request(hosturl, None, header)
response = urllib.request.urlopen(request)
htmldata = response.read()
soup = BeautifulSoup(htmldata,"html.parser")
ips = soup.findAll('tr')
f = open("proxy.txt","w")

for x in range(1,len(ips)):
    ip = ips[x]
    tds = ip.findAll("td")
    ip_temp = tds[6].contents[0].lower()+"\t"+tds[2].contents[0]+"\t"+tds[3].contents[0]+"\n"
    f.write(ip_temp)


读取proxy.txt,并验证,将可以使用的代理信息保存到proxy-tested.txt里
#encoding=utf8
import urllib
import urllib.request
import socket
socket.setdefaulttimeout(3)
f = open("proxy.txt")
lines = f.readlines()
proxys = []
fo = open("proxy-tested.txt","w")
for i in range(0,len(lines)):
    ip = lines[i].strip("\n").split("\t")
    proxy_host = str(ip[0])+"://"+ip[1]+":"+ip[2]
    proxy_temp = {str(ip[0]):proxy_host}
    proxys.append(proxy_temp)
index=0;
for proxy in proxys:
    index=index+1
    print("index:"+str(index))
    try:
        proxy_support = urllib.request.ProxyHandler(proxy)
        opener = urllib.request.build_opener(proxy_support)
        urllib.request.install_opener(opener)
        response=urllib.request.urlopen("http://ip.chinaz.com/getip.aspx").read()

        for i in proxy:
            ip_temp = proxy[i].split(":")[0]+"\t"+proxy[i].split(":")[1][2:]+"\t"+proxy[i].split(":")[-1]+"\n"
            fo.write(ip_temp)
        print("success:"+str(proxy)+"result:"+str(response))
    except Exception as e:
        print("error:"+str(proxy))
        print(e)
        continue 
1
1
分享到:
评论

相关推荐

    通过代理服务器网站获取代理服务器IP

    5. **验证代理服务器**:获取到IP后,还需要验证它们是否可用。这可以通过发送请求并检查响应来实现,比如发送一个简单的HTTP HEAD请求。同时,也要测试代理的速度和匿名性。 6. **存储和管理**:最后,将验证过的...

    全球网络代理服务器精灵

    自动获取功能意味着用户无需手动搜索代理服务器,程序会定期更新可用的代理列表。自动查询功能则是检查这些代理的连通性和速度,确保用户能够获得高效稳定的代理服务。自动验证环节则进一步验证了这些代理的匿名性,...

    轻松设置代理(EasyProxy) 是一个非常简单易用的代理服务器搜索及验证软件

    【轻松设置代理(EasyProxy)】是一款专为用户设计的高效代理服务器搜索和验证工具,其主要功能在于帮助用户快速找到可用的代理服务器,并确保这些代理服务器的稳定性和安全性。在IT领域,代理服务器扮演着重要的...

    ProxyFinder2.2beta代理服务器搜索者

    ProxyFinder 2.2 beta 是一款专用于搜索和获取免费代理服务器的软件工具。它能够帮助用户在网络上自动扫描并找到可用的代理服务器,以便在访问互联网时提供匿名性或者突破某些网络限制。代理服务器在日常的网络活动...

    代理IP获取器

    在IT行业中,代理IP(代理Internet Protocol)是一种网络通信技术,它允许设备通过另一台服务器(代理服务器)来访问互联网,从而隐藏真实的IP地址。这种技术有多种用途,包括提高网络安全、匿名浏览、数据抓取以及...

    VC 代理服务器嗅探器.rar

    “VC 代理服务器嗅探器”这个项目,其主要功能是在网络上搜索可用的代理服务器地址,并将这些地址显示在程序的网格控件中。网格控件是常见的用户界面元素,可以方便地展示数据表格形式的信息。根据描述,该工具曾经...

    【确认好用】优易代理服务器IP自动更新软件

    总的来说,这款“优易代理服务器IP自动更新软件”是一款高效、便捷的工具,专为需要频繁使用代理服务器的用户设计,它能自动获取和更新代理IP,提供稳定的服务,并有针对Windows 7的特别支持,大大简化了用户管理...

    HLS流媒体服务器代理

    4. **负载均衡**:代理服务器可以用于负载均衡,将请求分散到多个源服务器,提高服务的稳定性和效率。 5. **安全控制**:代理服务器还可以用于实施访问控制,如鉴权、防盗链等,保护流媒体内容的安全。 6. **内容...

    易语言无忧代理获取

    3. **代理服务器的获取**:无忧代理获取意味着需要动态地寻找可用的代理服务器。这可能涉及到爬虫技术,从网上抓取公开的代理列表,或者使用第三方API服务获取。抓取时要注意遵守网站的使用条款,并处理可能出现的...

    dellmib库snmp获取dell服务器信息的

    通过熟练掌握和运用Dell MIB库,你可以实时获取到Dell服务器的关键信息,及时发现和预防可能出现的问题,提高系统的稳定性和可用性。对于IT管理员来说,这是一项必不可少的技能,能够显著提升网络管理的效率。

    获取在线http/https代理并验证可用性python脚本

    自动从在线平台获取免费代理ip,可自定义获取条数,并自动对获取ip进行可用性验证检查

    代理ip获取器

    1. 自动搜集:该工具能够自动在网络上搜索可用的代理IP资源,这些资源可能来自免费或付费的代理服务器列表。 2. 验证有效性:获取到的代理IP需要经过验证,确保它们能够正常工作,例如支持HTTP、HTTPS协议,或者支持...

    获取代理ip地址

    在IT行业中,代理IP地址是一种常见的网络访问策略,它允许用户通过第三方服务器(代理服务器)进行网络通信,以隐藏原始IP地址或者增加访问速度。"获取代理ip地址"这个主题涉及了如何自动化地找到可用的代理IP地址...

    代理ip地址获取(可导出)

    代理IP获取的过程通常包括从各种在线资源抓取数据,如免费或付费的代理服务器列表网站、API接口等。这些代理IP可能分为不同类型,如HTTP、HTTPS、SOCKS4或SOCKS5,每种类型有不同的协议和使用方式。用户在实际应用中...

    代理IP扫描-代理IP获取器

    代理IP的工作原理是,当用户的设备请求访问某个网站时,请求会首先发送到代理服务器,由代理服务器代替用户向目标网站发起请求,并将返回的结果转发给用户。这样,目标网站看到的IP地址是代理服务器的,而不是用户的...

    搭建APT代理服务器.pdf

    ### 搭建APT代理服务器知识点详解 #### 一、APT代理服务器概述 APT代理服务器是一种专门为局域网内多台Ubuntu Linux系统提供软件包安装与更新服务的解决方案。通过集中下载并缓存软件包,它能显著提高局域网内...

    动态代理IP获取.rar

    在IT行业中,动态IP代理是一种常见的网络技术,它允许用户通过第三方服务器的IP地址来访问互联网,以此隐藏真实的IP地址,提升网络安全或者实现多账号管理等目的。本项目"动态代理IP获取.rar"是一个基于C#语言开发的...

    CDN中的代理服务器放置算法

    ### CDN中的代理服务器放置算法 #### 一、引言 随着互联网技术的快速发展,人们越来越依赖于网络来获取信息和娱乐资源。然而,在这个过程中,网络拥堵和带宽瓶颈成为了限制用户体验的主要因素之一。为了解决这些...

    代理IP获取2.0(可导出测速收藏设置)

    通过程序,用户可以快速地收集到大量的可用代理IP,这些IP可以用于各种目的,如网络爬虫、数据抓取、匿名浏览等。获取到的IP地址会以列表的形式呈现,用户一目了然,便于筛选和选择。 其次,新增的导出功能是此版本...

Global site tag (gtag.js) - Google Analytics