Proxy

A tiny tool for crawling, assessing, storing some useful proxies.中文版

Construct your ip pool

Install mysql:

pip install pymysql requests

Modify db connection information in config.py.

# crawl, assess and store proxies
python ip_pool.py

# assess proxies quality in db periodically.
python assess_quality.py

Demo on how to use these proxies.

Please first construct your ip pool.

Crawl github homepage data:

# visit database to get all proxies
ip_list = []
try:
    cursor.execute('SELECT content FROM %s' % cfg.TABLE_NAME)
    result = cursor.fetchall()
    for i in result:
        ip_list.append(i[0])
except Exception as e:
    print e
finally:
    cursor.close()
    conn.close()

# use this proxies to crawl website
for i in ip_list:
    proxy = {'http': 'http://'+i}
    url = "https://www.github.com/"
    r = requests.get(url, proxies=proxy, timeout=4)
    print r.text

More detail in crawl_demo.py。

Contact

myfancoo@qq.com

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
images		images
README.MD		README.MD
README.zh-cn.md		README.zh-cn.md
assess_quality.py		assess_quality.py
config.py		config.py
crawl_demo.py		crawl_demo.py
ip_pool.py		ip_pool.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Proxy

Construct your ip pool

Demo on how to use these proxies.

Contact

About

Releases

Packages

Languages

mazzzystar/Proxy

Folders and files

Latest commit

History

Repository files navigation

Proxy

Construct your ip pool

Demo on how to use these proxies.

Contact

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages