cloudscraper

A Python module to bypass Cloudflare's anti-bot page (also known as "I'm Under Attack Mode", or IUAM), implemented with Requests.

Features

Bypasses Cloudflare's anti-bot protection automatically
Supports all Cloudflare challenge types (v1, v2, v3, Turnstile)
Multiple JavaScript interpreters (js2py, nodejs, native)
Browser fingerprint emulation (Chrome, Firefox)
Stealth mode with human-like behavior
Proxy rotation support
Session management and persistence
CAPTCHA solver integration
PyInstaller/executable compatibility

Installation

pip install cloudscraper

Quick Start

import cloudscraper

# Create a CloudScraper instance
scraper = cloudscraper.create_scraper()

# Use it like a regular requests session
response = scraper.get("https://example.com")
print(response.text)

That's it! The scraper will automatically handle any Cloudflare challenges it encounters.

How It Works

Cloudflare's anti-bot protection works by presenting JavaScript challenges that must be solved before accessing the protected content. cloudscraper:

Detects Cloudflare challenges automatically
Solves JavaScript challenges using embedded interpreters
Maintains session state and cookies
Returns the protected content seamlessly

For reference, this is what Cloudflare's protection page looks like:

Checking your browser before accessing website.com.

This process is automatic. Your browser will redirect to your requested content shortly.

Please allow up to 5 seconds...

Dependencies

Python 3.8+
requests >= 2.31.0
js2py >= 0.74 (default JavaScript interpreter)
Additional optional dependencies for enhanced features

JavaScript Interpreters

cloudscraper supports multiple JavaScript interpreters:

js2py (default) - Pure Python implementation
nodejs - Requires Node.js installation
native - Built-in Python solver
ChakraCore - Microsoft's JavaScript engine
V8 - Google's JavaScript engine

Basic Usage

import cloudscraper

# Create scraper instance
scraper = cloudscraper.create_scraper()

# Use like requests
response = scraper.get("https://protected-site.com")
print(response.text)

# Works with all HTTP methods
response = scraper.post("https://protected-site.com/api", json={"key": "value"})

Advanced Configuration

Stealth Mode

Enable stealth techniques for better bypass success:

scraper = cloudscraper.create_scraper(
    enable_stealth=True,
    stealth_options={
        'min_delay': 2.0,
        'max_delay': 5.0,
        'human_like_delays': True,
        'randomize_headers': True,
        'browser_quirks': True
    }
)

Browser Selection

Choose specific browser fingerprints:

# Use Chrome fingerprint
scraper = cloudscraper.create_scraper(browser='chrome')

# Use Firefox fingerprint  
scraper = cloudscraper.create_scraper(browser='firefox')

# Advanced browser configuration
scraper = cloudscraper.create_scraper(
    browser={
        'browser': 'chrome',
        'platform': 'windows',
        'mobile': False
    }
)

JavaScript Interpreter Selection

# Use specific interpreter
scraper = cloudscraper.create_scraper(interpreter='js2py')
scraper = cloudscraper.create_scraper(interpreter='nodejs')
scraper = cloudscraper.create_scraper(interpreter='native')

Proxy Support

# Single proxy
scraper = cloudscraper.create_scraper()
scraper.proxies = {
    'http': 'http://proxy:8080',
    'https': 'http://proxy:8080'
}

# Proxy rotation
proxies = [
    'http://proxy1:8080',
    'http://proxy2:8080',
    'http://proxy3:8080'
]

scraper = cloudscraper.create_scraper(
    rotating_proxies=proxies,
    proxy_options={
        'rotation_strategy': 'smart',
        'ban_time': 300
    }
)

CAPTCHA Solver Integration

For sites with CAPTCHA challenges:

scraper = cloudscraper.create_scraper(
    captcha={
        'provider': '2captcha',
        'api_key': 'your_api_key'
    }
)

Supported CAPTCHA providers:

2captcha
anticaptcha
CapSolver
CapMonster Cloud
deathbycaptcha
9kw

Complete Examples

Basic Web Scraping

import cloudscraper

scraper = cloudscraper.create_scraper()

# Simple GET request
response = scraper.get("https://example.com")
print(response.text)

# POST request with data
response = scraper.post("https://example.com/api", json={"key": "value"})
print(response.json())

Advanced Configuration

import cloudscraper

# Maximum compatibility configuration
scraper = cloudscraper.create_scraper(
    interpreter='js2py',
    delay=5,
    enable_stealth=True,
    stealth_options={
        'min_delay': 2.0,
        'max_delay': 5.0,
        'human_like_delays': True,
        'randomize_headers': True
    },
    browser='chrome',
    debug=True
)

response = scraper.get("https://protected-site.com")

Session Management

import cloudscraper

scraper = cloudscraper.create_scraper()

# Login to a site
login_data = {'username': 'user', 'password': 'pass'}
scraper.post("https://example.com/login", data=login_data)

# Make authenticated requests
response = scraper.get("https://example.com/dashboard")

Troubleshooting

Common Issues

Challenge solving fails:

# Try different interpreter
scraper = cloudscraper.create_scraper(interpreter='nodejs')

# Increase delay
scraper = cloudscraper.create_scraper(delay=10)

# Enable debug mode
scraper = cloudscraper.create_scraper(debug=True)

403 Forbidden errors:

# Enable stealth mode
scraper = cloudscraper.create_scraper(
    enable_stealth=True,
    auto_refresh_on_403=True
)

Slow performance:

# Use faster interpreter
scraper = cloudscraper.create_scraper(interpreter='native')

Debug Mode

Enable debug mode to see what's happening:

scraper = cloudscraper.create_scraper(debug=True)
response = scraper.get("https://example.com")

# Debug output shows:
# - Challenge type detected
# - JavaScript interpreter used  
# - Challenge solving process
# - Final response status

Configuration Options

Common Parameters

Parameter	Type	Default	Description
`debug`	boolean	False	Enable debug output
`delay`	float	auto	Override challenge delay
`interpreter`	string	'js2py'	JavaScript interpreter
`browser`	string/dict	None	Browser fingerprint
`enable_stealth`	boolean	True	Enable stealth mode
`allow_brotli`	boolean	True	Enable Brotli compression

Challenge Control

Parameter	Type	Default	Description
`disableCloudflareV1`	boolean	False	Disable v1 challenges
`disableCloudflareV2`	boolean	False	Disable v2 challenges
`disableCloudflareV3`	boolean	False	Disable v3 challenges
`disableTurnstile`	boolean	False	Disable Turnstile

Session Management

Parameter	Type	Default	Description
`session_refresh_interval`	int	3600	Session refresh time (seconds)
`auto_refresh_on_403`	boolean	True	Auto-refresh on 403 errors
`max_403_retries`	int	3	Max 403 retry attempts

Example Configuration

scraper = cloudscraper.create_scraper(
    debug=True,
    delay=5,
    interpreter='js2py',
    browser='chrome',
    enable_stealth=True,
    stealth_options={
        'min_delay': 2.0,
        'max_delay': 5.0,
        'human_like_delays': True
    }
)

Utility Functions

Get Tokens

Extract Cloudflare cookies for use in other applications:

import cloudscraper

# Get cookies as dictionary
tokens, user_agent = cloudscraper.get_tokens("https://example.com")
print(tokens)
# {'cf_clearance': '...', '__cfduid': '...'}

# Get cookies as string
cookie_string, user_agent = cloudscraper.get_cookie_string("https://example.com")
print(cookie_string)
# "cf_clearance=...; __cfduid=..."

Integration with Other Tools

Use cloudscraper tokens with curl or other HTTP clients:

import subprocess
import cloudscraper

cookie_string, user_agent = cloudscraper.get_cookie_string('https://example.com')

result = subprocess.check_output([
    'curl',
    '--cookie', cookie_string,
    '-A', user_agent,
    'https://example.com'
])

License

MIT License. See LICENSE file for details.

Contributing

Contributions are welcome! Please feel free to submit a Pull Request.

Disclaimer

This tool is for educational and testing purposes only. Always respect website terms of service and use responsibly.

Name		Name	Last commit message	Last commit date
Latest commit History 316 Commits
.github		.github
cloudscraper		cloudscraper
examples		examples
.gitignore		.gitignore
.pypirc		.pypirc
CHANGELOG.md		CHANGELOG.md
CLEANUP_REPORT.md		CLEANUP_REPORT.md
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

License

SoulMelody/cloudscraper

Folders and files

Latest commit

History

Repository files navigation

cloudscraper

Features

Installation

Quick Start

How It Works

Dependencies

JavaScript Interpreters

Basic Usage

Advanced Configuration

Stealth Mode

Browser Selection

JavaScript Interpreter Selection

Proxy Support

CAPTCHA Solver Integration

Complete Examples

Basic Web Scraping

Advanced Configuration

Session Management

Troubleshooting

Common Issues

Debug Mode

Configuration Options

Common Parameters

Challenge Control

Session Management

Example Configuration

Utility Functions

Get Tokens

Integration with Other Tools

License

Contributing

Disclaimer

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages