
# Proxies
## Escondiendo la IP
Muchos servidores web, al recibir múltiples peticiones en un corto tiempo de una misma IP, la bloquean para evitar saturaciones y problemas de servicio. Esto puede ser un problema para los scrapers ya que generan justamente este comportamiento.
Para evitar ser detectados tendríamos que cambiar nuestra dirección IP pública antes de cada request, cosa que sería extremadamente lento y en muchos casos imposible, o podemos utilizar un proxy. Un proxy es un intermediario entre quien hace la petición (nuestro programa) y quien la recibe (el servidor) que nos permite enmascarar la IP de donde salió la request. Utilizando un proxy, el servidor web verá la IP de ese proxy y no la nuestra. Si bien no podemos elegir con qué dirección IP hacer la petición, sí podemos elegir a través de qué proxy hacerla.
El sitio www.cualesmiip.com te permite ver cuál es la IP saliente de tu red. Si estás en una LAN, seguramente tu IP local sea algo como 192.18.x.x, pero la IP con la que salís al mundo, la IP de tu router asignada por tu ISP, será diferente.
Links útiles:

* https://free-proxy-list.net/
* PySocks

In [0]:
import requests
import re

In [0]:
def get_my_ip(url='http://www.cualesmiip.com/', proxies=None):
    try:
        r = requests.get(url=url, proxies=proxies)
    except Exception as e:
        print('Error haciendo la request', e)
        return None
    
    if r.status_code != 200:
        print("Status Code:", r.status_code)
        return None
    
    regex = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})')
    my_ip = regex.findall(r.text)
    return my_ip[0] if my_ip else None

In [14]:
get_my_ip()

'34.83.20.102'

In [0]:
proxy_dict = {'http':'http://45.236.88.42:8880',
             'https':'https://45.236.88.42:8880'}

In [21]:
get_my_ip(proxies=proxy_dict)

'45.236.88.42'

In [0]:
socks_proxy_dict = {'http':'socks4://157.230.154.241:9050',
                   'https':'socks4://157.230.154.241:9050'}

In [0]:
get_my_ip(proxies=socks_proxy_dict)