# Proxies
## Escondiendo la IP
Muchos servidores web, al recibir múltiples peticiones en un corto tiempo de una misma IP, la bloquean para evitar saturaciones y problemas de servicio. Esto puede ser un problema para los scrapers ya que generan justamente este comportamiento.<br>
Para evitar ser detectados tendríamos que cambiar nuestra dirección IP pública antes de cada request, cosa que sería extremadamente lento y en muchos casos imposible, o podemos utilizar un **proxy**. Un proxy es un intermediario entre quien hace la petición (nuestro programa) y quien la recibe (el servidor) que nos permite enmascarar la IP de donde salió la request. Utilizando un proxy, el servidor web verá la IP de ese proxy y no la nuestra. Si bien no podemos elegir con qué dirección IP hacer la petición, sí podemos elegir a través de qué proxy hacerla.<br>
El sitio www.cualesmiip.com te permite ver cuál es la IP saliente de tu red. Si estás en una LAN, seguramente tu IP local sea algo como 192.18.x.x, pero la IP con la que salís al mundo, la IP de tu router asignada por tu ISP, será diferente.<br>
Links útiles:
- https://free-proxy-list.net/
- [PySocks](https://pypi.org/project/PySocks/)

In [15]:
import requests
import re

In [16]:
def get_my_ip(url='http://www.cualesmiip.com/', proxies=None):
    try:
        r = requests.get(url=url, proxies=proxies)
    except Exception as e:
        print('Error haciendo la request', e)
        return None

    if r.status_code != 200:
        print("Status Code:", r.status_code)
        return None

    regex = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})')
    my_ip = regex.findall(r.text)
    return my_ip[0] if my_ip else None

In [17]:
get_my_ip()

'092.092.212.137'

In [18]:
proxy_dict = {'http': 'http://107.150.37.82:3128',
              'https': 'https://54.165.67.102:8080'}

In [19]:
get_my_ip(proxies=proxy_dict)

Error haciendo la request HTTPConnectionPool(host='107.150.37.82', port=3128): Max retries exceeded with url: http://www.cualesmiip.com/ (Caused by ProxyError('Cannot connect to proxy.', NewConnectionError('<urllib3.connection.HTTPConnection object at 0x0728EFF0>: Failed to establish a new connection: [WinError 10060] Se produjo un error durante el intento de conexión ya que la parte conectada no respondió adecuadamente tras un periodo de tiempo, o bien se produjo un error en la conexión establecida ya que el host conectado no ha podido responder')))


In [20]:
socks_proxy_dict = {'http': 'socks4://222.165.194.68:50486',
                    'https': 'socks4://110.34.166.187:4153'}

In [21]:
get_my_ip(proxies=socks_proxy_dict)

Error haciendo la request Missing dependencies for SOCKS support.
