# Create a virtual environment using venv or virtualenv

In [6]:
!python3 -m venv env


# Cambiar al entorno virtual


![Alt text](image.png)
![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

![image.png](attachment:image.png)

Beautiful Soup es una biblioteca de Python ampliamente utilizada para extraer datos de documentos HTML y XML. Proporciona una forma fácil de analizar y extraer información de una página web.

Aquí tienes una guía básica para comenzar a utilizar Beautiful Soup:

1. Instalación: Asegúrate de tener Beautiful Soup instalado en tu entorno virtual. Puedes instalarlo ejecutando el siguiente comando en tu terminal:

   ```
   pip install beautifulsoup4
   ```

2. Importación: En tu script de Python, importa las clases y funciones necesarias de Beautiful Soup. Puedes hacerlo utilizando la siguiente línea de código:

   ```python
   from bs4 import BeautifulSoup
   ```

3. Obtención del contenido HTML: Beautiful Soup necesita el contenido HTML de la página web que deseas analizar. Puedes obtener este contenido de varias formas, como descargar una página web utilizando la biblioteca `requests` o leyendo un archivo HTML local. Asegúrate de tener el contenido HTML disponible antes de continuar.

4. Creación del objeto BeautifulSoup: Una vez que tengas el contenido HTML, crea un objeto BeautifulSoup pasando el contenido y el tipo de parser que deseas utilizar. Beautiful Soup admite varios parsers, como el parser incorporado `html.parser` y los parsers externos como `lxml` y `html5lib`. Aquí hay un ejemplo:

   ```python
   # Supongamos que tienes el contenido HTML almacenado en la variable "html_content"
   soup = BeautifulSoup(html_content, 'html.parser')
   ```

5. Navegación y extracción de datos: Una vez que tienes el objeto BeautifulSoup, puedes utilizar sus métodos y atributos para navegar y extraer los datos que necesitas. Algunas operaciones comunes incluyen:

   - Buscar elementos por etiqueta: Puedes utilizar el método `find()` o `find_all()` para buscar elementos por etiqueta. Por ejemplo, para encontrar todos los elementos `<a>` en el documento, puedes usar:

     ```python
     links = soup.find_all('a')
     ```

   - Acceder a los atributos de los elementos: Puedes acceder a los atributos de un elemento utilizando la notación de diccionario o el método `get()`. Por ejemplo, para obtener el valor del atributo `href` de un enlace, puedes hacer:

     ```python
     href = link['href']
     # O también puedes usar:
     href = link.get('href')
     ```

   - Acceder al contenido de los elementos: Puedes acceder al contenido de un elemento utilizando la propiedad `text` o el método `get_text()`. Por ejemplo, para obtener el texto dentro de un elemento `<h1>`, puedes hacer:

     ```python
     heading_text = h1.text
     # O también puedes usar:
     heading_text = h1.get_text()
     ```

   Estos son solo algunos ejemplos básicos de las operaciones que puedes realizar con Beautiful Soup. Puedes consultar la documentación oficial de Beautiful Soup para obtener más información sobre sus capacidades y funcionalidades adicionales.

Recuerda que cuando estés realizando scraping web, asegúrate de cumplir con los términos de servicio del sitio web que estás analizando y respeta las políticas de uso responsable de datos.

In [7]:
!pip install requests
!pip install beautifulsoup4



In [8]:
import requests
from bs4 import BeautifulSoup

# Realizar la solicitud HTTP GET a la página
url = "https://www.bbc.com/news"
response = requests.get(url)

# Crear el objeto BeautifulSoup
soup = BeautifulSoup(response.content, 'html.parser')

# Encontrar los elementos de noticias en la página
articles = soup.find_all('div', class_='gs-c-promo')

# Imprimir los títulos y enlaces de las noticias
for article in articles:
    title = article.find('h3').text.strip()
    link = article.find('a')['href']
    print("Título:", title)
    print("Enlace:", link)
    print()


Título: Russia strikes Ukraine grain after ending sea deal
Enlace: /news/world-europe-66242446

Título: US soldier in N Korea was held after fights in Seoul
Enlace: /news/world-asia-66219603

Título: What we know so far about Travis King's detention
Enlace: /news/world-asia-66240928

Título: Deadly shooting in Auckland hours before World Cup
Enlace: /news/world-asia-66252727

Título: Top US college to end family and donor admissions
Enlace: /news/world-us-canada-66249601

Título: Oppenheimer is a 'flat-out masterpiece' ★★★★★
Enlace: https://www.bbc.com/culture/article/20230719-a-magnificent-story-of-a-tragic-american-genius

Título: Tropical Storm Calvin threatens Hawaii's Big Island
Enlace: /news/world-us-canada-66248104

Título: Video appears to show Prigozhin for first time since mutiny
Enlace: /news/world-europe-66249551

Título: Trump loses retrial bid in E Jean Carroll case
Enlace: /news/world-us-canada-66249529

Título: European outcry forces US economist to drop top job
Enlace:

Beautiful Soup es una herramienta valiosa en la ciencia de datos, especialmente cuando se trata de realizar tareas de web scraping y extracción de datos de páginas web. Aquí tienes algunas razones por las cuales Beautiful Soup es importante en la ciencia de datos:

1. Extracción de datos estructurados: Beautiful Soup facilita la extracción de datos estructurados de páginas web. Puedes utilizar sus métodos y atributos para buscar y filtrar elementos HTML específicos, extraer texto, obtener atributos y acceder a la estructura de un documento web.

2. Web scraping: Beautiful Soup es ampliamente utilizado en tareas de web scraping, donde se extraen datos de forma automatizada de diferentes fuentes en línea. Puedes utilizar Beautiful Soup para analizar y extraer información de páginas web, como noticias, precios de productos, datos de redes sociales, entre otros.

3. Integración con otras bibliotecas y herramientas: Beautiful Soup se puede combinar fácilmente con otras bibliotecas y herramientas populares en el ecosistema de Python, como pandas, NumPy, scikit-learn y más. Esto permite una integración fluida en flujos de trabajo de ciencia de datos más amplios, donde los datos extraídos se pueden procesar, analizar y visualizar.

4. Limpieza y preparación de datos: Al extraer datos de páginas web, a menudo se encuentran datos sin formato o desordenados. Beautiful Soup proporciona métodos y funciones para ayudar en la limpieza y preparación de datos, lo que permite convertir datos no estructurados en formatos más útiles y analizables.

5. Análisis de datos: Una vez que se han extraído los datos de una página web, Beautiful Soup permite realizar análisis de datos posteriores. Puedes utilizar bibliotecas como pandas para estructurar los datos extraídos en un formato adecuado para el análisis y aplicar técnicas de visualización de datos para obtener información significativa.

En resumen, Beautiful Soup es una herramienta esencial en la ciencia de datos cuando se trata de extraer datos de páginas web y realizar tareas de web scraping. Su capacidad para analizar y estructurar datos web facilita la integración en flujos de trabajo de ciencia de datos más amplios, lo que ayuda a obtener información valiosa a partir de fuentes en línea.

![image.png](attachment:image.png)

# ¡Bienvenido al Portal de Oportunidades de Bosch México!



![image.png](attachment:image.png)

La práctica de web scraping en el Portal de Oportunidades de Bosch México implica utilizar técnicas de extracción de datos de páginas web para obtener información relevante sobre las oportunidades de empleo disponibles.

Mediante el uso de herramientas como Beautiful Soup, unida a bibliotecas como requests, se puede acceder al contenido HTML de la página web del Portal de Oportunidades de Bosch México. Una vez obtenido el contenido, se pueden aplicar técnicas de web scraping para extraer datos específicos de interés.

Por ejemplo, es posible extraer información sobre los títulos de los puestos vacantes, los requisitos de empleo, las responsabilidades asociadas a cada posición y la ubicación de trabajo. Además, es posible obtener detalles sobre los beneficios y oportunidades de desarrollo profesional que ofrece Bosch México a sus empleados.

Al realizar el web scraping en el Portal de Oportunidades de Bosch México, se pueden recopilar datos en un formato estructurado y analizable. Esto brinda la posibilidad de realizar análisis de los perfiles requeridos, identificar las áreas de especialización demandadas y obtener una visión general de las oportunidades de carrera disponibles en Bosch México.


In [10]:
import requests
from bs4 import BeautifulSoup

# Realizar la solicitud HTTP GET a la página
url = "https://jobs.smartrecruiters.com/BoschGroup/743999919065123-ingeniero-de-procesos-mecanicos-manufactura-b?trid=c2ad57d8-2ec6-41b0-aac8-9fb2f04e9fa5"  # Reemplaza "URL_DE_LA_PAGINA" con la URL real de la página que deseas analizar
response = requests.get(url)

# Crear el objeto BeautifulSoup
soup = BeautifulSoup(response.content, 'html.parser')

# Extraer el título del trabajo
job_title = soup.find('h1', class_='job-title').text.strip()
print("Título del trabajo:", job_title)

# Extraer la ubicación del trabajo
job_location = soup.find('span', class_='job-detail').text.strip()
print("Ubicación del trabajo:", job_location)

# Extraer el tipo de empleo
employment_type = soup.find('li', itemprop='employmentType').text.strip()
print("Tipo de empleo:", employment_type)

# Extraer la entidad legal
legal_entity = soup.find('li', class_='job-detail').text.strip()
print("Entidad Legal:", legal_entity)

# Extraer la descripción del trabajo
job_description = soup.find('div', itemprop='description').text.strip()
print("Descripción del trabajo:")
print(job_description)

# Extraer las calificaciones/requisitos
qualifications = soup.find('div', itemprop='qualifications').find_all('li')
print("Calificaciones/Requisitos:")
for qualification in qualifications:
    print("-", qualification.text.strip())

# Extraer información adicional
additional_information = soup.find('div', itemprop='f').text.strip()
print("Información adicional:")
print(additional_information)


Título del trabajo: Ingeniero de procesos mecánicos|| Manufactura B
Ubicación del trabajo: 
Tipo de empleo: A jornada completa
Entidad Legal: A jornada completa
Descripción del trabajo:
Descripción de la empresaBosch fue fundada en Stuttgart en 1886 por Robert Bosch (1861-1942), y por más de 130 años se ha distinguido por una cultura corporativa única, basada en valores sólidos que nos impulsan a mejorar cada día. Nuestros productos, presentes en una amplia variedad de terrenos, contribuyen a mejorar la calidad de vida de millones de personas.Descripción del empleoResponsible to implement, maintain and improve the manufacturing process, ensure technical availability of equipment in all shifts. Fulfil Value Stream KPI’s: IDC, FOR, Technical Down time.RequisitosInterpretation of plans, drawings.CORE Tools ( SPC, MSA, CPK, CGK)Force Analysis (Finite Element Analysis)Knowledge in transduced tools (automatic screwdrivers with torque control, Angle)Interpretation of electrical schematics (co