# 📘 पायथन सीखें – आसान भाषा में
## अध्याय 33: Python और Web Scraping – BeautifulSoup और Requests

### कहानी
राम को daily news headlines collect करनी थी।
श्याम ने कहा:
> "Python और BeautifulSoup का इस्तेमाल करो। Web scraping से ये आसानी से हो जाएगा।"

राम:
> "अरे वाह! अब मैं खुद headlines scrape कर सकता हूँ और app में दिखा सकता हूँ।"

### Web Scraping क्या है?
- Websites से data automatically collect करना
- Mostly HTML parsing
- Python में popular library: `BeautifulSoup` और `requests`

### Step 1: Install Required Libraries
```bash
pip install requests beautifulsoup4
```

### Example 1: Simple HTML Request
```python
import requests
from bs4 import BeautifulSoup

url = 'https://www.example.com'
response = requests.get(url)
html = response.text
soup = BeautifulSoup(html, 'html.parser')

print(soup.prettify())  # formatted HTML
```

### Example 2: Extract Specific Tags
```python
# सभी headlines को extract करना
headlines = soup.find_all('h2')  # assume h2 tags contain headlines
for h in headlines:
    print(h.text)
```

### Example 3: Extract Links
```python
links = soup.find_all('a')  # all anchor tags
for link in links:
    print(link.get('href'))
```

### Example 4: CSS Selectors
```python
items = soup.select('.news-item')  # select elements with class 'news-item'
for item in items:
    print(item.text)
```

### Best Practices
- Respect website `robots.txt`
- Avoid too many requests in short time → use time.sleep()
- Don’t scrape copyrighted content without permission

### अभ्यास प्रश्न
1. किसी news website से top 5 headlines scrape कीजिए।
2. किसी website से सभी links collect करके print कीजिए।
3. किसी online book store page से book titles scrape कीजिए।
4. BeautifulSoup में find() और find_all() का इस्तेमाल करके अलग-अलग tags extract कीजिए।
5. Scraped data को CSV file में save कीजिए।

### सीखने योग्य बातें
- Web scraping → automatic data collection
- `requests.get()` → page request
- `BeautifulSoup` → HTML parsing
- `find()`, `find_all()`, `select()` → elements extract
- Scraped data → files / databases / APIs में store किया जा सकता है

---
🔔 **अगला अध्याय:** "Python और Automation – Selenium और Task Automation"