# Importing related libraries

In [3]:
import json
import requests
from bs4 import BeautifulSoup

# Stage 1: Scraping news links

### Variables

In [None]:
info = list() # an empty list for carrying individual dictionaries of news items

### Main scraping script

In [None]:
for page_no in range(1,51):
    
    # making URL string with page numbers
    url = 'https://www.urdupoint.com/daily/live/important-page' + str(page_no) + '.html'
    
    # hitting/requesting URL
    response = requests.post(url)
    
    # validating the success of URL 
    if response.status_code == 200:
        
        # parsing the content
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # finding/extracting the region/HTML tag of interest
        ul = soup.find('ul', class_='list_item_wrap')
        
        # drilling down to the individual list item inside the region of interest
        li = ul.find_all('li', class_='item_shadow')
        
        # getting relevant anchors (links), titles, and short descriptions; keeping them in dictionary
        for i,item in enumerate(li):
            temp = dict()
            temp['url'] = item.find('a')['href'].strip()
            temp['title'] = item.find('h3').text.strip()
            temp['desc'] = item.find('p').text.strip()
            
            # appending dictionary in main list
            info.append(temp) 

In [28]:
print(len(info))

1000


### Saving information in JSON file/format

In [35]:
with open('scraped-news.json', 'w', encoding='utf-8') as file:
    json.dump(info, file, ensure_ascii=False)

# Stage 2: Scraping news details

### Reading JSON file

In [4]:
with open('scraped-news.json', 'r', encoding='utf-8') as file:
    info = json.load(file)

# printing length
print(len(info))

# printing first dictionary
print(info[0])

1000
{'url': 'https://www.urdupoint.com/daily/livenews/2021-11-06/news-2952365.html', 'title': 'ملک میں سونے کی مجوعی قیمت میں5201 روپے کا بڑا اضافہ ہوگیا', 'desc': 'سونے کی فی تولہ نئی قیمت ایک لاکھ 23 ہزار روپے ہوگئی، جبکہ 10گرام سونے کی نئی قیمت ایک لاکھ 5 ہزار 453 روپے ہوچکی ہے۔ سندھ صرافہ بازار ایسوسی ایشن', 'detail': 'کراچی (اردوپوائنٹ اخبارتازہ ترین۔ 06 نومبر2021ء) عالمی مارکیٹ میں سونے کی فی تولہ قیمتوں میں اتارچڑھاؤ کا سلسلہ جاری ہے، جس کے باعث پاکستان میں بھی سونے کی قیمت میں بڑا ردوبدل دیکھا گیا ہے، ملک میں سونے کی مجموعی قیمت 5 ہزار201 روپے مہنگی ہوگئی، فی تولہ قیمت میں 2800 روپے اور 10 گرام سونے کی قیمت میں2401 روپے اضافہ ہوگیا ہے۔ سندھ صرافہ بازار ایسوسی ایشن کے مطابق عالمی مارکیٹ میں سونے کی قیمت میں یکدم بڑا اضافہ ہوا ہے۔(جاری ہے)   عالمی صرافہ بازار میں سونے کی قدر 26 امریکی ڈالر اضافے سے 1818 ڈالر فی اونس پر پہنچ گئی ہے۔ عالمی مارکیٹ میں سونے کی قیمت بڑھنے سے پاکستان میں سونے کی فی تولہ قیمت میں 2 ہزار 800 روپے کا اضافہ ہوا، جس کے بعد سونے کی فی تولہ نئی قیمت ایک لاکھ

### Iterating URL for detailed news and scraping the main news content

In [5]:
for i,item in enumerate(info):
    response = requests.post(item['url'])
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        div = soup.find('div', class_='detail_txt urdu fs17 lh34 aj rtl')
        
        # Keeping the news details in the same dictionary
        info[i]['detail'] = div.text.replace('\n', ' ').replace('\r', ' ').replace('   ',' ').replace('  ', ' ').strip()

### Updating/Saving the information in the same JSON file

In [6]:
with open('scraped-news.json', 'w', encoding='utf-8') as file:
    json.dump(info, file, ensure_ascii=False, indent=1)