In [2]:
from googletrans import Translator
import pandas as pd
import requests
from bs4 import BeautifulSoup

def get_sanskrit_sloka(url):
    page_request = requests.get(url)
    if page_request.status_code == 200:
        data = page_request.content
        soup = BeautifulSoup(data, "html.parser")
        sloka_text = soup.find('div', class_='r r-devanagari').text
        return sloka_text
    else:
        print(f"Failed to retrieve sloka from {url}")
        return None

def translate_slokas(df):
    translator = Translator()
    df['slokas_google'] = df['slokas'].apply(lambda x: translator.translate(x, dest='en').text)

def get_chapter_slokas(chapter, sloka_numbers):
    slokas = {}
    base_url = "https://vedabase.io/en/library/bg/"

    for sloka_number in sloka_numbers:
        sloka_url = f"{base_url}{chapter}/{sloka_number}/"
        sloka_text = get_sanskrit_sloka(sloka_url)

        if sloka_text is not None:
            slokas[sloka_number] = sloka_text

    return slokas

# List of grouped slokas for Chapter 1
list_slokas_chap1 = [str(x) for x in range(1, 16)]
list_slokas_chap1.extend(['16-18'])
list_slokas_chap1.extend([str(x) for x in range(19, 21)])
list_slokas_chap1.extend(['21-22'])
list_slokas_chap1.extend([str(x) for x in range(23, 32)])
list_slokas_chap1.extend(['32-35', '36', '37-38'])
list_slokas_chap1.extend([str(x) for x in range(39, 47)])

# Get the slokas for Chapter 1
sloks_chap1 = get_chapter_slokas(1, list_slokas_chap1)

# Create a DataFrame from the retrieved slokas and add a "chapter_no" column
slokas_df = pd.DataFrame({'chapter_no': 1, 'slokas_no': list(sloks_chap1.keys()), 'slokas': list(sloks_chap1.values())})

translate_slokas(slokas_df)

# Display the DataFrame
print(slokas_df)

    chapter_no slokas_no                                             slokas  \
0            1         1  धृतराष्ट्र उवाचधर्मक्षेत्रे कुरुक्षेत्रे समवेत...   
1            1         2  सञ्जय उवाचदृष्ट्वा तु पाण्डवानीकं व्यूढं दुर्य...   
2            1         3  पश्यैतां पाण्डुपुत्राणामाचार्य महतीं चमूम् ।व्...   
3            1         4  अत्र श‍ूरा महेष्वासा भीमार्जुनसमा युधि ।युयुधा...   
4            1         5  धृष्टकेतुश्चेकितानः काशिराजश्च वीर्यवान् ।पुरु...   
5            1         6  युधामन्युश्च विक्रान्त उत्तमौजाश्च वीर्यवान् ।...   
6            1         7  अस्माकं तु विशिष्टा ये तान्निबोध द्विजोत्तम ।न...   
7            1         8  भवान्भीष्मश्च कर्णश्च कृपश्च समितिंजयः ।अश्वत्...   
8            1         9  अन्ये च बहवः श‍ूरा मदर्थे त्यक्तजीविताः ।नानाश...   
9            1        10  अपर्याप्त‍ं तदस्माकं बलं भीष्माभिरक्षितम् ।पर्...   
10           1        11  अयनेषु च सर्वेषु यथाभागवमस्थिताः ।भीष्ममेवाभिर...   
11           1        12  तस्य सञ्जनयन्हर्षं कुरुवृद

In [3]:
list_slokas_chap2 = [str(x) for x in range(1, 41)]
list_slokas_chap2.extend(['42-43'])
list_slokas_chap2.extend([str(x) for x in range(44, 72)])

sloks_chap2 = get_chapter_slokas(2, list_slokas_chap2)

chap2_df = pd.DataFrame({'chapter_no': 2, 'slokas_no': list(sloks_chap2.keys()), 'slokas': list(sloks_chap2.values())})

slokas_df = pd.concat([slokas_df, chap2_df], ignore_index=True)

translate_slokas(slokas_df)

print(slokas_df)

     chapter_no slokas_no                                             slokas  \
0             1         1  धृतराष्ट्र उवाचधर्मक्षेत्रे कुरुक्षेत्रे समवेत...   
1             1         2  सञ्जय उवाचदृष्ट्वा तु पाण्डवानीकं व्यूढं दुर्य...   
2             1         3  पश्यैतां पाण्डुपुत्राणामाचार्य महतीं चमूम् ।व्...   
3             1         4  अत्र श‍ूरा महेष्वासा भीमार्जुनसमा युधि ।युयुधा...   
4             1         5  धृष्टकेतुश्चेकितानः काशिराजश्च वीर्यवान् ।पुरु...   
..          ...       ...                                                ...   
103           2        67  इन्द्रियाणां हि चरतां यन्मनोऽनुविधीयते ।तदस्य ...   
104           2        68  तस्माद्यस्य महाबाहो निगृहीतानि सर्वशः ।इन्द्रि...   
105           2        69  या निशा सर्वभूतानां तस्यां जागर्ति संयमी ।यस्य...   
106           2        70  आपूर्यमाणमचलप्रतिष्ठंसमुद्रमापः प्रविशन्ति यद्...   
107           2        71  विहाय कामान्यः सर्वान्पुमांश्चरति निःस्पृहः ।न...   

                                       

In [None]:
output_csv_filename = "slokas_google.csv"

# Filter the DataFrame to select only the rows where "chapter_no" is 1 and save selected columns to a CSV file
slokas_df[slokas_df['chapter_no'] == 1][['slokas_no', 'english_translation']].to_csv(output_csv_filename, index=False)

print(f"Chapter 1 slokas have been saved to {output_csv_filename}")