In [1]:
import os
import torch

print("CUDA Available:", torch.cuda.is_available())
print("Number of CUDA devices:", torch.cuda.device_count())

print("Number of CUDA devices:", torch.cuda.device_count())
for i in range(torch.cuda.device_count()):
    print("CUDA Device {}: {}".format(i, torch.cuda.get_device_name(i)))

# Check for the availability of CUDA-enabled GPU
if torch.cuda.is_available():
    # Set device to GPU
    torch.cuda.set_device(0)
    device = torch.device("cuda")
    print("Switched to GPU")
else:
    # Use CPU if no GPU is available
    device = torch.device("cpu")
    print("No GPU available, using CPU")

print("Using device:", device)


CUDA Available: True
Number of CUDA devices: 1
Number of CUDA devices: 1
CUDA Device 0: NVIDIA GeForce RTX 3060 Laptop GPU
Switched to GPU
Using device: cuda


In [8]:
from transformers import MarianMTModel, MarianTokenizer

model_name_hindi = 'Helsinki-NLP/opus-mt-en-hi'
tokenizer_hindi = MarianTokenizer.from_pretrained(model_name_hindi)
model_hindi = MarianMTModel.from_pretrained(model_name_hindi)

model_name_urdu = 'Helsinki-NLP/opus-mt-en-ur'
tokenizer_urdu = MarianTokenizer.from_pretrained(model_name_urdu)
model_urdu = MarianMTModel.from_pretrained(model_name_urdu)


def translate_text(text, model, tokenizer):
    inputs = tokenizer.encode(text, return_tensors="pt")
    outputs = model.generate(inputs, max_length=100, num_beams=4, early_stopping=True)
    translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return translated_text

english_text = "Hello, how are you?"
translated_text_hindi = translate_text(english_text, model_hindi, tokenizer_hindi)
print("English to Hindi:", translated_text_hindi)

translated_text_urdu = translate_text(english_text, model_urdu, tokenizer_urdu)
print("English to Urdu:", translated_text_urdu)





English to Hindi: हैलो, तुम कैसे हो?
English to Urdu: ہیلو، تم کیسے ہو؟


In [5]:
from transformers import MarianMTModel, MarianTokenizer

model_name_punjabi = 'Helsinki-NLP/opus-mt-en-pa'
tokenizer_punjabi = MarianTokenizer.from_pretrained(model_name_punjabi)
model_punjabi = MarianMTModel.from_pretrained(model_name_punjabi)

def translate_text(text, model, tokenizer):
    inputs = tokenizer.encode(text, return_tensors="pt")
    outputs = model.generate(inputs, max_length=100, num_beams=4, early_stopping=True)
    translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return translated_text

english_text = "Hello, how are you?"

translated_text_punjabi = translate_text(english_text, model_punjabi, tokenizer_punjabi)
print("English to Punjabi:", translated_text_punjabi)


OSError: Helsinki-NLP/opus-mt-en-pa is not a local folder and is not a valid model identifier listed on 'https://huggingface.co/models'
If this is a private repository, make sure to pass a token having permission to this repo with `use_auth_token` or log in with `huggingface-cli login` and pass `use_auth_token=True`.

In [20]:
from gtts import gTTS

def generate_audio(text, filename):
    
    tts = gTTS(text=text, lang='hi')
    
    tts.save(filename)

hindi_text = """
हिन्दी एक भारतीय भाषा है जो भारत के उत्तरी और मध्य भाग में बोली जाती है। यह भारत की राष्ट्रभाषा 
भी है और भारत के सबसे अधिक बोली जाने वाले भाषाओं में से एक है। हिन्दी का विकास आपदा काल से 
प्रारंभ होता है, जब यह संस्कृत के प्रकृतियों में से विकसित हुई। यह विकास गगनभूमि के गड्ढे 
गुजरते हुए भारतीय उपमहाद्वीप के उत्तरी भाग की कई उपभाषाओं में हुआ। विकास के दौरान हिन्दी की 
कई भिन्न-भिन्न विधाएँ बनीं, जिसमें प्राचीन हिन्दी, आपब्राह्मण, अपभ्रंश, अवधी, भोजपुरी, 
ब्रजभाषा, बुंदेलखण्डी, खड़ीबोली, खड़ीबोली, बगेलखण्डी आदि उल्लेखनीय हैं।
"""

filename = 'hindi_audio.mp3'

generate_audio(hindi_text, filename)
