In [2]:
!pip install groq


Collecting groq
  Downloading groq-0.30.0-py3-none-any.whl.metadata (16 kB)
Downloading groq-0.30.0-py3-none-any.whl (131 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m131.1/131.1 kB[0m [31m958.7 kB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: groq
Successfully installed groq-0.30.0


In [11]:
from google.colab import userdata
if(userdata.get('GROQ_API_KEY')):
  print("API Key found!")
else:
  print("API Key not found!")

API Key found!


In [10]:
from groq import Groq
import os
from google.colab import userdata

def transcribe_audio_with_groq(file_path, model="whisper-large-v3"):
    """
    Transcribes an audio file using the Groq API.
    """
    if not os.path.exists(file_path):
        raise FileNotFoundError(f"The audio file was not found at: {file_path}")

    print(f"Sending audio to Groq for transcription with '{model}'...")

    try:
        # Explicitly pass the API key
        client = Groq(api_key=userdata.get('GROQ_API_KEY'))
    except Exception as e:
        print(f"Error initializing Groq client: {e}")
        print("Please ensure the GROQ_API_KEY environment variable is set correctly.")
        return None

    try:
        with open(file_path, "rb") as file:
            transcription = client.audio.transcriptions.create(
                file=(os.path.basename(file_path), file.read()),
                model=model,
                # You can optionally prompt the model to improve transcription quality
                # prompt="The following is a discussion in Hindi about technology.",
                response_format="json",  # or "verbose_json"
                language="hi"  # Specify Hindi language
            )
        print("Transcription complete.")
        return transcription.text
    except Exception as e:
        print(f"An error occurred during transcription with Groq: {e}")
        return None


def summarize_text_with_groq_streaming(text_to_summarize, model_name="llama3-70b-8192"):
    """
    Summarizes the given text using the Groq API and streams the response.
    """
    print(f"\n--- Summary (from Groq's '{model_name}') ---")

    try:
        # Explicitly pass the API key
        client = Groq(api_key=userdata.get('GROQ_API_KEY'))
    except Exception as e:
        print(f"Error initializing Groq client: {e}")
        return

    prompt = f"""
    Please summarize the following Hindi text in a few concise bullet points.
    Provide the summary in Hindi.

    Text to summarize:
    "{text_to_summarize}"

    Summary:
    """

    try:
        stream = client.chat.completions.create(
            model=model_name,
            messages=[
                {
                    "role": "user",
                    "content": prompt
                }
            ],
            temperature=0.7,
            max_tokens=1024,
            top_p=1,
            stream=True,
            stop=None,
        )

        # Print the streamed response as it arrives
        for chunk in stream:
            print(chunk.choices[0].delta.content or "", end="")

        print("\nSummarization complete.")

    except Exception as e:
        print(f"An error occurred during summarization with Groq: {e}")


if __name__ == "__main__":
    # --- Configuration ---
    # 1. Replace this with the path to your Hindi audio file (e.g., .mp3, .wav, .m4a)
    AUDIO_FILE_PATH = "/content/x.mp3"

    # 2. (Optional) Change the summarization model. Groq offers several.
    # Models: "llama3-70b-8192", "llama3-8b-8192", "mixtral-8x7b-32768", "gemma-7b-it"
    SUMMARIZATION_MODEL = "llama3-70b-8192"

    # The transcription model is typically "whisper-large-v3"
    TRANSCRIPTION_MODEL = "whisper-large-v3"
    # --- End of Configuration ---

    try:
        # Step 1: Transcribe the audio file to text using Groq
        hindi_text = transcribe_audio_with_groq(AUDIO_FILE_PATH, model=TRANSCRIPTION_MODEL)

        if hindi_text:
            # As requested, print the full transcription first
            print("\n--- Transcribed Text (from Groq) ---")
            print(hindi_text)

            # Step 2: Summarize the transcribed text with a streaming response
            summarize_text_with_groq_streaming(hindi_text, model_name=SUMMARIZATION_MODEL)

    except FileNotFoundError as e:
        print(e)
    except Exception as e:
        print(f"An unexpected error occurred: {e}")

Sending audio to Groq for transcription with 'whisper-large-v3'...
Transcription complete.

--- Transcribed Text (from Groq) ---
 एक बार की बात है, एक गाउं में एक किसान रहता था, उस किसान को जानवर पालने का बहुत शौक था, उसके पास पहले से ही बहुत सारी भैसे थी, जिनका दूद बेच कर वो अपना घर चलाया करता था, तो एक दिन उस किसान ने एक खरगोश और एक बंदर को भी अपने � और फिर उन गड़ों पर मिट्टी डाल कर उन गड़ों को बंद कर दिया और किसी एक गड़े में उस किसान ने एक गाजर को छुपा दिया अब उस किसान ने खरगोश और बंदर को उस गाजर को ढूनने के लिए कहा खरगोश बहुत ही confident था और उसे अपने आप पर बहुत विश्वास था उसने एक एक गड़े को खोदना शुरू किया और गाजर ढूनने लगा लेकिन बंदर जो था वो बहुत ही negative और आलसी था उसने सोचा की खेत में इतने सारे गड़े है और वो गाजर किसी एक गड़े में है इतना कौन ढूनेगा वो बंदर ये सोचकर एक गड़े के उपर जाकर सो गया अब उधர खर्गोष अपनी पूरी महनस से गाजर ढून रहा था एक एक करके खरगोश ने सारे गडडे देख लिये, लेकिन उसे किसी भी गडडे में गाजर नहीं मिली. सिर्फ एक गडडा बाकी रह गया था, जिसके उपर बंदर सो रहा 