# ytdebunk  

## Overview  
`ytdebunk` is a command-line tool designed to:  
- Download audio from YouTube videos.  
- Transcribe the audio content.  
- Optionally enhance the transcription using the **Gemini API**.  

This tool is particularly useful for analyzing transcriptions to identify **logical fallacies** and **incorrect claims** made by YouTubers.  

## Installation 

For avoiding conflicts better create a virtual environment and start working on it:

```sh
python3.11 -m venv .venv
source .venv/bin/activate
```

Now, you can install from PyPI using,

```sh
pip install ytdebunk
```

Alternatively, for latest updated please try installing directly from Github using:

```sh
pip install git+https://github.com/hissain/youtuber-debunked.git
```

## Usage  

The `ytdebunk.py` script provides a **command-line interface (CLI)** with several options.  

### **Arguments**  
- `video_url` (**str**) – URL of the YouTube video to download audio from.  

### **Options**  
| Option                  | Description |
|-------------------------|-------------|
| `-e, --enhance` (bool) | Enhance the transcription using the **Gemini API**. *(Default: False)* |
| `-d, --detect` (bool) | Detect logical fallacies, bias, irony, faults in the transcription using **Gemini API**. *(Default: False)* |
| `-o, --output_file` (str) | Path to save the final transcription. *(Default: `downloads/transcription.txt`)* |
| `-v, --verbose` (bool) | Increase output verbosity. |
| `-t, --token` (str) | API token for the **Gemini API** *(Required if `--enhance` is enabled)*. |

### **Example Usage**  

```bash
ytdebunk "https://www.youtube.com/watch?v=example" -e -o output.txt -v -t YOUR_GEMINI_API_TOKEN
```


```bash
export GEMINI_API_TOKEN="your_api_key"
ytdebunk "https://www.youtube.com/watch?v=example" #when Gemini API key is in environment
```

## **Environment Variables**  
If preferred, you can set the **Gemini API token** as an environment variable instead of passing it as a CLI argument:

```sh
export GEMINI_API_TOKEN="your_api_key"
```

## **Detailed Process**  

1. **Download Audio**  
   - Uses the `download_audio` function from `ytdebunk.downloader` to download audio from the given YouTube URL.  

2. **Transcribe Audio**  
   - Uses the `transcribe_audio` function from `ytdebunk.transcriber` to generate a text transcription.  

3. **Enhance Transcription** *(Optional)*  
   - If `--enhance` is enabled, the script uses `enhance_transcription` from `ytdebunk.refiner` to refine the transcription using the **Gemini API**.  
   - The API token must be provided via `--token` or as an **environment variable**.  

4. **Save Transcription**  
   - The final transcription (raw or enhanced) is saved to the specified output file.  

## **Error Handling**  
- If `--enhance` is enabled but no **Gemini API token** is provided, the script prints an **error message** and exits.  

## **License**  
This project is licensed under the **MIT License**. See the [LICENSE](LICENSE) file for details.  


## Contribution and Contact

You can Contact to the author hissain.khan@gmail.com


## Configurations Setup

In [1]:
#!pip install git+https://github.com/hissain/youtuber-debunked.git

## Usage of the `ytdebunk` CLI

In [1]:
!ytdebunk "https://www.youtube.com/watch?v=w4sJoZ9D1YM" -e

[youtube] Extracting URL: https://www.youtube.com/watch?v=w4sJoZ9D1YM
[youtube] w4sJoZ9D1YM: Downloading webpage
[youtube] w4sJoZ9D1YM: Downloading tv client config
[youtube] w4sJoZ9D1YM: Downloading player 69f581a5
[youtube] w4sJoZ9D1YM: Downloading tv player API JSON
[youtube] w4sJoZ9D1YM: Downloading ios player API JSON
[youtube] w4sJoZ9D1YM: Downloading m3u8 information
[info] w4sJoZ9D1YM: Downloading 1 format(s): 251
[download] Destination: downloads/audio
[K[download] [0;94m  0.0%[0m of    2.69MiB at [0;32m Unknown B/s[0m ETA [0;33mUnknown[0mDownloading: [0;94m  0.0%[0m complete
[K[download] [0;94m  0.1%[0m of    2.69MiB at [0;32m   2.21MiB/s[0m ETA [0;33m00:01[0mDownloading: [0;94m  0.1%[0m complete
[K[download] [0;94m  0.3%[0m of    2.69MiB at [0;32m   2.51MiB/s[0m ETA [0;33m00:01[0mDownloading: [0;94m  0.3%[0m complete
[K[download] [0;94m  0.5%[0m of    2.69MiB at [0;32m   4.05MiB/s[0m ETA [0;33m00:00[0mDownloading: [0;94m  0.5%[0m complete


In [3]:
from IPython.display import Audio

mp3_path = "downloads/audio.mp3"
Audio(mp3_path, autoplay=True)


In [4]:
with open('downloads/transcription.txt') as f:
    print(f.read())

বিষয়মার্যার ভোররাতে নিজের ভেরিফাইড ফেসবুক পেইজ থেকে ওই স্ট্যাটাসে হাসনাত দাবি করেন যে ক্যান্টনমেন্ট থেকে আওয়ামী লীগকে পুনর্বাসনের পরিকল্পনা করা হচ্ছে। ওই স্ট্যাটাসে তিনি দাবি করেন, তিনি সহ আরও কয়েকজন ছাত্র নেতা সম্মতিতে বিষয়টিকে ‘রিফান্ড আওয়ামী লীগ’ নামে নতুন একটি ষড়যন্ত্র হিসেবে বর্ণনা করেছেন। তিনি দাবি করেন, নতুন নেতৃত্বের অধীনে আওয়ামী লীগকে রাজনীতিতে ফিরিয়ে আনার পরিকল্পনা চলছে। এদিকে একাধিক রাজনৈতিক দলকেও একই পুনর্বাসনের রাজনীতিতে সাহায্য করার অভিযোগ উঠেছে। বিএনপির জ্যেষ্ঠ যুগ্ম মহাসচিব রুহুল কবির রিজভী শুক্রবার ঢাকার এক অনুষ্ঠানে বলেছেন, হত্যা ও লুটপাটের সঙ্গে জড়িত নয় এমন কারও নেতৃত্বে আওয়ামী লীগের রাজনীতিতে কোনো বাধা নেই। যে লোক আওয়ামী লীগে নেতৃত্বে আসবে, সে যদি কোনো অপরাধ না করে, সে যদি ছাত্র হত্যা না করে, সে যদি কোনো অর্থ লুটপাট না করে, টাকা পাচার না করে, এরকম লোক দিলে নেতৃত্বে, তাদের আপত্তি থাকবে না। দলটির আমির শফিক রহমান বিষয়টি নিয়ে তার ভেরিফাইড ফেসবুক পেইজে পোস্ট দিয়েছেন যে, আওয়ামী লীগের পুনর্বাসন জনগণ মেনে নেবে না। তিনি আরও লিখেন, আওয়ামী লীগের চরম পরিনতি ৩১শে জুলাই ঘটবে। রা

In [5]:
!ytdebunk "https://www.youtube.com/watch?v=w4sJoZ9D1YM" -e -d -v

[youtube] Extracting URL: https://www.youtube.com/watch?v=w4sJoZ9D1YM
[youtube] w4sJoZ9D1YM: Downloading webpage
[youtube] w4sJoZ9D1YM: Downloading tv client config
[youtube] w4sJoZ9D1YM: Downloading player 69f581a5
[youtube] w4sJoZ9D1YM: Downloading tv player API JSON
[youtube] w4sJoZ9D1YM: Downloading ios player API JSON
[youtube] w4sJoZ9D1YM: Downloading m3u8 information
[info] w4sJoZ9D1YM: Downloading 1 format(s): 251
[download] Destination: downloads/audio
[K[download] [0;94m  0.0%[0m of    2.69MiB at [0;32m Unknown B/s[0m ETA [0;33mUnknown[0mDownloading: [0;94m  0.0%[0m complete
[K[download] [0;94m  0.1%[0m of    2.69MiB at [0;32m   1.81MiB/s[0m ETA [0;33m00:01[0mDownloading: [0;94m  0.1%[0m complete
[K[download] [0;94m  0.3%[0m of    2.69MiB at [0;32m   2.98MiB/s[0m ETA [0;33m00:00[0mDownloading: [0;94m  0.3%[0m complete
[K[download] [0;94m  0.5%[0m of    2.69MiB at [0;32m   4.96MiB/s[0m ETA [0;33m00:00[0mDownloading: [0;94m  0.5%[0m complete


## Sample video (Around 11 minutes long)

https://www.youtube.com/watch?v=FxsIcCb4k2w

## Transcription

পিউ ওয়াকার তুতুপিটু, লেবিন চুষ পেয়েছে! সৈন্যবাহিনীর দিক থেকে মূল ভেটোটা ছিল যে টক্ষম্ম হুনুজ কেনা, যারাই নতুন অথবা অন্য ব্যক্তি, টক্ষম্ম হুনুজের নামে মামলা আছে, তিনি একজন কনভিক্টেড পার্সন। একজন কনভিক্টেড পার্সনকে কীভাবে স্বাধীনতা সংগ্রামের প্রধান প্রতিকে ওয়াকার পাশাপাশি থাকা থেকে বিপ্লবকে ব্যর্থ করার মিশ্র আচরণে, বিক্রম-মিশ্র আদেশে ক্ষতি করতে তারা কোন গোপন ষড়যন্ত্র বুঝলেন না। বিক্রম বিশ্বাসের সাথে দেখা করে বাংলাদেশের সার্বভৌমত্বের মধ্যে কোন রাষ্ট্রের কাছ থেকে সংকটে পড়তে পড়ে ভারতীয় সেনাপ্রধানের সাথে বাংলাদেশের বিপ্লবোত্তর অবস্থানীয় আলাপ কেউ কেউ অনুমোদন নিয়েছিলেন। এই ওয়াকার ছাড়াখার সকল বাধা দিচ্ছে ওয়াকার নিচে, তারপর আঙ্গুলোচয়, হুমকি দিচ্ছে! কেউ না, আমি একা রুখে দাঁড়াবো এ সি ওয়াকারকে? আমার বিরুদ্ধে লেগেছে সবাই। আমার বিরুদ্ধে ভয়ংকর ক্যাম্পেইন চলছে। মলমলা, আপনারা সেন্সরশিপে ওয়াকারের অসম্ভব অস্বাভাবিক আচরণ গণ্য করছেন। একজন গরিবশাসন তার নিজের জমিতে সে অন্যের জমি সাঁজ করে, এই রকম ওয়াকারের নিজস্ব মিশন নাই, ওয়াকারের মিশন একজন গরিবশাসন তার নিজের মিশন নাই, অন্যের মিশন নিয়ে কাজ করে, অন্যদিকে, অন্যদেশের জেনারেল ইন্ডিয়ান মিশনে আওয়ামী লীগকে ফিরে আসতে এবং আবার বাংলাদেশে তাদের রাজনীতি করতে দেওয়া। বিএনপিকে প্রতিশ্রুতি দিচ্ছে ওয়াকার, ভারতের সামনে নির্বাচনে বিএনপি সরকার গঠন করবে। অর্থাৎ আবার একটা তরিকা আছে। ইন্ডিয়া কখনোই বাংলাদেশের মুক্তিযুদ্ধ, ধর্মনিরপেক্ষতা আর অসাম্প্রদায়িকতার পক্ষে বলতে হবে, জামাতকে বাংলাদেশের শত্রু বলতে হবে, ধর্মীয় উগ্রপন্থার বিরুদ্ধে বলতে হবে, ঠিকই কাজী করছে বিএনপি দেখেন সেতানার কথা বলছে, ৭১ এর সংবিধানের কথা বলছে, আওয়ামী লীগের ইন্ডিয়া বিরোধী দল ঠিক করে দিতে চায়, বাংলাদেশে, আওয়ামী লীগের জন্য জাতীয় পার্টি ঠিক করে দিতে চেয়েছিল বিরোধীদের হিসেবে। জাতীয় পার্টির নেতা হারামজাদা জি.এম. কাদেরকে নির্বাচনের আগে ইন্ডিয়ানরা পড়ে যাতে আগে গ্রেপ্তার করেন, ওটা মাখন ক্রিম ঐক্যবদ্ধ ব্যবস্থা যে বই একে ঢোকানোর মধ্যে। বিএনপির বিরুদ্ধের দল হিসেবে ইন্ডিয়া আওয়ামী লীগকে লিখেছে। এটা বিশুদ্ধ আওয়ামী লীগ লিখেছে। এই আওয়ামী লীগ বানাইতে দায়িত্ব দায়িত্বে ভালোমন্দ ক্ষমা করে থেকে থেকে হয়েছে। সাবেরুজেন চৌধুরী এই সভাপতি আর বডি সোল হবে সাধারণ সম্পাদক, এইভাবে আওয়ামী লীগ পুনর্গঠিত হয়েছে। এ পুনর্গঠিত আওয়ামী লীগ নির্বাচনে যাবে। এড়াই ভারতের সিদ্ধান্ত বিএনপি একমত হয়েছে, ওয়াকারকে ঠিক করে সবাইকে ডাকিচ্ছে। হাসনাদিটিক দলে উই এয়ার ঘুট পাকিয়েছে বিদেশীদের তরুণদের, এই কারণে সাবেরুজেন চৌধুরীকে জেলে রাখা যায় না, এবং সেজন্যেই মাঝে মাঝে সামরিক গোষ্ঠীগুলি আইনশৃঙ্খলা মাঝে মাঝে ঘুটনা করার চেষ্টা করে, বিভ্রান্তিকর নির্বাচন করবে, ইলেকশন মনিটরিং দলের কিন্ডশার মিন ওয়াকারের প্রটেকশনের ক্যান্টনমেন্ট এরায় ছেকনেও টাইম মত ওয়াকার বের করবে, মানে ইন্ডিয়া যখন বলবে বের করে ওয়াকারকে, ওটা ভারতের কথাচার, হাগ্রামত কথাচার, সালামুন একটা দেশ মানে দেশে কনছনান্ড কোন্সন কন… টু, অলিমার্ড যেনি কেন্ড্র ফর মেসগেভিংস। পাশ্চাত্যের সৈন্যদের জুনিয়র অফিসারদের বন্দুকের নল ঘুরে গিয়েছিল জালেমের দিকে। কোনও কমান্ড শোনে নি সৈনিকেরা; নিজের বিবেকের কমান্ড শুনেছে। জেনারেলদের কেনা যাজকরা, সৈন্য কর্মীরা, দেশকে উপনিবেশ তৈরির জন্য ও মনে করেশন দেশনে কাজ করছে। এরা কথার শুনে নয়, এরা কৃষকের সন্তান, দরিদ্র মধ্যবিত্তের সন্তান। এই সৈনিকেরা ওদের পিউর, ওদের জানে, ওদের সম্প্রদায় একটাই, তা হচ্ছে বিবেক, তা হচ্ছে ইনসাফ। ওরা কখনো ভুল করেনি। প্রশাসনের পশ্চাতে পোশাকের আড়ালে আগস্টের ঘটনা ঘটেছে। জেনারেলদের পক্ষে ধারাবে না! মুজিবকে জয় বাংলা করার সাহসী সিনিয়র অফিসারদের হয় নয়, জেনারেলদের হয় নয়, হয়েছে সৈনিকেরা, জুনিয়র অফিসার, বাংলাদেশের নতুন আর্মির জুনিয়র অফিসার, বাংলাদেশের সেনাপ্রধান থেকে নির্দেশ। নিজের পজিশন কেসে খুনি হাসিনা তার দলের স্বার্থে ভারতের আজ্ঞা পালন করছে, জনগণের টাকায় বেতন নেয়া, নৈতিক অধিকার ওয়াকারের নাই, জনগণের টাকায় বেতন নেয়া, ইন্ডিয়ার এজেন্ডা পালন করে যাচ্ছে। ওয়াকার মিথ্যাচার করেছে, কারা ছাত্রদলের ভাই? বাংলাদেশের স্থিতিশীলতা শত্রু বলছে, এদের ভুলে যাবেন না। আপনারা সবাই রেখে নেই। যারা বাংলাদেশের রাজনীতিকে ষড়যন্ত্র দিয়ে ব্যাখ্যা করে তাদের রাজনীতি পরাজিত হবে। আজকের শিক্ষা, যুদ্ধে আমাদের বীরত্বপূর্ণ ত্যাগ, ক্রোধ, কুম্ভীর, কুশিলব সকল অফিসারদের পুলিশের হাতে সপর্দ করতে হবে। জুলাই বিপ্লবে যে অফিসাররা নিজেরা গুলি চালিয়েছে, গুলির অভিযোগের দিকে তাদের পুলিশের হাতে সপর্দ করতে হবে। কর্নেল রেদোয়ানের কেম নিয়ন্ত্রণের টাকায় বেতন নেয়া, সেনাবাহিনীতে থেকে কেউ ইন্সটিটিউশনের মান নষ্ট করছে, আর্মির সরমান নষ্ট করছে, কৈশলাম না, হারকুলী সভানা, বুকের মধ্যে স্টেন্ট লাগায়, এক্স-হার্টের রুগি-ওই হাততো মান নয়। বাংলাদেশে আওয়ামী লীগ বা ভারতীয় আধিপত্যকে field-level pence, ওয়াকার ট্যাক্স, জেনারেলদের মিলিত ব্লক।  আওয়ামী লীগের রাজনীতি করতে দেওয়া হবে না। করতে সুরান্তর লড়াইয়ের আওয়ামী লীগকে না হোমার করে সাথে না হোমার মতো পুনরায় আগস্টের মতো পাচারী আগস্টের ভুল আমরা আর করব না। যান দেবে, কিন্তু জুলাই অর্জন দেব না, ইনশাল্লাহ, খোদা তালা, আবার আমাদের বিজয়, সেনিয়ানের তফ, একদিন এন্ড ক্লাব, জিন্দাবাদ।

## Fallacies and Logical Flaws

এই ভিডিওতে বক্তার বক্তব্যে বেশ কিছু যৌক্তিক ত্রুটি, পক্ষপাত, ব্যঙ্গাত্মকতা এবং ভুল ধরা পড়েছে।  প্রথমেই, "পিউ ওয়াকার তুতুপিটু, লেবিন চুষ পেয়েছে!" এই ধরণের অশ্লীল ও অপরিপক্ক ভাষা ব্যবহার  অবমাননাকর এবং যুক্তিপূর্ণ আলোচনার পরিবর্তে  বক্তার ক্ষোভ প্রকাশ করে। পরবর্তীতে, "টক্ষম্ম হুনুজ কেনা," "কনভিক্টেড পার্সন"  এরকম অভিযোগ  সাথে কোনো প্রমাণ উপস্থাপন করা হয়নি, যা  অপবাদ ও ব্যক্তিগত আক্রমণের  উদাহরণ।  বক্তা  ওয়াকারের বিরুদ্ধে  বিভিন্ন ষড়যন্ত্র তত্ত্ব  উত্থাপন করেছেন,  কিন্তু  কোনো  প্রমাণ  দিতে পারেননি।  এখানে  অসমর্থিত  দাবী  করার ফলে  তার বক্তব্যে  যুক্তিগত  ত্রুটি  দেখা যায়।  আরও  গুরুত্বপূর্ণ হলো, বক্তা  ভারতের  বিরুদ্ধে  পক্ষপাতিত্বপূর্ণ  বক্তব্য  রেখেছেন এবং  ভারতকে  বিএনপি ও  ওয়াকারের  সাথে  মিলে  বাংলাদেশের  বিরুদ্ধে  ষড়যন্ত্র  করার  অভিযোগ  তুলেছেন,  যা  সুস্পষ্ট  ভাবপ্রবণতা  এবং  সাধারণীকরণ।  সার্বভৌমত্বের  প্রসঙ্গ  তুলে  তিনি  এই  ষড়যন্ত্র  তত্ত্ব  কে  আরও  শক্তিশালী  করার  চেষ্টা  করেছেন।  বক্তার  নিজেকে  "একা রুখে দাঁড়াবো"  বলে  উল্লেখ  করার  মধ্যে  এক ধরণের  আত্ম-মহিমান্বিত  ব্যঙ্গাত্মকতা  দেখা যায়।  শেষ পর্যন্ত,  তিনি  সৈনিকদের  বিবেকের  উল্লেখ  করে  সামরিক  বাহিনীর  উপর  একটা  আদর্শবাদী  চিত্র  দেখাতে চেষ্টা  করেছেন, যা  বাস্তবতার সাথে  মেলে না এবং তা  প্রচারমূলক  বক্তব্যের  উদাহরণ।  সামগ্রিকভাবে,  এই বক্তব্যটি  তথ্যাধারিত  না হয়ে,  অনির্ভরযোগ্য  তথ্য ও  অনুমানের  উপর  নির্ভর  করে  তৈরি  হয়েছে। বক্তার বক্তব্যে বেশ কিছু যুক্তিগত ত্রুটি, পক্ষপাত, বিদ্রূপ এবং ভুল লক্ষ্য করা যায়।  প্রথমেই অস্পষ্ট "আগস্টের ঘটনা"  উল্লেখ করে,  জেনারেলদের অপরাধী বলে  নির্দিষ্ট কোন প্রমাণ ছাড়াই  অভিযোগ করা হয়েছে, যা একধরনের  অপবাদ (ad hominem)  এবং  প্রমাণের অভাব (lack of evidence)  সম্পর্কিত  তর্কের ত্রুটি।  শেখ হাসিনাকে "খুনি"  হিসেবে আখ্যায়িত করা  এবং  "ভারতের আজ্ঞা পালন"  করার অভিযোগ  ব্যক্তিগত আক্রমণ (personal attack)  এবং  ষড়যন্ত্র তত্ত্ব (conspiracy theory) -এর উপর নির্ভর করে,  যেখানে কোন বস্তুনিষ্ঠ প্রমাণ  উপস্থাপন করা হয়নি। "ওয়াকার" -এর  মিথ্যাচারের অভিযোগ  কোন  বিশেষ উদাহরণ ছাড়াই  করা হয়েছে, যা  অপ্রমাণিত দাবী (unsubstantiated claim)।  "ছাত্রদলের ভাই"  উল্লেখ করে বিরোধীদের  একটা  সাধারণ শ্রেণীতে  পরিণত করা হয়েছে,  যা  জাতিগত  গোষ্ঠীভুক্তি (groupthink)  এবং  একধরনের  stereotyping-এর  উদাহরণ। "বাংলাদেশের স্থিতিশীলতা শত্রু"  বলার মাধ্যমে  বিরোধীদের  দেশদ্রোহী  হিসেবে  চিহ্নিত  করা হয়েছে,  যা  একধরনের  অতিরঞ্জন (hyperbole)  এবং  লজ্জাজনক  বক্তব্য (inflammatory rhetoric)।  "যুদ্ধে বীরত্বপূর্ণ ত্যাগ"  উল্লেখ করে  অতিরঞ্জন এবং  সাধারণীকরণের (generalization)  দোষ  দেখা যায়। "কর্ণেল রেদোয়ান" -এর  নাম  উল্লেখ করে  ব্যক্তিগত  আক্রমণ  এবং  অপ্রমাণিত  অভিযোগ  করা  হয়েছে।  অন্তে,  "আওয়ামী লীগের  রাজনীতি করতে দেওয়া হবে না"  এমন  ঘোষণা  একধরনের  ধমকি  (threat)  এবং  সহিংসতার  ভাব (incitement of violence)  প্রকাশ করে, যা  যুক্তিবাদী  তর্কের  প্রমাণ  হিসেবে  গণ্য  হবে না।  সামগ্রিকভাবে,  বক্তৃতাটি  যুক্তিবাদী  তর্ক  নয়,  বরং  ভাবপ্রবাহিত  এবং  অপ্রমাণিত  অভিযোগের  মিশ্রণ।  বক্তা  নিজের  দাবি  সমর্থনের  জন্য  বস্তুনিষ্ঠ  প্রমাণ  উপস্থাপন  করেননি,  বরং  অপবাদ,  আক্রমণ  এবং  ভয়ভীতির  মনোভাব  ব্যবহার  করেছেন।