Fine-Tuning LLMs for Text-to-SQL Generation 🧠📊

This project explores the fine-tuning of large language models (LLMs) to convert natural language queries into SQL using synthetic data from GretelAI. We experimented with two models: LLaMA 3 (8B) and DeepSeek-R1:8B, optimized for SQL generation using efficient training techniques and deployed for local inference via Ollama.

🚀 Objective

Convert natural language queries into valid SQL statements.
Improve SQL generation accuracy through supervised fine-tuning.
Deploy optimized models locally for fast and lightweight inference.

🗃 Dataset

Source: GretelAI Synthetic Text-to-SQL Dataset

Format:

{
  "SQL Prompt": "Which employees earn more than $5000?",
  "SQL": "SELECT name FROM employees WHERE salary > 5000",
  "Explanation": "Filters employees earning more than 5000"
}

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
FineTuning_LLMs_Text_to_SQL_Updated.pptx		FineTuning_LLMs_Text_to_SQL_Updated.pptx
GenAI_Project.ipynb		GenAI_Project.ipynb
Llama3_finetune.ipynb		Llama3_finetune.ipynb
Model1.modelfile		Model1.modelfile
README.md		README.md
deepseek_finetune.ipynb		deepseek_finetune.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fine-Tuning LLMs for Text-to-SQL Generation 🧠📊

🚀 Objective

🗃 Dataset

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Fine-Tuning LLMs for Text-to-SQL Generation 🧠📊

🚀 Objective

🗃 Dataset

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages