LLM Defect Detection on CodeXGLUE

This project explores bug detection in source code using Large Language Models (LLMs).
It evaluates whether a code snippet is buggy (1) or clean (0) using open-source LLMs and standard defect detection benchmarks.

Dataset

I use the CodeXGLUE Defect Detection dataset from Hugging Face:

Dataset name: google/code_x_glue_cc_defect_detection
Task: Binary classification — buggy (1) vs non-buggy (0)
Languages: C/C++
Source: Real-world code collected from GitHub commits

Models Used

You can easily switch between models to compare performance:

Model	Type	Size	Notes
🧩 `microsoft/codebert-base`	Encoder (BERT-style)	~125M	Pretrained for code understanding, fine-tunable
⚡ `deepseek-ai/deepseek-coder-1.3b-instruct`	Decoder (LLM)	~1.3B	Instruction-tuned, used for True/False reasoning

S

Requirements

Install the required Python libraries:

pip install transformers datasets scikit-learn tqdm

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
CodeBert_CodeXGlue.ipynb		CodeBert_CodeXGlue.ipynb
CodeBert_CodeXGlue_10.ipynb		CodeBert_CodeXGlue_10.ipynb
CodeBert_CodeXGlue_6_AST.ipynb		CodeBert_CodeXGlue_6_AST.ipynb
Deepseek_coder.ipynb		Deepseek_coder.ipynb
README.md		README.md
llama3-CodeXGlue.ipynb		llama3-CodeXGlue.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LLM Defect Detection on CodeXGLUE

Dataset

Models Used

Requirements

About

Uh oh!

Releases

Packages

Languages

jitani04/AI-Bug-Detection

Folders and files

Latest commit

History

Repository files navigation

LLM Defect Detection on CodeXGLUE

Dataset

Models Used

Requirements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages