# 06_LangFuse_Code_Review - Tự động hóa Code Review với LangFuse

## Mục tiêu học tập
- Hiểu cách thiết kế và triển khai pipeline code review tự động với LangFuse
- Theo dõi hiệu suất và chất lượng của các gợi ý review code
- Tối ưu hóa prompt cho các loại review khác nhau (security, performance, best practices)
- Sử dụng LangFuse để thu thập feedback và cải thiện chất lượng review

## Giới thiệu
Code review tự động bằng LLM giúp:
- **Phát hiện lỗi tiềm ẩn** sớm trong quá trình phát triển
- **Đảm bảo tuân thủ** coding standards và best practices
- **Gợi ý cải tiến** về performance và security 
- **Hỗ trợ đào tạo** junior developers

LangFuse giúp:
- Theo dõi chất lượng và độ chính xác của review comments
- A/B test các prompt templates khác nhau
- Thu thập feedback từ developers để cải thiện model

## Cài đặt & Cấu hình

In [None]:
import os
import json
import ast
from datetime import datetime
from typing import Dict, List, Optional, Tuple

from langfuse import Langfuse
from langfuse.decorators import observe, langfuse_context
from langchain_anthropic import ChatAnthropic
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
import re

In [None]:
# Cấu hình LangFuse
langfuse = Langfuse(
    secret_key=os.getenv("LANGFUSE_SECRET_KEY"),
    public_key=os.getenv("LANGFUSE_PUBLIC_KEY"),
    host="http://localhost:3000"
)

# Cấu hình Anthropic
llm = ChatAnthropic(
    model="claude-3-haiku-20240307",
    api_key=os.getenv("ANTHROPIC_API_KEY"),
    temperature=0.1
)

print("✅ Cấu hình hoàn tất")

## Định nghĩa Code Review Templates

In [None]:
# Template cho security review
SECURITY_REVIEW_TEMPLATE = """
Bạn là một security expert. Hãy review đoạn code sau và tìm các vấn đề bảo mật tiềm ẩn:

NGÔN NGỮ: {language}
CODE:
```{language}
{code}
```

Hãy phân tích và đưa ra:
1. **Các lỗ hổng bảo mật** (nếu có)
2. **Mức độ nghiêm trọng** (Critical/High/Medium/Low)
3. **Gợi ý khắc phục** cụ thể
4. **Code example** để fix (nếu cần)

Trả lời bằng JSON format:
{
  "issues": [
    {
      "type": "security",
      "severity": "high",
      "line": 10,
      "description": "Mô tả vấn đề",
      "suggestion": "Gợi ý khắc phục",
      "example": "Code example"
    }
  ],
  "overall_score": 7
}
"""

# Template cho performance review
PERFORMANCE_REVIEW_TEMPLATE = """
Bạn là một performance optimization expert. Hãy review đoạn code sau về mặt hiệu suất:

NGÔN NGỮ: {language}
CODE:
```{language}
{code}
```

Hãy phân tích:
1. **Bottlenecks** tiềm ẩn
2. **Memory usage** không tối ưu
3. **Algorithm complexity** có thể cải thiện
4. **Gợi ý tối ưu hóa** cụ thể

Trả lời bằng JSON format:
{
  "issues": [
    {
      "type": "performance",
      "severity": "medium",
      "line": 5,
      "description": "Vấn đề hiệu suất",
      "suggestion": "Cách tối ưu",
      "impact": "Cải thiện 50% performance"
    }
  ],
  "overall_score": 6
}
"""

# Template cho best practices review
BEST_PRACTICES_TEMPLATE = """
Bạn là một senior developer. Hãy review đoạn code sau về coding best practices:

NGÔN NGỮ: {language}
CODE:
```{language}
{code}
```

Kiểm tra:
1. **Code style** và naming conventions
2. **Code structure** và organization
3. **Error handling** 
4. **Documentation** và comments
5. **Maintainability** và readability

Trả lời bằng JSON format:
{
  "issues": [
    {
      "type": "best_practice",
      "severity": "low",
      "line": 3,
      "description": "Vấn đề về best practice",
      "suggestion": "Cách cải thiện",
      "category": "naming"
    }
  ],
  "overall_score": 8
}
"""

## Implement Code Review Pipeline

In [None]:
class CodeReviewPipeline:
    def __init__(self, llm, langfuse_client):
        self.llm = llm
        self.langfuse = langfuse_client
        
    def detect_language(self, code: str) -> str:
        """Phát hiện ngôn ngữ lập trình"""
        if 'def ' in code or 'import ' in code or 'from ' in code:
            return 'python'
        elif 'function' in code or 'const ' in code or 'let ' in code:
            return 'javascript'
        elif 'public class' in code or 'import java' in code:
            return 'java'
        else:
            return 'unknown'
    
    @observe()
    def security_review(self, code: str, language: str) -> Dict:
        """Review code về mặt bảo mật"""
        langfuse_context.update_current_observation(
            name="security_review",
            metadata={"language": language, "review_type": "security"}
        )
        
        prompt = ChatPromptTemplate.from_template(SECURITY_REVIEW_TEMPLATE)
        chain = prompt | self.llm | StrOutputParser()
        
        result = chain.invoke({
            "code": code,
            "language": language
        })
        
        try:
            # Parse JSON response
            json_match = re.search(r'{.*}', result, re.DOTALL)
            if json_match:
                return json.loads(json_match.group())
            else:
                return {"issues": [], "overall_score": 5, "raw_response": result}
        except json.JSONDecodeError:
            return {"issues": [], "overall_score": 5, "raw_response": result}
    
    @observe()
    def performance_review(self, code: str, language: str) -> Dict:
        """Review code về mặt hiệu suất"""
        langfuse_context.update_current_observation(
            name="performance_review",
            metadata={"language": language, "review_type": "performance"}
        )
        
        prompt = ChatPromptTemplate.from_template(PERFORMANCE_REVIEW_TEMPLATE)
        chain = prompt | self.llm | StrOutputParser()
        
        result = chain.invoke({
            "code": code,
            "language": language
        })
        
        try:
            json_match = re.search(r'{.*}', result, re.DOTALL)
            if json_match:
                return json.loads(json_match.group())
            else:
                return {"issues": [], "overall_score": 5, "raw_response": result}
        except json.JSONDecodeError:
            return {"issues": [], "overall_score": 5, "raw_response": result}
    
    @observe()
    def best_practices_review(self, code: str, language: str) -> Dict:
        """Review code về best practices"""
        langfuse_context.update_current_observation(
            name="best_practices_review",
            metadata={"language": language, "review_type": "best_practices"}
        )
        
        prompt = ChatPromptTemplate.from_template(BEST_PRACTICES_TEMPLATE)
        chain = prompt | self.llm | StrOutputParser()
        
        result = chain.invoke({
            "code": code,
            "language": language
        })
        
        try:
            json_match = re.search(r'{.*}', result, re.DOTALL)
            if json_match:
                return json.loads(json_match.group())
            else:
                return {"issues": [], "overall_score": 5, "raw_response": result}
        except json.JSONDecodeError:
            return {"issues": [], "overall_score": 5, "raw_response": result}
    
    @observe()
    def comprehensive_review(self, code: str, filename: str = "unknown") -> Dict:
        """Thực hiện review toàn diện code"""
        langfuse_context.update_current_observation(
            name="comprehensive_code_review",
            input={"code": code, "filename": filename},
            metadata={"filename": filename}
        )
        
        # Detect language
        language = self.detect_language(code)
        
        # Perform all types of review
        security_result = self.security_review(code, language)
        performance_result = self.performance_review(code, language)
        best_practices_result = self.best_practices_review(code, language)
        
        # Combine results
        all_issues = []
        all_issues.extend(security_result.get('issues', []))
        all_issues.extend(performance_result.get('issues', []))
        all_issues.extend(best_practices_result.get('issues', []))
        
        # Calculate overall metrics
        critical_issues = len([i for i in all_issues if i.get('severity') == 'critical'])
        high_issues = len([i for i in all_issues if i.get('severity') == 'high'])
        medium_issues = len([i for i in all_issues if i.get('severity') == 'medium'])
        low_issues = len([i for i in all_issues if i.get('severity') == 'low'])
        
        overall_score = (
            security_result.get('overall_score', 5) +
            performance_result.get('overall_score', 5) +
            best_practices_result.get('overall_score', 5)
        ) / 3
        
        result = {
            "filename": filename,
            "language": language,
            "timestamp": datetime.now().isoformat(),
            "reviews": {
                "security": security_result,
                "performance": performance_result,
                "best_practices": best_practices_result
            },
            "summary": {
                "total_issues": len(all_issues),
                "critical_issues": critical_issues,
                "high_issues": high_issues,
                "medium_issues": medium_issues,
                "low_issues": low_issues,
                "overall_score": round(overall_score, 2)
            },
            "all_issues": all_issues
        }
        
        langfuse_context.update_current_observation(
            output=result,
            metadata={
                "total_issues": len(all_issues),
                "overall_score": overall_score,
                "language": language
            }
        )
        
        return result

# Khởi tạo pipeline
review_pipeline = CodeReviewPipeline(llm, langfuse)
print("✅ Code Review Pipeline đã sẵn sàng")

## Ví dụ 1: Review Python Code có vấn đề bảo mật

In [None]:
# Code Python có vấn đề bảo mật
vulnerable_python_code = """
import os
import subprocess
from flask import Flask, request

app = Flask(__name__)

@app.route('/execute')
def execute_command():
    cmd = request.args.get('cmd')
    result = subprocess.run(cmd, shell=True, capture_output=True, text=True)
    return result.stdout

@app.route('/login')
def login():
    username = request.args.get('username')
    password = request.args.get('password')
    
    # Vulnerable SQL query
    query = f"SELECT * FROM users WHERE username='{username}' AND password='{password}'"
    
    # Execute query (giả lập)
    print(f"Executing: {query}")
    return "Login successful"

if __name__ == '__main__':
    app.run(debug=True)
"""

print("🔍 Đang review code Python có vấn đề bảo mật...")
result = review_pipeline.comprehensive_review(vulnerable_python_code, "vulnerable_app.py")

print(f"\n📊 KẾT QUẢ REVIEW:")
print(f"File: {result['filename']}")
print(f"Ngôn ngữ: {result['language']}")
print(f"Tổng số vấn đề: {result['summary']['total_issues']}")
print(f"Điểm tổng thể: {result['summary']['overall_score']}/10")
print(f"Vấn đề nghiêm trọng: {result['summary']['critical_issues']}")
print(f"Vấn đề cao: {result['summary']['high_issues']}")

# Hiển thị một số issues quan trọng
print("\n🚨 CÁC VẤN ĐỀ QUAN TRỌNG:")
for i, issue in enumerate(result['all_issues'][:3], 1):
    print(f"{i}. [{issue.get('type', 'unknown')}] {issue.get('description', 'No description')}")
    if issue.get('suggestion'):
        print(f"   💡 Gợi ý: {issue['suggestion']}")
    print()

## Ví dụ 2: Review JavaScript Code có vấn đề performance

In [None]:
# JavaScript code có vấn đề performance
performance_issue_js = """
function processLargeDataset(data) {
    let result = [];
    
    // Inefficient nested loops
    for (let i = 0; i < data.length; i++) {
        for (let j = 0; j < data.length; j++) {
            if (data[i].id === data[j].relatedId) {
                result.push({
                    item: data[i],
                    related: data[j]
                });
            }
        }
    }
    
    // Inefficient array operations
    let filtered = [];
    for (let item of result) {
        if (item.item.active) {
            filtered.push(item);
        }
    }
    
    // Inefficient sorting
    filtered.sort((a, b) => {
        return new Date(a.item.createdAt) - new Date(b.item.createdAt);
    });
    
    return filtered;
}

// Memory leak potential
let globalCache = {};
function cacheData(key, data) {
    globalCache[key] = data; // Never cleaned up
}
"""

print("🔍 Đang review JavaScript code có vấn đề performance...")
result = review_pipeline.comprehensive_review(performance_issue_js, "inefficient_processor.js")

print(f"\n📊 KẾT QUẢ REVIEW:")
print(f"File: {result['filename']}")
print(f"Ngôn ngữ: {result['language']}")
print(f"Tổng số vấn đề: {result['summary']['total_issues']}")
print(f"Điểm tổng thể: {result['summary']['overall_score']}/10")

# Hiển thị performance issues
performance_issues = [issue for issue in result['all_issues'] if issue.get('type') == 'performance']
print(f"\n⚡ VẤN ĐỀ PERFORMANCE ({len(performance_issues)}):")
for i, issue in enumerate(performance_issues, 1):
    print(f"{i}. {issue.get('description', 'No description')}")
    if issue.get('suggestion'):
        print(f"   💡 Gợi ý: {issue['suggestion']}")
    if issue.get('impact'):
        print(f"   📈 Tác động: {issue['impact']}")
    print()

## Ví dụ 3: Review Code với Best Practices

In [None]:
# Python code cần cải thiện best practices
poor_practices_code = """
def calc(a,b,op):
    if op=="+":
        return a+b
    elif op=="-":
        return a-b
    elif op=="*":
        return a*b
    elif op=="/":
        return a/b
    else:
        return None

def process_data(data):
    result=[]
    for item in data:
        try:
            val=item['value']
            if val>0:
                result.append(val*2)
        except:
            pass
    return result

# Global variables
CONFIG={}
TEMP_DATA=[]

class DataProcessor:
    def __init__(self):
        self.data=None
        
    def load_data(self,filename):
        # No error handling
        with open(filename) as f:
            self.data=f.read()
            
    def process(self):
        # Magic numbers
        if len(self.data)>1000:
            return self.data[:500]
        return self.data
"""

print("🔍 Đang review code về best practices...")
result = review_pipeline.comprehensive_review(poor_practices_code, "poor_practices.py")

print(f"\n📊 KẾT QUẢ REVIEW:")
print(f"File: {result['filename']}")
print(f"Tổng số vấn đề: {result['summary']['total_issues']}")
print(f"Điểm tổng thể: {result['summary']['overall_score']}/10")

# Hiển thị best practice issues
bp_issues = [issue for issue in result['all_issues'] if issue.get('type') == 'best_practice']
print(f"\n📋 VẤN ĐỀ BEST PRACTICES ({len(bp_issues)}):")
for i, issue in enumerate(bp_issues, 1):
    print(f"{i}. [{issue.get('category', 'general')}] {issue.get('description', 'No description')}")
    if issue.get('suggestion'):
        print(f"   💡 Gợi ý: {issue['suggestion']}")
    print()

## Tính năng Feedback và Đánh giá

In [None]:
def submit_review_feedback(review_id: str, feedback_data: Dict):
    """Gửi feedback cho review để cải thiện model"""
    langfuse.score(
        trace_id=review_id,
        name="review_quality",
        value=feedback_data.get("quality_score", 5),
        comment=feedback_data.get("comment", "")
    )
    
    langfuse.score(
        trace_id=review_id,
        name="review_helpfulness",
        value=feedback_data.get("helpfulness_score", 5),
        comment=feedback_data.get("helpfulness_comment", "")
    )
    
    langfuse.score(
        trace_id=review_id,
        name="review_accuracy",
        value=feedback_data.get("accuracy_score", 5),
        comment=feedback_data.get("accuracy_comment", "")
    )

# Ví dụ submit feedback
sample_feedback = {
    "quality_score": 8,
    "comment": "Review rất chi tiết và có gợi ý cụ thể",
    "helpfulness_score": 9,
    "helpfulness_comment": "Giúp phát hiện được lỗi nghiêm trọng",
    "accuracy_score": 7,
    "accuracy_comment": "Một vài gợi ý chưa hoàn toàn chính xác"
}

print("✅ Tính năng feedback đã được setup")
print("Developers có thể đánh giá chất lượng review để cải thiện model")

## Batch Review Multiple Files

In [None]:
@observe()
def batch_code_review(code_files: Dict[str, str]) -> Dict:
    """Review multiple files cùng lúc"""
    langfuse_context.update_current_observation(
        name="batch_code_review",
        input={"files_count": len(code_files)},
        metadata={"files": list(code_files.keys())}
    )
    
    results = {}
    total_issues = 0
    critical_issues = 0
    
    for filename, code in code_files.items():
        print(f"🔍 Reviewing {filename}...")
        result = review_pipeline.comprehensive_review(code, filename)
        results[filename] = result
        
        total_issues += result['summary']['total_issues']
        critical_issues += result['summary']['critical_issues']
    
    # Tạo summary report
    summary = {
        "total_files": len(code_files),
        "total_issues": total_issues,
        "critical_issues": critical_issues,
        "avg_score": sum(r['summary']['overall_score'] for r in results.values()) / len(results),
        "files_with_critical": len([r for r in results.values() if r['summary']['critical_issues'] > 0])
    }
    
    langfuse_context.update_current_observation(
        output=summary,
        metadata=summary
    )
    
    return {
        "summary": summary,
        "results": results
    }

# Ví dụ batch review
sample_codebase = {
    "auth.py": """
def authenticate(username, password):
    # Vulnerable password check
    if password == "admin123":
        return True
    return False
""",
    "utils.py": """
def slow_search(data, target):
    # O(n²) search
    for i in range(len(data)):
        for j in range(len(data)):
            if data[i] == target:
                return i
    return -1
""",
    "config.py": """
DATABASE_URL="postgresql://user:pass@localhost/db"
API_KEY="sk-1234567890abcdef"
DEBUG=True
"""
}

print("🔍 Bắt đầu batch review...")
batch_results = batch_code_review(sample_codebase)

print(f"\n📊 BATCH REVIEW SUMMARY:")
print(f"Tổng số files: {batch_results['summary']['total_files']}")
print(f"Tổng số vấn đề: {batch_results['summary']['total_issues']}")
print(f"Vấn đề nghiêm trọng: {batch_results['summary']['critical_issues']}")
print(f"Điểm trung bình: {batch_results['summary']['avg_score']:.2f}/10")
print(f"Files có vấn đề nghiêm trọng: {batch_results['summary']['files_with_critical']}")

# Top issues across all files
all_issues = []
for filename, result in batch_results['results'].items():
    for issue in result['all_issues']:
        issue['filename'] = filename
        all_issues.append(issue)

# Sort by severity
severity_order = {'critical': 0, 'high': 1, 'medium': 2, 'low': 3}
all_issues.sort(key=lambda x: severity_order.get(x.get('severity', 'low'), 3))

print(f"\n🚨 TOP 5 ISSUES NGHIÊM TRỌNG NHẤT:")
for i, issue in enumerate(all_issues[:5], 1):
    print(f"{i}. [{issue['filename']}] {issue.get('description', 'No description')}")
    print(f"   Mức độ: {issue.get('severity', 'unknown')}")
    print()

## Analytics và Monitoring

In [None]:
def analyze_review_metrics():
    """Phân tích metrics từ LangFuse để cải thiện review quality"""
    
    print("📈 ANALYTICS DASHBOARD:")
    print("\n🎯 Để xem chi tiết analytics:")
    print("1. Truy cập LangFuse Dashboard: http://localhost:3000")
    print("2. Xem Traces tab để theo dõi từng review session")
    print("3. Xem Scores tab để phân tích feedback")
    print("4. Sử dụng Playground để test và optimize prompts")
    
    print("\n📊 Key Metrics cần theo dõi:")
    metrics = {
        "Review Quality Score": "Đánh giá chất lượng tổng thể của review",
        "Accuracy Score": "Độ chính xác của việc phát hiện issues", 
        "Helpfulness Score": "Mức độ hữu ích của gợi ý",
        "Response Time": "Thời gian xử lý review",
        "Issues Detection Rate": "Tỷ lệ phát hiện issues thực tế",
        "False Positive Rate": "Tỷ lệ báo sai issues"
    }
    
    for metric, description in metrics.items():
        print(f"• {metric}: {description}")
    
    print("\n🔧 Optimization Strategies:")
    strategies = [
        "A/B test các prompt templates khác nhau",
        "Fine-tune model dựa trên feedback", 
        "Tối ưu hóa prompt cho từng loại code (language-specific)",
        "Implement rule-based post-processing để filter false positives",
        "Sử dụng ensemble của multiple models"
    ]
    
    for i, strategy in enumerate(strategies, 1):
        print(f"{i}. {strategy}")

analyze_review_metrics()

## Production Deployment Patterns

In [None]:
# Ví dụ integration với CI/CD pipeline
cicd_integration_example = """
# .github/workflows/code-review.yml
name: AI Code Review

on:
  pull_request:
    types: [opened, synchronize]

jobs:
  ai-review:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v3
      
      - name: Setup Python
        uses: actions/setup-python@v4
        with:
          python-version: '3.9'
          
      - name: Install dependencies
        run: |
          pip install langfuse langchain-anthropic
          
      - name: Run AI Code Review
        env:
          LANGFUSE_SECRET_KEY: ${{ secrets.LANGFUSE_SECRET_KEY }}
          LANGFUSE_PUBLIC_KEY: ${{ secrets.LANGFUSE_PUBLIC_KEY }}
          ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}
        run: |
          python scripts/ai_code_review.py --pr-number ${{ github.event.number }}
          
      - name: Comment PR
        uses: actions/github-script@v6
        with:
          script: |
            const fs = require('fs');
            const review = fs.readFileSync('review_results.json', 'utf8');
            const data = JSON.parse(review);
            
            let comment = '## 🤖 AI Code Review\n\n';
            comment += `**Overall Score**: ${data.overall_score}/10\n`;
            comment += `**Total Issues**: ${data.total_issues}\n\n`;
            
            if (data.critical_issues > 0) {
              comment += '🚨 **Critical Issues Found**\n\n';
            }
            
            github.rest.issues.createComment({
              issue_number: context.issue.number,
              owner: context.repo.owner,
              repo: context.repo.repo,
              body: comment
            });
"""

print("🚀 PRODUCTION DEPLOYMENT PATTERNS:")
print("\n1. 🔄 CI/CD Integration:")
print("   • Tự động review mỗi Pull Request")
print("   • Comment kết quả trực tiếp trên PR")
print("   • Block merge nếu có critical issues")

print("\n2. 📊 Monitoring & Alerts:")
print("   • Setup alerts khi review quality giảm")
print("   • Monitor API usage và costs")
print("   • Track false positive rates")

print("\n3. 🔧 Configuration Management:")
print("   • Environment-specific prompts")
print("   • Language-specific review rules")
print("   • Team-specific coding standards")

print("\n4. 🛡️ Security & Compliance:")
print("   • Ensure code không được gửi ra external services")
print("   • Implement rate limiting")
print("   • Audit logs cho all review activities")

with open('/tmp/example_cicd.yml', 'w') as f:
    f.write(cicd_integration_example)
    
print("\n✅ Example CI/CD config đã được lưu tại /tmp/example_cicd.yml")

## Tài liệu Tham khảo

### LangFuse Documentation
- **Tracing & Observability**: https://langfuse.com/docs/tracing
- **Prompt Management**: https://langfuse.com/docs/prompts
- **Evaluation & Scoring**: https://langfuse.com/docs/scores
- **Python Integration**: https://langfuse.com/docs/integrations/langchain
- **Dashboard & Analytics**: https://langfuse.com/docs/analytics

### Best Practices
- **Production Deployment**: https://langfuse.com/docs/deployment
- **Security Guidelines**: https://langfuse.com/docs/data-security-privacy
- **Performance Optimization**: https://langfuse.com/docs/performance

### Code Review Resources
- **OWASP Code Review Guide**: https://owasp.org/www-project-code-review-guide/
- **Google Code Review Guidelines**: https://google.github.io/eng-practices/review/
- **Static Analysis Tools**: SonarQube, CodeClimate, ESLint

## Kết luận & Bước tiếp theo

### Những gì đã học được:
1. **Thiết kế Code Review Pipeline** với LangFuse để theo dõi chất lượng
2. **Implement Multi-aspect Review** (security, performance, best practices)
3. **Batch Processing** cho multiple files
4. **Feedback Loop** để cải thiện model liên tục
5. **Production Deployment** patterns và CI/CD integration

### Bước tiếp theo:
1. **Customize Prompts** cho specific domains/languages
2. **Implement Rule-based Post-processing** để giảm false positives
3. **Integrate với IDE** (VS Code extension, IntelliJ plugin)
4. **Setup A/B Testing** cho different prompt strategies
5. **Build Knowledge Base** từ historical review data
6. **Implement Real-time Review** trong development workflow

### Advanced Features:
- **Multi-model Ensemble** (combine multiple LLMs)
- **Context-aware Review** (understand project architecture)
- **Learning from Fixes** (track how developers fix reported issues)
- **Team-specific Customization** (different standards for different teams)