Skip to content

apinball/2026NLP

Repository files navigation

Reverse Job Engineering + Logic Auditor

채용공고의 암묵적 요구 역량을 추론하고, 포트폴리오·이력서의 논리적 모순을 탐지하는 통합 NLP 파이프라인.

구조

├── Dockerfile / docker-compose.yml    # 실행 환경
├── requirements.txt / .env.example    # 의존성 & 설정
├── data/ontology_seed.json            # 기술 온톨로지 시드 (30개)
├── src/
│   ├── config.py                      # 환경변수 로딩
│   ├── main.py                        # 데모 엔트리
│   ├── reverse_job/                   # Module A
│   │   ├── extractor.py               # 키워드 사전 + KoELECTRA NER
│   │   ├── arm_miner.py               # Apriori 공동출현 분석
│   │   ├── llm_reasoner.py            # Chain-of-Thought (LLM 미정, Protocol 주입)
│   │   └── pipeline.py
│   └── logic_auditor/                 # Module B
│       ├── ontology.py                # TechEntry 인덱스
│       ├── rule_based.py              # 연도/버전 팩트 검증
│       ├── ml_detector.py             # Perplexity + Burstiness
│       └── pipeline.py                # 신뢰도 점수 산출
└── tests/                             # pytest 스모크 테스트

빠른 시작

cp .env.example .env
docker compose build
docker compose run --rm app                                    # 전체 데모
docker compose run --rm app python -m src.main --module rje    # Module A만
docker compose run --rm app python -m src.main --module audit  # Module B만
docker compose run --rm app python -m src.main --use-ml        # AI 생성 탐지 활성화
docker compose run --rm app pytest -q                          # 테스트 실행

설정 항목 (.env)

변수 기본값 용도
HF_NER_MODEL_KO monologg/koelectra-base-v3-finetuned-naver-ner 한국어 NER
HF_NER_MODEL_EN dslim/bert-base-NER 영문 NER
HF_PPL_MODEL skt/kogpt2-base-v2 Perplexity 계산

LLM 연동 (미정)

Module A 의 LLMReasonerLLMClient Protocol 로 LLM 을 외부 주입받는다. 사용할 LLM(Anthropic / OpenAI / 로컬 HF / Ollama 등)이 확정되면 아래 형태의 어댑터를 만들어 주입한다.

class MyLLM:
    def complete(self, prompt: str) -> str:
        ...  # 팀에서 결정한 LLM 호출

from src.reverse_job.llm_reasoner import LLMReasoner
reasoner = LLMReasoner(client=MyLLM())

파이프라인 요약

Module A — Reverse Job Engineering

  1. JobExtractor 가 채용공고 → 명시적 tech stack + 경력 추출
  2. ARMMiner 가 동일 직군 코퍼스로 Apriori 규칙 학습 → 누락된 공통 역량 도출
  3. LLMReasoner 가 Chain-of-Thought 로 실무 맥락 추론 → 앙상블

Module B — Logic Auditor

  1. RuleBasedAuditor 가 온톨로지 DB 대조로 출시연도/버전 모순 탐지
  2. AIGenerationDetector 가 perplexity·burstiness 로 AI 생성 신호 측정
  3. LogicAuditorPipeline 이 위반 수 × 페널티 + AI 확률로 신뢰도 점수(0–100) 산출

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors