Skip to content

SchemaBio/EVOScore-2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

EVOScore-2

MIT License

基于 ESM-2 的蛋白质突变评分与后处理工具。

功能

  • VCF 注释: 使用预打分文件批量注释 VCF
  • ClinVar 基准测试: 过滤、拆分、阈值校准、性能评估

安装

基础安装(推荐,用于预打分文件流程)

pip install -e .

完整安装(包含 ESM-2 模型打分功能)

pip install -e .[model]

命令

转换Parquet到Vcf

evoscore2 to-vcf --scores hg38_VESM_3B_scores.parquet.gzip --output hg38_VESM_3B_scores.vcf.gz --backend polars

ClinVar 基准测试流程

# 1. 清洗 ClinVar
evoscore2 filter-clinvar --input clinvar.vcf.gz --output clinvar_filtered.vcf.gz

# 2. 拆分数据集 (2:8)
evoscore2 split-clinvar --input clinvar_filtered.vcf.gz --scores hg38_VESM_3B_scores.parquet.gzip --output split_results

# 3. 计算阈值 (训练集)
evoscore2 calibrate-precision --input split_results/train.csv --output threshold.json --ppv 0.95 --npv 0.95

# 4. Benchmark (测试集)
evoscore2 benchmark --input split_results/test.csv --p-threshold -11.6 --b-threshold -8.5 --output benchmark.json

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages