🧬 Semantic Echo: Representasi Vektor Dampak Karya Ilmiah

"Sitasi adalah percakapan. AI seharusnya membaca nada dan jedanya, bukan hanya menghitung volume suaranya."

📖 Deskripsi

Semantic Echo adalah framework analisis sitasi berbasis Graph Neural Networks (GNN) yang mengukur kedalaman pengaruh konseptual (influence depth) antar karya ilmiah. Berbeda dengan metrik tradisional seperti H-index atau jumlah sitasi yang hanya menghitung kuantitas, Semantic Echo menganalisis kualitas dan kedalaman pengaruh dengan cara membandingkan perubahan vektor representasi makalah sebelum dan setelah sitasi terjadi.

🎯 Masalah yang Diselesaikan

Metrik sitasi konvensional tidak dapat membedakan antara:

Kutipan perfunctory (sekilas/formalitas)
Kutipan transformatif (yang mengubah arah penelitian fundamental)

Semantic Echo menjawab pertanyaan: "Seberapa banyak 'DNA konseptual' Paper A mengubah vektor penelitian Paper B?"

🧠 Pendekatan Teknis

Konstruksi Graf Heterogen Dinamis:
- Node: Makalah, Penulis, Jurnal, Institusi, Kata Kunci (Keyphrase)
- Edge: Sitasi, Co-Authorship, Publikasi di, Afiliasi, Kesamaan Semantik
- Mengadopsi pendekatan Heterogeneous Dynamical Graph Neural Network (SI-HDGNN) untuk graf akademik berbobot, terarah, dan teratribusi
Arsitektur GNN:
- Menggunakan GraphSAGE atau GAT (Graph Attention Networks) untuk agregasi tetangga
- Node Features: Embedding teks dari abstrak (menggunakan SciBERT), fitur struktural (degree centrality), dan fitur temporal (tahun publikasi)
- Menghasilkan vectorized representations untuk setiap node yang dapat di-train
Metrik "Semantic Echo":
- Mengukur cosine similarity antara vektor Paper A pada waktu t dengan vektor Paper B pada waktu t+n
- Bukan sekadar prediksi link, tetapi perubahan embedding space yang disebabkan oleh kemunculan suatu karya

🚀 Instalasi Cepat

# 1. Clone repositori
git clone https://github.com/stipwunaraha/citation-graph-neural-embedding.git
cd citation-graph-neural-embedding

# 2. Buat virtual environment
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 3. Instal semua dependensi
pip install -r requirements.txt

# 4. Instal package untuk pengembangan (opsional)
pip install -e .

💻 Penggunaan Dasar

from semantic_echo import CitationGraph, InfluencePredictor

# Muat dataset (misal: subset DBLP atau OpenAlex)
graph = CitationGraph.from_openalex(doi_list=["10.xxx/paper1", "10.xxx/paper2"])

# Latih model GNN
predictor = InfluencePredictor(graph)
predictor.train(epochs=100)

# Dapatkan "Echo Score" antara dua makalah
score = predictor.echo_score(source_doi="10.xxx/paper1", target_doi="10.xxx/paper2")
print(f"Kedalaman pengaruh: {score:.4f}")

📦 Struktur Repositori

citation-graph-neural-embedding/
├── semantic_echo/       # Source code utama
│   ├── __init__.py      # Inisialisasi package
│   ├── data_loader.py   # Loader dataset (OpenAlex, arXiv, DBLP)
│   ├── embeddings.py    # Pembangkitan embedding (SciBERT, dll.)
│   ├── graph.py         # Konstruksi dan manipulasi graf
│   ├── models.py        # Model GNN (GraphSAGE, GAT, dll.)
│   └── metrics.py       # Metrik evaluasi (Echo Score, dll.)
├── tests/               # Unit test dan integration test
├── configs/             # File konfigurasi YAML
├── examples/            # Contoh penggunaan dan notebook
├── utils/               # Fungsi utilitas tambahan
├── requirements.txt     # Daftar dependensi Python
├── setup.py            # Setup script untuk instalasi package
└── docs/               # Dokumentasi lengkap

📊 Dataset Target

OpenAlex: API terbuka dengan data sitasi lengkap
arXiv + Semantic Scholar: Untuk data teks dan graf sitasi
DBLP: Data publikasi ilmu komputer

🛠️ Teknologi Utama

Kategori	Library/Framework
Deep Learning	PyTorch ≥ 2.0, PyTorch Geometric ≥ 2.3
NLP	Transformers (SciBERT), Sentence Transformers
Scientific Computing	NumPy, SciPy, Pandas
Visualisasi	Matplotlib, NetworkX
Testing	pytest, pytest-cov
Development	black, flake8

🗺️ Roadmap

✅ Implementasi dasar GCN/GAT dengan PyTorch Geometric
✅ Integrasi SciBERT untuk node features
🔄 Skrip scraper untuk OpenAlex
🔄 Evaluasi terhadap metrik "Disruption Index" sebagai baseline
📋 Dashboard visualisasi interaktif
📋 API REST untuk akses programatik

🤝 Kontribusi

Kami sangat terbuka untuk kontribusi! Cara memulai:

Baca CONTRIBUTING.md untuk panduan detail
Cek Issues untuk tugas yang tersedia
Fork repositori dan buat pull request

📄 Lisensi

Proyek ini dilisensikan di bawah Lisensi MIT - lihat berkas LICENSE untuk detail.

Penulis & Kontributor: @stipwunaraha dan komunitas

Kata Kunci: Graph Neural Networks, Citation Analysis, Academic Impact, Semantic Similarity, PyTorch, Scientometrics

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.github		.github
configs		configs
examples		examples
semantic_echo		semantic_echo
tests		tests
utils		utils
.gitignore		.gitignore
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
DESIGN.md		DESIGN.md
INSTALL.md		INSTALL.md
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🧬 Semantic Echo: Representasi Vektor Dampak Karya Ilmiah

📖 Deskripsi

🎯 Masalah yang Diselesaikan

🧠 Pendekatan Teknis

🚀 Instalasi Cepat

💻 Penggunaan Dasar

📦 Struktur Repositori

📊 Dataset Target

🛠️ Teknologi Utama

🗺️ Roadmap

🤝 Kontribusi

📄 Lisensi

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🧬 Semantic Echo: Representasi Vektor Dampak Karya Ilmiah

📖 Deskripsi

🎯 Masalah yang Diselesaikan

🧠 Pendekatan Teknis

🚀 Instalasi Cepat

💻 Penggunaan Dasar

📦 Struktur Repositori

📊 Dataset Target

🛠️ Teknologi Utama

🗺️ Roadmap

🤝 Kontribusi

📄 Lisensi

About

Resources

License

Code of conduct

Contributing

Security policy

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages