MUSIED

Dataset and baselines for paper "MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous Informal Texts".

Data

The dataset can be obtained from the “data” folder. The data format is introduced in this document.

Data preprocess

Run preprocessing.py to obtain the sentence-level input of model. The result is saved in data directory.

├── data
│     └── train_sentence.json
│     └── dev_sentence.json
│     └── test_sentence.json

Codes

We release the source codes for the baselines, including

sentence-level models:

--DMCNN

--BiLSTM

--BERT

--C-BiLSTM

--DMBERT

document-level models

--HBTNGMA

--MLBiNet.

Name		Name	Last commit message	Last commit date
Latest commit History 133 Commits
code		code
data		data
LICENSE		LICENSE
README.md		README.md
preprocessing.py		preprocessing.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MUSIED

Data

Data preprocess

Codes

About

Releases

Packages

Contributors 2

Languages

License

myeclipse/MUSIED

Folders and files

Latest commit

History

Repository files navigation

MUSIED

Data

Data preprocess

Codes

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages