PunjabiLLM eval

What is currently covered:

Common sense reasoning: Hellaswag, Winogrande, PIQA, OpenbookQA, ARC-Easy, ARC-Challenge
World knowledge: NaturalQuestions, TriviaQA
Reading comprehension: BoolQ
Alpaca dataset

Run translation

Finally run (note model, translation_project_id and model_args are not important for us but we need to specify them):

python main.py \
    --model hf \
    --model_args pretrained=mistralai/Mistral-7B-v0.1 \
    --tasks hellaswag \
    --translation_project_id 123
    --char_limit 500000
    --start_from_doc_index 0

Contact

You can find me @kdcyberdude

For any queries regarding the work, please reach out at kdsingh.cyberdude@gmail.com or https://linkedin.com/in/kdcyberdude

Name		Name	Last commit message	Last commit date
Latest commit History 1,539 Commits
.vscode		.vscode
docs		docs
lm_eval		lm_eval
scripts		scripts
serbian_eval		serbian_eval
templates		templates
tests		tests
.coveragerc		.coveragerc
.flake8		.flake8
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
CITATION.bib		CITATION.bib
CODEOWNERS		CODEOWNERS
Dockerfile		Dockerfile
LICENSE.md		LICENSE.md
README.md		README.md
ignore.txt		ignore.txt
main.py		main.py
pile_statistics.json		pile_statistics.json
requirements.txt		requirements.txt
setup.py		setup.py
transliterate_cyrillic_to_latin.py		transliterate_cyrillic_to_latin.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PunjabiLLM eval

What is currently covered:

Run translation

Contact

About

Releases

Packages

Languages

License

kdcyberdude/punjabi-llm-eval

Folders and files

Latest commit

History

Repository files navigation

PunjabiLLM eval

What is currently covered:

Run translation

Contact

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages