NLPete

Simple, self-contained, PyTorch NLP models.

Quick start

Python >= 3.9 is required.

from nlpete.gpt import *

# Initialize a GPT model and tokenizer from pretrained weights on HuggingFace:
gpt2 = GPT.from_pretrained("gpt2").eval()
tokenizer = GPTTokenizer.from_pretrained("gpt2")

# Tokenize inputs for passing into the model:
inputs = tokenizer(["Hello, I'm a language model,"])

# Generate tokens with beam search:
generated = gpt2.generate(
    inputs["input_ids"],
    attention_mask=inputs["attention_mask"],
    max_steps=20,
    beam_size=5,
    sampler=GumbelSampler(0.7),
    constraints=[RepeatedNGramBlockingConstraint(1)],
)
for generation in tokenizer.decode_torch(generated.token_ids[0]):
    print(generation)

Name		Name	Last commit message	Last commit date
Latest commit History 61 Commits
.github		.github
nlpete		nlpete
scripts		scripts
tests		tests
.flake8		.flake8
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
RELEASE_PROCESS.md		RELEASE_PROCESS.md
dev-requirements.txt		dev-requirements.txt
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

License

epwalsh/nlpete

Folders and files

Latest commit

History

Repository files navigation

NLPete

Quick start

About

Resources

License

Stars

Watchers

Forks

Languages