Add support for HuggingFace's TensorFlow models #127

valeriosofi · 2022-12-21T09:23:27Z

New Feature:

This PR implements support for HuggingFace's TensorFlow models, solving #125.
It also adds a notebook that shows a use case with BERT.

Example of usage:

from speedster import optimize_model
from transformers import TFAutoModel, AutoTokenizer

# Make sure to always load a matching tokenizer and model!
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = TFAutoModel.from_pretrained("bert-base-cased")

# Let's load some data and tokenize it
test_string = "This is a sentence!"
tokenized_inputs = tokenizer(test_string, return_tensors="np")

dynamic_info = {
    "inputs": [
        {0: "batch", 1: "num_tokens"},
        {0: "batch", 1: "num_tokens"},
        {0: "batch", 1: "num_tokens"},
    ],
    "outputs": [{0: "batch", 1: "num_tokens"}, {0: "batch"}],
}

# Run Speedster optimization
optimized_model = optimize_model(
  model, input_data=[tokenized_inputs], dynamic_info=dynamic_info
)

Minor changes:

Added a warning when dynamic_info is not provided with HuggingFace models
The final report on the optimized model now contains also the name of the compiler used
Fix a tvm issue when using the PyTorch implementation with gpu
Added dynamic shape support for optimized models converted from TensorFlow to ONNX
Fixed an issue that caused a wrong output shape for the models optimized with the neural compressor
Enabled openVINO compiler when using python 3.10

…models (#1) * add optimized model type info

nebuly-ai

LGTM!

…tion results

merge

nebullvm/installers/installers.py

apps/accelerate/speedster/speedster/api/tests/test_tensorflow.py

nebullvm/operations/inference_learners/neural_compressor.py

diegofiori · 2023-01-03T11:11:12Z

@valeriosofi why was the azure test cancelled?

valeriosofi · 2023-01-03T11:24:23Z

@valeriosofi why was the azure test cancelled?

Because there was a bug, so there was no reason to perform the tests, they would have failed

apps/accelerate/speedster/requirements.txt

apps/accelerate/speedster/setup.py

apps/accelerate/speedster/speedster/root_op.py

diegofiori · 2023-01-03T14:23:51Z

Closes #125 and #103

valeriosofi added 25 commits December 21, 2022 10:06

added support for for HuggingFace's TensorFlow models

871161c

fix

f6e498d

fix

1d21079

fix

3cc3bad

added notebook for HuggingFace's tensorflow bert model

01ade06

fix

faccd23

fix

495f2ad

change nebullvm name in logs

a2c6f64

Add optimized model details + warning if static shape is used for HF …

1232091

…models (#1) * add optimized model type info

fix tvm issue

53f7d78

edit dockerfile and add image auto building

6acb926

add docker installation on azure pipeline

dfcdadd

fix docker permission error

369af08

fix docker permission error

5e73e9e

fix docker permission error

ac97106

fix docker permission error

2c76a42

fix bug

2450d71

fix tensorflow bug

e76982a

fix tensorflow bug

82c0be0

fix tensorflow

bb73213

fix tensorflow

054909d

fix bug in neural compressor output shape

76e2f35

Merge branch 'main' into main

ce31a61

add support for openvino with python 3.10

724c5fe

add build docker image to azure pipelines

f614e17

nebuly-ai approved these changes Jan 3, 2023

View reviewed changes

valeriosofi added 2 commits January 3, 2023 12:07

revert docker build from az pipelines and edit format of the optimiza…

022f22f

…tion results

Merge branch 'main' of https://github.com/valeriosofi/nebullvm

158653f

merge

diegofiori reviewed Jan 3, 2023

View reviewed changes

nebullvm/installers/installers.py Show resolved Hide resolved

apps/accelerate/speedster/speedster/api/tests/test_tensorflow.py Show resolved Hide resolved

nebullvm/operations/inference_learners/neural_compressor.py Show resolved Hide resolved

revert docker build from az pipelines

ba00516

added tabulate to setup.py and general fixes

d12400e

diegofiori reviewed Jan 3, 2023

View reviewed changes

apps/accelerate/speedster/requirements.txt Outdated Show resolved Hide resolved

apps/accelerate/speedster/setup.py Outdated Show resolved Hide resolved

apps/accelerate/speedster/speedster/root_op.py Outdated Show resolved Hide resolved

fixes

7cc555c

diegofiori merged commit e24d943 into nebuly-ai:main Jan 3, 2023

This was referenced Jan 3, 2023

Add support for Huggingface TensorFlow models #125

Closed

DeepSparse and OpenVINO are not working with python 3.10 #103

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add support for HuggingFace's TensorFlow models #127

Add support for HuggingFace's TensorFlow models #127

valeriosofi commented Dec 21, 2022 •

edited

nebuly-ai left a comment

diegofiori commented Jan 3, 2023

valeriosofi commented Jan 3, 2023

diegofiori commented Jan 3, 2023

Add support for HuggingFace's TensorFlow models #127

Add support for HuggingFace's TensorFlow models #127

Conversation

valeriosofi commented Dec 21, 2022 • edited

nebuly-ai left a comment

Choose a reason for hiding this comment

diegofiori commented Jan 3, 2023

valeriosofi commented Jan 3, 2023

diegofiori commented Jan 3, 2023

valeriosofi commented Dec 21, 2022 •

edited