In [None]:
import tensorflow as tf

## 1. Dynamic Range Quantization (동적 범위 양자화)

In [None]:
saved_model_dir = 'saved_model/'

# TFLite Converter 생성
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)

# 동적 범위 양자화 설정
converter.optimizations = [tf.lite.Optimize.DEFAULT]

# TFLite 모델로 변환
tflite_model = converter.convert()

# 변환된 모델 저장
with open('quantized_model/yamnet_dynamic_quant.tflite', 'wb') as f:
    f.write(tflite_model)


## 2. Full Integer Quantization (정수 양자화)

In [None]:
saved_model_dir = 'saved_model/'

# TFLite Converter 생성
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)

# 정수 양자화 설정
converter.optimizations = [tf.lite.Optimize.DEFAULT]

# 훈련 또는 추가 데이터 없이 바로 정수 양자화 진행
converter.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS_INT8]

# 모든 텐서를 8비트 정수로 변환
converter.inference_input_type = tf.uint8
converter.inference_output_type = tf.uint8

# TFLite 모델로 변환
tflite_model = converter.convert()

# 변환된 모델 저장
with open('quantized_model/yamnet_full_integer_quant.tflite', 'wb') as f:
    f.write(tflite_model)

## 3. Float16 Quantization (FP16 양자화)

In [None]:
saved_model_dir = 'saved_model/'

# TFLite Converter 생성
converter = tf.lite.TFLiteConverter.from_saved_model(saved_model_dir)

# FP16 양자화 설정
converter.optimizations = [tf.lite.Optimize.DEFAULT]
converter.target_spec.supported_types = [tf.float16]

# TFLite 모델로 변환
tflite_model = converter.convert()

# 변환된 모델 저장
with open('quantized_model/yamnet_fp16_quant.tflite', 'wb') as f:
    f.write(tflite_model)
