# 안드로이드로 하는 딥러닝
Deep learning with Android

- 기계학습 모델을 서버에 두고, 스마트폰의 앱/웹브라우저는 입출력만 수행. 

  - 스마트폰/웹브라우저에서 데이터 입출력하는 방법을 배우면 됨.

  - **단점**: 

    1. 항상 온라인 상태여야 함. 

    2. 모델을 수정하면 다시 배포해야 함.
    3. PC에서 수행했던 전처리를 스마트폰에서 다시 수행해야 하는데 이 때 언어나 프레임워크가 지원이 안 될 수 있음.
    4. OpenCV 같은 경우 언어 별로 별도로 라이브러리가 존재. 모든 디바이스에서 C++ 지원.

  - **장점**: 모델을 한 번만 생성, 온라인 아니어도 사용 가능.

  - 1) 스마트폰/웹 브라우저에 기계 학습 모델을 저장해 스마트폰/웹 브라우저가 작업을 수행, 출력하도록 함. 

    2) 모델 자체는 일반적으로 PC에서 만들고 이를 스마트폰이나 웹브라우저에서 사용할 수 있도록 변환.

    3) Keras:

       - 안드로이드에서 동작하는 TensorFlow Light (tflite)이 있음.

       - 웹브라우저용 TensorFlow.js 모델로 변환해서 사용

- 딥러닝

  1. Workflow: TensorFlow Light 모델 개발

     - 모델 생성 - 모델 변환 - 기기 배포 - 모델 최적화(다시 모델 변환 작업을 하는 경우도 있음)

  2. 모델 생성(이 단계에서 최적화 할 수도 있음)

     - 직접 생성하거나 이미 개발된 모델 이용

       1) 모델 직접 개발: 설계 >> 학습 >> 변환

          - 사전 학습 모델 이용(tf): 학습 >> 변환의 과정이나 변환만으로 사용
          - 사전 학습 모델 이용(tflite): 아무런 작업도 할 필요가 없음
            - keras 모듈에서 제공하기도 하고  Tensorfloor Hub provides the model.
            -  이미지 분류, 객체 탐지, 입지 분할, 자세 추정, 스타일 변환, 텍스트 분류, 질의 응답, 스마트 답장(챗봇)
          - 전이 학습: 학습 >> 변환
            - 학습이 완료된 모델을 다른 문제에 다시 학습
          - 텐서플로우 허브 tfhub.dev
          - 텐서플로우 허브 
          - Papers with Code paperswidcode.com/sorta

          - 데이터셋:
            - ft dataset, google research dataset. google cloud dataset용, kaggle dataset
    - 모델 평가

  3. 모델 변환

     - tflite로 변환(확장자가 .tflite가 일반적)

  4. 기기 배포

     - 안드로이드 프로젝트의  assets 디렉토리에 변환된 모델을 복사.
       - 처음에 복사하지 않고 앱을 실행할 때 서버에서 다운로드 받아도 됨.
     - assets 디렉토리와 res 디렉토리의 차이:
       -  assets 디렉토리의 내용은 필요할 때 읽어옴
       - res 디렉토리의 내용은 

  5. 모델 최적화

     - 모델을 만들 때도 수행하지만 안드로이드 기기에서 최적화 되었는지 다시 확인하기도 함.

5) MNIST 데이터셋을 이용해 손글씨 분류 모델 만들기
   - 저수준 API (tensorflow, Theano, CNTK)나 고수준 API (Keras, Pytorch)에서 하나를 선택
   - 데이터 준비: tensorflow dataset
     - 70,000장의 이미지(28*28)
     - X_train: 60,000장 
     - y_train: 10,000장
     - y_test: 



## 데이터 준비

In [1]:
import tensorflow as tf

mnist = tf.keras.datasets.mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()


In [2]:
# feature scaling (data normalisation)
# 정규화를 했을 때 정확도가 하지 않았을 때보다 높게 나옴
# 원본 데이터 범위 0 ~ 255  ---> 정규화 범위 0.0 ~ 1.0 
X_train, X_test = X_train/255.0, X_test/255.0

## 모델 생성

In [None]:
# 모델 생성
mlp_model = tf.keras.models.Sequential([
                                        tf.keras.layers.Flatten(input_shape=(28, 28)),
                                        tf.keras.layers.Dense(128, activation='relu'),
                                        tf.keras.layers.Dense(10, activation='softmax')
])

### 함수를 이용한 모델 생성(Functional API 이용)

In [3]:
# DNN - 다중 퍼셉트론 모델
inputs = tf.keras.Input(shape=(28,28))
x = tf.keras.layers.Flatten()(inputs)
x = tf.keras.layers.Dense(128, activation='relu')(x)
outputs = tf.keras.layers.Dense(10, activation='softmax')(x)
mlp_model = tf.keras.Model(inputs=inputs, outputs=outputs)

mlp_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

mlp_model.fit(X_train, y_train, epochs=5)
mlp_model.evaluate(X_test, y_test, verbose=1)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


[0.07716403901576996, 0.9771000146865845]

### 상속을 이용한 모델 생성


In [6]:
# 재사용성이 가장 높음 - 모델 자체를 배포할 때도 이 방식 사용

class MLP_Model(tf.keras.Model):
    def __init__(self):
        super(MLP_Model, self).__init__()
        self.flatten = tf.keras.layers.Flatten()
        self.dense = tf.keras.layers.Dense(128, activation='relu')
        self.softmax = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, inputs):
        x = self.flatten(inputs)
        x = self.dense(x)
        return self.softmax(x)

mlp_model = MLP_Model()

mlp_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

mlp_model.fit(X_train, y_train, epochs=5)
mlp_model.evaluate(X_test, y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 0s - loss: 0.0769 - accuracy: 0.9759


[0.07685790210962296, 0.9758999943733215]

## 모델 컴파일
compile the model

In [4]:
mlp_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['acuracy'])
# loss fucntiom은 회귀의 경우 MSE(값), 분류의 경우 CrossEntropy(확률) 사용
# 회귀에서는 MSE 대신 MAE, RMSE 등 사용

# 이진 분류에서는 binary_crossentropy
# 다중 분류: sparse_categorical crossentropy나 categorical_crossentropy
# 원핫 인코딩 적용: categorical_crossentropy
# 원핫 인코딩 미적용: sparse_categorical_crossentropy

y_train = tf.keras.utils.to_categorical(y_train)
y_test = tf.keras.utils.to_categorical(y_test)
mlp_model.compile(optimizer='adam',
                  loss='categorical_crossentropy',
                  metrics=['accuracy'])

mlp_model.fit(X_train, y_train, epochs=5)
mlp_model.evaluate(X_test, y_test, verbose=2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 0s - loss: 0.0746 - accuracy: 0.9789


[0.07457836717367172, 0.9789000153541565]

## 모델 구조 확인

In [5]:
mlp_model.summary()

Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 28, 28)]          0         
_________________________________________________________________
flatten (Flatten)            (None, 784)               0         
_________________________________________________________________
dense (Dense)                (None, 128)               100480    
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1290      
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________


## 모델 학습

In [6]:
mlp_model.fit(X_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f576a07d890>

## 모델 평가

In [7]:
mlp_model.evaluate(X_test, y_test, verbose=1)



[0.0990874171257019, 0.9778000116348267]

## 합성곱 신경망(CNN)
다중 perceptrons은 

In [3]:
import tensorflow as tf

mnist = tf.keras.datasets.mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

X_train, X_test = X_train/255.0, X_test/255.0

# 입력 데이터 수정
X_train_4d = X_train.reshape(-1, 28, 28, 1)
X_test_4d = X_test.reshape(-1, 28, 28, 1)

cnn_model = tf.keras.models.Sequential([
            tf.keras.layers.Conv2D(32, (3,3), activation='relu',
                                   input_shape=(28,28,1)),
            tf.keras.layers.MaxPooling2D((2,2)),
            tf.keras.layers.Conv2D(64, (3,3), activation='relu'),    # Conv 층에서 데이터를 좀 늘려줌.  # MaxPooling이 데이터 수를 깎아먹기 때문.
            tf.keras.layers.MaxPooling2D((2,2)),
            tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
            tf.keras.layers.Flatten(),
            tf.keras.layers.Dense(64, activation='relu'),
            tf.keras.layers.Dense(10, activation='softmax')
])

cnn_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

cnn_model.fit(X_train_4d, y_train, epochs=5)

cnn_model.evaluate(X_test_4d, y_test, verbose=1)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


[0.03209259733557701, 0.9908999800682068]

### ResNet 모델 생성


In [9]:
import tensorflow as tf

# Load and scale data.
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train, X_test = X_train/255.0, X_test/255.0

# 입력 데이터 수정
X_train_4d = X_train.reshape(-1, 28, 28, 1)
X_test_4d = X_test.reshape(-1, 28, 28, 1)

# ResNet에 맞게 입력 데이터 수정
resized_X_train = tf.image.resize(X_train_4d, [32, 32])
resized_X_test = tf.image.resize(X_test_4d, [32, 32])

# 모델 생성
resnet_model = tf.keras.applications.ResNet50V2(
                    input_shape=(32,32,1),
                    classes=10,
                    weights=None
)

resnet_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])

resnet_model.fit(resized_X_train, y_train, epochs=5)

resnet_model.evaluate(resized_X_test, y_test, verbose=1)

# 훈련을 하면 층의 깊이가 더 깊이서 시간이 더 오래 걸림.

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


[0.02614090032875538, 0.9922000169754028]

### 전이학습 모델 생성 
- Mobile TensorFlow Hub에서 가져옴.
  - https://tfhub.dev/
- Tensorflow Light model (tflite 확장자가 일반적)로 변환
- tensorflow.lite.TFLiteConverter.from_keras_model(모델이름)을 호출해서 변환기를 만들고, convert 함수를 호출하면 모델이 변환됩니다.
- 변환된 모델을 파일에 기록을 하면 됩니다. 
- 확장자는 특별한 경우가 아니면 tflite

        모델 이름 = tf.keras.Sequential([
            tensorflow_hun.KerasLayer(url, input_shape=(입력 구조), trainable=False),
            tf.keras.layers.Dense(출력의 개수)
        ])




## 이전에 생성한 모델을 TensorFlow Lite 모델로 변환

In [3]:
from google.colab import drive
drive.mount('here')

Mounted at here


In [8]:
converter = tf.lite.TFLiteConverter.from_keras_model(mlp_model)
tflite_model = converter.convert()

with open('/content/here/MyDrive/MLP_model/keras_model.tflite', 'wb') as f:
    f.write(tflite_model)

INFO:tensorflow:Assets written to: /tmp/tmpww6fw5n4/assets


INFO:tensorflow:Assets written to: /tmp/tmpww6fw5n4/assets


# Error Notes

        ValueError: Shape mismatch: The shape of labels (received (320,)) 
        should equal the shape of logits 
        except for the last dimension (received (32, 10)).

- When you are running the same model built with different methods multiple times, be sure to reset runtime to clear memory. 

