# Patrick de Carvalho Tavares Rezende Ferreira - RA: 175480 - EFC1

Repositório: https://github.com/patrickctrf/EA072-Inteligencia-Artificial-IA/tree/master/EFC1

## Questão 4

Inicialmente, executou-se 5 vezes o código sugerido inicial a fim de verificar o desempenho da proposta. Seu desempenho foi de:

* Loss: 0.0260; Acurácia: 0.9909.

Utilizando-se o método de tentativa e erro, foi criado um script que verificava o desempenho da rede para diferentes parâmetros alterados como dropout (0.1 a 0.6), número de filtros (32 a 64), épocas de treinamento (2 a 6) e formato dos kernel utilizados (2x2 ou 3x3). O script executava esta mudança de parâmetros dentro de loops "for" para executar todas as combinações possíveis e tirava também a média das múltiplas execuções com mesmos parâmetros, a fim de se obter uma média de desempenho mais confiável. Os resultados desta varredura eram salvos ao final das execuções em um arquivo "listas.txt", permitindo ao usuários verificar qual a configuração obteve melhor desempenho.
Foram utilizadas 4 threads - para varredura de redes de 1 a 4 camadas - durante o treinamento, a fim de promover paralelismo e diminuir o tempo requerido, que era ainda maior que o demandado para a questão 1. Verificou-se que com 6 épocas de treinamento o resultado era levemente melhorado, mas não siginficativamente. A variação das demais grandezas fazia o desempenho diminuir nos testes. Então, após a varredura, foi realizado mais uma tentativa de treinamento com adição de uma camada convolucional e dropout de 0.3, o que elevou os resultados e nos trouxe à proposta final de código para esta questão.

Através da varredura, foi possível perceber que as alterações que implicavam em aumento de desempenho eram: Maior número de filtros, 2 camadas convolucionais, taxa de dropout próxima de 0.3 e kernel 3x3 (com max pool 2x2).

Portanto, para a proposta final deste modelo, os parâmetros alterados que resultaram no melhor desempenho durante a varredura foram:

* Adição de duas camadaa convolucionais com kernel 3x3 (seguida de uma max pool em 2x2) após a saída da primeira layer de max pool; 8 épocas de treinamento. Camadas convolucionais todas com 512 filtros e dropout de 0,3. Os demais parâmetros foram mantidos por não apresentar vantagem média significativa.

O desempenho médio obtido foi de:

* Loss: 0.0190; Acurácia: 0.9935.

Ambas as soluções consumiram um tempo de execução da ordem de poucos minutos e a diferença de desempenho foi cerca de 0,22% em ganho.

Os arquivos utilizados foram (no diretório q2):

Proposta Inicial: q4Inicial.py

Script de Varredura de parâmetros: q4.py

Proposta Final: q4Final.py

## Comparação entre ELM, MLP e CNN

Desempenho:
* ELM: 91,09%
* MLP: 98,23%
* CNN: 99,35%

Nota-se claramente que a CNN apresenta o melhor desempenho dentre as 3 melhores técnicas utilizadas. Porém, o processo de treinamento para otimização desta toma dezenas de horas, enquanto que a ELM requer apenas alguns minutos para ser ajustada e ficar cerca de 8% abaixo em desempenho. Logo, se houver recursos computacionais, a CNN é a melhor escolha para este tipo de problema.

In [0]:
# q4Inicial.py

import tensorflow as tf
import os
mnist = tf.keras.datasets.mnist
(x_train, y_train),(x_test, y_test) = mnist.load_data()
# reshape to be [samples][width][height][pixels]
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
x_train, x_test = x_train / 255.0, x_test / 255.0
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv2D(32, kernel_size=(3, 3),
 activation='relu',
input_shape=(28, 28, 1)))
model.add(tf.keras.layers.Conv2D(64, (3, 3), activation='relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.25))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(128, activation='relu'))
model.add(tf.keras.layers.Dropout(0.5))
model.add(tf.keras.layers.Dense(10, activation='softmax'))
model.compile(optimizer='adam',
 loss='sparse_categorical_crossentropy',
 metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test, y_test)
model_json = model.to_json()
json_file = open("model_CNN.json", "w")
json_file.write(model_json)
json_file.close()
model.save_weights("model_CNN.h5")
print("Model saved to disk")
os.getcwd()

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Model saved to disk


'/content/drive/My Drive/PODE APAGAR/EA072-EF1'

In [0]:
# q4.py

import tensorflow as tf
import os
import threading

myMutex = threading.Lock()
value = "teste"

numeroDeNeuronios = []
numeroDeEpocas = []
numeroDeCamadas = []
numeroDeDropout = []
taxaDeAcertos = []

# Vamos colocar uma thread para treinar cada rede com um numero especifico de camadas.
def thread1Camadas(camadas):
	
	# Para tirar a media das iteracoes, somaremos todas aqui e dividiremos pelo total.
	somaDasEficienciasDeCadaIteracao = 0
	
	# Os valores que utilizaremos para dropout variarao de 10% a 90% (instrucao abaixo).
	valoresDropout = range(10, 40, 10)# Variaremos de 10% em 10%.
	valoresDropout = [i/100 for i in valoresDropout]# Converte de porcentagem para escala de 0 a 1.
	
	# Testando resultados com diferentes quantidades de epocas.
	for epocas in [2, 6]:
	
		# Testando resultados com diferentes quantidades de filtros.
		for filtros in [32, 64]:
		
			# So para indicar em que passo da execucao estamos.
			print("\n\nepocas: " + str(epocas) + "\nCAMADAS" + str(camadas) + ": " + str(filtros) + "\n\n")
	
			# Este loop fica responsável por treinar com diferentes taxas de dropout.
			# "i" eh o valor a cada iteracao.
			for taxaDropout in valoresDropout:
			
				# Repetimos o treinamento algumas vezes para tirar uma media da eficiencia
				for iteracaoMedia in range(1,3):
					mnist = tf.keras.datasets.mnist
					(x_train, y_train),(x_test, y_test) = mnist.load_data()
					# reshape to be [samples][width][height][pixels]
					x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
					x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
					x_train, x_test = x_train / 255.0, x_test / 255.0
					model = tf.keras.models.Sequential()
					model.add(tf.keras.layers.Conv2D(filtros, kernel_size=(3, 3),
					 activation='relu',
					input_shape=(28, 28, 1)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (3, 3), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Flatten())
					model.add(tf.keras.layers.Dense(128, activation='relu'))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Dense(10, activation='softmax'))
					model.compile(optimizer='adam',
					 loss='sparse_categorical_crossentropy',
					 metrics=['accuracy'])
					model.fit(x_train, y_train, epochs=epocas)
					value = model.evaluate(x_test, y_test)
					model_json = model.to_json()
					json_file = open("model_CNN1.json", "w")
					json_file.write(model_json)
					json_file.close()
					model.save_weights("model_CNN1.h5")
					print("Model saved to disk")
					os.getcwd()
					
					somaDasEficienciasDeCadaIteracao = value[1] + somaDasEficienciasDeCadaIteracao
					
				
				
				myMutex.acquire()
				numeroDeNeuronios.append(filtros)
				numeroDeEpocas.append(epocas)
				numeroDeCamadas.append(camadas)
				numeroDeDropout.append(taxaDropout)
				taxaDeAcertos.append(somaDasEficienciasDeCadaIteracao/iteracaoMedia)
				myMutex.release()
				
				# Reiniciamos a soma.
				somaDasEficienciasDeCadaIteracao = 0
				
# Vamos colocar uma thread para treinar cada rede com um numero especifico de camadas.
def thread2Camadas(camadas):
	
	# Para tirar a media das iteracoes, somaremos todas aqui e dividiremos pelo total.
	somaDasEficienciasDeCadaIteracao = 0
	
	# Os valores que utilizaremos para dropout variarao de 10% a 90% (instrucao abaixo).
	valoresDropout = range(10, 40, 10)# Variaremos de 10% em 10%.
	valoresDropout = [i/100 for i in valoresDropout]# Converte de porcentagem para escala de 0 a 1.
	
	# Testando resultados com diferentes quantidades de epocas.
	for epocas in [2, 6]:
	
		# Testando resultados com diferentes quantidades de filtros.
		for filtros in [32, 64]:
		
			# So para indicar em que passo da execucao estamos.
			print("\n\nepocas: " + str(epocas) + "\nCAMADAS" + str(camadas) + ": " + str(filtros) + "\n\n")
	
			# Este loop fica responsável por treinar com diferentes taxas de dropout.
			# "i" eh o valor a cada iteracao.
			for taxaDropout in valoresDropout:
			
				# Repetimos o treinamento algumas vezes para tirar uma media da eficiencia
				for iteracaoMedia in range(1,3):
					mnist = tf.keras.datasets.mnist
					(x_train, y_train),(x_test, y_test) = mnist.load_data()
					# reshape to be [samples][width][height][pixels]
					x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
					x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
					x_train, x_test = x_train / 255.0, x_test / 255.0
					model = tf.keras.models.Sequential()
					model.add(tf.keras.layers.Conv2D(filtros, kernel_size=(2, 2),
					 activation='relu',
					input_shape=(28, 28, 1)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (3, 3), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (3, 3), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Flatten())
					model.add(tf.keras.layers.Dense(128, activation='relu'))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Dense(10, activation='softmax'))
					model.compile(optimizer='adam',
					 loss='sparse_categorical_crossentropy',
					 metrics=['accuracy'])
					model.fit(x_train, y_train, epochs=epocas)
					value = model.evaluate(x_test, y_test)
					model_json = model.to_json()
					json_file = open("model_CNN2.json", "w")
					json_file.write(model_json)
					json_file.close()
					model.save_weights("model_CNN2.h5")
					print("Model saved to disk")
					os.getcwd()
					
					somaDasEficienciasDeCadaIteracao = value[1] + somaDasEficienciasDeCadaIteracao
					
				
				
				
				myMutex.acquire()
				numeroDeNeuronios.append(filtros)
				numeroDeEpocas.append(epocas)
				numeroDeCamadas.append(camadas)
				numeroDeDropout.append(taxaDropout)
				taxaDeAcertos.append(somaDasEficienciasDeCadaIteracao/iteracaoMedia)
				myMutex.release()
				
				# Reiniciamos a soma.
				somaDasEficienciasDeCadaIteracao = 0
				
# Vamos colocar uma thread para treinar cada rede com um numero especifico de camadas.
def thread3Camadas(camadas):
	
	# Para tirar a media das iteracoes, somaremos todas aqui e dividiremos pelo total.
	somaDasEficienciasDeCadaIteracao = 0
	
	# Os valores que utilizaremos para dropout variarao de 10% a 90% (instrucao abaixo).
	valoresDropout = range(10, 40, 10)# Variaremos de 10% em 10%.
	valoresDropout = [i/100 for i in valoresDropout]# Converte de porcentagem para escala de 0 a 1.
	
	# Testando resultados com diferentes quantidades de epocas.
	for epocas in [2, 6]:
	
		# Testando resultados com diferentes quantidades de filtros.
		for filtros in [32, 64]:
		
			# So para indicar em que passo da execucao estamos.
			print("\n\nepocas: " + str(epocas) + "\nCAMADAS" + str(camadas) + ": " + str(filtros) + "\n\n")
	
			# Este loop fica responsável por treinar com diferentes taxas de dropout.
			# "i" eh o valor a cada iteracao.
			for taxaDropout in valoresDropout:
			
				# Repetimos o treinamento algumas vezes para tirar uma media da eficiencia
				for iteracaoMedia in range(1,3):
					mnist = tf.keras.datasets.mnist
					(x_train, y_train),(x_test, y_test) = mnist.load_data()
					# reshape to be [samples][width][height][pixels]
					x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
					x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
					x_train, x_test = x_train / 255.0, x_test / 255.0
					model = tf.keras.models.Sequential()
					model.add(tf.keras.layers.Conv2D(filtros, kernel_size=(3, 3),
					 activation='relu',
					input_shape=(28, 28, 1)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (2, 2), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Flatten())
					model.add(tf.keras.layers.Dense(128, activation='relu'))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Dense(10, activation='softmax'))
					model.compile(optimizer='adam',
					 loss='sparse_categorical_crossentropy',
					 metrics=['accuracy'])
					model.fit(x_train, y_train, epochs=epocas)
					value = model.evaluate(x_test, y_test)
					model_json = model.to_json()
					json_file = open("model_CNN3.json", "w")
					json_file.write(model_json)
					json_file.close()
					model.save_weights("model_CNN3.h5")
					print("Model saved to disk")
					os.getcwd()
					
					somaDasEficienciasDeCadaIteracao = value[1] + somaDasEficienciasDeCadaIteracao
					
				
				
				myMutex.acquire()
				numeroDeNeuronios.append(filtros)
				numeroDeEpocas.append(epocas)
				numeroDeCamadas.append(camadas)
				numeroDeDropout.append(taxaDropout)
				taxaDeAcertos.append(somaDasEficienciasDeCadaIteracao/iteracaoMedia)
				myMutex.release()
				
				# Reiniciamos a soma.
				somaDasEficienciasDeCadaIteracao = 0
				
# Vamos colocar uma thread para treinar cada rede com um numero especifico de camadas.
def thread4Camadas(camadas):
	
	# Para tirar a media das iteracoes, somaremos todas aqui e dividiremos pelo total.
	somaDasEficienciasDeCadaIteracao = 0
	
	# Os valores que utilizaremos para dropout variarao de 10% a 90% (instrucao abaixo).
	valoresDropout = range(10, 40, 10)# Variaremos de 10% em 10%.
	valoresDropout = [i/100 for i in valoresDropout]# Converte de porcentagem para escala de 0 a 1.
	
	# Testando resultados com diferentes quantidades de epocas.
	for epocas in [2, 6]:
	
		# Testando resultados com diferentes quantidades de filtros.
		for filtros in [32, 64]:
		
			# So para indicar em que passo da execucao estamos.
			print("\n\nepocas: " + str(epocas) + "\nCAMADAS" + str(camadas) + ": " + str(filtros) + "\n\n")
	
			# Este loop fica responsável por treinar com diferentes taxas de dropout.
			# "i" eh o valor a cada iteracao.
			for taxaDropout in valoresDropout:
			
				# Repetimos o treinamento algumas vezes para tirar uma media da eficiencia
				for iteracaoMedia in range(1,3):
					mnist = tf.keras.datasets.mnist
					(x_train, y_train),(x_test, y_test) = mnist.load_data()
					# reshape to be [samples][width][height][pixels]
					x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
					x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
					x_train, x_test = x_train / 255.0, x_test / 255.0
					model = tf.keras.models.Sequential()
					model.add(tf.keras.layers.Conv2D(filtros, kernel_size=(3, 3),
					 activation='relu',
					input_shape=(28, 28, 1)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (3, 3), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(3, 3)))
					model.add(tf.keras.layers.Conv2D(filtros*2, (3, 3), activation='relu'))
					model.add(tf.keras.layers.MaxPooling2D(pool_size=(3, 3)))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Flatten())
					model.add(tf.keras.layers.Dense(128, activation='relu'))
					model.add(tf.keras.layers.Dropout(taxaDropout))
					model.add(tf.keras.layers.Dense(10, activation='softmax'))
					model.compile(optimizer='adam',
					 loss='sparse_categorical_crossentropy',
					 metrics=['accuracy'])
					model.fit(x_train, y_train, epochs=epocas)
					value = model.evaluate(x_test, y_test)
					model_json = model.to_json()
					json_file = open("model_CNN4.json", "w")
					json_file.write(model_json)
					json_file.close()
					model.save_weights("model_CNN4.h5")
					print("Model saved to disk")
					os.getcwd()
					
					somaDasEficienciasDeCadaIteracao = value[1] + somaDasEficienciasDeCadaIteracao
					
				
				
				
				myMutex.acquire()
				numeroDeNeuronios.append(filtros)
				numeroDeEpocas.append(epocas)
				numeroDeCamadas.append(camadas)
				numeroDeDropout.append(taxaDropout)
				taxaDeAcertos.append(somaDasEficienciasDeCadaIteracao/iteracaoMedia)
				myMutex.release()
				
				# Reiniciamos a soma.
				somaDasEficienciasDeCadaIteracao = 0
				
				
	
if __name__ == '__main__':

	
	camadas1 = threading.Thread(target=thread1Camadas,args=(1,))
	camadas2 = threading.Thread(target=thread2Camadas,args=(2,))
	camadas3 = threading.Thread(target=thread3Camadas,args=(3,))
	camadas4 = threading.Thread(target=thread4Camadas,args=(4,))
	
	camadas1.start()
	camadas2.start()
	camadas3.start()
	camadas4.start()
	
	try:
		camadas4.join(); 
	except:
		pass;
		
	try:
		camadas3.join(); 
	except:
		pass;
		
	try:
		camadas2.join(); 
	except:
		pass;
		
	try:
		camadas1.join(); 
	except:
		pass;
		
	listasFile = open("listasCONV.txt", "w")
	listasFile.write(str(numeroDeNeuronios) + "\n")
	listasFile.write(str(numeroDeEpocas) + "\n")
	listasFile.write(str(numeroDeCamadas) + "\n")
	listasFile.write(str(numeroDeDropout) + "\n")
	listasFile.write(str(taxaDeAcertos) + "\n")
	listasFile.close()
		
		
		



epocas: 2
CAMADAS1: 32



epocas: 2
CAMADAS2: 32





epocas: 2
CAMADAS3: 32




epocas: 2
CAMADAS4: 32


Epoch 1/2
  288/60000 [..............................] - ETA: 1:33 - loss: 1.8135 - acc: 0.4167Epoch 1/2
  992/60000 [..............................] - ETA: 1:21 - loss: 2.0883 - acc: 0.2984Epoch 1/2
 1504/60000 [..............................] - ETA: 1:04 - loss: 1.7619 - acc: 0.4116Epoch 1/2
Epoch 2/2
Epoch 2/2
Epoch 2/2
  768/60000 [..............................] - ETA: 48s - loss: 0.0613 - acc: 0.9831Epoch 2/2
Model saved to disk
Epoch 1/2
 9504/60000 [===>..........................] - ETA: 20s - loss: 0.3375 - acc: 0.8932Epoch 1/2
10592/60000 [====>.........................] - ETA: 19s - loss: 0.3201 - acc: 0.8991Epoch 1/2
11136/60000 [====>.........................] - ETA: 19s - loss: 0.3094 - acc: 0.9027Epoch 1/2
Epoch 2/2
  768/60000 [..............................] - ETA: 51s - loss: 0.0

In [0]:
# q4Final.py
import tensorflow as tf
import os
mnist = tf.keras.datasets.mnist
(x_train, y_train),(x_test, y_test) = mnist.load_data()
# reshape to be [samples][width][height][pixels]
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
x_train, x_test = x_train / 255.0, x_test / 255.0
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv2D(32, kernel_size=(3, 3),
 activation='relu',
input_shape=(28, 28, 1)))
model.add(tf.keras.layers.Conv2D(512, (3, 3), activation='relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.3))
model.add(tf.keras.layers.Conv2D(512, (3, 3), activation='relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.3))
model.add(tf.keras.layers.Conv2D(512, (3, 3), activation='relu'))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2, 2)))
model.add(tf.keras.layers.Dropout(0.3))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(128, activation='relu'))
model.add(tf.keras.layers.Dropout(0.5))
model.add(tf.keras.layers.Dense(10, activation='softmax'))
model.compile(optimizer='adam',
 loss='sparse_categorical_crossentropy',
 metrics=['accuracy'])
model.fit(x_train, y_train, epochs=10)
model.evaluate(x_test, y_test)
model_json = model.to_json()
json_file = open("model_CNN.json", "w")
json_file.write(model_json)
json_file.close()
model.save_weights("model_CNN.h5")
print("Model saved to disk")
os.getcwd()

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Model saved to disk


'/content'