# Simulación de un cubo

# Simulación de imágenes independientes

In [2]:
import random 
import numpy as np

# Ésta función nos va a dar la intensidad de una fuente simulada a partir de el data_cube inicial,
# el valor máximo de las varianzas y el valor máximo de la intensidad de la fuente.


def mock_data( data_cube, sigma_max_x, sigma_max_y, Amax ):

    # Creamos una matriz M de ceros con el tamaño del cubo de datos:
    xmax = np.shape(data_cube)[0]
    ymax = np.shape(data_cube)[1]
    M = np.zeros((xmax, ymax))
    # Generamos aleatoriamente la posición media de la fuente en los ejes x, y dentro de la imagen, así como los valores máximos para la intensidad y las varianzas:
    A = np.random.rand()*Amax #Intensidad (almacenarla y que sea siempre mayor al ruido blanco añadido)
    sigmax = np.random.rand()*sigma_max_x
    sigmay = np.random.rand()*sigma_max_y #anchuras
    x_mid = random.randint(0, xmax)
    y_mid = random.randint(0, ymax)
    label_structure={"class":"galaxy", "x":x_mid, "y":y_mid,"width":sigmax, "height": sigmay}

    # Calculamos una distribución gaussiana para la fuente en los 3 ejes:
    x = (np.arange(0,xmax)-x_mid)**2./(2.*sigmax**2.)
    y = (np.arange(0,ymax)-y_mid)**2./(2.*sigmay**2.)

    X,Y = np.meshgrid(x,y)
    
    M = A*np.exp(-X-Y)
    
    return [M,label_structure]

In [3]:
data=[]
n_images=100
for n in range(n_images):
  # definimos el tamaño de los ejes del cubo
  x_len = 512
  y_len = 512

  # creamos una matriz de (512,512) de ceros para almacenar los datos
  data_cube = np.zeros((x_len, y_len))

  # definimos las varianzas y la intensidad máxima de las fuentes.

  Amax = 1
  sigma_max_x = 10 
  sigma_max_y= 10  

  # Añadimos un ruido blanco a la imagen en todas las frecuencias
  Noise = np.reshape(np.random.normal(0, Amax/50, x_len*y_len), (x_len, y_len)) # Por qué justo entre 50?
  data_cube_noise = data_cube + Noise

  # Creamos N fuentes con esas características.

  N = 100 #El número de galaxias

  fuentes=[] #Almacenamos las fuentes para el label
  ax=[]

  boxes=[]

  for i in range(N):
      mock=mock_data(data_cube_noise, sigma_max_x, sigma_max_y, Amax)
      boxes.append(mock[1])
      data_cube_noise = data_cube_noise + mock[0]

  data.append([data_cube_noise, boxes])
  print(n)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99


In [4]:
#Creamos una lista para almacenar los arrays binarios
binaries=[]

#Creamos una lista para almacenar los arrays de etiquetas
labels=[]

for k in range(len(data)):
  #Definimos el tamaño de la imagen
  x_len = 512
  y_len = 512
  #Inicializamos los arrays binarios
  binary=np.zeros((x_len, y_len))
  #Recorremos los boxes
  for box in data[k][1]:
    #Definimos los límites de la caja
    x_min=int(box['x']-box['width'])
    x_max=int(box['x']+box['width'])
    y_min=int(box['y']-box['height'])
    y_max=int(box['y']+box['height'])
    #Rellenamos los límites con etiquetas
    binary[x_min:x_max, y_min:y_max] = 1
  #Almacenamos los arrays binarios
  binaries.append(binary)
  #Añadimos las etiquetas
  labels.append(data[k][1])

#Creamos una lista con todos los datos
data_total=[binaries, labels]

In [5]:
# Displaying the array
print('Array:\n', data)
file = open("galaxies.txt", "w+")
 
# Saving the array in a text file
content = str(data)
file.write(content)
file.close()
 
# Displaying the contents of the text file
file = open("galaxies.txt", "r")
content = file.read()
 
print("\nContent in galaxies.txt:\n", content)
file.close()

Array:
 [[array([[-0.01111954, -0.01005484,  0.04366575, ..., -0.03161648,
        -0.0256404 ,  0.01398464],
       [-0.00040847, -0.00797062, -0.00498969, ..., -0.04315691,
         0.00315609,  0.00066387],
       [ 0.01858622,  0.00510423,  0.02044891, ..., -0.03788659,
        -0.01109522,  0.0205709 ],
       ...,
       [ 0.01925779, -0.02230971,  0.03810971, ...,  0.0517562 ,
         0.01651914,  0.01700204],
       [ 0.00416506, -0.00815468,  0.01302534, ..., -0.0263291 ,
         0.00935729,  0.02516223],
       [ 0.01385418, -0.0130844 , -0.01362223, ..., -0.01292259,
         0.02382679, -0.04104601]]), [{'class': 'galaxy', 'x': 120, 'y': 2, 'width': 4.161697492759824, 'height': 3.263705791428574}, {'class': 'galaxy', 'x': 447, 'y': 298, 'width': 5.402847010380922, 'height': 3.2999202560169625}, {'class': 'galaxy', 'x': 247, 'y': 178, 'width': 0.8218508033721994, 'height': 0.7093940962041057}, {'class': 'galaxy', 'x': 329, 'y': 105, 'width': 5.872370200096859, 'height': 8.

In [7]:
from astropy.io import fits
hdulist = fits.HDUList() #instancia HDUList

for n in data:
  data_cube_noise=n[0]
  from astropy.io import fits
  hdulist.append(fits.PrimaryHDU(data_cube_noise.T))# agregamos nuestro cubo de datos
  
#Guardamos el cubo
try:
  hdulist.writeto('data_imagen_simulada.fits')
except Exception as e:
  import os
  os.remove('data_imagen_simulada.fits')
  hdulist.writeto('data_imagen_simulada.fits')

ModuleNotFoundError: No module named 'astropy'

In [None]:
hdulist.info()

In [None]:
import matplotlib.pyplot as plt
fig, ax = plt.subplots(figsize=(7, 7))
ax.imshow(hdulist[0].data, cmap="gray")

# Modelo

In [None]:
images=[]
label=[]
for n in range (n_images):
  images.append(hdulist[n].data)
  label.append(data_total[0][n])


In [None]:
#Como cada imagen es una nueva simulación no necesitamos aleatorizar los datos

# Definir tamaño de los conjuntos de entrenamiento y prueba 
train_size = int(0.7 * len(images))
test_size = len(images) - train_size

# Separar los conjuntos de entrenamiento y prueba 
train_images = images[:train_size]
train_label = label[:train_size]
test_images = images[train_size:]
test_label = label[train_size:]

In [None]:
np.shape(train_images)
np.shape(train_label)

In [None]:
#Importar las librerías necesarias
import tensorflow as tf
from tensorflow.keras.layers import Input, Conv2D, Dense, Flatten, Dropout

#Definir modelo
model = tf.keras.Sequential()

#Agregar capas
model.add(Input(shape=(512, 512, 3)))
model.add(Conv2D(32, (3, 3), activation='relu'))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1))

#Compilar modelo
model.compile(optimizer='adam',
              loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              metrics=['accuracy'])

#Entrenar modelo
model.fit(x=train_images, 
          y=train_label, 
          epochs=10, 
          validation_data=(test_images, test_label))