In [1]:
from __future__ import division, absolute_import, print_function
%matplotlib inline

In [2]:
import time
import numpy as np

### Original features (union of all features submitted by contestants in Madelon challenge)

In [3]:
original_features = np.array([ 29, 49, 65, 106, 129, 154, 242, 282, 319, 337, 339, 379, 434, 443, 452, 454, 456, 473, 476, 494])

In [4]:
already_seen_features = set(original_features.flat)
print(already_seen_features)

set([129, 282, 452, 454, 65, 443, 106, 434, 337, 49, 242, 339, 456, 473, 154, 379, 476, 29, 494, 319])


### Generate 200 unique random features different from the original features

In [5]:
import random

null_features = np.array([], dtype=int)
while len(null_features) < 200:
    next_int = random.randint(1, 501)
    if next_int not in already_seen_features:
        already_seen_features.add(next_int)
        null_features = np.append(null_features, next_int)
print(null_features.shape)
print(null_features)

(200,)
[157 422 408 137  16  82  99 469 150  24 484 190  61 264 238 224 251 453
 127 173 433 241 413 159 403 210 302  51  81 271 411 142 120 345 485  21
 294 468 219  93 397 329 201 486  34 133 152 279 489 394 355 409 296 206
 109 439 324  13  25  76  72 297 286 125 197 269 175 189 149 214 123 147
  86 179  57 266 346 162 258 404 499 370  17 122  52 483 357 459 114 472
 401 407 500 118  68 396 161 301 314 447 229 462 428  36  10 381 423 463
  42 327  84  60 441 496 450 323 230 113 202 203  64 344 293  14 176  74
 491 466 467 268 227 377 172 103 417 438 342 393 398 283 384 430 493 111
 244 274 375 182 320  71 267  41 177 135 110 492 402  88 424 207 223 431
  94 217  75 167 220 330 410 243 262 260 235  55 383 121 124 249 247 457
  30 426 464 451 256 335  98 187 208 164 287 352  27 285 218 170 442  54
 105 134]


### Add the 20 original features after every 20 features

In [6]:
all_features = np.array([], dtype=int)
for i in range(10):
    all_features = np.append(all_features, null_features[20*i:20*(i+1)])
    all_features = np.append(all_features, original_features)
print(all_features.shape)
print(all_features)

(400,)
[157 422 408 137  16  82  99 469 150  24 484 190  61 264 238 224 251 453
 127 173  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
 456 473 476 494 433 241 413 159 403 210 302  51  81 271 411 142 120 345
 485  21 294 468 219  93  29  49  65 106 129 154 242 282 319 337 339 379
 434 443 452 454 456 473 476 494 397 329 201 486  34 133 152 279 489 394
 355 409 296 206 109 439 324  13  25  76  29  49  65 106 129 154 242 282
 319 337 339 379 434 443 452 454 456 473 476 494  72 297 286 125 197 269
 175 189 149 214 123 147  86 179  57 266 346 162 258 404  29  49  65 106
 129 154 242 282 319 337 339 379 434 443 452 454 456 473 476 494 499 370
  17 122  52 483 357 459 114 472 401 407 500 118  68 396 161 301 314 447
  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454 456 473
 476 494 229 462 428  36  10 381 423 463  42 327  84  60 441 496 450 323
 230 113 202 203  29  49  65 106 129 154 242 282 319 337 339 379 434 443
 452 454 456 473 476 494  64 344 293  14 176

### Reshape array to [10,40] to get 10 different sets to train with

In [7]:
all_features_2dim = np.reshape(all_features, [10,40])
print(all_features_2dim.shape)
print(all_features_2dim)

(10, 40)
[[157 422 408 137  16  82  99 469 150  24 484 190  61 264 238 224 251 453
  127 173  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 473 476 494]
 [433 241 413 159 403 210 302  51  81 271 411 142 120 345 485  21 294 468
  219  93  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 473 476 494]
 [397 329 201 486  34 133 152 279 489 394 355 409 296 206 109 439 324  13
   25  76  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 473 476 494]
 [ 72 297 286 125 197 269 175 189 149 214 123 147  86 179  57 266 346 162
  258 404  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 473 476 494]
 [499 370  17 122  52 483 357 459 114 472 401 407 500 118  68 396 161 301
  314 447  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 473 476 494]
 [229 462 428  36  10 381 423 463  42 327  84  60 441 496 450 323 230 113
  202 203  29  49  65 106 129 154 242 282 319 337 339 379 434 443 452 454
  456 47

In [8]:
all_features_2dim.sort(axis=1)
print(all_features_2dim)

[[ 16  24  29  49  61  65  82  99 106 127 129 137 150 154 157 173 190 224
  238 242 251 264 282 319 337 339 379 408 422 434 443 452 453 454 456 469
  473 476 484 494]
 [ 21  29  49  51  65  81  93 106 120 129 142 154 159 210 219 241 242 271
  282 294 302 319 337 339 345 379 403 411 413 433 434 443 452 454 456 468
  473 476 485 494]
 [ 13  25  29  34  49  65  76 106 109 129 133 152 154 201 206 242 279 282
  296 319 324 329 337 339 355 379 394 397 409 434 439 443 452 454 456 473
  476 486 489 494]
 [ 29  49  57  65  72  86 106 123 125 129 147 149 154 162 175 179 189 197
  214 242 258 266 269 282 286 297 319 337 339 346 379 404 434 443 452 454
  456 473 476 494]
 [ 17  29  49  52  65  68 106 114 118 122 129 154 161 242 282 301 314 319
  337 339 357 370 379 396 401 407 434 443 447 452 454 456 459 472 473 476
  483 494 499 500]
 [ 10  29  36  42  49  60  65  84 106 113 129 154 202 203 229 230 242 282
  319 323 327 337 339 379 381 423 428 434 441 443 450 452 454 456 462 463
  473 476 494 496

In [9]:
np.save("TenMadelonModels.npy", all_features_2dim)

In [10]:
check = np.load("TenMadelonModels.npy")
print(check)

[[ 16  24  29  49  61  65  82  99 106 127 129 137 150 154 157 173 190 224
  238 242 251 264 282 319 337 339 379 408 422 434 443 452 453 454 456 469
  473 476 484 494]
 [ 21  29  49  51  65  81  93 106 120 129 142 154 159 210 219 241 242 271
  282 294 302 319 337 339 345 379 403 411 413 433 434 443 452 454 456 468
  473 476 485 494]
 [ 13  25  29  34  49  65  76 106 109 129 133 152 154 201 206 242 279 282
  296 319 324 329 337 339 355 379 394 397 409 434 439 443 452 454 456 473
  476 486 489 494]
 [ 29  49  57  65  72  86 106 123 125 129 147 149 154 162 175 179 189 197
  214 242 258 266 269 282 286 297 319 337 339 346 379 404 434 443 452 454
  456 473 476 494]
 [ 17  29  49  52  65  68 106 114 118 122 129 154 161 242 282 301 314 319
  337 339 357 370 379 396 401 407 434 443 447 452 454 456 459 472 473 476
  483 494 499 500]
 [ 10  29  36  42  49  60  65  84 106 113 129 154 202 203 229 230 242 282
  319 323 327 337 339 379 381 423 428 434 441 443 450 452 454 456 462 463
  473 476 494 496