# Traitement des distances - distances relatives

Dans ce notebook, on définit des fonctions permettant de faire différents traitements sur les distances relatives des atomes dans les molécules. Il s'agit de la solution qui était initialement envisagée mais qui a été abandonnée à cause des problèmes de manque de précision dans la reconstruction des molécules au delà d'un certain nombre d'atomes contenus.


## Génération d'un tableau de coordonnées fictives

In [24]:
import numpy as np

atomes_nb = 6
atomes_nb_incl_fictif = atomes_nb + 1


# Génération d'une matrice de positions des atomes d'une molécule. Pour chaque atome, 
# une ligne contient 3 coordonnées x, y, z, chacune dans l'intervalle [-1,1[. 
def gen_pos(nb_atomes):
    return (np.random.random_sample(nb_atomes*3) * 2 - 1).reshape(-1,3)


positions = gen_pos(atomes_nb)
positions

array([[ 0.7156453 , -0.1090782 ,  0.55117387],
       [-0.57095618,  0.15154152, -0.7274713 ],
       [-0.26602364,  0.40630069, -0.51268229],
       [ 0.49056129, -0.09708921,  0.31878515],
       [-0.86309543,  0.33149966,  0.32799924],
       [ 0.25782006, -0.58608888,  0.70626478]])

## Conversion des coordonnées en distances

L'objectif est de fournir au réseau de neurones un vecteur contenant chaque coordonnée x, y, z et masse m des atomes contenant la molécule, afin d'obtenir en sortie le déplacement nécessaire des atomes et d'en déduire les nouvelles positions. On ne s'intéresse ici qu'aux positions, afin d'obtenir la matrice distances de la molécule.

La matrice distances contient pour chaque atome la distance aux 4 atomes suivants (dans l'ordre donné au vecteur positions initial). Si l'atome suivant n'existe pas (on arrive à la fin de la liste), alors on impute une valeur 0.

Afin de s'assurer que l'on pourra reconstruire la molécule avec la différence de distances fournie en sortie du RN, on ajoute un atome fictif prenant comme indice 0 et qui possédera une masse nulle. Cet atome peut être placé librement, à condition qu'il n'appartienne pas au plan formé par les trois premiers atomes.

### Ajout d'un atome fictif

In [2]:
def ajout_atome_fictif(positions):
    """ Ajoute un atome fictif aux positions initiales. Pour le moment, le place simplement
    aux coordonnées (0,0,0.5). Dans le futur, elle le placera à une position n'appartenant pas avec
    certitude au plan formé par les trois premiers atomes. """
    return np.insert(positions, 0, [0,0,.5], axis=0).reshape(-1,3)
    
positions = ajout_atome_fictif(positions)
positions

array([[ 0.        ,  0.        ,  0.5       ],
       [-0.99117714, -0.03212202,  0.85914182],
       [ 0.14811588,  0.7272142 ,  0.77787489],
       [ 0.52924691, -0.75761739, -0.79684465],
       [-0.35631885,  0.9845391 , -0.61906389],
       [-0.09431892,  0.53595655, -0.89807166],
       [-0.3413267 , -0.49416922, -0.6755993 ]])

### Génération du vecteur distances

In [3]:
import math


def get_atome_coord(positions, index):
    """ Renvoie les coordonnées de l'atome ayant l'index donné """
    return (positions[index])
    
def calcul_dist(x1, y1, z1, x2, y2, z2):
    """ Calcule et retourne la distance entre deux points selon leurs coordonnées en 3 dimensions"""
    return math.sqrt(pow(x1 - x2, 2) + pow(y1 - y2, 2) + pow(z1 - z2, 2))
    
def get_val_dist_matrice(i, j, positions):
    """ Renvoie la valeur de la matrice de distances aux coordonnées (i, j). La matrice complète n'est
    jamais calculée. """
    coord_i = get_atome_coord(positions, i)  # Coordonnées de l'atome i
    coord_j = get_atome_coord(positions, j)  # Coordonnées de l'atome j

    return calcul_dist(coord_i[0], coord_i[1], coord_i[2], coord_j[0], coord_j[1], coord_j[2])
    
def matrice_distances_compr(positions, nb_atomes):
    """ Renvoie le vecteur de distances à partir des coordonnées des atomes et du nombre d'atomes dans
    la molécule. La matrice de distances complète n'est pas générée, seules les valeurs nécessaires
    sont calculées à la demande """
    mat_distances = np.zeros(shape=(nb_atomes-1,4))
    
    for j in range(nb_atomes - 1):
        k=0  # Permet d'accéder simplement à l'indice dans le tableau de sortie
        for i in range(j+1, j+5):
            if i < nb_atomes:
                mat_distances[j][k] = get_val_dist_matrice(i, j, positions)
            k += 1
            
    return mat_distances

distances = matrice_distances_compr(positions, atomes_nb_incl_fictif)
distances

array([[1.05472594, 0.79246026, 1.59244857, 1.53250917],
       [1.37156276, 2.36227094, 1.90308618, 2.05301416],
       [2.19766407, 1.50735147, 1.70415697, 1.96059142],
       [1.96238171, 1.43958841, 0.91760764, 0.        ],
       [0.58967416, 1.47986463, 0.        , 0.        ],
       [1.08243517, 0.        , 0.        , 0.        ]])

### Test de la génération du vecteur distances

In [4]:
# On génère un tableau de positions d'atomes
pos_test = np.array([1., 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]).reshape(-1,3)
nb_atomes_test = int(len(pos_test))

# On ajoute l'atome fictif
pos_test = ajout_atome_fictif(pos_test)

print(pos_test)

# Valeurs attendues du vecteur distances
# [d10, d20, d30, d40,
#  d21, d31, d41, d51,
#  d32, d42, d52, 0,
#  d43, d53, 0,   0,
#  d54, 0,   0,   0]
#
# d10 = 3,74...
# d20 = 8,77...
# d30 = 13,92...
# d40 = 19,10...
# d21 = 5,19...
# d31 = 10,39...
# d41 = 15,58...
# d51 = 20,78...
# d32 = 5,19...
# d42 = 10,39...
# d52 = 15,58...
# d43 = 5,19...
# d53 = 10,39...
# d54 = 5,19...

distances_test = matrice_distances_compr(pos_test, nb_atomes_test)

# Les valeurs de retour sont bien celles attendues

distances_test

[[ 0.   0.   0.5]
 [ 1.   2.   3. ]
 [ 4.   5.   6. ]
 [ 7.   8.   9. ]
 [10.  11.  12. ]
 [13.  14.  15. ]]


array([[ 3.35410197,  8.44097151, 13.61065759, 18.79494613],
       [ 5.19615242, 10.39230485, 15.58845727,  0.        ],
       [ 5.19615242, 10.39230485,  0.        ,  0.        ],
       [ 5.19615242,  0.        ,  0.        ,  0.        ]])

## Déduction des positions en fonction des distances

La sortie du RN nous fournit un vecteur différence de distance (que l'on note delta_distances) qui correspond aux variations des distances inter-atomiques de la molécule induites par l'optimisation. La connaissance du vecteur distances fourni en entrée du RN permet de déduire le nouveau vecteur distance, et la connaissance des coordonnées de l'atome fictif permet de déduire les nouvelles positions des atomes de la molécule.

### Calcul des nouvelles distances inter-atomiques

#### Simulation de la sortie du RN

In [5]:
def simulation_rn_nul(distances_init, atomes_nb):
    """ On simule la sortie d'un RN n'ayant aucune incidence sur les données initiales
    (matrice variation de distances nulle)"""
    return np.zeros(shape=(atomes_nb-1,4))

# On simule l'appel au RN pour obtenir le vecteur variations de distances
delta_distances = simulation_rn_nul(distances_test, atomes_nb_incl_fictif)

def simulation_rn_bruit(distances_init, atomes_nb, sigma):
    """ On simule la sortie d'un RN ajoutant une légère variation de distances"""
    return np.random.normal(0, sigma, 4*(atomes_nb-1)).reshape(atomes_nb-1, 4)

delta_distances_bruit = simulation_rn_bruit(distances, atomes_nb_incl_fictif, 0.01)

delta_distances_bruit

array([[ 0.00320647, -0.00132229, -0.0056869 ,  0.01256035],
       [ 0.00109181, -0.00040209, -0.00451531, -0.01194563],
       [-0.00692605, -0.00919298,  0.03281213, -0.00082192],
       [ 0.01470494,  0.00917503,  0.00223659,  0.01098425],
       [ 0.00686042,  0.00090961,  0.01467258, -0.00959846],
       [ 0.00197571,  0.00842318, -0.01326036, -0.00835165]])

## Tentatives de résolution du problème de la localisation d'un point

Afin de déterminer les coordonnées d'un point de l'espace en fonction de sa distance relative avec quatre autres points dont les positions sont connues, on tente ici d'appliquer plusieurs méthodes différentes.

### Résolution générale du système général (décrivant les quatre sphères)

On peut dans un premier temps tenter de résoudre le système d'équation exprimant les coordonnées du point recherché en fonction de sa distance avec les autres points de manière générale. Si cette méthode fonctionne, alors on pourra calculer directement les coordonnées xn, yn et zn (n>=4) de chaque point, sans faire appel à un solveur à chaque résolution, et donc en évitant la nécessité de résoudre une instance du système à chaque placement de point.

Le problème de cette méthode (voir plus bas) est qu'elle nécessite le calcul d'équation très complexes, et que le solveur utilisé (sympy) n'arrive pas à trouver de solution.

#### Expression de xn en fonction de yn, zn et des autres paramètres

In [7]:
"""from sympy import Symbol
from sympy.solvers.solveset import *

# Tentative résolution système général

# Variables recherchées
xn = Symbol('xn')
yn = Symbol('yn')
zn = Symbol('zn')

# Position du point (n-4)
xnm4 = Symbol('xnm4')
ynm4 = Symbol('ynm4')
znm4 = Symbol('znm4')

# Position du point (n-3)
xnm3 = Symbol('xnm3')
ynm3 = Symbol('ynm3')
znm3 = Symbol('znm3')

# Position du point (n-2)
xnm2 = Symbol('xnm2')
ynm2 = Symbol('ynm2')
znm2 = Symbol('znm2')

# Position du point (n-1)
xnm1 = Symbol('xnm1')
ynm1 = Symbol('ynm1')
znm1= Symbol('znm1')

# Distances entre le point n recherché et les points (n-4), (n-3), (n-2) et (n-1)
dn_nm4 = Symbol('dn_nm4')
dn_nm3 = Symbol('dn_nm3')
dn_nm2 = Symbol('dn_nm2')
dn_nm1 = Symbol('dn_nm1')

# Formalisation du système
eqs = []
eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

eqs.append((xn - xnm1)**2 + (yn - ynm1)**2
           + (zn - znm1)**2 - dn_nm1**2)

# Expression de xn en fonction des autres variables et paramètres
nonlinsolve(eqs, [xn])"""

"from sympy import Symbol\nfrom sympy.solvers.solveset import *\n\n# Tentative résolution système général\n\n# Variables recherchées\nxn = Symbol('xn')\nyn = Symbol('yn')\nzn = Symbol('zn')\n\n# Position du point (n-4)\nxnm4 = Symbol('xnm4')\nynm4 = Symbol('ynm4')\nznm4 = Symbol('znm4')\n\n# Position du point (n-3)\nxnm3 = Symbol('xnm3')\nynm3 = Symbol('ynm3')\nznm3 = Symbol('znm3')\n\n# Position du point (n-2)\nxnm2 = Symbol('xnm2')\nynm2 = Symbol('ynm2')\nznm2 = Symbol('znm2')\n\n# Position du point (n-1)\nxnm1 = Symbol('xnm1')\nynm1 = Symbol('ynm1')\nznm1= Symbol('znm1')\n\n# Distances entre le point n recherché et les points (n-4), (n-3), (n-2) et (n-1)\ndn_nm4 = Symbol('dn_nm4')\ndn_nm3 = Symbol('dn_nm3')\ndn_nm2 = Symbol('dn_nm2')\ndn_nm1 = Symbol('dn_nm1')\n\n# Formalisation du système\neqs = []\neqs.append((xn - xnm4)**2 + (yn - ynm4)**2\n           + (zn - znm4)**2 - dn_nm4**2)\n\neqs.append((xn - xnm3)**2 + (yn - ynm3)**2\n           + (zn - znm3)**2 - dn_nm3**2)\n\neqs.appen

#### Expression de yn en fonction de zn et des autres paramètres

On remplace ici les xn par la solution trouvée plus haut et on recherche yn exprimé en fonction de zn et des paramètres de position des autres points et de distance.

On remarque que l'on obtient deux solutions très complexes

In [8]:
"""
eqs = []
eqs.append((xnm1 + sqrt(dn_nm1**2 - yn**2 + 2*yn*ynm1 - ynm1**2 - zn**2 + 2*zn*znm1 - znm1**2) - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xnm1 + sqrt(dn_nm1**2 - yn**2 + 2*yn*ynm1 - ynm1**2 - zn**2 + 2*zn*znm1 - znm1**2) - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xnm1 + sqrt(dn_nm1**2 - yn**2 + 2*yn*ynm1 - ynm1**2 - zn**2 + 2*zn*znm1 - znm1**2) - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

eqs.append((xnm1 + sqrt(dn_nm1**2 - yn**2 + 2*yn*ynm1 - ynm1**2 - zn**2 + 2*zn*znm1 - znm1**2) - xnm1)**2 + (yn - ynm1)**2
           + (zn - znm1)**2 - dn_nm1**2)
nonlinsolve(eqs, [yn])"""

NameError: name 'sqrt' is not defined

#### Expression de zn en fonction des paramètres

On cherche ici à exprimer zn en fonction des positions des autres points et des distances relatives entre le point n et les autres points, dans le but de remplacer zn par cette expression dans les équations précédentes, afin d'exprimer finalement xn, yn en fonction de ces paramètres.

Malheureusement, le solveur ne trouve pas de solution. On abandonne donc la solution de vouloir exprimer chaque variable du système à 4 équations en fonction des paramètres.

In [None]:
"""eqs = []

eqs.append(-(xnm1 - xnm2)*sqrt(-dn_nm1**4 + 2*dn_nm1**2*dn_nm2**2 
                               + 2*dn_nm1**2*xnm1**2 - 4*dn_nm1**2*xnm1*xnm2 + 2*dn_nm1**2*xnm2**2 
                               + 2*dn_nm1**2*ynm1**2 - 4*dn_nm1**2*ynm1*ynm2 + 2*dn_nm1**2*ynm2**2 
                               - 4*dn_nm1**2*zn*znm1 + 4*dn_nm1**2*zn*znm2 + 2*dn_nm1**2*znm1**2 
                               - 2*dn_nm1**2*znm2**2 - dn_nm2**4 + 2*dn_nm2**2*xnm1**2 
                               - 4*dn_nm2**2*xnm1*xnm2 + 2*dn_nm2**2*xnm2**2 + 2*dn_nm2**2*ynm1**2 
                               - 4*dn_nm2**2*ynm1*ynm2 + 2*dn_nm2**2*ynm2**2 + 4*dn_nm2**2*zn*znm1 
                               - 4*dn_nm2**2*zn*znm2 - 2*dn_nm2**2*znm1**2 + 2*dn_nm2**2*znm2**2 
                               - xnm1**4 + 4*xnm1**3*xnm2 - 6*xnm1**2*xnm2**2 - 2*xnm1**2*ynm1**2 
                               + 4*xnm1**2*ynm1*ynm2 - 2*xnm1**2*ynm2**2 - 4*xnm1**2*zn**2 
                               + 4*xnm1**2*zn*znm1 + 4*xnm1**2*zn*znm2 - 2*xnm1**2*znm1**2 
                               - 2*xnm1**2*znm2**2 + 4*xnm1*xnm2**3 + 4*xnm1*xnm2*ynm1**2 
                               - 8*xnm1*xnm2*ynm1*ynm2 + 4*xnm1*xnm2*ynm2**2 + 8*xnm1*xnm2*zn**2 
                               - 8*xnm1*xnm2*zn*znm1 - 8*xnm1*xnm2*zn*znm2 + 4*xnm1*xnm2*znm1**2 
                               + 4*xnm1*xnm2*znm2**2 - xnm2**4 - 2*xnm2**2*ynm1**2 + 4*xnm2**2*ynm1*ynm2 
                               - 2*xnm2**2*ynm2**2 - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm1 
                               + 4*xnm2**2*zn*znm2 - 2*xnm2**2*znm1**2 - 2*xnm2**2*znm2**2 
                               - ynm1**4 + 4*ynm1**3*ynm2 - 6*ynm1**2*ynm2**2 - 4*ynm1**2*zn**2 
                               + 4*ynm1**2*zn*znm1 + 4*ynm1**2*zn*znm2 - 2*ynm1**2*znm1**2 
                               - 2*ynm1**2*znm2**2 + 4*ynm1*ynm2**3 + 8*ynm1*ynm2*zn**2 
                               - 8*ynm1*ynm2*zn*znm1 - 8*ynm1*ynm2*zn*znm2 + 4*ynm1*ynm2*znm1**2 
                               + 4*ynm1*ynm2*znm2**2 - ynm2**4 - 4*ynm2**2*zn**2 + 4*ynm2**2*zn*znm1 
                               + 4*ynm2**2*zn*znm2 - 2*ynm2**2*znm1**2 - 2*ynm2**2*znm2**2 
                               - 4*zn**2*znm1**2 + 8*zn**2*znm1*znm2 - 4*zn**2*znm2**2 + 4*zn*znm1**3 
                               - 4*zn*znm1**2*znm2 - 4*zn*znm1*znm2**2 + 4*zn*znm2**3 - znm1**4 
                               + 2*znm1**2*znm2**2 - znm2**4)/(2*(xnm1**2 - 2*xnm1*xnm2 + xnm2**2 + ynm1**2 
                               - 2*ynm1*ynm2 + ynm2**2)) - (dn_nm1**2*ynm1 - dn_nm1**2*ynm2 - dn_nm2**2*ynm1 
                               + dn_nm2**2*ynm2 - xnm1**2*ynm1 - xnm1**2*ynm2 + 2*xnm1*xnm2*ynm1 + 2*xnm1*xnm2*ynm2 
                               - xnm2**2*ynm1 - xnm2**2*ynm2 - ynm1**3 + ynm1**2*ynm2 + ynm1*ynm2**2 
                               + 2*ynm1*zn*znm1 - 2*ynm1*zn*znm2 - ynm1*znm1**2 + ynm1*znm2**2 - ynm2**3 
                               - 2*ynm2*zn*znm1 + 2*ynm2*zn*znm2 + ynm2*znm1**2 - ynm2*znm2**2)/(2*(xnm1**2 
                               - 2*xnm1*xnm2 + xnm2**2 + ynm1**2 - 2*ynm1*ynm2 + ynm2**2)))

nonlinsolve(eqs, [zn])

"""

### Résolution générale du système partiel (contenant la description de trois sphères)

On cherche toujours ici à résoudre le système d'équations de façon générale, afin d'éviter d'utiliser un solveur à chaque recherche des coordonnées d'un point. La différence avec la méthode développée ci-dessus est qu'on ne va pas chercher à trouver l'intersection de quatre sphères mais de seulement trois. L'idée est que dans le cas où les quatre premiers points ne sont pas alignés, l'intersection de trois sphères ayant pour centres trois des points et pour rayon la distance entre ces points et le point recherché possèdera deux solutions. Une seule de ces solutions correspond au point recherché, mais nous pourrons déterminer ce point en fonction de la distance avec le point que l'on aura ignoré jusque là.

Formellement, nous allons tenter de trouver la solution générale de l'intersection entre les sphères de centres respectifs a(n-4), a(n-3) et a(n-2) et de rayons respectifs dn_nm4, dn_nm3, dn_nm2. L'ensemble de solution devrait contenir deux valeurs, parmi lesquelles on sélectionnera au cas par cas (à chaque recherche) celle dont la distance avec le point a(n-1) sera la plus proche de la valeur de dn_nm1.

On réalise que les équations sont encore trop complexes, on va donc tenter une nouvelle approche

#### Expression de xn en fonction de yn, zn et des paramètres


In [None]:
"""# Formalisation du système
eqs = []

xn = Symbol("xn")

eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

nonlinsolve(eqs, [xn, yn, zn])
"""

In [9]:
"""# Formalisation du système
eqs = []

xn = Symbol("xn")

eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

# Expression de xn en fonction des autres variables et paramètres
nonlinsolve(eqs, [xn])"""

{(xnm4 - sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2),), (xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2),)}

#### Expression de yn en fonction de zn et des paramètres pour chaque solution de xn

On remplace xn par l'expression calculée au dessus et on en déduit l'expression de yn en fonction de zn et des paramètres.

In [36]:
"""from sympy import sqrt
from sympy import solve
# Formalisation du système
eqs = []


eqs.append(((xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
 - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append(((xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
 - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)
# Expression de yn en fonction de zn et des paramètres

nonlinsolve(eqs, [yn])"""

{(-(xnm2 - xnm4)*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 + 2*dn_nm2**2*xnm2**2 - 4*dn_nm2**2*xnm2*xnm4 + 2*dn_nm2**2*xnm4**2 + 2*dn_nm2**2*ynm2**2 - 4*dn_nm2**2*ynm2*ynm4 + 2*dn_nm2**2*ynm4**2 - 4*dn_nm2**2*zn*znm2 + 4*dn_nm2**2*zn*znm4 + 2*dn_nm2**2*znm2**2 - 2*dn_nm2**2*znm4**2 - dn_nm4**4 + 2*dn_nm4**2*xnm2**2 - 4*dn_nm4**2*xnm2*xnm4 + 2*dn_nm4**2*xnm4**2 + 2*dn_nm4**2*ynm2**2 - 4*dn_nm4**2*ynm2*ynm4 + 2*dn_nm4**2*ynm4**2 + 4*dn_nm4**2*zn*znm2 - 4*dn_nm4**2*zn*znm4 - 2*dn_nm4**2*znm2**2 + 2*dn_nm4**2*znm4**2 - xnm2**4 + 4*xnm2**3*xnm4 - 6*xnm2**2*xnm4**2 - 2*xnm2**2*ynm2**2 + 4*xnm2**2*ynm2*ynm4 - 2*xnm2**2*ynm4**2 - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm2 + 4*xnm2**2*zn*znm4 - 2*xnm2**2*znm2**2 - 2*xnm2**2*znm4**2 + 4*xnm2*xnm4**3 + 4*xnm2*xnm4*ynm2**2 - 8*xnm2*xnm4*ynm2*ynm4 + 4*xnm2*xnm4*ynm4**2 + 8*xnm2*xnm4*zn**2 - 8*xnm2*xnm4*zn*znm2 - 8*xnm2*xnm4*zn*znm4 + 4*xnm2*xnm4*znm2**2 + 4*xnm2*xnm4*znm4**2 - xnm4**4 - 2*xnm4**2*ynm2**2 + 4*xnm4**2*ynm2*ynm4 - 2*xnm4**2*ynm4**2 - 4*xnm4**2

#### Expression de zn en fonction des paramètres 

In [30]:
"""eqs = []


yn = ((xnm2 - xnm4)*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 + 2*dn_nm2**2*xnm2**2 - 4*dn_nm2**2*xnm2*xnm4 
                    + 2*dn_nm2**2*xnm4**2 + 2*dn_nm2**2*ynm2**2 - 4*dn_nm2**2*ynm2*ynm4 + 2*dn_nm2**2*ynm4**2 
                    - 4*dn_nm2**2*zn*znm2 + 4*dn_nm2**2*zn*znm4 + 2*dn_nm2**2*znm2**2 - 2*dn_nm2**2*znm4**2 
                    - dn_nm4**4 + 2*dn_nm4**2*xnm2**2 - 4*dn_nm4**2*xnm2*xnm4 + 2*dn_nm4**2*xnm4**2 
                    + 2*dn_nm4**2*ynm2**2 - 4*dn_nm4**2*ynm2*ynm4 + 2*dn_nm4**2*ynm4**2 + 4*dn_nm4**2*zn*znm2 
                    - 4*dn_nm4**2*zn*znm4 - 2*dn_nm4**2*znm2**2 + 2*dn_nm4**2*znm4**2 - xnm2**4 
                    + 4*xnm2**3*xnm4 - 6*xnm2**2*xnm4**2 - 2*xnm2**2*ynm2**2 + 4*xnm2**2*ynm2*ynm4 
                    - 2*xnm2**2*ynm4**2 - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm2 + 4*xnm2**2*zn*znm4 
                    - 2*xnm2**2*znm2**2 - 2*xnm2**2*znm4**2 + 4*xnm2*xnm4**3 + 4*xnm2*xnm4*ynm2**2 
                    - 8*xnm2*xnm4*ynm2*ynm4 + 4*xnm2*xnm4*ynm4**2 + 8*xnm2*xnm4*zn**2 - 8*xnm2*xnm4*zn*znm2 
                    - 8*xnm2*xnm4*zn*znm4 + 4*xnm2*xnm4*znm2**2 + 4*xnm2*xnm4*znm4**2 - xnm4**4 
                    - 2*xnm4**2*ynm2**2 + 4*xnm4**2*ynm2*ynm4 - 2*xnm4**2*ynm4**2 - 4*xnm4**2*zn**2 
                    + 4*xnm4**2*zn*znm2 + 4*xnm4**2*zn*znm4 - 2*xnm4**2*znm2**2 - 2*xnm4**2*znm4**2 
                    - ynm2**4 + 4*ynm2**3*ynm4 - 6*ynm2**2*ynm4**2 - 4*ynm2**2*zn**2 + 4*ynm2**2*zn*znm2 
                    + 4*ynm2**2*zn*znm4 - 2*ynm2**2*znm2**2 - 2*ynm2**2*znm4**2 + 4*ynm2*ynm4**3 
                    + 8*ynm2*ynm4*zn**2 - 8*ynm2*ynm4*zn*znm2 - 8*ynm2*ynm4*zn*znm4 + 4*ynm2*ynm4*znm2**2 
                    + 4*ynm2*ynm4*znm4**2 - ynm4**4 - 4*ynm4**2*zn**2 + 4*ynm4**2*zn*znm2 
                    + 4*ynm4**2*zn*znm4 - 2*ynm4**2*znm2**2 - 2*ynm4**2*znm4**2 - 4*zn**2*znm2**2 
                    + 8*zn**2*znm2*znm4 - 4*zn**2*znm4**2 + 4*zn*znm2**3 - 4*zn*znm2**2*znm4 
                    - 4*zn*znm2*znm4**2 + 4*zn*znm4**3 - znm2**4 + 2*znm2**2*znm4**2 - znm4**4)
                    /(2*(xnm2**2 - 2*xnm2*xnm4 + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)) 
                    - (dn_nm2**2*ynm2 - dn_nm2**2*ynm4 - dn_nm4**2*ynm2 + dn_nm4**2*ynm4 - xnm2**2*ynm2 
                    - xnm2**2*ynm4 + 2*xnm2*xnm4*ynm2 + 2*xnm2*xnm4*ynm4 - xnm4**2*ynm2 - xnm4**2*ynm4 
                    - ynm2**3 + ynm2**2*ynm4 + ynm2*ynm4**2 + 2*ynm2*zn*znm2 - 2*ynm2*zn*znm4 
                    - ynm2*znm2**2 + ynm2*znm4**2 - ynm4**3 - 2*ynm4*zn*znm2 + 2*ynm4*zn*znm4 
                    + ynm4*znm2**2 - ynm4*znm4**2)/(2*(xnm2**2 - 2*xnm2*xnm4 + xnm4**2 + ynm2**2 
                    - 2*ynm2*ynm4 + ynm4**2)))

xn = (xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))


eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)


nonlinsolve(eqs, [zn])

"""

KeyboardInterrupt: 

### Translation d'un point en (0,0,0) et intersection de trois sphères

#### On exprime zn en fonction de xn, yn et des paramètres de l'instance

In [50]:
"""# Formalisation du système
eqs = []

xn = Symbol("xn")
yn = Symbol("yn")
zn = Symbol("zn")

# Position du point (n-4), fixé à (0, 0, 0)
xnm4 = 0
ynm4 = 0
znm4 = 0

# Position du point (n-3)
xnm3 = Symbol('xnm3')
ynm3 = Symbol('ynm3')
znm3 = Symbol('znm3')

# Position du point (n-2)
xnm2 = Symbol('xnm2')
ynm2 = Symbol('ynm2')
znm2 = Symbol('znm2')

# Position du point (n-1)
xnm1 = Symbol('xnm1')
ynm1 = Symbol('ynm1')
znm1= Symbol('znm1')

# Distances entre le point n recherché et les points (n-4), (n-3), (n-2) et (n-1)
dn_nm4 = Symbol('dn_nm4')
dn_nm3 = Symbol('dn_nm3')
dn_nm2 = Symbol('dn_nm2')
dn_nm1 = Symbol('dn_nm1')


eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

nonlinsolve(eqs, [zn])
"""

{(-sqrt(dn_nm4**2 - xn**2 - yn**2),), (sqrt(dn_nm4**2 - xn**2 - yn**2),)}

#### Expression de yn en fonction de zn si zn est positif

In [51]:
"""eqs = []

zn = (sqrt(dn_nm4**2 - xn**2 - yn**2))

eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

nonlinsolve(eqs, [yn])
"""

{(-ynm2*(dn_nm2**2 - dn_nm4**2 + 2*xn*xnm2 - xnm2**2 - ynm2**2 - znm2**2)/(2*(ynm2**2 + znm2**2)) - znm2*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 - 4*dn_nm2**2*xn*xnm2 + 2*dn_nm2**2*xnm2**2 + 2*dn_nm2**2*ynm2**2 + 2*dn_nm2**2*znm2**2 - dn_nm4**4 + 4*dn_nm4**2*xn*xnm2 - 2*dn_nm4**2*xnm2**2 + 2*dn_nm4**2*ynm2**2 + 2*dn_nm4**2*znm2**2 - 4*xn**2*xnm2**2 - 4*xn**2*ynm2**2 - 4*xn**2*znm2**2 + 4*xn*xnm2**3 + 4*xn*xnm2*ynm2**2 + 4*xn*xnm2*znm2**2 - xnm2**4 - 2*xnm2**2*ynm2**2 - 2*xnm2**2*znm2**2 - ynm2**4 - 2*ynm2**2*znm2**2 - znm2**4)/(2*(ynm2**2 + znm2**2)),), (-ynm2*(dn_nm2**2 - dn_nm4**2 + 2*xn*xnm2 - xnm2**2 - ynm2**2 - znm2**2)/(2*(ynm2**2 + znm2**2)) + znm2*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 - 4*dn_nm2**2*xn*xnm2 + 2*dn_nm2**2*xnm2**2 + 2*dn_nm2**2*ynm2**2 + 2*dn_nm2**2*znm2**2 - dn_nm4**4 + 4*dn_nm4**2*xn*xnm2 - 2*dn_nm4**2*xnm2**2 + 2*dn_nm4**2*ynm2**2 + 2*dn_nm4**2*znm2**2 - 4*xn**2*xnm2**2 - 4*xn**2*ynm2**2 - 4*xn**2*znm2**2 + 4*xn*xnm2**3 + 4*xn*xnm2*ynm2**2 + 4*xn*xnm2*znm2**2

#### Expression de yn en fonction de zn si zn est négatif

In [53]:
"""eqs = []

zn = (-sqrt(dn_nm4**2 - xn**2 - yn**2))

eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

nonlinsolve(eqs, [yn])"""

{(-ynm2*(dn_nm2**2 - dn_nm4**2 + 2*xn*xnm2 - xnm2**2 - ynm2**2 - znm2**2)/(2*(ynm2**2 + znm2**2)) - znm2*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 - 4*dn_nm2**2*xn*xnm2 + 2*dn_nm2**2*xnm2**2 + 2*dn_nm2**2*ynm2**2 + 2*dn_nm2**2*znm2**2 - dn_nm4**4 + 4*dn_nm4**2*xn*xnm2 - 2*dn_nm4**2*xnm2**2 + 2*dn_nm4**2*ynm2**2 + 2*dn_nm4**2*znm2**2 - 4*xn**2*xnm2**2 - 4*xn**2*ynm2**2 - 4*xn**2*znm2**2 + 4*xn*xnm2**3 + 4*xn*xnm2*ynm2**2 + 4*xn*xnm2*znm2**2 - xnm2**4 - 2*xnm2**2*ynm2**2 - 2*xnm2**2*znm2**2 - ynm2**4 - 2*ynm2**2*znm2**2 - znm2**4)/(2*(ynm2**2 + znm2**2)),), (-ynm2*(dn_nm2**2 - dn_nm4**2 + 2*xn*xnm2 - xnm2**2 - ynm2**2 - znm2**2)/(2*(ynm2**2 + znm2**2)) + znm2*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 - 4*dn_nm2**2*xn*xnm2 + 2*dn_nm2**2*xnm2**2 + 2*dn_nm2**2*ynm2**2 + 2*dn_nm2**2*znm2**2 - dn_nm4**4 + 4*dn_nm4**2*xn*xnm2 - 2*dn_nm4**2*xnm2**2 + 2*dn_nm4**2*ynm2**2 + 2*dn_nm4**2*znm2**2 - 4*xn**2*xnm2**2 - 4*xn**2*ynm2**2 - 4*xn**2*znm2**2 + 4*xn*xnm2**3 + 4*xn*xnm2*ynm2**2 + 4*xn*xnm2*znm2**2

On remarque que la solution est identique, quel que soit le signe de zn

#### Expression de xn en fonction des paramètres, pour la première solution yn

In [54]:
"""eqs = []

yn = (-ynm2*(dn_nm2**2 - dn_nm4**2 + 2*xn*xnm2 - xnm2**2 - ynm2**2 - znm2**2)/(2*(ynm2**2 + znm2**2)) 
      - znm2*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 - 4*dn_nm2**2*xn*xnm2 + 2*dn_nm2**2*xnm2**2 
      + 2*dn_nm2**2*ynm2**2 + 2*dn_nm2**2*znm2**2 - dn_nm4**4 + 4*dn_nm4**2*xn*xnm2 
      - 2*dn_nm4**2*xnm2**2 + 2*dn_nm4**2*ynm2**2 + 2*dn_nm4**2*znm2**2 - 4*xn**2*xnm2**2 - 4*xn**2*ynm2**2 
      - 4*xn**2*znm2**2 + 4*xn*xnm2**3 + 4*xn*xnm2*ynm2**2 + 4*xn*xnm2*znm2**2 - xnm2**4 - 2*xnm2**2*ynm2**2 
      - 2*xnm2**2*znm2**2 - ynm2**4 - 2*ynm2**2*znm2**2 - znm2**4)/(2*(ynm2**2 + znm2**2)))

zn = (-sqrt(dn_nm4**2 - xn**2 - yn**2))

eqs.append((xn - xnm4)**2 + (yn - ynm4)**2
           + (zn - znm4)**2 - dn_nm4**2)

eqs.append((xn - xnm3)**2 + (yn - ynm3)**2
           + (zn - znm3)**2 - dn_nm3**2)

eqs.append((xn - xnm2)**2 + (yn - ynm2)**2
           + (zn - znm2)**2 - dn_nm2**2)

nonlinsolve(eqs, [xn])

"""

KeyboardInterrupt: 

### Utilisation d'un solveur pour résoudre le système composé de trois équations

Cette méthode offre de bons résultats sur la plupart des molécules mais est parfois imprévisible (renvoie des solutions complexes ou sature la mémoire)

In [6]:

from sympy import Symbol
from sympy.solvers import solve
from sympy import Add
from sympy import erf
from sympy.solvers.solveset import nonlinsolve
from sympy import Float
import sympy as sp
import mpmath as mp


def calcul_distance(at1, at2):
    return math.sqrt(pow(at1[0] - at2[0], 2) + pow(at1[1] - at2[1], 2) + pow(at1[2] - at2[2], 2))

def get_distance(distances, at1, at2):
    """ Renvoie la distance entre deux atomes selon la matrice de distances compressée """
    
    # On a besoin de l'atome de numéro le plus bas en première position
    if (at1 > at2):
        at1, at2 = at2, at1
        
    if at2 <= at1 or at2 > at1 + 4:
        raise "Cette distance n'est pas connue dans la matrice de distances compressée "
    
    return distances[at1][at2-at1-1]
    
    
def get_valeur_tolerance(seuil, epsilon, valeur):
    """ Renvoie une valeur à laquelle on a ajouté une tolérance epsilon. Si la valeur est comprise entre
    epsilon+seuil et seuil alors on renvoie seuil. Sinon on renvoie la valeur initiale """
    
    if seuil <= valeur <= seuil+epsilon or seuil+epsilon <= valeur <= seuil:
        return seuil
    else:
        return valeur
    

def calcul_positions_a1_a4(distances, pos_at_fictif):
    """ Calcule les positions des atomes a0, a1, a2 et a3 et renvoie une nouvelle matrice de positions
    initialisée à 0 et de taille (nb_atomes, 3) """
    
    nb_atomes = len(distances) + 1
    
    epsilon = -1e-7
    
    positions = np.array(np.zeros(shape=(nb_atomes,3)))
    
    d10 = get_distance(distances, 0, 1)
    d20 = get_distance(distances, 0, 2)
    d21 = get_distance(distances, 1, 2)
    d30 = get_distance(distances, 0, 3)
    d31 = get_distance(distances, 1, 3)
    d32 = get_distance(distances, 2, 3)
        
    # On considère pour le moment que a0 est en (0,0,0)
    positions[0][0] = 0
    positions[0][1] = 0
    positions[0][2] = 0
    
    # Calcul de a1
    positions[1][0] = d10
    positions[1][1] = 0
    positions[1][2] = 0

    # Calcul de a2
    positions[2][0] = (d20**2-d21**2+d10**2)/(2*d10)
    positions[2][1] = math.sqrt(get_valeur_tolerance(0, epsilon, d20**2-((d20**2-d21**2+d10**2)/(2*d10))**2))
    positions[2][2] = 0

    # Calcul de a3
    positions[3][0] = (d30**2+d10**2-d31**2)/(2*d10)
    positions[3][1] = (-2*positions[3][0]*positions[2][0] +d20**2-d32**2+d30**2)/(2*positions[2][1])
    positions[3][2] = math.sqrt(get_valeur_tolerance(0, epsilon,
                                                     -positions[3][0]**2 - positions[3][1]**2 + d30**2))

    # Translation des positions calculées selon le vecteur (Oa0)
    positions[0:4] += pos_at_fictif
    
    return positions   

def points_alignes(pt1, pt2, pt3, epsilon):
    """ Renvoie vrai si les trois points sont alignés et faux sinon, avec une tolérance epsilon.
    On calcule pour cela l'aire du triangle formé par les trois points et on vérifie si elle est inférieure
    à la tolérance epsilon donnée."""
    
    mat1 = np.array(np.zeros(shape=(3,3)))
    mat2 = np.array(np.zeros(shape=(3,3)))
    mat3 = np.array(np.zeros(shape=(3,3)))
    
    mat1[0] = (pt1[0], pt2[0], pt3[0])
    mat1[1] = (pt1[1], pt2[1], pt3[1])
    mat1[2] = (1, 1, 1)
    
    mat2[0] = (pt1[1], pt2[1], pt3[1])
    mat2[1] = (pt1[2], pt2[2], pt3[2])
    mat2[2] = (1, 1, 1)

    mat2[0] = (pt1[2], pt2[2], pt3[2])
    mat2[1] = (pt1[0], pt2[0], pt3[0])
    mat2[2] = (1, 1, 1)
    
    return 0.5*(math.sqrt(np.linalg.det(mat1)**2 + np.linalg.det(mat2)**2 + np.linalg.det(mat3)**2)) < epsilon


    

def calcul_position(positions, distances, id_at): 
    """ Calcul des coordonnées (x, y, z) de l'atome dont l'identifiant est spécifié """
        
    # On récupère les distances entre le point à placer et les quatre points précédents dans la matrice
    # de distances compressée
    dn_nmin4 = get_distance(distances, id_at, id_at-4)
    dn_nmin3 = get_distance(distances, id_at, id_at-3)
    dn_nmin2 = get_distance(distances, id_at, id_at-2)
    dn_nmin1 = get_distance(distances, id_at, id_at-1)
    
    # On utilise un solveur sympy pour calculer les deux points intersection des trois premières sphères
    xn = Symbol('xn')
    yn = Symbol('yn')
    zn = Symbol('zn')
    
    if points_alignes(positions[id_at-4], positions[id_at-3], positions[id_at-2], 0.001):
        print("Les points n-4, n-3 et n-2 sont alignés")
        
    if points_alignes(positions[id_at-3], positions[id_at-2], positions[id_at-1], 0.001):
        print("Les points n-3, n-2 et n-1 sont alignés")
    
    if points_alignes(positions[id_at-4], positions[id_at-2], positions[id_at-1], 0.001):
        print("Les points n-4, n-2 et n-1 sont alignés")
        

    eqs = []
    eqs.append((xn - positions[id_at-4][0])**2 + (yn - positions[id_at-4][1])**2
               + (zn - positions[id_at-4][2])**2 - dn_nmin4**2)
    
    eqs.append((xn - positions[id_at-3][0])**2 + (yn - positions[id_at-3][1])**2
               + (zn - positions[id_at-3][2])**2 - dn_nmin3**2)
    
    eqs.append((xn - positions[id_at-2][0])**2 + (yn - positions[id_at-2][1])**2
               + (zn - positions[id_at-2][2])**2 - dn_nmin2**2)

    
    # On obtient deux solutions, et on retient celle dont la distance avec l'atome (n-1) est la plus proche
    # de la distance prévue dans la matrice de distances compressée
    
    ### TODO : Cas où les quatre premiers atomes sont alignés ### 
    
    #sol = nonlinsolve(eqs, [xn, yn, zn])
    sol = solve(eqs, [xn, yn, zn], check=False)
    
    best_delta_sol = float('inf')
    best_sol = None
    
    for curr_sol in sol:
        
        curr_sol = list(curr_sol)
        delta_sol = abs(calcul_distance(curr_sol, positions[id_at-1])
                                        - get_distance(distances, id_at, id_at-1))
        if (delta_sol<best_delta_sol):
            best_delta_sol = delta_sol
            best_sol = curr_sol
    
    positions[id_at] = best_sol
    
    return positions


def calcul_xn_yn_zn(signe_x, signe_y, z_val, xnm4, ynm4, znm4
                    , xnm3, ynm3, znm3, xnm2, ynm2, znm2, dn_nm4, dn_nm3, dn_nm2):
    
    """ Calcul des valeurs des coordonnées en fonction du signe de l'expression de xn et yn, et
    des paramètres de l'instance du problème"""
    
    if signe_x != "pos" or signe_x != "neg" or signe_y !="pos" or signe_y != "neg":
        return None
    
    yn = ((xnm2 - xnm4)*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 + 2*dn_nm2**2*xnm2**2 - 4*dn_nm2**2*xnm2*xnm4 
            + 2*dn_nm2**2*xnm4**2 + 2*dn_nm2**2*ynm2**2 - 4*dn_nm2**2*ynm2*ynm4 + 2*dn_nm2**2*ynm4**2 
            - 4*dn_nm2**2*zn*znm2 + 4*dn_nm2**2*zn*znm4 + 2*dn_nm2**2*znm2**2 - 2*dn_nm2**2*znm4**2 
            - dn_nm4**4 + 2*dn_nm4**2*xnm2**2 - 4*dn_nm4**2*xnm2*xnm4 + 2*dn_nm4**2*xnm4**2 
            + 2*dn_nm4**2*ynm2**2 - 4*dn_nm4**2*ynm2*ynm4 + 2*dn_nm4**2*ynm4**2 + 4*dn_nm4**2*zn*znm2 
            - 4*dn_nm4**2*zn*znm4 - 2*dn_nm4**2*znm2**2 + 2*dn_nm4**2*znm4**2 - xnm2**4 + 4*xnm2**3*xnm4 
            - 6*xnm2**2*xnm4**2 - 2*xnm2**2*ynm2**2 + 4*xnm2**2*ynm2*ynm4 - 2*xnm2**2*ynm4**2 
            - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm2 + 4*xnm2**2*zn*znm4 - 2*xnm2**2*znm2**2 - 2*xnm2**2*znm4**2 
            + 4*xnm2*xnm4**3 + 4*xnm2*xnm4*ynm2**2 - 8*xnm2*xnm4*ynm2*ynm4 + 4*xnm2*xnm4*ynm4**2 
            + 8*xnm2*xnm4*zn**2 - 8*xnm2*xnm4*zn*znm2 - 8*xnm2*xnm4*zn*znm4 + 4*xnm2*xnm4*znm2**2 
            + 4*xnm2*xnm4*znm4**2 - xnm4**4 - 2*xnm4**2*ynm2**2 + 4*xnm4**2*ynm2*ynm4 - 2*xnm4**2*ynm4**2 
            - 4*xnm4**2*zn**2 + 4*xnm4**2*zn*znm2 + 4*xnm4**2*zn*znm4 - 2*xnm4**2*znm2**2 - 2*xnm4**2*znm4**2 
            - ynm2**4 + 4*ynm2**3*ynm4 - 6*ynm2**2*ynm4**2 - 4*ynm2**2*zn**2 + 4*ynm2**2*zn*znm2 
            + 4*ynm2**2*zn*znm4 - 2*ynm2**2*znm2**2 - 2*ynm2**2*znm4**2 + 4*ynm2*ynm4**3 + 8*ynm2*ynm4*zn**2 
            - 8*ynm2*ynm4*zn*znm2 - 8*ynm2*ynm4*zn*znm4 + 4*ynm2*ynm4*znm2**2 + 4*ynm2*ynm4*znm4**2 - ynm4**4 
            - 4*ynm4**2*zn**2 + 4*ynm4**2*zn*znm2 + 4*ynm4**2*zn*znm4 - 2*ynm4**2*znm2**2 - 2*ynm4**2*znm4**2 
            - 4*zn**2*znm2**2 + 8*zn**2*znm2*znm4 - 4*zn**2*znm4**2 + 4*zn*znm2**3 - 4*zn*znm2**2*znm4 
            - 4*zn*znm2*znm4**2 + 4*zn*znm4**3 - znm2**4 + 2*znm2**2*znm4**2 - znm4**4)
            /(2*(xnm2**2 - 2*xnm2*xnm4 + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)) 
            - (dn_nm2**2*ynm2 - dn_nm2**2*ynm4 - dn_nm4**2*ynm2 + dn_nm4**2*ynm4 - xnm2**2*ynm2 - xnm2**2*ynm4 
            + 2*xnm2*xnm4*ynm2 + 2*xnm2*xnm4*ynm4 - xnm4**2*ynm2 - xnm4**2*ynm4 - ynm2**3 + ynm2**2*ynm4 
            + ynm2*ynm4**2 + 2*ynm2*zn*znm2 - 2*ynm2*zn*znm4 - ynm2*znm2**2 + ynm2*znm4**2 - ynm4**3 
            - 2*ynm4*zn*znm2 + 2*ynm4*zn*znm4 + ynm4*znm2**2 - ynm4*znm4**2)/(2*(xnm2**2 - 2*xnm2*xnm4 
            + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)))
    
    if signe_y == "neg":
        yn = -yn
        
    if signe_x == "pos":
        xn = (xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
    else:
        xn = (xnm4 - sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
    
    return (xn, yn, zn)
    
    

def get_xn_yn_expr(signe_x, signe_y, xnm4, ynm4, znm4
                    , xnm3, ynm3, znm3, xnm2, ynm2, znm2, dn_nm4, dn_nm3, dn_nm2):
    """ Renvoie le couple d'expressions (xn, yn) en fonction du signe de chaque expression et des
    paramètres de l'instance. Les signes peuvent prendre les valeurs {"pos", "neg"} """
    
    if (signe_x != "pos" and signe_x != "neg") or (signe_y != "pos" and signe_y != "neg"):
        print("erreur")
        return None
    
    xn = Symbol("xn")
    yn = Symbol("yn")
    
    
    print()
    print(signe_x, signe_y)
    
  
    
    yn = ((xnm2 - xnm4)*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 + 2*dn_nm2**2*xnm2**2 - 4*dn_nm2**2*xnm2*xnm4 
            + 2*dn_nm2**2*xnm4**2 + 2*dn_nm2**2*ynm2**2 - 4*dn_nm2**2*ynm2*ynm4 + 2*dn_nm2**2*ynm4**2 
            - 4*dn_nm2**2*zn*znm2 + 4*dn_nm2**2*zn*znm4 + 2*dn_nm2**2*znm2**2 - 2*dn_nm2**2*znm4**2 
            - dn_nm4**4 + 2*dn_nm4**2*xnm2**2 - 4*dn_nm4**2*xnm2*xnm4 + 2*dn_nm4**2*xnm4**2 
            + 2*dn_nm4**2*ynm2**2 - 4*dn_nm4**2*ynm2*ynm4 + 2*dn_nm4**2*ynm4**2 + 4*dn_nm4**2*zn*znm2 
            - 4*dn_nm4**2*zn*znm4 - 2*dn_nm4**2*znm2**2 + 2*dn_nm4**2*znm4**2 - xnm2**4 + 4*xnm2**3*xnm4 
            - 6*xnm2**2*xnm4**2 - 2*xnm2**2*ynm2**2 + 4*xnm2**2*ynm2*ynm4 - 2*xnm2**2*ynm4**2 
            - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm2 + 4*xnm2**2*zn*znm4 - 2*xnm2**2*znm2**2 - 2*xnm2**2*znm4**2 
            + 4*xnm2*xnm4**3 + 4*xnm2*xnm4*ynm2**2 - 8*xnm2*xnm4*ynm2*ynm4 + 4*xnm2*xnm4*ynm4**2 
            + 8*xnm2*xnm4*zn**2 - 8*xnm2*xnm4*zn*znm2 - 8*xnm2*xnm4*zn*znm4 + 4*xnm2*xnm4*znm2**2 
            + 4*xnm2*xnm4*znm4**2 - xnm4**4 - 2*xnm4**2*ynm2**2 + 4*xnm4**2*ynm2*ynm4 - 2*xnm4**2*ynm4**2 
            - 4*xnm4**2*zn**2 + 4*xnm4**2*zn*znm2 + 4*xnm4**2*zn*znm4 - 2*xnm4**2*znm2**2 - 2*xnm4**2*znm4**2 
            - ynm2**4 + 4*ynm2**3*ynm4 - 6*ynm2**2*ynm4**2 - 4*ynm2**2*zn**2 + 4*ynm2**2*zn*znm2 
            + 4*ynm2**2*zn*znm4 - 2*ynm2**2*znm2**2 - 2*ynm2**2*znm4**2 + 4*ynm2*ynm4**3 + 8*ynm2*ynm4*zn**2 
            - 8*ynm2*ynm4*zn*znm2 - 8*ynm2*ynm4*zn*znm4 + 4*ynm2*ynm4*znm2**2 + 4*ynm2*ynm4*znm4**2 - ynm4**4 
            - 4*ynm4**2*zn**2 + 4*ynm4**2*zn*znm2 + 4*ynm4**2*zn*znm4 - 2*ynm4**2*znm2**2 - 2*ynm4**2*znm4**2 
            - 4*zn**2*znm2**2 + 8*zn**2*znm2*znm4 - 4*zn**2*znm4**2 + 4*zn*znm2**3 - 4*zn*znm2**2*znm4 
            - 4*zn*znm2*znm4**2 + 4*zn*znm4**3 - znm2**4 + 2*znm2**2*znm4**2 - znm4**4)
            /(2*(xnm2**2 - 2*xnm2*xnm4 + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)) 
            - (dn_nm2**2*ynm2 - dn_nm2**2*ynm4 - dn_nm4**2*ynm2 + dn_nm4**2*ynm4 - xnm2**2*ynm2 - xnm2**2*ynm4 
            + 2*xnm2*xnm4*ynm2 + 2*xnm2*xnm4*ynm4 - xnm4**2*ynm2 - xnm4**2*ynm4 - ynm2**3 + ynm2**2*ynm4 
            + ynm2*ynm4**2 + 2*ynm2*zn*znm2 - 2*ynm2*zn*znm4 - ynm2*znm2**2 + ynm2*znm4**2 - ynm4**3 
            - 2*ynm4*zn*znm2 + 2*ynm4*zn*znm4 + ynm4*znm2**2 - ynm4*znm4**2)/(2*(xnm2**2 - 2*xnm2*xnm4 
            + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)))

    if signe_y == "neg":
        yn = -yn
        
    if signe_x == "pos":
        xn = (xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
    else:
        xn = (xnm4 - sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2))
        
    return (xn, yn)
    

def calcul_position2(positions, distances, id_at):
    """ Calcul des coordonnées (x, y, z) de l'atome dont l'identifiant est spécifié. Fonctionne
    sur le même principe que calcul_position() mais n'utilise le solveur que pour trouver la valeur
    numérique de zn. xn et yn en sont déduites"""
    
    # On récupère les distances entre le point à placer et les quatre points précédents dans la matrice
    # de distances compressée
    dn_nm4 = get_distance(distances, id_at, id_at-4)
    dn_nm3 = get_distance(distances, id_at, id_at-3)
    dn_nm2 = get_distance(distances, id_at, id_at-2)
    dn_nm1 = get_distance(distances, id_at, id_at-1)
    
    xnm2 = positions[id_at-2][0]
    ynm2 = positions[id_at-2][1]
    znm2 = positions[id_at-2][2]
    
    xnm3 = positions[id_at-3][0]
    ynm3 = positions[id_at-3][1]
    znm3 = positions[id_at-3][2]
    
    xnm4 = positions[id_at-4][0]
    ynm4 = positions[id_at-4][1]
    znm4 = positions[id_at-4][2]
    
            
    
    
    for signe_xn in {"pos", "neg"}:
        for signe_yn in {"pos", "neg"}:
            
            # On utilise un solveur sympy pour calculer les deux points intersection des trois premières sphères
            zn = Symbol('zn')
    
            
            xn, yn = get_xn_yn_expr(signe_xn, signe_yn, xnm4, ynm4, znm4
                    , xnm3, ynm3, znm3, xnm2, ynm2, znm2, dn_nm4, dn_nm3, dn_nm2)
            
    
            print("xn : "+str(xn))
            print("yn : "+str(yn))
        
            eqs = []
            eqs.append((xn - positions[id_at-4][0])**2 + (yn - positions[id_at-4][1])**2
                       + (zn - positions[id_at-4][2])**2 - dn_nm4**2)

            eqs.append((xn - positions[id_at-3][0])**2 + (yn - positions[id_at-3][1])**2
                       + (zn - positions[id_at-3][2])**2 - dn_nm3**2)

            eqs.append((xn - positions[id_at-2][0])**2 + (yn - positions[id_at-2][1])**2
                       + (zn - positions[id_at-2][2])**2 - dn_nm2**2)
    
    

    
            # On obtient deux solutions, et on retient celle dont la distance avec l'atome (n-1) est la plus proche
            # de la distance prévue dans la matrice de distances compressée

            ### TODO : Cas où les quatre premiers atomes sont alignés ### 

            # sol = nonlinsolve(eqs, [zn])
            sol = solve(eqs, [zn], check=False)

            best_delta_sol = float('inf')
            best_sol = None

            print(sol)

            for curr_sol in sol:

                zn = curr_sol[0]

        """# On ne s'intéresse qu'aux solution réelles
        if isinstance(zn, Float):
        
            yn = ((xnm2 - xnm4)*sqrt(-dn_nm2**4 + 2*dn_nm2**2*dn_nm4**2 + 2*dn_nm2**2*xnm2**2 - 4*dn_nm2**2*xnm2*xnm4 
                + 2*dn_nm2**2*xnm4**2 + 2*dn_nm2**2*ynm2**2 - 4*dn_nm2**2*ynm2*ynm4 + 2*dn_nm2**2*ynm4**2 
                - 4*dn_nm2**2*zn*znm2 + 4*dn_nm2**2*zn*znm4 + 2*dn_nm2**2*znm2**2 - 2*dn_nm2**2*znm4**2 
                - dn_nm4**4 + 2*dn_nm4**2*xnm2**2 - 4*dn_nm4**2*xnm2*xnm4 + 2*dn_nm4**2*xnm4**2 
                + 2*dn_nm4**2*ynm2**2 - 4*dn_nm4**2*ynm2*ynm4 + 2*dn_nm4**2*ynm4**2 + 4*dn_nm4**2*zn*znm2 
                - 4*dn_nm4**2*zn*znm4 - 2*dn_nm4**2*znm2**2 + 2*dn_nm4**2*znm4**2 - xnm2**4 + 4*xnm2**3*xnm4 
                - 6*xnm2**2*xnm4**2 - 2*xnm2**2*ynm2**2 + 4*xnm2**2*ynm2*ynm4 - 2*xnm2**2*ynm4**2 
                - 4*xnm2**2*zn**2 + 4*xnm2**2*zn*znm2 + 4*xnm2**2*zn*znm4 - 2*xnm2**2*znm2**2 - 2*xnm2**2*znm4**2 
                + 4*xnm2*xnm4**3 + 4*xnm2*xnm4*ynm2**2 - 8*xnm2*xnm4*ynm2*ynm4 + 4*xnm2*xnm4*ynm4**2 
                + 8*xnm2*xnm4*zn**2 - 8*xnm2*xnm4*zn*znm2 - 8*xnm2*xnm4*zn*znm4 + 4*xnm2*xnm4*znm2**2 
                + 4*xnm2*xnm4*znm4**2 - xnm4**4 - 2*xnm4**2*ynm2**2 + 4*xnm4**2*ynm2*ynm4 - 2*xnm4**2*ynm4**2 
                - 4*xnm4**2*zn**2 + 4*xnm4**2*zn*znm2 + 4*xnm4**2*zn*znm4 - 2*xnm4**2*znm2**2 - 2*xnm4**2*znm4**2 
                - ynm2**4 + 4*ynm2**3*ynm4 - 6*ynm2**2*ynm4**2 - 4*ynm2**2*zn**2 + 4*ynm2**2*zn*znm2 
                + 4*ynm2**2*zn*znm4 - 2*ynm2**2*znm2**2 - 2*ynm2**2*znm4**2 + 4*ynm2*ynm4**3 + 8*ynm2*ynm4*zn**2 
                - 8*ynm2*ynm4*zn*znm2 - 8*ynm2*ynm4*zn*znm4 + 4*ynm2*ynm4*znm2**2 + 4*ynm2*ynm4*znm4**2 - ynm4**4 
                - 4*ynm4**2*zn**2 + 4*ynm4**2*zn*znm2 + 4*ynm4**2*zn*znm4 - 2*ynm4**2*znm2**2 - 2*ynm4**2*znm4**2 
                - 4*zn**2*znm2**2 + 8*zn**2*znm2*znm4 - 4*zn**2*znm4**2 + 4*zn*znm2**3 - 4*zn*znm2**2*znm4 
                - 4*zn*znm2*znm4**2 + 4*zn*znm4**3 - znm2**4 + 2*znm2**2*znm4**2 - znm4**4)
                /(2*(xnm2**2 - 2*xnm2*xnm4 + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)) 
                - (dn_nm2**2*ynm2 - dn_nm2**2*ynm4 - dn_nm4**2*ynm2 + dn_nm4**2*ynm4 - xnm2**2*ynm2 - xnm2**2*ynm4 
                + 2*xnm2*xnm4*ynm2 + 2*xnm2*xnm4*ynm4 - xnm4**2*ynm2 - xnm4**2*ynm4 - ynm2**3 + ynm2**2*ynm4 
                + ynm2*ynm4**2 + 2*ynm2*zn*znm2 - 2*ynm2*zn*znm4 - ynm2*znm2**2 + ynm2*znm4**2 - ynm4**3 
                - 2*ynm4*zn*znm2 + 2*ynm4*zn*znm4 + ynm4*znm2**2 - ynm4*znm4**2)/(2*(xnm2**2 - 2*xnm2*xnm4 
                + xnm4**2 + ynm2**2 - 2*ynm2*ynm4 + ynm4**2)))

            xn = (xnm4 + sqrt(dn_nm4**2 - yn**2 + 2*yn*ynm4 - ynm4**2 - zn**2 + 2*zn*znm4 - znm4**2)) 

            curr_sol = (xn, yn, zn)

            print(curr_sol)

            curr_sol = list(curr_sol)
            delta_sol = abs(calcul_distance(curr_sol[0], curr_sol[1], curr_sol[2],
                                            positions[id_at-1][0], positions[id_at-1][1], positions[id_at-1][2])
                                            - get_distance(distances, id_at, id_at-1))
            if (delta_sol<best_delta_sol):
                best_delta_sol = delta_sol
                best_sol = curr_sol"""
    
   # positions[id_at] = best_sol
    
    return positions


    
def reconstruction_positions(distances_init, delta_distances, pos_at_fictif):
    """ Fonction calculant les nouvelles positions des atomes de la molécule à partir des distances initiales,
    des variations de distances fournies par le RN et de la position initiale de l'atome fictif"""
    
    mp.dps = 40
    
    nb_atomes = len(distances_init)+1
    
    # On commence par calculer la nouvelle matrice compressée de distances
    distances = distances_init + delta_distances
    
    # On calcule les positions des quatre premiers atomes de la molécule (dont l'atome fictif)
    positions = calcul_positions_a1_a4(distances, pos_at_fictif)
    
    # On calcule les positions des atomes restants
    for i in range(4, nb_atomes):
        positions = calcul_position(positions, distances, i)
    
    return positions

#positions_post_traitement = reconstruction_positions(distances_test, delta_distances, pos_test[0])

positions_post_traitement = reconstruction_positions(distances, delta_distances, pos_test[0])

positions_post_traitement




  from ._conv import register_converters as _register_converters


array([[ 0.        ,  0.        ,  0.5       ],
       [ 0.96056285,  0.        ,  0.5       ],
       [ 0.00603933,  1.29055841,  0.5       ],
       [ 0.86869975,  0.53939825,  0.60247539],
       [-0.41963316, -0.63782796,  1.1029201 ],
       [-1.06178721,  0.70421529,  1.10149879],
       [ 0.83543365,  0.10555871,  0.69121006]])

### Benchmark de la solution

In [7]:
import time

def time_n_reconstructions(iterations, nb_atomes):
    
    start_time = time.time()
    
    for i in range(iterations):
       
        positions = gen_pos(atomes_nb)  # On génère les positions
        positions = ajout_atome_fictif(positions)  # On ajoute un atome fictif
        distances = matrice_distances_compr(positions, atomes_nb+1)  # On calcule la matrice des distances
        delta_distances = simulation_rn_nul(distances, atomes_nb+1)  # On génère un delta distance nul
            
        # On reconstruit les positions à partir des distances
        positions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])

    print("--- %s seconds ---" % (time.time() - start_time))


In [9]:
# Nombre d'atomes
nb_at = [30]

# Nombre de molécules
nb_mol = [10, 50]

for at in nb_at:
    for mol in nb_mol:
        print("Nb at :"+str(at)+"; Nb mol :"+str(mol))
        time_n_reconstructions(mol, at)

Nb at :30; Nb mol :10


NameError: name 'time_n_reconstructions' is not defined

### Implémentation de la méthode de trilatération par translation de repère (solution retenue)

La description de la méthode est trouvable ici : https://en.wikipedia.org/wiki/Trilateration

Pour trouver les coordonnées du point a_n, la méthode est de translater les atomes tel que a_n-4 est à la position (0, 0, 0), a_n-3 est sur l'axe x et a_n-2 est sur le plan défini par z = 0

On trouve alors deux solutions, que l'on translate dans le repère d'origine, puis on sélectionne la position retenue en fonction de la distance de la solution a_n à a_n-1

#### Définition de méthodes utilitaires

In [6]:
def calcul_distance(at1, at2):
    return math.sqrt(pow(at1[0] - at2[0], 2) + pow(at1[1] - at2[1], 2) + pow(at1[2] - at2[2], 2))

def get_distance(distances, at1, at2):
    """ Renvoie la distance entre deux atomes selon la matrice de distances compressée """
    
    # On a besoin de l'atome de numéro le plus bas en première position
    if (at1 > at2):
        at1, at2 = at2, at1
        
    if at2 <= at1 or at2 > at1 + 4:
        raise "Cette distance n'est pas connue dans la matrice de distances compressée "
    
    return distances[at1][at2-at1-1]
    
    
def get_valeur_tolerance(seuil, epsilon, valeur):
    """ Renvoie une valeur à laquelle on a ajouté une tolérance epsilon. Si la valeur est comprise entre
    epsilon+seuil et seuil alors on renvoie seuil. Sinon on renvoie la valeur initiale """
    
    if seuil+epsilon <= valeur <= seuil:
        print("Tolérance : on renvoie "+str(seuil)+" plutôt que "+str(valeur))
        return seuil
    else:
        if valeur<0 : 
            print("Tolérance : on renvoie la valeur négative " + str(valeur))
            print("epsilon = "+str(epsilon))
            print("epsilon_sqrt = "+str(epsilon_sqrt))

        return valeur
    

def points_alignes(pt1, pt2, pt3, epsilon):
    """ Renvoie vrai si les trois points sont alignés et faux sinon, avec une tolérance epsilon.
    On calcule pour cela l'aire du triangle formé par les trois points et on vérifie si elle est inférieure
    à la tolérance epsilon donnée."""
    
    mat1 = np.array(np.zeros(shape=(3,3)))
    mat2 = np.array(np.zeros(shape=(3,3)))
    mat3 = np.array(np.zeros(shape=(3,3)))
    
    mat1[0] = (pt1[0], pt2[0], pt3[0])
    mat1[1] = (pt1[1], pt2[1], pt3[1])
    mat1[2] = (1, 1, 1)
    
    mat2[0] = (pt1[1], pt2[1], pt3[1])
    mat2[1] = (pt1[2], pt2[2], pt3[2])
    mat2[2] = (1, 1, 1)

    mat2[0] = (pt1[2], pt2[2], pt3[2])
    mat2[1] = (pt1[0], pt2[0], pt3[0])
    mat2[2] = (1, 1, 1)
    
    return 0.5*(math.sqrt(np.linalg.det(mat1)**2 + np.linalg.det(mat2)**2 + np.linalg.det(mat3)**2)) < epsilon
    

#### Calcul de la position des quatre premiers atomes

In [7]:
def calcul_positions_a1_a4(distances, pos_at_fictif):
    """ Calcule les positions des atomes a0, a1, a2 et a3 et renvoie une nouvelle matrice de positions
    initialisée à 0 et de taille (nb_atomes, 3) """
    
    nb_atomes = len(distances) + 1
    
    epsilon = -1e-2
    
    positions = np.array(np.zeros(shape=(nb_atomes,3)))
    
    d10 = get_distance(distances, 0, 1)
    d20 = get_distance(distances, 0, 2)
    d21 = get_distance(distances, 1, 2)
    d30 = get_distance(distances, 0, 3)
    d31 = get_distance(distances, 1, 3)
    d32 = get_distance(distances, 2, 3)
        
    # On considère pour le moment que a0 est en (0,0,0)
    positions[0] = (0, 0, 0)
    
    # Calcul de a1
    positions[1] = (d10, 0, 0)
    
    # Calcul de a2
    positions[2] = ((d20**2-d21**2+d10**2)/(2*d10),
                    math.sqrt(get_valeur_tolerance(0, epsilon, d20**2-((d20**2-d21**2+d10**2)/(2*d10))**2)),
                    0)
   
    # Calcul de a3
    positions[3][0] = (d30**2+d10**2-d31**2)/(2*d10)
    positions[3][1] = (-2*positions[3][0]*positions[2][0] +d20**2-d32**2+d30**2)/(2*positions[2][1])
    positions[3][2] = math.sqrt(get_valeur_tolerance(0, epsilon,
                                                     -positions[3][0]**2 - positions[3][1]**2 + d30**2))
    

    # Translation des positions calculées selon le vecteur (Oa0)
    positions[0:4] += pos_at_fictif
    
    return positions   

In [8]:

def _choix_spheres_naif(positions, id_at):
    """ Choix naïf : on choisit an-4, an-3 et an-2 comme centre des sphères et an-1 comme point de contrôle """
    return positions[id_at-4:id_at]

def _choix_spheres_pp_dist(positions, distances, id_at):
    """ Les centres des trois sphères sont les points ayant la plus petite distance avec le point
    à placer. """
    
    dist = []
    
    for i in (4):
        pass
        
        
    

def choix_spheres(positions, distances, id_at, heuristique):
    """ Choisit les trois sphères dont on fera l'intersection et le point de contrôle parmi les quatre
    points donnés en entrée. La sortie est une liste de positions (x, y, z), parmi lesquelles les
    trois premières sont les centres des trois sphères et la dernière est le point de contrôle"""
    pass


#### Calcul de la position d'un atome quelconque

In [9]:
from math import sqrt

# Seuil au delà duquel on considère qu'une valeur négative est nulle. Permet d'éviter de calculer des racines
# carrées d'un nombre négatif lorsque celui-ci est très proche de 0
epsilon_sqrt = -1e-1



def calcul_position(positions, distances, id_at, heuristique_choix_sphere=""):
    """ Calcul la position de l'atome id_atome en fonction de la position des quatre atomes précédents.
    Utilisation de la méthode décrite sur https://en.wikipedia.org/wiki/Trilateration """
        
    # On récupère les distances entre le point à placer et les quatre points précédents dans la matrice
    # de distances compressée
    dn_nm4 = get_distance(distances, id_at, id_at-4)
    dn_nm3 = get_distance(distances, id_at, id_at-3)
    dn_nm2 = get_distance(distances, id_at, id_at-2)
    dn_nm1 = get_distance(distances, id_at, id_at-1)
    
    ## Changement de système de coordonnées ##
    
    # Vecteur unitaire de direction a_n-4->a_n-3
    e_x = (positions[id_at-3] - positions[id_at-4])/np.linalg.norm(positions[id_at-3] - positions[id_at-4])
    
    # Ordre de grandeur signé de la composante x dans le nouveau système de coordonnées du vecteur
    # de a_n-4 à a_n-2
    i = np.dot(e_x, (positions[id_at-2] - positions[id_at-4]))    
    
    # Vecteur unitaire de direction y
    e_y = (positions[id_at-2] - positions[id_at-4] - i*e_x)/np.linalg.norm(positions[id_at-2] - positions[id_at-4] - i*e_x)

    # Vecteur unitaire dans la direction z
    e_z = np.cross(e_x, e_y)
  
    # Distance entre a_n-4 et a_n-3
    d = np.linalg.norm(positions[id_at-3] - positions[id_at-4])
    
    # Ordre de grandeur signé de la composante y dans le nouveau système de coordonnées, de a_n-4 à a_n-2
    j = np.dot(e_y, (positions[id_at-2]- positions[id_at-4]))
    
    
    ## Calcul des solutions dans le nouveau système de coordonnées  ##
    sol_nouv_syst = []
    
    xn = (dn_nm4**2 - dn_nm3**2 + d**2)/(2*d)
    yn = (dn_nm4**2 - dn_nm2**2 + i**2 + j**2)/(2*j) - (i/j)*xn
    
    zn_pos_carre = dn_nm4**2 - xn**2 - yn**2
    
    """ Note importante : si l'intersection des trois sphères est nulle alors zn_pos_carre est négatif
    et on ne peut pas donc calculer de racine réelle. Dans ce cas, on choisit de lui attribuer
    la valeur zéro. On perd des informations importantes et donc de la précision"""
    if zn_pos_carre > 0:
        zn_pos = math.sqrt(zn_pos_carre)
    else:
        print("Intersection nulle")
        zn_pos = 0
            
    sol_nouv_syst.append((xn, yn, zn_pos))
    sol_nouv_syst.append((xn, yn, -zn_pos))

    ## Translation des solutions dans le système de coordonnées original ##
    sol_syst_original = []
    for sol in sol_nouv_syst :
        sol_syst_original.append(positions[id_at-4] + np.dot(sol, np.array([e_x, e_y, e_z])))
    
    ## Sélection de la meilleure solution selon la distance avec le dernier point ##
    diff_dist_min = float("inf")
    for sol in sol_syst_original:
        curr_diff = abs(calcul_distance(sol, positions[id_at-1])-dn_nm1)
        if curr_diff < diff_dist_min:
            best_sol = sol
            diff_dist_min = curr_diff
                
    
    return best_sol
               
               
    
    
def reconstruction_positions(distances_init, delta_distances, pos_at_fictif):
    """ Fonction calculant les nouvelles positions des atomes de la molécule à partir des distances initiales,
    des variations de distances fournies par le RN et de la position initiale de l'atome fictif"""
        
    nb_atomes = len(distances_init)+1
    
    # On commence par calculer la nouvelle matrice compressée de distances
    distances = distances_init + delta_distances
    
    # On calcule les positions des quatre premiers atomes de la molécule (dont l'atome fictif)
    positions = calcul_positions_a1_a4(distances, pos_at_fictif)
    
    # On calcule les positions des atomes restants
    for i in range(4, nb_atomes):
        positions[i] = calcul_position(positions, distances, i)

    return positions

#positions_post_traitement = reconstruction_positions(distances_test, delta_distances, pos_test[0])


print("distances attendues")
print(distances)
positions_post_traitement = reconstruction_positions(distances, delta_distances, pos_test[0])

print("nouvelles distances calculées")
nouvelles_distances = matrice_distances_compr(positions_post_traitement, atomes_nb_incl_fictif)
print(nouvelles_distances)

print("diff")
print(str(abs(distances-nouvelles_distances)))

distances attendues
[[1.05472594 0.79246026 1.59244857 1.53250917]
 [1.37156276 2.36227094 1.90308618 2.05301416]
 [2.19766407 1.50735147 1.70415697 1.96059142]
 [1.96238171 1.43958841 0.91760764 0.        ]
 [0.58967416 1.47986463 0.         0.        ]
 [1.08243517 0.         0.         0.        ]]
nouvelles distances calculées
[[1.05472594 0.79246026 1.59244857 1.53250917]
 [1.37156276 2.36227094 1.90308618 2.05301416]
 [2.19766407 1.50735147 1.70415697 1.96059142]
 [1.96238171 1.43958841 0.91760764 0.        ]
 [0.58967416 1.47986463 0.         0.        ]
 [1.08243517 0.         0.         0.        ]]
diff
[[0.00000000e+00 1.11022302e-16 0.00000000e+00 0.00000000e+00]
 [0.00000000e+00 0.00000000e+00 2.22044605e-16 0.00000000e+00]
 [0.00000000e+00 2.22044605e-16 0.00000000e+00 2.22044605e-16]
 [2.22044605e-16 0.00000000e+00 1.11022302e-16 0.00000000e+00]
 [4.44089210e-16 2.22044605e-16 0.00000000e+00 0.00000000e+00]
 [2.22044605e-16 0.00000000e+00 0.00000000e+00 0.00000000e+00]]


### Vérification de la reconstruction de molécule

#### Vérification sur une molécule

Pour vérifier que la reconstruction fonctionne, on prend la molécule en sortie de la reconstruction, on calcule ses nouvelles distances internes et on tente de la reconstruire pour vérifier que l'on obtient bien la même molécule

In [10]:
"""
nouvelles_distances = matrice_distances_compr(positions_post_traitement, atomes_nb_incl_fictif)

positions_post_traitement_verif = reconstruction_positions(nouvelles_distances, delta_distances, pos_test[0])
positions_post_traitement_verif
"""

'\nnouvelles_distances = matrice_distances_compr(positions_post_traitement, atomes_nb_incl_fictif)\n\npositions_post_traitement_verif = reconstruction_positions(nouvelles_distances, delta_distances, pos_test[0])\npositions_post_traitement_verif\n'

La molécule a bien été reconstruite à l'identique, on vérifie maintenant que les distances internes sont les mêmes (à 10^-8 près).

In [11]:
"""epsilon_diff = 1e-8
print((abs(distances - nouvelles_distances) < epsilon_diff).all())"""

'epsilon_diff = 1e-8\nprint((abs(distances - nouvelles_distances) < epsilon_diff).all())'

#### Reconstruction d'une molécule dans le cas où tous les atomes sont alignés

In [25]:
positions = np.array([2.,0,0,4,0,0,6,0,0,8,0,0]).reshape(-1, 3)

print(positions)
positions = ajout_atome_fictif(positions)
print(positions)

distances = matrice_distances_compr(positions, 5)
delta_distances = simulation_rn_nul(distances, 5)

positions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])
distances_post_traitement = matrice_distances_compr(positions_post_traitement, 5)

print(abs(distances-distances_post_traitement))


[[2. 0. 0.]
 [4. 0. 0.]
 [6. 0. 0.]
 [8. 0. 0.]]
[[0.  0.  0.5]
 [2.  0.  0. ]
 [4.  0.  0. ]
 [6.  0.  0. ]
 [8.  0.  0. ]]
Tolérance : on renvoie 0 plutôt que 0.0
Intersection nulle
[[0.00000000e+00 0.00000000e+00 0.00000000e+00 1.77635684e-15]
 [6.66133815e-16 0.00000000e+00 8.88178420e-16 0.00000000e+00]
 [4.44089210e-16 1.77635684e-15 0.00000000e+00 0.00000000e+00]
 [1.77635684e-15 0.00000000e+00 0.00000000e+00 0.00000000e+00]]


#### Reconstruction d'une molécule dans le cas où les trois premiers atomes sont alignés mais pas les autres

In [13]:
"""positions = np.array([2.,0,0,4,0,0,6,0,0,1,2.136,4]).reshape(-1, 3)
positions = ajout_atome_fictif(positions)
print(positions)


distances = matrice_distances_compr(positions, 5)
delta_distances = simulation_rn_nul(distances, 5)

positions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])
print(positions_post_traitement)
distances_post_traitement = matrice_distances_compr(positions_post_traitement, 5)

print(abs(distances-distances_post_traitement))
"""

'positions = np.array([2.,0,0,4,0,0,6,0,0,1,2.136,4]).reshape(-1, 3)\npositions = ajout_atome_fictif(positions)\nprint(positions)\n\n\ndistances = matrice_distances_compr(positions, 5)\ndelta_distances = simulation_rn_nul(distances, 5)\n\npositions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])\nprint(positions_post_traitement)\ndistances_post_traitement = matrice_distances_compr(positions_post_traitement, 5)\n\nprint(abs(distances-distances_post_traitement))\n'

#### Vérification sur n molécules

On va maintenant appliquer la même méthode de vérification sur n molécules : on génère des positions aléatoirement, on simule un vecteur variation de distances nul et on reconstruit la molécule. On vérifie ensuite que les coordonnées des deux molécules sont identiques à 10-8 près 

In [34]:

def check_n_reconstructions(iterations, atomes_nb, epsilon, check_positions=True):
    """ Teste la reconstruction de iterations molécules contenant chacune nb_atomes atomes. La reconstruction
    de chaque molécule est validée si la différence entre les distances attendues et les distances calculées
    après la reconstructions est inférieure à l'epsilon donné.
    Si le paramètre check_positions est vrai, alors on reconstruit la molécule une fois de plus à chaque
    itération et on vérifie que les deux reconstructions ont produit les mêmes positions à epsilon près
    """
    
    succes = True
    
    erreurs_pos = 0
    erreurs_dist = 0
    
    imprecisions_glob_dist = []
    imprecisions_glob_pos = []
    
    for i in range(n):

        succes_courant = True
        
        positions = gen_pos(atomes_nb)  # On génère les positions
        #positions = ajout_atome_fictif(positions)  # On ajoute un atome fictif
                
        distances = matrice_distances_compr(positions, atomes_nb)  # On calcule la matrice des distances
        delta_distances = simulation_rn_nul(distances, atomes_nb)  # On génère un delta distance nul
        
        # On reconstruit les positions à partir des distances
        positions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])

        # On calcule les nouvelles distances
        nouvelles_distances = matrice_distances_compr(positions_post_traitement, atomes_nb)

        if check_positions:
        
            # On reconstruit les nouvelles positions afin de vérifier qu'on obtient les mêmes
            positions_post_traitement2 = reconstruction_positions(nouvelles_distances, 
                                                                  delta_distances, positions[0])
            
            # On enregistre l'échec de la validation si les positions de la deuxième reconstruction sont
            # différentes des positions de la première reconstruction
        
            diff_pos = abs(positions_post_traitement - positions_post_traitement2)
            succes_courant = (diff_pos < epsilon).all()
            imprecisions_glob_pos.append(diff_pos.flatten())

            if not succes_courant:
                erreurs_pos += 1
            
            succes = succes and succes_courant
            
            succes_courant = True

        # On enregistre l'échec de la validation si les distances pré/post reconstruction diffèrent
        diff_dist = abs(distances - nouvelles_distances)
        succes_courant = (diff_dist < epsilon).all()
        imprecisions_glob_dist.append(diff_dist.flatten())

        if not succes_courant and check_positions:
            erreurs_dist += 1
            
            
        succes = succes and succes_courant            
            
    
    print("Vérification des distances")
    print("Nombre de molécules ayant au moins une imprécision supérieure au seuil : "+str(erreurs_dist))
    print("Imprécision max : "+str(np.amax(imprecisions_glob_dist)))
    print("Imprécision moyenne "+str(np.mean(imprecisions_glob_dist)))
    print("Imprécision médiane : "+str(np.median(imprecisions_glob_dist)))
    
    if check_positions:
        print()
        print("Vérification des positions")
        print("Nombre de molécules ayant au moins une imprécision supérieure au seuil : "+str(erreurs_pos))
        print("Imprécision max : "+str(np.amax(imprecisions_glob_pos)))
        print("Imprécision moyenne "+str(np.mean(imprecisions_glob_pos)))
        print("Imprécision médiane : "+str(np.median(imprecisions_glob_pos)))
    
    return succes
    


In [None]:
n = 50000  # molécules générées
epsilon_diff = 1e-5  # tolérance epsilon

tailles = [10, 15, 20, 25, 30, 35, 40]

for taille in tailles:
    print("Taille : "+str(taille))
    print(check_n_reconstructions(n, taille, epsilon_diff))




Taille : 10
Vérification des distances
Nombre de molécules ayant au moins une imprécision supérieure au seuil : 0
Imprécision max : 7.762539500077992e-10
Imprécision moyenne 1.7476796321864224e-14
Imprécision médiane : 0.0

Vérification des positions
Nombre de molécules ayant au moins une imprécision supérieure au seuil : 0
Imprécision max : 1.926608816926745e-09
Imprécision moyenne 2.7855607842054708e-14
Imprécision médiane : 1.1102230246251565e-16
True
Taille : 15
Vérification des distances
Nombre de molécules ayant au moins une imprécision supérieure au seuil : 0
Imprécision max : 1.8115186684042328e-08
Imprécision moyenne 2.058798338346542e-13
Imprécision médiane : 1.1102230246251565e-16

Vérification des positions
Nombre de molécules ayant au moins une imprécision supérieure au seuil : 0
Imprécision max : 8.85757756030614e-08
Imprécision moyenne 7.295869120009127e-13
Imprécision médiane : 5.551115123125783e-16
True
Taille : 20
Intersection nulle
Vérification des distances
Nombre d

#### Mise en évidence de la propagation des imprécisions de calcul

La façon actuelle dont la matrice de distances compressée représente les distances relatives entre les atomes induit des imprécisions élevées sur les derniers atomes des grosses molécules. En effet, les coordonnées des atomes sont déterminées en fonction de la distance avec les quatre derniers points calculés. À chaque calcul d'une position, une légère imprécision apparaît, et ces imprécisions se propagent et s'amplifient jusqu'à devenir élevées sur les derniers atomes de la molécule.

Une parade à ce problème serait de calculer la position de chaque atome en fonction de la distance avec les quatre premiers atomes (a0, a1, a2 et a3). Il existerait toujours des imprécisions de calcul à chaque position (de l'ordre de 10^-15), mais elles ne se propageraient pas à chaque calcul.

On peut voir ci-dessous une matrice représentant la différence entre les distances inter-atomiques attendues et les distances calculées à l'issue d'une reconstruction d'une molécule de 100 atomes. On peut remarquer que la précision du placement des premiers atomes est très bonne, mais que la différence entre les distances attendues et les distances calculées à l'issue de la reconstruction va jusqu'à un ordre de 10^-1 pour les derniers atomes

In [199]:
"""atomes_nb = 100
positions = gen_pos(atomes_nb)  # On génère les positions
positions = ajout_atome_fictif(positions)  # On ajoute un atome fictif
distances = matrice_distances_compr(positions, atomes_nb+1)  # On calcule la matrice des distances
delta_distances = simulation_rn_nul(distances, atomes_nb+1)  # On génère un delta distance nul

# On reconstruit les positions à partir des distances
positions_post_traitement = reconstruction_positions(distances, delta_distances, positions[0])

# On calcule les nouvelles distances
nouvelles_distances = matrice_distances_compr(positions_post_traitement, atomes_nb+1)

print("Différence de distances : ")
diff = abs(distances - nouvelles_distances)
print(diff)
print("Différence max : "+str(diff.max()))
"""

Différence de distances : 
[[0.00000000e+00 0.00000000e+00 0.00000000e+00 0.00000000e+00]
 [0.00000000e+00 0.00000000e+00 0.00000000e+00 6.66133815e-16]
 [5.55111512e-17 0.00000000e+00 6.66133815e-16 2.22044605e-16]
 [0.00000000e+00 1.33226763e-15 0.00000000e+00 4.44089210e-16]
 [2.90878432e-14 2.22044605e-16 3.33066907e-16 0.00000000e+00]
 [1.90958360e-14 2.22044605e-16 2.22044605e-16 1.11022302e-16]
 [6.21724894e-15 2.22044605e-16 0.00000000e+00 0.00000000e+00]
 [3.66373598e-15 2.22044605e-16 0.00000000e+00 1.11022302e-16]
 [2.34257058e-14 2.22044605e-16 2.22044605e-16 2.22044605e-16]
 [1.66533454e-14 2.22044605e-16 2.22044605e-16 0.00000000e+00]
 [6.21724894e-15 4.44089210e-16 0.00000000e+00 0.00000000e+00]
 [1.79856130e-13 0.00000000e+00 1.11022302e-16 1.11022302e-16]
 [1.18793864e-13 2.22044605e-16 2.22044605e-16 0.00000000e+00]
 [1.99840144e-14 0.00000000e+00 0.00000000e+00 0.00000000e+00]
 [1.61648472e-13 3.33066907e-16 0.00000000e+00 0.00000000e+00]
 [1.55209179e-13 0.00000000e