# PHY4268 Tutorial 1 - Quantum Chemistry Modelling Basis ( Acquis de lecture)

1. **F. Z. ATSAFACK FOUELEFACK**, zita.atsafack@facsciences-uy1.cm
    * Department of Physics, Faculty of Science, University of Yaounde I
  


In [2]:
from pyscf import gto
import py3Dmol

In [3]:
## definir les coordonnées de la molecule (thiazole)
mol_xyz = """
  C      1.1291      0.0795     -0.5259
  C      0.7115     -1.2207     -0.4748
  H      2.0789      0.4171     -0.9381
  H      1.2719     -2.0822     -0.8377
  S     -0.0500      1.1306      0.1514
  N     -1.1147     -0.1822      0.5074
  C     -0.5926     -1.3347      0.1299
  H     -1.1422     -2.2662      0.2851"""

smi_key = 'thiazole'

# Define the PySCF molecule object
Thiazole_mol=gto.Mole(
    atom=mol_xyz,
    basis='def2-TZVP',# on defini la base de la molécule
    charge=0,      # on defini la charge 
    spin=0,        #  on defini le spin
    unit='Angstrom', # on defini l'unité 'Angstrom' ,on peut aussi definir le 'bohr'
)
Thiazole_mol.build() # on construit la molécule

<pyscf.gto.mole.Mole at 0x747791f7ead0>

### Representation 3D de la molécule avec py3Dmol

In [4]:
"""_3D representation with py3Dmol
"""
# Create a py3Dmol.view object
xyz_view = py3Dmol.view(width=250, height=250) # on crée  un objet py3Dmol.view representant la fenetre 3D  ou la molécule sera affiché comme parametre respectifs 'largeur ' et 'hauteur'

# Add the molecule model to the view
xyz_view.addModel(Thiazole_mol.tostring(format="xyz"),'xyz')# la methode 'tostring()'convertit l'objet moléculaire en une chaine de caractères ( format de sortie est 'xyz')
# xyz_view.addModel(mol_xyz,'xyz')

# Set the style of representation
xyz_view.setStyle({'stick': {}, 'sphere': {'scale': 0.40}}) # on defini le style de représentation de la molécule:
# les atomes sont représentés par des bâtonnets (stick) et des sphères (sphere) avec une échelle de 0,40.

# Zoom to fit the molecule in the view
xyz_view.zoomTo()    # on ajoute l'option de zoom ,pour mieux visualiser la molécule

# Show the molecule view
xyz_view.show() # On  affiche la fenêtre 3D contenant la représentation de la molécule


### Impression des propriétés de la molécule

In [5]:
print(f'Le nombre total d\'électrons est {Thiazole_mol.nelectron} \
et le nombre total d\'électrons (alpha, béta) est {Thiazole_mol.nelec}\n')
print(f'Les index (0-Based) du (HOMO,LUMO) sont {Thiazole_mol.nelectron//2 -1, Thiazole_mol.nelectron//2}\n')
print(f'Le nombre d\'orbitales atomiques, dans la base {Thiazole_mol.basis}, est {Thiazole_mol.nao}\n')
print(f'L\'énergie nucléaire vaut {Thiazole_mol.energy_nuc()} Hartrees')

Le nombre total d'électrons est 44 et le nombre total d'électrons (alpha, béta) est (22, 22)

Les index (0-Based) du (HOMO,LUMO) sont (21, 22)

Le nombre d'orbitales atomiques, dans la base def2-TZVP, est 179

L'énergie nucléaire vaut 203.5391249740159 Hartrees


### Calcul Hartree Fock (HF) 

Il utilise la fonction de Roothaan-Hall qui jout un rôle essentiel dans la résolution de l'équation de Hartree-Fock pour les systèmes moléculaires

$$\mathbf{FC} = \mathbf{SC} \epsilon.$$

* $\mathbf{F}$ est la matrice Fock;
* $\mathbf{C}$ est la matrice des coefficients orbitaux moléculaires;
* $\mathbf{S}$ est la matrice de chevauchement orbitale atomique;
* $\epsilon$ est le vecteur des énergies orbitales moléculaires.

L'équation de Roothaan-Hall est une méthode fondamentale en chimie quantique permettant de résoudre l'équation de Schrödinger pour les systèmes moléculaires. Sa résolution sert principalement à :

    Calculer la structure électronique des molécules :
        Déterminer les orbitales moléculaires et leur énergie.
        Calculer la densité électronique et les charges partielles des atomes.
        Prédire les propriétés chimiques et physiques des molécules.


$$\mathbf{FC} = \mathbf{SC} \epsilon.$$

* $\mathbf{F}$ est la matrice Fock;
* $\mathbf{C}$ est la matrice des coefficients orbitaux moléculaires;
* $\mathbf{S}$ est la matrice de chevauchement orbitale atomique;
* $\epsilon$ est le vecteur des énergies orbitales moléculaires.


### Création du champ moyen avec scf.RHF()

In [6]:
from pyscf import scf # de 'pyscf' on importe 'scf"

mf=scf.RHF(Thiazole_mol) # On utilise l'objet 'RHF' de 'scf' pour faire le calcul du champ moyen

In [7]:
mf.kernel() #  la fonction 'kernel()' permet d'executer ce calcul 

converged SCF energy = -567.370561140446


-567.3705611404457

In [8]:
mf.mo_occ # on obtient  l'occupation des orbitales moléculaires à partir du champ moyen

array([2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.,
       2., 2., 2., 2., 2., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [9]:
mf.get_occ() # on affiche l'occupation des orbitales moléculaires

array([2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.,
       2., 2., 2., 2., 2., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [10]:
try:
    import plotly.express as px  # On importe 'plotly.express' comme 'px'
except:                          # s'il n'est pas installé, le programme utilisera les commandes qui suivent pour l'installer  et l'importer respectivement
    !pip install plotly
    import plotly.express as px

# Plot the MO Occupations
fig = px.line(y=mf.mo_occ, markers=True, title="Molecular Orbital (MO) Occupations")   # on utilise la fonction px.line() de Plotly express pour tracer un graphique en ligne des occupations des orbitales moléculaires (mf.mo_occ)
fig.update_layout(xaxis_title="Orbital Index (0-Based)", yaxis_title="MO Occupation") # utilise 'update_layout' pour personnaliser la mise en page du graphique
                                                                                     # yaxis_title="MO Occupation" permet de nommer l'axe des y
fig.show()                                                                          # affiche la figure

In [11]:
lumo_idx = mf.mo_occ.tolist().index(0.) # 'tolist()' converti en liste python la liste des occupations moléculaires recupérées,et trouve l'indice de la première valeur egale à '0' de cette liste
                                         #qui correspond a l'indice LUMO  
homo_idx = lumo_idx - 1               # Il déduit ensuite l'indice de la dernière orbitale moléculaire occupée (HOMO) en soustrayant 1 de l'indice LUMO.
print(f'Les index (0-Based) du (HOMO,LUMO) sont {homo_idx,lumo_idx}') # affiche l'indice du HOMO et LUMO calculé 

Les index (0-Based) du (HOMO,LUMO) sont (21, 22)


In [12]:
from pyscf.data.nist import HARTREE2EV as au2ev # On importe de 'pyscf.data.nist' la fonction'HARTREE2EV' comme 'au2ev (qui permettra de convertir de HARTREE en EV
print(f'Energie du Homo = {mf.mo_energy[homo_idx] * au2ev} eV')#Récupère l'énergie de l'orbitale HOMO  en hartree et convertie en ev.
print(f'Energie de Lumo = {mf.mo_energy[lumo_idx] * au2ev} eV')#Récupère l'énergie de l'orbitale LUMO  en hartree et convertie en ev.
print(f'Energie du gap Homo-Lumo = {abs(mf.mo_energy[homo_idx] - mf.mo_energy[lumo_idx]) * au2ev} eV')#Calcule la différence d'énergie entre le HOMO et le LUMO, en valeur absolue,et affiche l'énergie en eV

Energie du Homo = -9.655929108062653 eV
Energie de Lumo = 2.462426007020408 eV
Energie du gap Homo-Lumo = 12.11835511508306 eV


In [13]:
# Plot the MO Energies (i.e. eigenvalues of the Fock matrix)
fig = px.line(y=mf.mo_energy, markers=True, title="Molecular Orbital (MO) Energies (a.u.)")# crée un objet fig qui représente le graphique à l'aide de la fonction px.line() de la bibliothèque Plotly Express
                                                                                           # markers=True : ajoute des marqueurs pour chaque point de données sur le graphique.  
fig.update_layout(xaxis_title="Orbital Index (0-Based)", yaxis_title="MO Energies (a.u.)")
fig.show()

#### Energie totale SCF

In [14]:
mf.e_tot  # Calcul l'energie totale SCF

-567.3705611404457

In [15]:
mf.dump_scf_summary() # On fait la synthese des energies SCF 

**** SCF Summaries ****
Total Energy =                        -567.370561140445716
Nuclear Repulsion Energy =             203.539124974015891
One-electron Energy =                -1182.893516081878943
Two-electron Energy =                  411.983829967417364


In [16]:
mf.scf_summary # on affiche les principales composantes de l'énergie totale du système calculée par la méthode Hartree-Fock

{'e1': -1182.893516081879, 'e2': 411.98382996741736, 'nuc': 203.5391249740159}

### On affiche les paramètres de calculs du mf

In [17]:
mf=scf.RHF(Thiazole_mol)

mf.conv_tol=1e-12 # the difference in the SCF energy (in Hartrees) between two successive cycles              (On defini le critere de convergence du calcul)
mf.conv_tol_grad=1e-8 # the root-mean-square of the orbital gradient                                     (définit le critère de convergence de la norme quadratique moyenne du gradient des orbitales à 1e-8)
mf.direct_scf_tol=1e-13 #the threshold for discarding integrals                                           (on accélére les calculs en négligeant les intégrales dont la valeur est inférieure à ce seui)
mf.init_guess='atom' #  vital for the efficient completion of the SCF procedure                         **( Je ne comprend pas le role de cette ligne)
mf.max_cycle=100 # the maximum number of SCF cycles that should be performed before the calculation terminates. For systems that are notoriously difficult to converge, the value should be increased to 100 or even 1000
mf.max_memory=4000 #determines the maximum amount of memory (in Megabytes) that PySCF is allowed to utilize during the SCF procedure
mf.verbose=5 #controls the print level for the mean-field object (in the 'Dwat_HF.txt' defined above)                    (## Donne le niveau de detail a afficher)

mf.kernel()                           # ( execute le calul)



******** <class 'pyscf.scf.hf.RHF'> ********
method = RHF
initial guess = atom
damping factor = 0
level_shift factor = 0
DIIS = <class 'pyscf.scf.diis.CDIIS'>
diis_start_cycle = 1
diis_space = 8
diis_damp = 0
SCF conv_tol = 1e-12
SCF conv_tol_grad = 1e-08
SCF max_cycles = 100
direct_scf = True
direct_scf_tol = 1e-13
chkfile to save SCF result = /tmp/tmpltkub_ze
max_memory 4000 MB (current use 279 MB)
Initial guess from superposition of atomic densities.


E1 = -1176.7450757219299  E_coul = 403.6569157838239
init E= -569.54903496409
cond(S) = 45359.41841873373
    CPU time for initialize scf     21.42 sec, wall time      9.00 sec
  HOMO = -0.344699663784207  LUMO = -0.0898579654351829
  mo_energy =
[-9.20916190e+01 -1.59210380e+01 -1.16260678e+01 -1.16082133e+01
 -1.16066085e+01 -9.10150518e+00 -6.77162724e+00 -6.77029622e+00
 -6.76684400e+00 -1.88347582e+00 -1.47537382e+00 -1.28918397e+00
 -9.28107818e-01 -8.99833081e-01 -7.51151199e-01 -6.24444950e-01
 -5.70449236e-01 -5.52428845e-01 -4.60858737e-01 -4.22400877e-01
 -3.93550127e-01 -3.44699664e-01 -8.98579654e-02 -2.18009224e-02
  1.04391958e-02  8.03160201e-02  9.29687004e-02  1.30419879e-01
  1.51892324e-01  1.67691165e-01  2.07637821e-01  2.60989786e-01
  2.70930804e-01  2.91973677e-01  3.05112945e-01  3.16569387e-01
  3.22791029e-01  3.64351384e-01  3.80792020e-01  3.86257519e-01
  4.06867824e-01  4.14356639e-01  4.29563694e-01  4.53776080e-01
  4.64235656e-01  4.85316718e-01  4.89

-567.370561140472

In [18]:
### On obtient le résultat après 27 itérations

### Théorie de la fonctionnelle de la densité - DFT

#### Création d'un objet mean-field (mf) avec `scf.RKS()

In [19]:
from pyscf import dft # On importe 'dft' de 'pyscf'

mfd=dft.KS(Thiazole_mol) # on fait le calcul du champ moyen avec 'KS'

mfd.xc='wB97X-D' #  on fait le choix de la fonctionnelle

mfd.kernel() # on execute le calcul

converged SCF energy = -569.052665024419


-569.0526650244185

In [20]:
mfd.dump_scf_summary()

**** SCF Summaries ****
Total Energy =                        -569.052665024418502
Nuclear Repulsion Energy =             203.539124974015891
One-electron Energy =                -1183.819026526315383
Two-electron Coulomb Energy =          461.117913415940450
DFT Exchange-Correlation Energy =      -49.890676888059424


In [21]:
mfd.scf_summary

{'e1': -1183.8190265263154,
 'coul': 461.11791341594045,
 'exc': -49.890676888059424,
 'nuc': 203.5391249740159}

In [22]:
mf.dump_scf_summary()

**** SCF Summaries ****
Total Energy =                        -567.370561140471978
Nuclear Repulsion Energy =             203.539124974015891
One-electron Energy =                -1182.893501753552300
Two-electron Energy =                  411.983815639064403


In [23]:
mf.analyze(verbose = 4) # on analyse le champ moyen avec un niveau de detail 4

**** SCF Summaries ****
Total Energy =                        -567.370561140471978
Nuclear Repulsion Energy =             203.539124974015891
One-electron Energy =                -1182.893501753552300
Two-electron Energy =                  411.983815639064403
**** MO energy ****
MO #1   energy= -92.0086819478986  occ= 2
MO #2   energy= -15.5929343755766  occ= 2
MO #3   energy= -11.2900071077965  occ= 2
MO #4   energy= -11.2863072320872  occ= 2
MO #5   energy= -11.249910905126   occ= 2
MO #6   energy= -9.00863973946178  occ= 2
MO #7   energy= -6.68971803301309  occ= 2
MO #8   energy= -6.68886821744796  occ= 2
MO #9   energy= -6.68842828272764  occ= 2
MO #10  energy= -1.25550297196204  occ= 2
MO #11  energy= -1.05971175716499  occ= 2
MO #12  energy= -0.998531947580138 occ= 2
MO #13  energy= -0.796067238280574 occ= 2
MO #14  energy= -0.769130003774976 occ= 2
MO #15  energy= -0.697920969857651 occ= 2
MO #16  energy= -0.586373749058671 occ= 2
MO #17  energy= -0.572094699369232 occ= 2
MO #18

((array([1.99998886e+00, 1.03858952e+00, 4.23065027e-03, 1.49428395e-03,
         9.34841475e-05, 1.07404551e+00, 1.04848290e+00, 1.00737262e+00,
         4.08533631e-03, 4.63391168e-03, 5.57112392e-03, 1.43381278e-03,
         1.37959153e-03, 6.19078015e-04, 4.30877360e-03, 2.92302639e-03,
         2.74399481e-03, 3.21683445e-03, 1.84428469e-03, 3.06101523e-04,
         2.29534596e-04, 1.61751004e-04, 2.27728746e-04, 5.40201124e-04,
         6.35204577e-04, 6.45354838e-04, 3.71871609e-04, 6.71088916e-04,
         4.36315171e-04, 4.10706479e-04, 7.13075621e-04, 1.99998814e+00,
         9.87682206e-01, 3.84591491e-03, 4.84446023e-04, 1.24598282e-04,
         1.03332054e+00, 1.05879114e+00, 1.06557091e+00, 5.45358680e-03,
         4.66458378e-03, 6.65003229e-03, 4.38747345e-04, 9.38392544e-04,
         2.02485679e-04, 1.46980838e-03, 1.34956817e-03, 1.79067050e-03,
         1.93498186e-03, 2.96683501e-03, 7.10323808e-04, 2.59377247e-04,
         1.30602196e-04, 1.67722395e-04, 2.24037851

### Ensemble de bases de calcul 

In [24]:
basis_sets = [
    "STO-3G",           # Simple zeta, minimal basis
    "3-21G",            # Double zeta with 3 Gaussian primitives
    "6-31G",            # Double zeta with 6 Gaussian primitives
    "6-31G*",           # Double zeta with 6 Gaussian primitives
    "6-31G(d,p)",       # Polarization functions (+ 5 d-orbitals for all atoms except H, +3 p-orbitals for H atoms) added
    "6-311G(d,p)",      # Triple zeta with polarization functions
    "6-311+G(d,p)",     # Triple zeta with polarization functions and diffuse functions
    "cc-pvqz",          # Quadruple zeta
    "cc-pv5z",          # Quintuple zeta
    "def2-SVP",         # Double zeta with polarization functions
    "def2-SVPD",         # Double zeta with polarization functions and diffuse functions
    "def2-TZVP",        # Triple zeta with polarization functions
    "def2-TZVPD",       # Triple zeta with polarization functions and diffuse functions
    "def2-TZVPP",       # Triple zeta with polarization functions and diffuse functions
    "def2-TZVPPD",      # Triple zeta with polarization functions, diffuse functions, and d functions
    "def2-QZVP",        # Quadruple zeta with polarization functions
    "def2-QZVPP",       # Quadruple zeta with polarization functions and diffuse functions
    "def2-QZVPPD",      # Quadruple zeta with polarization functions, diffuse functions, and d functions
    "def2-QZVPD",       # Quadruple zeta with polarization functions and diffuse functions
    "def2-QZVPPD",      # Quadruple zeta with polarization functions, diffuse functions, and d functions
]

In [25]:
import time                  # on importe le module 'time' qui permettra de mesurer le temps pour chaque calcul

mf_energies = list()        # cette liste servira à stocker l' energie pour chaque base
mf_times = list()           #Cette liste servira à stocker les temps d'exécution des calculs HF pour chaque base 
nb_prim = list()             #Cette liste servira à stocker le nombre de fonctions de base primitives pour chaque base

# Perform a Mean-Field calculation for each basis set
for bs in basis_sets:

    # Measure execution time
    start = time.time()            # Enregistre l'heure de debut de calcul
    Thiazole_mol.basis = bs            # change la base de calcul
    Thiazole_mol.build()

    mf = scf.RHF(Thiazole_mol)       #crée un nouvel objet mf pour le calcul Hartree-Fock restreint (RHF) sur la molécule DWat_mol
    mf.kernel()
    end = time.time()             # Enregistre l'heure de fin du calcul

    nb_prim.append(Thiazole_mol.npgto_nr())
    mf_energies.append(mf.e_tot)
    mf_times.append(end-start)


converged SCF energy = -560.839162479208
converged SCF energy = -564.353910370577
converged SCF energy = -567.14659720878
converged SCF energy = -567.271438515033
converged SCF energy = -567.277171175378
converged SCF energy = -567.332421478453
converged SCF energy = -567.337216126817


converged SCF energy = -567.386205746625
converged SCF energy = -567.390991904292
converged SCF energy = -567.03322381821
converged SCF energy = -567.047677122676
converged SCF energy = -567.370561140446
converged SCF energy = -567.3714549239
converged SCF energy = -567.371711409627
converged SCF energy = -567.372532084781
converged SCF energy = -567.390181136282
converged SCF energy = -567.390181136281
converged SCF energy = -567.390318544903
converged SCF energy = -567.390318544903
converged SCF energy = -567.390318544902


In [26]:
# Create the results dataframe
import pandas as pd                    

df_HF = pd.DataFrame({"Basis":basis_sets, 
                      'Nb of GTO primitives':nb_prim, 
                      'Total energy':mf_energies,
                      "Time":mf_times})

df_HF                                                                


Unnamed: 0,Basis,Nb of GTO primitives,Total energy,Time
0,STO-3G,96,-560.839162,0.28804
1,3-21G,96,-564.35391,0.266673
2,6-31G,146,-567.146597,0.443223
3,6-31G*,171,-567.271439,0.802366
4,"6-31G(d,p)",180,-567.277171,1.037844
5,"6-311G(d,p)",193,-567.332421,1.983811
6,"6-311+G(d,p)",213,-567.337216,3.883636
7,cc-pvqz,455,-567.386206,652.236078
8,cc-pv5z,732,-567.390992,8706.436098
9,def2-SVP,153,-567.033224,0.891997


In [27]:
%matplotlib notebook
import matplotlib.pyplot as plt

# Create the matplotlib figure
fig, ax = plt.subplots(figsize=(8,5))

# Plot the energies.
ax.set_xticks(range(len(basis_sets)), basis_sets, rotation=90)
ax.set_xlabel("Basis set")
ax.set_ylabel("Energy(Hartree)", color="b")
ax.scatter(range(len(basis_sets)), mf_energies, marker="o", s=50, color="b")

# Plot the time to solution
ax_time = ax.twinx()
ax_time.scatter(range(len(basis_sets)), mf_times, marker="s", s=50, color="r")
ax_time.set_ylabel("Time to solution(s)", color="r", rotation=270, va="bottom")

# Show the graph
plt.tick_params(axis="both", direction="in")
plt.show()

<IPython.core.display.Javascript object>