<a href="https://colab.research.google.com/github/RochaGerd/Chemistry_with_Python/blob/main/8o_Enconto_Qu%C3%ADmica_UFPB_2024_Parte_01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Modelagem Molecular Usando Python**

##Autor: Prof. Gerd Bruno Rocha
###(gbr@academico.ufpb.br e https://www.quantum-chem.pro.br/)

####Links:

1. <https://github.com/RochaGerd/Chemistry_with_Python>
2. <https://pense-python.caravela.club/introducao.html>
3. <https://github.com/pythonchembook>

***Versão: 1.0 (01-JUL-24)***

----------------------

### **Minicurso prático**
#### *Duração Total: 6 horas, divididos em dois dias*

Requisitos: Ter familiaridade com Python e conceitos de química. Possuir conta no Google (**preferência**) ou Replit.

Ambiente de programação: **Plataforma Google Colab (<https://colab.research.google.com/>)** ou Replit (<https://replit.com/>).


***Material bibliográfico sobre uso de Python em Química:***

1. Aprendendo Química com Python, Rodrigo Queiroz e Gerd Rocha, 2021, Amazon Book. <https://github.com/pythonchembook>

  Link para compra: <https://www.amazon.com/Aprendendo-Qu%C3%ADmica-com-python-Portuguese/dp/B09LGSG6TY>

2. J. Mueller. Começando a Programar em Python Para Leigos. Alta Books, 2020.
3. A. Downey. Pense em Python: Pense como um cientista da computação. Novatec, 2016.
4. <https://penseallen.github.io/PensePython2e/>
5. <https://python-guide-pt-br.readthedocs.io/pt_BR/latest/>
6. <https://aprendendo-computacao-com-python.readthedocs.io/en/latest/index.html>
7. Websites, tutoriais, artigos (visite o portal do Journal of chemical education) e outros mais.

---------------------------





###**Conteúdo do Minicurso teórico/prático:**

####**PARTE 1 (Dia 02/07/24): Aspectos introdutórios do uso de Python em modelagem molecular com o Google Colab**

#### 1. Introdução à Modelagem Molecular (20 min)
- **Conceitos Básicos de Modelagem Molecular**
  - Definição e importância da modelagem molecular
  - Aplicações em Química, Biologia e Ciência dos Materiais

#### 2. Ambiente de Trabalho: Google Colaboratory (20min)
- **Configuração do Google Colaboratory**
  - Introdução ao Google Colaboratory
  - Configuração do ambiente para modelagem molecular
  - Importação de bibliotecas básicas de Python: `numpy`, `matplotlib`, `pandas`, etc.
- **Trabalhando com Notebooks**
  - Estrutura e funcionalidade dos notebooks
  - Execução de células de código e markdown

#### 3. Instalação e uso básico de Bibliotecas de Python para Modelagem Molecular   (140 min)

- **Aspectos introdutórios de Modelagem molecular**
  - Definindo o sistema molecular
  - Superfície de energia potencial e campo de força
- **Biblioteca RDKit**
  - Processamento de moléculas (código SMILES)
  - Visualização 2D
  - Cálculo elementares de propriedades moleculares
  - Cálculos de mecânica molecular
  - Busca conformacional
  - Visualização de estruturas moleculares em 3D com o py3Dmol
  - Descritores moleculares com a Mordred
- **Dinâmica molecular**
  - AmberTools  
- **Métodos *ab initio* e DFT**
  - PySCF
  - Psi4
- **Métodos semiempíricos**
  - MOPAC
  - xTB

####**PARTE 2 (Dia 03/07/24): Aplicações Avançadas**

#### 1. Aplicações Avançadas (180 min)

- **Modelagem do *Protein folding***
  - Encontrando uma estrutura enovelada a partir de cálculos quânticos

- **Modelagem de proteínas em solvente implícito**
  - Enovelamento de proteína

- **Dinâmica molecular de proteínas em solução**
- **Visualizando a estrutura eletrônica de PAHs (*polycyclic aromatic hydrocarbons*)**

####**Considerações finais**
####**Formulário de *feedback* do minicurso**

-------------

**Tutoriais e Documentação**
   - [Google Colaboratory Documentation](<https://colab.research.google.com/notebooks/intro.ipynb>)
   

---------------
##**Objetivos**

1. Permitir a popularização da programação para químicos(a)s
2. Divulgar aspectos introdutórios dos métodos de modelagem/simulação molecular como estratégia de aprendizado de química
3. Mostrar a potencialidade da modelagem/simulação molecular para pesquisa em química e áreas afins
4. Apresentar uma platafoma online que permite realizar modelagem/simulação molecular *open source*.

-----------
## **Público alvo**

1. Alunos de graduação e de pós-graduação sem experiência com modelagem/simulação molecular
2. Alunos de graduação e de pós-graduação com pouca base de programação em python

------------

#**PARTE 1: Aspectos introdutórios do uso de Python em modelagem molecular**




##**1 - Introdução à Modelagem Molecular (20 min)**
- **Conceitos Básicos de Modelagem Molecular**
  - Definição e importância da modelagem molecular
  - Aplicações em Química, Biologia e Ciência dos Materiais



### **1.1 - O que é modelagem molecular?**

**Definição da IUPAC:** <font color='red'>é a investigação das estruturas e das propriedades moleculares pelo uso da química computacional e técnicas de visualização gráficas, visando fornecer uma representação tridimensional, sob um dado conjunto de circunstâncias.</font>

<https://goldbook.iupac.org/terms/view/MT06971#:~:text=Molecular%20modeling%20is%20the%20investigation,a%20given%20set%20of%20circumstances>

Requer uma interação entre pesquisadores de física, química, matemática, ciência da computação, estatística, ciência dos materiais, engenharias e biologia.

  - Construção de modelos
  - Cálculo de propriedades e fenômenos
  - Sintetisar ou produzir os materiais desejados

**<font color='red'>Os cientistas moleculares modelam os materiais para que estes desempenhem papéis importantes na sociedade.**

*in-silico*: Experimento computacional num sistema modelo

  

### **1.2 - Utilização de modelagem molecular**

A química computacional se tornou uma ferramenta essencial em diversas áreas da química, revolucionando a maneira como pesquisadores abordam problemas químicos. Hoje em dia, a química computacional é tão integrada à pesquisa e desenvolvimento que é difícil imaginar a química moderna sem ela.

**Em resumo, as áreas da química que mais se beneficiam da química computacional são:**

**1. Descoberta e Desenvolvimento de Fármacos:**

* **Simulação de Interações Moleculares:** A química computacional permite simular a interação entre moléculas de fármacos e seus alvos biológicos, auxiliando na identificação de candidatos promissores e na otimização de sua estrutura molecular para maior atividade e especificidade.
* **Predição de Propriedades Moleculares:** Através de cálculos computacionais, é possível prever propriedades como toxicidade, solubilidade e permeabilidade de compostos, acelerando o processo de desenvolvimento de fármacos e reduzindo custos com testes experimentais.
* **Design Racional de Fármacos:** A química computacional permite o *design* racional de novos fármacos com propriedades específicas, direcionando o desenvolvimento para compostos mais eficazes e menos tóxicos.

**2. Química de Materiais:**

* **Desenvolvimento de Novos Materiais:** A simulação computacional de propriedades de materiais, como condutividade, resistência e reatividade, facilita o desenvolvimento de novos materiais com características otimizadas para aplicações específicas.
* **Estudo de Processos Químicos:** A química computacional pode simular processos químicos em materiais, como polimerização e catálise, ajudando na compreensão dos mecanismos envolvidos e na otimização das condições de reação.
* **Descoberta de Materiais Funcionais:** A simulação de propriedades emergentes em materiais, como supercondutividade e ferromagnetismo, permite a descoberta de novos materiais com funcionalidades inovadoras.

**3. Catálise:**

* **Desenvolvimento de Catalisadores Eficazes:** A química computacional pode simular reações catalíticas e o comportamento de catalisadores, auxiliando no design de catalisadores mais eficientes e seletivos para processos químicos específicos.
* **Estudo de Mecanismos de Reação:** A simulação computacional de mecanismos de reação catalítica permite a compreensão detalhada das etapas envolvidas e dos fatores que influenciam a eficiência do catalisador.
* **Otimização de Condições de Reação:** Através de simulações computacionais, é possível otimizar as condições de reação para aumentar a eficiência e seletividade de processos catalíticos.

**4. Química Ambiental:**

* **Estudo de Poluentes:** A química computacional pode simular o comportamento de poluentes no meio ambiente, como sua decomposição, transporte e interação com organismos vivos, auxiliando na avaliação de riscos e no desenvolvimento de estratégias de remediação.
* **Desenvolvimento de Materiais Ecológicos:** A simulação computacional de propriedades de materiais ecológicos, como biodegradabilidade e compostabilidade, facilita o desenvolvimento de produtos mais sustentáveis.
* **Otimização de Processos Industriais:** A química computacional pode simular processos industriais para reduzir a geração de poluentes e otimizar o uso de recursos, contribuindo para uma química mais verde.

**5. Química Teórica:**

* **Estudo da Estrutura e Propriedades Eletrônicas das Moléculas:** A química computacional permite calcular a estrutura molecular, as distribuições de carga eletrônica e as propriedades espectroscópicas de moléculas com alta precisão, aprofundando a compreensão da natureza química.
* **Desenvolvimento de Modelos Teóricos:** A química computacional contribui para o desenvolvimento de modelos teóricos cada vez mais precisos para descrever o comportamento de moléculas e sistemas químicos.
* **Exploração de Fenômenos Químicos Complexos:** A simulação computacional permite explorar fenômenos químicos complexos que são difíceis ou impossíveis de estudar experimentalmente, expandindo o conhecimento em áreas como catálise, fotoquímica e reações em fases líquidas e sólidas.

**Conclusão:**

A química computacional se tornou uma ferramenta indispensável para a química moderna, oferecendo soluções inovadoras para diversos desafios em áreas como desenvolvimento de fármacos, química de materiais, catálise, química ambiental e química teórica. Sua capacidade de simular e prever o comportamento de moléculas e sistemas químicos com alta precisão a torna uma ferramenta essencial para pesquisa, desenvolvimento e inovação na área da química.


---------------

##**2 - Utilizando Python no Google Colaboratory (20 min)**

O Google Colaboratoy ou, simplemente, Colab é um ambiente do tipo Jupyter Notebook gratuito fornecido pelo Google onde você pode usar recursos computacionais que precisem de CPUs, GPUs e TPUs.

É um ambiente que foi bem desenhado para ***Aprendizado de Máquina ou Inteligência artificial.***

No entanto, nesse minicurso vamos explorar algumas possibilidades de como usar esse ambiente computacional para fazer modelagem molecular.


### **2.1 - Como ter acesso ao Google Colaboratory**

Você pode fazer uma busca no google por "google colaboratory" para saber mais sobre a ferramenta. Para ter acesso à ferramenta é preciso possuir uma conta google. Uma vez que você tenha aberto uma conta na google, automaticamente você terá acesso à ferramenta *Google Colaboratory*.

O link direto é [`Colab`](https://colab.google/). Nesse link você poderá criar um novo *Notebook* ou abrir a ferramenta. Clique em *Open Colab*.

Ao clicar em *Open Colab*, você será redirecionado para uma janela onde você pode escolher em abrir um novo *Notebook* ou abrir um existente. Para quem não tem familiaridade nenhuma com a ferramenta é acoselhado tentar abrir *Notebooks* já prontos que estão na aba de *Exemplos*. Lá você vai encontrar mais de uma dezena de exemplos de como usar o *Colab*, desde tutoriais iniciais até os avançados.

----



### **2.2 - Começando a usar o Colab**

Nativamente o *Colab* é uma ferramenta de programação em Python ou R. Mas, vamos ver nesse minicurso que pode ser usada para muito mais coisas.

Para selecionar se vai programar em Python ou em R, basta ir no menu *Editar* e selecionar a opção *Configurações de Notebook*. Vai ser aberta uma janela onde você pode selecionar a linguagem do seu *notebook*, bem como selecionar também o ambiente computacional que você vai usar.

As opções são:

* CPU
* T4 GPU
* A100 GPU
* V100 GPU
* TPU

Na conta gratuita da plataforma Google, você terá direito a rodar em um ambiente de CPU contendo 2 *cores* e também poderá selecionar os aceleradores T4 GPU e TPU. As outras opções só estarão disponíveis mediante assinatura da ferramenta *Google Colab*. Essa assinatura pode ser feita clicando nessa mesma janela na opção *Compre mais unidades de computação*.

Para se conectar ao ambiente de execução selecionado, você deve clicar no botão *Conectar* que fica no canto superior direito. Ou explorar o menu ao lado desse mesmo botão.

Uma vez conectado a um ambiente de execução, você pode conferir os recursos computacionais disponíveis para você usar, tais como memória RAM e disco. Ao clicar no mostrativo de recursos, uma janela se abrirá onde várias informações são mostradas em detalhes.

Mude o nome do seu *notebook* de acordo com seu interesse. É sempre bom usar nomes sem espaços no meio do nome. Para isso use o caractere "_".

### Material bibliográfico sobre o *Google Colab*:

1. Poornima G. Naik. Conceptualizing Python in Google COLAB, 2023.
2. David Paper. State-of-the-Art Deep Learning Models in TensorFlow, 2021. <https://link.springer.com/book/10.1007/978-1-4842-7341-8>
3. SHASHIKANT BAKRE, PRIYA GOKHALE. Python Programming with Google Colab : A beginner's Hand Book
4. Todd Kelsey. Learning Python with ChatGPT and Google Colab: The easiest, quickest way to learn Python, using an advanced AI tutor and free cloud tools
5. AM Govind Kumar. Python Programming : With Google Colab Development Environment
6. William Vallejo, Carlos Díaz-Uribe, and Catalina Fajardo. Google Colab and Virtual Simulations: Practical e-Learning Tools to Support the Teaching of Thermodynamics and to Introduce Coding to Students. <https://pubs.acs.org/doi/10.1021/acsomega.2c00362>.

-------------

####**OBS: a partir desse ponto**

<font color='red'>Se você está seguindo esse minicurso usando a ferramenta *Colab*, a partir desse ponto você deve ir no menu *Arquivo* e clicar na opção *Salvar uma cópia no Drive*. Isso vai permitir que você tenha uma cópia desse *.ipynb* no seu *Google Drive* e possa ter total controle sobre o mesmo.

----


### **2.3 - O *Colab* é uma plataforma de linux**

Ao se conectar ao ambiente de execução do *Colab*, automaticamente é montado para você um "mini" ambiente Linux.

Veja que existe uma barra lateral contendo sete ícones. Ao clicar no quarto ícone (de cima pra baixo) vai dar acesso a uma janela onde você pode navegar na estrutura de arquivos e pastas que foi criada.

A pasta que é apresentada por padrão é a */content*. É nela onde os arquivos (*outputs*) que serão produzidos por meio de suas execuções serão salvas (por padrão) e também é a pasta onde você deve pôr seus *inputs* para serem lidos pelos procedimentos que constarão nas suas execuções.

Navegar nessa janela é muito intuitivo. Se parece muito com muitos gerenciadores de arquivos de ambientes Linux, Windows, Android, IOS, etc.

Nessa janela você pode fazer *upload* e *download* de arquivos, bem como criar pastas e também navegar pelas pastas existentes. Se você navegar pela estrutura de pastas desse ambiente você vai perceber claramente que se trata de um ambiente Linux.

-------


### **2.4 - Começando a programar em Python**

Esse tutorial não foi produzido para apresentar a linguagem Python ou R. Para aprender a programar em Python sugiro os materiais a seguir:

##### **Para Python**

1. Aprendendo Química com Python, Rodrigo Queiroz e Gerd Rocha, 2021, Amazon Book. <https://github.com/pythonchembook>

  Link para compra: <https://www.amazon.com/Aprendendo-Qu%C3%ADmica-com-python-Portuguese/dp/B09LGSG6TY>

2. J. Mueller. Começando a Programar em Python Para Leigos. Alta
Books, 2020.
3. A. Downey. Pense em Python: Pense como um cientista da computação.
Novatec, 2016.
4. <https://penseallen.github.io/PensePython2e/>
5. <https://python-guide-pt-br.readthedocs.io/pt_BR/latest/>
6. <https://aprendendo-computacao-com-python.readthedocs.io/en/latest/index.html>
7. <https://github.com/RochaGerd/Chemistry_with_Python>

--------------------

O ambiente de programação do *Google Colab* é muito próximo de um ambiente do Jupyter Notebook. Onde você vai escrever seus códigos nas células de execução. A execução pode ser feita pelas teclas "Shift" e "Enter" pressionada juntas ou também clicando-se no botão de "Play* que cada célula possui.

O ambiente do *Google Colab* também permite que você insira células de texto, onde é usada a linguagem *Markdown* para edição e formatação dessas células.

Com a liguagem *Markdown* você pode construir tabelas, inserir equações e imagens, e muitas coisas mais.

Veja exemplos:

$\sqrt{3x-1}+(1+x)^2$

$e^x = \sum_{i = 0}^\infty \frac{1}{i!}x^i$

Vale muito a pena saber um pouco mais da linguagem *Markdown*. Existem muitos tutoriais para se aprender *Markdown*. Aqui apresento uma lista rápida conseguida através de uma busca simples. Mas existem livros e materiais mais avançados.

* <https://www.markdowntutorial.com/>
* <https://www.markdownguide.org/>
* <https://markdown.net.br>
* <https://experienceleague.adobe.com/docs/contributor/contributor-guide/writing-essentials/markdown.html?lang=pt-BR>

------------------


In [None]:
# Versão do Python usada
import sys
print(sys.version)

In [None]:
# Mostrar data e hora da execução
import time
print(time.ctime())

In [None]:
'''# Verificando a GPU

import tensorflow as tf
tf.test.gpu_device_name()
'''

In [None]:
import multiprocessing

cores = multiprocessing.cpu_count() # Count the number of cores in a computer
cores

---------
#### **2.4.1 - Instalação de bibliotecas no Python/Google *Colab***

Existe um minicurso de noções de Python mais completo do que exploraremos aqui e pode ser encontrado no link a seguir:

- <https://github.com/RochaGerd/Chemistry_with_Python>

Aqui, nesse minicurso, mostrarei apenas os seguintes conteúdos de Python:

- Bibliotecas essenciais (numpy, matplotlib e pandas)



---
#### **Bibliotecas e módulos**

Bibliotecas são coleções de funções e classes (e às vezes de dados gerais e constantes) que podem ser facilmente importadas em Python de forma a possibilitar uma enorme variedade de operações com um mínimo de código.

Links de bibliotecas em Python

- <https://pypi.org/>
- <http://datascienceacademy.com.br/blog/top-20-bibliotecas-python-para-data-science/>

Algumas dessas bibliotecas precisam ser instaladas. Elas não vêm com a distribuição do python.

Primeiro você tem que instalar a biblioteca

- Para isso você deve usar os gerenciadores de pacotes de Python: PyPi (<https://pypi.org/>) ou "*Conda*".
- <http://pyscience-brasil.wikidot.com/install:como-instalar-o-numpy>
- <https://computadorcomwindows.com/2018/01/19/tutorial-como-instalar-uma-biblioteca-python-no-computador/>
- <http://pyscience-brasil.wikidot.com/>

Para carregar uma bibloteca e/ou pacote no seu programa, use uma das seguintes chamadas:


```python
import biblioteca
import biblioteca as apelido
from biblioteca import módulo
from biblioteca import módulo as apelido
from biblioteca import função
from biblioteca import função as apelido
```

---

In [None]:
# Exemplo de importação da biblioteca matemática NumPy
import numpy as np
print ("Versão da NumPy", np.__version__)

In [None]:
print(4.0*np.pi) # Imprime a operação 4.0*Pi

print(np.sqrt(10.0)) # Imprime a raiz quadrada de 10.0

print(2.0*np.cos(np.pi)) # Função cosseno

#print(np.abs(-3.0*np.pi)) # Função valor absoluto

In [None]:
# Exemplo de importação de um módulo específico do SciPy # OBS colocar operações da SciPy
from scipy import linalg as la
A = np.matrix(np.random.random((2,2)))
B = np.mat(np.random.random((10,5)))
C = np.mat([[3,4], [5,6]])
print("A = ", A)
print("B = ", B)
print("C = ", C)

In [None]:
import pandas as pd
print("Versão do Pandas", pd.__version__)

In [None]:
%%file dados.csv
 X,Y
  1.1,     3.5
  4. ,     6.9
  0.1,     9.5
 23.89,   67.789
 -4.999,  55.456
-35.,     34.98

In [None]:
# Se colunas estão separadas por espaços ou tabulações , use :
data = pd.read_csv('dados.csv',header=0)      # colunas separadas por ','

type(data)

In [None]:
data

In [None]:
data.to_excel('dados_novo.xlsx', index = False)  # exporte como xlsx

In [None]:
# Importando a Matplolib
# Quando usar o Jupyter-Notebook um comando para mostrar os gráficos no próprio Jupyter Notebook é:

%matplotlib inline
import matplotlib as mpl

print ("Versão da Matplotlib usada:", mpl.__version__)

In [None]:
from matplotlib import pyplot as plt # Comando para carregar o módulo PyPlot da Matplotlib

ax = [0., 0.5, 1.0, 1.5, 2.0, 2.5, 3.0]
ay = [0.0, 0.25, 1.0, 2.25, 4.0, 6.25, 9.0]
plt.plot(ax,ay)
plt.show()

In [None]:
# Exemplo Distribuição de Velocidades moleculares em um gás ideal
# A distribuição das velocidades das moléculas de um gás ideal pode ser calculada com base no tratamento dado por James Clerk Maxwell juntamente com Ludwig Boltzmann.
# Considere 1 mol de gás carbônico (CO2) inserido em um recipiente de volume fixo de 1L.
# Obtenha as curvas de distribuição de velocidade molecular para essa amostra nas temperaturas de 300K e 800K.
# Fonte para consulta: Tópico 3D.3 do livro Peter Atkins, Loretta Jones e Lerroy Laverman, Princípios de Química: questionando a vida moderna e o meio ambiente, 7.ed., Porto Alegre, Bookman, 2018.
import numpy as np
import matplotlib.pyplot as plt

M_CO2 = 44.0095  # Em g/mol
R = 8.3145 # J/(K*mol)
T1 = 300  # K
T2 = 800  # K
ct1 = ((M_CO2/1000.0)/(2.0*R*T1))
ct2 = ((M_CO2/1000.0)/(2.0*R*T2))

npt = 100000
vmin, vmax = 0.01, 2000.0
v = np.linspace(vmin, vmax, npt)

fr1 = 4.0*np.pi*((ct1/np.pi)**(1.5))*np.square(v)*np.exp(-ct1*np.square(v))
fr2 = 4.0*np.pi*((ct2/np.pi)**(1.5))*np.square(v)*np.exp(-ct2*np.square(v))

plt.plot(v,fr1, label="T = 300K", lw = 2.5)
plt.plot(v,fr2, label="T = 800K", lw = 2.5)
plt.title("Gráfico de distribuições de velocidades moleculares ", fontsize=16)
plt.xlabel("Velocidade molecular (m/s)",fontsize=14)
plt.ylabel("Fração, f(v) (s/m)",fontsize=14)
plt.legend()
plt.tight_layout()
plt.savefig('molecular_speed.png',dpi=400, transparent=True)
plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt

L, nx, ny = 1, 2, 2
x = np.linspace(0, L, 20)
y = np.linspace(0, L, 20)
X, Y = np.meshgrid(x,y)

Psi = (2/L) * np.sin(nx*np.pi*X/L) * np.sin(ny*np.pi*Y/L)

fig = plt.figure(figsize=(10,6))
plt.contourf(X, Y, Psi, 12, cmap='jet', alpha=0.8)
contorno = plt.contour(X, Y, Psi, 12, colors='black')
plt.clabel(contorno)

plt.title('Gráfico 2D de $\Psi_{2,2}(X,Y)$', fontsize=16)
plt.ylabel('Y', fontsize = 14)
plt.xlabel('X', fontsize = 14)
plt.savefig('2D_part_in_box_600.png', dpi=600, transparent=True)

##**3 - Instalação e uso básico de Bibliotecas de Python para Modelagem Molecular (140 min)**

A partir dessa parte vamos mostrar como utilizar a plataforma *Google Colab* como ambiente de desenvolvimento e execução de modelagens e simulações moleculares.

Para a maioria dos pesquisadores que executam códigos de modelagem e simulação molecular é preciso ter um ambiente que permita:

* Instalar seus programas, bibliotecas ou compilar seus códigos (fortran, C, C++, etc)
* Executar o cálculo em paralelo em CPUs e GPUs
* Manipular arquivos e pastas
* Outros

Vamos ver que dá para fazer tudo isso no ambiente Linux que é oferecido pelo *Google Colab*

#### **Instalando programas a partir de bibliotecas disponíveis em repositórios**

O *Google Colab* já possui muitas bibliotecas de Python pré-instaladas no seu ambiente computacional. Pelo menos as mais conhecidas:

* Numpy
* Scipy
* Matplotlib
* Pandas
* outras mais.

Contudo é interessante saber que você pode instalar uma biblioteca do Python, mesmo que ela não esteja disponível no *Google Colab*.

Para fazer isso basta usar o seguinte comando

- **!pip install** *nome da biblioteca ou pacote*
- **Através do ambiente *conda***

Ex: <font color='red'>**!pip install** *rdkit*

---

**Fonte: Aprendendo Química com Python, Rodrigo Queiroz e Gerd Rocha, 2021, Amazon Book. <https://github.com/pythonchembook>**


-----------------



#### **Executando comandos do sistema operacional Linux**

Os comandos anteriores mostraram que podemos executar qualquer comando do Linux, como se estivessemos em um terminal, usando a sintaxe:

* **!comando**

In [None]:
!ls -la *

# essa é a pasta /content

In [None]:
# Vendo infos sobre o sistema operacional do ambiente conectado
!cat /proc/cpuinfo
!cat /proc/meminfo

In [None]:
!lscpu

In [None]:
!cat /proc/cpuinfo | grep processor | wc -l

In [None]:
!apt-get install hwinfo

In [None]:
!hwinfo --cpu

In [None]:
#!nvidia-smi -L

In [None]:
#!nvidia-smi -q

In [None]:
#!nvidia-smi

In [None]:
!free -h --si | awk  '/Mem:/{print $2}'

In [None]:
'''
import os
if int(os.environ["COLAB_GPU"]) > 0:
  print("a GPU is connected.")
elif "COLAB_TPU_ADDR" in os.environ and os.environ["COLAB_TPU_ADDR"]:
  print("A TPU is connected.")
else:
  print("No accelerator is connected.")
'''

In [None]:
# Executando comandos a partir de um arquivo "temporário" bash
# Veja que aqui não é preciso usar o caractere "!" antes do comando do sistema operacional
%%bash
pwd
ls -la *

In [None]:
# para omitir a saida de muitos comandos
%%capture
!pip install py3Dmol
!pip instal pyscf
!pip instal ase

----------------
#### **Instalando programas a partir de executáveis compilados em máquinas externas**

Aqui a dica é compilar seu código em uma máquina Linux e fazer o *upload* para a pasta de interesse. Podendo ser inclusive a do seu drive montado.

Testar com um código simples de fortran.

Program Hello

write(6,*) "Hello Bro !!"

stop 'O programa acabou'

End Program Hello

*Compila com gfortran -o hello.exe hello.f90*
Você deve copiar seu executável para a pasta /content e executá-lo.

In [None]:
#!/contet/hello.exe

-------------------
#### **Compilando seus códigos dentro do ambiente do *Colab***

Como se trata de um ambiente Linux, você pode compilar seus códigos dentro do *Google Colab* e gerar seus executáveis. O *Colab* tem compilador de C++ e Fortran da GNU, além de cuda da Nvidia.  

A vantagem de compilar dentro do *Colab* é que teremos um executável bem ajustado para o ambiente Linux que o *Colab* nos oferece (CPUs e GPUs).  


In [None]:
%%file hello_world.f90
Program hello_world
Implicit none
Integer, parameter :: n = 10
Integer :: i
do i = 1,n
  write(6,*) 'Hello World'
enddo
continue
Stop 'O programa acabou'
End program hello_world

In [None]:
!ls -la *

In [None]:
!gfortran -o hello_world.exe hello_world.f90

In [None]:
!/content/hello_world.exe

In [None]:
#!cuda

In [None]:
#!gcc

### **3.1 - Modelagem molecular básica**

#### **3.1.1 - Definindo o sistema molecular**

A representação de sistemas moleculares no espaço é fundamental para a modelagem molecular e simulações computacionais.

* **Nomenclatura ou fórmula química (1-D):** Identificação da molécula. Permite a classificação de compostos de acordo com suas propriedades.
* **Fórmula plana ou de linhas (2-D):** Explicita grupos funcionais e ligações entre os átomos.
* **Estrutura tridimensional (3-D):** Geometria espacial (distâncias, ângulos e diedros), conformação.
* **Superfícies (3-D):** Fornece mapa 3D de propriedades (densidade eletrônica, potencial eletrostático, hidrofobicidade, área acessível ao solvente, etc.).


Para nós, nesse momento, a estrutura tridimensional permite a definição das coordenadas atômicas (X, Y, Z) e conectividades. A maneira como os sistemas moleculares são representados tem um impacto significativo na eficiência das simulações, além de influenciar a interpretação dos resultados.

O tipo de representação pode ser específica para evidenciar uma determinada propriedade ou específica para um dado tipo de sistema (e.g. estado sólido, proteína, líquido, etc..) .
Essas representações dão origem aos inúmeros formatos de arquivos usados pelos diversos programas de modelagem molecular.

Existe um conversor universal de formatos de arquivos de modelagem/simulação molecular:

* <https://openbabel.org/index.html>


#### **3.1.2 - Superfície de energia potencial e campo de força**

#### **Superfície de energia potencial**

A superfície de energia potencial (PES, do inglês *Potential Energy Surface*) é um conceito fundamental na química quântica e na modelagem molecular. Ela representa a energia potencial de um sistema molecular em função das coordenadas nucleares. A PES fornece uma descrição completa de como a energia do sistema varia com a geometria molecular, sendo essencial para entender e prever a estrutura, reatividade e dinâmica das moléculas.

#### **Fundamentos Teóricos**

A PES é uma função multidimensional que depende das coordenadas nucleares de um sistema de $N$ átomos:

$$
E = E(R_1, R_2, \ldots, R_N)
$$

onde $R_i$ são as coordenadas dos núcleos. A PES é geralmente obtida a partir de cálculos de mecânica quântica para diferentes conformações do sistema molecular.

#### **Pontos Críticos na PES**

Os pontos críticos na PES são de particular interesse:

- **Minimos Globais**: Corresponde à estrutura de menor energia, que geralmente é a mais estável.
- **Minimos Locais**: Correspondem a estruturas estáveis, mas de energia maior que o mínimo global.
- **Pontos de Sela**: Correspondem a estados de transição e representam barreiras de energia entre diferentes mínimas.

#### **Equação de Schrödinger**

A PES é derivada da equação de Schrödinger independente do tempo para um sistema molecular:

$$
\hat{H} \Psi = E \Psi
$$

onde $\hat{H}$ é o Hamiltoniano do sistema, $\Psi$ é a função de onda e $E$ é a energia. Para obter a PES, resolvemos a equação de Schrödinger para várias configurações nucleares fixas.

#### **Energia Potencial**

A energia potencial ou energia total para um sistema molecular pode ser expressa como:

$$
E_{potencial} = E_{eletrônica} + E_{nuclear}
$$

onde $E_{eletrônica}$ é a energia dos elétrons para uma configuração nuclear fixa e $E_{nuclear}$ é a energia de repulsão entre os núcleos.

#### Energia de Ativação

A energia de ativação para uma reação química é a diferença de energia entre o estado de transição (ponto de sela) e o reagente:

$$
E_{ativação} = E_{TS} - E_{reagente}
$$

### Bibliografia Relevante

1. **"Molecular Electronic-Structure Theory"** - T. Helgaker, P. Jørgensen, J. Olsen.
2. **"Modern Quantum Chemistry: Introduction to Advanced Electronic Structure Theory"** - A. Szabo, N. S. Ostlund.
3. **"Potential Energy Surfaces and Dynamics Calculations"** - D. G. Truhlar, A. Kuppermann.

#### **Campos de Força**

Campos de força são conjuntos de funções matemáticas e parâmetros que descrevem a energia potencial de um sistema molecular. São amplamente utilizados em simulações de dinâmica molecular (MD), Monte Carlo (MC) e mecânica molecular (MM) para estudar as propriedades estruturais e dinâmicas de biomoléculas, polímeros, materiais e outros sistemas químicos. Diferentemente dos métodos quânticos, os campos de força são baseados em aproximações clássicas, permitindo a simulação de sistemas muito maiores e em escalas de tempo mais longas.

#### **Fundamentos Teóricos**

Um campo de força descreve a energia potencial total de um sistema como a soma de várias contribuições energéticas, que podem incluir termos de interação entre pares de átomos, ângulos, torções e interações não ligadas.

#### **Energia Potencial Total do Campo de Força**

A energia potencial total $E_{total}$ de um sistema pode ser expressa como:

$$
E_{total} = E_{lig} + E_{ang} + E_{tor} + E_{não-lig}
$$

onde:

- $E_{lig}$: Energia de ligação.
- $E_{ang}$: Energia angular.
- $E_{tor}$: Energia de torção.
- $E_{não-lig}$: Energia de interações não-ligadas (van der Waals e eletrostática).

#### **Energia de Ligação**

A energia de ligação $E_{lig}$ é geralmente modelada como uma mola harmônica (Lei de Hooke):

$$
E_{lig} = \sum_{bonds} \frac{1}{2} k_b (r - r_0)^2
$$

onde $k_b$ é a constante de força da ligação, $r$ é a distância entre átomos ligados e $r_0$ é a distância de equilíbrio.

#### **Energia Angular**

A energia angular $E_{ang}$ também é modelada harmonicamente (lei de Hooke):

$$
E_{ang} = \sum_{ângulos} \frac{1}{2} k_\theta (\theta - \theta_0)^2
$$

onde $k_\theta$ é a constante de força angular, $\theta$ é o ângulo entre três átomos e $\theta_0$ é o ângulo de equilíbrio.

#### **Energia de Torção**

A energia de torção $E_{tor}$ é frequentemente modelada por uma série de Fourier:

$$
E_{tor} = \sum_{torções} \sum_n \frac{1}{2} V_n [1 + \cos(n\phi - \gamma)]
$$

onde $V_n$ é a constante de força de torção, $\phi$ é o dihedral angle, $n$ é a periodicidade e $\gamma$ é a fase.

#### **Energia de Interações Não-Ligadas**

As interações não-ligadas incluem forças de van der Waals e interações eletrostáticas:

$$
E_{não-lig} = \sum_{i<j} \left[ 4\epsilon_{ij} \left( \left( \frac{\sigma_{ij}}{r_{ij}} \right)^{12} - \left( \frac{\sigma_{ij}}{r_{ij}} \right)^6 \right) + \frac{q_i q_j}{4 \pi \epsilon_0 r_{ij}} \right]
$$

onde $\epsilon_{ij}$ e $\sigma_{ij}$ são os parâmetros de van der Waals para o par de átomos $i$ e $j$, $r_{ij}$ é a distância entre eles, $q_i$ e $q_j$ são as cargas parciais dos átomos, e $\epsilon_0$ é a permissividade do vácuo.


#### Bibliografia

1. **"Molecular Modelling: Principles and Applications"** - A. R. Leach.
2. **"Understanding Molecular Simulation: From Algorithms to Applications"** - D. Frenkel, B. Smit.
3. **"Computer Simulation of Liquids"** - M. P. Allen, D. J. Tildesley.


### **3.2 - Biblioteca RDKit**

A RDKit (**R**apidly developing **D**evelopment **K**it for **I**nformation **T**echnology) é uma biblioteca de software open-source em Python amplamente utilizada para química computacional. Ela oferece uma gama completa de ferramentas para manipulação, análise e visualização de moléculas, facilitando o desenvolvimento de aplicações em diversas áreas, como:

* **Descoberta de Fármacos:** A RDKit permite o cálculo de propriedades moleculares, predição de atividade biológica, *docking* de ligantes e *design* racional de fármacos.
* **Química Computacional:** A biblioteca fornece ferramentas para simulação de dinâmica molecular, otimização de geometria molecular, estudos de QSAR (*Quantitative Structure-Activity Relationships*) e muito mais.
* **Bioinformática:** A RDKit pode ser utilizada para análise de sequências de DNA e proteínas, predição de estrutura de proteínas, e estudos de interações biomoleculares.
* **Materiais:** A biblioteca oferece ferramentas para o estudo de materiais moleculares, como polímeros e nanomateriais.
* **Ensino e Pesquisa:** A RDKit é utilizada em diversos cursos e pesquisas em química, biologia, farmácia e áreas afins.

**Principais Características da RDKit:**

* **Facilidade de Uso:** A RDKit possui uma interface amigável e intuitiva, com documentação extensa e exemplos de código.
* **Flexibilidade:** A biblioteca oferece diversas funções e métodos para manipular e analisar moléculas de forma abrangente.
* **Extensibilidade:** A RDKit pode ser facilmente estendida com novas funcionalidades através de scripts em Python.
* **Comunidade Ativa:** A comunidade RDKit é grande e ativa, com fóruns online, tutoriais e workshops disponíveis para auxiliar os usuários.

**Links Importantes:**

* **Site Oficial:** [https://www.rdkit.org/docs/GettingStartedInPython.html](https://www.rdkit.org/docs/GettingStartedInPython.html)
* **Documentação:** [https://www.rdkit.org/docs/](https://www.rdkit.org/docs/)
* **Tutoriais:** [https://www.rdkit.org/docs/GettingStartedInPython.html](https://www.rdkit.org/docs/GettingStartedInPython.html)
* **Fórum da Comunidade:** [https://github.com/rdkit/rdkit/discussions](https://github.com/rdkit/rdkit/discussions)
* **Exemplos de Código:** [https://github.com/rdkit/rdkit](https://github.com/rdkit/rdkit)
* **Mais Tutoriais:** https://www.rdkit.org/docs/RDKit_Book.html

-------------


In [None]:
#@title **Instalando Conda/Mamba**
# Execute this cell to install mamba in the Colab environment

if 'google.colab' in str(get_ipython()):
  print('Running on colab')
  !pip install -q condacolab
  import condacolab
  condacolab.install_mambaforge()
else:
  print('Not running on colab.')
  print('Make sure you create and activate a new conda environment!')

In [None]:
# Conferência se foi instalado corretamente
!conda --version

In [None]:
#@title **Instalando/Importando libs importantes**
# install the 3rd party chemistry packages
!pip install -q rdkit
!pip install -q py3Dmol # --> https://pypi.org/project/py3Dmol/
!pip install -q pythreejs
##!pip install -q git+https://github.com/funkymunkycool/Cube-Toolz.git

# Instalando o NGL Viwer
!pip install ipywidgets==7.7.2 ## nglview

# import everything
import warnings
warnings.filterwarnings("ignore")
import pathlib
import sys, os
import numpy as np
import pandas as pd
import seaborn as sns
from termcolor import cprint
import py3Dmol as p3d
#import cube_tools
from google.colab import output
output.enable_custom_widget_manager()
# This import is required to handle files
from google.colab import files
# This imports are required to use NGL viewer as well as the capabilities of pyCapsid to generate structures.
#import nglview as ngl
#from nglview.adaptor import FileStructure
import matplotlib
from matplotlib import pyplot as plt
from matplotlib.offsetbox import OffsetImage, AnnotationBbox
import ipywidgets as widgets
%matplotlib inline
import copy
from IPython.display import Markdown, display, clear_output

In [None]:
# import py3Dmol as p3d
print('Versão do py3DMol --> ', p3d.__version__)

In [None]:
# import nglview as ngl
#print('Versão do nglview --> ', ngl.__version__)

-----------

In [None]:
# Instalando RDKit
!pip install --upgrade rdkit

In [None]:
# Importando os módulos do RDKit
from rdkit import Chem
from rdkit.Chem.Draw import IPythonConsole
from rdkit.Chem import Draw, AllChem
from rdkit.Chem import rdDistGeom, rdCoordGen
from rdkit.Chem import rdMolAlign
IPythonConsole.ipython_useSVG=True  # <-- Colocar Falso se você quiser PNGs ao invés de SVGs
%config InlineBackend.figure_format = 'svg'
from rdkit import rdBase
print("Versão da RDKit:", rdBase.rdkitVersion)
print("Versão da RDKit base:", rdBase.boostVersion)

In [None]:
# Gerar estrutura de linhas a partir do código SMILES
mol = Chem.MolFromSmiles('c1ccccc1')
mol

#### **3.2.1 - O Código SMILES para Modelagem Molecular**

O **Simplified Molecular Input Line Entry System (SMILES)** é uma notação que permite representar estruturas químicas de forma textual, facilitando o armazenamento e a manipulação de informações moleculares em programas de computador. Desenvolvido por Arthur Weininger e David Weininger nos anos 1980, o SMILES usa caracteres simples para descrever átomos, ligações, e a estrutura geral de uma molécula.

##### Características Principais:

- **Átomos**: Representados por seus símbolos químicos (ex: C, N, O).
- **Ligações**: Ligações simples são implícitas, enquanto duplas (=), triplas (#), e aromáticas (:) são explicitamente indicadas.
- **Ramificações**: Indicadas por parênteses.
- **Ciclos**: Numerados após o átomo onde o ciclo começa e fecha.

##### Exemplo:

- **Etileno**: `C=C`
- **Benzeno**: `c1ccccc1`

O SMILES é amplamente utilizado em software de modelagem molecular e quimioinformática para tarefas como a busca de moléculas, a predição de propriedades químicas, e a visualização de estruturas. A notação SMILES pode ser convertida de volta para estruturas químicas completas por diversos programas de química computacional, tornando-se uma ferramenta versátil e poderosa na pesquisa química.

##### **Aplicações:**

- **Armazenamento de dados químicos**
- **Busca e recuperação de informações moleculares**
- **Modelagem e simulação de propriedades moleculares**

A simplicidade e eficiência do SMILES continuam a fazer dele um padrão amplamente adotado na química computacional, quimioinformática e na bioinformática.

##### **Materiais interessantes**

- <https://en.wikipedia.org/wiki/Simplified_molecular-input_line-entry_system>
- <https://www.cheminfo.org/Chemistry/Cheminformatics/FormatConverter/index.html>
- <https://pubchem.ncbi.nlm.nih.gov/>

In [None]:
# Adiconando hidrogênios a molécula mol
mol_H = Chem.AddHs(mol)
# Contando o número de átomos do objeto "mol_H"
print(f'O número de átomos da molécula de benzeno com os hidrogênios é {mol_H.GetNumAtoms()}')

#### **3.2.2 - Busca conformacional com a RDKit**

- <https://greglandrum.github.io/rdkit-blog/posts/2023-03-02-clustering-conformers.html>
- <https://github.com/RochaGerd/Chemistry_with_Python>

In [None]:
# Exemplo de uma molécula flexível: a molécula de omeprazole
# Sugestão: Ir no site do pubchem (https://pubchem.ncbi.nlm.nih.gov/)
#           e consultar o código smiles da molécula da sua preferência
smiles = 'CC1=CN=C(C(=C1OC)C)CS(=O)C2=NC3=C(N2)C=C(C=C3)OC'
mol = Chem.MolFromSmiles(smiles)
mol_copy = mol
mol_copy

In [None]:
# Adicionar hidrogênios explícitos à molécula
mol = Chem.AddHs(mol)

# Gerar conformações
num_confs = 10  # Número de conformações a serem geradas
confs = AllChem.EmbedMultipleConfs(mol, numConfs=num_confs)

# Otimizar conformações usando UFF (Universal Force Field)
for conf in confs:
    AllChem.UFFOptimizeMolecule(mol, confId=conf)

# Imprimir e salvar em arquivos as conformações geradas
for i, conf in enumerate(confs):
    filename = f"conformation_{i+1}.mol"  # Create unique filename for each .mol file
    Chem.MolToMolFile(mol, filename)  # Save molecule as .mol file
    print(f'Conformação {i+1}:')
    print(Chem.MolToMolBlock(mol, confId=conf))
    print('----------------------------')

In [None]:
confs

In [None]:
def generate_and_visualize_conformations(smiles, num_confs):
    # Gerar a molécula a partir do SMILES
    mol = Chem.MolFromSmiles(smiles)

    # Adicionar hidrogênios explícitos à molécula
    mol = Chem.AddHs(mol)

    # Gerar conformações
    confs = AllChem.EmbedMultipleConfs(mol, numConfs=num_confs)

    # Otimizar conformações usando UFF (Universal Force Field)
    for conf in confs:
        AllChem.UFFOptimizeMolecule(mol, confId=conf)
        #mol_without_H = Chem.RemoveHs(mol)

    # Alinhar todas as conformações ao primeiro conformero
    ref_conf = mol.GetConformer(confs[0])
    for conf in confs:
        if conf != confs[0]:
            rdMolAlign.AlignMol(mol, mol, prbCid=conf, refCid=confs[0])
            mol_without_H = Chem.RemoveHs(mol)

    # Gerar a visualização 3D
    # Visualizar as conformações usando py3Dmol
    viewer = p3d.view(width=800, height=600)
    for conf in confs:
        mol_block = Chem.MolToMolBlock(mol_without_H, confId=conf)
        viewer.addModel(mol_block, 'mol')  # Adicionar modelo ao visualizador
        viewer.setStyle({'stick': {}})  # Estilo de visualização

    viewer.zoomTo()  # Ajustar o zoom para visualizar todas as conformações
    return viewer

# Exemplo de uso
smiles = 'CC1=CN=C(C(=C1OC)C)CS(=O)C2=NC3=C(N2)C=C(C=C3)OC'  # Omeprazole
num = 25
viewer = generate_and_visualize_conformations(smiles,num)
viewer.show()

In [None]:
mol_copy

In [None]:
core = Chem.MolFromSmiles('C2=NC3=C(N2)C=C(C=C3)OC')
core

In [None]:
def generate_and_visualize_conformations_core(smiles, core_smiles, num_confs):
    # Gerar a molécula a partir do SMILES
    mol = Chem.MolFromSmiles(smiles)

    # Adicionar hidrogênios explícitos à molécula
    mol = Chem.AddHs(mol)

    # Gerar conformações
    confs = AllChem.EmbedMultipleConfs(mol, numConfs=num_confs)

    # Otimizar conformações usando UFF (Universal Force Field)
    for conf in confs:
        AllChem.UFFOptimizeMolecule(mol, confId=conf)

    # Gerar o "core" (subestrutura comum) a partir do SMILES
    core_mol = Chem.MolFromSmiles(core_smiles)

    # Alinhar todas as conformações ao "core"
    # Encontre o mapeamento de átomos entre o core e a molécula
    match = mol.GetSubstructMatch(core_mol)
    if not match:
        raise ValueError("O core não é uma subestrutura da molécula.")

    atom_map = [(i, i) for i in match]

    for conf in confs:
        if conf != confs[0]:
            rdMolAlign.AlignMol(mol, mol, prbCid=conf, refCid=confs[0], atomMap=atom_map)

    # Visualizar as conformações usando py3Dmol
    viewer = p3d.view(width=800, height=600)
    for conf in confs:
        mol_block = Chem.MolToMolBlock(mol, confId=conf)
        viewer.addModel(mol_block, 'mol')  # Adicionar modelo ao visualizador
        viewer.setStyle({'stick': {}})  # Estilo de visualização

    viewer.zoomTo()  # Ajustar o zoom para visualizar todas as conformações
    return viewer

# Exemplo de uso
smiles = 'CC1=CN=C(C(=C1OC)C)CS(=O)C2=NC3=C(N2)C=C(C=C3)OC'  # Omeprazole
core_smiles = 'C2=NC3=C(N2)C=C(C=C3)OC'  # Core da molécula
num = 25
viewer = generate_and_visualize_conformations_core(smiles, core_smiles, num)
viewer.show()

#### **3.2.3 - Cálculo de descritores moleculares usando a RDkit e a Mordred**

- Aprendendo Química com Python, Rodrigo Queiroz e Gerd Rocha, 2021, Amazon Book. <https://github.com/pythonchembook>

  - Link para compra: <https://www.amazon.com/Aprendendo-Qu%C3%ADmica-com-python-Portuguese/dp/B09LGSG6TY>

In [None]:
# Códigos SMILES de 30 solventes orgânicos
solventes = ['c1ccccc1', 'CO', 'CCO', 'Cc1ccccc1', 'Cc1ccc(C)cc1', 'Cc1cccc(C)c1', 'Cc1ccccc1C',
             'C1CCCCC1', 'CCCCCCCCO', 'CCCCC', 'CCCCCC', 'CCCCCCC', 'CC=O', 'CCOC(C)=O', 'CC(=O)C',
             'CC#N', 'O=C(O)C', 'O=CO', 'CC(C)O', 'CCCCO', 'C(Cl)(Cl)Cl', 'O=CN(C)C', 'CS(C)=O',
             'CCOCC', 'CCC(=O)C', 'C1=NC=CC=C1', 'C(Cl)(Cl)(Cl)Cl', 'C1CCCO1', 'CCN(CC)CC', 'CCOCCO']

In [None]:
# Converta de SMILES para objeto da RDKit
size_solv = len(solventes) # Tamanho da lista
solv_smi = size_solv*['']  # Gera uma lista vazia
for ms in range(size_solv):
    solv_smi[ms] = Chem.MolFromSmiles(solventes[ms])

In [None]:
!pip install mordred
!pip install pubchempy

In [None]:
import pubchempy
names_smi = size_solv*['']
for i in range(size_solv):
    smi = solventes[i]
    c = pubchempy.get_compounds(smi, namespace='smiles')
    match = c[0]
    names_smi[i] = match.iupac_name

In [None]:
print(names_smi)

In [None]:
# Visualize as estruturas e seus nomes IUPAC em uma grade
img = Draw.MolsToGridImage(solv_smi[:size_solv], molsPerRow=4, subImgSize=(200,200),legends=names_smi)
img

In [None]:
# Comandos para gerar arquivo SDF com moléculas em formato .mol
sdf_solv = Chem.SDWriter('sdf_solv.sdf')
for imol in range(size_solv):
    m = solv_smi[imol]
    m.SetProp("_Name",names_smi[imol])
    sdf_solv.write(m)
sdf_solv.close() # comando para fechar o arquivo.

In [None]:
# Crie um objeto para o cálculo de todos os descritores
from mordred import Calculator, descriptors
calc = Calculator(descriptors, ignore_3D=True)
len(calc.descriptors)

In [None]:
# Importar os módulos de cálculo de alguns descritores
from mordred import WienerIndex, ZagrebIndex, AcidBase, TopoPSA
from mordred import GravitationalIndex, HydrogenBond, McGowanVolume
from mordred import Polarizability, VdwVolumeABC, TopologicalIndex

# Criar os objetos para o cálculo dos descritores
descr_obj = [WienerIndex.WienerIndex(), ZagrebIndex.ZagrebIndex(version = 1),
             ZagrebIndex.ZagrebIndex(version = 2), AcidBase.AcidicGroupCount(),
             AcidBase.BasicGroupCount(), HydrogenBond.HBondAcceptor(), HydrogenBond.HBondDonor(),
             McGowanVolume.McGowanVolume(), Polarizability.APol(False),
             Polarizability.BPol(False), TopoPSA.TopoPSA(False), TopologicalIndex.Diameter(),
             TopologicalIndex.Radius(), TopologicalIndex.TopologicalShapeIndex(),
             TopologicalIndex.PetitjeanIndex(), VdwVolumeABC.VdwVolumeABC()]

descr_names = ['Wiener', 'Z1', 'Z2', 'AcidicGroupCount', 'BasicGroupCount','HBondAcceptor',
               'HBondDonor', 'McGowanVolume', 'Apol', 'Bpol', 'TopoPSA', 'Diameter', 'Radius',
               'TopologicalShapeIndex',  'PetitjeanIndex', 'VdwVolumeABC']

# Cálculo dos descritores e armazenar em um array da Numpy
desc = np.zeros((len(solventes), 16))
for i in range(len(solventes)):
    mol = Chem.MolFromSmiles(solventes[i])
    for j in range(16):
        descriptor = descr_obj[j]
        desc[i][j] = descriptor(mol)

# Criar um dataframe do Pandas contendo todos esses dados
import pandas as pd
df_data = pd.DataFrame(index=names_smi)

for i in range(16):
   df_data[descr_names[i]] = [x[i] for x in desc]

In [None]:
df_data

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Cálculo da matriz de correlação
corrMat = df_data.corr()

# Gráfico da matriz de correlação como heatmap
plt.figure(figsize=(20,15))
plt.xticks(rotation=90, fontsize=16)
plt.yticks(fontsize=16)
sns.heatmap(corrMat, annot=True, annot_kws={"size": 12}, cmap="RdBu_r", linecolor='gray',
            linewidths=0.35, vmin=-1, vmax=1, center=0)

# Salvar a figura como um arquivo PNG
plt.savefig('correlation_matrix_heatmap.png', dpi=300, bbox_inches='tight')

# Exibir a figura
plt.show()


In [None]:
del df_data['Z2']  # Apaga coluna do dataframe
del df_data['McGowanVolume']
del df_data['Apol']

In [None]:
# Análise de agrupamento nos dados do dataframe
import scipy.cluster.hierarchy as shc

plt.figure(figsize=(12, 12))
plt.title('Dendrograma para Descritores dos solventes orgânicos \n', fontsize = 22)
dend_solv = shc.dendrogram(shc.linkage(df_data, method='ward'),
                           labels=names_smi, orientation='right')
plt.xticks(rotation=90, fontsize = 14)
plt.yticks(fontsize = 14)
plt.tight_layout()

----------------------

#### **Montando drive permanente**

O ambiente criado pelo *Google Colab* só mantem os arquivos produzidos das simulações ou os que foram feitos *upload* enquanto você permanece logado (conectado) ou por pouquissimo tempo após você fechar a ferramenta. Ou seja, esse ambiente é temporário.

Mas, você pode montar um espaço de armazenamento externo ao *Colab* por meio do *Google Drive*.

No instante que você tentar montar seu drive externo ao *Colab*, o sistema de proteção da Google vai pedir autorização para acessar seus arquivos do *Google Drive*. Aí é só clicar na sua conta Google, pôr sua senha e permitir o acesso. A partir desse momento o seu *Google Drive* estará montado como um drive externo ao *Colab*.

Os próximos passos vão mostrar como fazer isso.

In [None]:
'''
from google.colab import drive
drive.mount('/mntDrive')
'''

In [None]:
# Uma dica é criar uma pasta no seu Google Drive, onde você possa direcionar seus arquivos.
# Use nomes sugestivos para isso. Por exemplo: Work_Colab.

In [None]:
# !ls /mntDrive/MyDrive/Work_Colab/

Você tamabém pode montar o drive clicando no quarto ícone de cima para baixo no menu lateral e depois clicando no terceiro ícone da esquerda pra direita. Mais uma vez o Google vai perguntar por uma autorização para acessar seus arquivos do *Google Drive*. Em geral o *Colab* monta seu drive em "/content" quando é feito dessa forma.

In [None]:
'''
from google.colab import drive
drive.mount('/content/gdrive')
'''

---------------------

#### **Instalando e usando pacotes de modelagem molecular**

A partir desse ponto vamos instalar e usar vários pacotes de modelagem e simulação molecular como uma espécie de preparativo para pesquisadores da área.

As instalações serão feitas tanto a partir das distribuições como bibliotecas quanto através do *download* do código e sua compilação.

Não vamos explorar muito os recursos de cada programa. A sugestão é gerar um novo *notebook* para cada ferramenta.

A lista dos softwares que vamos cobrir é:

* AMBERTools
* PySCF
* Psi4
* MOPAC 2016 e ASE
* xTB

--------------------
### **3.3 - Dinâmica molecular**

A Dinâmica Molecular (MD) é uma técnica computacional de amostragem do espaço de fases utilizada para estudar o comportamento de sistemas moleculares ao longo do tempo. Por meio da resolução das equações de movimento de Newton, a MD permite simular a evolução temporal de um conjunto de átomos ou moléculas, fornecendo informações detalhadas sobre a estrutura, dinâmica e propriedades termodinâmicas do sistema.

#### **Fundamentos Teóricos**

#### **Equações de Movimento de Newton**

A base da dinâmica molecular é a resolução das equações de movimento de Newton para um conjunto de partículas. Para um sistema de $N$ átomos, as equações são:

$$
m_i \frac{d^2 \mathbf{r}_i}{dt^2} = \mathbf{F}_i
$$

onde $m_i$ é a massa do átomo $i$, $\mathbf{r}_i$ é a posição do átomo $i$ e $\mathbf{F}_i$ é a força atuando sobre o átomo $i$, que pode ser obtida a partir do gradiente da energia potencial $U(\mathbf{r}_1, \mathbf{r}_2, \ldots, \mathbf{r}_N)$:

$$
\mathbf{F}_i = - \nabla_i U
$$


Percebam que a energia potencial ($U$) usada para calcular a força pode ser calculada a partir de métodos clássicos (campo de força), a partir de métodos quânticos ou ainda a partir de métodos híbridos (QM/MM).

#### **Integração Numérica**

As equações de movimento são resolvidas numericamente utilizando métodos de integração, como o algoritmo de Verlet ou o algoritmo de Velocity Verlet. O algoritmo de Verlet, por exemplo, atualiza as posições e velocidades dos átomos a cada passo de tempo $\Delta t$:

$$
\mathbf{r}(t + \Delta t) = 2\mathbf{r}(t) - \mathbf{r}(t - \Delta t) + \frac{\mathbf{F}(t)}{m} \Delta t^2
$$

O algoritmo de Velocity Verlet também considera as velocidades:

$$
\mathbf{r}(t + \Delta t) = \mathbf{r}(t) + \mathbf{v}(t) \Delta t + \frac{\mathbf{F}(t)}{2m} \Delta t^2
$$

$$
\mathbf{v}(t + \Delta t) = \mathbf{v}(t) + \frac{\mathbf{F}(t) + \mathbf{F}(t + \Delta t)}{2m} \Delta t
$$

#### **Energia e Conservação**

Durante uma simulação de dinâmica molecular, a energia total do sistema deve ser conservada. A energia total é a soma da energia cinética ($E_k$) e da energia potencial ($U$):

$$
E_{total} = E_k + U
$$

onde a energia cinética é dada por:

$$
E_k = \sum_{i=1}^N \frac{1}{2} m_i \mathbf{v}_i^2
$$

#### **Softwares de dinâmica molecular em Python**

Para realizar simulações de dinâmica molecular em Python, podemos utilizar bibliotecas como ASE (Atomic Simulation Environment), AMBER, Gromacs, OpenMM ou LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator).

---------------


#### **3.3.1 - AMBERTools**

AmberTools é uma coleção de programas que acompanham a suite de programas Amber, amplamente utilizada na simulação de sistemas biológicos. Desenvolvida inicialmente nos anos 70, Amber (*Assisted Model Building with Energy Refinement*) evoluiu significativamente, tornando-se uma ferramenta essencial na modelagem molecular e na química computacional. AmberTools oferece uma série de utilitários para preparar, simular e analisar sistemas moleculares, sendo especialmente útil no estudo de proteínas, ácidos nucleicos, e outras biomoléculas.

O AmberTools é gratuito e *open-source*, enquanto Amber, que contém a maior parte dos códigos de dinâmica molecular (MD), é um software comercial. As ferramentas do AmberTools permitem a criação de arquivos de entrada para a dinâmica molecular, análise de trajetórias e cálculos de mecânica quântica, entre outros.

Link:

* <https://ambermd.org/>
* <https://github.com/Amber-MD>
*<https://ambermd.org/tutorials/>

In [None]:
#@title **Instalando dependências para softwares de dinâmica molecular**
#@markdown It will take a few minutes, please, drink a coffee and wait. ;-)
# install dependencies
import subprocess
import sys
subprocess.run("rm -rf /usr/local/conda-meta/pinned", shell=True)
subprocess.run("mamba install -c conda-forge ambertools -y", shell=True)
import pytraj as pt
subprocess.run("pip install git+https://github.com/pablo-arantes/biopandas", shell=True)
subprocess.run("mamba install openmm=7.7.0", shell=True)
subprocess.run("pip install --upgrade MDAnalysis==2.4.2", shell=True)
!conda install openbabel -c conda-forge

#load dependencies
import sys
from biopandas.pdb import PandasPdb
import openmm as mm
from openmm import *
from openmm.app import *
from openmm.unit import *
import os
import urllib.request
import numpy as np
import MDAnalysis as mda
import pytraj as pt
import platform
import scipy.cluster.hierarchy
from scipy.spatial.distance import squareform
import scipy.stats as stats
from statistics import mean, stdev
from pytraj import matrix
from IPython.display import set_matplotlib_formats

In [None]:
# import pytraj as pt
print('Versão da PyTraj --> ', pt.__version__)

In [None]:
# Instalando o AMBERTools

#!conda install -c conda-forge ambertools

In [None]:
# Verificando se foi instalado corretamente
!which tleap

--------
##### **Montando o sistema inicial**

In [None]:
%%file leap.inp
source leaprc.protein.ff14SB
seq = sequence {NALA ALA ALA ALA ALA CALA}
set default PBradii mbondi3
saveamberparm seq peptide.top peptide_ini.crd
savepdb seq peptide_ini.pdb
quit

In [None]:
# Para executar um comando no Linux
!tleap -f leap.inp > leap.log

In [None]:
%%file min_implicit.inp
Minimizacao da energia
&cntrl
imin=1, maxcyc=5000, ncyc=1000,
cut=999., igb=8, ntb=0, ntpr=100
&end

In [None]:
def show_prot(filename):
  p = p3d.view(width=400, height=300)
  p.addModel(open(filename, 'r').read(),'pdb')
  p.setStyle({'cartoon':{'color':'spectrum'},'stick':{'radius':0.15}})
  #p.setStyle({'cartoon': {'color':'spectrum'}})
  p.center()
  p.zoomTo()
  return p

In [None]:
show_prot('peptide_ini.pdb')

In [None]:
!sander -O -i min_implicit.inp -p peptide.top -c peptide_ini.crd -r min_implicit.rst7

In [None]:
# Carrega a estrutura otimizada com a PyTraj
ref_implicit_min = pt.load('min_implicit.rst7', top='peptide.top')
ref_implicit_min.save('peptide_min.pdb')
show_prot('peptide_min.pdb')

##### **Rodando a simulação de dinâmica molecular**

In [None]:
# Monta input para dinâmica molecular NVT
# OBS: Não usar comentários na caixa que escreve o arquivo "md_implicit.in"

In [None]:
%%file md_implicit.inp
MD NVT, 500 ps
&cntrl
    imin = 0, nstlim = 250000, dt = 0.002, ntf = 2, nscm = 1000,
    ntx = 1, irest = 0, ig = -1, ntc = 2, temp0 = 300.0, gamma_ln = 1.0,
    ntt=3, tempi = 300.0, ntwr = 500, ntpr = 500, ntb = 0, ntwx = 500,
    ntwe = 0, cut = 999.0, igb = 8, ioutfm = 1,
&end

In [None]:
# Para executar a dinâmica moleculare NVT para o peptídeo (ALA)6
!nohup sander -O -i md_implicit.inp -o md_implicit.out -p peptide.top -c min_implicit.rst7 -r md_implicit.rst -x md_implicit.nc &

In [None]:
# Observar a execução da dinâmica molecular
!tail -n 20 md_implicit.out

In [None]:
# Carregar a trajetória no objeto "traj_implicit"
traj_implicit = pt.load('md_implicit.nc', top='peptide.top')
traj_implicit

In [None]:
# Carrega a última estrutura depois da dinâmica com a PyTraj
last_frame = pt.load('md_implicit.rst', top='peptide.top')
last_frame.save('peptide_last_frame.pdb')

show_prot('peptide_last_frame.pdb')

---------------
### **3.3 - Métodos *ab initio* e DFT**

#### **Método Ab Initio de Química Quântica**

Os métodos *ab initio* de química quântica são um conjunto de métodos que permite calcular as propriedades eletrônicas e estruturais de moléculas a partir dos primeiros princípios, ou seja, baseados diretamente nas leis fundamentais da mecânica quântica, sem o uso de parâmetros empíricos. Esses métodos fornecem uma descrição detalhada e exata dos sistemas moleculares, embora sejam computacionalmente intensivos.

#### **Uso dos Métodos *ab Initio***

Os métodos *ab initio* são amplamente aplicados em diversas áreas da química e da ciência dos materiais, incluindo:

- **Predição de Estruturas Moleculares**: Determinam geometrias moleculares com alta exatidão.
- **Cálculo de Energias de Reação**: Estimam barreiras de reação e energias de dissociação.
- **Espectroscopia**: Simulam espectros IR, Raman, UV-Vis e NMR.
- **Propriedades Moleculares**: Predizem momentos dipolares, polarizabilidades e outras propriedades físicas e químicas.

#### **Fundamentos Teóricos**

Os métodos *ab initio* tentam resolver o mais próximo a equação de Schrödinger para sistemas moleculares. A equação de Schrödinger não-relativística independente do tempo para um sistema de \( N \) elétrons e \( M \) núcleos é:

$\hat{H} \Psi = E \Psi$

onde $( \hat{H})$ é o Hamiltoniano do sistema, $( \Psi )$ é a função de onda total e $( E )$ é a energia total do sistema.

#### **Hamiltoniano Molecular**

O Hamiltoniano molecular inclui termos de energia cinética e potencial para elétrons e núcleos:

$
\hat{H} = -\sum_{i=1}^{N} \frac{\hbar^2}{2m_e} \nabla_i^2 - \sum_{I=1}^{M} \frac{\hbar^2}{2M_I} \nabla_I^2 - \sum_{i=1}^{N} \sum_{I=1}^{M} \frac{Z_I e^2}{4 \pi \epsilon_0 r_{iI}} + \sum_{i<j} \frac{e^2}{4 \pi \epsilon_0 r_{ij}} + \sum_{I<J} \frac{Z_I Z_J e^2}{4 \pi \epsilon_0 R_{IJ}}
$

Aqui, $( \nabla_i^2 $) e $( \nabla_I^2 )$ são os operadores laplacianos para elétrons e núcleos, $( m_e )$ e $( M_I )$ são as massas de elétrons e núcleos, $( Z_I )$ são os números atômicos dos núcleos, e $( r_{ij} )$ e $( R_{IJ} )$ são as distâncias entre partículas.

#### **Aproximação de Born-Oppenheimer**

A grande parte dos cálculos de química computacional só é possível devido a a aproximação de Born-Oppenheimer. Nessa aproximação, a função de onda molecular é escrita como uma função de onda descorrelacionada elétron-núcleo. Possui dependência paramétrica da função de onda eletrônica com as coordenadas nucleares.

$
\Psi(\mathbf{r}, \mathbf{R}) = \psi(\mathbf{r}; \mathbf{R}) \chi(\mathbf{R})
$

onde $ \mathbf{r} $ e $ \mathbf{R} $ são coordenadas eletrônicas e nucleares, respectivamente. A função de onda eletrônica $ \psi(\mathbf{r}; \mathbf{R}) $ é resolvida para uma configuração fixa de núcleos.

#### **Método Hartree-Fock**

O método Hartree-Fock (HF) é o ponto de partida para muitos métodos *ab initio*. No método HF, a função de onda do sistema é aproximada por um produto antissimetrizado de orbitais moleculares (determinante de Slater), que considera o princípio de exclusão de Pauli para elétrons:

$
\Psi_{HF} = \frac{1}{\sqrt{N!}} \det|\psi_i(\mathbf{r}_j)|
$

A equação de Hartree-Fock é resolvida iterativamente:

$
\hat{F} \psi_i = \epsilon_i \psi_i
$

onde $\hat{F}$ é o operador de Fock e $\epsilon_i$ são as energias dos orbitais moleculares. O operador de Fock é dado por:

$
\hat{F} = \hat{h} + \sum_{j} (\hat{J}_j - \hat{K}_j)
$

onde $\hat{h}$ é o Hamiltoniano de um elétron, $\hat{J}_j$ é o operador de Coulomb, e $\hat{K}_j$ é o operador de troca.

#### **Correções Pós-Hartree-Fock**

Para melhorar a exatidão além do método Hartree-Fock, são utilizados métodos pós-Hartree-Fock ou métodos correlacionados:

- **Método de Perturbação Møller-Plesset (MP2, MP3, etc.)**: Trata a correlação eletrônica como uma correção de perturbação à solução Hartree-Fock.
- **Método Coupled Cluster (CC)**: Inclui efeitos de correlação eletrônica de forma sistemática através de operadores de excitação.
- **Método Interação de configurações (CI)**: Inclui efeitos de correlação eletrônica montando uma função de onda mais flexível que considera mais de uma configuração eletrônica na composição da função de onda do estado eletrônicos. Essas consfigurações eletrônicas são geradas a partir de excitações de um ou mais elétrons a partir do estado de referência, que em geral é o estado de Hartree-Fock.


### Bibliografia Relevante

1. **"Molecular Electronic-Structure Theory"** - T. Helgaker, P. Jørgensen, J. Olsen. Este livro fornece uma abordagem abrangente para a teoria da estrutura eletrônica molecular, cobrindo métodos de Hartree-Fock, DFT e pós-Hartree-Fock.
2. **"Modern Quantum Chemistry: Introduction to Advanced Electronic Structure Theory"** - A. Szabo, N. S. Ostlund. Uma introdução detalhada aos métodos ab initio e à teoria da estrutura eletrônica.
3. **"Quantum Chemistry"** - I. N. Levine. Um clássico que abrange os fundamentos da química quântica, incluindo métodos ab initio e de aproximação.

### Recursos Adicionais

Para mais detalhes e aplicações práticas, considere explorar os seguintes recursos online:

- [Psi4: An Open-Source Quantum Chemistry Software Package](http://www.psicode.org/)
- [Gaussian: Computational Chemistry Software](https://gaussian.com/)
- [PySCF: Python Library for Quantum Chemistry](https://sunqm.github.io/pyscf/)


-----------------
#### **Algoritmo SCF (*Self-Consistent Field*)**

O algoritmo *Self-Consistent Field* (SCF) é fundamental na química quântica computacional, especialmente no método Hartree-Fock (HF) e na Teoria do Funcional da Densidade (DFT). O SCF é um procedimento iterativo usado para resolver as equações de Hartree-Fock, aproximando a função de onda de um sistema molecular e minimizando a energia total do sistema até a convergência, considerando a geometria fixa.

#### **Iterações SCF**

O procedimento SCF envolve os seguintes passos iterativos:

1. **Inicialização**: Estimar um conjunto inicial de orbitais moleculares $\{\psi_i\}$.
2. **Construção do Operador de Fock**: Calcular o operador de Fock $\hat{F}$ com base nos orbitais moleculares atuais.
3. **Resolução da Equação de Hartree-Fock**: Resolver $\hat{F} \psi_i = \epsilon_i \psi_i$ para obter novos orbitais moleculares $\{\psi_i\}$.
4. **Convergência**: Comparar os novos orbitais com os antigos. Se a diferença for menor que um limiar predefinido, o processo é convergido; caso contrário, repetir os passos 2-4.

### **Bibliografia Relevante**

1. **"Molecular Electronic-Structure Theory"** - T. Helgaker, P. Jørgensen, J. Olsen. Aborda de forma abrangente a teoria da estrutura eletrônica molecular, incluindo o método Hartree-Fock.
2. **"Modern Quantum Chemistry: Introduction to Advanced Electronic Structure Theory"** - A. Szabo, N. S. Ostlund. Introdução detalhada aos métodos Hartree-Fock e pós-Hartree-Fock.
3. **"Quantum Chemistry"** - I. N. Levine. Um clássico que cobre os fundamentos da química quântica, incluindo o algoritmo SCF.


--------------
#### **Teoria do Funcional da Densidade (DFT)**

A Teoria do Funcional da Densidade (DFT) é uma das abordagens mais importantes e amplamente utilizadas na química computacional e na física do estado sólido para estudar as propriedades eletrônicas dos sistemas moleculares e materiais. A DFT permite calcular a estrutura eletrônica de sistemas com muitos elétrons com boa exatidão e custo computacional relativamente baixo. Ela se baseia na ideia de que as propriedades fundamentais de um sistema quântico podem ser descritas pela densidade eletrônica, ao invés de pela função de onda completa, simplificando consideravelmente o problema de muitos corpos.

#### **História e Desenvolvimento**

A DFT teve suas raízes estabelecidas nos trabalhos de Thomas e Fermi na década de 1920, que propuseram que a energia de um sistema de elétrons poderia ser expressa como um funcional da densidade eletrônica. No entanto, foi somente com os trabalhos fundamentais de Hohenberg e Kohn (1964), e Kohn e Sham (1965), que a teoria foi formalizada e ganhou a forma robusta que conhecemos hoje. Os teoremas de Hohenberg-Kohn estabeleceram que a densidade eletrônica no estado fundamental determina unicamente todas as propriedades do sistema e que existe um funcional universal da densidade que descreve a energia total do sistema.

#### **Princípios Fundamentais**

#### **Teoremas de Hohenberg-Kohn**

1. **Primeiro Teorema**: A densidade eletrônica $\rho(\mathbf{r})$ no estado fundamental determina unicamente o potencial externo $v_{\text{ext}}(\mathbf{r})$ e, consequentemente, as propriedades eletrônicas do sistema. Em outras palavras, a energia total do sistema no estado fundamental é um funcional da densidade eletrônica $\rho(\mathbf{r})$.
   
2. **Segundo Teorema**: Existe um funcional universal da densidade eletrônica, $F[\rho(\mathbf{r})]$, que é independente do potencial externo e que, quando minimizado com respeito à densidade eletrônica correta, dá a energia do estado fundamental do sistema.

#### **Equações de Kohn-Sham**

Para tornar a DFT praticável, Kohn e Sham introduziram um conjunto de equações auxiliares para um sistema fictício de elétrons não interagentes que reproduz a densidade do sistema real. As equações de Kohn-Sham são escritas como:

$
\left( -\frac{1}{2} \nabla^2 + v_{\text{eff}}(\mathbf{r}) \right) \phi_i(\mathbf{r}) = \epsilon_i \phi_i(\mathbf{r})
$

onde $v_{\text{eff}}(\mathbf{r})$ é o potencial efetivo que inclui o potencial externo, o potencial de Hartree e o potencial de troca-correlação:

$
v_{\text{eff}}(\mathbf{r}) = v_{\text{ext}}(\mathbf{r}) + v_{\text{H}}(\mathbf{r}) + v_{\text{xc}}(\mathbf{r})
$

O potencial de Hartree, $v_{\text{H}}(\mathbf{r})$, representa a interação eletrostática entre os elétrons e é dado por:

$
v_{\text{H}}(\mathbf{r}) = \int \frac{\rho(\mathbf{r'})}{|\mathbf{r} - \mathbf{r'}|} d\mathbf{r'}
$

O potencial de troca-correlação, $v_{\text{xc}}(\mathbf{r})$, é o componente que incorpora todos os efeitos quânticos de troca e correlação entre os elétrons e é definido como a variação funcional da energia de troca-correlação $E_{\text{xc}}[\rho]$ com respeito à densidade:

$
v_{\text{xc}}(\mathbf{r}) = \frac{\delta E_{\text{xc}}[\rho]}{\delta \rho(\mathbf{r})}
$

#### **Funcionais de Troca-Correlação**

Um dos maiores desafios na aplicação da DFT é a escolha do funcional de troca-correlação adequado. Existem diferentes níveis de complexidade e precisão para esses funcionais, incluindo:

- **Funcionais de Densidade Local (LDA)**: Consideram a densidade eletrônica local e assumem que o sistema é homogêneo. Exemplos incluem os funcionais de troca de Slater e o funcional de correlação de Perdew-Zunger.
  
- **Funcionais de Gradiente Generalizado (GGA)**: Incorporam o gradiente da densidade eletrônica para capturar variações na densidade. Exemplos incluem os funcionais de Perdew-Burke-Ernzerhof (PBE) e Becke-88 (B88).

- **Funcionais Meta-GGA**: Além do gradiente da densidade, utilizam a derivada segunda da densidade ou o laplaciano da densidade. Um exemplo é o funcional de Tao-Perdew-Staroverov-Scuseria (TPSS).

- **Funcionais Híbridos**: Combinam uma fração da energia de troca exata de Hartree-Fock com funcionais GGA ou meta-GGA. Um exemplo amplamente utilizado é o B3LYP.

#### **Aplicações da DFT**

A DFT é amplamente utilizada em diversos campos da ciência e engenharia, incluindo:

- **Química Computacional**: Para calcular energias de ligação, geometria molecular, estados de transição, e espectros de RMN e UV-Vis.
- **Física do Estado Sólido**: Para estudar propriedades eletrônicas e estruturais de sólidos, incluindo bandas de energia e estados de superfície.
- **Ciência dos Materiais**: Para investigar propriedades de materiais novos, incluindo catalisadores, semicondutores e materiais nanoestruturados.
- **Biofísica e Bioquímica**: Para modelar interações moleculares em sistemas biológicos complexos, incluindo proteínas e ácidos nucleicos.

#### **Bibliografia**

Para um estudo aprofundado da DFT, os seguintes livros e artigos são altamente recomendados:

1. **Livros**:
   - Kohn, W. and Sham, L. J. "Self-consistent equations including exchange and correlation effects." *Physical Review*, 140(4A), A1133, (1965).
   - Parr, R. G., and Yang, W. "Density-Functional Theory of Atoms and Molecules." *Oxford University Press*, (1989).
   - Koch, W., and Holthausen, M. C. "A Chemist's Guide to Density Functional Theory." *Wiley-VCH*, (2001).

2. **Artigos**:
   - Hohenberg, P., and Kohn, W. "Inhomogeneous Electron Gas." *Physical Review*, 136(3B), B864, (1964).
   - Becke, A. D. "Density-functional exchange-energy approximation with correct asymptotic behavior." *Physical Review A*, 38(6), 3098, (1988).
   - Perdew, J. P., Burke, K., and Ernzerhof, M. "Generalized Gradient Approximation Made Simple." *Physical Review Letters*, 77(18), 3865, (1996).


--------------
#### **3.3.1 - PySCF**

Essa biblioteca realiza cálculos de química quântica em moléculas. É um código aberto e de fácil utilização.  

- <https://pyscf.org/>

Nós iremos executar alguns exemplos de tutoriais do PySCF que estão disponíveis na internet.

**Links interessantes**
- <http://www.cheminfo.org/Chemistry/Cheminformatics/FormatConverter/index.html>


**Fonte de Consulta**
- <https://github.com/vinayak2019/python_quantum_chemistry_introductory>
- <https://github.com/pyscf/pyscf/tree/master/examples>


In [None]:
# Instalando o PySCF

!pip install pyscf

Vamos gerar um input para um sistema molecular bem simples. Para isso use a ferramenta openbabel online para criar a estrutura da molécula do etileno. Vamos usar para isso mais uma biblioteca, a *openbabel*.

In [None]:
!which obabel

In [None]:
!obabel -:'CC' -Oetano.sdf --gen3D

In [None]:
v = p3d.view()
v.addModel(open('etano.sdf').read())
v.setStyle({'stick':{'colorscheme':'greenCarbon'}})
v.zoomTo()

In [None]:
!obabel etano.sdf -O etano.xyz
!cat < etano.xyz

----------
##### **Propriedades eletrônicas com a PySCF**

In [None]:
# Importar os módulos do PySCF importantes para os primeiros cálculos.

from pyscf import gto, scf

In [None]:
# Ler a geometria xyz

mol = gto.M(atom="etano.xyz")
mol

In [None]:
# definir a função de base
mol.basis = "6-31G"

# definir o método de cálculo
mf = mol.KS()
mf.xc = 'b3lyp'

In [None]:
# Rodar o cálculo e obter a energia eletrônica (em a.u.)
e_1SCF = mf.kernel()
print()
print("A energia 1SCF da molécula é igual a:", e_1SCF, "em a.u.")

In [None]:
# total number of electrons
n = mol.tot_electrons()
n

In [None]:
# display all orbitals
mf.mo_energy

In [None]:
# HOMO is n/2 orbital. But python index starts from 0
homo = mf.mo_energy[int(n/2) - 1]
homo

In [None]:
# Considerar o efeito do solvente

mol = gto.M(atom="etano.xyz")

# set basis set
mol.basis = "6-31G"

# set the functional
mf = mol.KS()
mf.xc = 'b3lyp'

# set solvent
mf = mf.DDCOSMO()
mf.with_solvent.eps = 35.688  # Acetonitrile

# run single point energy
mf = mf.run()

#get total energy
neutral_energy_solvent = mf.e_tot

------------
##### **Automatizando cálculo de propriedades eletrônicas com a PySCF**

In [None]:
%%file molecs.csv
SMILES
C
CC
CCC
O
N

In [None]:
# Se colunas estão separadas por espaços ou tabulações , use :
data = pd.read_csv('molecs.csv',header=0)      # colunas separadas por ','
data

In [None]:
import pandas as pd
from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem.rdmolfiles import MolToXYZFile
from pyscf import gto, scf

def gerar_xyz(smiles, indice):
    """Gerar arquivo XYZ a partir de um SMILES, adicionando hidrogênios e otimizando a molécula"""
    mol = Chem.MolFromSmiles(smiles)
    mol = Chem.AddHs(mol)
    AllChem.EmbedMolecule(mol)
    AllChem.MMFFOptimizeMolecule(mol)
    nome_arquivo_xyz = f'mol_{indice}.xyz'
    MolToXYZFile(mol, nome_arquivo_xyz)
    return nome_arquivo_xyz

def calcular_props(nome_arquivo_xyz):
    """Calcular a energia single point de uma molécula a partir de
    um arquivo XYZ usando PySCF"""
    mol = gto.M(atom=nome_arquivo_xyz, basis='sto-3g')
    n = mol.tot_electrons()
    mf = scf.RHF(mol)
    energia = mf.kernel()
    homo = mf.mo_energy[int(n/2) - 1]
    lumo = mf.mo_energy[int(n/2)]
    return energia,homo,lumo

def calcular_props_solv(nome_arquivo_xyz):
    """Calcular a energia single point de uma molécula com solvente
    a partir de um arquivo XYZ usando PySCF"""
    mol = gto.M(atom=nome_arquivo_xyz, basis='sto-3g')
    n = mol.tot_electrons()
    mf = scf.RHF(mol)
    mf = mf.DDCOSMO()
    mf.with_solvent.eps = 35.688  # Acetonitrile
    mf = mf.run()
    energia_solv = mf.e_tot
    homo_solv = mf.mo_energy[int(n/2) - 1]
    lumo_solv = mf.mo_energy[int(n/2)]
    # total number of electrons
    return energia_solv, homo_solv,lumo_solv

In [None]:
energias = []
energias_solv = []
homo = []
lumo = []
homo_solv = []
lumo_solv = []

for i in range(len(data)):
    smiles = data.iat[i,0]
    nome_arquivo_xyz = gerar_xyz(smiles, i)
    ener,h,l = calcular_props(nome_arquivo_xyz)
    energias.append(ener)
    homo.append(h)
    lumo.append(l)
    ener_solv,hs,ls = calcular_props_solv(nome_arquivo_xyz)
    energias_solv.append(ener_solv)
    homo_solv.append(hs)
    lumo_solv.append(ls)

data['energia (a.u.)'] = energias
data['energia_solv (a.u.)'] = energias_solv
data['homo (a.u.)'] = homo
data['lumo (a.u.)'] = lumo
data['homo_solv(a.u.)'] = homo_solv
data['lumo_solv(a.u.)'] = lumo_solv


In [None]:
data

----------

##### **Otimização de geometria com a PySCF**

In [None]:
# Para otimizar a geometria com o PySCF é necessário instalar a biblioteca Geometric
!pip install geometric

In [None]:
from pyscf.geomopt.geometric_solver import optimize

# create the pyscf molecule
mol = gto.M(atom="etano.xyz")

# set basis set
mol.basis = "6-31G"

# set the functional
mf = mol.KS()
mf.xc = 'b3lyp'

# run optimatization calculations
mol_eq = optimize(mf)

In [None]:
# save the optimized geometry for visualization
mol_eq.tofile("opt_etano.xyz")

In [None]:
# Executar opcionalmente
conv_params = {
    'convergence_energy': 1e-1,  # Eh
    'convergence_grms': 3e-1,    # Eh/Bohr
    'convergence_gmax': 4.5e-1,  # Eh/Bohr
    'convergence_drms': 1.2e-1,  # Angstrom
    'convergence_dmax': 1.8e-1,  # Angstrom
}

mol_eq = optimize(mf, **conv_params)

-------------
##### **Cálculo de frequências vibracionais e termoquímica**

In [None]:
# create a molecule object
mol = gto.M(atom="opt_etano.xyz")

# set basis set
mol.basis = "6-31G"

# set the functional
mf = mol.KS()
mf.xc = 'b3lyp'

# run frequency calculation
mf.run()
hessian = mf.Hessian().kernel()

In [None]:
from pyscf.hessian import thermo

# getting the frequncy data from the calculation
freq_info = thermo.harmonic_analysis(mf.mol, hessian)
freq_info["freq_wavenumber"]

In [None]:
# https://mattermodeling.stackexchange.com/questions/10393/how-may-i-calculate-free-energy-using-pyscf
# https://github.com/pyscf/pyscf/blob/master/examples/hessian/10-thermochemistry.py
#!/usr/bin/env python
#
# Author: Qiming Sun <osirpt.sun@gmail.com>
#

'''
Thermochemistry analysis based on nuclear Hessian.
'''

from pyscf import gto
from pyscf.hessian import thermo

# First compute nuclear Hessian.
mol = gto.M(
    atom = '''O    0.   0.       0
              H    0.   -0.757   0.587
              H    0.    0.757   0.587''',
    basis = '631g')

mf = mol.RHF().run()
hessian = mf.Hessian().kernel()

# Frequency analysis
freq_info = thermo.harmonic_analysis(mf.mol, hessian)
# Thermochemistry analysis at 298.15 K and 1 atmospheric pressure
thermo_info = thermo.thermo(mf, freq_info['freq_au'], 298.15, 101325)

print('Rotation constant')
print(thermo_info['rot_const'])

print('Zero-point energy')
print(thermo_info['ZPE'   ])

print('Internal energy at 0 K')
print(thermo_info['E_0K'  ])

print('Internal energy at 298.15 K')
print(thermo_info['E_tot' ])

print('Enthalpy energy at 298.15 K')
print(thermo_info['H_tot' ])

print('Gibbs free energy at 298.15 K')
print(thermo_info['G_tot' ])

print('Heat capacity at 298.15 K')
print(thermo_info['Cv_tot'])

------
##### ***Scan* com o PySCF**

In [None]:
# https://github.com/pyscf/pyscf/tree/master/examples/scf
import numpy
import matplotlib.pyplot as plt
from pyscf import scf
from pyscf import gto

ehf = []
dm = None
distances = numpy.arange(0.4, 2.5, 0.1)

for b in distances:
    mol = gto.M(atom=[["H", 0., 0., 0.],
                      ["H", 0., 0., b]], basis='ccpvdz', verbose=0)
    mf = scf.RHF(mol)
    ehf.append(mf.kernel(dm))
    dm = mf.make_rdm1()

print('R     E(HF)')
for i, b in enumerate(distances):
    print('%.2f  %.8f' % (b, ehf[i]))

# Plotting the graph
plt.figure(figsize=(8, 6))
plt.plot(distances, ehf, marker='o', linestyle='-', color='b')
plt.xlabel('Distance (Å)')
plt.ylabel('Energy (Hartree)')
plt.title('Variation of Energy vs Interatomic Distance for H2')
plt.grid(True)
plt.show()

------------
#####**Estrutura eletrônica com o PySCF**

In [None]:
# Executar opcionalmente
import sys
from pyscf import gto, scf
from pyscf import lo
from pyscf.tools import molden

'''
Write orbitals in molden format
'''

mol = gto.M(
    atom = '''
  C  3.2883    3.3891    0.2345
  C  1.9047    3.5333    0.2237
  C  3.8560    2.1213    0.1612
  C  1.0888    2.4099    0.1396
  C  3.0401    0.9977    0.0771
  C  1.6565    1.1421    0.0663
  H  3.9303    4.2734    0.3007
  H  1.4582    4.5312    0.2815
  H  4.9448    2.0077    0.1699
  H  0.0000    2.5234    0.1311
  H  3.4870    0.0000    0.0197
  H  1.0145    0.2578    0.0000
           ''',
    basis = 'cc-pvdz',
    symmetry = 1)

mf = scf.RHF(mol)
mf.kernel()

#
# First method is to explicit call the functions provided by molden.py
#
with open('C6H6mo.molden', 'w') as f1:
    molden.header(mol, f1)
    molden.orbital_coeff(mol, f1, mf.mo_coeff, ene=mf.mo_energy, occ=mf.mo_occ)

#
# Second method is to simply call from_mo function to write the orbitals
#
c_loc_orth = lo.orth.orth_ao(mol)
molden.from_mo(mol, 'C6H6loc.molden', c_loc_orth)


#
# Molden format does not support high angular momentum basis.  To handle the
# orbitals which have l>=5 functions, a hacky way is to call molden.remove_high_l
# function.  However, the resultant orbitals may not be orthnormal.
#
mol = gto.M(
    atom = 'He 0 0 0',
    basis = {'He': gto.expand_etbs(((0, 3, 1., 2.), (5, 2, 1., 2.)))})
mf = scf.RHF(mol).run()
try:
    molden.from_mo(mol, 'He_without_h.molden', mf.mo_coeff)
except RuntimeError:
    print('    Found l=5 in basis.')
    molden.from_mo(mol, 'He_without_h.molden', mf.mo_coeff, ignore_h=True)

In [None]:
# Executar opcionalmente
'''
Write orbitals, electron density, molecular electrostatic potential in
Gaussian cube file format.
'''

from pyscf import gto, scf
from pyscf.tools import cubegen

mol = gto.M(atom='''
            O 0.0000000, 0.000000, 0.00000000
            H 0.761561 , 0.478993, 0.00000000
            H -0.761561, 0.478993, 0.00000000''', basis='6-31g*')
mf = scf.RHF(mol).run()

# electron density
cubegen.density(mol, 'h2o_den.cube', mf.make_rdm1())

# electron density slice
cubegen.density(mol, 'h2o_den_slice.cube', mf.make_rdm1(), nx=1, ny=1, nz=80)

# molecular electrostatic potential
cubegen.mep(mol, 'h2o_pot.cube', mf.make_rdm1())

# molecular electrostatic potential slice
cubegen.mep(mol, 'h2o_pot_slice.cube', mf.make_rdm1(), nx=1, ny=1, nz=80)

# 1st MO
cubegen.orbital(mol, 'h2o_mo1.cube', mf.mo_coeff[:,0])

# 1st MO orbital slice
cubegen.orbital(mol, 'h2o_mo1_slice.cube', mf.mo_coeff[:,0], nx=1, ny=1, nz=80)

-------------
#### **3.3.2 - Psi4**

PSI4 é um pacote de software de código aberto para química computacional, amplamente utilizado para cálculos de estrutura eletrônica. Desenvolvido pela comunidade científica, PSI4 é conhecido por sua eficiência e precisão em métodos de química quântica, incluindo Hartree-Fock (HF), Teoria do Funcional da Densidade (DFT), Teoria de Perturbação de Møller-Plesset (MP2) e muitos outros.

**Links:**

* <https://psicode.org/>
* <https://github.com/psi4/psi4>
* <https://github.com/Psi4Education/>
* <https://education.molssi.org/qm-tools/>

--------

In [None]:
#@title **Instalando as dependências para a Psi4**
#@markdown It will take a few minutes, please, drink a coffee and wait. ;-)
# install dependencies

import subprocess
import sys
subprocess.run("rm -rf /usr/local/conda-meta/pinned", shell=True)
subprocess.run("pip -q install py3Dmol", shell=True)
subprocess.run("!mamba install -c anaconda intel-openmp", shell=True)
subprocess.run("conda config --add channels http://conda.anaconda.org/psi4", shell=True)
subprocess.run("mamba install psi4 resp -c conda-forge/label/libint_dev -c conda-forge", shell=True)
subprocess.run("pip install rdkit-pypi", shell=True)
subprocess.run("pip install Cython", shell=True)
subprocess.run("mamba install -c conda-forge parmed -y", shell=True)
subprocess.run("mamba install -c conda-forge openbabel -y", shell=True)

import os
import psi4
import resp
import openbabel as ob
from rdkit import Chem
from rdkit.Chem import AllChem

In [None]:
# Install psi4
#!pip install psi4

##### **Cálculos iniciais com o Psi4**

In [None]:
# https://github.com/Psi4Education/psi4education/blob/master/labs/Hartree_Fock/HF_student.ipynb
# ==> Set Basic Psi4 Options <==
# Memory specification
psi4.set_memory('500 MB')
numpy_memory = 2 # No NumPy array can exceed 2 MB in size

# set output file
#psi4.core.set_output_file('output.dat', False)
# Desabilitar a saída em tela
#psi4.core.set_output_file('/dev/null', False)

# specify the basis
basis = 'cc-pvdz'
#basis = 'sto-3g'


# Set computation options
psi4.set_options({'basis': basis,
                  'scf_type': 'pk',
                  'e_convergence': 1e-8})


# ==> Define Molecule <==
# Define our model of water --
# we will distort the molecule later, which may require C1 symmetry
mol = psi4.geometry("""
O
H 1 1.1
H 1 1.1 2 104
symmetry c1
""")

# compute energy

SCF_E_psi = psi4.energy('scf')
psi4.core.clean()
print()
print(f"The Hartree-Fock ground state energy of the water is: {SCF_E_psi} Eh")

In [None]:
# Executar opcionalmente
# ==> Compute static 1e- and 2e- quantities with Psi4 <==
wfn = psi4.core.Wavefunction.build(mol, psi4.core.get_global_option('basis'))

# number of spin alpha orbitals (doubly occupied for closed-shell systems)
ndocc = wfn.nalpha()
nbf = wfn.basisset().nbf()

print(F'Number of occupied orbitals: {ndocc}')
print(F'Number of basis functions: {nbf}')

-------------
##### **Otimização de geometrica, cálculo de frequências vibracionais e termoquímica**

In [None]:
# https://psicode.org/psi4manual/master/psiapi.html
#! Sample HF/cc-pVDZ H2O Computation

psi4.set_memory('500 MB')

h2o = psi4.geometry("""
O
H 1 0.96
H 1 0.96 2 104.5
""")
print()
print("Energy 1SCF = ", psi4.energy('scf/cc-pvdz'), "Eh")

In [None]:
psi4.set_options({'reference': 'rhf'})
print("Energy ground state = ", psi4.optimize('scf/cc-pvdz', molecule=h2o), "Eh")

In [None]:
scf_e, scf_wfn = psi4.frequency('scf/cc-pvdz', molecule=h2o, return_wfn=True)

In [None]:
# Executar opcionalmente
# https://psicode.org/psi4manual/master/psiapi.html
# Example SAPT computation for ethene*ethyne (*i.e.*, ethylene*acetylene).
# Test case 16 from S22 Database

dimer = psi4.geometry("""
0 1
C   0.000000  -0.667578  -2.124659
C   0.000000   0.667578  -2.124659
H   0.923621  -1.232253  -2.126185
H  -0.923621  -1.232253  -2.126185
H  -0.923621   1.232253  -2.126185
H   0.923621   1.232253  -2.126185
--
0 1
C   0.000000   0.000000   2.900503
C   0.000000   0.000000   1.693240
H   0.000000   0.000000   0.627352
H   0.000000   0.000000   3.963929
units angstrom
""")

psi4.set_options({'scf_type': 'df',
                  'freeze_core': True})

psi4.energy('sapt0/jun-cc-pvdz', molecule=dimer)


In [None]:
methane = psi4.geometry("""
        pubchem:methane
        """)

In [None]:
methane

In [None]:
psi4.energy('scf/STO-3g', molecule = methane)

In [None]:
print("Initial geometry is\n", np.array(methane.geometry()))
print("Initial energy is ", psi4.energy('scf/STO-3g', molecule = methane))
psi4.optimize('scf/STO-3g', molecule = methane)
print("Final geometry is\n", np.array(methane.geometry()))
print("Final energy is ", psi4.energy('scf/STO-3g', molecule = methane))

In [None]:
energies = np.array([])
basis_set_sizes = np.array([])
#A note: are you looking at the length of my variable names and being sad at
# how long they are? Ask me to demonstrate tab-completion for you.

basis_sets = ["STO-3G", "3-21G", "6-31G", "cc-pvdz", "6-311g(d)", "6-311++G(d,p)"]

#Another note: None of these calculationis take long when using HF-SCF on methane,
# mostly because methane is a REALLY small molecule - only 2 p electrons.
# If you end up working at a higher level of theory on a molecule with a lot
# more electrons (how many in chlorine?), these calculations might end up taking a while.
# It's useful to remember how to do a keyboard interrupt
# and be ready to regroup and try again.

for basis_set in basis_sets:
    print(basis_set)
    psi4.set_options({'basis': basis_set})
    result, wfn = psi4.energy('scf', return_wfn = True)
    nbf = wfn.basisset().nbf()
    energies = np.append(energies, result)
    basis_set_sizes = np.append(basis_set_sizes, nbf)
    print("Energy is ", result)
    print("Number of basis sets is ", nbf)

plt.plot(basis_set_sizes, energies, 'o')
plt.xlabel("Number of basis functions")
plt.ylabel("Minimized energy")


In [None]:
basis_set_sizes = np.array([])
bond_lengths = np.array([])
basis_sets = ["STO-3G", "3-21G", "6-31G", "6-311g(d)"]


for basis_set in basis_sets:
    methane = psi4.geometry("""
        pubchem:methane
        """)
    print(basis_set)
    psi4.set_options({'basis': basis_set})
    result, wfn = psi4.optimize('scf', return_wfn = True)

    current_geometry = np.array(methane.geometry()) #grab the geometry and store it
    bond_length = np.linalg.norm(current_geometry[1,:]-current_geometry[0,:])*0.529177 #calculate the distance then convert from Bohr to Angstroms
    bond_lengths = np.append(bond_lengths, bond_length)
    print("C-H bond length is ", bond_length, " Angstroms")

    nbf = wfn.basisset().nbf()
    basis_set_sizes = np.append(basis_set_sizes, nbf)
    print("Number of basis sets is ", nbf)

plt.plot(basis_set_sizes, bond_lengths, 'o')
plt.xlabel("Number of basis functions")
plt.ylabel("C-H bond length")

In [None]:
co2 = psi4.geometry("""
C
O 1 1.0
O 1 1.0 2 180
""")

In [None]:
print("The inital point group of this molecule is ", co2.get_full_point_group())
psi4.optimize('scf/6-31g', molecule = co2)
print("The point group after geometry optimization is ", co2.get_full_point_group())

In [None]:
energy, wfn = psi4.frequencies('scf/6-31g', molecule = co2, return_wfn = True)
co2.get_full_point_group()

In [None]:
vibinfo = wfn.frequency_analysis

In [None]:
reps = vibinfo['gamma'].data
freqs = np.real(vibinfo['omega'].data)
motion = vibinfo['TRV'].data
deg = vibinfo['degeneracy'].data
# This is not the only way to corral your data!
# It's also probably not the simplest way!
# It's just the way that made sense to me when I learned Psi4 in December.

In [None]:
pd.DataFrame(np.transpose([reps, freqs, motion, deg]),
             columns = ["Representation", "Frequency (wavenumbers)", "Type of motion", "Degeneracy"])

---------------
##### ***Scan* de coordenadas com o Psi4**

In [None]:
# ==> Scanning a Bond Angle: Flexible Water <==
# Import a library to visualize energy profile
import matplotlib.pyplot as plt
%matplotlib inline

# Define flexible water molecule using Z-matrix
flexible_water = """
O
H 1 0.96
H 1 0.96 2 {}
"""

# Scan over bond angle range between 90 & 180, in 5 degree increments
scan = {}
for angle in range(90, 181, 5):
    # Make molecule
    mol = psi4.geometry(flexible_water.format(angle))
    # Call Psi4
    e = psi4.energy('scf/cc-pvdz', molecule=mol)
    #e = psi4.energy('scf/sto-3g', molecule=mol)

    # Save energy in dictionary
    scan[angle] = e

# Visualize energy profile
x = list(scan.keys())
y = list(scan.values())
plt.plot(x,y,'ro-')
plt.xlabel('H-O-H Bond Angle ($^{\circ}$)')
plt.ylabel('Molecular Energy ($E_h$)')
plt.show()

In [None]:
#! Example potential energy surface scan and CP-correction for Ne2

ne2_geometry = """
Ne
--
Ne 1 {0}
"""

Rvals = [2.5, 3.0, 4.0]

psi4.set_options({'freeze_core': True})

# Initialize a blank dictionary of counterpoise corrected energies
# (Need this for the syntax below to work)

ecp = {}

for R in Rvals:
    ne2 = psi4.geometry(ne2_geometry.format(R))
    ecp[R] = psi4.energy('ccsd(t)/aug-cc-pvdz', bsse_type='cp', molecule=ne2)

# Prints to screen
print("CP-corrected CCSD(T)/aug-cc-pVDZ Interaction Energies\n\n")
print("          R [Ang]                 E_int [kcal/mol]       ")
print("---------------------------------------------------------")
for R in Rvals:
    e = ecp[R] * psi4.constants.hartree2kcalmol
    print("            {:3.1f}                        {:1.6f}".format(R, e))

# Prints to output.dat
psi4.core.print_out("CP-corrected CCSD(T)/aug-cc-pVDZ Interaction Energies\n\n")
psi4.core.print_out("          R [Ang]                 E_int [kcal/mol]       \n")
psi4.core.print_out("---------------------------------------------------------\n")
for R in Rvals:
    e = ecp[R] * psi4.constants.hartree2kcalmol
    psi4.core.print_out("            {:3.1f}                        {:1.6f}\n".format(R, e))

In [None]:
#import psi4
#import numpy as np
#%matplotlib inline
#import matplotlib.pyplot as plt

# set the amount of memory that you will need
psi4.set_memory('500 MB')

# set the molecule name for your files and plots
molecule_name = "h2o-dimer"

# Define water dimer
water_dimer = """
O1
H2 1 1.0
H3 1 1.0 2 104.52
x4 2 1.0 1 90.0 3 180.0
--
O5 2 **R** 4 90.0 1 180.0
H6 5 1.0 2 120.0 4 90.0
H7 5 1.0 2 120.0 4 -90.0
"""

In [None]:
rvals = [1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 3.0, 3.5]
energies = []
for r in rvals:
    # Build a new molecule at each separation
    mol = psi4.geometry(water_dimer.replace('**R**', str(r)))

    # Compute the interaction energy
    E = psi4.energy('scf/aug-cc-pVDZ', molecule=mol, bsse_type='cp')

    # Place in a reasonable unit, kcal/mole in this case
    E = E*627.509

    # Append the value to our list
    energies.append(E)

print("Finished computing the potential energy surface!")

In [None]:
plt.plot(rvals,energies,".-");
plt.xlabel("distance (angstrom)")
plt.ylabel("energy (kcal/mol)")
plt.ylim(-5, 10)
plt.title(molecule_name + " interaction energy")

plt.show()

In [None]:
# Define water dimer
water_dimer2 = """
O1
H2 1 1.0
H3 1 1.0 2 104.52
x4 2 1.0 1 90.0 3 180.0
--
O5 2 **R** 4 90.0 1 180.0
H6 5 1.0 2 120.0 4 **A**
H7 5 1.0 2 120.0 4 **B**
"""

R = 1.8
Avals = np.linspace(start=-180,stop=180, num=25)

energies_R = []

for A in Avals:

    print(F'Computing dimer at {R:.1f} angstroms and {A:.2f} degrees')

    # Build a new molecule at each separation
    B = A-180
    molR = water_dimer2.replace('**R**', str(R))
    molA = molR.replace('**A**', str(A))
    molB = molA.replace('**B**', str(B))
    mol = psi4.geometry(molB)

    # calculate energy
    psi4.set_output_file(F'{molecule_name}_{R:.1f}_{A:.2f}_energy.dat', False)
    E = psi4.energy('scf/aug-cc-pVDZ', molecule=mol, bsse_type='cp')
    E = E*627.509
    energies_R.append(E)

In [None]:
plt.figure()
plt.plot(Avals, energies_R, 'r-o')
plt.xlabel('Dihedral angle (degrees)')
plt.ylabel('Interaction Energy (kcal/mole)')

In [None]:
Rvals = np.linspace(start=1.8,stop=2.5,num=8)
Avals = np.linspace(start=-180,stop=180, num=25)

energy_2D = []

for R in Rvals:
    energies_R = []

    for A in Avals:

        print(F'Computing dimer at {R:.1f} angstroms and {A:.2f} degrees')

        # Build a new molecule at each separation
        B = A-180
        molR = water_dimer2.replace('**R**', str(R))
        molA = molR.replace('**A**', str(A))
        molB = molA.replace('**B**', str(B))
        mol = psi4.geometry(molB)

        # calculate energy
        psi4.set_output_file(F'{molecule_name}_{R:.1f}_{A:.2f}_energy.dat', False)
        E = psi4.energy('scf/aug-cc-pVDZ', molecule=mol, bsse_type='cp')
        E = E*627.509
        energies_R.append(E)

    energy_2D.append(energies_R)

print(F'All calculations are complete!')

In [None]:
plt.figure()
plt.plot(Avals, energy_2D[2], 'r-o', label='2.0 Angstroms')
plt.plot(Avals, energy_2D[5], 'b-o', label='2.3 Angstroms')
plt.xlabel('Angle (degrees)')
plt.ylabel('Energy (kcal/mole)')
plt.legend()
plt.show()

In [None]:
from mpl_toolkits import mplot3d
%matplotlib inline

X, Y = np.meshgrid(Avals, Rvals)

mycmap1 = plt.get_cmap('gist_earth')

fig, (ax,ax2) = plt.subplots(1,2,figsize=(12,6))

ax = plt.axes(projection='3d')
cf = ax.contour3D(X, Y, np.array(energy_2D), 300, cmap=mycmap1)
ax.plot_surface(X, Y, np.array(energy_2D), rstride=1, cstride=1,
                cmap='jet', edgecolor='none')

ax.set_xlabel('angle (degrees)')
ax.set_ylabel('R (Bohr)')
ax.set_zlabel('energy (kcal/mol)')
#ax.set_zlim3d(-4,-2)
ax.view_init(45, 35)

---------------

### **3.4 - Métodos semiempíricos**

Os métodos semiempíricos de química quântica utilizam aproximações e parâmetros ajustados empiricamente para simplificar parcelas custosas das equações dos cálculos de estrutura eletrônica. Esses métodos são particularmente úteis para moléculas grandes e sistemas complexos, onde métodos de primeiros princípios, como Hartree-Fock (HF) ou Teoria do Funcional da Densidade (DFT), podem ser computacionalmente proibitivos.

Os métodos semiempíricos baseiam-se nas equações da mecânica quântica, mas simplificam os cálculos ignorando certos termos ou utilizando parâmetros ajustados a dados experimentais ou de cálculos ab initio. Entre os métodos semiempíricos mais conhecidos estão o AM1, PM3 e RM1.

#### **Alguns Métodos Semiempíricos**

#### **Método AM1 (Austin Model 1)**

Desenvolvido por Michael Dewar e colaboradores em 1985, o AM1 é baseando na aproximação NDDO (*Neglect of Diatomic Differential Overlap*) e é um melhoramento do MNDO (Modified Neglect of Diatomic Overlap). O AM1 introduz parâmetros adicionais para melhorar a descrição de interações intermoleculares e melhorar a exatidão dos cálculos de propriedades moleculares.

#### **Método PM3 (Parametric Method 3)**

O PM3, desenvolvido por James Stewart em 1989, é um aprimoramento do AM1. Ele utiliza um conjunto maior de parâmetros ajustados para um maior número de átomos e tipos de ligações. O PM3 busca melhorar a precisão dos cálculos de energias de ligação, estruturas e propriedades eletrônicas.

#### **Método RM1 (Recife Model 1)**

O RM1 é uma melhoria do AM1 e do PM3, desenvolvida por pesquisadores brasileiros em 2002. Ele usa um conjunto de parâmetros ajustados especificamente para melhorar a precisão de propriedades como energias de formação, geometrias e momentos dipolares.

* <https://doi.org/10.21577/0103-5053.20180239>
* <https://rm1.sparkle.pro.br/>

#### **Equações Principais**

Os métodos semiempíricos utilizam as equações da mecânica quântica, mas com simplificações específicas. A equação de Hartree-Fock serve como base para muitos métodos semiempíricos, mas com termos específicos ajustados empiricamente.

#### **Equação de Hartree-Fock Simplificada**

A equação de Hartree-Fock pode ser escrita como:

$$
\hat{F} \psi_i = \epsilon_i \psi_i
$$

onde $\hat{F}$ é o operador de Fock, $\psi_i$ são os orbitais moleculares e $\epsilon_i$ são as energias dos orbitais.

Nos métodos semiempíricos, o operador de Fock $\hat{F}$ é simplificado e parametrizado. Em vez de calcular todos os termos de interação eletrônica explicitamente, muitos deles são substituídos por parâmetros ajustados a dados experimentais.


####**Uso dos Métodos Semiempíricos com Python**

Para implementar métodos semiempíricos em Python, podemos usar a biblioteca ASE (Atomic Simulation Environment) juntamente com MOPAC, um pacote de software que implementa vários métodos semiempíricos.

#### **Referências**

1. Stewart, J. J. P. "Optimization of parameters for semiempirical methods I. Method." *Journal of Computational Chemistry* 10.2 (1989): 209-220.
2. Dewar, M. J. S., et al. "Development and use of quantum mechanical molecular models. 76. AM1: a new general purpose quantum mechanical molecular model." *Journal of the American Chemical Society* 107.13 (1985): 3902-3909.
3. Stewart, J. J. P. "Optimization of parameters for semiempirical methods II. Applications." *Journal of Computational Chemistry* 10.2 (1989): 221-264.
4. Stewart, J. J. P. "Application of the PM3 method to modeling proteins." *Journal of Molecular Modeling* 13.12 (2007): 1173-1213.

--------------





#### **3.4.1 - MOPAC**

MOPAC (***Molecular Orbital Package***) é um programa de química quântica amplamente utilizado para cálculos semiempíricos. Desenvolvido inicialmente por James J. P. Stewart, MOPAC permite a simulação de uma ampla variedade de propriedades moleculares e processos químicos usando métodos semiempíricos. O objetivo é fornecer um equilíbrio entre exatidão e eficiência computacional, tornando-o ideal para o estudo de sistemas moleculares grandes e complexos que seriam proibitivamente caros para métodos *ab initio* e de DFT.

#### **Usodo MOPAC com Python**

MOPAC pode ser utilizado para otimização de geometria, cálculos de energia, análise de espectros vibracionais, e muito mais. No contexto de Python, bibliotecas como `ASE` (Atomic Simulation Environment) podem ser usadas para configurar e executar cálculos MOPAC, facilitando a integração com outras ferramentas de modelagem molecular e análise de dados.


Links:

* <http://openmopac.net/>
* <https://github.com/openmopac/>
* <https://wiki.fysik.dtu.dk/ase/>

-------------

##### **Instalando o MOPAC no Colab**

In [None]:
!wget https://github.com/openmopac/mopac/releases/download/v22.0.6/mopac-22.0.6-linux.tar.gz

In [None]:
!git clone https://github.com/igorChem/AULA_GERD

In [None]:
!tar xfz mopac-22.0.6-linux.tar.gz

In [None]:
!ls -la /content/mopac-22.0.6-linux/bin/*

In [None]:
import os
os.environ['PATH'] += ':/content/mopac-22.0.6-linux/bin'

In [None]:
!mopac

In [None]:
%%file acrolein.mop
GNORM=0.01 AM1 AUX ALLVECS LARGE EPS=74.8 BFGS
1SCF calculation for acrolein
Testing MOPAC on Google Colab
C   0.811 1  0.465 1  0.000  1
C  -0.667 1  0.603 1 -0.000  1
C  -1.468 1 -0.469 1  0.000  1
H  -1.067 1  1.615 1 -0.000  1
H  -2.551 1 -0.382 1  0.000  1
H  -1.041 1 -1.468 1  0.000  1
H   1.374 1  1.423 1  0.000  1
O   1.404 1 -0.598 1 -0.000  1
0

In [None]:
!nohup mopac acrolein.mop &

In [None]:
!cat < acrolein.arc

##### **Executando o MOPAC através da ASE**

In [None]:
!pip install ase

In [None]:
# https://wiki.fysik.dtu.dk/ase/ase/calculators/mopac.html
from ase.build import molecule
from ase.calculators.mopac import MOPAC

atoms = molecule('O2') # Testar com a N2 é melhor
atoms.calc = MOPAC(label='O2') # Testar com a N2 é melhor
atoms.get_potential_energy()
eigs = atoms.calc.get_eigenvalues()
somos = atoms.calc.get_somo_levels()
homo, lumo = atoms.calc.get_homo_lumo_levels()

In [None]:
eigs

In [None]:
atoms = molecule('H2')
atoms.calc = MOPAC(label='H2', task='GRADIENTS')
atoms.get_potential_energy()

In [None]:
atoms = MOPAC.read_atoms('H2')
atoms.calc.get_homo_lumo_levels()

In [None]:
atoms.calc.get_final_heat_of_formation()*23.060548

In [None]:
atoms.get_all_distances()

In [None]:
atoms.get_dipole_moment()

------------

##### **Exercício 1. Reação isodésmica**

In [None]:
!git clone https://github.com/RochaGerd/Chemistry_with_Python.git

In [None]:
!mv -v Chemistry_with_Python/datafiles/Minicurso_Gerd_Rocha_e_Igor_Barden_X_EMMSB_MAI2021/Parte_1_Metodos_Semiempiricos.zip .

In [None]:
!unzip Parte_1_Metodos_Semiempiricos.zip

In [None]:
# Tentar importar a biblioteca e, se falhar, instalar
try:
    import rdkit
except ImportError:
    !pip install rdkit
    import rdkit

# Verificar a instalação e a versão da biblioteca
print("Versão do RDKit:", rdkit.__version__)

In [None]:
del df

In [None]:
import pandas as pd
from ase import Atoms
from ase.optimize import BFGS
from ase.calculators.mopac import MOPAC
from rdkit import Chem
from rdkit.Chem import AllChem

# Função para converter SMILES para objeto Atoms do ASE
def smiles_to_ase_atoms(smiles):
    mol = Chem.MolFromSmiles(smiles)
    mol = Chem.AddHs(mol)
    AllChem.EmbedMolecule(mol, AllChem.ETKDG())
    atoms = [atom.GetSymbol() for atom in mol.GetAtoms()]
    positions = mol.GetConformer().GetPositions()
    return Atoms(symbols=atoms, positions=positions)

# Lista de SMILES das moléculas com identificação
molecules = [
    {'smiles': 'CCO', 'id': 'molecule_1'},  # Etanol
    {'smiles': 'CC(=O)O', 'id': 'molecule_2'},  # Ácido acético
    {'smiles': 'C1=CC=CC=C1', 'id': 'molecule_3'}  # Benzeno
]

# Inicializar dicionário para armazenar resultados
results = {'Molecule': [], 'SMILES': []}

# Adicionar colunas para cada método
methods = ['AM1', 'PM3', 'RM1']
for method in methods:
    results[method] = []

# Loop sobre cada molécula e cada método semiempírico
for mol in molecules:
    mol_id = mol['id']
    smiles = mol['smiles']
    ase_atoms = smiles_to_ase_atoms(smiles)

    # Adicionar informações básicas da molécula
    results['Molecule'].append(mol_id)
    results['SMILES'].append(smiles)

    for method in methods:
        # Configurar o calculador MOPAC
        calc = MOPAC(label=mol_id, task='1SCF GRADIENTS', method=method)
        ase_atoms.set_calculator(calc)

        # Otimizar a geometria
        opt = BFGS(ase_atoms)
        opt.run(fmax=0.05)

        # Obter o calor de formação da última linha do arquivo .out
        with open(f'{mol_id}.out', 'r') as file:
            lines = file.readlines()
            for line in lines:
                if 'FINAL HEAT OF FORMATION' in line:
                    heat_of_formation = float(line.split()[-2])
                    break

        # Armazenar os resultados no dicionário
        results[method].append(heat_of_formation)

# Criar DataFrame do pandas
df = pd.DataFrame(results)
print(df)

# Salvar DataFrame em um arquivo CSV
df.to_csv('heat_of_formation_results.csv', index=False)


In [None]:
df

------------
#### **3.4.2 - xTB**

xTB (*xtight-binding*) é uma ferramenta de química computacional desenvolvida para realizar cálculos de estrutura eletrônica de maneira eficiente. É especialmente útil para estudos de sistemas grandes, como biomoléculas e materiais, onde métodos *ab initio* são computacionalmente proibitivos em computadores de pequeno e médio porte. Desenvolvido pelo grupo de Stefan Grimme, o xTB oferece uma variedade de métodos semiempíricos, incluindo GFN-xTB (Geometries, Frequencies, Noncovalent interactions eXtended Tight-Binding) e outras variantes como GFN1-xTB e GFN2-xTB.

#### **Uso do xTB com Python**

O xTB pode ser utilizado para otimização de geometria, cálculos de energia, análise de espectros vibracionais, e muito mais. No contexto de Python, ele pode ser facilmente integrado e automatizado usando scripts, facilitando a execução de cálculos de alto desempenho.

**Links**

* <https://xtb-docs.readthedocs.io/en/latest/>




-------------
##### **Instalando o xTB no Colab**

In [None]:
# Baixar e instalar o xTB
%%bash
wget https://github.com/grimme-lab/xtb/releases/download/v6.7.0/xtb-6.7.0-linux-x86_64.tar.xz
tar -xvJf xtb-6.7.0-linux-x86_64.tar.xz
export PATH=$PATH:$(pwd)/xtb-dist/bin

In [None]:
!/content/xtb-dist/bin/xtb --version

In [None]:
import os
os.environ['PATH'] += ':/content/xtb-dist/bin'
!xtb --version

---------------------
##### ***Scan* de coordenadas com o xTB**

In [None]:
%%file ethane.xyz
8
-7.46994680
C          -0.01503441120750    0.04820403778911   -0.01075686629161
H          -0.02618280545732    0.12324247717853    1.07751478989514
H           1.02025706611374    0.10521724412205   -0.34995019287160
H          -0.56108089374185    0.89840506905011   -0.42160774836772
C          -0.65104926960692   -1.26213120711759   -0.46045958867132
H          -1.67328207424848   -1.33815676349645   -0.08720971228148
H          -0.67543548798470   -1.32088660386766   -1.54947400918083
H          -0.08161812386697   -2.11204925365809   -0.08140067223057

In [None]:
%%file scan.inp
$constrain
 force constant=0.05
$scan
 dihedral: 8,5,1,4,60.0; 60.0,420.0,72
$end

In [None]:
!xtb ethane.xyz --opt --input scan.inp

In [None]:
!cat < xtbscan.log

In [None]:
def extract_energies_from_xyz(filename):
    energies = []

    with open(filename, 'r') as file:
        lines = file.readlines()

        for line in lines:
            if line.startswith(' energy:'):
                energy = float(line.split()[1])
                energies.append(energy)

    return energies

# Exemplo de uso da função
filename = 'xtbscan.log'  # Substitua pelo nome do seu arquivo XYZ
energies = extract_energies_from_xyz(filename)
print(energies)

# Definir os parâmetros do scan
start_angle = 60.0  # ângulo inicial em graus
end_angle = 420.0   # ângulo final em graus
num_steps = 72      # número de passos

# Gerar os ângulos usando linspace do NumPy
angles = np.linspace(start_angle, end_angle, num_steps)

# Imprimir a lista de ângulos
print(angles)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

# Plotar os ângulos e os valores de energia
plt.figure()
plt.plot(angles, energies, 'r-o')
plt.xlabel('Dihedral angle (degrees)')
plt.ylabel('Energy (hartrees)')
plt.show()

In [None]:
!pip install py3Dmol

import py3Dmol

In [None]:
# Ler o arquivo XYZ
with open('xtbscan.log', 'r') as file:
    xyz_data = file.read()

In [None]:
# Criar a visualização
view = py3Dmol.view(width=800, height=600)

# Adicionar a trajetória do XYZ
view.addModelsAsFrames(xyz_data, 'xyz')

# Ajustar o estilo da visualização
view.setStyle({'stick': {'colorscheme':'greenCarbon'}})

# Ajustar o zoom para que todas as moléculas estejam visíveis
view.zoomTo()

# Animação
view.animate({'loop': 'backAndForth'})  # Animação de ida e volta

# Mostrar a visualização
view.show()

---------------

In [None]:
def visualizar_molecula(nome_arquivo):
    import py3Dmol
    import os
    # Verifica se o arquivo existe
    if not os.path.exists(nome_arquivo):
        print(f"O arquivo '{nome_arquivo}' não existe.")
        return
    # Lê o conteúdo do arquivo XYZ
    with open(nome_arquivo, 'r') as file:
        xyz_content = file.read()

    # Cria a visualização
    view = py3Dmol.view(width=800, height=600)
    view.addModel(xyz_content, 'xyz')

    # Adiciona a visualização
    view.setStyle({'stick': {}})

    # Adiciona rótulos com a numeração dos átomos
    for i, line in enumerate(xyz_content.splitlines()[2:]):
        atom_num = i + 1
        atom = line.split()[0]
        x, y, z = map(float, line.split()[1:])
        label_text = f'{atom_num} ({atom})'
        view.addLabel(label_text, {'position': {'x': x, 'y': y, 'z': z},
                                   'backgroundColor': 'white',
                                   'backgroundOpacity': 0.8,
                                   'fontColor': 'black'})

    # Renderiza a visualização
    view.zoomTo()
    view.show()

# Exemplo de uso:
# visualizar_molecula('caminho/para/seu_arquivo.xyz')

In [None]:
%%file water.xyz
3
Water molecule
O       0.000000       0.000000      -0.065000
H       0.750000       0.750000       0.520000
H      -0.750000       0.750000       0.520000

In [None]:
visualizar_molecula('water.xyz')

In [None]:
# Exemplo de uma molécula flexível: a molécula de omeprazole
# Sugestão: Ir no site do pubchem (https://pubchem.ncbi.nlm.nih.gov/)
#           e consultar o código smiles da molécula da sua preferência
smiles = 'CC1=CN=C(C(=C1OC)C)CS(=O)C2=NC3=C(N2)C=C(C=C3)OC'
mol = Chem.MolFromSmiles(smiles)
mol

In [None]:
# Adicionar hidrogênios explícitos à molécula
mol_H = Chem.AddHs(mol)
AllChem.EmbedMolecule(mol_H)
AllChem.MMFFOptimizeMolecule(mol_H) # Otimizando a geometria com o campo de força MMFF
print(Chem.MolToXYZBlock(mol_H))

In [None]:
%%file ome.xyz
43

C     -6.474593   -1.386555   -0.085378
C     -5.010672   -1.114409    0.059177
C     -4.153592   -2.102349    0.510946
N     -2.824337   -1.936193    0.674526
C     -2.279859   -0.735437    0.347187
C     -3.055068    0.338660   -0.115204
C     -4.442281    0.134371   -0.202095
O     -5.257125    1.157798   -0.623738
C     -5.712181    1.922362    0.495209
C     -2.446673    1.671177   -0.452735
C     -0.784509   -0.639865    0.520217
S      0.093970   -0.967575   -1.039405
O      0.310485   -2.447112   -1.197267
C      1.692332   -0.331621   -0.506293
N      1.906874    0.869064   -0.015498
C      3.256240    0.908021    0.244012
C      3.868305   -0.294656   -0.095925
N      2.843371   -1.067076   -0.575541
C      5.237506   -0.538459    0.065366
C      6.005992    0.504755    0.598781
C      5.409604    1.723367    0.946098
C      4.035473    1.942725    0.775645
O      7.356184    0.456793    0.829870
C      8.024829   -0.754065    0.500177
H     -7.010977   -1.056879    0.809473
H     -6.663638   -2.456287   -0.226535
H     -6.886116   -0.873089   -0.960372
H     -4.517237   -3.095233    0.763116
H     -6.303973    1.310527    1.183965
H     -6.355958    2.720429    0.113650
H     -4.876013    2.387804    1.027737
H     -1.531667    1.553640   -1.039730
H     -2.216215    2.219709    0.465915
H     -3.115661    2.287728   -1.061147
H     -0.519142    0.350129    0.903819
H     -0.442738   -1.373880    1.258977
H      2.892933   -2.018989   -0.912600
H      5.658359   -1.494970   -0.216269
H      6.025270    2.520225    1.358373
H      3.582018    2.889108    1.047457
H      7.952448   -0.965680   -0.571736
H      7.643832   -1.590198    1.095783
H      9.084201   -0.627816    0.743519

In [None]:
visualizar_molecula('ome.xyz')

In [None]:
%%file scan.inp
$constrain
 force constant=0.05
$scan
 dihedral: 4,5,11,12,60.0; 60.0,420.0,36
$end

In [None]:
!xtb ome.xyz --opt --input scan.inp

In [None]:
'''
def extract_energies_from_xyz(filename):
    energies = []

    with open(filename, 'r') as file:
        lines = file.readlines()

        for line in lines:
            if line.startswith(' energy:'):
                energy = float(line.split()[1])
                energies.append(energy)

    return energies
'''

filename = 'xtbscan.log'  # Substitua pelo nome do seu arquivo XYZ
energies = extract_energies_from_xyz(filename)
#print(energies)

# Definir os parâmetros do scan
start_angle = 60.0  # ângulo inicial em graus
end_angle = 420.0   # ângulo final em graus
num_steps = 36      # número de passos

# Gerar os ângulos usando linspace do NumPy
angles = np.linspace(start_angle, end_angle, num_steps)

# Imprimir a lista de ângulos
#print(angles)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

# Plotar os ângulos e os valores de energia
plt.figure()
plt.plot(angles, energies, 'r-o')
plt.xlabel('Dihedral angle (degrees)')
plt.ylabel('Energy (hartrees)')
plt.show()

In [None]:
# Ler o arquivo XYZ
with open('xtbscan.log', 'r') as file:
    xyz_data = file.read()

In [None]:
# Criar a visualização
view = py3Dmol.view(width=800, height=600)

# Adicionar a trajetória do XYZ
view.addModelsAsFrames(xyz_data, 'xyz')

# Ajustar o estilo da visualização
view.setStyle({'stick': {'colorscheme':'greenCarbon'}})

# Ajustar o zoom para que todas as moléculas estejam visíveis
view.zoomTo()

# Animação
view.animate({'loop': 'backAndForth'})  # Animação de ida e volta

# Mostrar a visualização
view.show()

-----------------

#**FIM**
