# Introdução à Mecânica Quântica Relativística

In [1]:
%run init.ipynb

Consideremos as hipóteses básicas no qual a relativade restrita (R.R.) é construída:
1.  As leis físicas são as mesmas em todos os referenciais inercias;
2. A velocidade da luz no vácuo é a mesma em todas as direções e em todos os referenciais inerciais, sendo independente do movimento da fonte;

Em particular, o 1º postulado da R.R. implica que as leis físicas são invariantes frente uma mudança de referencial inercial, ou seja, as equações que descrevem leis físicas (e consequentemente, fenômenos naturais) não alteram sua forma frente uma mudança de referencial inercial, onde essa mudança de referencial inercial é dada pela transformação de Lorentz e não mais de Galileu. Assim, depois do advento da teoria da relatividade restrita e sua consequente formalização matemática através do conceito de espaço-tempo (ou espaço de Minkowski, um espaço vetorial de $dim = 4$ no qual há um produto escalar implicitamente definido pelo intervalo espaço-temporal $ds^2 = c^2dt^2 - \vec{dr} \cdot \vec{dr}$, como veremos mais adiante.), uma condição básica para uma "boa teoria" é que suas implicações físicas (resultados que descrevem fenômenos) não dependam do particular referencial usado para obtê-las (uma vez que tal escolha é arbitrária e é feita por quem descreve o fenômeno e diferentes observadores podem escolher diferentes referênciais e sistemas de coordenadas a fim de descrevê-lo).

Seguindo esse raciocínio, é possível observar que a mecânica quântica "não-relativística" (já pelo nome é possível advinhar) não é uma 'boa teoria', uma vez que a equação de Schrödinger (na base da posição) para partícula livre dada por
\begin{equation}
i\hbar \partial_t \Psi(\vec{x},t) = - \frac{\hbar^2}{2m} \nabla^2\Psi(\vec{x},t)
\end{equation}
não mantém sua forma na transição de um referencial inercial para outro, ou seja, frente a uma transformação de Lorentz. Ademais, também é possível observar que a ordem da derivada temporal é diferente da ordem das derivadas espaciais, não sendo consistente com a R.R., uma vez que as coordenadas espaço-temporais são tratadas em pé de igualdade. Logo, é necessário encontrar uma equação, equivalente a equação de Schrödinger, que descreva a evolução temporal de um estado do sistema (na base da posição) e ainda seja consistente com a relatividade especial.





## 'Crash-course' em Tensores & Relatividade

Como mencionado acima, uma vez que descrevemos a natureza através da matemática, é razoável (ou até mandatório) esperar que as previsões físicas que fazemos devem ser independentes de nossas convenções matemáticas, tal como um sistema de coordenadas com sua origem arbitrária e orientação de seus eixos. Além do mais, as leis físicas quando formuladas devem refletir a indepêndencia dos sistemas de referência (Princípio da relatividade). A implicação prática deste princípio é que as equações que representam as leis físicas (e que fazem previsões) devem ser descritas em termos de tensores, uma vez que tensores são objetos matemáticos que mantém sua forma frente às transformações que o definem.

A primeira noção intuitiva que nos é dada sobre vetores é que são quantidades caracterizadas por possuírem módulo, direção e sentido (além de pertencer a um espaço vetorial). Assim, dentro do cenário acima, não basta que vetores possuam módulo, direção e sentido, é necessário defini-los frente a um conjunto de transformações que deixam sua forma invariante. Por exemplo, consideremos um vetor $\vec{V}$ no plano $\mathbb{R}^2$, representado na figura abaixo, descritos pelas coordenadas $\vec{V} = V_1 \hat{x} + V_2 \hat{y}$ no sistema $\Sigma$, enquanto que no referencial rotacionado $\Sigma'$ é descrito pelas coordenadas  $\vec{V} = V'_1 \hat{x}' + V'_2 \hat{y}'$. Assim, para tal objeto ser independe do sistema de eixos escolhidos, é necessário encontrar uma transformação $R$ que leve as coordenadas (e a base) de $\vec{V}$ no sistema $\Sigma$ para o sistema $\Sigma'$, mantendo suas propriedades inalteradas (como módulo, sentido e direção) mesmo que representado por notações diferentes.

<img src="sistcoord.png" width="500">

Assim, usando um pouco de geometria, podemos ver que as bases estão relacionadas a partir de 
\begin{align}
    & \hat{x}' = \cos \theta \hat{x} + \sin \theta \hat{y},\\
    & \hat{y}' = - \sin \theta \hat{x} + \cos \theta \hat{y}.\\
\end{align}
Substituindo na expressão $\vec{V} = V'_1 \hat{x}' + V'_2 \hat{y}'$, temos que
\begin{align}
\vec{V} & = V'_1 (\cos \theta \hat{x} + \sin \theta \hat{y}) + V'_2 (- \sin \theta \hat{x} + \cos \theta \hat{y}) \\
& = (V'_1 \cos \theta - V'_2 \sin \theta)\hat{x} + (V'_2 \cos \theta + V'_1 \sin \theta)\hat{y},
\end{align}
comparando com  $\vec{V} = V_1 \hat{x} + V_2 \hat{y}$, podemos ver que as coordenadas de $\vec{V}$ nos referencias $\Sigma$ e $\Sigma'$ estão ligadas pela transformação
\begin{align}
 \left( \begin{array}{c}
V_1 \\
V_2 \\
\end{array}  
\right) =  \left( \begin{array}{cc}
\cos \theta & -\sin \theta \\
\sin \theta & \cos \theta \\
\end{array}  
\right)  \left( \begin{array}{c}
V'_1 \\
V'_2 \\
\end{array}
\right) = R(\theta) \left( \begin{array}{c}
V'_1 \\
V'_2 \\
\end{array}
\right),
\end{align}
sendo imediato ver que o módulo de $\vec{V}$ é preservado uma vez que
\begin{align}
V^2_{\Sigma} & = \vec{V} \cdot \vec{V} = (V'_1 \cos \theta - V'_2 \sin \theta)^2 +  (V'_2 \cos \theta + V'_1 \sin \theta)^2 \\
& = V'^2_1 (\cos^2 \theta + \sin^2 \theta) + V'^2_2 (\cos^2 \theta + \sin^2 \theta) + 2 V'_1 V'_2 (\cos \theta \sin \theta - \cos \theta \sin \theta)\\
& = V'^2_1 + V'^2_2\\
& = V^2_{\Sigma'}.
\end{align}
Agora, denotando por $a_{ij}$, $i,j = 1,2$ os elementos da matriz $R(\theta)$, é possível escrever a relação entre as coordenadas de $\vec{V}$ como
\begin{align}
V_i = \sum_j a_{ij} V'_j.
\end{align}
Como o módulo de $\vec{V}$ é preservado, então é necessário que $V^2_{\Sigma} = \sum_{i} V_i V_i = \sum_j V'_j V'_j$ o que implica em
\begin{align}
V^2_{\Sigma} = \sum_{i} V_i V_i = \sum_{i} \sum_{j,k} a_{ij} a_{ik} V'_j V'_k  = \sum_j V'_j V'_j = V^2_{\Sigma'},
\end{align}
que implica em 
\begin{align}
\sum_{i} a_{ij} a_{ik} = \delta_{jk}.
\end{align}
Por outro lado, notando que $a_{ij} = (R^T)_{ji}$ e $a_{ik} = (R)_{ik}$, então
\begin{align}
\sum_{i} a_{ij} a_{ik} = \sum_{i}(R^T)_{ji}(R)_{ik}  = \delta_{jk},
\end{align}
que nada mais é que a condição de ortogalidade $R^T R = I$. 
Logo, podemos dizer que $\vec{V}$ mantém sua forma (é invariante) frente a rotações do sistema de coordenadas. Assim, podemos definir vetores não só como objetos geométricos que tem módulo, sentido e direção (e pertencem a um espaço vetorial), mas também como objetos que mantém sua forma frente a um conjunto de transformações (e pertencem a um espaço vetorial). 

Tal definição possui a vantagem de estar sujeita a generalizações, levando naturalmente à noção de tensores ('basta adicionar mais índices'). 





No entanto, como estamos interessados em MQ relativística, o conjunto de transformações que buscamos não são rotações, mas sim, transformações de Lorentz (que, no fundo, são rotações no espaço de Minkowski), que ligam dois referencias inerciais se movendo com velocidade constante relativa entre si.

Ademais,
1. O protudo escalar entre dois vetores no plano pode ser definidi como um mapa linear $\langle \cdot, \cdot \rangle : \mathbb{R}^2 \times \mathbb{R}^2 \to \mathbb{R}$ que atua em dois vetores $V, W \in \mathbb{R}^2$ e leva nos números reais de tal maneira:
\begin{equation}
 \langle V, W \rangle  = V \cdot W = \sum_i V_i W_i = \sum_{i,j} \delta_{ij} V_i W_j = V^T I W,
\end{equation}
onde $(\delta_{ij}) = I$ é a matriz identidade, fazendo o papel da métrica no plano, uma vez que, a partir daí, podemos definir noção de distância entre dois pontos ou tamanho de um vetor.
2. A distância entre dois pontos infinitesimais $(x,y)$ e $(x + dx, y + dy)$ em $\mathbb{R}^2$ pode ser definida como
\begin{align}
ds^2 = dx^2 + dy^2 = \sum_{i,j} \delta_{ij} dx_i dx_j,
\end{align}
com $x_1 = x, x_2 = y$.



### Sumário da Relativade Restrita
Seja $\Sigma$ um referencial inercial e $\Sigma'$ um outro referencial inercial que se move em relação à $\Sigma$ com velocidade constante $v$, de maneira que as origens $O$ e $O'$ coincidam nos instantes $t = t' = 0$ e que a velocidade relativa $v$ seja paralela ao eixo $x$ de $\Sigma$:

<img src="sistref.png" width="500">


Então, as coordenadas $(x,y,z)$ no intervalo $t$, e as $(t',x',y',z')$ no intervalor $t'$, atribuídas a um mesmo evento por observadores fixos nos referenciais $\Sigma$ e $\Sigma'$, estão relacionadas através de
\begin{align}
& t' = \gamma(t - \beta x/c) \ \ \ \ \ \ \ \  t = \gamma(t' + \beta x'/c),\\ 
& x' = \gamma(x - vt)   \ \ \ \ \ \ \ \ \ x = \gamma(x' + vt'), \\
& y' = y  \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ y = y', \\
& z' = z  \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ z = z',
\end{align}
onde $\gamma = (1 - v^2/c^2)^{-1/2}$ e $\beta = v/c$. Tais transformações são denominadas de transformações de Lorentz. Há inúmeras maneiras de deduzir tais relações. Por exemplo, Einstein as obteve a partir dos postulados 1. Princípio da relatividade e 2. Constância da velocidade da luz. No entanto, também é possível obter ela assumindo apenas o príncipio da relatividade e a estrutura de grupo que tais relações deve satisfazer http://arxiv.org/abs/1504.02423; ou ainda, assumindo o princípio da relatividade e isotropia e homogeneidade do espaço tempo http://aip.scitation.org/doi/10.1063/1.1665000. Também, é possível obtê-las dentro do contexto de teoria de grupos, buscando transformações que deixam o produto escalar no espaço de Minkowski invariante. Logo, dado tal conjunto de transformações, podemos ver que um vetor em $\mathbb{R}^3$ não se mantém invariante. Por exemplo, se considerarmos o vetor deslocamento entre dois pontos $\vec{x} = (x, y, z)$ em $\Sigma$ e $\vec{x}' = (x',y',z')$ em $\Sigma'$, então $r^2 \neq r'^2$. 

#### Teorema
A distância (ou intervalo) entre dois pontos infinitesimais (ou dois eventos), (ct, x, y, z) e (c(t + dt), x + dx, y + dy, z +dz), que se mantém invariante frente as transformações de Lorentz pode ser definida através:
\begin{equation}
ds^2 := c^2dt^2 - dx^2 - dy^2 - dz^2.
\end{equation}
##### prova:
Dado que
\begin{align}
dt' = \gamma(dt - \beta dx/c), \ \ \ \ dx' = \gamma(dx - vdt), \ \ \ \ dy' = dy, \ \ \ \ dz' = dz,
\end{align}
então
\begin{align}
ds'^2 & = c^2dt'^2 - dx'^2 - dy'^2 - dz'^2 \\
& = c^2\gamma^2(dt - \beta dx/c)^2 - \gamma^2(dx - vdt)^2 - dy^2 - dz^2 \\
& = c^2 \gamma^2(dt^2 + \beta^2 dx^2/c^2 - 2 \beta dt dx / c)  - \gamma^2(dx^2 + v^2 dt^2 - 2v dx dt) - dy^2 - dz^2 \\
& = \gamma^2(1 - v^2/c^2)c^2 dt^2 - \gamma^2(1 - \beta^2) dx^2 - dy^2 - dz^2\\
& = c^2dt^2 - dx^2 - dy^2 - dz^2 \\
& = ds^2.
\end{align}

Assim, o substrato (espaço vetorial) no qual os objetos estão definidos não é mais o espaço euclidiano ($\mathbb{R}^3 com o produto interno usual).

#### Definição: 
O espaço de Minkowski é um espaço vetorial 4-dimensional, $\mathbb{R}^4$, dotado de um produto interno $\langle \cdot, \cdot \rangle$ definido a partir de
\begin{align}
\langle x, y \rangle = x^0 y^0 - \vec{x} \cdot \vec{y} = \sum_{\mu, \nu} \eta_{\mu \nu} x^{\mu} y^{\nu} = x^T \eta y,
\end{align}
onde $\eta := (\eta_{\mu \nu}) = diag (1, -1, -1, -1)$ é a métrica de Minkowski e $x^{\mu} := (x^0, x^1, x^2, x^3) = (ct, x, y, z)$ são elementos do espaço de Minkowski, $\mathcal{M}$, e são denominados de eventos.

1. Vale ressaltar que os elementos $x$ são pontos em $\mathcal{M}$ e também denominados de quadri-vetores contravariantes (como veremos mais adiante). Assim, as transformações de Lorentz são aquelas que deixam a norma de um evento $x \in \mathcal{M}$ (ou o intervalo entre dois eventos) invariante.

2. A métrica definida por
\begin{align}
\eta = \left( \begin{array}{cccc}
1 & 0 & 0 & 0 \\
0 & -1 & 0 & 0 \\
0 & 0 & -1 & 0 \\
0 & 0 & 0 & -1 \\
\end{array}  
\right)
\end{align}
é uma matriz simétrica, $\eta_{\mu \nu} = \eta_{\nu \mu}$, cuja inversa é ela mesma, i.e., $\eta^{-1} = \eta$. E denotamos $\eta^{-1} := (\eta^{\mu \nu})$ de tal maneira que 
\begin{align}
\eta^{-1} \eta = I \to \sum_{\alpha} \eta^{\mu \alpha} \eta_{\alpha \nu} = \delta^{\mu}_{\nu}. 
\end{align}

3. É comum, nesse contexto, a omissão dos símbolos de soma em expressões do tipo $\sum_{\mu, \nu} \eta_{\mu \nu} x^{\mu} y^{\nu}$ com o entendimento de que índices repetidos são sempre somados, com índices gregos $\mu, \nu,...$ variando de 0 a 3 e índices latinos $i,j,...$ variando de 1 a 3. Assim, implicitamente temos que
\begin{equation}
\eta_{\mu \nu} x^{\mu} y^{\nu} = \sum_{\mu, \nu} \eta_{\mu \nu} x^{\mu} y^{\nu}.
\end{equation}

4. As transformações de Lorentz formam um conjunto de transformações lineares que podem ser reescritas na forma
\begin{align}
& t' = \gamma(t - \beta x/c) \to  x'^0 = \Lambda^0_0 x^0 + \Lambda^0_1 x^1 + \Lambda^0_2 x^2 + \Lambda^0_3 x^3\\ 
& x' = \gamma(x - vt)   \to x'^1 = \Lambda^1_0 x^0 + \Lambda^1_1 x^1 + \Lambda^1_2 x^2 + \Lambda^1_3 x^3, \\
& y' = y  \to x'^2 = \Lambda^2_0 x^0 + \Lambda^2_1 x^1 + \Lambda^2_2 x^2 + \Lambda^2_3 x^3, \\
& z' = z  \to x'^3 = \Lambda^3_0 x^0 + \Lambda^3_1 x^1 + \Lambda^3_2 x^2 + \Lambda^3_3 x^3,
\end{align}
ou mais, compactamente, podemos escrever $x'^{\mu} = \sum_{\nu} \Lambda^{\mu}_{\ \nu}x^{\nu} = \Lambda^{\mu}_{\nu}x^{\nu}$, onde a matriz $\Lambda := (\Lambda^{\mu}_{\nu})$ neste caso é dada por
\begin{align}
\Lambda = \left( \begin{array}{cccc}
\gamma & -\gamma \beta & 0 & 0 \\
-\gamma \beta &  \gamma & 0 & 0 \\
0 & 0 & 1 & 0 \\
0 & 0 & 0 & 1 \\
\end{array}  
\right).
\end{align}


#### Definição
Um escalar é uma quantidade invariante sob transformações de Lorentz, ou seja, cujo valor é o mesmo em todos os referenciais inerciais. E.g.: carga elétrica de uma partícula, intervalo entre dois eventos, velocidade da luz no vácuo, o produto escalar...

#### Definição
Um vetor contravariante é um objeto de 4 componentes $V^{\mu} = (V^0, V^1, V^2, V^3)$ definido em $\mathcal{M}$ que, sob uma transformação de Lorentz, transforma-se da mesma maneira que um evento $x^{\mu}$ no espaço de Minkowski, i.e.,
\begin{align}
V'^{\mu} = \Lambda^{\mu}_{\nu}V^{\nu}.
\end{align}
Resumindo, o protótipo de vetor contravariante é o evento $x^{\mu} = (x^0, x^1, x^2, x^3)$.


Assim, o produto escalar entre dois vetores $V^{\mu},W^{\nu}$ que pertencem ao espaço de Minkowski é dado por
\begin{align}
\langle V, W \rangle =  \eta_{\mu \nu} V^{\mu} W^{\nu} = V^0 W^0 - V^1 W^1 - V^2 W^2 - V^3 W^3,
\end{align}
sendo um escalar e, portanto, invariante frente à transformações de Lorentz.

1. Notemos por exemplo que
\begin{align}
 \eta_{1 \nu} W^{\nu} = \eta_{1 0} W^{0} + \eta_{1 1} W^{1} + \eta_{1 2} W^{2} + \eta_{1 3} W^{3} = -W^1, 
\end{align}
sendo sugestivo definir um objeto covariante (com índice embaixo) $W_{1} := \eta_{1 \nu} W^{\nu} = - W^1$. Ou ainda, de maneira mais geral, $$W_{\mu} := \eta_{\mu \nu} W^{\nu},$$
onde
\begin{align}
& W_{0} = \eta_{0 \nu} W^{\nu} = W^0, \\
& W_{1} = \eta_{1 \nu} W^{\nu} = - W^1, \\
& W_{2} = \eta_{2 \nu} W^{\nu} = - W^2, \\
& W_{3} = \eta_{3 \nu} W^{\nu} = - W^3, \\
\end{align}
e, portanto, $W_{\mu} = (W_0, W_1, W_2, W_3) = (W^0, -W^1, -W^2, -W^3)$. Sendo possível reescrever o produto escalar como
\begin{align}
\langle V, W \rangle & =  V^0 W^0 - V^1 W^1 - V^2 W^2 - V^3 W^3\\
& = V^0 W_0 + V^1 W_1 + V^2 W_2 + V^3 W_3 \\
& = V^{\mu} W_{\mu},
\end{align}
ou ainda, $$\langle V, W \rangle  =  \eta_{\mu \nu} V^{\mu} W^{\nu} = V^{\mu} W_{\mu} = V_{\nu} W^{\nu}.$$ 
2. A métrica estabelece um isomorfismo (relação de 1-para-1) entre objetos covariantes e contravariantes, de modo que a ação $\eta_{\mu \nu}$ pode ser lida como: abaixe o índice e faça $\mu = \nu$.

#### Definição 
Um vetor covariante $V_{\mu}$ é definido pela lei de transformação $V'_\mu = \Lambda_{\mu}^{\nu} V_{\nu}$, onde $(\Lambda_{\mu}^{\nu})$ é a inversa de $(\Lambda^{\mu}_{\nu})$.

Essa definição decorre imediatamente do fato de que o produto escalar é um invariante Lorentz, uma vez que \begin{align}
V^{\alpha} V_{\alpha} = V'^{\mu} V'_{\mu} = \Lambda^{\mu}_{\nu}\Lambda_{\mu}^{\alpha} V^{\nu} V_{\alpha} 
\end{align}
o que implica que 
\begin{align}
\Lambda^{\mu}_{\nu}\Lambda_{\mu}^{\alpha} = \delta^{\alpha}_{\nu}.
\end{align}

#### Obs: Na realidade, $(\Lambda_{\mu}^{\nu})$ é a  transposta inversa de $(\Lambda^{\mu}_{\nu})$.

#### Definição
Um tensor contravariante de ordem 2 em $\mathcal{M}$ é um objeto $T^{\mu \nu}$, com $4^2$ componentes, que se transforma segundo $T'^{\mu \nu} = \Lambda^{\mu}_{\alpha}\Lambda^{\nu}_{\beta}T'^{\alpha \beta}$. Analogamente, um tensor covariante de ordem 2 em  $\mathcal{M}$ é um objeto $T_{\mu \nu}$, com $4^2$ componentes, que se transforma segundo $T'_{\mu \nu} = \Lambda_{\mu}^{\alpha}\Lambda_{\nu}^{\beta}T'_{\alpha \beta}$.



1. A derivada partial $\partial/\partial x^{\mu}$ se comporta como a componentes $\mu$ de um vetor covariante, enquanto $\partial/\partial x_{\mu}$ se comporta como a componentes $\mu$ de um vetor contravariante de modo que denotamos tal fato sugestivamente por
\begin{align}
 \frac{\partial}{\partial x^{\mu}} := \partial_{\mu} \ \ \ \  \frac{\partial}{\partial x_{\mu}} := \partial^{\mu}.
\end{align}
Sendo possível verificar tal fato a partir de que $\partial_{\mu} x^{\mu} = \partial^{\mu} x_{\mu} = 4 $ é um escalar.

2. O operador
\begin{align}
\partial_{\mu}\partial^{\mu} & = \partial^{\nu}\partial_{\nu} = \eta^{\mu \nu} \partial_{\mu} \partial_{\nu} = \partial^2_0 - \partial^2_1 - \partial^2_2 - \partial^2_3\\
& = \frac{1}{c^2} \frac{\partial^2}{\partial t^2} - \nabla^2,
\end{align}

é invariante frente às transformações de Lorentz.


#### Proposição
A equação de Schrödinger para uma partícula livre não é invariante frente às transformações de Lorentz.

#### prova

Dado os referenciais $\Sigma$ e $\Sigma'$ que se move em relação à $\Sigma$ com velocidade constante $v$ como discutido anteriorimente. A invariância frente às transformações de Lorentz significa que se, no referencial $\Sigma$, $\Psi(\vec{x},t)$  é solução da equação
$$i\hbar \partial_t \Psi(\vec{x},t) = - \frac{\hbar^2}{2m} \nabla^2\Psi(\vec{x},t),$$ então
$\Psi'(\vec{x'},t')$ é solução da equação 
$$i\hbar \partial'_t \Psi'(\vec{x'},t') = - \frac{\hbar^2}{2m} \nabla'^2\Psi'(\vec{x'},t'),$$
no referencial $\Sigma'$. Como $\Psi(\vec{x},t)$ pode ser visto como um campo escalar, isto é, $\Psi : \mathbb{R}^3 \times \mathbb{R} \to \mathbb{C}$, então, por definição, podemos impor que ele é invariante de Lorentz, ou seja, $\Psi'(\vec{x'},t') = \Psi(\vec{x},t)$. Assim, podemos escrever a equação acima como
\begin{equation}
(i\hbar \partial'_t + \frac{\hbar^2}{2m} \nabla'^2) \Psi(\vec{x},t) = 0,
\end{equation}
restando mostrar que o operador diferencial que atua sobre $\Psi$ é invariante de Lorentz. Mas isso é um absurdo, pois
\begin{align}
& \frac{\partial}{\partial x'} = \frac{\partial x}{\partial x'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial x'}\frac{\partial}{\partial t} = \gamma\frac{\partial}{\partial x} + \frac{\gamma \beta}{c}\frac{\partial}{\partial t}, \\ 
\end{align}
que leva à
\begin{align}
\frac{\partial^2}{\partial x'^2} & = \frac{\partial}{\partial x'} \frac{\partial}{\partial x'} = (\frac{\partial x}{\partial x'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial x'}\frac{\partial}{\partial t})(\frac{\partial x}{\partial x'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial x'}\frac{\partial}{\partial t})\\
& = (\gamma\frac{\partial}{\partial x} + \frac{\gamma \beta}{c}\frac{\partial}{\partial t})(\gamma\frac{\partial}{\partial x} + \frac{\gamma \beta}{c}\frac{\partial}{\partial t})\\
& = \gamma^2 \frac{\partial^2}{\partial x^2} + \frac{\gamma^2 \beta^2}{c^2}\frac{\partial}{\partial t} + \frac{2 \gamma^2 \beta}{c}\frac{\partial^2}{\partial x \partial t}, 
\end{align}
enquanto que
\begin{align}
& \frac{\partial}{\partial t'} = \frac{\partial x}{\partial t'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial t'}\frac{\partial}{\partial t} = \gamma v \frac{\partial}{\partial x} + \gamma \frac{\partial}{\partial t},\\
& \frac{\partial^2}{\partial y'^2} = \frac{\partial^2}{\partial y^2},\\
& \frac{\partial^2}{\partial z'^2} = \frac{\partial^2}{\partial z^2},
\end{align}
sendo possível observar que
\begin{equation}
(i\hbar \partial'_t + \frac{\hbar^2}{2m} \nabla'^2) \neq (i\hbar \partial_t + \frac{\hbar^2}{2m} \nabla^2).
\end{equation}
Logo, a equação de Schrödinger não é invariante frente às transformações de Lorentz.



No entanto, calculando $\partial'^2_t$ 
\begin{align}
\frac{\partial^2}{\partial t'^2}& =  (\frac{\partial x}{\partial t'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial t'}\frac{\partial}{\partial t})(\frac{\partial x}{\partial t'}\frac{\partial}{\partial x} + \frac{\partial t}{\partial t'}\frac{\partial}{\partial t})\\ 
& = (\gamma v \frac{\partial}{\partial x} + \gamma \frac{\partial}{\partial t})(\gamma v \frac{\partial}{\partial x} + \gamma \frac{\partial}{\partial t}) \\
& = \gamma^2 v^2 \frac{\partial^2}{\partial x^2} + \gamma^2 \frac{\partial^2}{\partial t^2} + 2 \gamma^2 v\frac{\partial^2}{\partial x \partial t},
\end{align}
temos que
\begin{align}
\frac{1}{c^2}\frac{\partial^2}{\partial t'^2} - \frac{\partial^2}{\partial x'^2} & =  \frac{1}{c^2}(\gamma^2 v^2 \frac{\partial^2}{\partial x^2} + \gamma^2 \frac{\partial^2}{\partial t^2} + 2 \gamma^2 v\frac{\partial^2}{\partial x \partial t}) - (\gamma^2 \frac{\partial^2}{\partial x^2} + \frac{\gamma^2 \beta^2}{c^2}\frac{\partial}{\partial t} + \frac{2 \gamma^2 \beta}{c}\frac{\partial^2}{\partial x \partial t})\\
& = \frac{\gamma^2}{c^2}(1 - \beta^2)\frac{\partial^2}{\partial t^2} + \gamma^2(1 - \frac{v^2}{c^2})\frac{\partial^2}{\partial x^2} \\
& = \frac{1}{c^2}\frac{\partial^2}{\partial t^2} - \frac{\partial^2}{\partial x^2}
\end{align}








## Equação de Klein-Gordon

A equação de Klein-Gordon foi considerada primeiramente por Schrödinger, antes mesmo da formulação não-relativísitica de sua "equação de onda", levando em conta os efeitos de um campo eletromagnético externo através do acoplamento mínimo (como veremos mais adiante) e abandonada, uma vez que não previa de maneira correta o desdobramento dos níveis de energia do átomo de Hidrogênio devido à estrutura fina (efeito relativístico + acoplamento spin-órbita), entre outros problemas (que também serão discutidos mais adiante). 

A fim de obtê-la, primeiro observemos que os valores do momento $\vec{p}$ e da energia $E$ são obtidos como autovalores dos operadores associados a esses observáveis, i.e., através da identificação $ \vec{p} \rightarrow -i\hbar \vec{\nabla} $ e $ E \rightarrow i\hbar \partial_t$, uma vez que eles são observáveis físicos e, portanto, podem ser representados a partir de operadores hermitianos. Assim, a equação de Schödinger para uma partícula livre não relativística 

\begin{equation}
i\hbar \partial_t \Psi(\vec{x},t) = - \frac{\hbar^2}{2m} \nabla^2\Psi(\vec{x},t)
\end{equation}
pode ser reescrita como
\begin{equation}
E \ \Psi(\vec{x},t) =  \frac{p^2}{2m}\Psi(\vec{x},t).
\end{equation}
Ainda, considerando que o hamiltoneano $H$ que descreve uma partícula livre não-relativística é dado por $H = \frac{p^2}{2m} = E$, sendo uma constante de movimento, uma vez que não depende explicitamente do tempo, e, portanto, pode ser identificado como a energia total do sistema. Uma possível solução para equação de Schrödinger que descreve a 'função de onda' de uma partícula livre é em termos de ondas planas: $\Psi(\vec{x},t) = A e^{i (\vec{k} \cdot \vec{x} - \omega t)}$, onde $\vec{p} = \hbar \vec{k}$ e $E = \hbar \omega$ e pode ser obtida a partir do método da separação de variáveis. Como $[H, \vec{p}] = 0$, ambos compartilham a mesma base de auto-funções, de modo que é possível observar que os valores da energia  e do momento são autovalores das equações $i \hbar \partial_t \Psi(\vec{x},t) = E \Psi(\vec{x},t) $ e $-i \hbar \vec{\nabla} \Psi(\vec{x},t) = \vec{p} \Psi(\vec{x},t)$, respectivamente. No entanto, sabemos que a energia total de uma partícula livre relativística obtido através da relação
\begin{equation}
E^2 = p^2c^2 + m^2c^4,
\end{equation}
de modo que somos 'tentados' a escrever essa relação em termos de operadores diferenciais uma vez que $ \vec{p} \rightarrow -i\hbar \vec{\nabla} $ e $ E \rightarrow i\hbar \partial_t$ e aplicá-la à $\Psi(\vec{x},t)$ para obter a equação de Klein-Gordon
\begin{equation}
-\hbar^2 \partial_t^2 \Psi(\vec{x},t) = (-\hbar^2c^2 \nabla^2 + m^2 c^4) \Psi(\vec{x},t)
\end{equation} 
que geralmente é escrita na forma
\begin{equation}
 (\nabla^2 - \frac{m^2 c^2}{\hbar^2})\Psi(\vec{x},t) = c^{-2} \partial_t^2 \Psi(\vec{x},t).
\end{equation}
Já, em notação indicial(ou tensorial), onde $(x^0,x^1,x^2,x^3):= (ct,x,y,z)$, podemos reescrever a equação de Klein-Gordon como
\begin{equation}
(\partial_\mu \partial^\mu + \frac{m^2 c^2}{\hbar^2})\Psi(\vec{x},t) = 0,
\end{equation}
onde $\partial_\mu \partial^\mu = \eta^{\mu \nu}\partial_\mu \partial_\nu$ e $\eta^{\mu \nu} = diag(1,-1,-1,-1)$. A equação de Klein-Gordon obtida satifaz a condição de ser invariante frente às transformações de Lorentz pois o operador $\partial_\mu \partial^\mu$ é invariante frente a tais transformações. Agora, é interessante notar que para $m = 0$, a equação se reduz a uma equação de onda. Assim como a equação de onda, a equação de Klein-Gordon também admite solução em termos de ondas planas, que são soluções características da partícula livre. Ainda, as funções
\begin{equation}
e^{\pm i k_\mu x^\mu} = e^{\pm i k^\mu x_\mu} = e^{\pm i(k^0ct - \vec{k} \cdot \vec{x})} = e^{\pm i(\omega t - \vec{k} \cdot \vec{x})},
\end{equation}
com $k^\mu = (k^0, \vec{k}) = (\omega/c, \vec{k})$ são autofunções dos operadores relacionados à energia e momento, como no caso não-relativístico. Para ver isso, em notação indicial é possível escrever $p^\mu = i \hbar \partial^\mu$ com
\begin{equation}
\begin{split}
& p^0 = i\hbar\partial^0 = i\hbar \eta^{0\nu}\partial_\nu = i\hbar \eta^{00}\partial_0 =  i\hbar c^{-1}\partial_t \\  
& p^j = i\hbar\partial^j = i\hbar \eta^{j\nu}\partial_\nu = i\hbar \eta^{jj}\partial_j  = -i\hbar \partial_j, \ \ j = 1, 2, 3, 
\end{split}
\end{equation}
d'onde é possível concluir que $p^0 = E/c$. Assim,
\begin{equation}
\begin{split}
i \hbar \partial^\mu e^{\pm i k_{\nu} x^{\nu}} & = i \hbar \eta^{\mu \alpha} \partial_{\alpha} e^{\pm i k_{\nu} x^{\nu}} = i \hbar \eta^{\mu \alpha} e^{\pm i k_{\nu} x^{\nu}} \partial_{\alpha}( \pm i k_{\nu} x^{\nu}) \\
& = \pm i^2 \eta^{\mu \alpha} \hbar k_\nu \delta_{\alpha \nu}e^{\pm i k_{\nu} x^{\nu}}\\
& = \pm i^2 \eta^{\mu \nu} \hbar k_\nu e^{\pm i k_{\nu} x^{\nu}}\\
& = \mp p^{\mu} e^{\pm i k_{\nu} x^{\nu}},
\end{split}
\end{equation}
com $\mp p^\mu = \mp \hbar k^\mu = \mp (\hbar \omega/c, \hbar \vec{k}) = \mp (E/c, \vec{p})$ como autovalores. Agora substituindo as autofunções $\Psi(\vec{x},t) = A e^{\pm i k_{\nu} x^{\nu}}$ na equação de Klein-Gordon, obtemos
\begin{equation}
(\partial_\mu \partial^\mu + \frac{m^2 c^2}{\hbar^2})A e^{\pm i k_{\nu} x^{\nu}} = (- k_\mu k^\mu + \frac{m^2 c^2}{\hbar^2})A e^{\pm i k_{\nu} x^{\nu}}  = 0,
\end{equation}
uma vez que 
\begin{equation}
\begin{split}
\partial_\mu \partial^\mu A e^{\pm i k_{\nu} x^{\nu}} & = \eta^{\mu \alpha} \partial_\mu \partial_\alpha A e^{\pm i k_{\nu} x^{\nu}} = \eta^{\mu \alpha} \partial_\mu (\pm i k_{\nu} \delta_{\alpha \nu})A e^{\pm i k_{\nu} x^{\nu}}\\ & = \eta^{\mu \alpha} (\pm i k_{\nu} \delta_{\mu \nu}) (\pm i k_{\nu} \delta_{\alpha \nu})A e^{\pm i k_{\nu} x^{\nu}}\\
& = \eta^{\mu \alpha}i^2 k_{\mu}k_{\alpha} A e^{\pm i k_{\nu} x^{\nu}}\\
& = - k_{\mu}k^{\mu} A e^{\pm i k_{\nu} x^{\nu}}. 
\end{split}
\end{equation}
Ou seja, $\Psi(\vec{x},t) = A e^{\pm i k_{\nu} x^{\nu}}$ é solução da equação de Klein-Gordon se
\begin{equation}
- k_\mu k^\mu + \frac{m^2 c^2}{\hbar^2} = 0
\end{equation}
é válido. Tal equação implica em $E = \pm \sqrt{p^2c^2 + m^2c^4}$. Aqui, já observamos a primeira peculiaridade ('problema') da equação de Klein-Gordon, i.e., a equação de Klein-Gordon admite soluções com energia negativa para uma partícula livre de modo que o espectro de energias possíveis para uma partícula livre é um espectro contínuo bipartido $(- \infty, -mc^2]\cup [mc^2, \infty)$. 
### Equação da Continuidade
Outra peculiaridade da equação de Klein-Gordon surge quando tentamos obter uma equação da continuidade para densidade de probabilidade, i.e., considerando a equação de Klein-Gordon e também sua equação conjugada na forma
\begin{equation}
\begin{split}
& (\nabla^2 - \frac{m^2 c^2}{\hbar^2})\Psi(\vec{x},t) = c^{-2} \partial_t^2 \Psi(\vec{x},t),\\
& (\nabla^2 - \frac{m^2 c^2}{\hbar^2})\Psi^* (\vec{x},t) = c^{-2} \partial_t^2 \Psi^* (\vec{x},t),
\end{split}
\end{equation}
e multiplicando à esquerda a equação de Klein-Gordon por $\Psi^* $, e à esquerda a equação conjugada por $\Psi$, temos
\begin{equation}
\begin{split}
& \Psi^* (\vec{x},t)\nabla^2\Psi(\vec{x},t) - \frac{m^2 c^2}{\hbar^2}\Psi^* (\vec{x},t) \Psi(\vec{x},t) = c^{-2} \Psi^* (\vec{x},t)  \partial_t^2 \Psi(\vec{x},t),\\
& \Psi(\vec{x},t) \nabla^2 \Psi^* (\vec{x},t) - \frac{m^2 c^2}{\hbar^2}\Psi (\vec{x},t) \Psi^* (\vec{x},t) =  c^{-2}\Psi (\vec{x},t) \partial_t^2 \Psi^* (\vec{x},t),
\end{split}
\end{equation}
subtraindo ambas as equações, temos
\begin{equation}
 c^2(\Psi(\vec{x},t) \nabla^2 \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \nabla^2 \Psi (\vec{x},t)) = \Psi (\vec{x},t) \partial_t^2 \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \partial_t^2 \Psi (\vec{x},t), 
\end{equation}
ou ainda,
\begin{equation}
c^2 \vec{\nabla} \cdot ( \Psi(\vec{x},t) \vec{\nabla} \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \vec{\nabla} \Psi (\vec{x},t)) = \partial_t (\Psi (\vec{x},t) \partial_t \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \partial_t \Psi (\vec{x},t)),
\end{equation}
agora, definindo
\begin{equation}
\begin{split}
& \rho(\vec{x},t)) := N c^{-2}(\Psi (\vec{x},t) \partial_t \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \partial_t \Psi (\vec{x},t)),\\
& \vec{J}(\vec{x},t)) := N (\Psi^* (\vec{x},t) \vec{\nabla} \Psi (\vec{x},t) - \Psi (\vec{x},t) \vec{\nabla} \Psi^* (\vec{x},t)), 
\end{split}
\end{equation}
onde N é uma constante de normalização, de modo que $\rho(\vec{x},t)$ tenha dimensão de probabilidade por unidade de volume (e será obtida quando considerarmos o limite não-relativístico), é possível escrever a equação da continuidade
\begin{equation}
\partial_t \rho(\vec{x},t) + \vec{\nabla} \cdot \vec{J}(\vec{x},t) = 0,
\end{equation}
com $\rho(\vec{x},t)$ sendo a densidade de probabilidade, e $\vec{J}(\vec{x},t)$ sendo a densidade de corrente de probabilidade. Tal relação exprime a conservação de probabilidade definida por $P(\vec{x},t) = \int d^3x \rho(\vec{x},t)$. Para ver isso, basta integrar a equação da continuidade num volume V de tal modo que na superfície S, que contém o volume V, a densidade de corrente $\vec{J}(\vec{x},t)$ se anula, ou seja, não fluxo de probabilidade atravessando a superfície S, o que é razoável supor, uma vez que é sempre possível considerar um volume V suficientemente grande no qual a partícula está com certeza dentro desse volume. Assim,
\begin{equation}
\int_V d^3 x \partial_t \rho(\vec{x},t) = - \int_V d^3 x \vec{\nabla} \cdot \vec{J}(\vec{x},t) = - \int_{S(V)} dS \ \vec{n} \cdot \vec{J}(\vec{x},t),
\end{equation}
onde foi usado o teorema da divergência (de Gauss) e $\vec{n}$ é um vetor unitário normal à superficie S que contem o volume V. Como, por hipótese, $\vec{n} \cdot \vec{J}(\vec{x},t) = 0$, já que não há fluxo de probabilidade para fora superfície S, temos que
\begin{equation}
\frac{d}{dt}P(\vec{x},t) = \frac{d}{dt}\int_V d^3 x  \rho(\vec{x},t) = \int_V d^3 x \partial_t \rho(\vec{x},t) = 0, 
\end{equation}
uma vez que o volume V não varia. No entanto, analisando a expressão
\begin{equation}
\rho(\vec{x},t) := N c^{-2}(\Psi (\vec{x},t) \partial_t \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \partial_t \Psi (\vec{x},t)),
\end{equation}
é possível observar que  $\rho(\vec{x},t))$ não é necessariamente  positiva definida, ou seja, sempre maior ou igual à zero, não sendo possível interpretar $P(\vec{x},t)$ como a probabilidade de encontrar a partícula no ponto $(\vec{x},t)$. Aqui é importante ressaltar que: (i) o fato da equação de Klein-Gordon admitir soluções com energia negativa é devido a relação de Einstein para energia total da partícula livre ser quadrática em E, que também leva ao segundo problema; (ii) o fato de $\rho(\vec{x},t)$ não ser positivo definido decorre da equação de Klein-Gordon conter derivada de segunda ordem no tempo;

### Limite não-relativístico
A fim de obter o limite não-relativístico (N.R.) da equação de Klein-Gordon, separemos a dependência temporal de $\Psi(\vec{x},t)$ em dois termos no qual um deles contém a energia de repouso, isto é, consideremos o ansatz $\Psi(\vec{x},t) = \phi(\vec{x},t) e^{-imc^2t/h}$. Assim, no limite N.R., a diferença da energia total E e da energia de repouso $mc^2$, e, para uma partícula livre corresponde a energia cinética, uma vez que
\begin{equation}
T = E - mc^2 = (\gamma - 1)mc^2 = ( (1 - \frac{v^2}{c^2})^{-1/2} - 1)mc^2 \approx \frac{1}{2}mv^2.
\end{equation}
Logo, a parte temporal de $\phi(\vec{x},t)$ está associada a $T$ e, portanto, podemos considerar a aproximação
\begin{equation}
|i \hbar \partial_t \phi(\vec{x},t)| \approx T \phi(\vec{x},t) << mc^2 \phi(\vec{x},t),
\end{equation}
derivando $\Psi(\vec{x},t) = \phi(\vec{x},t) e^{-imc^2t/h}$ em relação ao tempo, temos
\begin{equation}
\partial_t \Psi(\vec{x},t) = \phi(\vec{x},t) e^{-imc^2t/h} = (\partial_t \phi(\vec{x},t) - \frac{imc^2}{\hbar}\phi(\vec{x},t)) e^{-imc^2t/h} \approx - \frac{imc^2}{\hbar}\phi(\vec{x},t) e^{-imc^2t/h},
\end{equation}
derivando novamente, temos
\begin{equation}
\begin{split}
\partial^2_t \Psi(\vec{x},t) & = -\partial_t (\partial_t \phi(\vec{x},t) - \frac{imc^2}{\hbar}\phi(\vec{x},t)) e^{-imc^2t/h}\\
& \approx - ( \frac{2imc^2}{\hbar} \partial_t \phi(\vec{x},t) + \frac{m^2c^4}{\hbar^2}\phi(\vec{x},t)) e^{-imc^2t/h},
\end{split}
\end{equation}
e substituindo na equação de Klein-Gordon, temos
\begin{equation}
(\nabla^2 - \frac{m^2 c^2}{\hbar^2})\Psi(\vec{x},t) = -c^{-2}( \frac{2imc^2}{\hbar} \partial_t \phi(\vec{x},t) + \frac{m^2c^4}{\hbar^2}\phi(\vec{x},t)) e^{-imc^2t/h},
\end{equation}
como $\Psi(\vec{x},t) = \phi(\vec{x},t) e^{-imc^2t/h}$ é imediato que
\begin{equation}
\nabla^2 \phi(\vec{x},t) = - \frac{2im}{\hbar} \partial_t \phi(\vec{x},t),
\end{equation}
que nada mais é que a equação de Schrödinger para uma partícula livre não relativista. A fim de determinar a constante de normalização $N$ para densidade de probabilidade, vamos obter a equação da continuidade no limite não relativístico. Fazendo o mesmo procedimento que anteriormente
\begin{equation}
\begin{split}
& \phi^* (\vec{x},t)\nabla^2 \phi(\vec{x},t) = -\frac{2im}{\hbar} \phi^* (\vec{x},t) \partial_t \phi(\vec{x},t), \\
& \phi (\vec{x},t)\nabla^2 \phi^* (\vec{x},t) = \frac{2im}{\hbar} \phi (\vec{x},t) \partial_t \phi^* (\vec{x},t),
\end{split}
\end{equation}
subtraindo a primeira equação da segunda, temos
\begin{equation}
 \frac{\hbar}{2im} \vec{\nabla} \cdot (\phi (\vec{x},t)\vec{\nabla} \phi^* (\vec{x},t) - \phi^* (\vec{x},t)\vec{\nabla} \phi (\vec{x},t) = - \partial_t (\phi^* (\vec{x},t) \phi (\vec{x},t)),
\end{equation}
podemos identificar
\begin{equation}
\begin{split}
& \rho(\vec{x},t) = \phi^* (\vec{x},t) \phi (\vec{x},t),\\
& \vec{J}(\vec{x},t) = \frac{\hbar}{2im} (\phi^* (\vec{x},t)\vec{\nabla} \phi (\vec{x},t) - \phi (\vec{x},t)\vec{\nabla} \phi^* (\vec{x},t)),
\end{split}
\end{equation}
e como as expressões para corrente de probabilidade devem coincidir no limite N.R., é possível concluir que $N = \hbar/2im$. Ou ainda, dado que $\rho(\vec{x},t)) := N c^{-2}(\Psi (\vec{x},t) \partial_t \Psi^* (\vec{x},t) - \Psi^* (\vec{x},t) \partial_t \Psi (\vec{x},t))$, no limite N.R., temos
\begin{equation}
\begin{split}
\rho(\vec{x},t)) & = N c^{-2}(\phi(\vec{x},t) e^{-imc^2t/h} \partial_t \phi^* (\vec{x},t) e^{imc^2t/h} - \phi^* (\vec{x},t) e^{imc^2t/h}  \partial_t \phi (\vec{x},t) e^{-imc^2t/h})\\
& = N c^{-2} ( \phi(\vec{x},t) \partial_t \phi^* (\vec{x},t) - \phi^* (\vec{x},t) \partial_t \phi (\vec{x},t) + \frac{2imc^2}{\hbar} \phi(\vec{x},t)\phi^* (\vec{x},t))\\
& \approx N \frac{2im}{\hbar} \phi(\vec{x},t)\phi^* (\vec{x},t)),
\end{split}
\end{equation}
uma vez que $ \partial_t \phi \propto T \phi << mc^2 \phi$ e, portanto, $N = \frac{\hbar}{2im}$. Logo, apenas no limite N.R., é possível interpretar $\rho(\vec{x},t)$ como uma densidade de probabilidade. 

### Acoplamento mínimo e o 'Átomo de Hidrogênio'
Antes de considerarmos uma partícula descrita pela equação de Klein-Gordon em um campo eletromagnético externo, consideremos o problema mais geral de determinar o Hamiltoniano de uma partícula de massa $m$ e carga $q$ sob a ação de um campo eletromagnético externo (nessa parte de obter o acoplamento mínimo não faremos distinção entre componentes contra e covariante de um vetor). Assim, a força que age sobre tal partícula devido ao campo eletromagnético, descrito por $\vec{E}(\vec{x},t)$, $\vec{B}(\vec{x},t)$ é dado pela força de Lorentz
\begin{equation}
\vec{F} = q(\vec{E} + \vec{v} \times \vec{B}),
\end{equation}
uma vez que os campos eletromagnéticos $\vec{E}(\vec{x},t)$, $\vec{B}(\vec{x},t)$  podem ser expressados em termos do potenciais vetor e escalar $\vec{A}(\vec{x},t)$, $\phi(\vec{x},t)$  através de
\begin{equation}
\begin{split}
& \vec{E} = - \vec{\nabla} \phi - \partial_t \vec{A},\\
& \vec{B} = \vec{\nabla} \times \vec{A},
\end{split}
\end{equation}
a força de Lorentz em termos do potencial pode ser escrita como
\begin{equation}
\vec{F} = q(- \vec{\nabla} \phi - \partial_t \vec{A} + \vec{v}\times \vec{\nabla} \times \vec{A}), 
\end{equation}
mas, como a i-ésima componente de $\vec{v}\times \vec{\nabla} \times \vec{A}$ pode ser reescrita como
\begin{equation}
\begin{split}
(\vec{v}\times \vec{\nabla} \times \vec{A})_i & = \epsilon_{ijk} v_j (\vec{\nabla} \times \vec{A})_k = \epsilon_{ijk} \epsilon_{klm} v_j \nabla_l A_m = \epsilon_{kij} \epsilon_{klm} v_j \nabla_l A_m\\
& = (\delta_{il}\delta_{jm} - \delta_{im}\delta_{jl})v_j \nabla_l A_m = v_j \nabla_i A_j - v_j \nabla_j A_i\\
& = \nabla_i (v_j  A_j) - v_j \nabla_j A_i, 
\end{split}
\end{equation}
uma vez que a velocidade não depende da posição. Assim, somando sobre todas i-ésimas componentes, temos que
\begin{equation}
\vec{v}\times \vec{\nabla} \times \vec{A} = \vec{\nabla}(\vec{v} \cdot \vec{A}) - (\vec{v} \cdot \vec{\nabla}) \vec{A},
\end{equation}
e ainda, como $\vec{A} = \vec{A}(\vec{x}(t),t)$, a derivada total de $\vec{A}$ é dada por
\begin{equation}
\frac{d}{dt}\vec{A} = \frac{d}{dt} \vec{A}(\vec{x}(t),t) = \sum_{i = 1}^3 \frac{d x_i}{dt} \frac{\partial \vec{A}}{\partial x_i} + \frac{\partial \vec{A}}{\partial t} = (\vec{v} \cdot \vec{\nabla}) \vec{A} + \partial_t \vec{A},
\end{equation}
podemos reescrever a força de Lorentz como
\begin{equation}
\vec{F} = - q( \vec{\nabla}( \phi - \vec{v} \cdot \vec{A}) + \frac{d \vec{A}}{dt}), 
\end{equation}
onde tal expressão para força de Lorentz pode ser obtida a partir da Lagrangiana
\begin{equation}
L = T - U = \frac{1}{2}mv^2 - q \phi + q \vec{v} \cdot \vec{A}.
\end{equation}
Logo, a partir da Lagrangiana é possível obter o Hamiltoniano uma vez que $H = \sum_i p_i q_i - L$, onde $p_i$ é momento canonicamente conjugado da coordenada generalizada $q_i$. No nosso caso $q_i = x_i$, de modo que
\begin{equation}
p_i = \frac{\partial L}{\partial \dot{x}_i} = m \dot{x}_i + q A_i, 
\end{equation}
e, portanto,
\begin{equation}
\dot{x}_i = \frac{1}{m}(p_i - q A_i).
\end{equation}
Assim,
\begin{equation}
\begin{split}
H = & \frac{1}{m}\sum_i p_i (p_i - q A_i) - \frac{1}{2}m\sum_i \frac{1}{m^2}(p_i - q A_i)^2 + q \phi - q \sum_i \frac{1}{m}(p_i - q A_i) A_i\\
& = \frac{1}{2m}(\vec{p} - q \vec{A})^2 + q \phi,
\end{split}
\end{equation}
de modo que, em comparação com o Hamiltoniano de uma partícula livre $H = p^2/2m$, o acoplamento mínimo consiste em fazer a seguinte substituição
\begin{equation}
\begin{split}
& H \rightarrow H - q\phi, \\
& \vec{p} \rightarrow \vec{p} - q \vec{A}.
\end{split}
\end{equation}

Assim, como mencionada anteriormente, a equação de Klein-Gordon foi considerada pela primeira por Schrödinger incluindo os efeitos de um campo eletromagnético descrito pelos potenciais $\vec{A}, \phi$ a fim de estudar o espectro do átomo de Hidrogênio. Considerando a relação $E^2 = p^2c^2 + m^2c^4$, e incluindo o acoplamento mínimo, i.e., fazendo $E \rightarrow E - q\phi$, $\vec{p} \rightarrow \vec{p} - q \vec{A}$ temos
\begin{equation}
(\vec{p} - q \vec{A})^2c^2 + m^2c^4 = (E - q\phi)^2,
\end{equation}
que leva à seguinte 'equação de onda'
\begin{equation}
[(-i\hbar \vec{\nabla} - q \vec{A})^2c^2 + m^2c^4] \Psi(\vec{x},t) = (i \hbar \partial_t - q\phi)^2\Psi(\vec{x},t).
\end{equation}
Os estados estacionários (e os níveis de energia) do átomo de hidrogênio podem então ser obtidos considerando o potencial coulombiano no qual $\vec(A) = 0$ e $\phi(r) = q/4 \phi \epsilon_0 r$. Como o potencial $\phi(r)$ é independente do tempo, é possível separar a parte espacial e temporal de $\Psi(\vec{x},t)$ facilmente através  do ansatz: $\Psi(\vec{x},t) = \psi(\vec{x}) e^{-iEt/\hbar}$ de modo a obter a seguinte equação diferencial:
\begin{equation}
(-\hbar^2 \nabla^2 + m^2c^4)\psi(\vec{x}) = (E - q\phi(r))\psi(\vec{x}).
\end{equation}
Resolvendo a equação diferencial pelo método da separação de variáveis e impondo as condições de contorno, ou seja, que $\psi$ não pode divergir, obtemos a quantização da energia do sistema dada por
\begin{equation}
    E = \frac{mc^2}{\sqrt{1 + \frac{\alpha^2}{n -(l + 1/2) + \sqrt{(l + 1/2)^2 - \alpha^2}}}},
\end{equation}
onde $\alpha = q^2/4\pi \epsilon_0 \hbar c$ é a constante de estrutura fina. É possível notar que nesse caso a energia depende tanto do número quântica principal ‘n’ quanto do número quântico orbital ‘l’, diferentemente do caso não relativístico sem aproximações, onde a energia depende apenas de ‘n’, levantando assim a degenerescência. Expandindo a fórmula da energia em série de potências de, obtemos
\begin{equation}
E = mc^2 (1 - \frac{\alpha^2}{2n^2} - \frac{\alpha^4}{2n^4}(\frac{n}{l + 1/2} - 3/4) \ +  \ ...),
\end{equation}
de modo que o primeiro termo é a energia de repouso, o segundo termo é fórmula de Bohr para o átomo de hidrogênio e o terceiro termo é a correção relativística para estrutura fina que pode ser obtida por métodos perturbativos na equação de Schrödinger não relativística devido o termo $H_{rel} = - p^4/8m^3 c^2$. No entanto, a correção para estrutura fina também deve levar em conta o acoplamento spin-órbita, ou seja, a interação do momento magnético intrínseco do elétron com o campo magnético interno do átomo no referencial do elétron, o que faz com que o desdobramento dos níveis de energia sejam maiores que os observados experimentalmente. O acoplamento spin-órbita é levado em conta na teoria não relativística por métodos perturbativos e, na equação de Klein-Gordon, podemos observar que esse termo não é levado em conta, implicando que a equação de Klein-Gordon não descreve partículas de spin ½ mas sim partículas de spin 0. Por exemplo, a equação de Klein-Gordon pode ser usada para descrever o méson pi (ou píon) de modo que a expressão para os níveis de energia obtidos acima servem para descrever os níveis de energia do átomo 'píonico', onde o elétron é 'substituído' por um méson pi negativamente carregado. O fato da equação de Klein-Gordon descreverem partículas sem spin está ligado à natureza da função de onda $\Psi(\vec{x},t)$, tomada como uma função complexa de $(\vec{x},t)$,i.e., $\Psi: \mathbb{R^3} \times \mathbb{R} \to \mathbb{C}$, e portanto sem qualquer depedência possível de graus de liberdade internos, como o spin. Assim, um dos pontos centrais do trabalho de Dirac foi, de fato, generalizar essa equação para 'funções de onda' com mais de uma componente a fim de possibilitar a inclusão do spin.  

## Equação de Dirac e Partículas de spin 1/2 relativísticas

Como visto anteriormente, a fim de incluir a descrição de graus de liberdade internos como o spin do elétron é preciso, pelomenos, considerar soluções com mais de uma componente. Ao tratar dessa questão, e ainda, motivado pelos problemas da equação de Klein-Gordon - densidade de probabilidade não é positiva definida e soluções de energia negativa para partícula livre-, Dirac prôpos uma nova equação que fosse compatível com os postulados da relatividade restrita e que também descrevesse o elétron, ou seja, uma partícula de spin ½. Como as derivadas segundas na equação de Klein-Gordon levam à densidade de probabilidade não ser positiva definida enquanto que na equação de Schödinger, que é de primeira ordem no tempo, leva uma densidade de probabilidade positiva definida, Dirac propôs manter a derivada temporal em primeira ordem. Com isso, e como o tempo não é mais um parâmetro na relatividade restrita, e sim uma coordenada, assim como as coordenadas espaciais, então ambos devem estar em ‘pé’ de igualdade, ou seja, se considerarmos derivada temporal de primeira ordem, também é necessário considerar derivadas espaciais de primeira ordem.

Dado que
\begin{equation}
H \Psi(\vec{x},t) = i \hbar \partial_t \Psi(\vec{x},t),
\end{equation}
Dirac supôs um Hamiltoniano linear do tipo 
\begin{equation}
H = c \vec{\alpha} \cdot \vec{p} + \beta mc^2,
\end{equation}
i.e., uma combinação linear de derivadas espaciais de primeira ordem, onde $\vec{\alpha},\beta$, são os coeficientes da combinação a determinar, de modo que o Hamiltoneano deve satisfazer a relação de Einstein
\begin{equation}
H^2 = E^2 = p^2c^2 + m^2c^4.
\end{equation}
Assim, podemos observar que
\begin{equation}
H^2\Psi(\vec{x},t) = H(H \Psi(\vec{x},t)) = i \hbar \partial_t(i \hbar \partial_t \Psi(\vec{x},t)) = - \hbar^2 \partial^2_t \Psi(\vec{x},t),
\end{equation}
de modo que
\begin{equation}
(p^2c^2 + m^2c^4)\Psi(\vec{x},t) = - \hbar^2 \partial^2_t \Psi(\vec{x},t)
\end{equation}
implicando na equação de Klein-Gordon, como vimos anteriormente. Ou seja, $\Psi(\vec{x},t)$ também deve satisfazer a equação de Klein-Gordon de modo que tal condição funciona como um filtro que seleciona uma classe particular entre o conjunto de soluções da equação de Klein-Gordon, pois, como veremos, $\Psi(\vec{x},t)$ também terá que satisfazer a equação de Dirac. Em última análise, o fato de: $H$ satisfazer a relação de Einstein; e $\Psi(\vec{x},t)$, a equação de Klein-Gordon; impõe restrições sobre os coeficientes $\vec{\alpha}, \beta$, ajudando a determiná-los. Logo, impondo que
\begin{equation}
H^2 = (c \vec{\alpha} \cdot \vec{p} + \beta mc^2)(c \vec{\alpha} \cdot \vec{p} + \beta mc^2) = p^2c^2 + m^2c^4 =  E^2,
\end{equation}
e fazendo algumas manipulações algébricas
\begin{equation}
c^2( \vec{\alpha} \cdot \vec{p} )( \vec{\alpha} \cdot \vec{p} ) + (\vec{\alpha} \cdot \vec{p}) \beta mc^3 + \beta (\vec{\alpha} \cdot \vec{p}) mc^3 + \beta^2 m^2 c^4 =  p^2c^2 + m^2c^4,
\end{equation}
notando que
\begin{align}
( \vec{\alpha} \cdot \vec{p} )( \vec{\alpha} \cdot \vec{p} ) & = \sum_i \alpha_i p_i \sum_j \alpha_j p_j = \sum_{i,j} \alpha_i \alpha_j p_i p_j = \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j (p_i p_j + p_j p_i) \\
& = \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j p_i p_j + \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j p_j p_i
\end{align}
onde usamos o fato de que $[p_i,p_j] = 0$. Agora, como ambos os índices são mudos (ou seja, estão sendo somados), é possível renomeá-los:
\begin{align}
( \vec{\alpha} \cdot \vec{p} )( \vec{\alpha} \cdot \vec{p} ) & = \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j p_i p_j + \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j p_j p_i = \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j p_i p_j + \frac{1}{2} \sum_{i,j} \alpha_j \alpha_i p_i p_ij\\
& = \frac{1}{2} \sum_{i,j}( \alpha_i \alpha_j + \alpha_j \alpha_i) p_i p_j, 
\end{align}
portanto, em notação indicial (e usando a convenção de Einstein), podemos escrever
\begin{equation}
 \frac{1}{2}( \alpha_i \alpha_j + \alpha_j \alpha_i) p_i p_j c^2 + (\alpha_i \beta + \beta \alpha_i) p_i mc^3 + \beta^2 m^2 c^4 = p^2c^2 + m^2c^4,
\end{equation}
o que implica em
\begin{align}
& (i) \ \alpha_i \alpha_j + \alpha_j \alpha_i = 2\delta_{ij},\\
& (ii) \ \alpha_i \beta + \beta \alpha_i = 0,\\
& (iii) \ \beta^2 = 1,
\end{align}
no entanto, até agora não foi falado nada sobre a natureza dos coeficientes. Isto é, se eles são números, matrizes, operados diferencias, funções, etc. Como a proposta de Dirac é obter uma equação diferencial de 1ª ordem, tais coeficientes não podem ser operados diferenciais pois levaria a equação de Dirac ser uma equação diferencial de 2ª ordem. Os coeficientes também não podem funções espaciais, pois para uma partícula livre, a sua energia independe do espaço e do tempo e, portanto, H é invariante frente a translações espaço-temporais. E ainda, pela 1ª e 2ª condição, não podem ser números pois números não anticomutam. Assim, uma representação possível para $\vec{\alpha}, \beta$ é em termos de matrizes. Assim, devemos reescrever as condições para levar em conta a natureza matricial dos coeficientes:
\begin{align}
& (i) \ \alpha_i \alpha_j + \alpha_j \alpha_i = 2\delta_{ij} I,\\
& (ii) \ \alpha_i \beta + \beta \alpha_i = \mathbb{0},\\
& (iii) \ \beta^2 = I,
\end{align}
onde $I$ é matriz identidade em alguma dimensão à determinar e $\mathbb{0}$ é matriz nula. Mas que tipo de matrizes são esses coeficientes?

A partir da condição (ii), temos que $\alpha_i \beta = - \beta \alpha_i$, ou seja,
\begin{equation}
    \alpha_i = - \beta \alpha_i \beta,
\end{equation}
tomando o traço da equação acima, temos que
\begin{equation}
    Tr(\alpha_i) = - Tr(\beta \alpha_i \beta) = Tr(\beta^{2} \alpha_i) = - Tr(\alpha_i),
\end{equation}
onde usamos a propriedade de ciclicidade do traço e o fato de que $\beta^2 = I$. A partir da equação acima, é possível concluir que $Tr(\alpha_i) = 0$. Analogamente, isolando $\beta$ a partir da condição (ii) e tomando o traço, obtém-se que $Tr(\beta) = 0$. A fim de garantir a hermiticidade de $H$, é necessário que $\alpha_{i}^{\dagger} = \alpha_{i}$ e $\beta^{\dagger} = \beta$. Assim, $\alpha_i, \beta$ são matrizes de traço nulo e hermitianas e, portanto, podem ser diagonalizadas. Ademais, como $\alpha_{i}^{2} = \beta^{2} = I$, seus autovalores devem ser $\pm 1$. 

Agora, voltando à $\alpha_i \beta = - \beta \alpha_i$ e tomando o determinante,
\begin{equation}
\begin{split}
    det(\alpha_i \beta) & = det(-\beta \alpha_i) = det(-\beta)det(\alpha_i) = (-1)^{n}det(\beta)det(\alpha_i)\\
    & = (-1)^{n}det(\alpha_i)det(\beta),
\end{split}
\end{equation}
onde usamos o fato de que
\begin{equation}
\begin{split}
    det(-\beta) & =\sum_{j_1...j_n}sgn(j_1,...,j_n)(-\beta)_{1,j_1}...(-\beta)_{n,j_n} \\
    & = \sum_{j_1...j_n}sgn(j_1,...,j_n) (-1)\beta_{1,j_1}...(-1)\beta_{n,j_n}\\
    & = (-1)^{n}\sum_{j_1...j_n}sgn(j_1,...,j_n) \beta_{1,j_1}...\beta_{n,j_n}\\
    & = (-1)^{n}det(\beta),
\end{split}
\end{equation}
com $n$ sendo o numero de linhas (e colunas) que ainda falta determina. Dado que $det(\alpha_i \beta) = det(\alpha_i)det(\beta)$, temos que 
\begin{equation}
    det(\alpha_i)det(\beta) = (-1)^{n}det(\alpha_i)det(\beta),
\end{equation}
ou seja, para tal igualdade se manter válida é necessário que $n$ seja um número par. Logo a dimensão das matrizes $\alpha_i, \beta$ é par. O que é razoável, pois, na forma diagonal, os elementos da diagonal assumem apenas valores $\pm 1$ e como $Tr(\alpha_i) = Tr(\beta) = 0$, isto implica que deve a haver o mesmo número de autovalores igual a 1 e igual a -1. 

Usando como guia norteador a navalha de Occam, começemos com a dimensão par mais baixa, ou seja, n = 2. Considerando que $\alpha_i, \beta$ são matrizes hermitianas e lembrando que, em n = 2, já conhecemos uma base de matrizes hermitianas, isto é, $\{I,\vec{\sigma}\} $, onde $I$ é a identidade e ${\vec{\sigma}}$ são as matrizes de Pauli. Logo, qualquer matriz (ou conjunto de matrizes) pode ser expressa em termos de $\{I,\vec{\sigma}\} $. Em particular, as matrizes $\alpha_i, \beta$ poderiam ser expressas em termos de $\{I,\vec{\sigma}\}$. No entanto, $Tr(I) \neq 0$ e $\sigma_0$ comuta com qualquer $\sigma_i$, não satisfazendo as condições obtidas anteriormente. Logo, não existe um conjunto de matrizes hermitianas de traço nulo que satisfaça as condições obtidas anteriormente. 

Assim, a próxima dimensão par possível no qual poderíamos construir $\alpha_i, \beta$ é n = 4. E ainda, é possível usar $\{I,\vec{\sigma}\}$ para construí-las uma vez que 
 \begin{equation}
\begin{split}
    & Tr(\sigma_i) = 0 \\
    & \sigma_i \sigma_j  + \sigma_j \sigma_i = \mathbb{0}.
\end{split}     
\end{equation}
Sendo assim, uma representação possível para $\alpha_i, \beta$ que satisfaz as condições (i), (ii) e (iii) é 
\begin{equation}
   \alpha_i = \left( \begin{array}{cc}
\mathbb{0} & \sigma_i \\
\sigma_i & \mathbb{0} \\
\end{array}  
\right) \ \ \ \ \ \ \ \ \beta = \left( \begin{array}{cc}
I & \mathbb{0} \\
\mathbb{0} & - I \\
\end{array}  
\right).
\end{equation}
Isto implica que $\Psi$ é um objeto de 4 componentes (em Teoria Quântica de Campos, $\Psi$ é interpretado como um campo spinorial com 4 componentes) de modo que a equação de Dirac para o elétron livre é um conjunto de equação diferenciais parciais de 1ª ordem e acopladas: 
\begin{equation}
    (-i\hbar c\alpha_i \partial_i + \beta mc^2)\Psi(\vec{x},t) = i\hbar \partial_t \Psi(\vec{x},t),
\end{equation}
com
\begin{equation}
\Psi(\vec{x},t) = \left( \begin{array}{c}
\psi_1 (\vec{x},t) \\
\psi_2 (\vec{x},t) \\
\psi_3 (\vec{x},t) \\
\psi_4 (\vec{x},t) \\
\end{array} 
\right).
\end{equation}

### Forma Covariante da Equação de Dirac
A fim de escrever a equação de Dirac na forma covariante, multipliquemos a equação
\begin{equation}
    (-i\hbar c\alpha_i \partial_i + \beta mc^2)\Psi(\vec{x},t) = i\hbar \partial_t \Psi(\vec{x},t)
\end{equation}
por $\beta/c$:
\begin{equation}
    (-i\hbar \beta \alpha_i \partial_i + \beta^2 mc)\Psi(\vec{x},t) = i\hbar \beta \frac{\partial}{\partial(ct)} \Psi(\vec{x},t),
\end{equation}
isto é,
\begin{equation}
    i\Big(\beta \partial_0 + \beta \alpha_i \partial_i - I\frac{mc}{\hbar}\Big)\Psi(\vec{x},t) = 0.
\end{equation}
definindo 
\begin{equation}
    \gamma^0 = \beta = \left( \begin{array}{cc}
I & \mathbb{0} \\
\mathbb{0} & - I \\
\end{array} \right) \ \ \ \ \ \ \  \gamma^i = \beta \sigma_i = \left( \begin{array}{cc}
\mathbb{0} & \sigma_i \\
- \sigma_i & \mathbb{0} \\
\end{array}  
\right),
\end{equation}
onde $\gamma^{\mu} = \{\gamma^0,\gamma^i\}$ são denominadas de matrizes $\gamma^{\mu}$ de Dirac (tal representação das matrizes gama não é única), e assim podemos escrever a equação de Dirac na forma 
\begin{equation}
    (i\gamma^{\mu}\partial_{\mu} - \frac{mc}{\hbar})\Psi = 0,
\end{equation}
onde está ímplicito que $\frac{mc}{\hbar} := \frac{mc}{\hbar}I$. As condições (i), (ii) e (iii) para as matrizes $\vec{\alpha}, \beta$ podem ser escritas como
\begin{equation}
\{\gamma^{\mu}, \gamma^{\nu}\} = 2\eta^{\mu \nu} I,
\end{equation}
onde $\{\gamma^{\mu}, \gamma^{\nu}\} = \gamma^{\mu}\gamma^{\nu} + \gamma^{\nu}\gamma^{\mu}$ é o anticomutador.
Há um teorema (denominado de teorema fundamental de Pauli) que afirma o seguinte: Se $\{\gamma^\mu\}_{\mu = 0}^2, \{\gamma'^\mu\}_{\mu = 0}^2$ são dois conjuntos que satisfazem a álgebra de Clifford (ou seja, que satisfaz a equaçação acima), então ambas as representações estão ligadas por uma transformação de similaridade, ou seja, $ \gamma'^\mu = S \gamma^\mu S^{-1}$, onde $S$ é uma matriz não-singular ($\det S \neq 0$). Para mais informações: 'W. Pauli, Mathematical contributions to the theory of Dirac's matrices, Ann. Inst. H. Poincare Phys.Theor. 6 (1936) 109-136' ou 'R. H. Good, Properties of the Dirac Matrices, Rev. Mod. Phys. 27, 187 (1955)'. Assim, se $\Psi'$ é solução da equação de Dirac, i.e.,
\begin{align}
(i \gamma'^{\mu} \partial_{\mu} - \frac{mc}{\hbar}) \Psi' = 0,
\end{align}
então,
\begin{align}
& (i S\gamma^{\mu}S^{-1} \partial_{\mu} - \frac{mc}{\hbar}S S^{-1}) \Psi' = 0 \\
& S (i\gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar})S^{-1} \Psi' = 0 \\
& (i\gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar})S^{-1} \Psi' = 0 \\
& (i\gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar})\Psi = 0,
\end{align}
onde $\Psi = S^{-1} \Psi'$ também é solução da equação de Dirac. Logo, as diferentes representações das matrizes $\gamma^{\mu}$ são equivalentes, e corresponde a uma mudança de base (ou de sistem de referência).


### Equação da Continuidade

A fim de obter a equação da continuidade na forma covariante, é necessário definir
\begin{equation}
\bar{\Psi} := \Psi^{\dagger} \gamma^0 = \left( \begin{array}{cccc}
\psi^*_1 (\vec{x},t) & \psi^*_2 (\vec{x},t) & - \psi^*_3 (\vec{x},t) & - \psi^*_4 (\vec{x},t)\\
\end{array} 
\right).
\end{equation}
Agora, considerando a equação de Dirac na forma covariante
\begin{equation}
(i \gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar}) \Psi = 0,
\end{equation}
e tomando o hermitiano conjugado dessa equação, temos
\begin{equation}
\Psi^{\dagger}(-i (\gamma^{\mu})^{\dagger} \overleftarrow{\partial_{\mu}} - \frac{mc}{\hbar}) = 0,
\end{equation}
onde $\overleftarrow{\partial_{\mu}}$ atua à esquerda. Usando o fato de que $\gamma^0 \gamma^{\mu} \gamma^0 = (\gamma^{\mu})^{\dagger} $, i.e., $ \gamma^0 \gamma^{0} \gamma^0 = \gamma^{0} = (\gamma^{0})^{\dagger} $ e 
\begin{align}
 \gamma^0 \gamma^{i} \gamma^0 = \left( \begin{array}{cc}
I & \mathbb{0} \\
\mathbb{0} & - I \\
\end{array} \right) \left( \begin{array}{cc}
\mathbb{0} & \sigma_i \\
- \sigma_i & \mathbb{0} \\
\end{array}  
\right)\left( \begin{array}{cc}
I & \mathbb{0} \\
\mathbb{0} & - I \\
\end{array} \right) = \left( \begin{array}{cc}
\mathbb{0} & - \sigma_i \\
\sigma_i & \mathbb{0} \\
\end{array}\right) = (\gamma^i)^{\dagger}, \ \ \ i = 1, 2, 3,
\end{align}
sendo possível observar que $(\gamma^i)^{\dagger} = - \gamma^i$ para $ i = 1, 2, 3$. Assim, temos que
\begin{equation}
\Psi^{\dagger}(i \gamma^0 \gamma^{\mu} \gamma^0 \overleftarrow{\partial_{\mu}} + (\gamma^{0})^2\frac{mc}{\hbar}) = 0,
\end{equation}
ou seja,
\begin{equation}
\Psi^{\dagger} \gamma^0 (i \gamma^{\mu} \overleftarrow{\partial_{\mu}} + \frac{mc}{\hbar})\gamma^0 = 0,
\end{equation}
multiplicando pela direita por $\gamma^0$ e usando o fato de que $(\gamma^0)^2 = I$, temos
\begin{equation}
\bar{\Psi} (i \gamma^{\mu} \overleftarrow{\partial_{\mu}} + \frac{mc}{\hbar}) = 0,
\end{equation}
fazendo o papel análogo à equação conjugada de Klein-Gordon. Assim, seguindo o mesmo procedimento, multipliquemos a equação acima por $\Psi$ à direita, e a equação de Dirac por $\bar{\Psi}$ de modo que somando as duas obtemos
\begin{align}
& \bar{\Psi} (i \gamma^{\mu} \overleftarrow{\partial_{\mu}} + \frac{mc}{\hbar})\Psi + \bar{\Psi} (i \gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar})\Psi = 0,\\
& i( \bar{\Psi}\gamma^{\mu} \overleftarrow{\partial_{\mu}} \Psi + \bar{\Psi} \gamma^{\mu} \partial_{\mu} \Psi) = 0,\\
& (\partial_{\mu}\bar{\Psi})\gamma^{\mu}\Psi + \bar{\Psi} \gamma^{\mu} \partial_{\mu} \Psi = 0,\\
& \partial_{\mu}(\bar{\Psi}\gamma^{\mu}\Psi) = 0,
\end{align}
definindo $J^{\mu} :=\bar{\Psi}\gamma^{\mu}\Psi$ como a quadri-corrente de probabilidade, então $ \partial_\mu J^{\mu} = 0$ representa a equação da continuidade na forma covariante. Como podemos ver
\begin{align}
& J^0 = \bar{\Psi}\gamma^{0}\Psi = \Psi^{\dagger} \gamma^0 \gamma^0 \Psi = \Psi^{\dagger} \Psi,\\ 
& \vec{J} = \bar{\Psi}\vec{\gamma}\Psi = \Psi^{\dagger} \gamma^0 \vec{\gamma}\Psi = \Psi^{\dagger} \vec{\alpha} \Psi,
\end{align}
sendo possível observar que $J^0 = \Psi^{\dagger} \Psi = \sum_{i = 1}^4 |\psi_i|^2 \ge 0$, e, portanto, sendo possível interpretar $J^0$ como uma densidade de probabilidade, diferentemente da equação de Klein-Gordon.

### Spin 
 O Hamiltoneano não-relativístico de uma partícula livre com spin é dado por
 \begin{equation}
 H_{nr} = \frac{p^2}{2m} \otimes I_S,
 \end{equation}
 uma vez que o spin é um grau de liberdade interno da partícula, ou seja, se fossemos descrever o estado de uma partícula livre (não relativística) com spin, teríamos $|\Psi \rangle = |\psi \rangle \otimes | \xi \rangle$, onde $| \xi \rangle$ descreve o estado de spin da partícula. Já, na base da posição, teríamos 
\begin{equation}
|\Psi \rangle = \int d^3x \psi(\vec{x}) |\xi \rangle \otimes |\vec{x} \rangle, 
\end{equation}
de modo que $p^2/2m$ atua sobre a 'função de onda'  $\psi(\vec{x})$ enquanto que $I_S$ atua em $\xi$. Assim, tanto o momento angular intrínseco (spin) $\vec{S}$ quanto o momento angular orbital $\vec{L}$ comutam com $H_{nr}$. Já, para o Hamiltoneano de Dirac, podemos ver que
\begin{align}
[L_i, H] & = [\epsilon_{ijk} x_j p_k, c \alpha_l p_l + \beta mc^2] = c \epsilon_{ijk} \alpha_l [x_j p_k, p_l]\\
& = c \epsilon_{ijk} \alpha_l [x_j, p_l] p_k = \epsilon_{ijk} c \alpha_l (i \hbar \delta_{jl}) p_k\\
& = i \hbar c \epsilon_{ijk}  \alpha_j p_k, 
\end{align}
ou seja, $[\vec{L}, H] = i \hbar c \vec{\alpha} \times \vec{p}$, e portanto, $\vec{L}$ e $L^2$ não comutam com o $H$ de Dirac. Outro problema é que é necessário definir matrizes $4 \times 4$ representam o spin da partícula relativística, em analogia à $\vec{S} = \frac{1}{2}\hbar \vec{\sigma}$. Para isso, seja
\begin{equation}
\Sigma_i := \left( \begin{array}{cc}
\sigma_i & \mathbb{0} \\
\mathbb{0} & \sigma_i \\
\end{array}  
\right),
\end{equation}
e notemos que
\begin{align}
\Sigma_i \Sigma_j & = \left( \begin{array}{cc}
\sigma_i & \mathbb{0} \\
\mathbb{0} & \sigma_i \\
\end{array}  
\right) \left( \begin{array}{cc}
\sigma_j & \mathbb{0} \\
\mathbb{0} & \sigma_j \\
\end{array}  
\right) = \left( \begin{array}{cc}
\sigma_i \sigma_j & \mathbb{0} \\
\mathbb{0} & \sigma_i \sigma_j \\
\end{array}  
\right) \\
& = \left( \begin{array}{cc}
I \delta_{ij} + i \epsilon_{ijk} \sigma_k & \mathbb{0} \\
\mathbb{0} & I \delta_{ij} + i \epsilon_{ijk} \sigma_k \\
\end{array}  
\right)\\
& = \delta_{ij} I + i \epsilon_{ijk} \Sigma_k,
\end{align}
e, portanto, $[\Sigma_i, \Sigma_j] = 2i \epsilon_{ijk} \Sigma_k$. Logo, o conjunto de matrizes $\frac{1}{2} \Sigma_i$, $i = 1, 2, 3$, satisfaz a álgebra do momento angular (álgebra de Lie), sendo possível toma-lás como a generalização das matrizes de Pauli. Além do mais, notemos que
\begin{align}
[\Sigma_i, \alpha_j] & = \left( \begin{array}{cc}
\sigma_i & \mathbb{0} \\
\mathbb{0} & \sigma_i \\
\end{array} \right) \left( \begin{array}{cc}
\mathbb{0} & \sigma_j \\
\sigma_j & \mathbb{0} \\
\end{array} \right) - \left( \begin{array}{cc}
\mathbb{0} & \sigma_j \\
\sigma_j & \mathbb{0} \\
\end{array} \right) \left( \begin{array}{cc}
\sigma_i & \mathbb{0} \\
\mathbb{0} & \sigma_i \\
\end{array} \right) \\
& = \left( \begin{array}{cc}
\mathbb{0} & \sigma_i \sigma_j \\
\sigma_i \sigma_j & \mathbb{0} \\
\end{array} \right) - \left( \begin{array}{cc}
\mathbb{0} & \sigma_j \sigma_i \\
\sigma_j \sigma_i & \mathbb{0} \\
\end{array} \right)\\
& = \left( \begin{array}{cc}
\mathbb{0} & [\sigma_i,\sigma_j] \\
[\sigma_i,\sigma_j] & \mathbb{0} \\
\end{array} \right) \\
& = 2i\epsilon_{ijk} \left( \begin{array}{cc}
\mathbb{0} & \sigma_k \\
\sigma_k & \mathbb{0} \\
\end{array} \right)\\
& = 2i\epsilon_{ijk} \alpha_k,
\end{align}    
e, também, $[\Sigma_i, \beta] = 0$. Assim, podemos ver que
\begin{align}
[\Sigma_i, H] & = [\Sigma_i, c\alpha_l p_l + \beta mc^2] = c [\Sigma_i, \alpha_l] p_l \\
& = 2i\epsilon_{ilm} \alpha_m p_l = -2i\epsilon_{iml} \alpha_m p_l\\
& = -2i\epsilon_{ijk} \alpha_j p_k,
\end{align}
onde, na última passagem, usamos o fato dos índices $m,l$ estarem sendo somados e portanto podem ser renomeados. Logo, 

\begin{align}
[\vec{L} + \frac{\hbar}{2} \vec{\Sigma}, H] & = [\vec{L}, H] + \frac{\hbar}{2} [\vec{\Sigma}, H]\\
& = i \hbar c \vec{\alpha} \times \vec{p} - i \hbar c \vec{\alpha} \times \vec{p}\\
& = 0,
\end{align}
e, portanto, o operador $\vec{J} := \vec{L}  + \frac{\hbar}{2} \vec{\Sigma} = \vec{L} + \vec{S}$ é compatível com $H$, sendo possível identificar $\vec{J}$ como o momento angular total da partícula de Dirac, fornecendo duas constantes de movimentos, $J^2, J_3$. Finalmente, podemos ver que a equação de Dirac descreve partículas com spin $1/2$ dado que
\begin{equation}
S_3 = \frac{1}{2}\hbar \left( \begin{array}{cc}
\sigma_3 & \mathbb{0} \\
\mathbb{0} & \sigma_3 \\
\end{array} \right), 
\end{equation}
possui dois autovalores duplamente degenerados: $\pm \frac{1}{2} \hbar$. E, também,
\begin{align}
 S^2 & = \vec{S} \cdot \vec{S} = \frac{\hbar^2}{4} (\Sigma^2_1 + \Sigma^2_2 + \Sigma^2_3)\\
 & = \frac{3}{4} \hbar^2 I = \hbar^2 \frac{1}{2}(\frac{1}{2} + 1) I,
\end{align}
em analogia com os autovalores de $S^2$: $S^2 |m_s \rangle = s(s + 1) \hbar^2 |m_s \rangle$, sendo possível concluir que $s = 1/2$.  
### Limite não-Relativístico da Equação de Dirac em um Potencial Externo
Como vimos anteriormente, o acoplamento de uma partícula carregada a um campo eletromagnético externo é dado através do que é convencionalmente conhecido como o acoplamento mínimo. Nesta seção, veremos outro importante triunfo da equação de Dirac, isto é, o fato de que ela nos dá a razão giromagnética correta, $g = 2$, para o elétron, e também, a forma correta do acoplamento spin-órbita incluindo o fator de correção $1/2$ devido a precessão de Thomas. Assim, dado  
\begin{equation}
\begin{split}
& H \rightarrow H - q\phi, \\
& \vec{p} \rightarrow \vec{p} - q \vec{A}.
\end{split}
\end{equation}
o hamiltoniano da equação de Dirac é dado por
\begin{align}
    H = c \vec{\alpha} \cdot \vec{p} - cq \vec{\alpha} \cdot \vec{A} + \beta mc^2 + q \phi. 
\end{align}
e, portanto, a equação de Dirac fica
\begin{equation}
    i \hbar \partial_t \left( \begin{array}{c} \varphi \\ \chi  \end{array} \right) = (c \vec{\alpha} \cdot \vec{p} - cq \vec{\alpha} \cdot \vec{A} + \beta mc^2 + q \phi)\left( \begin{array}{c} \varphi \\ \chi  \end{array} \right),
\end{equation}
onde escrevemos $\Psi (\vec{x},t)$ em termos de objetos de duas componentes cada
lembrando que 
\begin{equation}
   \alpha_i = \left( \begin{array}{cc}
\mathbb{O} & \sigma_i \\
\sigma_i & \mathbb{O} \\
\end{array}  
\right) \ \ \ \ \ \ \ \ \beta = \left( \begin{array}{cc}
I & \mathbb{O} \\
\mathbb{O} & - I \\
\end{array}  
\right).
\end{equation}
podemos escrever a equação de Dirac como
\begin{equation}
    i \hbar  \left( \begin{array}{c}\partial_t \varphi \\ \partial_t \chi  \end{array} \right) = \left( \begin{array}{cc}
(mc^2 + q \phi) I &  c \vec{\sigma} \cdot (\vec{p} - q \vec{A}) \\
c \vec{\sigma} \cdot (\vec{p} - q \vec{A}) & (-mc^2 + q \phi) I \\
\end{array} \right) \left( \begin{array}{c} \varphi \\  \chi  \end{array} \right), 
\end{equation}
sendo equivalente ao seguinte conjunto de E.D. acopladas de primeira ordem
\begin{align}
    & i \hbar \partial_t \varphi = c \vec{\sigma} \cdot (\vec{p} - q \vec{A}) \chi + (mc^2 + q \phi) \varphi \label{eq:psi}, \\
    & i \hbar \partial_t \chi = c \vec{\sigma} \cdot (\vec{p} - q \vec{A}) \varphi + (-mc^2 + q \phi) \chi \label{eq:chi},
\end{align}
explicitando a dependência temporal de $\varphi, \chi$ em termos da energia de repouso como feito anteriormente no limite NR da equação de Klein-Gordon, ou seja, 
\begin{align}
    & \varphi(\vec{x},t) = \psi(\vec{x},t)e^{-imc^2t/h}\\
    & \chi(\vec{x},t) = \xi(\vec{x},t)e^{-imc^2t/h}
\end{align}
de modo que $\psi(\vec{x},t), \xi(\vec{x},t)$ são funções que variam lentamente com o tempo, ou seja, $\partial_t \xi(\vec{x},t) \approx 0$. Uma vez que estão associados ao termo de energia cinética da partícula, que, no limite NR, é muito menor que a energia de repouso. Assim, a equação diferencial para $\xi$ pode ser reescrita como
\begin{equation}
    i\hbar \Big( - \frac{imc^2}{\hbar} e^{-imc^2t/h} \xi + e^{-imc^2t/h} \partial_t \xi \Big) =  c \vec{\sigma} \cdot (\vec{p} - q \vec{A})\psi e^{-imc^2t/h} + (-mc^2 + q \phi)\xi e^{-imc^2t/h},
\end{equation}
ou ainda,
\begin{equation}
    i \hbar \partial_t \xi =  c \vec{\sigma} \cdot (\vec{p} - q \vec{A})\psi + (-2mc^2 + q \phi)\xi \approx 0,
\end{equation}
sendo possível escrever a componente $xi$ em termos $\psi$ uma vez que $(-2mc^2 + q \phi)$ é um escalar:
\begin{equation}
    \xi \approx \frac{c \vec{\sigma} \cdot (\vec{p} - q \vec{A})}{2mc^2 - q \phi} \psi \approx \frac{c \vec{\sigma} \cdot (\vec{p} - q \vec{A})}{2mc^2} \psi \label{eq:xi},
\end{equation}
já que no limite não-relativístico, a energia de repouso é dominante frente à energia cinética e potencial. Como $\vec{p} \approx m \vec{v}$ é possível ver que
\begin{equation}
    \xi = \mathcal{O}(\frac{v}{c}) \psi ,
\end{equation}
ou seja, $\xi << \psi$. Assim, $\chi$ também é chamado de componente 'menor' de $\Psi$, de modo que, no limite NR, $\Psi$ se reduz a uma função de 2 componentes (spinor de 2 componentes). Substituindo a expressão de $\xi$, em termos de $\psi$, na equação diferencial para $\psi$, temos
\begin{align}
    i \hbar\Big(-\frac{imc^2}{\hbar} \phi + \partial_t \phi \Big)e^{-imc^2t/h} = \frac{1}{2m} [\vec{\sigma} \cdot (\vec{p} - q \vec{A})]^2 \psi e^{-imc^2t/h} + (mc^2 + q \phi) \psi e^{-imc^2t/h},
\end{align}
ou seja,
\begin{align}
i \hbar \partial_t \psi = \frac{1}{2m}[\vec{\sigma} \cdot (\vec{p} - q \vec{A})]^2 \psi + q \phi \psi.    
\end{align}
Ainda, dado que
\begin{align}
    (\vec{\sigma} \cdot \vec{a}) (\vec{\sigma} \cdot \vec{b}) & = \sigma_i a_i \sigma_j b_j = \sigma_i \sigma_j a_i b_j\\
    & = (\delta_{ij}I + i \epsilon_{ijk} \sigma_k) a_i b_j\\
    & = a_i b_j \delta_{ij} I + i \sigma_k  \epsilon_{kij} a_i b_j\\
    & = (\vec{a}\cdot \vec{b}) I + i \sigma_k (\vec{a} \times \vec{b})_k\\
    & = (\vec{a}\cdot \vec{b}) I + i \vec{\sigma} \cdot (\vec{a} \times \vec{b}),
\end{align}
é possível reescrever
\begin{align}
    [\vec{\sigma} \cdot (\vec{p} - q \vec{A})]^2 & = (\vec{p} - q \vec{A})^2 + i \vec{\sigma} \cdot (\vec{p} - q \vec{A}) \times (\vec{p} - q \vec{A})\\
    & = (\vec{p} - q \vec{A})^2 + i\vec{\sigma} \cdot \Big(\vec{p} \times \vec{p} - q(\vec{p}\times \vec{A} + \vec{A} \times \vec{p}) + q^2 \vec{A} \times \vec{A} \Big)\\
    & = (\vec{p} - q \vec{A})^2 - iq\vec{\sigma} \cdot(\vec{p}\times \vec{A} + \vec{A} \times \vec{p}).
\end{align}
Lembrando $[\vec{\sigma} \cdot (\vec{p} - q \vec{A})]^2$ está atuando em $\psi$, então 
\begin{align}
    (\vec{p} - q \vec{A}) \times (\vec{p} - q \vec{A}) \psi & = -q(\vec{p}\times \vec{A} + \vec{A} \times \vec{p})\psi \\
    & = i\hbar q (\vec{\nabla}\times \vec{A} + \vec{A} \times \vec{\nabla})\psi\\
    & = i\hbar q (\vec{\nabla}\times (\vec{A}\psi) + \vec{A} \times \vec{\nabla} \psi),
\end{align}
onde
\begin{align}
    \vec{\nabla}\times (\vec{A}\psi) & = \epsilon_{ijk} \nabla_j A_k \psi = \psi \epsilon_{ijk} \nabla_j A_k + \epsilon_{ijk} A_k \nabla_j \psi \\
    & = \psi \vec{\nabla} \times \vec{A} - \epsilon_{ikj}A_k \nabla_j \psi \\
    & = \psi \vec{\nabla} \times \vec{A} - \vec{A}\times \vec{\nabla}\psi,
\end{align}
de modo que 
\begin{align}
    (\vec{p} - q \vec{A}) \times (\vec{p} - q \vec{A}) \psi & = i\hbar q (\psi \vec{\nabla} \times \vec{A} - \vec{A}\times \vec{\nabla}\psi + \vec{A} \times \vec{\nabla} \psi)\\
    & = i\hbar q (\vec{\nabla} \times \vec{A}) \psi\\
    & = i\hbar q \vec{B} \psi.
\end{align}
Portanto,
\begin{align}
    [\vec{\sigma} \cdot (\vec{p} - q \vec{A})]^2 = (\vec{p} - q \vec{A})^2 - \hbar q (\vec{\sigma} \cdot \vec{B}),
\end{align}
e a equação de Dirac no limite NR se reduz à
\begin{equation}
    i \hbar \partial_t \psi = \frac{1}{2m}(\vec{p} - q \vec{A})^2  \psi - \frac{q \hbar}{2m}(\vec{\sigma} \cdot \vec{B}) \psi + q \phi \psi,
\end{equation}
que é a equação de Pauli (ou Pauli-Schrödinger) para uma partícula de spin-1/2 em um campo eletrogmanético externo. Ademais, o segundo termo do lado direito da equação  nos dá a razão giromagnética correta, $g = 2$, uma vez que o momento magnético intrínseco do elétron é dado por 
\begin{equation}
    \vec{\mu}_e = \frac{gq}{2m} \vec{S},
\end{equation}
e portanto,
\begin{align}
    - \frac{q \hbar}{2m}(\vec{\sigma} \cdot \vec{B}) \psi = - \frac{2q \hbar}{4m}(\vec{\sigma} \cdot \vec{B}) \psi = - \frac{gq}{2m}(\vec{S} \cdot B) \psi  = - (\vec{\mu}_e \cdot \vec{B}) \psi,
\end{align}
representando o termo de interação entre o spin do elétron e o campo magnético externo.



### Partícula Livre
 As soluções para equação de Dirac descrevendo uma partícula livre devem ser objetos de quatro componentes, com valores bem definidos para o momento e energia. No entanto, antes de tentar obter tais soluções, vamos mostrar que cada componente de $\Psi$ também satisfaz a equação de Klein-Gordon. Assim, começemos pela equação de Dirac na forma covariante e multipliquemos ambos os lados por $\gamma^{\nu} \partial_{\nu}$, isto é,
\begin{align}
& \gamma^{\nu} \partial_{\nu} ( i \gamma^{\mu} \partial_{\mu} - \frac{mc}{\hbar})I \Psi = 0 \\
& i \gamma^{\nu}\gamma^{\mu} \partial_{\nu} \partial_{\mu} \Psi - \frac{mc}{\hbar}\gamma^{\nu} \partial_{\nu}\Psi = 0\\
& = i \frac{1}{2} \gamma^{\nu}\gamma^{\mu} (\partial_{\mu} \partial_{\nu} + \partial_{\nu} \partial_{\mu})\Psi + i \frac{m^2 c^2}{\hbar^2} I \Psi = 0\\
& = \frac{1}{2} (\gamma^{\nu}\gamma^{\mu} + \gamma^{\mu}\gamma^{\nu}) \partial_{\nu} \partial_{\mu} \Psi + \frac{m^2 c^2}{\hbar^2}I \Psi = 0,\\
\end{align}
 mas, como $\frac{1}{2} (\gamma^{\nu}\gamma^{\mu} + \gamma^{\mu}\gamma^{\nu}) = I \eta^{\nu \mu}$, temos que
 \begin{align}
  I \eta^{\nu \mu} \partial_{\nu} \partial_{\mu} \Psi + \frac{m^2 c^2}{\hbar^2}I \Psi = 0 \\
  (\partial^{\mu} \partial_{\mu} + \frac{m^2 c^2}{\hbar^2}) \Psi = 0,
 \end{align} 
ou seja, cada componente de $\Psi$ de fato satifaz a equação de Klein-Gordon. Assim, podemos supor como 'ansatz' uma solução em forma de ondas planas $\Psi(\vec{x},t) = u(\vec{k},E) e^{i(\vec{k} \cdot x - \omega t)}$, onde $u(\vec{k},E)$ é um objeto de quatro componentes constante. A equação de Dirac nos dará informação sobre tal objeto.

No entanto, consideremos primeiramente o caso idealizado no qual $\vec{p} = 0$, ou seja, a partícula está em repouso (no final, não é tao idealizado assim, pois podemos pensar que estamos resolvendo a equação de Dirac para o referencial no qual a partícula está em repouso). Assim, a equação de Dirac na forma hamiltoneana se reduz à
\begin{equation}
i \hbar \partial_t \Psi(\vec{x},t) = \beta mc^2 \Psi(\vec{x},t),
\end{equation}
que pode ser reescrita na forma matricial como
\begin{equation}
\left( \begin{array}{cccc}
i \hbar \partial_t - mc^2 & 0 & 0 & 0 \\
0 & i \hbar \partial_t - mc^2 & 0 & 0 \\
0 & 0 & i \hbar \partial_t + mc^2 & 0 \\
0 & 0 & 0 & i \hbar \partial_t + mc^2 \\
\end{array}  
\right) \left( \begin{array}{c}
\psi_1 (\vec{x},t) \\
\psi_2 (\vec{x},t) \\
\psi_3 (\vec{x},t) \\
\psi_4 (\vec{x},t) \\
\end{array} 
\right) = 0,
\end{equation}
ou seja, temos uma equação diferencial de 1ª para cada componente, cuja solução é de obtida a partir de uma integração. Assim
\begin{align}
\Psi(\vec{x},t) = \left( \begin{array}{c}
\psi_1 (\vec{x},t) \\
\psi_2 (\vec{x},t) \\
\psi_3 (\vec{x},t) \\
\psi_4 (\vec{x},t) \\
\end{array} 
\right) = \left( \begin{array}{c}
e^{- \frac{i}{\hbar} mc^2 t} \\
e^{- \frac{i}{\hbar} mc^2 t} \\
e^{\frac{i}{\hbar} mc^2 t} \\
e^{\frac{i}{\hbar} mc^2 t} \\
\end{array}
\right) = e^{- \frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
1 \\
0 \\
0 \\
0 \\
\end{array}
\right) + e^{- \frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
1 \\
0 \\
0 \\
\end{array}
\right) + e^{\frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
0 \\
1 \\
0 \\
\end{array}
\right) + e^{\frac{i}{\hbar} mc^2 t }\left( \begin{array}{c}
0 \\
0 \\
0 \\
1 \\
\end{array}
\right),
\end{align}
sendo possível observar que há 4 soluções linearmente independentes. Ou seja, cada
\begin{align}
\phi_1 := e^{- \frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
1 \\
0 \\
0 \\
0 \\
\end{array}
\right) \ \ \ \phi_2 := e^{- \frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
1 \\
0 \\
0 \\
\end{array}
\right), \ \ \ \chi_1:= e^{\frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
0 \\
1 \\
0 \\
\end{array}
\right), \ \ \ \chi_2:= e^{\frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
0 \\
0 \\
1 \\
\end{array}
\right), 
\end{align}
satifaz a equação de Dirac separadamente. Ainda, $\chi_1, \chi_2$ representam soluções com energia negativa, ou seja, já podemos observar que as soluções com energia negativa persistem. Como veremos mais tarde, esse problema é resolvido interpretando as últimas componentes como 'funções de onda' que descrevem anti-partículas. No entanto, será necessário abandonar a interpretação de que a 'função de onda' $\Psi$ descreve partícula única (em teoria quântica de campos, $\Psi$ não é mais uma 'função de onda', mas sim, um campo quantizado cujas excitações representam partículas). 

Agora, considerando uma partícula livre com momento $\vec{p}$ e energia $E$, consideremos o seguinte 'ansatz': $\Psi(\vec{x},t) = u(\vec{k},E) e^{i(\vec{k} \cdot x - \omega t)}$, onde $u(\vec{k},E)$ é um objeto de quatro componentes constante, $\vec{p} = \hbar \vec{k}$ e $E = \hbar \omega$. Da equação de Dirac na forma $(c \vec{\alpha} \cdot \vec{p} + \beta mc^2) \Psi = i \hbar \partial_t \Psi$, resulta
\begin{equation}
\left( \begin{array}{cc}
mc^2 I & \hbar c \vec{\sigma} \cdot \vec{k} \\
c \vec{\sigma} \cdot \vec{k} & -mc^2 I \\
\end{array} \right) u(\vec{k},E) = E u(\vec{k},E),
\end{equation}
escrevendo $u(\vec{k},E)$ em termos de objetos de duas componentes cada, i.e.,
\begin{equation}
u(\vec{k},E) = \left( \begin{array}{c} \phi \\ \chi  \end{array} \right) = \left( \begin{array}{c} \phi_1 \\ \phi_2 \\ \chi_1 \\ \chi_2 \\  \end{array} \right),
\end{equation}
é possível obter um sistema de equações acopladas dadas por
\begin{align}
& mc^2 \phi + \hbar c \vec{\sigma} \cdot \vec{k} \chi = E \phi \\
&  \hbar c \vec{\sigma} \cdot \vec{k} \phi - mc^2 \chi = E \chi,
\end{align}
isolando $\chi$ na segunda equação, vem que
\begin{equation}
\chi = \frac{\hbar c \vec{\sigma} \cdot \vec{k}}{E + mc^2} \phi,
\end{equation}
e substituindo na primeira equação do sistema, temos
\begin{equation}
(E - mc^2) \phi = \frac{\hbar^2 c^2 (\vec{\sigma} \cdot \vec{k})^2}{E + mc^2} \phi.
\end{equation}
Agora, lembrando que
\begin{align}
(\vec{\sigma} \cdot \vec{A})(\vec{\sigma} \cdot \vec{B})& = (\sum_i \sigma_i A_i)(\sum_j \sigma_j B_j) = \sum_{i,j} \sigma_i \sigma_j A_i B_j\\
& = \sum_{i,j}(\delta_{ij}I +i \sum_k \epsilon_{ijk} \sigma_k) A_i B_j \\
& = \vec{A} \cdot \vec{B}I + i \vec{\sigma}\cdot(\vec{A} \times \vec{B}),
\end{align}
de modo que, para $\vec{A} = \vec{B} = \vec{k}$, temos $(\vec{\sigma} \cdot \vec{k})^2 = \vec{k} \cdot \vec{k} I = k^2 I$. Assim,
\begin{equation}
(E - mc^2) \phi = \frac{\hbar^2 c^2 k^2}{E + mc^2} I \phi,
\end{equation}
ou, equivalentemente, $(E^2 - m^2c^4 - c^2 \hbar^2 k^2) \phi = 0$. Assim, qualquer objeto $\phi$ será solução da equação acima, e portanto, $\Psi(\vec{x},t) = u(\vec{k},E) e^{i(\vec{k} \cdot x - \omega t)}$ será solução da equação de Dirac, se $E = \pm \sqrt{m^2c^4 + c^2 \hbar^2 k^2}$, existindo tanto soluções de energia positiva quanto negativa.

Agora, voltando à
\begin{equation}
\chi = \frac{\hbar c \vec{\sigma} \cdot \vec{k}}{E + mc^2} \phi,
\end{equation}
\end{equation}
e considerando as soluções de energia positiva $E = + \sqrt{m^2c^4 + c^2 \hbar^2 k^2}$, temos que
\begin{equation}
\chi_1 \left( \begin{array}{c}
1 \\
0 \\
\end{array} 
\right) + \chi_2 \left( \begin{array}{c}
0 \\
1 \\
\end{array} 
\right) =  \frac{\hbar c \vec{\sigma} \cdot \vec{k}}{E + mc^2}( \phi_1 \left( \begin{array}{c}
1 \\
0 \\
\end{array} 
\right) + \phi_2 \left( \begin{array}{c}
0 \\
1 \\
\end{array} 
\right)),
\end{equation}
como $\left( \begin{array}{c}
0 \\
1 \\
\end{array} 
\right) e \left( \begin{array}{c}
1 \\
0 \\
\end{array} 
\right)$ são L.I., temos que
\begin{equation}
\chi_i \left( \begin{array}{c}
\delta_{i 1} \\
\delta_{i 2} \\
\end{array} 
\right) = \frac{\hbar c \vec{\sigma} \cdot \vec{k}}{E + mc^2} \phi_i \left( \begin{array}{c}
\delta_{i 1} \\
\delta_{i 2} \\
\end{array} 
\right) = \frac{ \hbar c}{E + mc^2} \left( \begin{array}{cc}
k^3 & k^- \\
k^+ & - k^3 \\
\end{array} \right) \phi_i \left( \begin{array}{c}
\delta_{i 1} \\
\delta_{i 2} \\
\end{array} 
\right), \ i = 1,2,
\end{equation}
com $k^{\pm} =  k^1  \pm i k^2$. E portanto,
\begin{align}
 \chi_1 = \frac{ \hbar c}{E + mc^2}\left( \begin{array}{c}
k^3 \\
k^+ \\
\end{array} 
\right) \phi_1, \ \ \ \ \chi_2 = \frac{ \hbar c}{E + mc^2}\left( \begin{array}{c}
k^- \\
-k^3 \\
\end{array} 
\right) \phi_2,
\end{align}
sendo possível observar que, para $E > 0$, obtemos duas soluções independentes
\begin{equation}
u(\vec{k}, E) = u_1 (\vec{k}, E, \uparrow) + u_2 (\vec{k}, E, \downarrow) = \frac{\hbar c}{E + mc^2} \left( \begin{array}{c}
1 \\
0 \\
k^3 \\
k^+ \\
\end{array}
\right) \phi_1 + \frac{\hbar c}{E + mc^2} \left( \begin{array}{c}
0 \\
1 \\
k^- \\
-k^3 \\
\end{array}
\right) \phi_2,
\end{equation}
onde $u_1(\vec{k}, E, \uparrow)$ descreve uma partícula com momento $\vec{k}$, energia $E > 0$ e spin 1/2 'para cima' na direção 'z' se o movimento da partícula é ao longo de z, enquanto que $u_2(\vec{k}, E, \downarrow)$  descreve uma partícula com momento $\vec{k}$, energia $E > 0$ e spin 1/2 'para baixo' na direção z. Para ver isso, consideremos o observável $S_3 = \frac{\hbar}{2} \Sigma_3$ e consideremos que a partícula livre se move apenas na direção 'z', assim $k_1 = k_2 = 0$. Logo,
\begin{align}
S_3 u_1(k_3, E, \uparrow) = \frac{\hbar}{2} \left( \begin{array}{cccc}
1 & 0 & 0 & 0 \\
0 & -1 & 0 & 0 \\
0 & 0 & 1 & 0 \\
0 & 0 & 0 & -1 \\
\end{array}  
\right) \frac{\hbar c}{E + mc^2} \left( \begin{array}{c}
1 \\
0 \\
k^3 \\
0 \\
\end{array}
\right) \phi_1 = \frac{\hbar}{2} \frac{\hbar c}{E + mc^2} \left( \begin{array}{c}
1 \\
0 \\
k^3 \\
0 \\
\end{array}
\right) \phi_1  = \frac{\hbar}{2}  u_1(k_3, E, \uparrow),
\end{align}
ou seja, $ u_1(k_3, E, \uparrow) $ é autovetor de $S_3$ com autovalor $\hbar/2$. Analogamente, $ u_2(k_3, E, \downarrow) $ é autovetor de $S_3$ com autovalor $-\hbar/2$. Ainda, é possível observar que, para $\vec{p} \to 0$ (limite não relativístico), $\chi_1, \chi_2 \to 0$, de modo que o 'spinor' de 4 componentes se reduz a um spinor de duas componentes.

Agora, para descrever as soluções de energia negativa $E = - \sqrt{m^2c^4 + c^2 \hbar^2 k^2} := - |E|$, que ainda devem ser solução L.I em relação às soluções de energia positiva, escrevemos $\phi$ em função $\chi$ do sistema de equações que surge da equação de Dirac, i.e.,
\begin{equation}
\phi = \frac{\hbar c \vec{\sigma} \cdot \vec{p}}{E - mc^2} \phi = - \frac{\hbar c \vec{\sigma} \cdot \vec{p}}{mc^2 - E} \phi, 
\end{equation}
seguindo o mesmo procedimento que anteriormente, obtemos
\begin{align}
\phi_3 = - \frac{\hbar c}{mc^2 - E}\left( \begin{array}{c}
k^3 \\
k^+ \\
\end{array}
\right) \chi_3, \ \ \ \phi_4 = \frac{\hbar c}{mc^2 - E}\left( \begin{array}{c}
- k^- \\
k^3 \\
\end{array}
\right) \chi_4,
\end{align}
de modo que
\begin{equation}
u(\vec{k}, E) = u_3 (\vec{k}, E, \uparrow) + u_4 (\vec{k}, E, \downarrow) = - \frac{\hbar c}{mc^2 - E} \left( \begin{array}{c}
k^3 \\
k^+ \\
1 \\
0 \\
\end{array}
\right) \chi_3 + \frac{\hbar c}{mc^2 -  E} \left( \begin{array}{c}
- k^- \\
k^3  \\
0 \\
1 \\
\end{array}
\right) \chi_4,
\end{equation}
onde $u_3(\vec{k}, E, \uparrow)$ descreve uma partícula com momento $\vec{k}$, energia $E < 0$ e spin 1/2 'para cima' na direção z enquanto que $u_4(\vec{k}, E, \downarrow)$  descreve uma partícula com momento $\vec{k}$, energia $E < 0$ e spin 1/2 'para baixo' na direção z. Para resumir, é possível ver que, para cada sinal de $E$, há duas soluções independentes que são expressas em termos de constantes arbitrárias: $\phi_1, \phi_2$ para $E> 0$; e, $\chi_3, \chi_4$ para $E < 0$. E, portanto, há em geral 4 soluções independentes para cada valor $\hbar \vec{k}$ do momento. Assim, de modo geral, a equação de Dirac para uma partícula livre de spin $1/2$ admite 4 soluções independentes em termos de ondas planas expressas por:
\begin{align}
& \psi^{+, \uparrow}(\vec{x},t) = u_1(\vec{k}, E_+, \uparrow) e^{i \vec{k}\cdot \vec{x} - \omega t} \ \ \ \ \ \ \ \psi^{+, \downarrow}(\vec{x},t) = u_2(\vec{k}, E_+, \downarrow) e^{i \vec{k}\cdot \vec{x} - \omega t}\\
& \psi^{-, \uparrow}(\vec{x},t) = u_3(\vec{k}, E_-, \uparrow) e^{i \vec{k}\cdot \vec{x} + \omega t} \ \ \ \ \ \ \  \psi^{-, \downarrow}(\vec{x},t) = u_4(\vec{k}, E_-, \downarrow) e^{i \vec{k}\cdot \vec{x} - \omega t},
\end{align}
com $\phi_1, \phi_2, \chi_3, \chi_4$ sendo constantes de normalização. Novamente, podemos ver que a equação de Dirac admite soluções com energia negativa para uma partícula livre de modo que o espectro de energias possíveis para uma partícula livre é um espectro contínuo bipartido $(- \infty, -mc^2]\cup [mc^2, \infty)$.




### Teoria do buraco e o mar de Dirac
Vimos que a equação de Dirac leva a resultados com soluções de energia positiva e negativa. No caso de partículas livres, por exemplo, os autovalores de energia são dados por
\begin{equation}
 E = \pm \sqrt{m^2c^4 + c^2 \hbar^2 k^2},
\end{equation}
de modo que o espectro de energias negativas e positivas está separado por um 'gap' de energia de $2mc^2$. A primeiro problema a notar é que o espectro de energia negativos não é limitado inferiormente. Assim, como os sistemas físicos têm uma tendência de ir para o menor estado de energia disponível, isso implica que qualquer
sistema físico (de partículas de Dirac) faria uma transição para esses estados de energia não-físicos, levando a um colapso de todos os sistemas, como o átomo de hidrogênio. Mesmo que começamos com uma solução de energia positiva, qualquer perturbação faz com que a energia diminua, desestabilizando o sistema físico e levando
um colapso final. Foi Dirac quem primeiro forneceu um tratamento consistente das soluções de energia
negativa. O argumento de Dirac só funciona para fermions pois faz uso do Princı́pio de Exclusão de Pauli. Aproveitando esse fato, Dirac postulou que o estado fundamental (estado de vácuo) em tal teoria deve ser
redefinido a fim de termos consistência com a observação. Ou seja, Dirac postulou que o estado fundamental em tal teoria é o estado em que todos os estados de energia negativos são preenchidos com elétrons, conhecido como mar de Dirac. Devido ao princı́pio de exclusão de Pauli um electron com energia $E > 0$ não pode efetuar uma transição para um estado de energia negativa, explicando a estabilidade dos átomos. Claro que, nesse caso, o
vácuo tem energia e momento infinitos mas fisicamente só medimos diferenças em relação ao vácuo e essas serão finitas. Tal redefinição também faz previsões.

Por exemplo, se fornecido energia suficiente a esse estado fundamental, um
elétron de energia negativa pode fazer uma transição para um estado de energia positivo e
pode aparecer como um elétron de energia positiva. Além disso, a ausência de um elétron de energia negativa pode ser pensado como um "buraco" que teria exatamente a mesma massa que a partícula mas carga positiva (em análogia, a buracos em materias semicondutores). Esse "buraco" é o que passamos a reconhecer como a antipartícula do elétron - neste caso, um pósitron - e o processo em discussão é comumente chamado de criação de pares elétron-prósiton. Dito de outra maneira, a ausência de um elétron de energia negativa no estado fundamental pode ser pensado como o estado fundamental completo mais uma partícula de energia e carga positiva de maneira que junto com o elétron cria um 'buraco' no estado fundamental. Na figura abaixo, temos uma representação de produção e aniquilação de pares.

<img src="hole.png" width="400">

Logo, se aceitarmos tal interpretação, é necessário reconhecer que tal interpretação representa uma teoria de muitas partículas no sentido de que o vácuo (estado fundamental) da teoria está definido para conter infinitamente muitas partículas de energia negativa. Assim, só o formalismo da segunda quantificação, com os seus operadores de criação e destruição permitirá fazer uma descrição consistente desta teoria de muitas partículas no qual a 'função de onda' se tornará um campo quantizado no qual os operadores de aniquilação e destruição atuam. No entanto, a interpretação de Dirac teve um papel determinante no desenvolvimento da teoria e na descoberta experimental do pósitron.

### Conjugação de Carga
Da teoria do buraco emerge assim numa nova simetria de natureza: para cada partı́cula existe uma antipartı́cula. Esta simetria pode ser vista através da conjugação de carga. Assim, devemos ter uma correspondência unívoca entre as soluções de energia negativa da equação de Dirac para o elétron e as soluções de energia positiva da equação de Dirac para o pósitron. Considerando acoplamente mínimo $p_{\mu} \to p_{\mu} - q A_{\mu}$, ou ainda, $i \partial_{\mu} \to i \gamma^{\mu} \partial_{\mu} - \frac{q}{\hbar}\gamma^{\mu} A_{\mu}$, é preciso estabelecer uma relação entre a equação de Dirac para o elétron
\begin{align}
(i \gamma^{\mu} \partial_{\mu} - \frac{q}{\hbar}\gamma^{\mu}A_{\mu} - \frac{mc}{\hbar}) \Psi = 0, 
\end{align}
e a equação de Dirac para o pósitron
\begin{align}
(i \gamma^{\mu} \partial_{\mu} + \frac{q}{\hbar}\gamma^{\mu} A_{\mu} - \frac{mc}{\hbar}) \Psi_c = 0. 
\end{align}
Assim, a fim de estabeler tal relação, tomemos o conjugado da equação do elétron:
\begin{align}
(-i (\gamma^{\mu})^* \partial_{\mu} - \frac{q}{\hbar}(\gamma^{\mu})^* A_{\mu} - \frac{mc}{\hbar}) \Psi^* = 0, 
\end{align}
de modo que o objetivo é encontrar uma transformação $U = C \gamma^0$ tal que $U(\gamma^{\mu})^* U^{-1} = - \gamma^{\mu}$. Assim, supondo que tal transformação exista, multipliquemos por U à esquerda a equação conjugada e usando o fato de que $I = U U^{-1}$, temos
\begin{align}
 (  U(\gamma^{\mu})^* U^{-1}   (i \partial_{\mu} + \frac{q}{\hbar} A_{\mu}) + \frac{mc}{\hbar}) U \Psi^* = 0
\to (i \gamma^{\mu} \partial_{\mu} + \frac{q}{\hbar}\gamma^{\mu} A_{\mu} - \frac{mc}{\hbar}) U \Psi^* = 0.
\end{align}
Comparando com a equação do pósitron, temos que ter $\Psi_c = U\Psi^*  = C \gamma^{0} \Psi^* := C \bar{\Psi}^T$, onde $\bar{\Psi}^T = (\Psi^{\dagger}\gamma^{0})^T = \gamma^{0} \Psi^*$. Para determinar $U = C \gamma^{0}$, lembremos que $\gamma^0 (\gamma^{\mu})^{\dagger} \gamma^{O} = \gamma^{\mu}$, ou equivalentemente, tomando a transposta
\begin{align}
\gamma^0 (\gamma^{\mu})^* \gamma^{0} = (\gamma^{\mu})^T,
\end{align}
assim
\begin{align}
U(\gamma^{\mu})^* U^{-1} & = C \gamma^{0} (\gamma^{\mu})^* \gamma^{0} C^{-1} \\
& = C (\gamma^{\mu})^T C^{-1},
\end{align}
de modo que o efeito de C sobre as matrizes gama é tal que $C (\gamma^{\mu})^T C^{-1} =  - \gamma^{\mu}$, ou equivalenteente, $C^{-1} \gamma^{\mu} C = - (\gamma^{\mu})^T$ . Mas $\gamma^1, \gamma^3$ são tais que $$ \gamma^1 = - (\gamma^1)^T \ \ \ \ \ \gamma^3 = - (\gamma^3)^T.$$ Logo, basta que C comute com $\gamma^1, \gamma^3$ uma vez que, para $i = 1,3$,  $[C, \gamma^i] = 0$ implica em
\begin{align}
\gamma^i = C^{-1} \gamma^i C \ \to \  C^{-1} \gamma^i C = - (\gamma^i)^T.
\end{align}
Enquanto que $\gamma^0, \gamma^2$ são tais que $$\gamma^0 =  (\gamma^0)^T \ \ \ \ \ \gamma^2 =  (\gamma^2)^T,$$ assim, basta que C anticomute  com $\gamma^0, \gamma^2$. Assim, encontrar $C$ tal que $C^{-1} \gamma^{\mu} C = - (\gamma^{\mu})^T$ é equivalente a encontrar uma matriz tal que
\begin{align}
& [C, \gamma^i] = 0, \ \ \ se \ \ i = 1,3 
& \{C, \gamma^i\} = 0, \ \ \ se \ \ i = 0,2.
\end{align}
Então, a menos de uma fase, uma possibilidade para C é dado por
\begin{equation}
C := i \gamma^2 \gamma^0 = \left( \begin{array}{cc}
\mathbb{0} & - i\sigma_2 \\
-i \sigma_2 & \mathbb{0} \\
\end{array} \right),
\end{equation}
com $C = - C^{-1} = - C^{\dagger} = - C^T$ e $\Psi_c = C \gamma^{0} \Psi^* = i \gamma^2 \Psi^*$. Logo, se $\Psi$ é solução da equação de Dirac para uma partícula de carga 'q', então $\Psi_c$ é solução da equação de DIrac para uma partícula de carga '-q'. Para ver isso, consideremos uma das soluções de energia negativa da equação de Dirac (em repouso)
\begin{align}
\psi^{-,\downarrow} = e^{\frac{i}{\hbar} mc^2 t} \left( \begin{array}{c}
0 \\
0 \\
0 \\
1 \\
\end{array}
\right),
\end{align}
e calculemos $\psi_c$:
\begin{align}
\psi_c & = i \gamma^2 (\psi^{-,\downarrow})^* = \left( \begin{array}{cc}
\mathbb{0} & - i\sigma_2 \\
-i \sigma_2 & \mathbb{0} \\
\end{array} \right)\left( \begin{array}{c}
0 \\
0 \\
0 \\
1 \\
\end{array}
\right) e^{\frac{-i}{\hbar} mc^2 t}\\
& = \left( \begin{array}{c}
1 \\
0 \\
0 \\
0 \\
\end{array}
\right) e^{\frac{-i}{\hbar} mc^2 t} = \psi^{+,\uparrow},
\end{align} 
ou seja, na teoria do buraco, a ausência de um elétron de spin $\downarrow$ e $E < 0$ corresponde à presença de um pósitron com spin $\uparrow$ e energia $E > 0$. Ademais, $(\Psi_c)_c = \Psi$. Para concluir, o que acabamos de ver é um caso particular de um teorema mais geral da teoria quântica de campos que afirma que: todo estado possível para uma partícula de carga 'q', também é possível para uma partícula '-q' (anti-partícula), fazendo $t \to -t$ e $\vec{x} \to - \vec{x}$. Tal teorema é conhecido como teorema CPT. 

 
### Observações Finais

1. A equação de Schödinger $i\hbar \partial_t \Psi = H \Psi$ com $\Psi$ sendo uma função de 1 componentes descreve uma partícula de spin-0 assim como sua generalização relativística (equação de Klein Gordon).
2. CPT é um teorema geral que não se aplica apenas ao elétron.
3. A equação de Klein-Gordon( assim como qualquer outra equação de "onda") deve ser reinterpretada à luz da Teoria Quântica de Campos. Uma vez que, levando em conta a R.R., $\Psi$ não descreve partícula única. Assim, $\Psi$ é de fato um campo (escalar, vetorial, spinorial, etc). Há um limite no qual a interpretação de partícula única é valido (por exemplo, no qual as componentes do spinor $\Psi$ da equação de Dirac podem ser desprezadas).
4. Em Teoria Quântica de Campos, partículas são meramente excitações quantizadas (como no Oscilador Harmônica Quântico) desse campo, e portanto, partículas são fenômenos emergentes (ou secundários). A. Hobson "There are no particles, only fields", American Journal of Physics 81, 211 (2013).
 
