# C√°lculo simb√≥lico de derivadas com SymPy

## $ \S 1 $ Introdu√ß√£o

Nesta aula aprenderemos a calcular derivadas de fun√ß√µes usando Python.  O
c√°lculo de derivadas pode ser abordado de duas maneiras principais:
**simb√≥lica** e **num√©rica**. Para cada tipo, usaremos um pacote diferente:
**SymPy** e **SciPy**, respectivamente. (Para disting√ºir um do outro,
note que "Sym" √© abrevia√ß√£o de "Symbolic").

‚ö†Ô∏è Quando importados, tanto o SymPy quanto o SciPy s√£o freq√ºentemente abreviados por `sp`.
Para evitar confus√£o, utilizaremos as abrevia√ß√µes abaixo.

In [2]:
import sympy as sym
import scipy as scp

O **c√°lculo num√©rico** utiliza t√©cnicas de discretiza√ß√£o do dom√≠nio para estimar
a derivada de uma fun√ß√£o com base nos valores dela em alguns pontos espec√≠ficos.
O *m√©todo das diferen√ßas finitas* √© o mais comumente utilizado. Na forma mais
simples, aproximamos a derivada de uma fun√ß√£o $ f $ em $ x = x_0 $ pela
express√£o
$$
f'(x_0) \approx \frac{f(x_0 + h) - f(x_0)}{h}\,
$$
para $ h \ne 0 $ pequeno. Esta √© a chamada _f√≥rmula da diferen√ßa progressiva_.
Outras f√≥rmulas, como a da _diferen√ßa centrada_
$$
f'(x_0) \approx \frac{f(x_0 + h) - f(x_0 - h)}{2h}\,
$$
oferecem aproxima√ß√µes melhores. 

Infelizmente, os m√©todos num√©ricos de deriva√ß√£o n√£o s√£o muito precisos, por
exemplo quando comparados aos m√©todos num√©ricos para integra√ß√£o. Isto ocorre por
causa do conflito entre os erros envolvidos na interpola√ß√£o em si (para os
quais a solu√ß√£o seria diminuir $ h $ ao m√°ximo nas express√µes acima) e os erros
de arredondamento inerentes √† precis√£o limitada do sistema de ponto flutuante
(para os quais a solu√ß√£o seria n√£o tomar $ h $ muito pequeno).

No **c√°lculo simb√≥lico**, como o realizado pelo SymPy, as derivadas s√£o obtidas
manipulando-se a express√£o matem√°tica exata da fun√ß√£o de acordo com as regras usuais
de deriva√ß√£o aprendidas no curso de C√°lculo. As vari√°veis s√£o tratadas como
_s√≠mbolos_, e o resultado √© uma express√£o anal√≠tica para a derivada como uma fun√ß√£o
independente, n√£o apenas o valor dela num determinado ponto $ x_0 $.


|   | C√°lculo Simb√≥lico                     | C√°lculo Num√©rico                      |
|---------------------------|---------------------------------------|---------------------------------------|
| **Precis√£o**              | exata                                 | aproximada                            |
| **Resultado**             | express√£o anal√≠tica                   | valor num√©rico                        |
| **Depend√™ncia de Dados**  | n√£o √© capaz de lidar diretamente com dados        | pode ser usado com dados experimentais |
| **Aplicabilidade**        | ideal para an√°lises te√≥ricas          | ideal para avalia√ß√µes pr√°ticas        |
| **Custo Computacional** | pode ser alto para fun√ß√µes complicadas | geralmente mais eficiente             |
| **Facilidade de Implementa√ß√£o** | requer considera√ß√£o de v√°rios casos e regras | geralmente muito simples |



## $ \S 2 $ Derivadas simb√≥licas de fun√ß√µes de uma vari√°vel

### $ 2.1 $ Exemplos

**Exemplo 1 (derivada de um polin√¥mio):** Considere $ f(x) = x^2 + 3x + 2 $.
Vamos calcular sua derivada (em rela√ß√£o a $ x $).

In [2]:
# Importando o SymPy:
import sympy as sym

# Definindo a vari√°vel simb√≥lica:
x = sym.symbols('x')

# Definindo a fun√ß√£o:
f = x**2 + 3*x + 2

# Calculando a derivada:
df_dx = sym.diff(f, x)

# Retornando o resultado:
df_dx

2*x + 3

__Exemplo 2 (derivada da exponencial):__ Para calcular derivadas de uma fun√ß√£o
especial, como a exponencial, o logaritmo ou o seno, precisamos importar a
vers√£o dela fornecida pelo SymPy. Por exemplo, se $ g(t) = e^{-t^2} $:

In [3]:
# Definindo a vari√°vel simb√≥lica:
t = sym.symbols('t')

# Definindo g:
g = sym.exp(-t * t)     # sym.exp √© a exponencial

# Calculando e retornando a derivada:
dg_dt = sym.diff(g, t)
dg_dt

-2*t*exp(-t**2)

üìù Podemos utilizar qualquer caracter Unicode (ou palavra consistindo de
caracteres deste tipo) como nomes para as vari√°veis, por exemplo '$ \alpha $' ou
"alfa".

__Exemplo 3 (derivadas de ordem superior):__ Vamos verificar a periodicidade das
derivadas da fun√ß√£o seno. 

In [32]:
# Definindo a vari√°vel simb√≥lica (Œ∏):
Œ∏ = sym.symbols('Œ∏')

# Definindo a fun√ß√£o seno:
f = sym.sin(Œ∏)

# Primeira derivada:
df_dt = sym.diff(f, Œ∏)

# Para calcular a segunda derivada, podemos derivar df_dt:
d2f_dt2 = sym.diff(df_dt, Œ∏)
# Alternativamente, basta indicar a ordem como um argumento extra:
d2f_dt2 = sym.diff(f, Œ∏, 2)

# Similarmente para as derivadas de ordem mais alta:
d3f_dt3 = sym.diff(f, Œ∏, 3)
d4f_dt4 = sym.diff(f, Œ∏, 4)

# Exibindo os resultados:
f, df_dt, d2f_dt2, d3f_dt3, d4f_dt4


(sin(Œ∏), cos(Œ∏), -sin(Œ∏), -cos(Œ∏), sin(Œ∏))

**Exerc√≠cio:** Use o SymPy para obter a primeira e segunda derivada de cada uma
das seguintes fun√ß√µes.

(a) $ f(x) = 5x^3 - 4x^2 + 2x - 7 \,$. Verifique ainda que $ f^{(4)} \equiv 0 $.

(b) $ g(x) = e^{3x} \sin x \,$

(c) $ h(t) = \frac{t^2 + 1}{t - 1} \,$

(d) $ u(x) = \ln(x^2 + 3x + 2) \,$ (o logaritmo natural no SymPy √© `log`).

(e) $ v(\alpha) = \sqrt{\alpha^2 + \sin^2(\alpha)} \ $ (utilize a vari√°vel-s√≠mbolo '$ \alpha $').

### $ 2.2 $ Explica√ß√£o do m√©todo simb√≥lico

De maneira breve, o c√°lculo simb√≥lico de derivadas consiste em formalizar
num algoritmo as regras formais de deriva√ß√£o, tais como:

$$
\begin{aligned}
& \big(a\, f + b\,g\big)' = a\, f' + b\, g' && (\text{regra da combina√ß√£o linear}) \\
& (x^r)' = r\,x^{r - 1} && (\text{regra da pot√™ncia}) \\
& (f \cdot g)' = f' \cdot g + f \cdot g' && (\text{regra do produto}) \\
& \left(\frac{f}{g}\right)' = \frac{f' \cdot g - f \cdot g'}{g^2} && (\text{regra do quociente}) \\
& (f \circ g)' = (f'\circ g) \cdot g' && (\text{regra da cadeia})
\end{aligned}
$$
Al√©m destas, precisamos implementar diretamente a derivada de fun√ß√µes
especiais, como a exponencial ou o seno.

Durante o processo, o algoritmo deve simplificar automaticamente as express√µes
intermedi√°rias para tentar controlar a complexidade.  Isso envolve a combina√ß√£o
de termos semelhantes, a aplica√ß√£o de identidades trigonom√©tricas, etc. Todas
estas regras precisam ser codificadas "√† m√£o".  Apesar da implementa√ß√£o
trabalhosa, as id√©ias subjacentes a um algoritmo deste tipo s√£o relativamente
simples.

**Exemplo 4:** Se derivarmos $ f(x) = \sin^2 x + \cos^2‚Å° x $ formalmente usando
a regra da soma e a do produto, obteremos a express√£o relativamente complexa
$$
f'(x) = 2\,\sin x \,\cos x + 2\,\cos x\,\big(-\sin x\big)\,.
$$
Contudo, o SymPy foi programado para notar que $ f(x) = 1 $ para todo $ x $ ou
que os dois termos na express√£o para $ f' $ podem ser cancelados:

In [4]:
# Reservando o s√≠mbolo x e definindo f:
x = sym.symbols('x')
f = sym.sin(x)**2 + sym.cos(x)**2

# Calculando a derivada:
df_dx = sym.diff(f, x)
df_dx

0

__Exerc√≠cio:__ O valor presente $ V $ de uma s√©rie de pagamentos mensais (por
exemplo da hipoteca de uma casa) √© dado pela f√≥rmula:
$$
V = \frac{C}{r_m} \left[1 - (1 + r_m)^{-n}\right]
$$
onde aqui:
* $ C $ √© o valor do pagamento mensal;
* $ r_m $ √© a taxa de juros mensal;
* $ n $ √© o n√∫mero total de meses da s√©rie.

Calcule a sensibilidade (ou seja, a taxa de varia√ß√£o) do valor presente em
rela√ß√£o √† taxa de juros mensal.

## $ \S 3 $ Derivadas simb√≥licas de fun√ß√µes de v√°rias vari√°veis

As constru√ß√µes da $ \S 1 $ se estendem facilmente √† diferencia√ß√£o simb√≥lica de
fun√ß√µes de v√°rias vari√°veis.

__Exemplo 1 (derivadas de uma fun√ß√£o de duas vari√°veis):__
Vamos calcular as derivadas parciais com respeito a $ x $ e $ y $ da fun√ß√£o
$ f(x, y) = x^3 - y^2 + 2xy $.

In [28]:
# Desta vez precisamos utilizar duas vari√°veis simb√≥licas:
x, y = sym.symbols('x y')

# Definindo f:
f = x**3 - y**2 + 2 * x * y

# Calculando as derivadas parciais:
df_dx = sym.diff(f, x)
df_dy = sym.diff(f, y)

# Exibindo f e suas derivadas parciais:
display(f, df_dx, df_dy)

x**3 + 2*x*y - y**2

3*x**2 + 2*y

2*x - 2*y

üìù A fun√ß√£o `display` exibe os resultados num formato mais amig√°vel e leg√≠vel
(usando $ \LaTeX $). Ela tem boa integra√ß√£o com o SymPy e est√° automaticamente
dispon√≠vel em cadernos Jupyter, mas fora deles precisa ser importada com:
`from Ipython.display import display`.

__Exemplo 2 (derivadas de ordem superior):__ 
Calcule as derivadas parciais de primeira e segunda ordem da fun√ß√£o $ g(u,v) = \sin‚Å°(uv) $.

In [5]:
# Definindo as vari√°veis e a fun√ß√£o g: 
u, v = sym.symbols('u v')
g = sym.sin(u * v)

# Calculando as derivadas parciais de primeira ordem:
dg_du = sym.diff(g, u)
dg_dv = sym.diff(g, v)

# Para calcular a derivada parcial de ordem 2 com respeito a u,
# podemos derivar dg_du com respeito a u:
d2g_du2 = sym.diff(dg_du, u)
# Por√©m √© mais f√°cil e natural derivar g com respeito a u e a u:
d2g_du2 = sym.diff(g, u, u)
# Ou ainda: 
d2g_du2 = sym.diff(g, u, 2)

# Similarmente para a derivada parcial com respeito a v:
d2g_dv2 = sym.diff(g, v, 2)

# Agora a derivada parcial mista:
d2g_dudv = sym.diff(g, u, v)

# Exibindo os resultados:
display(g, dg_du, dg_dv, d2g_du2, d2g_dv2, d2g_dudv)

sin(u*v)

v*cos(u*v)

u*cos(u*v)

-v**2*sin(u*v)

-u**2*sin(u*v)

-u*v*sin(u*v) + cos(u*v)

__Exerc√çcio (fun√ß√£o de tr√™s vari√°veis):__ Determine todas as derivadas parciais
de primeira e segunda ordem da fun√ß√£o $$ h(x,y,z) = x^2 y + yze^z\,. $$

__Exerc√≠cio:__

(a) Quantas derivadas parciais de ordem $ 3 $ tem uma fun√ß√£o de duas vari√°veis?

(b) Quantas derivadas parciais de ordem $ r $ tem uma fun√ß√£o $ f $ de $ m $ vari√°veis?
Voc√™ pode assumir que a ordem em que tomamos derivadas parciais n√£o importa, de modo
que por exemplo:
$$
\frac{\partial^3 f}{\partial x\, \partial y^2} = \frac{\partial^3 f}{\partial y\, \partial x\, \partial y}
$$
_Dica:_ Este problema √© equivalente ao seguinte: de quantas maneiras podemos
alocar $ r $ bolas indisting√º√≠veis em $ m $ caixas distintas?

## $ \S 4 $ Calculando o gradiente

### $ 4.1 $ O gradiente de fun√ß√µes de duas vari√°veis

Seja $ z = f(x, y) $ uma fun√ß√£o de duas vari√°veis $ x $ e $ y $. O __gradiente__ de
$ f $, denotado por $ \nabla f $, √© um campo vetorial cujas componentes s√£o as
duas derivadas parciais de $ f $:
$$
\nabla f = \big(f_x\,,\,f_y\big) = \bigg(
\frac{\partial f}{\partial x}\,,\, \frac{\partial f}{\partial y}
\bigg)\,.
$$

Em um ponto espec√≠fico do dom√≠nio, o gradiente aponta na dire√ß√£o de maior
crescimento da fun√ß√£o, e a taxa de maior crescimento √© dada pela norma
(magnitude) do gradiente.

Geometricamente, o gradiente de uma fun√ß√£o $ f $ em cada ponto √© perpendicular
√† __curva de n√≠vel__ de $ f $ passando por aquele ponto. A curva de n√≠vel $ L_c
$ correspondente a $ z = c $ √©, por defini√ß√£o, o subconjunto de pontos do
dom√≠nio onde $ f $ vale $ c $, ou seja, $ L_c = f^{-1}(c) $.

No SymPy, podemos calcular o gradiente de uma fun√ß√£o utilizando o procedimento
`derive_by_array`. Mais precisamente, ele permite calcular as derivadas parciais
de uma fun√ß√£o com respeito a um conjunto qualquer de vari√°veis,
retornando um array (do SymPy, n√£o do NumPy) como resultado.

__Exemplo 1:__ Vamos determinar o gradiente da fun√ß√£o $ f(x, y) = x^2 + xy - y^2\, $.

In [6]:
# Definindo as vari√°veis simb√≥licas e f:
x, y = sym.symbols('x y')
f = x**2 + x*y - y**2

# Calculando o gradiente usando `derive_by_array`:
grad_f = sym.derive_by_array(f, (x, y))

# Exibindo os resultados:
display(f, grad_f)

# Checando que o resultado √© um array:
print(type(grad_f))

x**2 + x*y - y**2

[2*x + y, x - 2*y]

<class 'sympy.tensor.array.dense_ndim_array.ImmutableDenseNDimArray'>


![Curvas de n√≠vel e gradiente](curvas_de_nivel_gradiente.png)

### $ 4.2 $ O gradiente de fun√ß√µes de v√°rias vari√°veis

Seja $ w = f(x_1, x_2, \ldots, x_m) $ uma fun√ß√£o de $ m $ vari√°veis, definida num subconjunto de $ \mathbb R^m $. Por defini√ß√£o, o **gradiente** de $ f $ √© dado por
$$
\nabla f = \big(f_{x_1}\,,\,f_{x_2}\,,\, \cdots \,,\, f_{x_m}\big) = \bigg( \frac{\partial f}{\partial x_1}\,,\, \frac{\partial f}{\partial x_2}\,,\, \ldots\,,\, \frac{\partial f}{\partial x_m} \bigg)\,.
$$

Assim como no caso de duas vari√°veis, o gradiente aponta na dire√ß√£o de maior
crescimento da fun√ß√£o e sua magnitude representa a taxa m√°xima de varia√ß√£o nesse
ponto. Al√©m disto, o gradiente √© perpendicular aos **conjuntos de n√≠vel**
de $ f $. Um conjunto de n√≠vel $ L_c $ correspondente a $ w = c $ √© o conjunto
de pontos do dom√≠nio onde $ f $ assume o valor $ c $, isto √©, $ L_c = f^{-1}(c)
$.  Para a maioria dos valores de $ c $, $ L_c $ forma uma hipersuperf√≠cie
de dimens√£o $ m - 1 $ dentro do dom√≠nio de $ f $.

Um __ponto cr√≠tico__ de $ f $ √© um ponto $ \mathbf p $ de seu dom√≠nio onde o
gradiente se anula (√© igual ao vetor nulo de $ \mathbb R^m $); em s√≠mbolos,
$$
\nabla f(\mathbf p) = \mathbf 0 = \big(0, 0, \cdots, 0)\,.
$$
Os pontos cr√≠ticos s√£o os candidatos a m√≠nimo e m√°ximo local de $ f $ _no
interior do dom√≠nio_.  Mais precisamente, qualquer m√≠nimo ou m√°ximo local contido
no interior do dom√≠nio tem de ser um ponto cr√≠tico, mas nem todo ponto cr√≠tico √©
necessariamente um extremo local.

__Exemplo:__ Vamos encontrar os pontos cr√≠ticos da fun√ß√£o $ g(x, y, z) = x^2 +
y^2 + z^2 - 4xz + 2y $ definida em todo o $ \mathbb R^3 $. Come√ßamos calculando
o gradiente como antes:

In [13]:
# Definindo as vari√°veis e a fun√ß√£o g:
x, y, z = sym.symbols('x y z')

g = x**2 + y**2 + z**2 - 4*x*z + 2*y

# Calculando o gradiente:
grad_g = sym.derive_by_array(g, (x, y, z))
grad_g

[2*x - 4*z, 2*y + 2, -4*x + 2*z]

Neste caso, igualando o gradiente ao vetor nulo, obtemos um sistema linear de
tr√™s equa√ß√µes nas tr√™s inc√≥gnitas $ x $, $ y $ e $ z $ que pode facilmente ser
resolvido √† m√£o. A √∫nica solu√ß√£o √© $ (0, -1, 0) $. Mas tamb√©m podemos delegar
esta parte do trabalho ao computador usando a fun√ß√£o `sympy.solve` como abaixo:

In [23]:
# Encontrando os pontos cr√≠ticos (gradiente igual a zero):
critical_points = sym.solve(grad_g, (x, y, z))

# Exibindo a solu√ß√£o:
critical_points

{x: 0, y: -1, z: 0}

üìù `sympy.solve` tenta encontrar os zeros _exatos_ de uma fun√ß√£o usando t√©cnicas
alg√©bricas e outras transforma√ß√µes. Se esta solu√ß√£o n√£o puder ser encontrada,
o resultado pode ser uma express√£o impl√≠cita ou param√©trica, ou o SymPy pode
gerar apenas um n√∫mero finito de zeros e ignorar outros.  Para obter
_aproxima√ß√µes num√©ricas_ para a solu√ß√£o, utilize o procedimento `sympy.nsolve`.

__Exerc√≠cio:__ Para cada uma das fun√ß√µes abaixo, determine o gradiente
usando `sympy.derive_by_array` e encontre os pontos cr√≠ticos resolvendo o
sistema de equa√ß√µes formado ao se igualar o gradiente ao vetor nulo com
ajuda do procedimento `sympy.solve`.

(a) $ f(x, y) = x^3 - 3xy^2 $.

(b) $ g(x, y) = \sin(x) \sin(y) $. As solu√ß√µes fornecidas pelo `solve` s√£o exaustivas?

(c) $ h(x, y, z) = x^2 + y^2 + z^2 - 4xz + 2y $.