## Python para *Data Science* e Econometria

***Semana Acadêmica 2025 - Departamento de Economia e Relações Internacionais - UFSC***

Auditório da Reitoria - UFSC

Quinta-feira - **11/09/2025**

Prof. Daniel de Abreu Pereira Uhr

### Seminário "Python para *Data Science* e Econometria"

Este seminário (minicurso introdutório) tem como objetivo introduzir os participantes aos conceitos fundamentais de *Data Science* e Econometria utilizando a linguagem de programação Python básica. Ao longo da apresentação, serão abordados tópicos essenciais para a análise de dados econômicos, incluindo a manipulação de dados, visualização, modelagem estatística e técnicas econométricas básicas.


### Conteúdo

* Por que usar o Python é importante para Economistas?
  * Contexto Atual
    * Capacidade de Geração de Dados
    * AI, AGI e o Futuro do Economista
  * O que diz a literatura sobre o impacto da AI no mercado de trabalho?
  * Linguagens de Programação para Análise Massiva de Dados
  * Diferencial Competitivo
  * Mercado de Trabalho
* Ambiente de Desenvolvimento: Visual Studio Code (VSCode) & Python
  * Python e Jupyter Notebooks
* Manipulação e Visualização de Dados: Pandas, Matplotlib e Seaborn
  * Dados
    * Cross-Section
    * Time Series
    * Panel Data
* Python na Econometria
  * Cross-section
    * Regressão Linear Simples e Múltipla
    * Modelos com *Machine Learning* (EconML)
  * Modelos de Séries Temporais
    * ARIMA
    * Modelos com *Machine Learning*
  * Modelos de Dados em Painel
    * Painel com Efeitos Fixos
    * Modelos com *Machine Learning* para dados em Painel
* Considerações Finais

### Referências

* https://code.visualstudio.com/download
* https://www.python.org/downloads/
* https://miktex.org/download
* https://copilot.github.com/
* https://github.com/Daniel-Uhr


Livro de referência para *Data Science* em python:

* [Introduction to Statistical Learning](https://www.statlearning.com/) by Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani 
* [Python Data Science Handbook](https://jakevdp.github.io/PythonDataScienceHandbook/) by Jake VanderPlas


Outros materiais com uso de python em Economia Matemática, Macroeconomia, e Microeconometria:

* https://python.quantecon.org/intro.html
* https://github.com/matheusfacure/python-causality-handbook
* https://mixtape.scunning.com/
* https://github.com/Daniel-Uhr


***Observações:*** *O material apresentado aqui é uma adaptação do material de aula do Prof. Daniel de Abreu Pereira Uhr, e não deve ser utilizado para fins comerciais. O material é disponibilizado para fins educacionais e de pesquisa, e não deve ser reproduzido sem a devida autorização do autor. Este material pode conter erros e imprecisões. O autor não se responsabiliza por quaisquer danos ou prejuízos decorrentes do uso deste material. O uso deste material é de responsabilidade exclusiva do usuário. Caso você encontre erros ou imprecisões neste material, por favor, entre em contato com o autor para que possam ser corrigidos. O autor agradece qualquer feedback ou sugestão de melhoria.*


## Por que usar o Python é importante para Economistas?

### Contexto Atual

#### Capacidade de Geração de Dados

A ***quantidade de dados produzida nos últimos meses*** pode ser **maior** do que **todo o histórico humano antes da era digital**. Isso ocorre porque nunca houve um período na história com tanta ***conectividade, processamento e armazenamento de informações***. A tendência é que esse crescimento continue, especialmente com a evolução da IA, computação em nuvem e sensores inteligentes.


<div style="text-align:center;">
    <img src="images\CrescData.png"  alt="Imagem" style="width: 650px;"/>
</div>

**Fonte:** International Data Corporation (IDC): https://www.idc.com/; Relatório "Data Age 2025": https://www.seagate.com/files/www-content/our-story/trends/files/Seagate-WP-DataAge2025-March-2017.pdf

**OBS:** Um Zettabyte (ZB) é equivalente a 1 trilhão de Gigabytes (GB).


#### AI, AGI e o Futuro do Economista 

O termo **Inteligência Artificial (IA, ou do inglês "AI" - Artificial Intelligence)** refere-se a um campo da ciência da computação que busca criar ***sistemas e algorítmos*** capazes de executar tarefas que normalmente exigiriam inteligência humana. Essas tarefas incluem ***aprendizado, raciocínio, tomada de decisão, reconhecimento de padrões, processamento de linguagem natural, entre outras***.
  * **algorítimo**: são sequências de passos que resolvem um problema.

Vejamos as subáreas da AI:

<div style="text-align:center;">
    <img src="images\IA_ML_DL.png"  alt="Imagem" style="width: 450px;"/>
</div>

* ***AI:*** Campo amplo da ciência da computação que busca criar sistemas capazes de simular comportamentos humanos inteligentes.
* ***ML:*** Subárea da AI que se concentra no desenvolvimento de algoritmos e modelos que permitem que os computadores aprendam a partir de dados.
* ***DL:*** Subárea do ML que se concentra no desenvolvimento de redes neurais profundas para tarefas de aprendizado de máquina.


#### AGI e o Futuro do Economista

* ***AGI (Inteligência Artificial Geral)***
  * Máquinas capazes de realizar qualquer tarefa intelectual humana.
  * Exige aprendizado, raciocínio, planejamento e autonomia.

* O ***economista não desaparece***, mas seu papel muda:
  * Supervisionar modelos de AI: validar previsões, evitar vieses e erros estatísticos.
  * Interpretar estrategicamente: transformar padrões em decisões econômicas e políticas.
  * Adaptar-se ao mercado: dominar programação e modelagem avançada para se manter relevante.

> Aprender Programação, Ciência de Dados, ML/AI e Econometria Avançada não é competir com a AGI, mas aprender a trabalhar com ela.

#### O que diz a literatura sobre o impacto da AI no mercado de trabalho?


* Teutloff, et al. (2025). *"Winners and Losers of Generative AI: Early Evidence of Shifts in Freelancer Demand"*. Journal of Economic Behavior & Organization, January, 106845 (https://doi.org/10.1016/j.jebo.2024.106845)


<div style="text-align:center;">
    <img src="images\Winners_Losers_AI.png"  alt="Imagem" style="width: 850px;"/>
</div>

* Conclusões:
  * O ChatGPT e outras IAs generativas reduzem a demanda por habilidades que podem ser automatizadas e, ao mesmo tempo, aumentam a demanda por habilidades complementares, como desenvolvimento de software e IA.
  * Trabalhadores menos experientes podem ter dificuldades para competir, enquanto freelancers especializados veem novas oportunidades.
  * O impacto da IA nos mercados de trabalho não é uniforme, e sua adoção depende da implementação por empresas e governos.

> ***A evidência recente mostra que a IA substitui tarefas rotineiras, mas amplia o valor das habilidades complementares. Portanto, aprender Python, ML e econometria não é opcional: é o caminho para estar entre os “vencedores” dessa transformação.***


#### Linguagens de Programação para Análise Massiva de Dados

Linguagens de Programação para Análise Massiva de Dados

* Python (principal escolha):
  * Simples e fácil de aprender.
  * Ecossistema enorme: Pandas, NumPy, Dask, PySpark, TensorFlow, PyTorch.
  * Ideal para Big Data, ML/AI e Econometria Avançada.

* SQL (essencial):
  * Base para bancos de dados relacionais (PostgreSQL, MySQL, SQLite).
  * Fundamental para consultar, extrair e manipular dados em larga escala.

* R (acadêmico):
  * Focado em estatística e visualização (ggplot2, dplyr, tidyr).
  * Forte em aplicações acadêmicas, mas menos escalável.

* Julia (alta performance):
  * Desempenho superior para computação científica.
  * Boa para simulações complexas em economia e engenharia.

***Qual escolher?***

* Python: melhor escolha geral (Big Data, ML, IA, Econometria Avançada).
* SQL: indispensável para trabalhar com bancos de dados.
* R: ótimo em estatística, mas nichado.
* Julia: para quando performance é tudo.

> Neste seminário escolhemos Python porque hoje é a linguagem mais popular do GitHub e a mais demandada no mercado de ciência de dados.

Ver: https://canaltech.com.br/apps/python-vira-a-linguagem-de-programacao-mais-popular-do-github-veja-ranking/


#### Ambiente de Desenvolvimento

O que é uma IDE?
* Integrated Development Environment: ambiente que reúne editor, depuração e integração de pacotes em uma única interface.

Nossa escolha: VSCode (Visual Studio Code)
* Mais popular para Python.
* Gratuito, leve e multiplataforma.
* Suporte a várias linguagens (Python, C++, R, Julia…).
* Extensões poderosas (Python, Jupyter, GitHub, Docker).

Alternativas
* Jupyter Notebook → ótimo para análises exploratórias e ensino (formato .ipynb com código + Markdown).
* PyCharm → IDE completa, indicada para grandes projetos em Python.
* Google Colab → notebooks em nuvem, sem instalação.
* GitHub Codespaces → VSCode na nuvem integrado ao GitHub.

#### Diferencial Competitivo

Com VSCode + Python, o economista pode:
* Automatizar tarefas rotineiras.
* Analisar e visualizar grandes volumes de dados.
* Modelar economias e simular cenários.
* Processar dados massivos (muito além do Excel ou Stata).

Por que importa?
* Bancos, consultorias e empresas de tecnologia buscam economistas que dominem Python.
* Python diferencia o economista tradicional do economista computacional e quantitativo.
* É um diferencial competitivo claro no mercado de trabalho.


#### Exemplo de Oportunidade de Trabalho

* **NetFlix** - USA

<div style="text-align:center;">
    <img src="images\NetFlix1.png"  alt="Imagem" style="width: 650px;"/>
</div>


<div style="text-align:center;">
    <img src="images\NetFlix2.png"  alt="Imagem" style="width: 650px;"/>
</div>


Vaga: https://explore.jobs.netflix.net/careers/job/790299738561 


* **FIESC** - SC/Brasil (Linkedin)

<div style="text-align:center;">
    <img src="images\FIESC_1.jpg"  alt="Imagem" style="width: 650px;"/>
</div>


<div style="text-align:center;">
    <img src="images\FIESC_2.jpg"  alt="Imagem" style="width: 650px;"/>
</div>


### Introdução ao Python e Jupyter Notebooks

### Introdução ao Python e Jupyter Notebooks