## Introdução à *Data Science* e à Econometria com Python

***Semana Acadêmica 2025 - Departamento de Economia e Relações Internacionais - UFSC***

Auditório da Reitoria - UFSC

**11/09/2025**

Prof. Daniel de Abreu Pereira Uhr

### Minicurso "Introdução à *Data Science* e à Econometria com Python"

Este minicurso tem como objetivo introduzir os participantes aos conceitos fundamentais de *Data Science* e Econometria utilizando a linguagem de programação Python. Ao longo do curso, serão abordados tópicos essenciais para a análise de dados econômicos, incluindo a manipulação de dados, visualização, modelagem estatística e técnicas econométricas básicas.


### Conteúdo Programático

* Por que usar o Python é importante para Economistas?
  * Contexto Atual
    * Capacidade de Geração de Dados
    * AI, AGI e o Futuro do Economista
  * O que diz a literatura sobre o impacto da AI no mercado de trabalho?
  * Linguagens de Programação para Análise Massiva de Dados
  * Diferencial Competitivo
  * Vagas de Emprego
* Ambiente de Desenvolvimento: Visual Studio Code (VSCode) & Python
  * Introdução ao Python e Jupyter Notebooks
* Manipulação e Visualização de Dados: Pandas, Matplotlib e Seaborn
  * Dados
    * Cross-Section
    * Time Series
    * Panel Data
* Python para Econometria
  * Cross-section
    * Regressão Linear Simples e Múltipla
    * Modelos de Machine Learning (EconML)
  * Modelos de Séries Temporais
    * ARIMA
    * Modelos de Machine Learning 
  * Modelos de Dados em Painel
    * Painel com Efeitos Fixos
    * Modelos de Machine Learning para dados em Painel
* Considerações Finais

### Referências

* https://code.visualstudio.com/download
* https://www.python.org/downloads/
* https://miktex.org/download
* https://copilot.github.com/
* https://github.com/Daniel-Uhr


Livro de referência parte de dados:
* [Introduction to Statistical Learning](https://www.statlearning.com/) by Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani 
* [Python Data Science Handbook](https://jakevdp.github.io/PythonDataScienceHandbook/) by Jake VanderPlas

Outros materiais:

* https://python.quantecon.org/intro.html


***Observações:*** *O material apresentado aqui é uma adaptação do material de aula do Prof. Daniel de Abreu Pereira Uhr, e não deve ser utilizado para fins comerciais. O material é disponibilizado para fins educacionais e de pesquisa, e não deve ser reproduzido sem a devida autorização do autor. Este material pode conter erros e imprecisões. O autor não se responsabiliza por quaisquer danos ou prejuízos decorrentes do uso deste material. O uso deste material é de responsabilidade exclusiva do usuário. Caso você encontre erros ou imprecisões neste material, por favor, entre em contato com o autor para que possam ser corrigidos. O autor agradece qualquer feedback ou sugestão de melhoria.*


### Por que usar o Python é importante para Economistas?

### Contexto Atual

#### Capacidade de Geração de Dados

A ***quantidade de dados produzida nos últimos meses*** pode ser **maior** do que **todo o histórico humano antes da era digital**. Isso ocorre porque nunca houve um período na história com tanta ***conectividade, processamento e armazenamento de informações***. A tendência é que esse crescimento continue, especialmente com a evolução da IA, computação em nuvem e sensores inteligentes.


<div style="text-align:center;">
    <img src="images\CrescData.png"  alt="Imagem" style="width: 650px;"/>
</div>

**Fonte:** International Data Corporation (IDC): https://www.idc.com/; Relatório "Data Age 2025": https://www.seagate.com/files/www-content/our-story/trends/files/Seagate-WP-DataAge2025-March-2017.pdf

**OBS:** Um Zettabyte (ZB) é equivalente a 1 trilhão de Gigabytes (GB).


#### AI, AGI e o Futuro do Economista 

**AI**

O termo **Inteligência Artificial (IA, ou do inglês "AI" - Artificial Intelligence)** refere-se a um campo da ciência da computação que busca criar ***sistemas e algorítmos*** capazes de executar tarefas que normalmente exigiriam inteligência humana. Essas tarefas incluem ***aprendizado, raciocínio, tomada de decisão, reconhecimento de padrões, processamento de linguagem natural, entre outras***.
  * **algorítimo**: são sequências de passos que resolvem um problema.

Vejamos as subáreas da AI:

<div style="text-align:center;">
    <img src="images\IA_ML_DL.png"  alt="Imagem" style="width: 450px;"/>
</div>

* ***AI:*** Campo amplo da ciência da computação que busca criar sistemas capazes de simular comportamentos humanos inteligentes.
* ***ML:*** Subárea da AI que se concentra no desenvolvimento de algoritmos e modelos que permitem que os computadores aprendam a partir de dados.
* ***DL:*** Subárea do ML que se concentra no desenvolvimento de redes neurais profundas para tarefas de aprendizado de máquina.


#### AGI e o Futuro do Economista

A ***Inteligência Artificial Geral (AGI)*** é um campo da AI que busca criar ***máquinas capazes de realizar qualquer tarefa intelectual que um ser humano possa fazer***. A AGI é um dos campos mais desafiadores da IA, pois exige que as *máquinas tenham a capacidade de aprender, raciocinar, planejar e resolver problemas de forma autônoma*.

***Eu entendo que se a Inteligência Geral Artificial (AGI) for capaz de processar dados e modelar economias com precisão superior à humana, o papel do economista NÃO desaparecerá, mas será redefinido***. O economista que dominar Programação, Ciência de Dados, Machine Learning (ML)/AI, e Inferência Causal, terá grandes vantagens:

* ***Capacidade de validar e supervisionar modelos de AI***
  * Mesmo que a AGI tome decisões, será necessário um economista para interpretar, validar e justificar suas previsões e recomendações.
  * Reguladores e tomadores de decisão precisarão de economistas que compreendam os modelos para evitar viés algorítmico, erros estatísticos e distorções econômicas inesperadas.
* ***Interpretação e uso estratégico da AI***
  * A AI pode encontrar padrões ocultos nos dados, mas não substitui o julgamento humano sobre implicações econômicas, políticas e sociais.
  * Modelos de AI são ótimos para previsão, mas a tomada de decisão em ambientes com incerteza e restrições políticas ainda exigirá economistas com visão estratégica.
* ***Adaptação ao novo mercado de trabalho***
  * Profissionais que não dominam ferramentas quantitativas modernas ficarão obsoletos mais rapidamente.
  * Economistas com habilidades em programação e modelagem avançada terão mais oportunidades, pois estarão na vanguarda da aplicação de AI na economia.

> ***Eu entendo que aprender Programação, Ciência de Dados, Machine Learning (ML)/AI, e Econometria Avançada, não é sobre competir com a  AGI, mas sim sobre trabalhar junto com ela, aproveitando o potencial da AI enquanto se mantém relevante no mercado.***

#### O que diz a literatura sobre o impacto da AI no mercado de trabalho?


Temos um artigo recente que trabalha esse tema que estamos discutindo: *"Winners and Losers of Generative AI: Early Evidence of Shifts in Freelancer Demand"* 
  * Journal of Economic Behavior & Organization, Available online 29 January 2025, 106845 (https://doi.org/10.1016/j.jebo.2024.106845)


<div style="text-align:center;">
    <img src="images\Winners_Losers_AI.png"  alt="Imagem" style="width: 850px;"/>
</div>

O artigo analisa o impacto do ChatGPT na demanda por freelancers em uma plataforma de trabalho online. Os autores categorizam habilidades como substituíveis, complementares ou não afetadas pelos modelos de IA generativa e utilizam um modelo de Diferenças-em-Diferenças (DiD) para avaliar os efeitos da adoção do ChatGPT no mercado de trabalho digital.

* Conclusões:
  * O ChatGPT e outras IAs generativas reduzem a demanda por habilidades que podem ser automatizadas e, ao mesmo tempo, aumentam a demanda por habilidades complementares, como desenvolvimento de software e IA.
  * Trabalhadores menos experientes podem ter dificuldades para competir, enquanto freelancers especializados veem novas oportunidades.
  * O impacto da IA nos mercados de trabalho não é uniforme, e sua adoção depende da implementação por empresas e governos.

Parece que esse trabalho corrobora com os argumentos que levantamos anteriormente.


#### Linguagens de Programação para Análise Massiva de Dados

A principal linguagem para lidar com ***Big Data, Ciência de Dados, Machine Learning (ML)/AI, e Econometria Avançada*** é Python. No entanto, outras linguagens desempenham papéis importantes dependendo do contexto e da aplicação. 

* **Python:** 
  * ***Por que é a principal?***
    * A mais usada para análise e modelagem devido a sua simplicidade e facilidade de aprendizado.
    * Grande número de bibliotecas para manipulação e análise de Big Data (Pandas, NumPy, Dask, Polars, PySpark)
    * Suporte robusto para Machine Learning e Deep Learning (Scikit-Learn, TensorFlow, PyTorch).
    * Integração fácil com bancos de dados SQL e NoSQL.
  * ***Quando usar?***
    * Para análise de dados massivos e aprendizado de máquina.
    * Para pesquisa em IA e modelos estatísticos avançados.

* **SQL:** 
  * ***Por que é importante?***
    * Linguagem padrão para manipulação de bancos de dados relacionais (PostgreSQL, MySQL, SQLite).
    * Permite consultas complexas e eficientes em grandes volumes de dados.
    * Integração com Python e outras linguagens de programação.
  * ***Quando usar?***
    * Para consultas em bancos de dados relacionais.
    * Para extração e manipulação de dados de bancos de dados.

* **R:** 
  * ***Por que é importante?***
    * Linguagem especializada em estatística e visualização de dados.
    * Grande número de pacotes para análise de dados (dplyr, ggplot2, tidyr).
  * ***Quando usar?***
    * Para análise estatística e visualização de dados.
    * Para aplicações acadêmicas e experimentais.

* **Julia:** 
  * ***Por que é importante?***
    * Alta performance para computação científica.
    * Mais rápida que Python para certas aplicações.
  * ***Quando usar?***
    * Para simulações computacionais em economia, finanças e engenharia.
    * Quando performance extrema é necessária.

***Qual linguagem de programação escolher?***

* Python → Melhor escolha geral para Big Data, Machine Learning e IA.
* SQL → Essencial para manipular bancos de dados massivos.
* R → Bom para estatística e modelagem econômica, mas menos escalável.
* Julia → Para computação de alta performance e ciência de dados pesada.


**Nesse curso escolhemos a linguagem de programação Python.** 

  * Python é a linguagem de programação mais popular do GitHub. (https://canaltech.com.br/apps/python-vira-a-linguagem-de-programacao-mais-popular-do-github-veja-ranking/)

#### Ambiente de Desenvolvimento

**Mas qual Ambiente de Desenvolvimento (Integrated Development Environment - IDE) devo utilizar para o Python?**

Agora precisamos de um ambiente para programar em Python, **IDE** é a sigla para ***Integrated Development Environment***, ou Ambiente de Desenvolvimento Integrado. Isso nada mais é do que um software que reúne ferramentas de desenvolvimento em uma única interface gráfica do usuário (GUI).

O **Visual Studio Code (VSCode) é o editor mais popular e amplamente utilizado para desenvolvimento em Python**. É um editor de código-fonte desenvolvido pela Microsoft, que oferece suporte a várias linguagens de programação, incluindo Python, C++, C#, Java, JavaScript, TypeScript, HTML, CSS, entre outras.

#### Diferencial Competitivo

Com o ***VSCode e Python o Economista pode automatizar tarefas rotineiras, analisar dados, criar visualizações, modelar economias e simular cenários***. Além disso, Scripts Python podem processar grandes volumes de dados rapidamente, algo impossível em Excel ou Stata.

***É um diferencial competitivo***. Bancos, consultorias e empresas de tecnologia contratam economistas com habilidades em Python para modelagem econômica e análise preditiva. O domínio de Python diferencia um economista tradicional de um economista computacional e quantitativo.


#### Exemplo de Oportunidade de Trabalho

* **NetFlix**

<div style="text-align:center;">
    <img src="images\NetFlix1.png"  alt="Imagem" style="width: 650px;"/>
</div>


<div style="text-align:center;">
    <img src="images\NetFlix2.png"  alt="Imagem" style="width: 650px;"/>
</div>


Vaga: https://explore.jobs.netflix.net/careers/job/790299738561 

### Introdução ao Python e Jupyter Notebooks

### Introdução ao Python e Jupyter Notebooks