# Git LFS

Git LFS (Git Large File Storage) é uma extensão do Git projetada para melhorar o gerenciamento de arquivos grandes dentro de repositórios Git. Ele funciona substituindo arquivos grandes — como datasets, imagens, vídeos ou arquivos binários — por pequenos arquivos de ponteiro no repositório, enquanto armazena o conteúdo real dos arquivos grandes em um armazenamento separado. Isso torna o repositório mais leve e o processo de clonagem e checkout muito mais rápido, pois os arquivos grandes só são baixados quando necessários.

### Utilidade para cientistas de dados
Em ciência de dados, o Git LFS é especialmente útil porque os projetos frequentemente envolvem arquivos grandes, como datasets, modelos treinados, imagens, e arquivos binários. Usar Git LFS permite:
- Manter o repositório Git com tamanho gerenciável, evitando que o download inicial de um projeto seja muito pesado.
- Controlar versões desses grandes arquivos de forma eficiente.
- Facilitar o compartilhamento e colaboração sem impactar a performance do Git em arquivos grandes.

### Como instalar o Git LFS
A instalação pode variar conforme o sistema operacional, mas aqui estão os passos gerais para Linux (Ubuntu, por exemplo):
1. Atualize sua lista de pacotes:
   ```bash
   sudo apt update
   ```
2. Instale o Git LFS:
   ```bash
   sudo apt install git-lfs
   ```
3. Inicialize o Git LFS para o seu usuário:
   ```bash
   git lfs install
   ```
Quando precisar fazer fetch, pode precisar:
```bash
git lfs fetch
git lfs pull
```
git lfs fetch  # Baixa os arquivos LFS para o .git/lfs/objects
git lfs pull   # Baixa e faz checkout dos arquivos no working tree
O git lfs pull é equivalente a git lfs fetch seguido de git lfs checkout.

Esse comando configura o Git para usar o LFS no seu ambiente. Depois, você pode começar a rastrear arquivos grandes com:
```bash
git lfs track "*.extensao"
```
(substitua "*.extensao" pelo tipo de arquivo, como "*.csv" ou "*.bin").

Ex.:
```bash
vscode@codespaces-edcd48:/workspaces/Stats-In-Codespace$ git lfs track "*.zip"
Tracking "*.zip"
vscode@codespaces-edcd48:/workspaces/Stats-In-Codespace$ git lfs track "*.geojson"
Tracking "*.geojson"
vscode@codespaces-edcd48:/workspaces/Stats-In-Codespace$ git lfs track "*.csv"
Tracking "*.csv"
```

Verificando se os arquivos são realmente ponteiros
Se os arquivos aparecem com tamanho pequeno (cerca de 130 bytes), eles são ponteiros LFS, não os arquivos reais. Confirme com:

```bash
git lfs ls-files
```
Este comando lista os arquivos que deveriam ser gerenciados pelo LFS.

Configurações avançadas de fetch
Fetch de todos os objetos LFS
Se você precisa de todos os objetos LFS do histórico, não apenas do commit atual:

```bash
git lfs fetch --all
```
Isso garante que todos os objetos LFS sejam baixados, útil quando há referências antigas.

Fetch por padrões específicos
Para baixar apenas tipos de arquivo específicos:

```bash
git lfs fetch -I "*.bin,*.wav"
```
Você pode combinar inclusões e exclusões para controlar exatamente o que é baixado.


Problemas de permissão e autenticação
Verificando acesso ao repositório
Erros 403 ou falhas silenciosas podem indicar problemas de permissão. Se você tem papel de Developer (em vez de Maintainer/Owner), o acesso LFS pode estar restrito. Verifique com:

```bash
git config lfs.url
```
e compare com a URL do remote origin.

Reinstalando o cliente Git LFS
Em casos de falhas persistentes, reinstale o cliente local:

```bash
git lfs uninstall
git lfs install
```
Isso resolve problemas de configuração corrompida.

Caso especial: arquivos adicionados antes do LFS
Se os arquivos grandes foram commitados antes de configurar o LFS, você precisa migrá-los:

```bash
git lfs migrate import --include="*.bin,*.zip"
``` 
Este comando reescreve o histórico, movendo os arquivos para o LFS.

Em sistemas Windows ou macOS, você pode baixar instaladores no site oficial do Git LFS ou usar o gerenciador de pacotes do sistema.

Em resumo, Git LFS é uma ferramenta essencial para cientistas de dados que trabalham com arquivos grandes em repositórios Git, melhorando a eficiência do versionamento e colaboração.[1][2][3][4]

[1](https://docs.github.com/pt/desktop/configuring-and-customizing-github-desktop/about-git-large-file-storage-and-github-desktop)
[2](https://www.atlassian.com/br/git/tutorials/git-lfs)
[3](https://www.datacamp.com/pt/tutorial/git-large-file-storage-lfs)
[4](https://docs.github.com/pt/repositories/working-with-files/managing-large-files/installing-git-large-file-storage)
[5](https://www.dio.me/articles/otimize-seu-repositorio-git-com-git-lfs-para-arquivos-grandes)
[6](https://translate.google.com/translate?u=https%3A%2F%2Fwww.perforce.com%2Fblog%2Fvcs%2Fhow-git-lfs-works&hl=pt&sl=en&tl=pt&client=srp)
[7](https://translate.google.com/translate?u=https%3A%2F%2Fwww.atlassian.com%2Fgit%2Ftutorials%2Fgit-lfs&hl=pt&sl=en&tl=pt&client=srp)
[8](https://translate.google.com/translate?u=https%3A%2F%2Fgraphite.dev%2Fguides%2Fhow-to-install-git-lfs-on-ubuntu&hl=pt&sl=en&tl=pt&client=srp)
[9](https://cursa.app/pt/pagina/git-lfs-large-file-storage-para-grandes-arquivos)
[10](https://translate.google.com/translate?u=https%3A%2F%2Fgit-lfs.com%2F&hl=pt&sl=en&tl=pt&client=srp)
[11](https://translate.google.com/translate?u=https%3A%2F%2Fvalohai.com%2Fblog%2Fgit-for-data-science%2F&hl=pt&sl=en&tl=pt&client=srp)
[12](https://www.youtube.com/watch?v=aRA66OnfH4A)
[13](https://www.youtube.com/watch?v=rQ8irmJbeek)
[14](https://docs.github.com/pt/repositories/working-with-files/managing-large-files/about-git-large-file-storage)
[15](https://www.reddit.com/r/learnpython/comments/akrr4e/data_scientists_using_python_and_git_can_you/)
[16](https://translate.google.com/translate?u=http%3A%2F%2Fsmpte-staticwebsite-staging.s3-website-us-east-1.amazonaws.com%2Ftutorials%2Fgit-lfs-tutorial.html&hl=pt&sl=en&tl=pt&client=srp)
[17](https://gamedeveloper.com.br/unity-git-lfs/)
[18](https://translate.google.com/translate?u=https%3A%2F%2Fdocs.gitlab.com%2Ftopics%2Fgit%2Flfs%2F&hl=pt&sl=en&tl=pt&client=srp)
[19](https://pt.linkedin.com/pulse/uso-de-git-para-data-science-albert-mazuz-hlm9f)
[20](https://translate.google.com/translate?u=https%3A%2F%2Fwww.geeksforgeeks.org%2Finstallation-guide%2Fhow-to-install-git-large-file-storage-on-linux%2F&hl=pt&sl=en&tl=pt&client=srp)