## Machine Learning Operations (MLOps)

In [1]:
from IPython.core.display import HTML

def load_css():
    styles = open("custom.css", "r").read()
    return HTML(f"<style>{styles}</style>")

load_css()

## Importando os pacotes do projeto
Vamos centralizar nesta célula a importação de todos os pacotes que iremos utilizar neste notebook

## Servindo o modelo por meio de um endpoint com alta escalabilidade
Algumas vezes, seu modelo deverá ser exposto por meio de um endpoint de inferência. Este endpoint (em geral REST ou gRPC) pode ser usado por aplicações
de terceiros para fazer predições em tempo real. Precisamos pensar em um processo simples e escalável de deployment.
    
https://mlflow.org/docs/latest/deployment/index.html

<div class="custom-slide">
    <h1>Conclusão</h1>
    <p>
       Podemos concluir então que nosso projeto atual já possui 2 dos 3 ambientes destacados na arquitetura de referência: dev environment e local inference. Ainda precisamos configurar o productin environment.
    </p>
    <p>
       Porém, antes de configurar o production environment, vamos criar um modelo customizado para o nosso projeto, no qual tanto o algoritmo K-Means quanto nossas regras de negócio fazem parte do modelo.
    </p>
</div>

<div class="custom-slide">
    <h1>Mesmo assim, nem sempre as coisas são tão simples na vida real...</h1>
    <p>
       Temos dois probleminhas importantes para resolver:
    </p>
    <ol>
        <li>Queremos fazer o deployment do modelo completo, não apenas do K-Means</li>
        <li>Embora o MLFlow forneça recursos interessantes de model serving, aparentemente teremos problemas de escalabiidade (imagem abaixo)</li>
    </ol>
    <img src="images/mlflow-local-serving.png" alt="Sample Image" style="width:100%;border-radius:10px;">
    <span class="image-ref">Source: https://mlflow.org/docs/latest/deployment/deploy-model-locally.html</span>
</div>

<div class="custom-slide">
    <h1>Conclusão</h1>
    <p>
       Arquitetura:
    </p>
    <img src="images/mlflow-prod-deployment.png" alt="Sample Image" style="width:100%;border-radius:10px;">
    <span class="image-ref">Source: https://mlflow.org/docs/latest/deployment/index.html#id1</span>
</div>

### Enviando o modelo para o S3

Primeiramente, vamos copiar o modelo para um bucket do S3. Para que o comando abaixo funcione, você precisa configurar as seguintes variáveis de ambiente na sua máquina: AWS_ACCESS_KEY_ID e AWS_SECRET_ACCESS_KEY

In [42]:
# Define the model path and destination
model_path = f"mlruns/{mlflow_experiment.experiment_id}/{run_id}/artifacts/model"
destination = "./mlflow_model"

# Copy the model directory to the destination
if os.path.exists(destination):
    shutil.rmtree(destination)
    
shutil.copytree(model_path, destination)

# Define your S3 bucket and the desired path in the bucket
s3_bucket = "mlflow-s3-bucket"
s3_path = "bootcamp/clustering-model"

# Initialize the S3 client
s3_client = boto3.client('s3')

# Upload the model directory to S3
for root, dirs, files in os.walk(destination):
    for file in files:
        local_path = os.path.join(root, file)
        relative_path = os.path.relpath(local_path, destination)
        s3_file_path = os.path.join(s3_path, relative_path)
        
        s3_client.upload_file(local_path, s3_bucket, s3_file_path)
        print(f"Uploaded {local_path} to s3://{s3_bucket}/{s3_file_path}")

Uploaded ./mlflow_model/python_env.yaml to s3://mlflow-s3-bucket/bootcamp/clustering-model/python_env.yaml
Uploaded ./mlflow_model/requirements.txt to s3://mlflow-s3-bucket/bootcamp/clustering-model/requirements.txt
Uploaded ./mlflow_model/MLmodel to s3://mlflow-s3-bucket/bootcamp/clustering-model/MLmodel
Uploaded ./mlflow_model/python_model.pkl to s3://mlflow-s3-bucket/bootcamp/clustering-model/python_model.pkl
Uploaded ./mlflow_model/registered_model_meta to s3://mlflow-s3-bucket/bootcamp/clustering-model/registered_model_meta
Uploaded ./mlflow_model/conda.yaml to s3://mlflow-s3-bucket/bootcamp/clustering-model/conda.yaml
Uploaded ./mlflow_model/artifacts/clustering_model.joblib to s3://mlflow-s3-bucket/bootcamp/clustering-model/artifacts/clustering_model.joblib
Uploaded ./mlflow_model/artifacts/app_config.ini to s3://mlflow-s3-bucket/bootcamp/clustering-model/artifacts/app_config.ini
Uploaded ./mlflow_model/metadata/python_env.yaml to s3://mlflow-s3-bucket/bootcamp/clustering-model/

### Configurando o `kubernetes-dashboard`

Antes de mais nada, vamos configurar o `kubernetes-dashboard` para que possamos ter acesso ao nosso local Kubernetes cluster via UI.

https://kubernetes.io/docs/tasks/access-application-cluster/web-ui-dashboard/ <br>
https://github.com/kubernetes/dashboard/blob/master/docs/user/access-control/creating-sample-user.md

`kubectl apply -f dist/kubernetes/dashboard-admin.yaml`<br>
`kubectl apply -f dist/kubernetes/dashboard-admin-rolebinding.yaml`

Você pode pegar o token para acessar a aplicação da seguinte forma:

`kubectl -n kubernetes-dashboard create token admin-user`

Por fim, basta digitar <br>`kubectl proxy`

A aplicação ficará disponível em: <br>
http://localhost:8001/api/v1/namespaces/kubernetes-dashboard/services/https:kubernetes-dashboard:/proxy/#/login

## Kubernetes deployment

### Cluster
Criando um novo cluster <br>
`kind create cluster --name bootcamp-cluster`

Informações do cluster <br>
`kubectl cluster-info --context kind-bootcamp-cluster`

### Contexto

Context atual <br>
`kubectl config current-context`

Verifica os contextos existentes <br>
`kubectl config get-contexts`

Usa um contexto existente <br>
`kubectl config use-context kind-bootcamp-cluster`

### Namespace

Cria um namaspace <br>
`kubectl create namespace bootcamp-namespace`

Lista os namespaces <br>
`kubectl get namespace/bootcamp-namespace`

### Resources

Lista os resources do tipo inferenceservice<br>
`kubectl get inferenceservice --namespace bootcamp-namespace` 

Descreve o resource <br>
`kubectl describe inferenceservice my-mlflow-model --namespace bootcamp-namespace`


### Seldon deployment

Cria o deployment: `kubectl apply -f dist/kubernetes/seldon-deployment.yaml`<br>
Acompanha o deployment: `kubectl rollout status deploy/$(kubectl get deploy -l seldon-deployment-id=mlflow -o jsonpath='{.items[0].metadata.name}')` <br>
Recupera as informações do deployment: `kubectl get seldondeployment` <br>
Reupera as informações do serviço: `kubectl describe seldondeployment mlflow` <br>
Lista os pods: `kubectl get pods -n default` <br>
Acessa os logs: `kubectl logs <<pod-name>>`

In [None]:
kubectl apply -f dist/kubernetes/test.yaml

In [60]:
X=!curl -s -d '{"inputs":[{"name":"INPUT0","data":[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16],"datatype":"INT32","shape":[1,16]},{"name":"INPUT1","data":[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16],"datatype":"INT32","shape":[1,16]}]}'  \
        -X POST http://0.0.0.0:8003/seldon/seldon/triton/v2/models/simple/infer \
        -H "Content-Type: application/json"
X
#d=json.loads(X[0])
##print(d)
#assert(d["outputs"][0]["data"][0]==2)

[]

In [None]:
kubectl create secret generic aws-secret \
  --from-literal=AWS_ACCESS_KEY_ID='AKIA6IQSWMH33M4B57NC' \
  --from-literal=AWS_SECRET_ACCESS_KEY='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'



mlflow models build-docker -m runs:/c45238ebb05442eb8ba33ee86a583591/model -n hackinganalytics/my-mlflow-model --enable-mlserver
docker push weslleymoura/my-mlflow-model

In [None]:
kubectl port-forward -n istio-system svc/istio-ingressgateway 8080:80