Se importan las librerías necesarias

In [1]:
# Librerías para manejo del sistema
import os
from pathlib import Path

# Librerías para manejar accesos a datos (SQL y API)
from sqlalchemy import create_engine
import xmlrpc.client

# Librerías para ciencia de datos
import pandas as pd
import numpy as np

# Librerías para graficación de datos
import matplotlib.pyplot as plt
import seaborn as sns

Se importan variables de entorno

In [2]:
api_url = os.environ.get('ODOO_URL_API')
api_db = os.environ.get('ODOO_DB_API')
# api_db = os.environ.get('ODOO_DB_PRUEBA_API')
api_username = os.environ.get('ODOO_USERNAME_API')
api_clave = os.environ.get('ODOO_CLAVE_API')

Se instancia el objeto engine para manejar el acceso a la base de datos local

In [3]:
db_file = 'local_db.db'
db_file_path_str = str(Path().cwd().parent.joinpath(Path(f'data/{db_file}')))

engine = create_engine(f'sqlite:///{db_file_path_str}')

Se instancia el objeto models para ejecutar métodos a los modelos del API de Odoo

In [4]:
common = xmlrpc.client.ServerProxy(f'{api_url}/xmlrpc/2/common')
uid = common.authenticate(api_db, api_username, api_clave, {})
models = xmlrpc.client.ServerProxy(f'{api_url}/xmlrpc/2/object')

# <span style="color:steelblue">Funciones<span>

In [5]:
def if_list_gt0_idex (item: dict, key: str, index:int ) -> None | int:
        val = item[key]

        if val:
            if len(val) == 0:
                return None
            else:
                return val[index]
        else:
            return None

# <span style="color:steelblue">Descripciones DataFrames<span>

In [6]:
desc_uripsers_fields = ['name', 'state', 'sale_team_id']
descrip_users_json = models.execute_kw(api_db, uid, api_clave, 'res.users', 'search_read', [], {'fields': desc_uripsers_fields})

descrip_users_data = []

for user in descrip_users_json:
    new = {}
    new['id'] = user['id']
    new['name'] = user['name']
    new['state'] = user['state']
    new['sale_team_id'] = if_list_gt0_idex(user, 'sale_team_id', 0)
    new['sale_team_description'] = if_list_gt0_idex(user, 'sale_team_id', 1)

    descrip_users_data.append(new)


descrip_users_df = pd.DataFrame(descrip_users_data)
descrip_users_df['sale_team_id'] = descrip_users_df['sale_team_id'].astype('Int64')

descrip_users_df.loc[descrip_users_df['sale_team_id'].isin([5,6]), 'business_model'] = 'Piso'
descrip_users_df.loc[descrip_users_df['sale_team_id'].isin([7,8]), 'business_model'] = 'CE'
descrip_users_df.loc[descrip_users_df['sale_team_id'].isin([5,7]), 'warehouse'] = 'A1'
descrip_users_df.loc[descrip_users_df['sale_team_id'].isin([6,8]), 'warehouse'] = 'A2'

descrip_sales_users_df  = descrip_users_df.loc[~descrip_users_df['sale_team_id'].isna()]

# <span style="color:steelblue">Algoritmo<span>

Se buscan los ids de las facturas en el modelo <font color="#F414FA">account.move</font> con los criterios de búsqueda `search_fact`. Esto devuelve una lista de enteros (ids de estas facturas) que se almacena en `fact_doc_ids`.

Después, se especifican los campos necesarios de este modelo en `fact_doc_fields` y se genera la lectura de los ids anteriores. Esto devuelve una lista de diccionarios con la información de cada factura que se almacena en `fact_doc_json`

In [7]:
search_fact = ["&", "&", "&",
          ("state", "=", "posted"),
          ("invoice_date", ">=", "2024-02-01"), 
          ("invoice_date", "<=", "2024-02-29"), 
          ("journal_id", "in", [10, 90, 30, 97])]

fact_doc_fields = [
          'name',
          'invoice_date',
          'state',
          'reversed_entry_id',
          'reversal_move_id',
          'journal_id',
          'company_id',
          'invoice_origin',
          'pos_order_ids',
          'line_ids',
          'partner_id',
          'move_type',
          'invoice_user_id'
          ]

fact_doc_ids = models.execute_kw(api_db, uid, api_clave, 'account.move', 'search', [search_fact])
fact_doc_json = models.execute_kw(api_db, uid, api_clave, 'account.move', 'read', [fact_doc_ids], {'fields': fact_doc_fields})


El esquema que se obtiene en el modelo de `fact_doc_json` es un esquema donde cada renglón es una factura. Sin embargo, lo que ocupamos es un esquema donde cada renglón es una línea de producto de cada una de las facturas que se encuentran en `fact_doc_json`.

Para hacer esto se preparan los datos con un ciclo <font color="#14E4FA">for</font> donde se manipula `fact_doc_json`. Para cada factura dentro de este modelo, se utiliza el campo llamado <font color="#14FA4C">"line_ids"</font> (que son la cantidad de líneas que tiene cada factura) para que con un segundo ciclo "for" se genere un diccionario de "línea de factura" por cada "línea de factura" que tiene cada documento de factura.

Este diccionario ya manipulado se ingresa a una lista vacía `data_fact`. La lista ya cargada con todos sus elementos es la que se convierte en el DataFrame `fact_doc_df`. Este data frame sólo tiene información de la factura, no hay información de sus líneas, sólo el id de ellas.

Para obtener la información de las líneas de factura se genera `fact_doc_ids`, el cual es el listado de los ids de las líneas de cada factura del trabajo anterior. Esto es importante porque se asegura que las ids de línea vienen únicamente de las ids de las facturas que se especificaron en los criterios de búsqueda generales `search_fact`.

In [8]:
data_fact = []
fact_line_ids = []

for fact in fact_doc_json:
    for line in fact['line_ids']:
        new = {}
        new['fact_doc_id'] = fact['id']
        new['name'] = fact['name']
        new['invoice_date'] = fact['invoice_date']
        new['state'] = fact['state']
        new['invoice_origin'] = fact['invoice_origin']
        new['module_origin'] = None
        new['pos_doc_id'] = if_list_gt0_idex(fact, 'pos_order_ids', 0)
        new['move_type'] = fact['move_type']
        new['reversal_move_id'] = if_list_gt0_idex(fact, 'reversal_move_id', 0)
        new['reversed_entry_id'] = if_list_gt0_idex(fact, 'reversed_entry_id', 0)
        new['journal_id'] = fact['journal_id'][0]
        new['company_id'] = fact['company_id'][0]
        new['partner_id'] = fact['partner_id'][0]
        new['fact_line_id'] = line
        new['invoice_user_id'] = fact['invoice_user_id'][0]

        if not fact['invoice_origin']:
            new['module_origin'] = 'Contabilidad'
        elif fact['invoice_origin'][:2] in ['Pd', 'Sh']:
                new['module_origin'] = 'PdV'
        elif fact['invoice_origin'][0] == 'S':
                new['module_origin'] = 'Ventas'


        fact_line_ids.append(line)
        data_fact.append(new)



fact_doc_df = pd.DataFrame(data_fact)


fact_doc_df['invoice_date'] = pd.to_datetime(fact_doc_df['invoice_date'], format='%Y-%m-%d')
fact_doc_df['pos_doc_id'] = fact_doc_df['pos_doc_id'].astype('Int64')
fact_doc_df['reversal_move_id'] = fact_doc_df['reversal_move_id'].astype('Int64')
fact_doc_df['reversed_entry_id'] = fact_doc_df['reversed_entry_id'].astype('Int64')
fact_doc_df.loc[fact_doc_df['invoice_origin'] == False , ['invoice_origin',]] = pd.NA


check_1 =  len(fact_doc_df[fact_doc_df['module_origin'].isna()]) == 0

Se especifican los campos necesarios `fact_line_fields` para que con `fact_line_ids` (que se generó arriba) se pueda obtener la información del modelo <font color="#F414FA">account.move.line</font>. Esto devuelve una lista de diccionarios con la información de cada línea de factura que se almacena en `fact_line_json`.

In [9]:
fact_line_fields = [
    'product_id',
    'quantity',
    'price_unit',
    'discount',
    'account_id',
    'price_subtotal',
    'sale_line_ids'
]

fact_line_json = models.execute_kw(api_db, uid, api_clave, 'account.move.line', 'read', [fact_line_ids], {'fields': fact_line_fields})

Se preparan los datos con un ciclo <font color="#14E4FA">for</font> donde se manipula `fact_line_json` y se genera un diccionario "línea de factura". Este diccionario ya manipulado se ingresa a una lista vacía `data_line_fact`. La lista ya cargada con todos sus elementos es la que se convierte en el DataFrame `fact_line_df`.

In [10]:
data_line_fact = []

for fact_line in fact_line_json:
    if fact_line['account_id'] and fact_line['account_id'][0] in [85, 197]:
        new = {}
        new['fact_line_id'] = fact_line['id']
        new['product_id'] = fact_line['product_id'][0]
        new['quantity'] = fact_line['quantity']
        new['price_unit'] = fact_line['price_unit']
        new['discount'] = fact_line['discount'] / 100
        new['price_subtotal'] = fact_line['price_subtotal']
        new['sale_line_id_fact'] = if_list_gt0_idex(fact_line, 'sale_line_ids', 0)

        data_line_fact.append(new)


fact_line_df = pd.DataFrame(data_line_fact)


fact_line_df['fact_line_id'] = fact_line_df['fact_line_id'].astype('Int64')
fact_line_df.loc[fact_line_df['product_id'] == False, ['product_id',]] = pd.NA
fact_line_df['product_id'] = fact_line_df['product_id'].astype('Int64')
fact_line_df['sale_line_id_fact'] = fact_line_df['sale_line_id_fact'].astype('Int64')

Con los dos dataframe anteriores, se procede a generar un <font color="#14E4FA">merge</font> en unión derecha, esto debido a que queremos despreciar todo los id de línea de `fact_doc_df` que tienen un id del campo <font color="#14FA4C">"account_id"</font> diferente a 85 y 197 y que solo se pueden filtrar con la información de `fact_line_df`. Ahora, el dataframe resultante `fact_df` tiene un seguimiento desde la factura hasta cada una de sus líneas con toda la información de ellas. 

In [11]:
fact_df = fact_doc_df.merge(fact_line_df, how='right', on='fact_line_id')

Para llegar al modelo <font color="#F414FA">sale.order</font> desde el modelo <font color="#F414FA">account.move</font> es necesario en ocasiones pasar por el modelo <font color="#F414FA">pos.order</font>. 

Para obtener los ids de este modelo, es importante asegurar que vienen únicamente de las ids de las facturas que se especificaron en los criterios de búsqueda generales `search_fact`. Para ello, hay que acceder al modelo de factura, a un campo llamado <font color="#14FA4C">"pos_order_ids"</font> que es donde se encuentra el id del documento pos. Es por esto que no se debe obtener los ids del pos usando un filtro diferente.

Se porcede a hacer un <font color="#14E4FA">for</font> en `fact_doc_ids`, donde para cada factura se accesa al campo <font color="#14FA4C">"pos_order_ids"</font> y se obtiene el id del documento del pos (PdV). Este id es único para cada factura, y se ingresa a la lista `pos_doc_ids`.

In [12]:
pos_doc_ids = []

for fact in fact_doc_json:
    if fact['pos_order_ids']:
        pos_doc_ids.append(fact['pos_order_ids'][0])

Hay facturas que se hacen duplicando facturas que se cancelan. Esto significa que las nuevas facturas no tienen un pos_doc_id y por lo tanto no se encuentra la información que se desea. Sin embargo, estas facturas duplicadas sí tienen en el campo <font color="#14FA4C">"invoice_origin"</font> el rastro de qué PdV tienen.

Se procede a filtrar estas facturas y hacer una lista de los nombres de ellas. Se guarda esta lista en `pos_doc_name_extra` y con estos nombres se buscan los ids en el modelo <font color="#F414FA">pos.order</font>. Devuelve esta búsqueda un json `pos_doc_json`.

Utilizando un ciclo <font color="#14E4FA">for</font>, se utiliza `pos_doc_json` para complementar `pos_doc_ids` con las ids de tipo documento faltantes.

In [13]:
pos_doc_name_extra = list(fact_df.loc[(fact_df['module_origin'] == 'PdV') & (fact_df['pos_doc_id'].isna()), 'invoice_origin'].unique())

search_pos = [
    ("name", "in", pos_doc_name_extra),
]

pos_doc_fields = [
    'name'
]

pos_doc_ids_extra = models.execute_kw(api_db, uid, api_clave, 'pos.order', 'search', [search_pos])
pos_doc_json_extra = models.execute_kw(api_db, uid, api_clave, 'pos.order', 'read', [pos_doc_ids_extra], {'fields': pos_doc_fields})

for pos in pos_doc_json_extra:
    pos_doc_ids.append(pos['id'])

Además del trabajo anterior, se ocupa complementar en `fact_df` los ids de documento `pos_doc_ids` de las facturas encontradas en `pos_doc_json_extra`. Se logra esto al generar un for de cada item del json y por ".loc" se agrega a `fact_df`.

In [14]:
for item in pos_doc_json_extra:
    fact_df.loc[fact_df['invoice_origin'] == item['name'], 'pos_doc_id'] = item['id']

`pos_doc_ids` son ids tipo documento y no son las mismas que las ids que ocupa el modelo <font color="#F414FA">pos.order.line</font>. Es por esto que aquí primero se hace una búsqueda de los ids tipo línea que tienen un id tipo documento porporcionado por `pos_doc_ids`. Cabe mencionar que no debe haber criterios de búsqueda que cambien los criterios originales.

Se especifican los campos necesarios `pos_doc_fields` para utilizarlos en una búsqueda en el modelo <font color="#F414FA">pos.order.line</font>. Esta búsqueda devuelve una lista con todos los ids tipo línea del pos y se almacena en `pos_line_ids`

No es necesario accesar al modelo del documento del pos <font color="#F414FA">pos.order</font>, pues la información que se necesita está dentro de cada línea del pos.

Con los ids tipo línea `pos_line_ids` se consulta la información de cada línea del pos en el modelo. Esto devuelve una lista de diccionarios que se almacenana en `pos_line_json`

In [15]:
pos_line_fields = [
    'order_id',
    'sale_order_line_id',
    'refund_orderline_ids',
    'refunded_orderline_id',
]


pos_line_ids = models.execute_kw(api_db, uid, api_clave, 'pos.order.line', 'search', [[("order_id.id", "=", pos_doc_ids)]])
pos_line_json = models.execute_kw(api_db, uid, api_clave, 'pos.order.line', 'read', [pos_line_ids], {'fields': pos_line_fields})

Se procede a generar un DataFrame de Pandas. Para esto se preparan los datos con un ciclo <font color="#14E4FA">for</font> donde se manipula `pos_line_json` y se ingresa cada línea del pos ya manipulada a una lista vacía `data_pos_line`. La lista ya cargada con todos sus elementos es la que se convierte en el DataFrame `pos_line_df`. Este dataframe tiene únicamente la información de las líneas del pos y el id del documento del pos. No hay un vínculo con `fact_df`

In [16]:
data_pos_line = []

for pos in pos_line_json:
    new = {}
    new['pos_line_id'] = pos['id']
    new['pos_doc_id'] = pos['order_id'][0]
    new['sale_line_id_pos'] = if_list_gt0_idex(pos, 'sale_order_line_id', 0)
    new['refund_orderline_ids'] = if_list_gt0_idex(pos, 'refund_orderline_ids', 0)
    new['refunded_orderline_id'] = if_list_gt0_idex(pos, 'refunded_orderline_id', 0)
    

    data_pos_line.append(new)

dfpos_line = pd.DataFrame(data_pos_line)
dfpos_line['sale_line_id_pos'] = dfpos_line['sale_line_id_pos'].astype('Int64')
dfpos_line['pos_line_id'] = dfpos_line['pos_line_id'].astype('Int64')
dfpos_line['refund_orderline_ids'] = dfpos_line['refund_orderline_ids'].astype('Int64')
dfpos_line['refunded_orderline_id'] = dfpos_line['refunded_orderline_id'].astype('Int64')

Debido a que `fact_df` contiene el total de las facturas de Odoo, se ocupa segmentar sólo las facturas que provienen del módulo de PdV. Esto con el fin de hacer un <font color="#14E4FA">merge</font> entre `fact_df` y `pos_line_df` de manera más sencilla. El resultado se almacena en `fact_pos_doc_df`.

In [17]:
fact_pos_doc_df = fact_df[~fact_df['pos_doc_id'].isna()][['fact_doc_id','name', 'fact_line_id', 'pos_doc_id', 'product_id']]

Para aumentar la seguridad del código, es necesario verificar que el total de líneas del modelo <font color="#F414FA">pos.order.line</font> es igual al total de líneas del modelo <font color="#F414FA">account.move.line</font> `check_total_size` y que cada factura tiene el mismo número de líneas que su orden `check_each_document_size`. Esto es necesario para evitar equivocaciones en el <font color="#14E4FA">merge</font> (enmaquetado) de ambos dataframes [`fact_df`, `pos_line_df`], derivado a que no hay un vínculo claro en común.

Para lograr `check_total_size`:
- Se agrupan ambos dataframes por el campo propio de id de línea, dando como resultado `fact_pos_doc_df` y `group_dfpos_line`.
- Se compara el tamaño de ambos grupos y el valor booleano se almacena en `check_total_size`.

Para lograr `check_each_document_size`:
- se concatenan `fact_pos_doc_df` y `group_dfpos_line` y se almacena en el dataframe `groups_concat`.
- se compara el campo id de fac con id del pos y el booleano resultante se almacen una columna nueva de `groups_concat` <font color="#14FA4C">"lines_per_doc"</font>.
- se filtran los valores <font color="#14FA4C">False</font> de <font color="#14FA4C">"lines_per_doc"</font> y al tamaño del resultado se le compara con cero. El resultado se almacena en `check_each_document_size`

In [18]:
group_fact_pos_df = fact_pos_doc_df.groupby('pos_doc_id').count()['fact_doc_id']
group_pos_line_df = dfpos_line.groupby('pos_doc_id').count()['pos_line_id']

check_total_size = len(group_fact_pos_df) == len(group_pos_line_df)

groups_concat = pd.concat([group_fact_pos_df, group_pos_line_df], axis=1)
groups_concat['lines_per_doc'] = groups_concat['fact_doc_id'] == groups_concat['pos_line_id']
check_each_document_size = len(groups_concat[~groups_concat['lines_per_doc']]) == 0

In [41]:
# En las facturas está el pos_doc_id de las devoluciones, por eso no coincíden.
fact_pos_doc_df.loc[fact_pos_doc_df['pos_doc_id'] == 6922]

Unnamed: 0,fact_doc_id,name,fact_line_id,pos_doc_id,product_id
1099,31572,RF2-CC/2024/00037,116571,6922,11014
1625,30736,F2-CC/2024/03902,113610,6922,11139
1626,30736,F2-CC/2024/03902,113611,6922,11014
1627,30736,F2-CC/2024/03902,113612,6922,11152
1628,30736,F2-CC/2024/03902,113613,6922,12490
1629,30736,F2-CC/2024/03902,113614,6922,14666
1630,30736,F2-CC/2024/03902,113615,6922,11383


Para poder hacer un <font color="#14E4FA">merge</font> entre `fact_df`, `pos_line_df` se busca hacer un id temporal `id_vinculo` que sirva de vínculo entre ambos dataframes.

Para generar `id_vinculo`, se utiliza el único campo en común para ambos dataframes <font color="#14FA4C">"pos_order_ids"</font> en `fact_df` y <font color="#14FA4C">"pos_doc_id"</font> en `pos_line_df`.

Se generó la función `id_vinculo_generator`, la cual recibe tres parámetros: el dataframe, el nombre de la columna donde se almacenan los ids de los documentos del pos y el nombre de la columna donde se almacenan los ids de las líneas de su modelo.

In [19]:
def id_vinculo_generator(df_base: pd.DataFrame, pos_doc_column_name: str, df_id_line_name:str ) -> pd.DataFrame:
    
    df = df_base.sort_values(by=[pos_doc_column_name, df_id_line_name])
    df['id_relative_pos'] = None

    pos_orders = df[pos_doc_column_name].unique()

    for pos in pos_orders:
        mini_df = df.loc[df[pos_doc_column_name] == pos]
        df.loc[df[pos_doc_column_name] == pos, 'id_relative_pos'] = [i for i in range(len(mini_df))]


    df['id_vinculo'] = df[pos_doc_column_name].astype(str) + '-' + df['id_relative_pos'].astype(str)

    return df

Se procede a ejecutar la función anterior para cada dataframe. Se guardan sus resultados respectivos en `fact_pos_link_df` y `pos_line_link_df`

In [20]:
fact_pos_doc_link_df = id_vinculo_generator( fact_pos_doc_df, 'pos_doc_id', 'fact_line_id')
pos_line_link_df = id_vinculo_generator(dfpos_line, 'pos_doc_id', 'pos_line_id')

Se procede a generar el merge de ambos dataframes de linea, dando como resultado `fac_pos_linked_df`.

In [21]:
fac_pos_linked_df =  fact_pos_doc_link_df.merge(pos_line_link_df, how='outer', on='id_vinculo')

Se procede a integrar `fac_pos_linked_df` al dataframe general `fact_df` por medio de un <font color="#14E4FA">merge</font> tipo "left join" en su campo de línea de factura <font color="#14FA4C">"id_x"</font>, obteniendo `fact_pos_df`. Al haber vinculado <font color="#F414FA">pos.order.line</font> al dataframe general, cada línea de venta (ya sea que venga del módulo de "Ventas" o del módulo de "PdV") tiene ya un id de línea del modelo <font color="#F414FA">sale.order.line</font>, que es donde se encuentra el nombre de la vendedora.

In [22]:
cols_to_keep = ['fact_line_id', 'pos_line_id', 'sale_line_id_pos', 'refund_orderline_ids', 'refunded_orderline_id']
fact_pos_df = fact_df.merge(fac_pos_linked_df[cols_to_keep], how='left', on='fact_line_id')

Al haber hecho merge en dos dataframes diferentes en `fact_pos_df`, se tienen los ids del modelo <font color="#F414FA">sale.order.line</font> en diferentes columnas. Se procede a juntar dichos ids en una sóla columna <font color="#14FA4C">"sale_line_join_id"</font>.

Se genera `ids_sale_line` que es una lista de los ids únicos para poder utilizarlos a posterior.

In [23]:
fact_pos_df['sale_line_id'] = None
fact_pos_df.loc[(~fact_pos_df['sale_line_id_fact'].isna() & fact_pos_df['sale_line_id_pos'].isna()), 'sale_line_id'] = fact_pos_df['sale_line_id_fact']
fact_pos_df.loc[(fact_pos_df['sale_line_id_fact'].isna() & ~fact_pos_df['sale_line_id_pos'].isna()), 'sale_line_id'] = fact_pos_df['sale_line_id_pos']
fact_pos_df['sale_line_id'] = fact_pos_df['sale_line_id'].astype('Int64')

fact_pos_df.drop(columns=['sale_line_id_fact', 'sale_line_id_pos'], inplace=True)

sale_line_ids = []
for sid in fact_pos_df.loc[~fact_pos_df['sale_line_id'].isna(), 'sale_line_id'].unique():
    sale_line_ids.append(int(sid))

Se especifican los campos necesarios `sale_line_fields` para que con `sale_line_ids` (que se generó arriba) se pueda obtener la información del modelo <font color="#F414FA">sale.order.line</font>. Esto devuelve una lista de diccionarios con la información de cada línea de venta, que se guarda en `sale_line_json`.

In [24]:
sale_line_fields = [
    'salesman_id',
]

sale_line_json = models.execute_kw(api_db, uid, api_clave, 'sale.order.line', 'read', [sale_line_ids], {'fields': sale_line_fields})

Se procede a generar el DataFrame `sale_line_df`. Para esto se preparan los datos con un ciclo <font color="#14E4FA">for</font> donde se manipula `sale_line_json`.

In [25]:
data_sale_line = []

for sale in sale_line_json:
    new = {}
    new['sale_line_id'] = sale['id']
    new['salesman_id'] = sale['salesman_id'][0]

    data_sale_line.append(new)


sale_line_df = pd.DataFrame(data_sale_line)
sale_line_df['salesman_id'] = sale_line_df['salesman_id'].astype('Int64')

Se procede a integrar `sale_line_df` al dataframe general `fact_pos_df` por medio de un <font color="#14E4FA">merge</font> tipo "left join" en su campo de línea de sale <font color="#14FA4C">"sale_line_id"</font>, obteniendo `complete_df`.

In [26]:
complete_df = fact_pos_df.merge(sale_line_df, how='left', on='sale_line_id').set_index('name')

Se filtra las líneas de factura que son de reversiones o notas de crédito/devolución. Estas líneas tienen que cambiar su signo a negativo para que la analítica de sumas y acumulados refleje la realidad en `complete_df`.

In [27]:
complete_df.loc[complete_df['move_type'] == 'out_refund', ['quantity', 'price_subtotal']] = complete_df.loc[complete_df['move_type'] == 'out_refund', ['quantity', 'price_subtotal']] * -1

Se ocupa corregir todas las líneas que en el campo 'salesman_id' no tienen información en `complete_df`. 

Se empieza con las líneas donde el campo 'module_origin' vengan de contabilidad o ventas. Debido a que en estas líneas el campo 'invoice_user_id' sí refleja a la vendedora de manera correcta, sólo se copia  'invoice_user_id' al campo 'salesman_id'.

In [28]:
complete_df.loc[complete_df['module_origin'] != 'PdV', 'salesman_id'] = complete_df.loc[complete_df['module_origin'] != 'PdV', 'invoice_user_id']

Al corregir líneas que vienen de Contabilidad o Ventas, sólo faltan las que vienen de PdV. Por lo tanto ahora se trabajan las líneas que no tienen 'salesman_id, que son movimientos tipo "out-invoice" y que sí tienen 'pos_line_id' para ser buscadas en `pos_line_json`.

Debido a que son facturas, estás líneas sin 'salesman_id' son adiciones que la cajera hizo al documento pos. Se trata de encontrar una línea hermana en este mismo documento, así que se trae del json todas las líneas que coinciden con el campo 'pos_doc_id'. Se busca una línea hermana que no tenga que tenga información en el campo 'sale_line_id' y se busca esta línea de venta en `complete_df`. Se copia el campo 'salesman_id' de esta línea hermana a la línea original. Para evitar que pase esto mismo con cada línea que pueda tener el documento pos, se genera un "break".

In [29]:
pos_doc_id_not_saleline, pos_line_id_not_saleline = complete_df.loc[(complete_df['salesman_id'].isna()) &(complete_df['module_origin'] == 'PdV') & (complete_df['move_type'] == 'out_invoice') & (~complete_df['pos_line_id'].isna()), ['pos_doc_id', 'pos_line_id']].items()

for i in range(len(pos_line_id_not_saleline[1])):
    for pos in pos_line_json:
        if pos['order_id'][0] == pos_doc_id_not_saleline[1].iloc[i]:
            if pos['sale_order_line_id']:
                complete_df.loc[complete_df['pos_line_id'] == pos_line_id_not_saleline[1].iloc[i], 'salesman_id'] = complete_df.loc[complete_df['sale_line_id'] == pos['sale_order_line_id'][0], 'salesman_id'].iloc[0]
                break

Ahora se corrigen todas las líneas que vienen de PdV, no tienen 'salesman_id', que son movimientos tipo "out-refund" y que sí tienen 'pos_line_id' para ser buscadas en `pos_line_json`.

Debido a que esta línea de devoluciones no siempre viene de facturas de este mes o puede que vengan de faturas cancelada, `pos_line_json` no tiene información sobre sus líneas 'refunded' o devueltas. Por lo tanto, se genera un ciclo "for" para buscar el campo 'refunded_orderline_id' en cada "id" de `pos_line_json`:
    
-> Si existe la línea 'refunded' en 'pos_line_id':
    Se copia el campo 'salesman_id' de la línea original a la línea de devolución.

-> Si no existe la línea 'refunded' en 'pos_line_id':
    Se genera una llamada a la API de Odoo por el pos_line_id original, si este devuelve que hay información en su campo 'sale_order_line_id', se genera una segunda llamada a la API de Odoo por el sale_line_id y traemos el campo 'salesman_id'. Este campo 'salesman_id' de la línea original se copia la línea de devolución.

In [30]:
pos_line_id_not_saleline, refunded_id_not_saleline = complete_df.loc[(complete_df['salesman_id'].isna()) &(complete_df['module_origin'] == 'PdV') & (complete_df['move_type'] == 'out_refund') & (~complete_df['pos_line_id'].isna()), ['pos_line_id', 'refunded_orderline_id']].items()

for i in range(len(pos_line_id_not_saleline[1])):
    if not complete_df.loc[complete_df['pos_line_id'] == refunded_id_not_saleline[1].iloc[i]].empty:
        complete_df.loc[complete_df['pos_line_id'] == pos_line_id_not_saleline[1].iloc[i], 'salesman_id'] = complete_df.loc[complete_df['pos_line_id'] == refunded_id_not_saleline[1].iloc[i], 'salesman_id'].iloc[0]
    else:
        pos_line_json_not_found = models.execute_kw(api_db, uid, api_clave, 'pos.order.line', 'read', [[int(refunded_id_not_saleline[1].iloc[i])]])
        res_id = pos_line_json_not_found[0]['sale_order_line_id']
        if res_id:
            sale_line_json_pos_not_found = models.execute_kw(api_db, uid, api_clave, 'sale.order.line', 'read', [[ res_id[0]]], {'fields': sale_line_fields})
            complete_df.loc[complete_df['pos_line_id'] == pos_line_id_not_saleline[1].iloc[i], 'salesman_id'] = sale_line_json_pos_not_found[0]['salesman_id'][0]

Por último para las líneas que vienen de PdV, no tienen 'salesman_id', que son movimientos tipo "out-refund" sólo faltan las que no tienen 'pos_line_id'. Esto hace que no puedan ser buscadas en `pos_line_json`.

Con estas líneas se busca en `compelte_df` el documento pos del cuál se hizo la devolución (pues vienen de PdV). Se encuentra el dataframe que lleva este documento, se quita todo lo que es devolución y con la información que queda (las ventas) se trata de encontrar el mismo id de producto (pues carecemos de una línea en la cuál empatar venta-devolución). Si se encuentra esta línea, se toma el campo 'salesman_id' de la línea original y se copia a la línea de devolución.

Las líneas que no se encuetran en `compelte_df` se trabajan en el siguiente snipet.

In [31]:
fact_line_id_not_saleline, pos_doc_id_not_saleline, product_id_not_saleline = complete_df.loc[(complete_df['salesman_id'].isna()) & (complete_df['pos_line_id'].isna()), ['fact_line_id','pos_doc_id', 'product_id']].items()

for i in range(len(fact_line_id_not_saleline[1])):
    if not complete_df.loc[(complete_df['pos_doc_id'] == pos_doc_id_not_saleline[1].iloc[i] ) & (complete_df['product_id'] == product_id_not_saleline[1].iloc[i]) & (complete_df['move_type'] != 'out_refund')].empty:
        complete_df.loc[complete_df['fact_line_id'] == fact_line_id_not_saleline[1].iloc[i], 'salesman_id'] = complete_df.loc[(complete_df['pos_doc_id'] == pos_doc_id_not_saleline[1].iloc[i] ) & (complete_df['product_id'] == product_id_not_saleline[1].iloc[i]) & (complete_df['move_type'] != 'out_refund'), 'salesman_id'].iloc[0]

In [32]:
complete_df.loc[complete_df['salesman_id'].isna()]

Unnamed: 0_level_0,fact_doc_id,invoice_date,state,invoice_origin,module_origin,pos_doc_id,move_type,reversal_move_id,reversed_entry_id,journal_id,...,product_id,quantity,price_unit,discount,price_subtotal,pos_line_id,refund_orderline_ids,refunded_orderline_id,sale_line_id,salesman_id
name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8506,-300.0,15.39,0.2,-3693.6,16307,,16199.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8092,-300.0,7.21,0.2,-1730.4,16308,,16200.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8433,-300.0,13.45,0.2,-3228.0,16309,,16201.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,10255,-4.0,61.26,0.1,-220.54,16310,,16202.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8301,-100.0,11.1,0.1,-999.0,16311,,16203.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,10351,-3.0,64.5,0.1,-174.15,16312,,16204.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8511,-100.0,15.44,0.2,-1235.2,16313,,16205.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8352,-150.0,11.93,0.2,-1431.6,16314,,16206.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8341,-100.0,11.55,0.2,-924.0,16315,,16207.0,,
RF2-CC/2024/00034,28937,2024-02-21,posted,PdV SJC/3754 REEMBOLSO,PdV,6549,out_refund,,28811.0,90,...,8275,-200.0,10.51,0.2,-1681.6,16316,,16208.0,,


Se ocupa mejorar 'salesman_id'

In [33]:
check_salesman_id = len(complete_df.loc[complete_df['salesman_id'].isna()]) == 0
check_salesman_id_just_salesteams = len(complete_df.loc[~complete_df['salesman_id'].isin(list(descrip_sales_users_df['id']))]) == 0

# <span style="color:steelblue">Check Points<span>

In [34]:
check_all = check_1 and check_total_size and check_each_document_size and check_salesman_id and check_salesman_id_just_salesteams
print('Todos los check points están correctos:', check_all)

Todos los check points están correctos: False


In [35]:
print('No hay valores sin calificar en module_origin:', check_1)
print('Las agrupaciones son del mismo tamaño:', check_total_size)
print('No hay diferencias al comparar cantidad de líneas por cada par de documentos:', check_each_document_size)
print('En el campo salesman_id sólo hay vendedoras', check_salesman_id)
print('Las vendedoras són únicamente ids que están dentro de los equipos de ventas', check_salesman_id_just_salesteams)

No hay valores sin calificar en module_origin: True
Las agrupaciones son del mismo tamaño: True
No hay diferencias al comparar cantidad de líneas por cada par de documentos: False
En el campo salesman_id sólo hay vendedoras False
Las vendedoras són únicamente ids que están dentro de los equipos de ventas False


## Variables de datos
----
### Filtros de búsqueda y variables iniciales
`search_fact`: Filtro iniciar de búsqueda para documentos de factura

----
### DataFrames fusionados
- `fact_df`: DataFrame <b><font color="#4EC2A6">fact_doc_df</font></b> <font color="#FF922C">+</font> <b><font color="#4EC2A6">fact_line_df</font></b>
- `fact_pos_doc_df`: DataFrame <b><font color="#4EC2A6">fact_df</font></b> <font color="#FF922C">+</font> <b><font color="#4EC2A6">pos_line_df</font></b>
- `fact_pos_df` DataFrame <b><font color="#4EC2A6">fact_df</font></b> <font color="#FF922C">+</font> <b><font color="#4EC2A6">pos_doc_df</font></b> <font color="#FF922C">+</font> <b><font color="#4EC2A6">pos_line_df</font></b>
- `complete_df`: DataFrame <b><font color="#4EC2A6">fact_pos_df</font></b> <font color="#FF922C">+</font> <b><font color="#4EC2A6">sale_line_df</font></b> <b><font color="#E8FF00">Este es el DataFrame completo</font></b>

----
### Documentos de factura
- `fact_doc_fields`:  Campos solicitados para búsqueda
- `fact_doc_ids`: Lista de IDs devuelta
- `fact_doc_json`: JSON devuelto por Odoo
- `fact_doc_df`: DataFrame

### Líneas de factura
- `fact_line_fields`: Campos solicitados para búsqueda
- `fact_line_ids`: Lista de IDs devuelta
- `fact_line_json`: JSON devuelto por Odoo
- `fact_line_df`: DataFrame

----
### Documentos de punto de venta
- `pos_doc_fields`:  Campos solicitados para búsqueda
- `pos_doc_ids`: Lista de IDs devuelta
- `pos_doc_json`: JSON devuelto por Odoo
- `pos_doc_df`: DataFrame

### Líneas de punto de venta
- `pos_line_fields`: Campos solicitados para búsqueda
- `pos_line_ids`: Lista de IDs devuelta
- `pos_line_json`: JSON devuelto por Odoo
- `pos_line_df`: DataFrame

----
### Líneas de ventas
- `sale_line_fields`: Campos solicitados para búsqueda
- `sale_line_ids`: Lista de IDs devuelta
- `sale_line_json`: JSON devuelto por Odoo
- `sale_line_df`: DataFrame

## Variables y búsquedas complementarias
----
### Documentos de punto de venta adicionales
- `pos_doc_name_extra`: Folios
- `pos_doc_ids_extra`: Lista de IDs devuelta
- `pos_doc_name_df`: DataFrame complementario de folios