Test

In [3]:
import pandas as pd

cam_df = pd.read_csv("data/Factbook_CAM.csv")
peru_df = pd.read_csv("data/Factbook_Peru.csv")
pipeline_df = pd.read_csv("data/Pipeline.csv")

In [4]:
# Combine Factbook datasets
factbook_df = pd.concat([cam_df, peru_df], ignore_index=True)

# Check columns (for reference)
print("Factbook columns:", factbook_df.columns.tolist())
print("Pipeline columns:", pipeline_df.columns.tolist())

# Check sample unique values for MARCA and Name to compare
print("Sample MARCA values:", factbook_df['MARCA'].dropna().unique()[:5])
print("Sample Name values:", pipeline_df['Name'].dropna().unique()[:5])

# Normalize names for merge: strip spaces, uppercase
factbook_df['MARCA_CLEAN'] = factbook_df['MARCA'].str.strip().str.upper()
pipeline_df['NAME_CLEAN'] = pipeline_df['Name'].str.strip().str.upper()

# Attempt merge
merged_df = factbook_df.merge(
    pipeline_df,
    left_on='MARCA_CLEAN',
    right_on='NAME_CLEAN',
    how='left',
    indicator=True
)

# Check merge result
print(merged_df['_merge'].value_counts())
print(merged_df.head())

# Optional: show rows that didn't match
unmatched = merged_df[merged_df['_merge'] == 'left_only']
print("Unmatched MARCA examples:", unmatched['MARCA'].unique()[:5])

Factbook columns: ['MERCADO', 'CATEGORIA', 'MARCA', 'VARIABLES', 'RY 2023', 'RY 2024']
Pipeline columns: ['Task ID', 'Created At', 'Completed At', 'Last Modified', 'Name', 'Section/Column', 'Assignee', 'Assignee Email', 'Start Date', 'Due Date', 'Tags', 'Notes', 'Projects', 'Parent task', 'Blocked By (Dependencies)', 'Blocking (Dependencies)', 'BU', 'Categoría', 'País', 'Love brand', 'Subcategoría', 'Categoría.1', 'Ventas (mm)', 'Link', 'Link ficha de candidato', 'Activo / inactivo', 'Score según matriz', 'Fecha último contacto']
Sample MARCA values: ['ACEITES Y MANTECAS' 'CLOVER' 'CONTROLLED LABEL' 'IDEAL' 'MAZOLA']
Sample Name values: ['Link matriz priorización' 'Sarita' 'Contactar a Carlos Bosque'
 'Jaboneria Wilson' 'Haleon']
_merge
left_only     45960
both           1794
right_only        0
Name: count, dtype: int64
  MERCADO           CATEGORIA               MARCA   VARIABLES       RY 2023  \
0  T. CAM  ACEITES Y MANTECAS  ACEITES Y MANTECAS  Vtas Valor  $550,000,617   
1  T. CAM

In [5]:
print("Unique BU:", pipeline_df['BU'].dropna().unique()[:10])
print("Unique Categoría:", pipeline_df['Categoría'].dropna().unique()[:10])
print("Unique Subcategoría:", pipeline_df['Subcategoría'].dropna().unique()[:10])
print("Unique Projects:", pipeline_df['Projects'].dropna().unique()[:10])

Unique BU: ['Comercial' 'Energy' 'D15' 'Super Tap']
Unique Categoría: ['Compra' 'Venta' 'Análisis' 'Compra, Análisis' 'Financiamiento']
Unique Subcategoría: ['Lácteos' 'Jabón' 'Personal Care' 'Gominolas' 'Dulces / Chocolates'
 'Salsas' 'Salsas y mermeladas'
 'Especias, granos, frutas secas, nueces y otros productos especializados. Servicios de empaque de marca privada.'
 'Nachos, especias' 'Condimentos']
Unique Projects: ['Pipeline M&A']


In [7]:
import pandas as pd

# Load your data
factbook_df = pd.concat([
    pd.read_csv("data/Factbook_CAM.csv"),
    pd.read_csv("data/Factbook_Peru.csv")
], ignore_index=True)

pipeline_df = pd.read_csv("data/Pipeline.csv")

# Normalize for searching
factbook_df['MARCA_CLEAN'] = factbook_df['MARCA'].str.strip().str.upper()
pipeline_df['COMPANY_CLEAN'] = pipeline_df['BU'].str.strip().str.upper()  # Or other correct field

# Search term (pretend user input)
search_term = 'CLOVER'.upper()

# Search Factbook
factbook_results = factbook_df[factbook_df['MARCA_CLEAN'].str.contains(search_term, na=False)]

# Search Pipeline
pipeline_results = pipeline_df[pipeline_df['COMPANY_CLEAN'].str.contains(search_term, na=False)]

# Show results
print("Factbook Results:")
print(factbook_results)

print("\nPipeline Results:")
print(pipeline_results)

Factbook Results:
                          MERCADO           CATEGORIA   MARCA  \
1                          T. CAM  ACEITES Y MANTECAS  CLOVER   
7                          T. CAM  ACEITES Y MANTECAS  CLOVER   
13                         T. CAM  ACEITES Y MANTECAS  CLOVER   
19                         T. CAM  ACEITES Y MANTECAS  CLOVER   
25                         T. CAM  ACEITES Y MANTECAS  CLOVER   
31                         T. CAM  ACEITES Y MANTECAS  CLOVER   
37          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
43          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
49          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
55          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
61          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
67          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
325                   T. HONDURAS  ACEITES Y MANTECAS  CLOVER   
331                   T. HONDURAS  ACEITES Y MANTECAS  CLOVER   
337    

In [9]:
# Ensure Notes and Tags are string type
pipeline_df['Notes'] = pipeline_df['Notes'].astype(str)
pipeline_df['Tags'] = pipeline_df['Tags'].astype(str)

# Search Factbook
factbook_results = factbook_df[factbook_df['MARCA_CLEAN'].str.contains(search_term, na=False)]
print("Factbook Results:")
print(factbook_results)

# Search Pipeline
pipeline_results = pipeline_df[
    pipeline_df['Notes'].str.upper().str.contains(search_term, na=False) |
    pipeline_df['Tags'].str.upper().str.contains(search_term, na=False)
]
print("\nPipeline Results:")
print(pipeline_results)

Factbook Results:
                          MERCADO           CATEGORIA   MARCA  \
1                          T. CAM  ACEITES Y MANTECAS  CLOVER   
7                          T. CAM  ACEITES Y MANTECAS  CLOVER   
13                         T. CAM  ACEITES Y MANTECAS  CLOVER   
19                         T. CAM  ACEITES Y MANTECAS  CLOVER   
25                         T. CAM  ACEITES Y MANTECAS  CLOVER   
31                         T. CAM  ACEITES Y MANTECAS  CLOVER   
37          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
43          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
49          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
55          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
61          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
67          T. CAM AUTOSERVICIOS.  ACEITES Y MANTECAS  CLOVER   
325                   T. HONDURAS  ACEITES Y MANTECAS  CLOVER   
331                   T. HONDURAS  ACEITES Y MANTECAS  CLOVER   
337    