# 🐍🐼 Python-Pandas: Create tailored insights with query()

### ❓ Ever wanted to create an interactive filter for your data without struggling with SQL? 
🙃 With pandas and its amazing `query()` function, you can easily and flexibly do just that!

### 🔧 How does it work?
The `query()` function in pandas allows you to filter DataFrames efficiently, but the interesting part is how we can integrate dynamic variables. This allows you to adjust your filters in real-time without writing complex SQL queries, making it perfect for interactive projects like dashboards.

### 🔎 Why does it matter?
This approach is perfect for data analysts, data science application developers, or anyone looking to perform quick analyses without relying on external SQL tools. The flexibility and speed of pandas make it ideal for automating and customizing workflows!

### ✨ Real-life example or use case:
Let's say you're working with the `tips` dataset from seaborn (an included sample dataset in Python), and you want to see how total bills from customers vary by day of the week, but you also want the total bill filter to be dynamic, i.e., adjustable based on what you choose.  
This can be done with the following code! 👇 It shows how to use `query()` and dynamic variables to generate quick, personalized insights.

### ⚙️ Business impact:
Imagine you're designing an interactive dashboard for a restaurant client. The client wants to be able to analyze tips and spending by different days and group sizes, with the option to easily change the minimum total bill through an interface. This is exactly what you can achieve with pandas and `query()`!

### 📊 Summary of what the code does:
- Filters the `tips` dataset to show only rows that meet certain conditions (total bill greater than a dynamic value).
- Prints the result of both the first 5 and the last 5 rows to review consistency.
- This type of filtering is very useful for exploratory analysis and creating customized dashboards.

### 💭 Reflection: How would you use this kind of interactive analysis to improve decision-making in your work?

🌍✨ **#DataScience #Python #Pandas #MachineLearning #Analytics #DataVisualization #AI #GenerativeAI #TechForAll #DashboardDesign #DataAnalysis #DataDriven #Innovators**

🔗 [Code on GitHub](https://github.com/jcombari/PyForAll/blob/main/20250128_query.ipynb)

---

# 🐍🐼 Python-Pandas: Genera insights a medida con query()

### ❓ ¿Alguna vez has querido crear un filtro interactivo para tus datos sin complicarte con SQL? 
🙃 ¡Con pandas y su increíble función `query()` puedes lograrlo con facilidad y flexibilidad!

### 🔧 ¿Cómo funciona?
La función `query()` en pandas permite filtrar DataFrames de manera eficiente, pero lo interesante es cómo podemos integrar variables dinámicas. Esto nos permite ajustar nuestros filtros en tiempo real sin escribir consultas SQL complejas, lo que es una gran ventaja para proyectos interactivos como dashboards.

### 🔎 ¿Por qué importa?
Este enfoque es perfecto para analistas de datos, desarrolladores de aplicaciones de ciencia de datos o cualquier persona que quiera realizar análisis rápidos sin depender de herramientas SQL externas. ¡La flexibilidad y rapidez de pandas lo hace ideal para automatizar y personalizar los flujos de trabajo!

### ✨ Ejemplo real o Caso práctico:
Supongamos que estás trabajando con el dataset de `tips` de seaborn (un dataset de ejemplo que se incluye en Python) y quieres ver cómo los gastos totales de los clientes varían según el día de la semana, pero también quieres que el filtro del total de la cuenta sea dinámico, es decir, ajustable según lo que tú elijas.  
¡Lo puedes hacer con el siguiente código! 👇 Este código muestra cómo puedes usar `query()` y variables dinámicas para generar insights rápidos y personalizados.

### ⚙️ Impacto en el negocio:
Imagina que estás diseñando un dashboard interactivo para un cliente en el sector de restauración. Este cliente quiere tener la capacidad de analizar las propinas y los gastos por diferentes días y tamaños de grupo, con la opción de cambiar fácilmente el valor mínimo del gasto total a través de una interfaz. ¡Así de fácil se puede lograr con pandas y `query()`!

### 📊 Resumen de qué se hace en el código:
- Se filtra el dataset `tips` para mostrar solo las filas que cumplen con ciertas condiciones (gasto total mayor a un valor dinámico).
- Se imprime el resultado tanto de las primeras 5 filas como de las últimas 5 filas para revisar la consistencia.
- Este tipo de filtrado es muy útil para análisis exploratorios y creación de dashboards personalizados.

### 💭 Reflexión: ¿Cómo usarías este tipo de análisis interactivo para mejorar la toma de decisiones en tu área de trabajo?

🌍✨ **#DataScience #Python #Pandas #MachineLearning #Analytics #DataVisualization #AI #GenerativeAI #TechForAll #DashboardDesign #DataAnalysis #DataDriven #Innovators**

🔗 [Código en GitHub](https://github.com/jcombari/PyForAll/blob/main/20250128_query.ipynb)


In [2]:
# Import necessary libraries
import pandas as pd

# Load the sample 'tips' dataset included with pandas
tips = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')

# 1. WHERE Clause: Filter rows based on a condition using 'WHERE' equivalent
# Find all tips where the total bill is greater than 20
query_1 = tips.query('total_bill > 20')
print("Query 1: Total bill greater than 20")
print(query_1.head(5))  # Show the first 5 rows
print(query_1.tail(5))  # Show the last 5 rows

# 2. WHERE Clause with Multiple Conditions: Combine multiple conditions
# Find all tips where the day is 'Sun' and the size is greater than or equal to 3
query_2 = tips.query('day == "Sun" and size >= 3')
print("\nQuery 2: Day is Sun and size >= 3")
print(query_2.head(5))  # Show the first 5 rows
print(query_2.tail(5))  # Show the last 5 rows

# 3. HAVING Clause (Simulating GROUP BY with aggregate functions)
# Find the average tip by day where the average tip is greater than 3
query_3 = tips.groupby('day').filter(lambda x: x['tip'].mean() > 3)
print("\nQuery 3: Average tip greater than 3 by day")
print(query_3.head(5))  # Show the first 5 rows
print(query_3.tail(5))  # Show the last 5 rows

# 4. WHERE Clause with Dynamic Variables: Use dynamic variables in the filter condition
# Filter tips where the total bill is less than a dynamic value
max_total_bill = 30
query_4 = tips.query('total_bill < @max_total_bill')
print("\nQuery 4: Total bill less than dynamic value")
print(query_4.head(5))  # Show the first 5 rows
print(query_4.tail(5))  # Show the last 5 rows

# 5. HAVING with GROUP BY: Use HAVING to filter the aggregated result
# Group by 'size' and filter those groups where the total bill sum is greater than 100
query_5 = tips.groupby('size').filter(lambda x: x['total_bill'].sum() > 100)
print("\nQuery 5: Group by size, total bill sum greater than 100")
print(query_5.head(5))  # Show the first 5 rows
print(query_5.tail(5))  # Show the last 5 rows


Query 1: Total bill greater than 20
   total_bill   tip     sex smoker  day    time  size
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
5       25.29  4.71    Male     No  Sun  Dinner     4
7       26.88  3.12    Male     No  Sun  Dinner     4
     total_bill   tip     sex smoker  day    time  size
237       32.83  1.17    Male    Yes  Sat  Dinner     2
238       35.83  4.67  Female     No  Sat  Dinner     3
239       29.03  5.92    Male     No  Sat  Dinner     3
240       27.18  2.00  Female    Yes  Sat  Dinner     2
241       22.67  2.00    Male    Yes  Sat  Dinner     2

Query 2: Day is Sun and size >= 3
   total_bill   tip     sex smoker  day    time  size
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
4       24.59  3.61  Female     No  Sun  Dinner     4
5       25.29  4.71    Male     No  Sun  Dinner     4