<a href="https://colab.research.google.com/github/ProfesorCamacho/Analisis_Estados_Financieros/blob/main/Analisis_de_estados_financieros.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [21]:
import sqlite3
import pandas as pd

# Ruta a la base de datos SQLite
ruta_base_de_datos = 'income_statements_select_07_21_.db'

# Nombre de la tabla a leer
nombre_tabla = 'Edo_Resultados'

# Conectar a la base de datos SQLite
conexion = sqlite3.connect(ruta_base_de_datos)

# Leer la tabla en un DataFrame
df = pd.read_sql_query(f'SELECT * FROM {nombre_tabla}', conexion)

# Cerrar la conexión
conexion.close()

# Mostrar los primeros 5 registros del DataFrame
print(df.head())

                  date symbol reportedCurrency        cik  \
0  2015-03-31 00:00:00     AA              USD  1675149.0   
1  2015-06-30 00:00:00     AA              USD  1675149.0   
2  2015-09-30 00:00:00     AA              USD  1675149.0   
3  2015-12-31 00:00:00     AA              USD  1675149.0   
4  2016-03-31 00:00:00     AA              USD  1675149.0   

           fillingDate         acceptedDate  calendarYear period  \
0  2015-03-31 00:00:00  2015-03-31 00:00:00        2015.0     Q2   
1  2015-06-30 00:00:00  2015-06-30 00:00:00        2015.0     Q2   
2  2015-09-30 00:00:00  2015-09-30 00:00:00        2015.0     Q3   
3  2015-12-31 00:00:00  2015-12-31 00:00:00        2015.0     Q4   
4  2016-03-31 00:00:00  2016-03-31 00:00:00        2016.0     Q2   

        revenue  costOfRevenue  ...  incomeBeforeTaxRatio  incomeTaxExpense  \
0  3.105000e+09   2.291000e+09  ...              0.132689       186000000.0   
1  2.964000e+09   2.352000e+09  ...              0.005735        4

In [22]:
# Contamos cuantas obvservaciones tenemos por empresa
conteo_empresas = df['symbol'].value_counts()
conteo_empresas

symbol
TILE    75
ASGN    73
LH      69
PPBI    68
T       68
        ..
BBL      2
LEV      2
THCB     2
TSIA     2
TBB      1
Name: count, Length: 1130, dtype: int64

In [23]:
# Filtrar las empresas con al menos 30 observaciones
empresas_30_obs = conteo_empresas[conteo_empresas >= 30].index

# Filtrar el conjunto de datos para incluir solo estas empresas
empresas_interes = df[df['symbol'].isin(empresas_30_obs)]

empresas_interes.describe(include=object)

Unnamed: 0,date,symbol,reportedCurrency,fillingDate,acceptedDate,period,link,finalLink
count,44935,44935,44935,44935,44934,44935,37863,37859
unique,1134,821,15,3420,37708,5,37610,33983
top,2016-12-31 00:00:00,TILE,USD,2013-12-31 00:00:00,2013-12-31 00:00:00,Q1,https://www.sec.gov/Archives/edgar/data/165204...,https://www.sec.gov/Archives/edgar/data/165204...
freq,721,75,41498,188,188,11686,4,4


Empezaremos calculando la Tasa de Crecimiento Anual Compuesta o CAGR (Compound Annual Growth Rate) de los ingresos para cada empresa. Esta medida es ampliamente utilizada en finanzas para evaluar el crecimiento de una empresa, debido a que ayuda a suavizar los efectos de las fluctuaciones anuales y proporciona una visión clara del crecimiento a largo plazo. Lo que nos dice es el desempeño de la empresa en términos de generación de ingresos de manera consistente.

Como queremos sacar las empresas sólidas, nos quedaremos con las empresas que muestren un CAGR positivo en los ingresos.

In [102]:
empresas_interes.loc[:, 'date'] = pd.to_datetime(empresas_interes['date'])

# Filtrar las fechas mínimas y máximas para cada empresa
min_fecha = empresas_interes.groupby('symbol')['date'].min()
max_fecha = empresas_interes.groupby('symbol')['date'].max()

# Filtrar las ventas iniciales y finales para cada empresa
inicio_ventas = empresas_interes.groupby('symbol').apply(lambda x: x[x['date'] == min_fecha[x.name]]['revenue'].iloc[0])
fin_ventas = empresas_interes.groupby('symbol').apply(lambda x: x[x['date'] == max_fecha[x.name]]['revenue'].iloc[0])

# Calcular el número de años entre las fechas mínimas y máximas
años = (max_fecha - min_fecha).dt.days / 365

# Calcular el CAGR de ventas para cada empresa
cagr_ventas = ((fin_ventas / inicio_ventas) ** (1 / años)) - 1

# Filtrar empresas con CAGR positivo
cagr_positivo = cagr_ventas[cagr_ventas > 0]

cagr_positivo

symbol
AAL     0.035224
AAPL    0.209878
AAWW    0.075450
ABB     0.008507
ABCB    0.174854
          ...   
ZG      0.676855
ZION    0.009790
ZIXI    0.187021
ZNGA    0.183941
ZYXI    0.251780
Length: 713, dtype: float64

Ahora pondremos atención a la utilidad neta. Tener pérdidas en algunos trimestres no necesariamente indica que una empresa está en problemas si estas pérdidas son manejables y se producen en un contexto de declive general o eventos excepcionales.

Sin embargo no podemos permitir que esto suceda en repetidas ocaciones. Al estar analizando 60 trimestres, no podemos permitir más de 8 trimestres con pérdidas. De ser así, esto significa que la empresa puede enfrentar problemas temporales sin poner en riesgo su estabilidad a largo plazo. Empresas con pérdidas intermitentes pueden demostrar su capacidad de recuperarse y seguir siendo rentables a largo plazo.

In [72]:
max_8_negativos = []

for symbol, group in empresas_interes.groupby('symbol'):
    try:
        conteo_negativos = (group['netIncome'] < 0).sum()
        if conteo_negativos <= 8:
            max_8_negativos.append([symbol, conteo_negativos])
    except:
        continue

mun_negativos = pd.DataFrame(max_8_negativos, columns=["symbol", "num_negativos_netIncome"])
print(mun_negativos)

    symbol  num_negativos_netIncome
0     AAPL                        0
1      ABB                        1
2      ACN                        0
3     ADBE                        1
4      ADM                        0
..     ...                      ...
431     WU                        2
432    XOM                        4
433    XRX                        6
434   YNDX                        4
435     YY                        5

[436 rows x 2 columns]


Ahora volvemos a calcular el CAGR pero ahora para los costos de venta. Para despues compararlos con el CAGR de las ventas. Esto nos da una visión de cómo están creciendo las ventas en relación con los costos. La diferencia entre estos dos CAGRs puede revelar mucho sobre la eficiencia operativa y la facilidad de crear utilidad bruta a largo plazo de la empresa.

Obtendremos la diferencia entre ambos y nos quedaremos solo con los positivos. Esto represeta una gestión efectiva de los costos y la mejora en la eficiencia de las operaciones pueden contribuir a un crecimiento de los ingresos mayor que el de los costos.

In [73]:
# Filtrar las ventas iniciales y finales para cada empresa
inicio_costo = empresas_interes.groupby('symbol').apply(lambda x: x[x['date'] == min_fecha[x.name]]['costOfRevenue'].iloc[0])
fin_costo = empresas_interes.groupby('symbol').apply(lambda x: x[x['date'] == max_fecha[x.name]]['costOfRevenue'].iloc[0])

# Calcular el CAGR de ventas para cada empresa
cagr_costos = ((fin_costo / inicio_costo) ** (1 / años)) - 1

# Filter out companies where CAGR of revenue is greater than CAGR of expenses
diferencia = cagr_ventas - cagr_costos
mayor_cagr_ventas = diferencia[diferencia > 0]

mayor_cagr_ventas

symbol
AAPL    0.009591
AAWW    0.018916
ABB     0.001779
ABMD    0.009105
ACN     0.005891
          ...   
WTS     0.010711
WU      0.001352
X       0.018531
XENT    0.173497
ZEN     0.091048
Length: 345, dtype: float64

Al final tenemos un grupo de empresas que al cumplir con estos criterios se vuelven confiables para inversiones de largo plazo. Es importante destacar que se debe analizar el instrumento de inversión de dicha empresa pero con este pequeño analisis se puede demostrar la fiabilidad y estabilidad de estas empresas.

In [100]:
# Convertir las Series en DataFrames
cagr_positivo_df = cagr_positivo.reset_index().rename(columns= {0 : "cagr_sales"})
mayor_cagr_ventas_df = mayor_cagr_ventas.reset_index().rename(columns={0: 'dif_cagrs'})

# Unir los DataFrames
empresas_solidas = cagr_positivo_df.merge(mun_negativos, on='symbol', how='inner')
empresas_solidas = empresas_solidas.merge(mayor_cagr_ventas_df, on='symbol', how='inner')

empresas_solidas

Unnamed: 0,symbol,cagr_sales,num_negativos_netIncome,dif_cagrs
0,AAPL,0.209878,0,0.009591
1,ABB,0.008507,1,0.001779
2,ACN,0.074651,0,0.005891
3,ADS,0.048986,1,0.018862
4,AMN,0.080875,8,0.009901
...,...,...,...,...
161,WNS,0.064358,3,0.011100
162,WOR,0.041409,6,0.005303
163,WRK,0.160672,4,0.000409
164,WTS,0.019048,6,0.010711
