### Calculo de Ratios

#### liquidez
* Razón corriente = Activos corrientes / Pasivos corrientes
* Prueba ácida = (Activo corriente - Inventarios) / Pasivo corriente

#### Solvencia y endeudamiento
* Endeudamiento total = Total de pasivos / Total de activos
* Endeudamiento de largo plazo = Pasivo no corriente / Total de activos
* Cobertura de intereses = EBIT / Gastos por intereses

#### Rentabilidad
* ROA (Return on Assets) = Beneficio neto / Activo total
* ROE (Return on Equity) =  Beneficio neto / Patrimonio neto
* Margen de utilidad = 	Beneficio neto / Ventas (ingresos totales) (escrapeado "Margen del beneficio neto %")
* Rotación de activos = ingresos totales / Total de activos
* Rotación de inventarios = ingresos totales / Inventario

In [7]:
import sqlite3
import pandas as pd
pd.options.display.max_rows = 999

# Consultar datos
conn = sqlite3.connect('webmining.db')
cursor = conn.cursor()
cursor.execute("SELECT * FROM datos_anuales")
column_names = [description[0] for description in cursor.description]
filas = cursor.fetchall()

# Guardar los datos en un dataframe
df = pd.DataFrame(filas, columns=column_names)

In [8]:
indicadores = df.groupby(["informe","seccion","indicador"]).size()

print(indicadores)

informe     seccion            indicador                                                 
balance     activo_corriente   Crecimiento de efectivo y equivalentes                        74
                               Créditos totales                                              74
                               Efectivo restringido                                          29
                               Efectivo y equivalentes                                       74
                               Gastos pagados por adelantado                                 42
                               Inventario                                                    66
                               Inversiones a corto plazo                                     63
                               Otros activos corrientes                                      66
                               Otros créditos                                                41
                               Total de cuenta

In [9]:
# rubros que componen cada seccion
# no se incluye por ejemplo el rubro "otros creditos" ya que forma parte de "Creditos totales"
activo_corriente = [
    "Efectivo y equivalentes",
    "Inversiones a corto plazo",
    "Créditos totales",
    "Inventario",
    "Gastos pagados por adelantado",
    "Otros activos corrientes"
]
activo_no_corriente = [
    "Planta, propiedad y equipo, neto",
    "Inversiones a largo plazo",
    "Activos intangibles",
    "Total de otros activos"
]
pasivo_corriente = [
    "Total de cuentas por pagar",
    "Total de gastos devengados",
    "Préstamos a corto plazo",
    "Parte actual de la deuda a largo plazo/arrendamientos",
    "Total de otros pasivos corrientes"
]
pasivo_no_corriente = [
    "Deuda a largo plazo",
    "Arrendamientos a largo plazo",
    "Total de otros pasivos"
]
patrimonio_neto = [
    "Total de acciones preferentes",
    "Acciones ordinarias y APIC",
    "Ganancias retenidas",
    "Acciones propias y otras",
    "Intereses minoritarios"
]

inventario = ["Inventario"]

EBIT = ["EBIT"]
	
intereses = ["Total de gastos de intereses"]

In [10]:
# features de indicadores ya escrapeados

indicadores_scrapeados = [
  "Crecimiento de efectivo y equivalentes",
  "Crecimiento de activos totales",
  "Crecimiento del pasivo total",
  "Crecimiento de la deuda total",
  "Crecimiento del beneficio neto",
  "Crecimiento del EBITDA",
  "Crecimiento de los ingresos totales"
]

In [19]:
ac = pd.pivot_table(df[df.indicador.isin(activo_corriente)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"activo_corriente"})
anc = pd.pivot_table(df[df.indicador.isin(activo_no_corriente)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"activo_no_corriente"})
pc = pd.pivot_table(df[df.indicador.isin(pasivo_corriente)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"pasivo_corriente"})
pnc = pd.pivot_table(df[df.indicador.isin(pasivo_no_corriente)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"pasivo_no_corriente"})
pn = pd.pivot_table(df[df.indicador.isin(patrimonio_neto)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"patrimonio_neto"})
inv = pd.pivot_table(df[df.indicador.isin(inventario)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"inventario"})
ebit = pd.pivot_table(df[df.indicador.isin(EBIT)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"EBIT"})
int = pd.pivot_table(df[df.indicador.isin(intereses)], index=["company","ejercicio"], values="valor",aggfunc="sum").rename(columns={"valor":"intereses"})

data = pd.concat([ac,anc,pc,pnc,pn,inv,ebit,int], axis=1)
data.round(2)

Unnamed: 0_level_0,Unnamed: 1_level_0,activo_corriente,activo_no_corriente,pasivo_corriente,pasivo_no_corriente,patrimonio_neto,inventario,EBIT,intereses
company,ejercicio,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
3m-co,2020,14975.0,32362.0,7948.0,26465.0,12927.0,4239.0,7156.0,-529.0
3m-co,2021,15403.0,31669.0,9035.0,22920.0,15109.0,4985.0,7754.0,-488.0
3m-co,2022,14688.0,31767.0,9523.0,22162.0,14756.0,5372.0,3348.0,-462.0
3m-co,2023,16379.0,34201.0,15297.0,30415.0,4852.0,3944.0,4281.0,-941.0
3m-co,2024,15884.0,23984.0,11256.0,24718.0,3879.0,3698.0,4290.0,-1191.0
amazon-com-inc,2020,132733.0,188462.0,126385.0,101406.0,93404.0,23795.0,22899.0,-1647.0
amazon-com-inc,2021,161580.0,258969.0,142266.0,140038.0,138245.0,32640.0,24879.0,-1809.0
amazon-com-inc,2022,146791.0,315884.0,155393.0,161239.0,146043.0,34405.0,13348.0,-2367.0
amazon-com-inc,2023,172351.0,355503.0,164917.0,161062.0,201875.0,33318.0,36852.0,-3182.0
amazon-com-inc,2024,190867.0,434027.0,179431.0,159493.0,285970.0,34214.0,68593.0,-2406.0


In [17]:
df[
  (df.indicador.isin(activo_corriente)) &
  (df.company == "apple-computer-inc") &
  (df.ejercicio == 2020)
   ]

Unnamed: 0,id,company,informe,ejercicio,seccion,indicador,valor
173,8872,apple-computer-inc,balance,2020,activo_corriente,Efectivo y equivalentes,38016.0
175,8874,apple-computer-inc,balance,2020,activo_corriente,Inversiones a corto plazo,52927.0
176,8875,apple-computer-inc,balance,2020,activo_corriente,Créditos totales,37445.0
179,8878,apple-computer-inc,balance,2020,activo_corriente,Inventario,4061.0
180,8879,apple-computer-inc,balance,2020,activo_corriente,Otros activos corrientes,11264.0


In [9]:
df[
(df["informe"] == "balance") &
(df["seccion"] == "patrimonio_neto") &
(df["ejercicio"] == 2020) &
(df["company"] == "apple-computer-inc")
].to_excel("apple_2020.xlsx", index=False)


In [3]:
df["company"].unique()

array(['apple-computer-inc', 'microsoft-corp', 'google-inc',
       'tesla-motors', 'visa-inc', 'berkshire-hathaway-inc',
       'johnson-johnson', 'pfizer', 'amazon-com-inc', 'disney', 'nike',
       'procter-gamble', 'chevron', '3m-co', 'coca-cola-co'], dtype=object)

In [7]:
df["seccion"].unique()

array(['activo_corriente', 'activo_total', 'pasivo_corriente',
       'pasivo_total', 'patrimonio_neto', 'crecimiento_deuda', ''],
      dtype=object)