### Calculo de Ratios

#### liquidez
* Razón corriente = Activos corrientes / Pasivos corrientes
* Prueba ácida = (Activo corriente - Inventarios) / Pasivo corriente

#### Solvencia y endeudamiento
* Endeudamiento total = Total de pasivos / Total de activos
* Endeudamiento de largo plazo = Pasivo no corriente / Total de activos
* Cobertura de intereses = EBIT / Gastos por intereses

#### Rentabilidad
* ROA (Return on Assets) = Beneficio neto / Activo total
* ROE (Return on Equity) =  Beneficio neto / Patrimonio neto
* Margen de utilidad = 	Beneficio neto / Ventas (ingresos totales) (escrapeado "Margen del beneficio neto %")
* Rotación de activos = ingresos totales / Total de activos
* Rotación de inventarios = ingresos totales / Inventario

In [6]:
import sqlite3
import pandas as pd
pd.options.display.max_rows = 999

# Consultar datos
conn = sqlite3.connect('webmining.db')
cursor = conn.cursor()
cursor.execute("SELECT * FROM datos_anuales")
column_names = [description[0] for description in cursor.description]
filas = cursor.fetchall()

# Guardar los datos en un dataframe
df = pd.DataFrame(filas, columns=column_names)

In [7]:
indicadores = df.groupby(["informe","seccion","indicador"]).size()

print(indicadores)

informe     seccion            indicador                                                 
balance     activo_corriente   Crecimiento de efectivo y equivalentes                        74
                               Créditos totales                                              74
                               Efectivo restringido                                          29
                               Efectivo y equivalentes                                       74
                               Gastos pagados por adelantado                                 42
                               Inventario                                                    66
                               Inversiones a corto plazo                                     63
                               Otros activos corrientes                                      66
                               Otros créditos                                                41
                               Total de cuenta

In [8]:
# rubros que componen cada seccion
# no se incluye por ejemplo el rubro "otros creditos" ya que forma parte de "Creditos totales"
activo_corriente = [
    "Efectivo y equivalentes",
    "Inversiones a corto plazo",
    "Créditos totales",
    "Inventario",
    "Gastos pagados por adelantado",
    "Otros activos corrientes"
]
activo_no_corriente = [
    "Planta, propiedad y equipo, neto",
    "Inversiones a largo plazo",
    "Activos intangibles",
    "Total de otros activos"
]
pasivo_corriente = [
    "Total de cuentas por pagar",
    "Total de gastos devengados",
    "Préstamos a corto plazo",
    "Parte actual de la deuda a largo plazo/arrendamientos",
    "Total de otros pasivos corrientes"
]
pasivo_no_corriente = [
    "Deuda a largo plazo",
    "Arrendamientos a largo plazo",
    "Total de otros pasivos"
]
patrimonio_neto = [
    "Total de acciones preferentes",
    "Acciones ordinarias y APIC",
    "Ganancias retenidas",
    "Acciones propias y otras",
    "Intereses minoritarios"
]

inventario = ["Inventario"]

EBIT = ["EBIT"]
	
intereses = ["Total de gastos de intereses"]

In [9]:
# features de indicadores ya escrapeados

indicadores_scrapeados = [
  "Crecimiento de efectivo y equivalentes",
  "Crecimiento de activos totales",
  "Crecimiento del pasivo total",
  "Crecimiento de la deuda total",
  "Crecimiento del beneficio neto",
  "Crecimiento del EBITDA",
  "Crecimiento de los ingresos totales"
]

In [10]:
ac = pd.pivot_table(df[df.indicador.isin(activo_corriente)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"activo_corriente"})
anc = pd.pivot_table(df[df.indicador.isin(activo_no_corriente)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"activo_no_corriente"})
pc = pd.pivot_table(df[df.indicador.isin(pasivo_corriente)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"pasivo_corriente"})
pnc = pd.pivot_table(df[df.indicador.isin(pasivo_no_corriente)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"pasivo_no_corriente"})
pn = pd.pivot_table(df[df.indicador.isin(patrimonio_neto)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"patrimonio_neto"})
inv = pd.pivot_table(df[df.indicador.isin(inventario)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"inventario"})
ebit = pd.pivot_table(df[df.indicador.isin(EBIT)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"EBIT"})
int = pd.pivot_table(df[df.indicador.isin(intereses)], index=["company","ejercicio"], values="valor").rename(columns={"valor":"intereses"})

data = pd.concat([ac,anc,pc,pnc,pn,inv,ebit,int], axis=1)
data

Unnamed: 0_level_0,Unnamed: 1_level_0,activo_corriente,activo_no_corriente,pasivo_corriente,pasivo_no_corriente,patrimonio_neto,inventario,EBIT,intereses
company,ejercicio,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
3m-co,2020,214.283833,61.537,3.9872,242.587667,14.5734,4.239,7.156,-529.0
3m-co,2021,183.053167,73.35175,5.0038,235.412,15.6092,4.985,7.754,-488.0
3m-co,2022,173.277,249.45,2.38075,225.502333,9.7444,5.372,3.348,-462.0
3m-co,2023,68.330833,60.99775,3.0594,184.630333,9.9614,3.944,4.281,-941.0
3m-co,2024,200.116333,5.996,2.814,158.755333,8.1684,3.698,4.29,-1.191
amazon-com-inc,2020,73.1,47.1155,170.132,33.802,31.134667,23.795,22.899,-1.647
amazon-com-inc,2021,80.6676,64.74225,28.4532,46.679333,46.081667,32.64,24.879,-1.809
amazon-com-inc,2022,84.072167,78.971,31.0786,53.746333,48.681,34.405,13.348,-2.367
amazon-com-inc,2023,111.475667,88.87575,62.354,53.687333,67.291667,33.318,36.852,-3.182
amazon-com-inc,2024,72.936667,108.50675,66.056,53.164333,95.323333,34.214,68.593,-2.406


In [9]:
df[
(df["informe"] == "balance") &
(df["seccion"] == "patrimonio_neto") &
(df["ejercicio"] == 2020) &
(df["company"] == "apple-computer-inc")
].to_excel("apple_2020.xlsx", index=False)


In [3]:
df["company"].unique()

array(['apple-computer-inc', 'microsoft-corp', 'google-inc',
       'tesla-motors', 'visa-inc', 'berkshire-hathaway-inc',
       'johnson-johnson', 'pfizer', 'amazon-com-inc', 'disney', 'nike',
       'procter-gamble', 'chevron', '3m-co', 'coca-cola-co'], dtype=object)

In [7]:
df["seccion"].unique()

array(['activo_corriente', 'activo_total', 'pasivo_corriente',
       'pasivo_total', 'patrimonio_neto', 'crecimiento_deuda', ''],
      dtype=object)