### 1ra parte

Lea los datos de transacciones de fondos y guarde la información en SQL. Podría ser útil ver:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_sql.html



In [6]:
#lee los datos desde excel
import pandas as pd

data = pd.read_excel('transacc.xlsx')


#guarda info a sql
import sqlite3
conn = sqlite3.connect('db_transacciones.db')
data.to_sql('transacciones', conn, if_exists='replace', index=False)


In [3]:
data

Unnamed: 0,PERIODO,R_INVERSIONISTA,R_TIPO_INVERSIONISTA,R_ACTIVO,R_TIPO_ACTIVO,R_NEMO_ACTIVO,DESTINO,R_MONTO_INVERSION
0,201812,19528,FI,12345,CFIPE,OTRO,FI_INV_EXTR,150705.276423
1,201812,19561,FI,12345,CFIE,OTRO,FI_INV_EXTR,156673.459268
2,201812,19593,FI,12345,CFIPE,OTRO,FI_INV_EXTR,277432.363821
3,201812,19621,FI,12345,CFIPE,OTRO,FI_INV_EXTR,598485.045366
4,201812,21515,FI,12345,CFIPE,OTRO,FI_INV_EXTR,172918.650488
5,201812,21530,FI,12345,CFIPE,OTRO,FI_INV_EXTR,322689.598049
6,201812,21561,FI,12345,CFIPE,OTRO,FI_INV_EXTR,213746.272927
7,201812,21659,FI,12345,CFIPE,OTRO,FI_INV_EXTR,439348.824146
8,201812,21704,FI,12345,CFIPE,OTRO,FI_INV_EXTR,313651.939512
9,201812,21783,FI,12345,CFIPE,OTRO,FI_INV_EXTR,61314.864634


### 2da parte

A partir del archivo SQL, responda las siguientes preguntas:

    - ¿a cuántos períodos se refiere la información?


In [13]:
import pandas as pd

query = 'select distinct periodo from transacciones'

df = pd.read_sql(query, conn)
df

Unnamed: 0,PERIODO
0,201812


    - ¿cuántos inversionistas hay en la base?


In [18]:
query = '''
    SELECT COUNT(*)
    FROM 
    (
        select distinct r_inversionista 
        from transacciones
    )
'''

df = pd.read_sql(query, conn)
df

Unnamed: 0,COUNT(*)
0,859


- ¿cuántos activos hay en la base?


In [44]:
query = '''
    SELECT COUNT(*)
    FROM 
    (
        select distinct r_activo 
        from transacciones
    )
'''

df = pd.read_sql(query, conn)
df

Unnamed: 0,COUNT(*)
0,5868


    - ¿cuántos activos por tipo de activo hay en la base (R_TIPO_ACTIVO)? 


In [43]:
param = 'BBFE'

query = '''
    SELECT r_tipo_activo, COUNT(*)
    FROM 
    (
        select distinct r_tipo_activo, r_activo 
        from transacciones
    )
    where r_tipo_activo = "{}"
    GROUP BY r_tipo_activo
'''.format(param)

data = conn.cursor().execute(query)

df = pd.DataFrame.from_records(data.fetchall())
df

Warning: You can only execute one statement at a time.

    - Monto total invertido por estos inversionistas


In [22]:
query = '''
    SELECT SUM(R_MONTO_INVERSION)
    FROM TRANSACCIONES
'''

df = pd.read_sql(query, conn)
df

Unnamed: 0,SUM(R_MONTO_INVERSION)
0,411950700.0


    - Monto total invertido por cada inversionista


In [25]:
query = '''
    SELECT R_INVERSIONISTA, SUM(R_MONTO_INVERSION)/ COUNT(*), AVG(R_MONTO_INVERSION)
    FROM TRANSACCIONES
    GROUP BY R_INVERSIONISTA
'''

df = pd.read_sql(query, conn)
df

Unnamed: 0,R_INVERSIONISTA,SUM(R_MONTO_INVERSION)/ COUNT(*),AVG(R_MONTO_INVERSION)
0,19347,105030.713189,105030.713189
1,19352,1190.934959,1190.934959
2,19353,29372.821138,29372.821138
3,19354,935.243902,935.243902
4,19355,217179.353659,217179.353659
5,19359,390112.513211,390112.513211
6,19360,68547.206844,68547.206844
7,19361,47925.813008,47925.813008
8,19363,81672.780488,81672.780488
9,19367,57435.496516,57435.496516


    - Porcentaje que representa el monto invertido en cada activo, sobre el total invertido por cada inversionista


In [55]:
query = '''
    WITH TABLA_AUXILIAR AS (
        SELECT R_INVERSIONISTA, SUM(R_MONTO_INVERSION) AS MONTO_TOTAL
        FROM TRANSACCIONES
        GROUP BY R_INVERSIONISTA
    )
    
    SELECT *
    FROM TRANSACCIONES JOIN TABLA_AUXILIAR USING (R_INVERSIONISTA)
    ORDER BY R_INVERSIONISTA
'''

df = pd.read_sql(query, conn)

df['porcentaje'] = df['R_MONTO_INVERSION'] / df.MONTO_TOTAL

df


Unnamed: 0,PERIODO,R_INVERSIONISTA,R_TIPO_INVERSIONISTA,R_ACTIVO,R_TIPO_ACTIVO,R_NEMO_ACTIVO,DESTINO,R_MONTO_INVERSION,MONTO_TOTAL,porcentaje
0,201812,19347,FI,20452,CFM,CFMBCICPAP,FI_INV_NACI,4798.138211,1.890553e+06,0.002538
1,201812,19347,FI,61820345,PE,SUAGUA120325,FI_INV_NACI,342.878049,1.890553e+06,0.000181
2,201812,19347,FI,61820345,PE,SUAGUA220620,FI_INV_NACI,452.715447,1.890553e+06,0.000239
3,201812,19347,FI,76050597,OTDN,OUNU-310328,FI_INV_NACI,5528.650407,1.890553e+06,0.002924
4,201812,19347,FI,76141503,OTDN,ONPRO-011222,FI_INV_NACI,149842.487805,1.890553e+06,0.079259
5,201812,19347,FI,76141503,OTDN,OUPR-310328,FI_INV_NACI,219138.081301,1.890553e+06,0.115912
6,201812,19347,FI,76373801,OTDN,OUPA-310328,FI_INV_NACI,361305.780488,1.890553e+06,0.191111
7,201812,19347,FI,76832631,OTDN,ONTAM-011222,FI_INV_NACI,8610.853659,1.890553e+06,0.004555
8,201812,19347,FI,76832631,OTDN,OUTA-310328,FI_INV_NACI,11116.878049,1.890553e+06,0.005880
9,201812,19347,FI,96740685,OTDN,ONIND-011230,FI_INV_NACI,118868.463415,1.890553e+06,0.062875


In [32]:
query = '''
    SELECT R_INVERSIONISTA, R_ACTIVO, R_MONTO_INVERSION, 
    MONTO_TOTAL, R_MONTO_INVERSION / MONTO_TOTAL AS PERC_MONTO
    FROM TRANSACCIONES JOIN   
        (SELECT R_INVERSIONISTA, SUM(R_MONTO_INVERSION) AS MONTO_TOTAL
        FROM TRANSACCIONES
        GROUP BY R_INVERSIONISTA) USING (R_INVERSIONISTA)
    WHERE R_INVERSIONISTA = ?
    ORDER BY R_INVERSIONISTA
'''

df = pd.read_sql(query, conn, params=(19347,))
df

Unnamed: 0,R_INVERSIONISTA,R_ACTIVO,R_MONTO_INVERSION,MONTO_TOTAL,PERC_MONTO
0,19347,20452,4798.138211,1890553.0,0.002538
1,19347,61820345,342.878049,1890553.0,0.000181
2,19347,61820345,452.715447,1890553.0,0.000239
3,19347,76050597,5528.650407,1890553.0,0.002924
4,19347,76141503,149842.487805,1890553.0,0.079259
5,19347,76141503,219138.081301,1890553.0,0.115912
6,19347,76373801,361305.780488,1890553.0,0.191111
7,19347,76832631,8610.853659,1890553.0,0.004555
8,19347,76832631,11116.878049,1890553.0,0.00588
9,19347,96740685,118868.463415,1890553.0,0.062875


    - Listado de inversionistas que invierten, en algún activo, más del 10% de su cartera.

In [75]:
#param = float(input())

query = '''
    WITH TABLA_AUXILIAR AS (
        SELECT R_INVERSIONISTA, SUM(R_MONTO_INVERSION) AS MONTO_TOTAL
        FROM TRANSACCIONES
        GROUP BY R_INVERSIONISTA
    ), 
    TABLA2 AS (
        SELECT R_INVERSIONISTA, R_ACTIVO, R_MONTO_INVERSION / MONTO_TOTAL AS PORCENTAJE
        FROM TRANSACCIONES JOIN TABLA_AUXILIAR USING (R_INVERSIONISTA)
        WHERE PORCENTAJE BETWEEN ? AND ?
        ORDER BY R_INVERSIONISTA    
    )
    
    SELECT DISTINCT R_INVERSIONISTA
    FROM TABLA2

'''

df = pd.read_sql(query, conn, params=[0.1,0.2])
df

Unnamed: 0,R_INVERSIONISTA
0,19347
1,19352
2,19359
3,19363
4,19367
5,19376
6,19434
7,19516
8,19530
9,19564


    - Listado de inversionistas que invierten, en algún activo, más del 10% de su cartera.

    - ¿qué tipo de inversionista (FM o FI) tiene una cartera de inversión más grande? Muestre el total, y también los montos desagregados por inversión extranjera e inversión nacional.
    - ¿qué tipos de activos tienen los mayores montos de inversión?


Finalmente, escriba código que le permita saber, de forma "dinámica", el total invertido (nacional y extranjero) por alguno de los tipos de inversionistas.


### 3ra parte

- Determine cuáles inversionistas son también activos. 




In [78]:
#param = float(input())

query = '''
    WITH INVERSIONISTAS AS (
        SELECT DISTINCT R_INVERSIONISTA AS ID
        FROM TRANSACCIONES
    ), 
    ACTIVOS AS (    
        SELECT DISTINCT R_ACTIVO AS ID
        FROM TRANSACCIONES
    )
    
    SELECT *
    FROM INVERSIONISTAS INNER JOIN ACTIVOS USING (ID)
    
'''

df = pd.read_sql(query, conn)
df

Unnamed: 0,ID
0,19355
1,19359
2,19361
3,19400
4,19409
5,19434
6,19530
7,19555
8,19564
9,19569


In [None]:
- ¿cómo podríamos saber los activos "subyacentes" de los inversionistas?


In [None]:
query = '''
    select r_tipo_inversionista, count(*) 
    from transacciones 
    group by r_tipo_inversionista'''


In [14]:
import pandas as pd

data = pd.read_excel('transacc.xlsx')


import sqlite3

conn = sqlite3.connect('db_transacciones.db')

data.to_sql('transacciones', conn, if_exists='replace', index=False)


In [10]:
data


Unnamed: 0,PERIODO,R_INVERSIONISTA,R_TIPO_INVERSIONISTA,R_ACTIVO,R_TIPO_ACTIVO,R_NEMO_ACTIVO,DESTINO,R_MONTO_INVERSION
0,201812,19528,FI,12345,CFIPE,OTRO,FI_INV_EXTR,150705.276423
1,201812,19561,FI,12345,CFIE,OTRO,FI_INV_EXTR,156673.459268
2,201812,19593,FI,12345,CFIPE,OTRO,FI_INV_EXTR,277432.363821
3,201812,19621,FI,12345,CFIPE,OTRO,FI_INV_EXTR,598485.045366
4,201812,21515,FI,12345,CFIPE,OTRO,FI_INV_EXTR,172918.650488
5,201812,21530,FI,12345,CFIPE,OTRO,FI_INV_EXTR,322689.598049
6,201812,21561,FI,12345,CFIPE,OTRO,FI_INV_EXTR,213746.272927
7,201812,21659,FI,12345,CFIPE,OTRO,FI_INV_EXTR,439348.824146
8,201812,21704,FI,12345,CFIPE,OTRO,FI_INV_EXTR,313651.939512
9,201812,21783,FI,12345,CFIPE,OTRO,FI_INV_EXTR,61314.864634


In [15]:
import sqlite3

conn = sqlite3.connect('db_transacciones.db')

query = 'select *  from transacciones limit 1'

df = pd.read_sql(query, conn)

df


Unnamed: 0,PERIODO,R_INVERSIONISTA,R_TIPO_INVERSIONISTA,R_ACTIVO,R_TIPO_ACTIVO,R_NEMO_ACTIVO,DESTINO,R_MONTO_INVERSION
0,201812,19528,FI,12345,CFIPE,OTRO,FI_INV_EXTR,150705.276423
