### Reporte Cálidad de Datos Geográficos Clientes SIGUE
Dirección de Apoyo Comercial - Catastro de Usuarios  
Agosto 2022
# ![LOGOEAAB](src/logo.png)



### Introducción

El presente reporte pretende estimar mediante estadistica inferencial, calidad de los datos geográficos que se almacenan en la capa de clientes, con este fin se toma una muestra representativa de los clientes georreferenciados y se evaluan los campos:    
 * Posición X, Y de la cuenta Contrato
 * CHIP
 * Estrato
 * Codigo de Lote
 * Codigo de Manzana
 * Distrito Hidráulico
 * Código UPZ
 * Nombre UPZ
 * Código Sector Catastral
 * Nombre Sector Catastral
 * ID Localidad
 * Codigo Localidad
 * Nombre Localidad
 * ID Municipio
 * Nombre Municipio
 * Unidad de Lectura
 * Porción de Lectura
 * Zona
 

#### Variables para la estimar el tamaño de muestra

* Poblacion N = 2'598 0000  
* Intervalo de Confianza = 99%  
* Z para intervalo de confianza = 2.58     
* P probalidad de Exito = 50%   
* Q probailidad de Fracaso = 50%
* d margen de Error = 2%

Dado que se desconoce con exactitud la calidad de los datos se toma 50% para la probabilidad de extio y fracaso, asumiendo que se desconoce la calidad de los datos

Para estimar el tamaño de la muestra se utiliza la siguiente ecuación, teniendo en cuenta que la población es grande

# $n = \frac{Z^{2}PQ}{d^{2}}$

Donde n es el tamaño de la muestra representativa para el conjunto de datos 

## Cálculos

#### Inicializando las variables

In [1]:
import pandas as pd
import numpy as np
import math as m

N = 2581402
Z = 2.326
P = 0.5
Q = 0.5
d = 0.02

#### Cálculado tamaño de la Muestra

In [2]:
n = int((Z**2*P*Q)/(d**2))
print('Tamaño de la Muestra: ',n)

Tamaño de la Muestra:  3381


### Extrayendo muestra de los datos

In [3]:
import sqlite3
conexionDB = sqlite3.connect('CuentasSIGUE.gpkg')
clientesSigue = pd.read_sql_query('''
                                  SELECT ID_CLIENTE, 
                                  TRAMO, PLACA, 
                                  AGREGACION, CHIP, 
                                  DOMESTRATO, BARMANPRE, 
                                  DISTRITO, ID_UPZ, NOM_UPZ, 
                                  ID_BARRIO, NOM_SECCATASTRAL, 
                                  ID_LOCALIDAD, NOM_LOC_COM, 
                                  SECSZOMME, ID_MUNICIPIO, 
                                  NOM_MUNICIPIO,UNIDADLECTURA, 
                                  PORCIONLECTURA, 
                                  ZONA, NORTE, ESTE 
                                  FROM 
                                  cli_Clientes_EstActual;
                                  ''', con=conexionDB)
muestraClientes = clientesSigue.sample(n=n)
del clientesSigue
muestraClientes.head(10)

Unnamed: 0,ID_CLIENTE,TRAMO,PLACA,AGREGACION,CHIP,DOMESTRATO,BARMANPRE,DISTRITO,ID_UPZ,NOM_UPZ,...,ID_LOCALIDAD,NOM_LOC_COM,SECSZOMME,ID_MUNICIPIO,NOM_MUNICIPIO,UNIDADLECTURA,PORCIONLECTURA,ZONA,NORTE,ESTE
737431,11402381,CL 70D BIS 106A,47,,AAA0174APSY,2.0,5675031045.0,5675031.0,UPZ73,GARCES NAVAS,...,10,ENGATIVA,2040700,11001,BOGOTÁ D.C,J22377A,J2,2,112216.509,94870.914
34656,11634085,KR 145 145,46,BQ 6 IN 69,AAA0180XNUH,2.0,9248008001.0,9248008.0,UPZ71,TIBABUYES,...,11,SUBA,1050704,11001,BOGOTÁ D.C,H11317,H1,1,117626.363161,95883.357174
1374192,12298069,KR 24 45A SUR,45,TO 2 AP 204,AAA0256WNEA,3.0,2205018013.0,2205018.0,UPZ39,QUIROGA,...,18,RAFAEL URIBE URIBE,3110920,11001,BOGOTÁ D.C,C33085,C3,3,98099.078362,94513.715275
867386,12236733,KR 13 40C,10,AP 313,AAA0088KANN,4.0,8112016021.0,8112016.0,UPZ99,CHAPINERO,...,2,CHAPINERO,2190101,11001,BOGOTÁ D.C,L22473A,L2,2,103581.885231,101183.684621
343333,10266841,DG 107 2,41,AP 304,AAA0102CMRJ,4.0,8409001001.0,8409001.0,UPZ14,USAQUEN,...,1,USAQUEN,1180400,11001,BOGOTÁ D.C,M11517,M1,1,109795.914327,104946.554788
2157283,12149177,KR 7A 3,80,TO 30 AP 102,,0.0,,,,,...,4,SOACHA,5301102,25754,SOACHA,C05014,C0,5,98259.943061,82705.26767
1938170,11616136,CL 57A SUR 93C,51,IN 8 CA 17,AAA0194ZRRU,2.0,4632036001.0,4632036.0,UPZ86,EL PORVENIR,...,7,BOSA,5010302,11001,BOGOTÁ D.C,O51083,O5,5,104116.727602,87239.765464
723814,10127641,CL 68B 78,18,,AAA0062OORU,3.0,5608030003.0,5608030.0,UPZ30,BOYACA REAL,...,10,ENGATIVA,2040201,11001,BOGOTÁ D.C,B22068B,B2,2,110169.861,97062.759
447473,10911535,KR 22 118,32,AP 404,AAA0105ZWSY,5.0,8417013003.0,8417013.0,UPZ16,SANTA BARBARA,...,1,USAQUEN,1070602,11001,BOGOTÁ D.C,A11029A,A1,1,111521.584646,102753.351153
152829,10370830,CL 129A 93,31,,AAA0129DZLW,2.0,9202073028.0,9202073.0,UPZ28,EL RINCON,...,11,SUBA,1050501,11001,BOGOTÁ D.C,L11441A,L1,1,114219.702,98427.02


### Exportando Datos



In [4]:
muestraClientes.to_excel('MuestraClientes.xlsx')