Analisis de Negocios para Ciencia de Datos El gran volumen de informacion que las empresas almacenan diariamente(costos, eficiencia, para entender a los clientes buscando una solucion matematica a un problema de negocio)
personas (like,subiendo fotos, etiquetando) transacciones(monetarias{pagos con targetas} y no monetarias{companias telefonicas registran todo llamadas etc} navegacion web(kuquis identifican todo edad genero pais) machine 2 machine(coneccion maquina maquina gps) biometricos(identifican como gen unico sangre saliva uella dactilar)
Empresas data-driven 1-crear una cultura de datos 2-recolectar informacion 3-medir todo 4-datos relevantes y precisos 5-testear y crear hipotesis 6-desde los insights de datos a las acciones(desde los insights ya podemos tomar acciones ejm en diciembre se consume mas cerveza por lo que podrias poner en sobreaviso a quien corresponda) 7- cumplir las regulaciones de datos 8-automatizar
IBM arranca con una maquina de ajedres este fue unos de los inicios automatiza las cosas se perfeccione sola por ejemplo los correos electronicos ya no se reciven span para que sirve esta machine learning? 1- detencion de fraudes detecta quien uso targetas falsas quien uso codigo para enganiar a la maquina y dice otra persona ya uso este tipo de codogo para enganiame 2- busqueda web detecta intereses de consumo y te de opciones de copra 3- anuncios a tiempo real detecta la nececidad y comveniete que te puede resultar una compra 4- analisis de texto explora todos los mensajes y detecta cosas 5- next best action la siguiente mejor accion
se refiere al aprendizaje multimedia ya sea imagenes y sonido
Ingeniero de datos (es el arquitecto conecta el dispocitivo con la base de datos) base de datos ETLs/APIs SQLyNoSQL Analista business intalligence(el encargado de presentar los datos para que sean legibles a cualquiera extraccion y dashboards automatizacion SQL y Exxel Data Scientist (es el encargado de presentar los modelos a futuro asia a donde vamos) machine learning modelos estaditicos R y Python data translator data scientist-decision makers destiladores de data expertos necessidad de negocios
extraccion de informacion con SQL sintesis de la base de datos cuadros de control de la operacion Analisis y visualizacion con R y Python
orden_id | fecha | valor | cliente_id |
---|---|---|---|
1 | 2021/08/01 | 1,4 | 2 |
(esta es una tabla SQL) instrucciones de coandos SQL select "alguna columna" from "tabla donde se almacena la info" where 'especifica las condiciones' group by "campos(columnas)de agrupacion order by "campos (columnas)de ordenacion
and "une varias condiciones que tienen que ser cumplidas para obtener resultados or "evalua dos o mas condiciones y obtienes resultados si una de ellas se cumple not "excluye un valor de la informacion a obtener.
FUNCIIONES AGREGADAS avg "promedio(average) de un campo(columna)" count "recuento de valores de una columna" distinct "encontrar valores unicos" sum "suma de valores de una columna" max "valor mas alto de una columna" min " valor mas bajo de una columna"