# Ejercicios con lista de valores

In [1]:
numeros <- c(103, 124, 89, 76, 132, 94, 115, 99, 100)

In [3]:
# Función para calcular la moda
calcular_moda <- function(lista) {
  frecuencias <- table(lista)
  moda <- as.numeric(names(frecuencias)[frecuencias == max(frecuencias)])
  if(length(moda) == length(lista)) {
    moda <- NA  # Si todos los valores son únicos, no hay moda
  }
  return(moda)
}

# Función para calcular estadísticas descriptivas
estadisticas_descriptivas <- function(lista) {
  resumen <- summary(lista)
  desviacion_estandar <- sd(lista)
  varianza <- var(lista)
  coef_var <- sd(lista) / mean(lista) * 100
  moda <- calcular_moda(lista)
  lista_resultados <- list(
    "Mínimo" = resumen["Min."],
    "Primer cuartil (Q1)" = resumen["1st Qu."],
    "Mediana" = resumen["Median"],
    "Media" = resumen["Mean"],
    "Tercer cuartil (Q3)" = resumen["3rd Qu."],
    "Máximo" = resumen["Max."],
    "Desviación estándar" = desviacion_estandar,
    "Varianza" = varianza,
    "Coeficiente de variación (%)" = coef_var,
    "Moda" = moda
  )
  return(lista_resultados)
}

# Calcular y mostrar las estadísticas descriptivas
resultados <- estadisticas_descriptivas(numeros)
print(resultados)


$Mínimo
Min. 
  76 

$`Primer cuartil (Q1)`
1st Qu. 
     94 

$Mediana
Median 
   100 

$Media
    Mean 
103.5556 

$`Tercer cuartil (Q3)`
3rd Qu. 
    115 

$Máximo
Max. 
 132 

$`Desviación estándar`
[1] 17.51507

$Varianza
[1] 306.7778

$`Coeficiente de variación (%)`
[1] 16.9137

$Moda
[1] NA



# Ejercicios con tabla de frecuencias

In [12]:
df <- data.frame(
  Minimo = c(500, 1000, 1500, 2000, 2500, 3000, 3500),
  Maximo = c(1000, 1500, 2000, 2500, 3000, 3500, 4000),
  Frecuencias = c(4, 9, 16, 25, 27, 14, 6)
)

### Media

In [4]:
calcular_media <- function(data) {
  puntos_medios <- (data$Minimo + data$Maximo) / 2
  media_ponderada <- sum(puntos_medios * data$Frecuencias) / sum(data$Frecuencias)
  return(media_ponderada)
}
media = calcular_media(df)

In [5]:
print(paste("Media:", media))

[1] "Media: 1907.5"


### Varianza y Desvío Estándar

In [6]:
calcular_varianza <- function(data) {
  media_ponderada <- calcular_media(data)
  puntos_medios <- (data$Minimo + data$Maximo) / 2
  N <- sum(data$Frecuencias)
    
  varianza <- sum(data$Frecuencias * (puntos_medios - media_ponderada)^2) / N
  return(varianza)
}

In [7]:
varianza <- calcular_varianza(df)
print(paste("Varianza:", varianza))

[1] "Varianza: 1054568.75"


In [8]:
print(paste("Desvío estándar:", sqrt(varianza)))

[1] "Desvío estándar: 1026.92197853586"


### Coeficiente de Variación

In [11]:
media <- calcular_media(df)
varianza <- calcular_varianza(df)

cv = sqrt(varianza) / media
print(paste("CV:", cv))

[1] "CV: 0.538360146021419"


### Mediana

In [88]:
encontrar_frecuencias <- function(data, N) {
  mitad_N <- N / 2  # La mitad del total de frecuencias
  
  frecuencia_acumulada <- 0  # Inicializar la frecuencia acumulada
  frecuencia_anterior <- 0  # Almacenar la frecuencia acumulada del paso anterior
  
  for (i in 1:nrow(data)) {
    frecuencia_anterior <- frecuencia_acumulada
    frecuencia_acumulada <- frecuencia_acumulada + data$Frecuencias[i]
    
    if (frecuencia_acumulada >= mitad_N) {
      return(c(L = data$Minimo[i], f = data$Frecuencias[i], F = frecuencia_anterior))
    }
  }
}

N = sum(df$Frecuencias)
resultado_frec <- encontrar_frecuencias(df,N)

L <- resultado_frec["L"]
f <- resultado_frec["f"]
F <- resultado_frec["F"]

In [54]:
mediana = L + (N/2 - F) / f * (df$Maximo[1] - df$Minimo[1])
print(paste("Mediana:",mediana))

[1] "Mediana: 1763.51351351351"


### Moda o Modalidad

In [56]:
encontrar_max_frecuencia <- function(data) {
  indice_max <- which.max(data$Frecuencias)
  valor_minimo <- data$Minimo[indice_max]
  return(valor_minimo)
}

encontrar_frecuencias_relacionadas <- function(data) {
  indice_max <- which.max(data$Frecuencias)
  f1 <- data$Frecuencias[indice_max]
  
  if (indice_max > 1) {
    f0 <- data$Frecuencias[indice_max - 1]
  } else {
    f0 <- 0
  }
  
  if (indice_max < nrow(data)) {
    f2 <- data$Frecuencias[indice_max + 1]
  } else {
    f2 <- 0
  }
  
  return(c(f0 = f0, f1 = f1, f2 = f2))
}

L = encontrar_max_frecuencia(df)

frecuencias_relacionadas <- encontrar_frecuencias_relacionadas(df)

f0 <- frecuencias_relacionadas["f0"]
f1 <- frecuencias_relacionadas["f1"]
f2 <- frecuencias_relacionadas["f2"]

In [57]:
moda <- L + ((f1 - f0) / (2 * f1 - f0 - f2)) * amplitud_intervalo
print(paste("Moda:",moda))

[1] "Moda: 1376.92307692308"


### Cuartiles

In [74]:
encontrar_frecuencias <- function(data, N, cuartil) {
  N_cuart <- N * cuartil  # La mitad del total de frecuencias
  
  frecuencia_acumulada <- 0  # Inicializar la frecuencia acumulada
  frecuencia_anterior <- 0  # Almacenar la frecuencia acumulada del paso anterior
  
  for (i in 1:nrow(data)) {
    frecuencia_anterior <- frecuencia_acumulada
    frecuencia_acumulada <- frecuencia_acumulada + data$Frecuencias[i]
    
    if (frecuencia_acumulada >= N_cuart) {
      return(c(L = data$Minimo[i], f = data$Frecuencias[i], F = frecuencia_anterior))
    }
  }
}

N = sum(df$Frecuencias)

In [75]:
resultado_frec <- encontrar_frecuencias(df, N, 0.25)

Q1 = resultado_frec["L"] + (N * 0.25 - resultado_frec["F"]) / resultado_frec["f"] * (df$Maximo[1] - df$Minimo[1])
print(paste("Q1:", Q1))

[1] "Q1: 1161.11111111111"


In [76]:
resultado_frec <- encontrar_frecuencias(df, N, 0.5)

Q2 = resultado_frec["L"] + (N * 0.5 - resultado_frec["F"]) / resultado_frec["f"] * (df$Maximo[1] - df$Minimo[1])
print(paste("Q2:", Q2))

[1] "Q2: 1763.51351351351"


In [77]:
resultado_frec <- encontrar_frecuencias(df, N, 0.75)

Q3 = resultado_frec["L"] + (N * 0.75 - resultado_frec["F"]) / resultado_frec["f"] * (df$Maximo[1] - df$Minimo[1])
print(paste("Q3:", Q3))

[1] "Q3: 2604.6511627907"


### Decil de K-orden

In [50]:
encontrar_frecuencias <- function(data, N, cuartil) {
  N_cuart <- N * cuartil  # La mitad del total de frecuencias
  
  frecuencia_acumulada <- 0  # Inicializar la frecuencia acumulada
  frecuencia_anterior <- 0  # Almacenar la frecuencia acumulada del paso anterior
  
  for (i in 1:nrow(data)) {
    frecuencia_anterior <- frecuencia_acumulada
    frecuencia_acumulada <- frecuencia_acumulada + data$Frecuencias[i]
    
    if (frecuencia_acumulada >= N_cuart) {
      return(c(L = data$Minimo[i], f = data$Frecuencias[i], F = frecuencia_anterior))
    }
  }
}

N = sum(df$Frecuencias)

In [45]:
orden <- 5
orden_porc <- orden / 10

resultado_frec <- encontrar_frecuencias(df, N, orden_porc)

decil_k = resultado_frec["L"] + (N * orden_porc - resultado_frec["F"]) / resultado_frec["f"] * (df$Maximo[1] - df$Minimo[1])
print(paste("Decil:", decil_k))

[1] "Decil: 2430"


### Asimetría

In [60]:
calcular_asimetria <- function(data) {
    puntos_medios <- (df$Minimo + df$Maximo) / 2
    media <- sum(puntos_medios * data$Frecuencias) / sum(data$Frecuencias)
    varianza <- sum(df$Frecuencias * (puntos_medios - media)^2) / sum(df$Frecuencias)
    tercer_momento <- sum(df$Frecuencias * (puntos_medios - media)^3) / sum(df$Frecuencias)
    asimetria <- tercer_momento / (sqrt(varianza))^3
    return(asimetria)
}

In [61]:
asimetria <- calcular_asimetria(df)
print(paste("Asimetría:", asimetria))

[1] "Asimetría: 0.630963073065562"


### Kurtosis

In [39]:
df <- data.frame(
  Minimo = c(10, 15, 20, 25, 30),
  Maximo = c(15, 20, 25, 30, 35),
  Frecuencias = c(4, 8, 5, 2, 1)
)

In [58]:
calcular_curtosis <- function(data) {
    puntos_medios <- (data$Minimo + data$Maximo) / 2
    media <- sum(puntos_medios * data$Frecuencias) / sum(data$Frecuencias)
    varianza <- sum(data$Frecuencias * (puntos_medios - media)^2) / sum(data$Frecuencias)
    cuarto_momento <- sum(data$Frecuencias * (puntos_medios - media)^4) / sum(data$Frecuencias)
    curtosis <- cuarto_momento / (varianza^2)
    return(curtosis)
}

In [62]:
curtosis <- calcular_curtosis(df)
print(paste("Exceso de Curtosis:", curtosis - 3))

[1] "Exceso de Curtosis: -0.113573407202216"


**Exceso de curtosis = 0:** La distribución tiene la misma curtosis que una distribución normal.

**Exceso de curtosis > 0:** La distribución es leptocúrtica, es decir, tiene colas más pesadas y un pico más alto que una distribución normal.

**Exceso de curtosis < 0:** La distribución es platicúrtica, es decir, tiene colas más ligeras y un pico más bajo que una distribución normal.

In [63]:
print(paste("Curtosis cruda:", curtosis))

[1] "Curtosis cruda: 2.88642659279778"


**Curtosis cruda = 3:** La distribución tiene la misma forma que una distribución normal en términos de la distribución de las colas y la altura del pico.

**Curtosis cruda > 3:** La distribución es leptocúrtica, lo que significa que tiene colas más pesadas y un pico más alto que una distribución normal. Esto indica la presencia de outliers más extremos.

**Curtosis cruda < 3:** La distribución es platicúrtica, lo que significa que tiene colas más ligeras y un pico más bajo que una distribución normal. Esto indica que los datos están más concentrados alrededor de la media y hay menos outliers extremos.

### Encontrar un dato

In [55]:
encontrar_frecuencias <- function(data, N, cuartil) {
  N_cuart <- N * cuartil  # La mitad del total de frecuencias
  
  frecuencia_acumulada <- 0  # Inicializar la frecuencia acumulada
  frecuencia_anterior <- 0  # Almacenar la frecuencia acumulada del paso anterior
  
  for (i in 1:nrow(data)) {
    frecuencia_anterior <- frecuencia_acumulada
    frecuencia_acumulada <- frecuencia_acumulada + data$Frecuencias[i]
    
    if (frecuencia_acumulada >= N_cuart) {
      return(c(L = data$Minimo[i], f = data$Frecuencias[i], F = frecuencia_anterior))
    }
  }
}

N = sum(df$Frecuencias)

In [56]:

orden_porc <- (calcular_media(df)+sqrt(calcular_varianza(df))) / 4000
print(orden_porc)

resultado_frec <- encontrar_frecuencias(df, N, orden_porc)

decil_k = resultado_frec["L"] + (N * orden_porc - resultado_frec["F"]) / resultado_frec["f"] * (df$Maximo[1] - df$Minimo[1])
print(paste("Decil:", decil_k))

[1] 0.7794684
[1] "Decil: 2957.89464150856"


In [63]:
N-((decil_k - resultado_frec["L"]) / (df$Maximo[1] - df$Minimo[1]) * resultado_frec["f"] + resultado_frec["F"])