In [3]:
required_packages <- c("readxl", "dplyr", "openxlsx", "rstatix", "tidyverse", "moments", "vcd")

# Funkce: Nainstaluj jen to, co chybí, a pak vše načti
install_and_load <- function(pkg) {
  if (!require(pkg, character.only = TRUE)) {
    install.packages(pkg, dependencies = TRUE)
    library(pkg, character.only = TRUE)
  }
}

# Spuštění pro všechny balíčky najednou
lapply(required_packages, install_and_load)

# Pro jistotu explicitní načtení (abys viděl, že to funguje):
library(readxl)    # Čtení Excelů
library(openxlsx)  # Zápis Excelů
library(tidyverse) # Obsahuje dplyr, ggplot2, tidyr (na filtrace a grafy)
library(rstatix)   # Statistické testy (moderní verze)
library(moments)   # Šikmost a špičatost (skewness, kurtosis)
library(vcd)       # Kategoriální data (Cramerovo V, Mozaikové grafy)

Loading required package: readxl

Loading required package: dplyr


Attaching package: ‘dplyr’


The following objects are masked from ‘package:stats’:

    filter, lag


The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union


Loading required package: openxlsx

Loading required package: rstatix


Attaching package: ‘rstatix’


The following object is masked from ‘package:stats’:

    filter


Loading required package: tidyverse

── [1mAttaching core tidyverse packages[22m ──────────────────────── tidyverse 2.0.0 ──
[32m✔[39m [34mforcats  [39m 1.0.1     [32m✔[39m [34mreadr    [39m 2.1.6
[32m✔[39m [34mggplot2  [39m 4.0.0     [32m✔[39m [34mstringr  [39m 1.5.2
[32m✔[39m [34mlubridate[39m 1.9.4     [32m✔[39m [34mtibble   [39m 3.3.0
[32m✔[39m [34mpurrr    [39m 1.1.0     [32m✔[39m [34mtidyr    [39m 1.3.1
── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mrstatix

In [1]:
data <- readxl::read_excel("dataset_5_out.xlsx")
head(data)

ID,m0,m1,skupina
<dbl>,<dbl>,<dbl>,<chr>
1,93.7,75.8,KETO
2,85.7,77.2,KETO
3,80.4,74.9,KETO
4,72.9,75.2,KETO
5,84.1,69.8,KETO
6,85.5,73.9,KETO


In [14]:

x <- data %>% 
  filter(skupina == "KETO+HIIT") %>%  # <--- ZKONTROLUJ PŘESNÝ NÁZEV KATEGORIE!
  pull(m0)      # pull() vytáhne sloupec jako vektor čísel


Q1 <- quantile(x, 0.25, na.rm = TRUE)
Q3 <- quantile(x, 0.75, na.rm = TRUE)
IQR_hodnota <- IQR(x, na.rm = TRUE)    # Rozdíl Q3 - Q1
 
IQR_hodnota


# Výpočet vnitřních hradeb (1.5 násobek IQR)
DM <- Q1 - 1.5 * IQR_hodnota # Dolní mez (Lower Fence)
HM <- Q3 + 1.5 * IQR_hodnota # Horní mez (Upper Fence)

print("--- HRANICE (Vnitřní hradby) ---")
print(paste("Dolní mez (DM):", round(DM, 4)))
print(paste("Horní mez (HM):", round(HM, 4)))
print(paste("Interval normálních hodnot: <", round(DM, 2), ";", round(HM, 2), ">"))

# 3. IDENTIFIKACE ODLEHLÝCH POZOROVÁNÍ
# ------------------------------------------------
# Hodnoty, které jsou MENŠÍ než DM nebo VĚTŠÍ než HM
odlehle <- x[x < DM | x > HM]

print("--- ODLEHLÉ HODNOTY (Outliers) ---")
if (length(odlehle) > 0) {
  print(odlehle)
  print(paste("Počet odlehlých:", length(odlehle)))
} else {
  print("Žádná odlehlá pozorování nebyla nalezena.")
}

x_clean <- x[x >= DM & x <= HM]

print("--- STATISTIKY PO ODSTRANĚNÍ ODLEHLÝCH ---")
print(paste("Nový průměr:", round(mean(x_clean, na.rm = TRUE), 4)))
print(paste("Nový medián:", round(median(x_clean, na.rm = TRUE), 4)))
print(paste("Nový horní kvartil (Q3):", round(quantile(x_clean, 0.10, na.rm = TRUE), 4)))
print(paste("Nová směrodatná odchylka:", round(sd(x_clean, na.rm = TRUE), 4)))

[1] "--- HRANICE (Vnitřní hradby) ---"
[1] "Dolní mez (DM): 69.625"
[1] "Horní mez (HM): 99.625"
[1] "Interval normálních hodnot: < 69.62 ; 99.63 >"
[1] "--- ODLEHLÉ HODNOTY (Outliers) ---"
[1] 105.2 105.4 105.4
[1] "Počet odlehlých: 3"
[1] "--- STATISTIKY PO ODSTRANĚNÍ ODLEHLÝCH ---"
[1] "Nový průměr: 84.5111"
[1] "Nový medián: 85.4"
[1] "Nový horní kvartil (Q3): 78.62"
[1] "Nová směrodatná odchylka: 4.2892"
