## Искусственные нейронные сети (ANN)

In [32]:
%use kandy

1. Перцептрон
2. Функции активации: сигмоида, гиперболический тангенс, ReLU
3. Без функции активации, ANN ведет себя как линейная регрессия
4. Прямое/обратное распространение ошибки
5. Градиентный спуск (напоминает рой)

#### Функции активации: сигмоида, гиперболический тангенс, ReLU

In [33]:
enum class Activation(
  val function: (Double) -> Double,
  val derivative: (Double) -> Double
) {
  SIGMOID(
    { x -> 1.0 / (1 + exp(-x)) },
    { x -> val s = 1.0 / (1 + exp(-x)); s * (1 - s) }
  ),
  TANH(
    { x -> tanh(x) },
    { x -> 1 - tanh(x).pow(2) }
  ),
  RELU(
    { x -> if (x > 0) x else 0.0 },
    { x -> if (x > 0) 1.0 else 0.0 }
  )
}

In [34]:
val xValues = (-300..300).map { it.toDouble() * 0.01 }

val plots = Activation.values().map { activation ->
  plot {
    line() {
      color = Color.BLUE
      x(xValues)
      y(xValues.map { activation.function(it) })
    }
    line() {
      color = Color.RED
      x(xValues)
      y(xValues.map { activation.derivative(it) })
    }
    layout {
      title = activation.name
      xAxisLabel = "x"
    }
  }
}

plots[0]

In [35]:
plots[1]

In [36]:
plots[2]

### Нейросеть для прогнозирования посещения ванны

#### 1. Подготовка данных из личного дневника

In [43]:
import java.io.File

val dataset = listOf(
  "2024 Лето",
  "2024 Осень",
  "2024-2025 Зима",
  "2025 Весна",
  "2025 Лето"
)

val rawText = dataset.asSequence()
  .map { File("../resources/personal_dataset/${it}.md") }
  .map { it.readText().lines() }
  .flatten()

In [44]:
val lines = rawText
  .filter { it.trim().isNotEmpty() }
  .filter { it.contains("- [x]") || it.contains("#") }

In [45]:
import kotlinx.datetime.Month
import java.time.LocalDate

fun parseToLocalDate(dateStr: String): LocalDate? {
  if (dateStr.contains("- [x]") || dateStr.contains("WEEKEND")) {
    return null
  }

  val date = dateStr
    .removePrefix("# ")
    .removeSuffix("❤️")
    .removeSuffix("🖤")
    .filter { it != '*' }
    .trim()
    .uppercase()
    .replace("ИЮНЯ", "JUNE")
    .replace("ИЮЛЯ", "JULY")
    .replace("АВГУСТА", "AUGUST")
    .replace("СЕНТЯБРЯ", "SEPTEMBER")
    .split(" ")
    .take(3)

  return LocalDate.of(
    date.last().toInt(),
    Month.valueOf(date[1]),
    date.first().toInt()
  )
}

In [46]:
data class DayEntry(
  val date: LocalDate,
  val tasks: List<String>,
)

In [47]:
var prevDatetime: LocalDate? = null
val currentTasks = mutableListOf<String>()
val days = mutableListOf<DayEntry>()

lines.forEach {
  val date = try {
    parseToLocalDate(it)
  } catch (_: Exception) {
    null
  }

  if (prevDatetime == null && date != null) {
    prevDatetime = date
  }

  if (prevDatetime != date) {
    days.add(
      DayEntry(
        prevDatetime!!,
        currentTasks.toList(),
      )
    )
    prevDatetime = date
    currentTasks.clear()
  }

  if (date == null) {
    currentTasks.add(it.removePrefix("- [x]").trim())
  }
}

In [48]:
import java.time.format.DateTimeFormatter

val formatter = DateTimeFormatter.ISO_DATE

val tasksByDateRaw = days
  .groupBy { it.date }
  .mapValues { (_, entries) ->
    entries.flatMap { it.tasks }.count { it.isNotEmpty() }
  }

val allDates = tasksByDateRaw.keys
val startDate = allDates.minOrNull()!!
val endDate = allDates.maxOrNull()!!

val fullDateRange = generateSequence(startDate) { it.plusDays(1) }
  .takeWhile { !it.isAfter(endDate) }
  .toList()

val tasksByDate = fullDateRange.map { date ->
  date to (tasksByDateRaw[date] ?: 0)
}

val grouped = tasksByDate.chunked(2).map { chunk ->
  val dateLabel = if (chunk.size == 2) {
    "${chunk[0].first.format(formatter)} — ${chunk[1].first.format(formatter)}"
  } else {
    chunk[0].first.format(formatter)
  }
  val count = chunk.sumOf { it.second }
  dateLabel to count
}

val dates = grouped.map { it.first }
val taskCounts = grouped.map { it.second }
val averageCounts = movingAverage(taskCounts, window = 7)

fun movingAverage(data: List<Int>, window: Int): List<Double> {
  return data.mapIndexed { index, _ ->
    val from = maxOf(0, index - window + 1)
    val sublist = data.subList(from, index + 1)
    sublist.average()
  }
}

plot {
  x(dates)
  y(taskCounts)

  bars {
    tooltips {
      line("Период: @x")
      line("Количество дел: @y")
    }
  }

  line {
    y(averageCounts)
    tooltips {
      color = Color.RED
      line("Период: @x")
      line("Среднее: @y")
    }
  }
}

#### 2. Кластеризация типов дел - ruBERT