## cross-term w rozkładzie sumy kwadratów wynosi zero

Dowód, że w prostej regresji liniowej cross-term w rozkładzie sumy kwadratów wynosi zero:

$$2\sum_{i=1}^{n}(\hat{y}_i - \bar{y})(y_i - \hat{y}_i) = 0$$

gdzie:
- $\hat{y}_i$ - przewidywane wartości
- $\bar{y}$ - średnia z obserwacji
- $y_i$ - obserwowane wartości

Ten wynik jest kluczowy dla partycjonowania sumy kwadratów: **TSS = ESS + RSS**


---
**Źródło:** [Wikipedia - Explained sum of squares](https://en.wikipedia.org/wiki/Explained_sum_of_squares#Partitioning_in_simple_linear_regression)

In [1]:
import sympy as sp
from IPython.display import display, Markdown
import re

def auto_latex(expr):
    """Automatycznie konwertuje wyrażenia SymPy na ładny LaTeX"""
    latex_str = sp.latex(expr)
    
    # Najpierw zamień symbole z podkreślnikami
    latex_str = latex_str.replace('y_{bar}', r'\bar{y}')
    latex_str = latex_str.replace('x_{bar}', r'\bar{x}')
    latex_str = latex_str.replace('b_{hat}', r'\hat{b}')
    
    # Teraz zamień funkcje na indeksy dolne
    # y_{hat}{\left(i \right)} → \hat{y}_i
    latex_str = re.sub(r'y_\{hat\}\{\\left\(([^}]+) \\right\)\}', r'\\hat{y}_{\1}', latex_str)
    # y{\left(i \right)} → y_i  
    latex_str = re.sub(r'y\{\\left\(([^}]+) \\right\)\}', r'y_{\1}', latex_str)
    # x{\left(i \right)} → x_i
    latex_str = re.sub(r'x\{\\left\(([^}]+) \\right\)\}', r'x_{\1}', latex_str)
    # x_{hat}{\left(i \right)} → \hat{x}_i
    latex_str = re.sub(r'x_\{hat\}\{\\left\(([^}]+) \\right\)\}', r'\\hat{x}_{\1}', latex_str)
    
    return latex_str

def display_math(expr, text=""):
    """Wyświetla wyrażenie SymPy z ładnym LaTeX"""
    if text:
        print(text)
    latex_code = auto_latex(expr)
    display(Markdown(f"$${latex_code}$$"))

## Dowód:

In [2]:

i, j, n = sp.symbols('i j n', integer=True, positive=True)
x_bar, y_bar, b_hat = sp.symbols('x_bar y_bar b_hat')
x = sp.Function('x')
y = sp.Function('y') 
y_hat = sp.Function('y_hat')

# 1. Normalne wyrażenie (bez evaluate=False)
normal_start = 2*(y_hat(i) - y_bar)*(y(i) - y_hat(i))
display_math("1. Start:")
display_math(normal_start)

# 2a. Pierwsze podstawienie
subst1 = sp.Eq(y(i) - y_hat(i), (y(i) - y_bar) - b_hat*(x(i) - x_bar))
display_math("2a. Podstawienie:")
display_math(subst1)
normal_step1 = normal_start.subs(subst1.lhs, subst1.rhs)
display_math("Po pierwszym podstawieniu:")
display_math(normal_step1)

# 2b. Drugie podstawienie  
subst2 = sp.Eq(y_hat(i) - y_bar, b_hat*(x(i) - x_bar))
display_math("2b. Podstawienie:")
display_math(subst2)
normal_step2 = normal_step1.subs(subst2.lhs, subst2.rhs)
display_math("Po drugim podstawieniu:")
display_math(normal_step2)

# 3. Suma
display_math("3. Dodanie sumy:")
normal_sum = sp.Sum(normal_step2, (i, 1, n))
display_math(normal_sum)

# 4. Factor
display_math("4. Wyciągnięcie przed sumę (factor):")
normal_factored = sp.factor(normal_sum)
display_math(normal_factored)

# 5. Podstawienie b_hat
b_hat_definition = sp.Sum((x(i) - x_bar)*(y(i) - y_bar), (i, 1, n)) / sp.Sum((x(i) - x_bar)**2, (i, 1, n))
subst3 = sp.Eq(b_hat, b_hat_definition)
display_math("5. Podstawienie definicji b_hat:")
display_math(subst3)
normal_final = normal_factored.replace(subst3.lhs, subst3.rhs)
display_math("Po podstawieniu:")
display_math(normal_final)

# 6. Simplify
display_math("6. Uproszczenie:")
normal_result = sp.simplify(normal_final)
display_math(normal_result)

$$\mathtt{\text{1. Start:}}$$

$$\left(- 2 \bar{y} + 2 \hat{y}_{i}\right) \left(y_{i} - \hat{y}_{i}\right)$$

$$\mathtt{\text{2a. Podstawienie:}}$$

$$y_{i} - \hat{y}_{i} = - \hat{b} \left(- \bar{x} + x_{i}\right) - \bar{y} + y_{i}$$

$$\mathtt{\text{Po pierwszym podstawieniu:}}$$

$$\left(- 2 \bar{y} + 2 \hat{y}_{i}\right) \left(- \hat{b} \left(- \bar{x} + x_{i}\right) - \bar{y} + y_{i}\right)$$

$$\mathtt{\text{2b. Podstawienie:}}$$

$$- \bar{y} + \hat{y}_{i} = \hat{b} \left(- \bar{x} + x_{i}\right)$$

$$\mathtt{\text{Po drugim podstawieniu:}}$$

$$\left(- 2 \bar{y} + 2 \hat{y}_{i}\right) \left(- \hat{b} \left(- \bar{x} + x_{i}\right) - \bar{y} + y_{i}\right)$$

$$\mathtt{\text{3. Dodanie sumy:}}$$

$$\sum_{i=1}^{n} \left(- 2 \bar{y} + 2 \hat{y}_{i}\right) \left(- \hat{b} \left(- \bar{x} + x_{i}\right) - \bar{y} + y_{i}\right)$$

$$\mathtt{\text{4. Wyciągnięcie przed sumę (factor):}}$$

$$2 \sum_{i=1}^{n} \left(\bar{y} - \hat{y}_{i}\right) \left(- \hat{b} \bar{x} + \hat{b} x_{i} + \bar{y} - y_{i}\right)$$

$$\mathtt{\text{5. Podstawienie definicji b\_hat:}}$$

$$\hat{b} = \frac{\sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right) \left(- \bar{y} + y_{i}\right)}{\sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right)^{2}}$$

$$\mathtt{\text{Po podstawieniu:}}$$

$$2 \sum_{i=1}^{n} \left(\bar{y} - \hat{y}_{i}\right) \left(- \frac{\bar{x} \sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right) \left(- \bar{y} + y_{i}\right)}{\sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right)^{2}} + \bar{y} + \frac{x_{i} \sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right) \left(- \bar{y} + y_{i}\right)}{\sum_{i=1}^{n} \left(- \bar{x} + x_{i}\right)^{2}} - y_{i}\right)$$

$$\mathtt{\text{6. Uproszczenie:}}$$

$$0$$