#**Линейная регрессия**
▶ Linear Regression 

**Функция модели**
$$y = \sum_{i=1}^{p}({x_iw_i}) + b$$


$$y = x_1w_1 + x_2w_2 + ... + x_pw_p + b$$

или

$$y = \sum_{i=0}^{p}({x_iw_i})$$
$$x_0 = 1$$

**Предсказание** - $\hat{y}$
$$\hat{y} = \sum_{i=1}^{p}({x_i\hat{w_i}}) + \hat{b}$$

**Цель** - подобрать $\hat{w_i}$ и $\hat{b}$ так, чтобы разница между $y$ (истинным значением целевой функции) и $\hat{y}$ (предсказанием модели) была минимальной.

**Функция потерь**
$$L(y,\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}({y_i -\hat{y_i} })^2$$
$$L(w_1,...,w_p) = \frac{1}{n}\sum_{i=1}^{n}({y_i -(x_1w_1 + ... + x_pw_p + b) })^2$$



##**Формулировка задачи**




Задана выборка значений признаков:
$$X_n : \{x_1, x_2, ..., x_n \space| \space x_i \in R^p\}$$

Здесь $n$ - количество элементов в выборке входных данных, $p$ - размерность признакового пространства.

Задана выборка соответствующих значений целевой переменной:
$$Y_n : \{y_1, y_2, ..., y_n \space| \space y_i \in R\}$$

Получаем множество исходных данных:
$$D : \{(x, y)_i\},\space i = 1...n $$

Задано параметрическое семейство функций $f(w, x)$ зависящее от параметров W и от входных признаков X:
$$f(w,x) = x_0w_0+x_1w_1 + x_2w_2 + ... + x_pw_p$$

Нужно построить модель, предсказывающую по $x_i$ значение $\hat{y_i}$, наиболее близкое к $y_i$ :
$$\hat{y_i} = f(w, x_i)$$

$$|\hat{y_i} - y_i| → 0$$

##**Градиентный спуск**
▶ Gradient Descent 

**Градиент** - вектор, указывающий направление роста функции:
$$\nabla L(w_1,...,w_p) = (\frac{\partial L}{\partial w_1},...,\frac{\partial L}{\partial w_p})$$
$$\frac{\partial L}{\partial w_i} = \frac{\partial}{\partial w_i} \Bigr(\frac{1}{n}\sum_{i=1}^{n}({y_i -(x_1w_1 + ... + x_pw_p + b) })^2\Bigl)$$

Для каждого веса:

$$\frac{\partial L}{\partial w_1} = \frac{2}{n}\sum_{i=1}^{n}({x_1w_1 + ... + x_pw_p + b -y_i })x_1 = \frac{2}{n}\sum_{i=1}^{n}(wx+b-y_i)x_1$$
$$...$$
$$\frac{\partial L}{\partial w_p} = \frac{2}{n}\sum_{i=1}^{n}({x_1w_1 + ... + x_pw_p + b -y_i })x_p = \frac{2}{n}\sum_{i=1}^{n}(wx+b-y_i)x_p$$ 

Смещение ($bias$):

$$\frac{\partial L}{\partial b} = \frac{2}{n}\sum_{i=1}^{n}({x_1w_1 + ... + x_pw_p + b -y_i }) = \frac{2}{n}\sum_{i=1}^{n}(wx+b-y_i)$$ 
Обновление весов и смещения:
$$w = w-α\nabla L(w)$$
$$b = b-α\nabla L(b)$$
$\alpha$ - скорость обучения ($learning\ rate$)

**Процесс обучения**: 

$w_1, ..., w_p :=0$ 
$b :=0$ 
$for\ i\ in\ range(n\_iter):$ 
$\ \ \ \ \ w_1:=w_1 - \alpha \frac{\partial L}{\partial w_1}$ 
$\ \ \ \ \ ...$ 
$\ \ \ \ \ w_p:=w_p - \alpha \frac{\partial L}{\partial w_p}$ 
$\ \ \ \ \ b:=b - \alpha \frac{\partial L}{\partial b}$

### Модель с единственным признаком
$$y = wx+b$$
$$\hat{y} = {\hat{w}x} + \hat{b}$$
$$L(y,\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}({y_i -\hat{y_i} })^2$$
Пусть: 
$X = [1, 2, 3]$ 
$Y = [1, 2, 3]$ 
$n = 3$ (число экземпляров данных) 
$w = 1,5$ 
$b = 0$ 

Тогда: 
$L(x) = \frac{1}{n}\sum_{i=1}^{n}({y_i -(wx_i+b) })^2$ 
$\frac{\partial L}{\partial w} = \frac{\partial}{\partial w} \frac{1}{n}\sum_{i=1}^{n}({y_i -(wx_i+b) })^2 = \frac{1}{n}\sum_{i=1}^{n} \frac{\partial}{\partial w}({y_i -(wx_i+b) })^2$ 

$\frac{\partial L}{\partial w} = \frac{1}{n}\sum_{i=1}^{n}2({y_i -(wx_i+b)(-x_i)})$ 

$\frac{\partial L}{\partial w} = \frac{2}{n}\sum_{i=1}^{n}({wx_i+b - y_i })x_i$ 

Градиент (расчет выполняется для всех данных выборки - полная **эпоха**): 
$\frac{\partial L}{\partial w} = \frac{2}{3}\Bigr((1,5w*1-1)*1 + ((1,5w*2-2)*2) + ((1,5w*3-3)*3)\Bigl)$ 

* Если при расчете используется полный набор (батч) экземпляров данных (используется весь датасет) - **Градиентный спуск, Batch GD**. 
* Если при расчете используется только 1 случайный экземпляр данных - **Стохастический градиентный спуск, SGD**. 
* Если при расчете используется мини-батч (случайное подмножество экземпляров данных заданного размера, часть от исходного датасета) - **Градиентный спуск с использованием мини-батчей, Mini-batch GD**

# **Код**

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

###Функция линейной регрессии

In [None]:
def func_lin_reg(x, w, b):
 return x * w + b

###Пример с тремя точками

**Документация:** 
[numpy.linspace](https://numpy.org/doc/stable/reference/generated/numpy.linspace.html)

In [None]:
lin_space_row = np.linspace(start=0, stop=100, num=5)
lin_space_row

**Документация:** 
[matplotlib.pyplot.plot](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html)

In [None]:
w = 1
b = 0

X_fake = np.linspace(0, 100, 100)

plt.plot(X_fake, func_lin_reg(X_fake, w, b), color='blue')
plt.plot([1, 2, 3], [1, 2, 3], 'x', color='red', linewidth=20, markersize=12)
plt.xlim(0, 4)
plt.ylim(0, 4)

In [None]:
from ipywidgets import interact, FloatSlider
%matplotlib inline

# Интерактивная функция для отображения графика
@interact(w=FloatSlider(value=1.0, min=-2.0, max=2.0, step=0.1, description='w:'),
 b=FloatSlider(value=0.0, min=-2.0, max=2.0, step=0.1, description='b:'))

def plot_regression(w=1.0, b=0.0):
 plt.figure(figsize=(6, 5))

 X_fake = np.linspace(0, 100, 100)
 plt.plot(X_fake, func_lin_reg(X_fake, w, b), color='blue', label=f'y = {w:.1f}x + {b:.1f}')

 # Точки данных
 plt.plot([1, 2, 3], [1, 2, 3], 'x', color='red', markersize=12, label='Данные')

 plt.xlim(0, 4)
 plt.ylim(0, 4)
 plt.xlabel('x')
 plt.ylabel('y')
 plt.legend()

###Функция потерь
$$L(y,\hat{y}) = \frac{1}{n}\sum_{i=1}^{n}({y_i -\hat{y_i} })^2$$

**Документация:** 
[numpy.mean](https://numpy.org/doc/2.0/reference/generated/numpy.mean.html) 
[numpy.square](https://numpy.org/doc/2.0/reference/generated/numpy.square.html)

In [None]:
def mse(y, y_pred):
 return np.mean(np.square(y - y_pred))

In [None]:
X_three = np.array([1, 2, 3])
y_three = np.array([1, 2, 3])
mse(y_three, func_lin_reg(X_three, 1, 0))

In [None]:
w_possible_values = np.linspace(-5, 5, 30)
X_three_dots = np.array([1, 2, 3])
y_three_dots = np.array([1, 2, 3])

w=1.5
b=0.0

fig, (ax1, ax2) = plt.subplots(1, 2)

# prediction plot
ax1.plot(X_fake, func_lin_reg(X_fake, w, b), color='blue')
ax1.plot(X_three_dots, y_three_dots, 'x', color='red', linewidth=20, markersize=12)
ax1.set_xlim(0, 4)
ax1.set_ylim(0, 4)

# loss plot
ax2.plot(w_possible_values,
 [mse(y_three_dots, func_lin_reg(X_three_dots, w, b)) for w in w_possible_values])
ax2.plot(w, mse(y_three_dots, func_lin_reg(X_three_dots, w, b)), 'x', color='red', markersize=12)
ax2.set_xlim(-1, 3)
ax2.set_ylim(0, 10)

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from ipywidgets import interact, FloatSlider

%matplotlib inline

# --- Вспомогательные функции (должны быть определены ДО использования) ---
def func_lin_reg(x, w, b):
 return w * x + b

def mse(y_true, y_pred):
 return np.mean((y_true - y_pred) ** 2)

# --- Константы ---
X = np.array([1, 2, 3], dtype=float)
y = np.array([1, 2, 3], dtype=float)
X_fake = np.linspace(0, 4, 200)
b = 0.0 # фиксированное смещение

# --- Статичная кривая MSE(w) при фиксированном b ---
w_curve = np.linspace(-1, 3, 400)
mse_curve = np.array([mse(y, func_lin_reg(X, w_i, b)) for w_i in w_curve])

# --- Интерактивная визуализация ---
@interact(
 w=FloatSlider(value=1.0, min=-1.0, max=3.0, step=0.05, description='w:')
)
def plot_interactive(w=1.0):
 fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 5))

 # --- Левый график: предсказания ---
 ax1.plot(X_fake, func_lin_reg(X_fake, w, b), 'b-', label=f'y = {w:.2f}x + {b:.1f}')
 ax1.plot(X, y, 'rx', markersize=12, label='Данные') # ← красные точки ДАННЫХ
 ax1.set_xlim(0, 4)
 ax1.set_ylim(0, 4)
 ax1.set_xlabel('x')
 ax1.set_ylabel('y')
 ax1.legend()
 ax1.grid(True)
 ax1.set_title('Предсказания модели')

 # --- Правый график: статичная парабола + подвижная точка ---
 ax2.plot(w_curve, mse_curve, 'g-', linewidth=2, label='MSE(w)')
 current_mse = mse(y, func_lin_reg(X, w, b))
 ax2.plot(w, current_mse, 'rx', markersize=12, label='Текущая точка') # ← красный крестик на параболе
 ax2.set_xlim(-1, 3)
 ax2.set_ylim(0, 10)
 ax2.set_xlabel('w')
 ax2.set_ylabel('MSE')
 ax2.legend()
 ax2.grid(True)
 ax2.set_title(f'Функция потерь (MSE), b = {b:.1f}')

 plt.tight_layout()
 plt.show()

### Генерация набора данных 
**Документация:** 
[numpy.random.gumbel](https://numpy.org/doc/stable/reference/random/generated/numpy.random.gumbel.html) 
[numpy.reshape](https://numpy.org/doc/2.0/reference/generated/numpy.reshape.html) 
[numpy.random.normal](https://numpy.org/doc/stable/reference/random/generated/numpy.random.normal.html)

In [None]:
gumbel = np.random.gumbel(3, 2, 10)
gumbel

In [None]:
gumbel.shape

In [None]:
gumbel.reshape(-1,1)

In [None]:
gumbel.reshape(10,1)

$$y = 80000*x$$

In [None]:
X = np.random.gumbel(loc=50, scale=10, size=1000).reshape(-1,1) # генерируем фичи
y = X * 80000 # генерируем таргет данные
y = y + np.random.normal(loc=0, scale=800000, size=(1000, 1)) # добавляем шум

In [None]:
X[:5] # первые 5 значений

In [None]:
y[:5] # первые 5 значений

In [None]:
plt.plot(X, y, 'o', alpha=0.3)

## Идеальная модель (подставили известные веса)

In [None]:
w = 80000
b = 0

x_vals = np.arange(30, 110) # числовой ряд

plt.plot(X, y, 'o', linewidth=20, alpha=0.3)
plt.plot(x_vals, func_lin_reg(x_vals, w, b), color='red')

### То же самое, но со сгенерированным датасетом

In [None]:
X_linespace = np.linspace(0, 100, 100)
w_possible_values = np.linspace(0, 100000, 10000)

w = 80000
b = 0

fig, (ax1, ax2) = plt.subplots(1, 2)

fig.set_figwidth(10)

# prediction plot
ax1.plot(X, y, 'x', color='blue', linewidth=20, markersize=12)
ax1.plot(x_vals, func_lin_reg(x_vals, w, b), color='red')

# loss plot
ax2.plot(w_possible_values, [mse(y, func_lin_reg(X, w, b)) for w in w_possible_values])
ax2.plot(w, mse(y, func_lin_reg(X, w, b)), 'o', color='red', alpha=0.3)

## Разбиение на train/test 

**Документация** 
[sklearn.model_selection.train_test_split](https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html)

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

print("X_train.shape: {}".format(X_train.shape))
print("y_train.shape: {}".format(y_train.shape))
print("X_test.shape: {}".format(X_test.shape))
print("y_test.shape: {}".format(y_test.shape))

###Визуализация разбиения

In [None]:
plt.plot(X_train, y_train, 'bo', label="Train", alpha=0.3) # тренировочные данные
plt.plot(X_test, y_test, 'rx', label="Test", alpha=0.3) # тестовые данные
plt.xlabel("Метраж") # надпись по оси X
plt.ylabel("Стоимость") # надпись по оси Y
plt.legend() # отображение легенды
plt.show() # отображение графика

###Описание модели

In [None]:
class MyLinearRegression:

 def __init__(self, lr, n_epochs):
 self.lr = lr # скорость обучения
 self.n_epochs = n_epochs # число эпох

 def mse(self, y, y_pred):
 return np.sum(np.square(y - y_pred)) / y.shape[0]

 def loss_gradient_w(self, y_pred, y, x):
 return 2 * np.sum((y_pred - y) * x) / y.shape[0]

 def loss_gradient_b(self, y_pred, y):
 return 2 * np.sum(y_pred - y) / y.shape[0]

 def fit(self, X, y):
 self.w = 0
 self.b = 0
 for i in range(self.n_epochs):
 self.w = self.w - self.lr * self.loss_gradient_w(self.predict(X), y, X)
 self.b = self.b - self.lr * self.loss_gradient_b(self.predict(X), y)
 print(f"MSE: {mse(y, self.predict(X))}")

 def predict(self, X):
 return self.w * X + self.b

In [None]:
y_train.shape[0]

### Обучение модели

In [None]:
X_train.shape

In [None]:
X_train.shape

In [None]:
model = MyLinearRegression(10e-5, 20)
model.fit(X_train, y_train)

### Визуализация результатов

In [None]:
plt.plot(X_train, y_train, 'bo', label="Train", alpha=0.2) # тренировочные данные
plt.plot(X_test, y_test, 'bx', label="Test", alpha=0.2) # тестовые данные
xx = np.arange(30, 110).reshape(-1, 1) # числовой ряд
plt.plot(xx, model.predict(xx), 'r--', label="Model") # график предсказаний модели
plt.xlabel("Метраж") # надпись по оси X
plt.ylabel("Стоимость") # надпись по оси Y
plt.legend() # отображение легенды
plt.show() # отображение графика

In [None]:
model.w

In [None]:
model.b

### То же самое, но с использованием `sklearn`

📘 Ссылка на документацию: [LinearRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression)

In [None]:
from sklearn.linear_model import LinearRegression

sklearn_model = LinearRegression()
sklearn_model.fit(X_train, y_train)

Параметр `model.coef_` - веса модели (W) 
Параметр `model.intercept`_ - свободный параметр (смещение) модели (b)

In [None]:
sklearn_model.coef_

In [None]:
sklearn_model.intercept_

### Визуальное сравнение моделей

In [None]:
plt.plot(X_train, y_train, 'bo', label="Train", alpha=0.2) # тренировочные данные
plt.plot(X_test, y_test, 'bx', label="Test", alpha=0.2) # тестовые данные
xx = np.arange(30, 110).reshape(-1, 1) # числовой ряд
plt.plot(xx, model.predict(xx), 'r--', label="Model") # график предсказаний модели
plt.plot(xx, sklearn_model.predict(xx), 'm--', label="sklearn Model") # график предсказаний модели
plt.xlabel("Метраж") # надпись по оси X
plt.ylabel("Стоимость") # надпись по оси Y
plt.legend() # отображение легенды
plt.show() # отображение графика

In [None]:
plt.plot(X_train, y_train, 'bo', label="Train", alpha=0.2) # тренировочные данные
plt.plot(X_test, y_test, 'bx', label="Test", alpha=0.2) # тестовые данные
xx = np.arange(30, 110).reshape(-1, 1) # числовой ряд
plt.plot(xx, model.predict(xx), 'r--', label="Model") # график предсказаний модели
plt.plot(xx, sklearn_model.predict(xx), 'm--', label="sklearn Model") # график предсказаний модели
plt.xlabel("Метраж") # надпись по оси X
plt.ylabel("Стоимость") # надпись по оси Y
plt.legend() # отображение легенды

plt.xlim(40, 45)
plt.ylim(3100000, 3800000)
plt.show() # отображение графика

In [None]:
y_pred_mymodel = model.predict(X_test)
y_pred_skmodel = sklearn_model.predict(X_test)

In [None]:
mse_mymodel = mse(y_test, y_pred_mymodel)
mse_mymodel

In [None]:
mse_skmodel = mse(y_test, y_pred_skmodel)
mse_skmodel

$$MSE = \frac{1}{n}\sum_{i=1}^{n}({y_i -\hat{y_i} })^2$$


In [None]:
from sklearn.metrics import mean_squared_error

mse_mymodel = mean_squared_error(y_test, y_pred_mymodel)
mse_mymodel

In [None]:
mse_skmodel = mean_squared_error(y_test, y_pred_skmodel)
mse_skmodel

$$MAE = \frac{1}{n}\sum_{i=1}^{n}|{y_i -\hat{y_i} }|$$


In [None]:
from sklearn.metrics import mean_absolute_error

mae_mymodel = mean_absolute_error(y_test, y_pred_mymodel)
mae_mymodel

In [None]:
mae_skmodel = mean_absolute_error(y_test, y_pred_skmodel)
mae_skmodel

$$MAPE = \frac{1}{n}\sum_{i=1}^{n}\frac{|{y_i -\hat{y_i} }|}{y_i}$$




In [None]:
from sklearn.metrics import mean_absolute_percentage_error

mape_mymodel = mean_absolute_percentage_error(y_test, y_pred_mymodel)
mape_mymodel

In [None]:
mape_skmodel = mean_absolute_percentage_error(y_test, y_pred_skmodel)
mape_skmodel

$$R^2 = 1 - \frac{\sum_{i=1}^{n}({y_i -\hat{y_i} })^2} {\sum_{i=1}^{n}({y_i -\bar{y_i} })^2}$$

$$R^2 = 1 - \frac{MSE_{model}}{MSE_{avg}}$$

In [None]:
from sklearn.metrics import r2_score

r2_mymodel = r2_score(y_test, y_pred_mymodel)
r2_mymodel

In [None]:
r2_skmodel = r2_score(y_test, y_pred_skmodel)
r2_skmodel