ПРОВЕРКА НА МУЛЬТИКОЛЛИНЕАРНОСТЬ PYTHON

Мультиколлинеарность - это наличие высокой корреляции между двумя или более независимыми переменными в модели. В случае мультиколлинеарности, затрудняется интерпретация важности каждой переменной, а также затрудняется оценка точности параметров регрессии. Python представляет множество инструментов, чтобы обнаружить и бороться с мультиколлинеарностью в данных.

Один из способов проверки на мультиколлинеарность - корреляционная матрица. Это матрица, содержащая коэффициенты корреляции между всеми переменными. Если в матрице есть высокие коэффициенты корреляции, это может указывать на наличие мультиколлинеарности.

import pandas as pd
import numpy as np
import seaborn as sns
data = pd.read_csv('data.csv')
corr_matrix = data.corr().abs()
sns.heatmap(corr_matrix)

Другим методом проверки на мультиколлинеарность является VIF (variance inflation factor), который измеряет степень мультиколлинеарности в модели. Если VIF более 10, это указывает на наличие мультиколлинеарности.

from statsmodels.stats.outliers_influence import variance_inflation_factor
# предполагая, что 'data' - это набор данных с независимыми переменными
vif = pd.DataFrame()
vif['variables'] = data.columns
vif['vif'] = [variance_inflation_factor(data.values, i) for i in range(data.shape[1])]

В отличие от корреляционной матрицы, VIF учитывает мультиколлинеарность между группой переменных, а не между каждой переменной по отдельности.

Мультиколлинеарность

Множественная линейная регрессия в Python. Машинное обучение ПРОСТО! ПРОГНОЗИРУЕМ ЦЕНУ НЕДВИЖИМОСТИ!

Устранение мультиколлинеарности. Метод LASSO и гребневой регрессии

Лекция 6. Проверка статистических гипотез (процедуры Python)

Мультиколлинеарность. Алгоритм Фаррара-Глобера. Эконометрика. Регрессия. Multicollinearity.

Семинар: Нейросети в компьютерном зрении: практика (08.12.2019)

Множественная регрессия в Excel и мультиколлинеарность

[ОТКРЫТЫЙ КУРС] Python для финансистов - Модуль Statsmodels. Линейная регрессия - Урок 11

Определение мультиколлинеарности

Множественная регрессия

BLGPG-2D2CA0101439-25-01-18-14

Новые материалы: