ПРОВЕРКА РАСПРЕДЕЛЕНИЯ НА НОРМАЛЬНОСТЬ PYTHON

Проверка распределения на нормальность является важным шагом в анализе данных. Для выполнения данной задачи мы можем использовать различные статистические тесты, такие как тест Шапиро-Уилка, тест Андерсона-Дарлинга и многие другие.

В Python мы можем использовать библиотеки SciPy и Statsmodels для проведения этих тестов. Например, для проведения теста Шапиро-Уилка, мы можем использовать функцию shapiro из библиотеки SciPy:

from scipy.stats import shapiro
data = [0.1, 0.2, 0.3, 0.4, 0.5]
stat, p = shapiro(data)
print('Статистика=%.3f, p=%.3f' % (stat, p))

В результате выполнения данного кода мы получим значение статистики и p-value. Если p-value меньше заданного уровня значимости (обычно 0,05), то мы можем отвергнуть гипотезу о том, что данные распределены нормально. Если значение p-value больше уровня значимости, то мы не можем отвергнуть гипотезу о нормальности распределения.

Кроме того, мы можем использовать визуализации для проверки нормальности распределения. Например, мы можем построить гистограмму и график квантилей-квантилей:

import matplotlib.pyplot as plt
from scipy.stats import norm
import numpy as np
# Создание выборки из нормального распределения
data = norm.rvs(size=1000)
# Построение гистограммы
plt.hist(data, bins=50, density=True)
# Построение графика квантилей-квантилей
quantiles = np.arange(0, 1.01, 0.01)
q_theor = norm.ppf(quantiles)
q_emp = np.percentile(data, quantiles * 100)
plt.plot(q_theor, q_emp, color='red')
plt.show()

Если данные распределены нормально, то на графике квантилей-квантилей точки должны следовать прямой линии. Если точки отклоняются от этой линии, то это может быть признаком ненормальности распределения.

01-10 Эмпирическое распределение в python

Видеоурок: Проверка на нормальность распределения

Валидизация тестирования персонала - проверка нормальности распределения с помощью QQ plot excel

Как проверить гипотезу о нормальном распределении ген. совокупности? Критерий согласия Пирсона

Проверка выборок на нормальность распределения

Повторная проверка на дальность 24 300 м показало полную плоскость поверхности

Проверка нормальности распределения случайной величины в программе Statistica.

BLGPG-9F530A924699-24-11-23-22

Новые материалы: