Видео: РЕГРЕССИОННЫЙ АНАЛИЗ общая идея | АНАЛИЗ ДАННЫХ #16 2024
Модели линейной регрессии используются для отображения или прогнозирования взаимосвязи между двумя переменными или факторами. Прогнозируемый множитель (коэффициент, который уравнение решает для ), называется зависимой переменной. Факторы, которые используются для прогнозирования значения зависимой переменной, называются независимыми переменными.
Хорошие данные не всегда рассказывают полную историю. Регрессионный анализ обычно используется в исследованиях, поскольку он устанавливает, что существует корреляция между переменными.
Но корреляция - это не то же самое, что и причинность. Даже линия в простой линейной регрессии, которая хорошо подходит к точкам данных, может не сказать что-то окончательное относительно причинно-следственной связи.
В простой линейной регрессии каждое наблюдение состоит из двух значений. Одно значение для зависимой переменной, а одно значение - для независимой переменной.
- Простой анализ линейной регрессии Простейшая форма регрессионного анализа использует зависимую переменную и одну независимую переменную. В этой простой модели прямая линия аппроксимирует связь между зависимой переменной и независимой переменной.
- Анализ множественной регрессии Когда в регрессионном анализе используются две или более независимых переменных, модель уже не является простой линейной.
Простая модель линейной регрессии
Простая модель линейной регрессии представлена следующим образом: y = ( β 0 + β > 1 + Ε По математическому соглашению два фактора, которые участвуют в простом анализе линейной регрессии, обозначаются
x и y . Уравнение, описывает, как
y относится к x , известна как модель регрессии . Модель линейной регрессии также содержит член ошибки, который представлен Ε < или эпсилон греческой буквы. Термин ошибки используется для учета изменчивости в y , что не может быть объяснено линейной зависимостью между x и y > Здесь также указаны параметры, которые представляют исследуемую популяцию. Эти параметры модели, представленные ( β 0+
β 1 x ), . Простая модель линейной регрессии Простое уравнение линейной регрессии представлено следующим образом: Ε
(
y ) = ( 0 + β 1 х ). Простое уравнение линейной регрессии рисуется как прямая. ( β
0 - перехват линии
y линии регрессии. β 1 - наклон. Ε
( y
) является средним или ожидаемым значением y для заданного значения x . Линия регрессии может показывать положительную линейную зависимость, отрицательную линейную зависимость, или нет отношений.Если графная линия в простой линейной регрессии плоская (не наклонная), между этими двумя переменными нет никакой связи. Если линия регрессии наклоняется вверх с нижним концом линии на перехвате (оси) y графика, а верхний конец линии продолжается вверх в поле графика, вдали от
x перехват (ось) существует положительная линейная зависимость. Если линия регрессии наклоняется вниз с верхним концом линии на перехвате (оси) y графика, а нижний конец линии проходит вниз в поле графика, в направлении x < перехват (ось) существует отрицательная линейная зависимость. Оценочное уравнение линейной регрессии Если известны параметры популяции, то для вычисления среднего значения y можно использовать уравнение простой линейной регрессии (показано ниже) для известного значения < х
.
Ε ( y ) = ( β
0 + β 1 x ). Однако на практике значения параметров не известны, поэтому их необходимо оценить, используя данные из выборки населения. Параметры популяции оцениваются с использованием выборочной статистики. Статистика выборок представлена b 0 + b 1. При замене выборочной статистики для параметров популяции формируется оценочное уравнение регрессии.
Оценочное уравнение регрессии показано ниже. ( ŷ ) = ( β
0 +
β 1 x ( ŷ ) произносится < y hat . График оценочного простого уравнения регрессии называется оценочной линией регрессии.
b 0 - это перехват y. b
1 - наклон.
ŷ ) - оценочное значение
y для заданного значения x
. Важное примечание: Регрессионный анализ не используется для интерпретации причинно-следственных связей между переменными. Однако регрессионный анализ может указывать, как связаны переменные или в какой степени переменные связаны друг с другом. При этом регрессионный анализ, как правило, создает важные отношения, которые требуют более внимательного изучения знающего исследователя. Также известен как: бивариантная регрессия, регрессионный анализ Примеры:
Метод наименьших квадратов
является статистической процедурой для использования выборочных данных для нахождения значения оцененного уравнения регрессии , Метод наименьших квадратов был предложен Карлом Фридрихом Гаусом, который родился в 1777 году и умер в 1855 году. Метод наименьших квадратов по-прежнему широко используется.
Источники: Андерсон, Д. Р., Суини, Д. Дж. И Уильямс, Т. А. (2003). Основы статистики для бизнеса и экономики (3-е изд.) Мейсон, Огайо: Юго-западный, Томпсонское обучение.
______. (2010). Разъяснение: регрессионный анализ. Новости MIT. McIntyre, L. (1994). Использование данных о сигаретах для введения в множественную регрессию. Журнал статистики образования, 2 (1).
Менденхолл, У. и Синчич Т. (1992). Статистика для инженерии и наук (3-е изд.), Нью-Йорк, Нью-Йорк: Dellen Publishing Co.
Панченко Д. 18. 443 Статистика для приложений, осень 2006 г., раздел 14, Простая линейная регрессия. (Массачусетский технологический институт: MIT OpenCourseWare)
Что такое оплата ACH и как она работает
Платежи aCH могут помочь уменьшить ошибки, ускорить работу и сэкономить Ресурсы. Узнайте больше о преимуществах и затратах и о том, почему вы должны их использовать.
Что такое дебетовая карта и как она работает?
Важно понять, что такое дебетовая карта и правила, связанные с ее использованием. Изучите меры предосторожности, которые необходимо предпринять с помощью вашей карты.
Что такое потеря права выкупа и как она работает?
Подробное объяснение того, что такое выкупа, как работает выкупа и как защитить себя, если вы думаете о покупке дома, принадлежащего банку.