Скачать:
Лабораторная работа №1
Линейный регрессионный анализ для функции с одной переменной
Цель работы:
1.Построить выборочную линейную эконометрическую модель и определить ее параметры
2.Определить неизвестные параметры модели..
3.Построить график эконометрической модели.
4.Интерпретировать результаты моделирования.
Порядок выполнения работы
1.Используя данные, приведенные в задании, построить линейную регрессионную модель и вычислить для нее:
а)
выборочные средние ,
(несмещеннные
оценки математического ожидания) и смещеннные оценки дисперсии s2 х = var (x),
s2у = var (y) для каждой переменной рассчитываются по формулам:
=
,
=
или с помощью встроенной функции СРЗНАЧ в Excel,
s2 х =var (x)=, s2у=var(y)=
или с помощью встроенной функции ДИСП в Excel.
Для возведения в квадрат используем функцию СТЕПЕНЬ.
Примечание 1. Во всех формулах, где опущены индексы
суммирования, оно проводится от 1 до n, то есть символ означает
б) выборочная ковариация cov (x, y) рассчитывается по формуле:
cov (x, y)=(КОВАР на Excel).
Уравнение регрессии всегда дополняется показателем тесноты связи между зависимой величиной Y и независимой X, в качестве которого выступает линейный коэффициент корреляции rxy, рассчитываемый по формуле:
rxy==
,
- 1£ rxy£+1 (КОРРЕЛ на Excel).
Коэффициент корреляции
является относительной мерой связи между двумя переменными. Нетрудно заметить,
что rxy совпадает
по знаку с b1. По значению rxy формулируется
вывод о количественной мере линейной связи между переменными x и y.
Отметим основные свойства коэффициента корреляции:
§ -1£rxy£1. Если коэффициент регрессии b1</sub>>0, то 0£rxy£1 и корреляционная связь между переменными называется прямой. И, наоборот, при b1<0, -1£rxy£0 – связь называется обратной.
§ в зависимости от того, насколько абсолютная
величина приближается к
1, различают виды связи от слабой до весьма тесной. Чем ближе rxy ®±1, тем сильнее связь, в противном случае, когда коэффициент корреляции
стремится к 0 – связь отсутствует.
§ если все значения переменных увеличить (уменьшить) на одно и тоже число или в одно и то же число раз, то величина rxy не изменится.
§ при rxy=0 линейная корреляционная связь отсутствует. Если rxy=±1, то можно сделать вывод о том, что между x и y существует точная функциональная линейная зависимость, направление которой определяется знаком rxy. В этом случае линейная регрессия должна точно проходить через все точки выборки (xi, yi), i=1,2,...,n и остаточная сумма квадратов (MSE), вычисленная по уравнению регрессии должна равняться нулю.
2.Определить неизвестные параметры модели двумя способами:
а) Параметры регрессии определяются исходя из метода наименьших квадратов (МНК).
МНК позволяет получить такие оценки параметров b0 и b1, при которых сумма квадратов отклонений фактических
значений результативного признака (у) от
расчетных (теоретических) минимальна:
Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной:
, следовательно,
Чтобы найти минимум функции, надо вычислить частные производные по каждому из параметров b0 и b1 и приравнять их к нулю.
Обозначим через F: F=
Запишем необходимые условия экстремума:
,
или
Преобразуем формулу, раскрыв скобки, и получим систему линейных алгебраических уравнений (СЛАУ) (для краткости опустим индексы суммирования у знака суммы) состоящую из двух уравнений:
.
В матричном виде СЛАУ
записывается как A=
с матрицей A и вектором свободных членов
:
A==
,
решать которую удобно методом Крамера, вычисляя b0 и b0 по формулам:
D=det A=n
D0=det=
D1=det=nb0=
, b1=
.
Разделив обе части уравнений на n, получим систему нормальных уравнений в виде
,
которую удобно решать методом полных исключений Жордана-Гаусса.
Соответствующие средние в СЛАУ определяются по формулам:
б) решая СЛАУ либо методом полных исключений Жордана-Гаусса, либо методом определителей, найдем искомые оценки параметров b0 и b0:
,
где s2х=- выборочная дисперсия переменной х;
cov(x,y) – выборочная ковариация;
( получим из 1-го уравнения системы, если все его члены разделим на n).
Параметр b1 называется коэффициентом регрессии y по х. Он показывает, на сколько единиц в среднем изменяется переменная у при увеличении переменной х на одну единицу.
Проверочные формулы для вычисления b0 и b1 (используются только для линейной регрессии) следующие:
b1=b0=
-b1
.
Еще одна проверка
правильности высчисления b0 и b1 осуществляется на основании тождественности =b0+ b1
.
3. Построение графиков регрессионной модели.
После высчисления b0 и b1 на рабочем листе
необходимо построить точечную диаграмму (например, используя Мастер диаграмм), на которую нужно нанести точки выборки (xi,yi), i=1,2,...,n, прямую регрессии и точку (,
).
Прямая регрессии может быть построена как второй ряд точечной диаграммы, для которого нужно подготовить данные, высчитав абсциссы и ординаты по крайней мере двух точек, принадлежащих прямой регрессии, и разместив их в подходящем диапазоне. Абсциссами этих двух точек целесообразно взять минимальное и максимальное значение исходной выборки. Точки ряда данных, задающих регрессию, должны быть соединены. Это можно сделать, выделив на диаграмме ряд данных регрессии, после чего нужно активизировать его контекстное меню и в опции Формат рядов данных (вкладка Вид) задать параметры линии, которая соединяет точки.
Точка (,
) задается на диаграмме как
третий ряд данных, состоящий из одной точки.
Примечание 2. При построении диаграммы прямую линейной регресии можно увидеть без всяких вычислений, построив линейный тренд по ряду данных выборки (xi, yi),i=1,2,...,n. Для этого нужно на диаграмме выделить этот ряд данных и правой кнопкой активизировать его контекстное меню, после чего в опции Добавить линию тренда выбрать ее линейный тип.
3) Проверим свойства простой выборочной регрессии
Определим ковариацию между случайной величиной и наблюдаемыми значениями (х) и между случайной величиной и оцениваемыми значениями (у) по формулам
4) Вычислить сумму квадратов отклонений от теоретических по формуле:
или с помощью встроенной функции СУММКВРАЗН в Excel
Величина MSEявляется количественной мерой качества построенной линейной регрессии. Чем она
меньше, тем ближе проходит регрессионная прямая к точкам исходной выборки . На основе значения остаточной суммы квадратов MSE вычисляем квадрат выборочного стандартного отклонения
наблюденного значения
от
предсказанного.
3 способ.
Используя встроенные функции EXCEL (ЛИНЕЙН) получили (27):
b1= 14,756 (27)
Рассчитаем Yтеордля каждого xi по формуле (28):
Параметр b1 называется коэффициентом регрессии y по х. Он показывает, на сколько единиц в среднем изменяется переменная у при увеличении переменной х на одну единицу.
Встроенная в Excelстатистическая функция ЛИНЕЙНопределяет параметры линейной регрессии . Порядок выполнения
следующий:
- подготовьте файл с анализируемыми данными (см. п.1.1.);
- выделите область пустых ячеек 5х2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики или область 1х2 – для получения только оценок коэффициентов регрессии;
- активизируйте Мастер функций, выберите в окне Категория Статистические, в окне Функция – ЛИНЕЙН;
- заполните аргументы функции:
а) диапазон ячеек, содержащих данные результативного признака y;
б) диапазон ячеек, содержащих данные факторов независимого признака х;
в) логические значения Константа (наличие или отсутствие свободного члена в уравнении), Статистика (вывод дополнительной информации по регрессионному анализу);
- в левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажать на клавишу F2, а затем - на комбинацию клавиш CTRL+SHIFT+ENTER.
Дополнительная регрессионная статистика в порядке, указанном в схеме:
Значение коэффициента b |
Значение коэффициента а |
Среднеквадратическое отклонение b |
Среднеквадратическое отклонение а |
Коэффициент детерминации R2 |
Среднеквадратическое отклонение y |
F-статистика |
Число степеней свободы |
MSR - регрессионная сумма квадратов |
MSE - остаточная сумма квадратов |
1.3. Проверочные формулы для вычисления b0 и b1 (используются только для линейной регрессии) следующие:
b1=b0=
-b1
.
Еще одна проверка правильности
высчисления b0 и b1 осуществляется на основании тождественности =b0+ b1
.
1.4. Построение графиков регрессионной модели.
После высчисления b0 и b1 на рабочем листе
необходимо построить точечную диаграмму (например, используя Мастер диаграмм), на которую нужно нанести точки выборки (xi,yi), i=1,2,...,n, прямую регрессии и точку (,
).
Прямая регрессии может быть построена как второй ряд точечной диаграммы, для которого нужно подготовить данные, высчитав абсциссы и ординаты по крайней мере двух точек, принадлежащих прямой регрессии, и разместив их в подходящем диапазоне. Абсциссами этих двух точек целесообразно взять минимальное и максимальное значение исходной выборки. Точки ряда данных, задающих регрессию, должны быть соединены. Это можно сделать, выделив на диаграмме ряд данных регрессии, после чего нужно активизировать его контекстное меню и в опции Формат рядов данных (вкладка Вид) задать параметры линии, которая соединяет точки.
Точка (,
) задается на диаграмме как
третий ряд данных, состоящий из одной точки.
Примечание 3. При построении диаграммы прямую линейной регресии можно увидеть без всяких вычислений, построив линейный тренд по ряду данных выборки (xi,yi), i=1,2,...,n. Для этого нужно на диаграмме выделить этот ряд данных и правой кнопкой активизировать его контекстное меню, после чего в опции Добавить линию тренда выбрать ее линейный тип.
Лабораторная работа №2
дисперсионный анализ в линейной регрессии
Цель работы: провести дисперсионный анализ эконометрической модели, построить ANOVA – таблицу, выполнить декомпозицию дисперсий эконометрической модели, проверить адекватность эконометрической модели, провести сравнительный анализ качества трех эконометрических моделей.
Порядок выполнения работы
1.Построить ANOVA – таблицу.
2.Определить коэффициент детерминации модели и проверить связь:
§между коэффициентом корреляции и наклоном регрессионной прямой b1;
§между коэффициентом корреляции и коэффициентом детерминации.
3.Проверить адекватность эконометрической модели по критерию Фишера.
4.Определить качество экономической модели и сделать выводы.
1.Используя данные из лабораторной работы №1, построим
ANOVA-таблицу и выполним дисперсионный анализ:
Дисперсионный анализ (англ. ANOVA- ANalisis Of VAriances )- это статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.
Из предыдущей лабораторной работы я выбрала данные, которые необходимы в следующей лабораторной работе. Далее я вычислила:
SST-общая сумма квадратов;
SSR-сумма квадратов объясняющих решений;
SSE-сумма квадратов ошибок;
SST= SSR+ SSE
n ^ 2
SSE=-∑(yi-yi)
i=1
n ^ - 2
SSR=∑(yi-y)
i=1
n - 2
SST=∑(yi-y)
i=1
Источник вариации |
Количество степеней свободы |
Сумма квадратов |
Средние квадраты |
Обусловленный регрессией (модель) |
1 |
|
|
Необъяснимый с помощью регрессии (ошибки) |
n-2 |
|
|
Общий |
n-1 |
|
|
Так как MSE>MSR, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у, то есть часть устройств оборудования зависит от затрат на 1 грн. товарной продукции.
Сравним результаты дисперсионного анализа с компонентами массива, полученного встроенной статистической функцией ЛИНЕЙН. В результате использования функции ЛИНЕЙН мы получили:
0,010 |
4,568 |
0,001 |
2,963 |
0,854 |
2,338 |
76,26520171 |
13 |
416,7908361 |
71,04525719 |
Центральное место в анализе найденного уравнения линейной регрессии
занимает разложение общей суммы квадратов отклонений переменной у от среднего
значения (т.е. этой
вариации) на две части: «объясненную» регрессионным уравнением и
«необъясненную» (т.е. связанную с ошибками ):
или MST=MSR+MSE,
где MST - общая сумма квадратов отклонений (вся дисперсия) зависимой переменной от средней,
MSR – факторная сумма квадратов отклонений,
объясненная (обусловленная) регрессией, равная сумме квадратов отклонений значений,
полученных при помощи уравнения регрессии от среднего значения
MSR=,
MSE – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных факторов (сумма квадратов ошибок):
(СУММКВРАЗН на Excel).
Величина MSEявляется количественной мерой качества построенной линейной регрессии. Чем она меньше, тем ближе проходит регрессионная прямая к точкам исходной выборки (xi,yi), i=1,2,..., n.
2.Определим коэффициент детерминации модели и проверим связь:
а) определим коэффициент детерминации по формуле:
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции r2xy, называемый коэффициентом детерминации,который характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:
,
тогда0,854367
Так как стремиться
больше к 1, чем к 0, то это означает, что регрессия имеет хорошую подгонку,
т.е. чем ближе
к 1, тем меньшее количество ошибок.
б) проверим связь между коэффициентом корреляции и коэффициентом детерминации:
0,854367
3.Проверим адекватность эконометрической модели по критерию Фишера.
Для
этого проведем сравнение фактического (F) и критического () значений F-критерия
Фишера. Вычислим значение F по формуле:
Получим, что F=76,2652.
Вычислим значение с помощью
статистической функции FРАСПОБР, где a=5%.
=5,933342
Так как F >, то скажем, что с вероятностью ошибиться 5%
отбрасываем базовую гипотезу статистики
, что коэффициент регрессии
=0. И с вероятностью принимаем гипотезу
-
0. Следовательно,
модель адекватна.
Оценка статистической значимости уравнения регрессии по критерию Фишера для уровня значимости a (F-тест).
После того, как найдено уравнение линейной регрессии, производится оценка значимости (оценивание качества) как уравнения в целом, так и отдельных его параметров.
Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или несколько) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа (с помощью F-критерия Фишера).
При этом
выдвигается нулевая гипотеза Н0, что коэффициент регрессии равен
нулю, т.е. b0=0, и, следовательно, фактор х не оказывает влияния на
результат у, т.е. уравнение регрессии и показатель тесноты связи статистически
незначимы. На
этом факте и основана проверка статистической значимости уравнения линейной
регрессии. То есть проверяется то обстоятельство, что полученное уравнение
линейной регрессии апроксимирует
точки выборки лучше, чем просто среднее значение
с доверительной
вероятностью, равной 1-a.
Для этого проведем сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфактопределяется из соотношений факторной и остаточной дисперсий, рассчитанных на одну степень свободы
=
(n- 2),
где n – число единиц совокупности,
m – число параметров при переменных х.
Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Обычно принимается a=0.05 или a=0.01.
Известно, что отношение (n- 2) имеет распределение Фишера с (
,
) степенями свободы.
Критическое
(табличное) значение статистики Фишера- – это
максимально возможное значение критерия под влиянием случайных факторов при
данных степенях свободы и уровне значимости a. Обычно принимается a=0.05 или a=0.01.
Вычислениевыполняется по
специальным таблицам значений F-критерия Фишера. Исходными данными для вычисления
служит,
-во-первых, значение a, определяющее необходимую таблицу,
-во-вторых, размерность выборки n, по которой
вычисляются значения степеней свободы и
, определяющие соответственно столбец и строку
таблицы, на пересечении которых приведено нужное значение
. В нашем случае
=1, а
=n- 2. (При использовании
таблицы стоит обратить внимание на то, где раположено
,а где
, потому что в различных книгах эти таблицы могут
отличаться транспонированным видом).
На Excel вычислениеосуществляется
функцией FРАСПОБР. Ее первым аргументом нужно задать значение a (этот аргумент называется
«Вероятность»), другим аргументом задастся единица, а третьим значение
=n- 2.
Полученное значениесравнивается с
(n - 2).
Если выполняется условиеFфакт >, то Н0– гипотеза о случайной природе оцениваемых характеристик отклоняется и можно сформулировать
вывод о том, что полученное уравнение линейной регрессии статистически значимо
и належно с доверительной вероятностью, равной 1-a и линейная модель адекватно
отражает результаты эксперимента.
Если Fкр </sub>> Fфакт , то гипотеза Н0 не отклоняется и признается статистическая незначимость и ненадежность уравнения регрессии.
4.Оценим качество эконометрической модели и сделаем выводы.
Фактические значения результативного признака у
отличаются от теоретических , рассчитанных по уравнению регрессии. Чем меньше это
отличие, тем ближе теоретические значения подходят к эмпирическим данным, лучше
качество модели. Величина отклонений фактических и расчетных значений
результативного признака (у-
) по каждому наблюдению представляет собой ошибку
аппроксимации. Их число соответствует объему совокупности.
Т.к. (у-) может быть положительной и отрицательной величиной,
то ошибки аппроксимации для каждого наблюдения определяют в процентах по
модулю.
Отклонения (у-) рассматривают как абсолютную ошибку аппроксимации, а
- как
относительную ошибку аппроксимации.
Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую
Для этого найдем абсолютную среднюю процентную ошибку по формуле:
Получим, что MAPE=5,984854. Так как МАРЕ<10%, то это означает высокую точность прогноза.
Центральное место в анализе найденного уравнения линейной регрессии
занимает разложение общей суммы квадратов отклонений переменной у от среднего
значения (т.е. этой
вариации) на две части: «объясненную» регрессионным уравнением и
«необъясненную» (т.е. связанную с ошибками ):
или MST=MSR+MSE,
где MST - общая сумма квадратов отклонений (вся дисперсия) зависимой переменной от средней,
MSR – факторная сумма
квадратов отклонений, объясненная (обусловленная) регрессией, равная сумме квадратов
отклонений значений, полученных при помощи уравнения регрессии от среднего
значения
MSR=,
MSE – остаточная сумма квадратов отклонений, характеризующая влияние неучтенных факторов (сумма квадратов ошибок):
(СУММКВРАЗН на Excel).
Величина MSE является количественной мерой качества построенной линейной регрессии. Чем она меньше, тем ближе проходит регрессионная прямая к точкам исходной выборки (xi,yi), i=1,2,..., n.
1.8. Оценка статистической значимости уравнения регрессии по критерию Фишера для уровня значимости a (F-тест).
После того, как найдено уравнение линейной регрессии, производится оценка значимости (оценивание качества) как уравнения в целом, так и отдельных его параметров.
Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или несколько) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа (с помощью F-критерия Фишера).
При этом
выдвигается нулевая гипотеза Н0, что коэффициент регрессии равен
нулю, т.е. b0=0, и, следовательно, фактор х не оказывает влияния на
результат у, т.е. уравнение регрессии и показатель тесноты связи статистически
незначимы. На
этом факте и основана проверка статистической значимости уравнения линейной
регрессии. То есть проверяется то обстоятельство, что полученное уравнение
линейной регрессии апроксимирует
точки выборки лучше, чем просто среднее значение
с доверительной
вероятностью, равной 1-a.
Для этого проведем сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфактопределяется из соотношений факторной и остаточной дисперсий, рассчитанных на одну степень свободы
=
(n- 2),
где n – число единиц совокупности,
m – число параметров при переменных х.
Fтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Обычно принимается a=0.05 или a=0.01.
Известно, что отношение (n- 2) имеет распределение Фишера с (
,
) степенями свободы.
Критическое (табличное) значение статистики Фишера- – это
максимально возможное значение критерия под влиянием случайных факторов при
данных степенях свободы и уровне значимости a. Обычно принимается a=0.05 или a=0.01.
Вычислениевыполняется по
специальным таблицам значений F-критерия Фишера. Исходными данными для вычисления
служит,
-во-первых, значение a, определяющее необходимую таблицу,
-во-вторых, размерность выборки n, по которой
вычисляются значения степеней свободы и
, определяющие соответственно столбец и строку
таблицы, на пересечении которых приведено нужное значение
. В нашем случае
=1, а
=n- 2. (При использовании
таблицы стоит обратить внимание на то, где раположено
,а где
, потому что в различных книгах эти таблицы могут
отличаться транспонированным видом).
На Excel вычислениеосуществляется
функцией FРАСПОБР. Ее первым аргументом нужно задать значение a (этот аргумент называется
«Вероятность»), другим аргументом задастся единица, а третьим значение
=n- 2.
Полученное значениесравнивается с
(n - 2).
Если выполняется условие Fфакт</i>>, то Н0– гипотеза о случайной природе оцениваемых характеристик отклоняется и можно сформулировать
вывод о том, что полученное уравнение линейной регрессии статистически значимо
и належно с доверительной вероятностью, равной 1-a и линейная модель адекватно
отражает результаты эксперимента.
Если Fкр </sub>> Fфакт , то гипотеза Н0 не отклоняется и признается статистическая незначимость и ненадежность уравнения регрессии.
Лабораторная работа №3
определение параметров классической регрессионной модели
Цель работы: определить параметры классической регрессионной модели по оценкам, полученным в выборочной регрессионной модели.
Определить параметры классической регрессионной модели по оценкам, полученным методом МНК, провести анализ статистической значимости коэффициентов модели, определить интервалы доверия для параметров классической модели, проверить нуль гипотезу классической регрессионной модели, определить статистическую значимость коэффициента корреляции генеральной совокупности.
Порядок выполнения работы
1.Применить тест Стьюдента для проверки на значимость параметров выборочной регрессионной модели (b0и b1), определенных методом наименьших квадратов в лабораторной работе № 1. Для проверки полученных результатов применить упрощенный тест Стьюдента
2.Построить интервалы доверия для параметров классической регрессионной модели (b0 и b1) применив тест Стьюдента;
3.Применить тест Фишера для проверки нуль – гипотезы (Н0:: b1 = 0) классической регрессионной модели. Тестирование по критерию Фишера статистической значимости независимой переменной эконометрической модели (х).
4.Определить статистическую значимость коэффициента корреляции генеральной совокупности, применив тест Стьюдента и трансформированный тест Стьюдента (с допущением, что r ≠ 0).
5.Интерпретировать полученные результаты, сделать выводы о параметрах классической регрессионной модели
1. Применить тест Стьюдента для проверки на значимость параметров выборочной регрессионной модели (b0 и b1), определенных методом наименьших квадратов в лабораторной работе № 1. Для проверки полученных результатов применить упрощенный тест Стьюдента
Проверим на статистическую значимость пераметры уравнения регрессии, т.е. гипотезы о равенстве нулю каждого из коэфициентов—о случайной природе показателей.
Вычислим квадрад выборочного стандартного отклонения наблюдаемого значения yi от прогнозируемого значения ýi:
, получим значение 5,46502
Далее вычисляем
оценки дисперсии коэфициентов
регрессии b1 иb0:
--стандартная ошибка параметра b0 (m b0)
=1,54E+1
--стандартная ошибка коэф. регрессии b1 (mb1)
=5,42E-08
Отсюда получаем стандартную ошибку к-та регрессии b1 (m b1) и стандартную ошибку параметра b0 (m b0)
, отсюда вычисляем
=12408689
=0,000233
Величина стандартной ошибки совместно с t- распределением Стьюдента при n-2 степенях свободы применяется для проверки существенности к-та регрессии и для расчета доверительных интервалов.
Известно, что если выбраны гипотетические значения оцениваемых
параметров для b1 и
для b0, то
статистика
имеет
распределение Стьюдента с n-2 степенями свободы. Проверяем гипотезы H0:
=
=0.
Фактическое значение
критерия tфакт=tj=
Далее, для
заданного вычислим
критическое (табличное) значение t-статистикиtкр. Для
этого используется таблица с названием
«Процентные точки распределния Стьюдента». Данными для вычисления tкр служат значение
и размерность
выборки n, которая задаст
значение степени свободы
. На их пересечении
приведено нужное значение tкр. При
использовании таблицы полезным будет
соотношение t (n,1-
)=-1 (n,
)
В Excel tкр вычисляем функцией СТЬЮДРАСПОБР.
Ее первый аргумент «Вероятность» - значение (делить его на 2 не нужно), вторым аргументом
задается n-2
Если tкр <tфакт, то Ho отклоняется, т.е. j-й к-т линейной регрессии не случайно отклоняется от 0 и сформировались под влиянием систематически действующего фактора х
Если tкр <tфакт, то Ho не отклоняется и признается случайная
природа формирования j-го к-та
линейной регрессии, т.е. к-т не является статистически значимым при выбранном уровне доверительной
вероятности 1-
1)Задаем базовую гипотезу статистики:
:
:
2)Принимаем уровень значимости a=5% и количество степеней свободы n-2=15-2=13.
3)Вычислим оценку дисперсии ошибки по формуле:
.
Она равна 1,968197.
4)Вычислим оценку дисперсии для параметра :
=14,42482.
5)Вычислим оценку дисперсии для параметра :
=0,00246.
6)Строем t-отношение:
.
Тогда t-отношение для параметров равно – 3,36797 и 18,42475 соответственно.
7)С помощью функции СТЬЮДРАСПОБР (a, n-2) мы определяем критическое
значение . Оно равно 2,160369.
8)Сравним вычисленное t-отношение с критическим значением. Мы видим, что – это значит,
что мы отклоняем гипотезу
.
2.Определим интервалы доверия для параметров обобщенной
регрессионной модели и
:
.
Тогда доверительные интервалы примут вид:
-20,997-4,5865;
0,80631,0204.
2. Построить интервалы доверия для параметров классической регрессионной модели (b0 и b1) применив тест Стьюдента;
Для расчета доверительного интервала для каждого показателя определим предельную ошибку :
Формулы для расчета доверительного интеравалов имеют следующий вид:
Если в границы дов-го интервала попадает 0, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, т.е. он не может одновременно принимать отрицательные и положительные значения.
3. Применить тест Фишера для проверки нуль – гипотезы (Н0:: b1 = 0) классической регрессионной модели. Тестирование по критерию Фишера статистической значимости независимой переменной эконометрической модели (х).
Покажем справедливость равенства
3.Применим тест Фишера для проверки гипотезы Н0:: b1=0 классической регрессионной модели. Проведем тестирование по критерию Фишера статистической значимости независимой переменной эконометрической модели (х):
1)Формируем базовую гипотезу H0: b1=0.
2)Задаем уровень значимости a=0,05*100%=5%.
3)ВычислимF-отношение по формуле:
=339,47143.
4)Применив функцию статистики FРАСПОБР (a, 1, n-2) находим Fкр.значение при заданном уровне a с (1, n-2) степенями свободы. Fкр=4,667.
5)Сделаем вывод.