Главная Контакты В избранное
  • ЛАБОРАТОРНАЯ РАБОТА № 1 Парная линейная регрессия

    АвторАвтор: student  Опубликовано: 18-03-2014, 13:25  Комментариев: (0)

     Скачать:  LABORATORNAYa_RABOTA1.zip [268,88 Kb] (cкачиваний: 106)

     

    ЛАБОРАТОРНАЯ РАБОТА № 1

    Парная линейная регрессия

     

    Задана выборка, полученная для двух факторов X и Y.

    ЗАДАНИЯ:

    1. По исходным данным построить корреляционное поле.

    2. Найти числовые характеристики заданной выборки.

    3. Записать уравнения прямых линий регрессии и построить их на корреляционном поле.

    4. Подсчитать дисперсию остатков.

    5. Проверить статистическую значимость выборочного коэффициента корреляции при помощи t – статистики Стьюдента.

    6. Проверить статистическую значимость коэффициента детерминации при помощи F – статистики Фишера.

    7. Построить доверительные интервалы для коэффициентов уравнения регрессии.

    8. Определить доверительную зону регрессии.

    9. По заданному значению аргумента Хp найти прогнозируемое значение Yp и его доверительный интервал.

    Как это сделать в EXСEL

    Ø В папке "трафареты” найти файл « Л.Р. № 1 трафарет.xls ».

    Ø Скопировать его в свою папку « Группа ***» и переименовать, вставив вместо слова "трафарет” свою фамилию:

    «Л.Р. № 1 Фамилия ».

    Ø Открыть файл и приступить к выполнению лабораторной работы.

     

     


    Выбор варианта лабораторной работы

     

    Ø Если Ваш номер по журналу – число 17, то выбираются столбцы:

    X1 и Y7

    Ø Если Ваш номер по журналу – число 20, то выбираются столбцы:

    X2 и Y0

    Ø Если Ваш номер по журналу – число 5 (или 05), то выбираются столбцы:

    X0 и Y5

    1. Корреляционное поле

    Как это сделать в EXСEL

    Ø Занести исходные данные (выборку) в отведенные для

    этого ячейки (столбцы N, O). Столбцам дать имена Х и Y.

    Ø В ячейку N23 занести значение X p .

    Ø По исходным данным построить корреляционное поле.

    («Мастер диаграмм», «Точечная диаграмма»).

     

    Корреляционное поле должно иметь вид:

     


    2. Нахождение числовых характеристик заданной выборки

    Как это сделать в EXСEL

    Ø Найти объем выборки n (ячейка O26).

    (Мастер функций, категория Статистические, функция СЧЕТ).

    Ячейке присвоить имя (например, n или "объем").

     

    Ø В столбцах Y и Z в предназначенных для этого ячейках вычислить числовые характеристики факторов X и Y:

    средние (СРЗНАЧ),

    дисперсии (диспр),

    стандартные отклонения ().

    Ячейкам присвоить имена: Xср, Yср; Dx, Dy; Sx, Sy.

     

    Ø В указанных в шаблоне ячейках вычислить следующие точечные оценки выборочной совокупности:

    ковариацию(«Мастер функций», функция КОВАР),

    коэффициент корреляции (функция КОРЕЛ),

    коэффициент детерминации ( ).

     

    Ячейкам присвоить соответствующие имена.

     

     

    3. Уравнения прямых регрессии

     

    Уравнения прямых регрессии имеют вид:

     

    и

    Подставить в последние соотношения уже найденные числовые характеристики и ввести обозначения:

     

    ,

    Значения коэффициентова и c подсчитать в ячейках U28 и Z28.


    Другая форма записи уравнений регрессии:

     

    и .

    В ячейках U29 и Z29 определить свободные слагаемые b и d

    по формулам

    и .

    Ячейкам, в которых подсчитаны коэффициенты a, b, c, d , присвоить имена. Имя для c записать русским шрифтом.

    В предусмотренных в шаблоне лабораторной работы полях записать уравнения прямых регрессии в обеих формах. Указать числовые значения коэффициентов. Построить графики прямых регрессии, совместив их с корреляционным полем.

     

    Как это сделать в EXСEL

     

    Ø Скопировать исходные данные выборки в столбцы AE и AF (выделяя сразу весь столбец и записывая в него формулу (=X) или (=Y), заканчивая ввод сочетанием Ctrl + Enter).

     

    Ø В столбец AG записать формулу, соответствующую уравнению регрессии Y на X: ( = a *x + b). Коэффициенты a , b и столбец x вызвать по именам. Закончить ввод сочетанием Ctrl + Enter. Дать столбцу имя Yтеор).

     

    Ø В столбец AH записать формулу, соответствующую уравнению регрессии X на Y: ( = ( x – d ) / c ). Коэффициенты c , d и столбец x вызвать по именам. Закончить ввод сочетанием Ctrl + Enter.

     

    Ø С помощью Мастера Диаграмм построить Точечную Диаграмму,выделяя все четыре столбца, включая шестую строку, в которой находятся заголовки.

    На диаграмме должны быть изображены две прямые линии (прямые регрессии), совмещенные с корреляционным полем.


    Примерный вариант совмещения теоретической линии

    с корреляционным полем

     

     

     

     

    Полученные графики следует привести к виду,

    удобному для анализа.

    Как это сделать в EXСEL

     

     


    Ø Поставив курсор на одну из цветных точек на поле Легенды, щелкнуть левой кнопкой мышки. Активизируется Легенда. Щелкнув еще раз, активизируем саму цветную точку – Ключ легенды. Щелкнув теперь правой кнопкой, открываем контекстное меню и, выбирая Формат ключа легенды, видим панель форматирования точек ряда.

     

    Ø Для формирования линии без точек, в разделе «Линия» нужно отметить «Другая» и выбрать нужные цвет, тип и толщину.

    В разделе «Маркер» отметить «Отсутствует».

     

    Ø Корреляционное поле – это совокупность точек. Для него выбираем соответствующий вид и цвет «Маркера». В разделе «Линия» отмечаем «Отсутствует».

     

     

    Аналогичным образом редактируются и другие графики.

     


    4. Дисперсия остатков

    Остатки – это разности между экспериментальными и теоретическими значениями фактора Y:

    , i = 1, 2, … , n

     

    Как это сделать в EXСEL

     

     

     

     

     


    ØОстатки вычисляются в столбце AW.

    ØВыделяя весь столбец AW, ввести в него формулу (= Y–Yтеор). Закончить ввод сочетанием Ctrl + Enter.

    ØВ предусмотренных шаблоном лабораторной работы ячейках подсчитываются:

    среднее значение остатков (СРЗНАЧ).

    Это значение должно быть практически равным нулю;

    дисперсия остатков

    .

    Мастер Функций, категория «Математические», СУММКВ, присвоить ячейке имя;

    стандартное отклонение остатков

     

    ,

    присвоить ячейке имя.

     

     

    Найденные точечные характеристики остатков будут далее использоваться при нахождении интервальных оценок.

     

    5. Проверка статистической значимости

    выборочного коэффициента корреляции при помощи

    t – статистики Стьюдента

    Проверяется гипотеза о статистической значимости коэффициента корреляции.


    В ячейке BC6 вычисляется наблюдаемое значение t – статистики Стьюдента:

    .

    По таблицам критических точек распределения Стьюдента с доверительной вероятностью= 0,05 и числом степеней свободы n - 2 находится и заносится в ячейку BG6.

    Можно воспользоваться Мастером Функций

    =СТЬЮДРАСПОБР(0,05;n-2)

    Сравнивая наблюдаемое и критическое значения t – статистики Стьюдента, формулируется вывод о статистической значимости коэффициента корреляции.

    Если , то коэффициент корреляции статистически значим, то есть между наблюдаемыми переменными X и Y существует линейная связь.

    Этот вывод записывается в соответствующем поле, предусмотренном шаблоном лабораторной работы.

    6. Проверка статистической значимости коэффициента

    детерминации при помощи F – статистики Фишера

     

    Для проверки статистической значимости коэффициента детерминации (степени соответствия построенного уравнения регрессии имеющимся статистическим данным) используетсяF статистика Фишера.

    Наблюдаемое значение F – статистики Фишера определяется соотношением:

    Здесь R 2 коэффициент детерминации;

    n объем выборки;

    n - 2 – число степеней свободы.

    Значение Fнабл подсчитывается в ячейке BC18.


    По таблицам критических точек распределения Фишера с доверительной вероятностью = 0,05 и числом степеней свободы n - 2 находится Fкр .

     

    Можно воспользоваться Мастером Функций

    =FРАСПОБР(0,05;k1; k2).

     

    Сравнивая наблюдаемое и критическое значения F – статистики Фишера, делается вывод о статистической значимости коэффициента детерминации и об адекватности математической модели уравнения регрессии в целом (чем больше Fнабл по сравнению с Fкр , тем более адекватной является математическая модель).

     

    Соответствующий вывод записывается в указанном в шаблоне поле, причем даётся оценка степени адекватности модели.

     

    7. Построение доверительных интервалов

    для коэффициентов уравнения регрессии

     

    Необходимо построить доверительные интервалы для найденных коэффициентов а, b, c и d уравнения регрессии.

    С доверительной вероятностьюможно утверждать, что истинные значения параметров а, b, c и d генеральной совокупности принадлежат интервалам:

    .

    Эти интервалы называются доверительными интервалами.

    Весьма существенно, что указанные формулы справедливы только для тех случаев, когда исследуемые случайные величины X и Y подчиняются нормальному закону распределения.

    Размах доверительных интервалов определяется формулами:

    ; .

    Чем меньше разброс статистических данных относительно построенной линии регрессии, тем меньше дисперсия и стандартное отклонение остатков и тем короче доверительные интервалы.


    Как это сделать в EXСEL

     

     


    Ø В ячейку BB29 записывается значение коэффициента , которое выбирается из таблицы критических точек t – статистики Стьюдента.

    ØВ ячейку BE29 заносится вычисленное ранее стандартное отклонение остатков S .

    ØВ ячейке BC31 вычисляется величина – размах доверительного интервала для коэффициента .

    Ø В ячейке BG29 вычисляется – среднее значение квадратов фактора X.

    Можно воспользоваться функцией СУММКВ категории МАТЕМАТИЧЕСКИЕ.

    Ø В ячейке BC32 определяется размах доверительного интервала для коэффициента b: .

    ØГраницы доверительного интервала для параметра формируются в ячейках BE31 и BG31.

    Аналогично строится доверительный интервал для b.

     

    8. Определение доверительной зоны регрессии

     

    Найденные коэффициенты уравнения регрессии а, b, c и d зависят от параметров выборки, и от выборки к выборке будут меняться. Поэтому уравнения регрессии носят приближенный характер. В связи с этим необходимо построить доверительную зону регрессии, в которой с доверительной вероятностью будет находиться истинная линия регрессии (для любой выборки из генеральной совокупности).

    Найденные теоретические значения фактора Y, т.е. , также являются только оценками. Истинные значения с доверительной вероятностью принадлежат интервалам

     

    , i = 1, 2, … , n


    Размах доверительных интервалов определяется формулой:

     

    Если на графике построить доверительную зону регрессии (см. рис.), то с доверительной вероятностьюможно утверждать, что истинная линия регрессии будет находиться в пределах этой зоны.

     

    Как это сделать в EXСEL

     

     

     


    ØДоверительные интервалы для вычисляются в столбце BL (ΔYi).

    ØПосле выделения всего столбца, программируется формула

    ØВнимание!Для чисел Sост , n ,и указывается абсолютный адрес или имя ячейки; для величин – имя столбца исходных данных для фактора Х (столбец N).

    Ø Закончить ввод сочетанием Ctrl + Enter.

    Ø В столбцах BM «нижн грань» и BN «верхн грань» вычисляются границы доверительной зоны: .


     

    ØДля построения доверительной зоны выделяются пять столбцов данных (вместе с заголовками): N, O, AG, BM и BN.

    Ø Далее следует вызвать Мастер Диаграмм и построить Точечную Диаграмму. (См. приведенную выше диаграмму)/

    Ø Внимание! Отредактировать линии зоны регрессии таким образом, чтобы они были непрерывными (не включали маркеры, точки и другие метки). Саму линию регрессии и границы доверительной зоны для неё желательно указать разными цветами.

    9. Прогноз и доверительный интервал для прогноза

     

    Полученное уравнение регрессии применяется для вычисления прогнозного значения фактора Y. Задавая значение фактора Xp, по уравнению регрессии определяется Yp .

    Так как коэффициенты уравнения регрессии носят приближенный характер, Ypтакже будет величиной приближенной. В связи с этим необходимо построить доверительный интервал (), которому с доверительной вероятностью будет принадлежать истинное значение прогнозируемой величины Y p . Размах доверительного интервала определяется по формуле

    Как это сделать в EXСEL

     

    Ø Заданное для прогноза значение Xpскопировать из ячейки N23 в ячейку BS29.

    Ø В ячейке BV29 по формуле вычислить прогнозное значение фактора Y p .

    ØРазмах доверительного интервала определить в ячейке BS32.

    Ø В ячейках BU32 и BW32 указать границы доверительного интервала для прогноза .


    ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ И КОНТРОЛЯ ЗНАНИЙ

    ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ И КОНТРОЛЯ ЗНАНИЙ

    1.Сформулируйте понятие корреляционного поля. Каким образом по виду корреляционного поля формулируется гипотеза о характере связи между изучаемыми переменными?

    2.Сформулируйте понятие уравнения регрессии. Какие типы уравнений регрессии наиболее часто используются в регрессионном анализе?

    3. В чём заключается суть метода наименьших квадратов для определения математической модели парной линейной регрессии?

    4. Что характеризует коэффициент корреляции в парной линейной регрессии? В каких пределах он изменяется?

    5. Что характеризует коэффициент детерминации в парной линейной регрессии? Как он определяется?

    6. Приведите пример анализа коэффициента детерминации в парной линейной регрессии. В каких пределах изменяется коэффициент детерминации и почему?

    7. Приведите определение точечных оценок случайных величин.

    8. В чем суть интервальных оценок случайных величин?

    9. Опишите методику проверки статистической значимости коэффициента корреляции и коэффициента детерминации. Приведите определение доверительной вероятности.

    10.Каким образом определяется критическое значение t статистики Стьюдента и F – статистики Фишера? Как геометрически можно интерпретировать значения указанных статистик?

    11.В чем суть интервальных оценок для коэффициентов уравнения парной линейной регрессии?

    12.Сформулируйте понятие доверительной зоны регрессии.

    13.Сформулируйте понятие дисперсии остатков? Для каких целей в парной линейной регрессии вычисляется дисперсия остатков?

    14.Каким образом выполняется проверка адекватности уравнения регрессии для парной линейной регрессии?

    15.Какому закону распределения должна подчиняться случайная величина, чтобы применять t – статистику Стьюдента и F – статистику Фишера для проверки статистической значимости коэффициентов корреляции и детерминации? Укажите смысл статистической значимости коэффициентов корреляции и детерминации.

     

     

    СОХРАНИТЬ ФАЙЛ ЛАБОРАТОРНОЙ РАБОТЫ В ЛИЧНОЙ ПАПКЕ!


    ВАРИАНТЫ ИСХОДНЫХ ДАННЫХ ДЛЯ ЛАБОРАТОРНОЙ РАБОТЫ № 1

     

    ЗНАЧЕНИЯ ФАКТОРА X

     

     

    X0

    Х1

    Х2

    Х3

    Х4

    Х5

    Х6

    Х7

    Х8

    Х9

     

    2,06 2,58 3,14 3,54 4,18 4,78 5,11 5,67 6,02 6,65 7,05 7,52 8,03 8,56 9,03

    2,53 3,54 3,84 3,84 4,22 4,81 6,53 5,82 6,43 7,73 8,19 7,65 9,31 9,26 9,86

    2,17 2,90 3,29 4,13 5,25 4,92 5,79 5,87 6,99 7,04 8,14 8,06 8,57 9,45 9,06

    3,65 3,82 3,76 5,24 5,03 5,52 5,62 6,98 6,91 7,95 7,24 9,27 8,46 10,30 10,72

    3,22 3,87 4,95 5,10 5,98 7,28 6,90 7,54 7,91 8,40 8,14 8,76 9,67 10,28 10,59

    2,16 2,65 3,49 3,16 3,85 4,58 5,33 5,89 6,20 6,39 6,95 7,25 7,80 8,47 9,22

    4,57 5,42 5,29 6,33 7,63 7,53 7,73 8,44 9,49 9,18 10,14 9,94 10,92 11,89 11,14

    2,25 2,98 2,15 2,71 3,70 4,59 4,77 5,34 5,45 6,00 6,25 6,79 8,24 8,51 9,15

    6,15 5,66 7,50 6,90 8,31 8,25 9,39 9,73 9,33 10,50 11,10 11,51 12,42 12,40 13,14

    1,86 1,91 2,14 3,39 3,95 4,30 5,10 5,47 5,97 6,16 6,46 6,07 6,71 7,16 8,81

    Значения X для прогноза ( X p )

     

     

    9,52

    9,69

    10,30

    10,05

    11,58

    9,32

    11,73

    9,78

    12,56

    8,07

    ЗАЧЕНИЯ ПОКАЗАТЕЛЯ Y

    Y0

    Y1

    Y2

    Y3

    Y4

    Y5

    Y6

    Y7

    Y8

    Y9

    7,24 8,02 9,28 10,12 11,12 12,19 13,01 14,12 15,21 16,29 17,01 18,03 19,19 20,21

    21,22

    10,89 11,92 12,45 13,27 14,12 15,23 16,07 17,40 18,68 19,46 20,52 21,32 22,58 23,73

    25,02

    16,21 17,75 16,39 18,87 19,60 21,21 21,84 23,00 24,44 25,36 25,54 27,14 27,95 28,99

    30,80

    12,11 12,30 13,82 14,84 15,86 16,41 17,80 18,61 19,57 21,26 21,08 22,99 23,43 24,63

    25,41

    15,21 15,42 16,44 17,93 18,52 19,80 20,76 21,30 22,25 24,14 24,17 25,66 26,50 27,46

    29,02

    16,62 17,63 19,22 19,36 20,52 21,95 22,45 23,56 24,90 25,53 26,11 28,02 28,37 29,48

    30,42

    10,22 10,58 12,01 12,84 13,28 15,13 15,84 17,08 17,99 18,32 19,49 20,59 21,35 23,20

    24,21

    12,50 13,88 15,16 16,06 16,66 17,65 18,46 19,54 20,58 21,77 22,15 23,80 24,79 25,57

    27,18

    19,66 20,53 21,31 22,59 23,27 24,44 25,85 26,74 27,36 28,37 29,22 30,50 31,21 32,56

    33,66

    14,87 15,78 16,79 18,03 18,29 19,93 20,32 21,18 22,47 23,47 24,07 25,57 27,07 27,62

    28,42


     

    скачать dle 10.6фильмы бесплатно