Методические указания и контрольны е задания для студентов заочной формы обучения по специальности 080507 «Менеджмент организации» Воскресенск icon

Методические указания и контрольны е задания для студентов заочной формы обучения по специальности 080507 «Менеджмент организации» Воскресенск


Смотрите также:
Методические указания для студентов заочной формы обучения по специальностям 080111 «Маркетинг»...
Методические указания и контрольные задания для студентов заочной формы обучения по...
Методические указания и контрольные задания для студентов заочной формы обучения по...
Методические указания по проведению практических...
Методические указания и контрольные задания для студентов специальности 080507...
Методические указания по проведению преддипломной практики и выполнению дипломного проекта для...
Методические указания к выполнению и защите дипломных работ для студентов дневной и заочной форм...
Российский государственный торгово-экономический университет...
Методические разработки: Сергеенкова Д. С. Исследование систем управления...
Методические указания и контрольные задания для студентов заочной формы обучения по дисциплине...
Российский государственный торгово-экономический университет...
Российский государственный торгово-экономический университет...



Загрузка...
страницы: 1   2   3   4   5
вернуться в начало
скачать

^ 4. РАСЧЕТ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ И ДЕТЕРМИНАЦИИ, ПРОВЕРКА ПРАВИЛЬНОСТИ ВЫБРАННЫХ ФАКТОРОВ И ФОРМЫ СВЯЗИ


Мы выяснили возможность установления корреляционной связи между значениями х и соответствующими значениями у. Теперь необходимо выяснить, как изменение факторного признака влияет на изменение результативного признака.

Если бы между x и y существовала строгая линейная функциональная зависимость, то расчетные значения ŷ были бы в точности равны фактическим у и разность между ними ŷ–y = 0. На самом деле расчетные значения отклоняются от фактических в силу того, что связь между признаками корреляционная.

В качестве меры тесноты взаимосвязи используется коэффициент корреляции:

r = = , (18)

где σx = , σy = .

Вычисление коэффициента корреляции по формуле (5) является трудоемкой операцией. Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:

(19)

Линейный коэффициент корреляции может принимать любые значения в пределах от минус 1 до плюс 1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.

В нашем примере r= 0,967.

Кроме того, можно рассчитать коэффициент детерминации R2, который в случае парной линейной регрессии равен квадрату коэффициента корреляции.

В нашем примере R2 = 0,935.

Это значит, что изменение расходов на товар А можно на 93,5% объяснить изменением дохода.

Остальные 6,5% могут явиться следствием:

  1. недостаточно хорошо подобранной формы связи;

  2. влияния на зависимую переменную каких-либо других неучтенных факторов.

Рассматриваемая нами зависимость описывалась слегка выпуклой кривой. Целесообразно проверить, не улучшится ли результат, если принять криволинейную форму связи.

Воспользуемся степенной функцией вида: ŷ = axb .

Логарифмируем: lg ŷ = lga + blgx.

Для нахождения параметров а и b всю процедуру МНК проделываем не с величинами у и х, а с их логарифмами. После решения системы нормальных уравнений (4) получаем: lg a = -4,525; b = 2,407.

Уравнение регрессии: lg ŷ = -4,525 + 2,407 lg x. Потенцируем и получаем: ŷ = 2,985 * 10-5 * х2,407

Сравним фактические и расчетные расходы на потребление товара А (таблица 3) и построим график полученной функции ŷ (рисунок 5).

Теснота криволинейной связи измеряется корреляционным отношением, обозначаемым через и имеющим тот же смысл, что и r.

Теоретическое корреляционное отношение может быть рассчитано по формуле:

=, (20)

где 2фактор–дисперсия для теоретических значений ŷ (объясненная вариация);

2общ – дисперсия для фактических значений у (необъясненная вариация).

Теоретическое корреляционное отношение можно представить в виде индекса корреляции ^ R. Преобразование основано на равенстве:

2общ =2фактор+2остаточ, , (21)

где 2остаточ – остаточная дисперсия.

2фактор=2общ-2остаточ. , (22)

R == (23)

В нашем примере = 0,997, ² = 0,994. Как видим криволинейная форма связи точнее отражает зависимость потребления товара А от дохода. Оставшиеся 0, 6% можно объяснить влиянием других факторов.

Рисунок 5. Сравнение фактических и расчетных расходов на потребление товара А для степенного уравнения регрессии


Таблица 3

Сравнение фактических и расчетных значений расходов на потребление товара А при степенной зависимости


группы

Расходы на товар А

Отклонение фактических значений от расчетных (у-ŷ)

фактические (у)

расчетные

(ŷ)

абсолютные

относительные (в процентах)

1

13

10

+3

23,077

2

20

17

+3

15

3

24

27

-3

-12,5

4

38

39

-1

-2,632

5

45

55

-10

-22,22

6

60

73

-13

-21,67

7

100

94

+6

6

8

150

118

+32

21,333

9

159

145

+14

8,805

10

160

176

-16

-10

11

196

211

-15

-7,653

Всего

-

-

0

-


^ 5. ОЦЕНКА ТОЧНОСТИ ПОСТРОЕННОЙ МОДЕЛИ. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ О ЗНАЧИМОСТИ ПАРАМЕТРОВ УРАВНЕНИЯ РЕГРЕССИИ И САМОГО УРАВНЕНИЯ В ЦЕЛОМ

При проведении статистических исследований возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемого процесса. Если исходные данные носят случайный характер, то и ответить можно лишь с определенной степенью уверенности, если вероятность ошибки мала, то суждения можно считать практически достоверными.

Статистическая гипотеза - это предположение о случайной величине, проверяемые по выборке (результатам наблюдений). Будем обозначать высказанные предположения (гипотезу) буквой Н. Наша цель - проверить, не противоречит ли высказанная нами гипотеза Н имеющимся выборочным данным. Процедура сопоставления высказанной гипотезы с имеющимися выборочными данными (x1,x2,…,xn) и количественная оценка степени достоверности полученного вывода называется статистической проверкой гипотез. Осуществляется такая проверка с помощью статистического критерия.

Результат сопоставления может быть отрицательным или неотрицательным. Отрицательный результат означает, что данные противоречат высказанной гипотезе, следовательно, от нее надо отказаться. Неотрицательный - данные наблюдения не противоречат высказанной гипотезе, и ее можно принять в качестве одного из допустимых решений. Однако это не означает, что высказанная нами гипотеза является наилучшей, единственно подходящей. Она лишь не противоречит имеющимся выборочным данным, таким же свойством могут обладать и другие гипотезы.

Существует множество разнообразных статистических критериев, однако, они строятся по общей логической схеме, которую можно описать следующим образом:

  1. Выдвигается гипотеза Но, которую будем называть "основной" или "нулевой".

  2. Задаются величиной уровня значимости . Принятие статистического решения всегда сопровождается некоторой вероятностью ошибочного заключения как в одну, так и в другую сторону. В небольшой доле случаев гипотеза Но может быть отвергнута, в то время как на самом деле она является справедливой. Это так называемая ошибка I рода, ее вероятность равна . Или, наоборот, в какой-то небольшой доле случаев мы можем принять нашу гипотезу, в то время как на самом деле она ошибочна, а справедливым оказывается некоторое конкурирующее с ней предположение - альтернативная гипотеза Н1. Это ошибка II рода. При фиксированном объеме выборочных данных величина вероятности одной из этих ошибок выбирается произвольно. Обычно задаются величиной  вероятности ошибочного отторжения проверяемой гипотезы Но. Эту вероятность называют уровнем значимости или размером критерия. Как правило, пользуются некоторыми стандартными значениями уровня значимости (= 0,1; 0,5; 0,025; 0,01; 0,005; 0,001). Наиболее распространенной =0,05. Она означает, что в среднем в пяти случаях из ста мы будем ошибочно отвергать гипотезу Но при многократном использовании данного статистического критерия.

  3. Задаются некоторой функцией от результатов наблюдений, которую называют критической статистикой. Она сама является случайной величиной и в предположении справедливости гипотезы Н0 подчинена некоторому хорошо изученному закону распределения.

  4. Из соответствующих таблиц распределения находятся критические точки, разделяющие всю область мыслимых значений данной статистики на три части: область неправдоподобно малых, неправдоподобно больших и естественных или правдоподобных (в условиях справедливости гипотезы Но) значений.

  5. Подсчитывают численную величину критической статистики, подставляя в функцию выборочные данные. Если вычисленное значение принадлежит области правдоподобных значений, то гипотеза Но считается не противоречащей выборочным данным. В противном случае, если вычисленное значение слишком мало или слишком велико, то делается вывод, что высказанное предположение Но ошибочно и от него следует отказаться в пользу альтернативной гипотезы.

В регрессионном анализе проверке статистической значимости подвергаются коэффициенты регрессии и корреляции. При этом соответственно используется t-статистика и F-статистика. Здесь можно использовать следующую процедуру.

  1. Выдвигаем ноль-гипотезу о том, что коэффициент регрессии b статистически незначим: Но: b=0 или что уравнение в целом статистически незначимо Но: r2=0

  2. Определяется фактическое значение соответствующего критерия.

  3. Сравнивается полученное фактическое значение с табличным.

  4. Если фактическое значение используемого критерия превышает табличное, ноль-гипотеза отклоняется и с вероятностью (1-) принимается альтернативная гипотеза о статистической значимости коэффициента регрессии или уравнения в целом. Если фактическое значение t-критерия меньше табличного, то говорят, что нет оснований отклонять ноль-гипотезу.

Статистическая значимость коэффициента регрессии проверяется с помощью t-критерия Стьюдента. Для этого сначала необходимо определить остаточную сумму квадратов

2ост=(yi – ŷi)2 (24)

и ее среднее квадратическое отклонение

= (25)

Затем определяется стандартная ошибка коэффициента регрессии по формуле:

(26)

Фактическое значение t-критерия Стьюдента для коэффициента регрессии рассчитывается как

. (27)

Значение |tb|>tкр (tкр2 для 95% уровня значимости) позволяет сделать вывод об отличии от нуля (на соответствующем уровне значимости) коэффициента регрессии и, следовательно, о наличии влияния (связи) х и у. Малые значения t-статистики соответствуют отсутствию достоверной статистической связи между х и у.

Можно построить доверительный интервал для b. Из (27) имеем:

[b – tкр*se(b), b + tкр*se(b)]- 95% доверительный интервал для b.

Доверительный интервал накрывает истинное значение параметра b c заданной вероятностью (в данном случае 95%).

Оценка статистической значимости построенной модели регрессии в целом производится с помощью F-критерия Фишера. Фактическое значение F-критерия для уравнения парной регрессии, линейной по параметрам определяется как:

, (28)

где 2фактор–дисперсия для теоретических значений ŷ (объясненная вариация);

2ост - остаточная сумма квадратов;

r2- коэффициент детерминации.

Соответственно, фактическое значение Fф сравнивается с табличным и на основании этого сравнения принимается или отвергается ноль-гипотеза.

Вернемся к нашему примеру и сделаем соответствующие расчеты.

Выдвигаем ноль-гипотезу о том, что коэффициент регрессии статистически незначим:

H0: b = 0. Статистическая значимость коэффициента регрессии проверяется с помощью t – критерия Стьюдента. Найдем остаточную сумму квадратов и ее среднее квадратическое отклонение:

2ост = 2946; = 18,0924.

Определим стандартную ошибку коэффициента регрессии и рассчитаем фактическое значение t-критерия Стьюдента для коэффициента регрессии:

se(b) = 0,0345; tb = 11,3768.

Выбираем уровень значимости равным 5%. По таблице находим значение t-критерия с n-2 степенями свободы t0,05(9) = 2,26 и сравниваем с ним фактическое значение (tb).

Так как фактическое значение t-критерия Стьюдента превышает табличное, то ноль-гипотеза отклоняется и с вероятностью 95% принимается альтернативная гипотеза о статистической значимости коэффициента регрессии.

Далее построим 95% доверительный интервал для коэффициента регрессии b:

0,3145 < b < 0,4705.

Перейдем к расчету коэффициентов корреляции и детерминации и проверке их статистической значимости:

r = 0,9666; d = r2 = 0,9343.

Выдвигаем ноль-гипотезу о том, что уравнение регрессии в целом статистически незначимо:

H0: r2 = 0.

Оценка статистической значимости производится с помощью F- критерия Фишера. Фактическое значение F-критерия Фишера:

Fф = 127, 9863.

По таблице находим значение F-критерия с (n-2) степенями свободы F0,05(1,9) = 5,12 и сравниваем фактическое значение с табличным. В результате, отклоняем ноль-гипотезу и с вероятностью 95% принимаем альтернативную гипотезу о статистической значимости уравнения регрессии.


^ 6. ОПРЕДЕЛЕНИЕ И АНАЛИЗ ЭЛАСТИЧНОСТИ ПОТРЕБЛЕНИЯ ПО ДОХОДУ

Для определения степени количественного воздействия на спрос отдельных факторов используются различные методы эконометрического анализа. Одним из них является исчисление коэффициентов эластичности потребления. С изменением дохода, цен и прочих факторов потребление товаров меняется в неодинаковой степени. То есть прирост дохода на единицу вызывает неодинаковый прирост потребления разных товаров. Отсюда – понятие эластичности.

Коэффициент эластичности потребления показывает, на сколько процентов изменяется потребление данного товара при изменении на один процент значения влияющего на него фактора. Наибольшее распространение при эконометрическом анализе потребления получили коэффициенты эластичности потребления по доходу и цене.

Потребности в тех или иных товарах различаются по степени их эластичности по доходу. Если расходы на удовлетворение какой-то потребности значительно изменяются при изменении дохода, то потребность эта обладает высокой степенью эластичности. Наиболее настоятельные потребности являются менее эластичными (например, хлеб, картофель, соль и т.д.). Менее настоятельные потребности обладают большой эластичностью, но степень их удовлетворения низка.

Коэффициент эластичности потребления по доходу характеризует количественную степень влияния изменения дохода на величину потребления и рассчитывается по формуле:

(29)

где у– потребление; х – доход; у – абсолютное изменение потребления; х – абсолютное изменение дохода.

Эмпирические коэффициенты эластичности рассчитываются по рядам статистических данных по формуле:

, (30)

i =1, 2, … n.

Рассчитаем эмпирические коэффициенты эластичности потребления по доходу по данным таблицы 1:

Э2 = 7/50 *250/20 = 1,75 Э7 = 4

Э3 = 4/50 * 300/24 = 1 Э8 = 3,67

Э4 = 2,58 Э9 = 0,68

Э5 = 1,24 Э10 = 0,08

Э6 = 2,25 Э11 = 2.57

эмпир.=1,65

Для целей анализа и прогнозирования лучше использовать теоретический коэффициент эластичности, полученный путем выравнивания и экстраполяции данных. Для больших совокупностей при небольших различиях в доходах семей отношение у/х можно рассматривать в пределе, заменив у и х их дифференциалами.

, (31)

Формулы эластичности, вычисленные для разных функций, не одинаковы.

Для линейной зависимости (ŷ = а + bx) y'=b, следовательно

(32)

Для степенной зависимости (у = а x b ) y'=abx b-1

(33)

Для линейной зависимости потребления от дохода ^ Э различен для разных доходных групп. При степенной зависимости Э постоянен (одинаков для всех групп) и равен b, т.е. показателю степени.

Теоретические и эмпирические коэффициенты эластичности могут существенно различаться в различных группах. Средние же их величины более или менее близки, что может служить свидетельством адекватности проверяемой формы связи исходным статистическим данным.

Принято разделять товары на «нормальные» и «низкокачественные» в зависимости от величины коэффициента эластичности. Потребление «нормальных» товаров растет с ростом дохода, т.е. Э >0, если Э < 0, то с ростом дохода потребление данного товара снижается и такой товар считается «низкокачественным».


^ 7. МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ.

ПОСТРОЕНИЕ ФУНКЦИИ СПРОСА (ПОТРЕБЛЕНИЯ) ОТ ДВУХ ФАКТОРОВ

Если на потребление влияет не один, а несколько факторов, то взаимосвязь их выражают уравнением множественной регрессии, процедура построения которого аналогична построению уравнения простой регрессии.

В большинстве случаев на потребление существенное влияние, кроме дохода, оказывает размер семьи. Считается, что расходы в целом на семью увеличиваются с ростом размера семьи, но расходы на каждого члена семьи уменьшаются.

В качестве второго фактора х2, влияющего на потребление, будем рассматривать размер семьи (данные приведены в таблице 4).

Множественный регрессионный анализ является развитием парного регрессионного анализа в том случае, когда зависимая переменная связана более чем с одной независимой переменной. Большая часть анализа является непосредственным расширением парного регрессионного анализа. Но существуют и новые проблемы.

  • При оценке влияния данной независимой переменной на зависимую переменную необходимо разграничить ее воздействие и воздействие других независимых переменных.

  • Проблема спецификации - какие переменные следует включить в модель, а какие - исключить из нее.

Если первоначальной моделью была (1):

,

где у - общая величина расходов на товар;

х - доход;

U - случайное отклонение (остаток);

то мы можем расширить эту модель, включив в нее новые объясняющие переменные.

Тогда истинную зависимость можно выразить следующим образом:

, (34)

где х2 – размер семьи.

С целью подбора наилучшей функции потребления с точки зрения аппроксимации расположения точек в трехмерном пространстве исходных данных, соответствующих наборам значений "доход – размер семьи - расход на потребление" в ППП Statistica, используя модуль Descriptive statistics, построим трехмерный график (рисунок 6).


Таблица 4

Исходные данные по фактору Х2 - размер семьи


№ группы

Размер семьи х2

1

1,5

2

2,1

3

2,7

4

3,0

5

3,2

6

3,4

7

3,6

8

3,7

9

4,0

10

3,8

11

3,7





Рисунок 6. Трехмерный график функции потребления


Как и в случае парной регрессии, мы выбираем значения коэффициентов регрессии так, чтобы обеспечить наилучшее соответствие наблюдениям. Оценка оптимальности соответствия определяется минимизацией суммы квадратов отклонений:

. (35)

Чтобы получить систему нормальных уравнений, необходимо продифференцировать это уравнение по всем параметрам (a, b1, b2), приравнять к нулю частные производные и преобразовать. Получим систему из трех нормальных уравнений с тремя переменными:



(36)




Преобразуя эти уравнения, можно получить формулы для расчета параметров а, b1 и b2.

Коэффициенты регрессии b1 и b2 - это показатели силы связи, характеризующие абсолютное (в натуральных единицах измерения) изменение результативного признака при изменении факторного признака на единицу своего измерения при фиксированном влиянии второго фактора.

Например, получено уравнение регрессии:

ŷ=116,7+0,112х1 – 0,739х2, (37)

Это уравнение можно интерпретировать следующим образом. При каждом увеличении дохода на 1 рубль (при сохранении постоянного размера семьи) расходы на питание возрастут на 0,112 рубля. На каждую единицу увеличения размера семьи (при постоянных доходах) эти расходы уменьшатся на 0,739 рубля.

Используя коэффициенты регрессии можно рассчитать частные коэффициенты эластичности, как правило, их рассчитывают для средних значений факторов и результатов.

. (38)

Интерпретация частных коэффициентов эластичности такая же, как и обычных, при фиксированных значениях остальных факторов.

Проверка значимости коэффициентов регрессии осуществляется, так же как и в парном регрессионном анализе с помощью t-критерия. Аналогично строятся и доверительные интервалы для каждого коэффициента регрессии.

В качестве показателей тесноты связи используются парные коэффициенты корреляции и частные коэффициенты корреляции.

Во множественном регрессионном анализе частный коэффициент корреляции используется для выявления коллинеарности (мультиколлинеарности) факторов. Для этого составляется и анализируется матрица частных коэффициентов корреляции, та ее часть, которая относится к объясняющим переменным. Не существует точных рекомендаций по устранению мультиколлинеарности, но считается, что при значении частного коэффициента корреляции большем 0,85 из анализа должен исключаться один из тех факторов, которые сильно коррелируют друг с другом. Какой именно оставить фактор в модели, решается с помощью матрицы парных или частных корреляций. Предпочтение следует отдать тому фактору, который наиболее тесно связан с зависимой переменной, то есть имеет с ней наибольший коэффициент корреляции. Это сложная задача, так как достоверно неизвестно, какие именно факторы оказывают наиболее существенное влияние на зависимую переменную и, следовательно, должны быть включены в уравнение регрессии.

Рассмотрим следующую модель:

, (39)

где y – общая величина расходов на питание

х – заработная плата,

z – доход, получаемый вне работы,

^ Т – совокупный доход.

Очевидно, что T=x+z, и, следовательно, Т будет сильно коррелировать как с х, так и с z. В этом примере можно исключить из рассмотрения фактор Т.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и фактором при фиксированном влиянии других факторов, включенных в уравнение регрессии. Их можно определить через парные коэффициенты корреляции по следующим рабочим формулам:

, (40)

, (41)

где - коэффициент частной корреляции между результатом и фактором х1, при фиксированном воздействии фактора х2;

- коэффициент частной корреляции между результатом и фактором x2 при фиксированном воздействии фактора x1;

,, –коэффициенты парной корреляции.

Тесноту связи между результатом и всеми факторами, включенными в уравнение регрессии, характеризует множественный коэффициент корреляции:

(42)

где 2фактор - факторная сумма квадратов, или объясненная моделью регрессия результата;

2общ - общая сумма квадратов, или общая вариация результата;

2остаточ = (y – ŷ)2 - остаточная сумма квадратов, или не объясненная моделью регрессии вариация результата.

Далее может быть определен коэффициент детерминации R2 (квадрат множественного коэффициента корреляции). Он определяет долю дисперсии у, объясненную регрессией, то есть совместное влияние включенных в уравнение регрессии факторов на результат. Интерпретируется аналогично коэффициенту детерминации в парном регрессионном анализе.

Для проверки статистической значимости уравнения регрессии в целом используется ^ F-критерий. Выдвижение гипотез и их проверка осуществляется, так же как и в парном регрессионном анализе. Фактическое значение F-критерия для уравнения множественной регрессии определяется по формуле:

, (43)

где k - общее число параметров в уравнении множественной регрессии (в случае двухфакторной линейной модели k = 3).





оставить комментарий
страница4/5
Дата07.03.2012
Размер0,97 Mb.
ТипМетодические указания, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3   4   5
Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

наверх