План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения icon

План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения


6 чел. помогло.

Смотрите также:
Предпринимательства...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Приказ от 21 января 2008 г...
2. теория статистического наблюдения 18 Лекция Теория статистического наблюдения 18...
Для объекта статистического наблюдения характерно то...
Указания по заполнению формы федерального статистического наблюдения №спо-1...
Приказ от 21 апреля 2011 г...
Об утверждении статистического инструментария для организации федерального статистического...
Указания по заполнению формы федерального статистического наблюдения №1 (профтех) Форму №1...
В соответствии с Федеральным планом статистических работ на 2005 год и постановлением...



страницы: 1   ...   4   5   6   7   8   9   10   11   12
вернуться в начало
скачать
^

Способы отбора.

ОТВЕТ


Основное требование к отбору - отбор должен быть простым по возможности.

Различают следующие виды отбора: простой собственно-случайный отбор (без предварительного расчленения генеральной совокупности на какие-либо группы) и отбор с предварительным разбиением совокупности на группы.

Простой собственно-случайный отбортакой отбор единиц из генеральной совокупности, когда на включение или исключение объекта из выборки не может повлиять какой-либо фактор кроме случая. Вероятность включения (исключения) объекта в выборку одинакова. Технически он осуществляется посредством жеребьевки или таблиц случайных чисел. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходится выигрыши. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.

Собственно-случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.

Простой отбор может быть организован как повторный или бесповторный.

При повторном отборе общая численность единиц генеральной совокупности в процессе выборки остается неизменной. Ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами при повторном отборе вновь попасть в выборку. Повторная выборка в социально-экономической жизни встречается редко.

При бесповторной выборке единица совокупности, попавшая в выборку, затем в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует; т.е. последующую выборку делают из генеральной совокупности уже без отобранных единиц. Таким образом, при бесповторной выборке численность единиц генеральной совокупности сокращается в процессе выборки.

Отбор с предварительным делением исходной совокупности на группы может быть организован разными способами, которым соответствуют свои виды отбора:

^ 1) Механический отбор - это бесповторный отбор элементов из генеральной совокупности, упорядоченной по нейтральному (несущественному для цели исследования) признаку через равные интервалы. В этом случае механический отбор дает хорошие результаты и близок к бесповторному собственно-случайному отбору.


Например, при исследовании успеваемости студентов вуза в качестве нейтрального признака можно взять фамилию, имя и отчество студента. Всех студентов упорядочивают по этому признаку. После чего отбирают заданное число студентов по фамилиям механически, через определенный интервал. Размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2%-ой выборке отбирается и проверяется каждая 50-я единица (1/0,02), при 5%-ой выборке – каждая 20-ая единица (1/0,05).

2) Для отбора единиц из неоднородной совокупности применяется так называемый расслоенный (стратифицированный) отбор. Расслоенный отбор используется тогда, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных групп по существенным для цели исследования признакам. Затем из каждой выделенной группы собственно-случайным или механическим способом производится индивидуальный отбор единиц в выборочную совокупность. Если пропорции между группами в выборке совпадают с пропорциями между группами в генеральной совокупности, то имеем типический отбор.

^ 3) Серийный отбор предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы совокупности. Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения, продажи упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

  1. ^ Смешанные (комбинированные) виды отбора.

По числу единиц в выборочной совокупности выборки делят на большие (n>30) и малые (n<30).


ВОПРОС 32

Точечные и интервальные оценки. Доверительный интервал.

^ ОТВЕТ

Различают точечное и интервальное оценивание. Точечной называют оценку, которая определяется одним числом. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам.

Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность (границы интервала оценивания) и надежность (вероятность, с которой гарантирован результат оценивания) оценок.

^ Доверительным интервалом называют интервал (*-;*+), который покрывает неизвестную характеристику (параметр) генеральной совокупности с заданной надежностью (доверительной вероятностью) . То есть: P[*-<г<*+]=. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Интервал (*-;*+) имеет случайные концы (доверительные границы), которые являются случайными величинами функциями от (X1, X2,..., Xn) и будут меняться от выборке.

На рис. 9 показаны доверительные интервалы для результатов оценивания по трем различным выборкам, но при одном и том же способе оценивания, одной и той же генеральной совокупности и одной и той же доверительной вероятности =0,9545. Здесь доверительный интервал под номером 3 «не покрывает» генеральную характеристику.




г




Рис.9. Интервальное оценивание генеральной характеристики.


Вероятность того, что доверительный интервал не покроет генеральную характеристику (параметр) совокупности обозначают и называют уровнем значимости. =1-, т.е. при =0,95 =0,05; при =0,99 =0,01. Событие, обладающее столь малой вероятностью, считается практически невозможным.

Порядок расчета интервальной оценки характеристики (параметра) генеральной совокупности:

  1. Определение точечной оценки характеристики (параметра) генеральной совокупности (*).

2. Расчет средней (среднеквадратической) ошибки выборки - . Формулы расчета средней ошибки выборки - зависят от способа отбора и от вида оцениваемой характеристики (параметра) генеральной совокупности.

3. Расчет предельной ошибки выборки: , где t–коэффициент доверия.

При большом объеме выборки значение коэффициента доверия t находим из таблиц интеграла Лапласа по заданной доверительной вероятности . Так, для =0,95 t=1,96. При =0,99040 t=2,58.

При небольшом объеме выборки (n30) значение t определяют по таблицам интеграла распределения Стьюдента.

Распределение Стьюдента (рис.10) имеет один параметр – объем выборки (n), либо число степеней свободы (k=n-1). Данное распределение симметрично относительно оси ординат, похоже на стандартное нормальное распределение, только более пологое. При n распределение Стьюдента стремится к стандартному нормальному распределению.




Рис. 10. Распределение Стьюдента.


Основные характеристики данного распределения: Е(t)=0; Mo=Me=0;

2=(n-1)/(n-3) >1; As=0; Ex=6/(n-5).

4. Результатом интервального оценивания является доверительный интервал: (*-;*+).


ВОПРОС 33

Оценивание среднего арифметического значения и доли по данным собственно- случайного повторного отбора. Оценивание дисперсии.

ОТВЕТ

В качестве точечной оценки среднего арифметического значения принимают выборочную среднюю: , которая является состоятельной, несмещенной оценкой генеральной средней.

В качестве точечной оценки доли альтернативного признака принимают выборочную долю: , которая является состоятельной и несмещенной оценкой.

В качестве точечной оценки дисперсии принимают исправленную дисперсию (s2): , где - выборочная дисперсия.

.

Если в качестве оценки генеральной дисперсии принять выборочную дисперсию , то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение генеральной дисперсии, т.е. выборочная дисперсия является смещенной оценкой генеральной дисперсии. Сравнивая формулы выборочной дисперсии и исправленной выборочной дисперсии, можно заметить, что они различаются только знаменателями. Очевидно, что при больших объемах выборки выборочная и исправленная дисперсии различаются мало (nn-1). На практике пользуются исправленной дисперсией, если n30.

Средняя ошибка выборки при собственно-случайном повторном отборе определяется следующим образом:

где - дисперсия признака в генеральной совокупности;

n - объем выборочной совокупности.

При проведении выборочных обследований она, как правило, неизвестна, поэтому на практике при расчете средней ошибки выборки используется исправленная дисперсия. В случае больших выборок вместо исправленной дисперсии можно использовать выборочную дисперсию.

Для доли (частости): 2=, где - доля альтернативного признака в выборке.

Результатом интервального оценивания генеральной средней является доверительный интервал: .

Результатом интервального оценивания генеральной доли (частости) : ,

где - предельная ошибка выборки.


ВОПРОС 34

Оценивание по данным бесповторного случайного отбора, расслоенного, серийного отбора. Расчет необходимого объема выборки.

ОТВЕТ

^ Оценивание по данным бесповторного случайного отбора.

При бесповторном отборе средняя ошибка выборки определяется следующим образом:



где N - объем генеральной совокупности.

При сравнительно небольшом проценте выборки отношение n/N близко к нулю, следовательно, значение средней ошибки выборки при бесповторном отборе близко к значению средней ошибки для повторного отбора. Это имеет место в тех случаях, когда число единиц генеральной совокупности неизвестно или безгранично, или когда n очень мало по сравнению с N.

^ Оценивание по данным расслоенного отбора.

При расчете средней ошибки выборки по данным расслоенного отбора в качестве показателя вариации используют среднюю взвешенную из внутригрупповых дисперсий:

- для повторного отбора,

- для бесповторный отбора,

где –средняя взвешенная из внутригрупповых дисперсий по выборочной совокупности;

m число выделенных типологических групп.

При оценивании среднего значения: ,

где 2j – дисперсия признака Х внутри j–ой группы; nj –численность j-ой группы.

При оценивании доли (частости): ,

где - выборочная доля альтернативного признака, рассчитанная по j–ой группе.

^ Оценивание по данным серийного отбора.

При расчете средней ошибки выборки по данным серийного отбора в качестве показателя вариации берется межгрупповая (межсерийная) дисперсия (2). Серийный отбор, как правило, является бесповторным. В случае равновеликих серий средняя ошибка выборки будет рассчитываться по формулам:



где r- число отобранных серий; R-общее число серий.

При оценивании среднего значения

,

где - средняя j-ой серии; - средняя по всей выборке.

При оценивании доли ,

где - доля признака в j-ой серии; - общая доля признака во всей выборочной совокупности.

Расчет необходимого объема выборки.

Так как величина ошибки выборки зависит от численности выборочной совокупности n, при подготовке выборочного наблюдения возникает задача определения необходимой численности выборки - такой, которая обеспечит заданную точность результатов исследования.

При повторном отборе необходимая численность выборки определяется по формулам:

- при оценивании среднего значения;

- при оценивании доли.

При бесповторном отборе необходимая численность выборки определяется по формулам:

- при оценивании среднего значения;

- при оценивании доли.


ВОПРОС 35

Классификация связей в статистике. Порядок изучения статистической связи.

ОТВЕТ

Признаки, которыми характеризуются единицы совокупности, могут быть взаимосвязанными. Взаимосвязанные признаки могут выступать в одной из ролей:

  • роли признака-результата (аналог зависимой переменной (Y) в математике);

  • роли признака-фактора, значения которого определяют значение признака-результата (аналог независимой переменной (X) в математике).

Связи классифицируют по степени тесноты, направлению, форме, числу факторов.

  • По степени тесноты связи делят на статистические и функциональные.

^ Статистическая (стохастическая) связь – это такая связь между признаками, при которой для каждого значения признака-фактора Х признак-результат Y может в определенных пределах принимать любые значения с некоторыми вероятностями; при этом его статистические (массовые) характеристики (например, среднее значение) изменяются по определенному закону (рис.11).

У · · ·

· · ·

· · ·

· · ·

· · · Х

Х1Х2 Х3Х4Х5 Х6

Рис. 11. Статистическая связь между признаками Х и Y.


Статистическая связь обусловлена:

  1. влиянием на результативный признак не только фактора Х, но и других факторов;

  2. неизбежностью ошибок измерения значений признаков (X и Y).

Модель стохастической связи может быть представлена в общем виде уравнением: Y=f(X,u), где Y - фактическое значение результативного;

f(X) - часть результативного признака, сформировавшаяся под воздействием фактора Х (или множества факторов: Y=f(X1,...,Xm);

u - случайная составляющая, часть результативного признака, возникшая вследствие действия прочих (неучтенных) факторов, а также ошибок измерения признаков.

Например, уровень успеваемость студентов по статистике стохастически связана с целым комплексом факторов: склонностью к точным наукам; временем, затраченным на подготовку к предмету; состоянием здоровья студента и др. Полный перечень факторов неизвестен. Кроме того, неодинаково действие любого известного фактора на успеваемость каждого студента. Например, при одной и той же успеваемости, разные студенты затрачивают неодинаковое время на подготовку. В результате – при одинаковых возможностях наблюдается вариация значений успеваемости студентов.

Корреляционная связь частный случай статистической связи. При корреляционной связи с изменением значения признака Х среднее значение признака Y закономерно изменяется; в то время как в каждом отдельном случае признак Y (с различными вероятностями) может принимать множество различных значений. Модель корреляционной связи: Е(YX)=f(X) или E(YX1, X2, .., Xm)=f(X1, X2, ...,Xm) , m-количество факторов, Е – математическое ожидание.

Противоположной статистической связи является функциональная.

^ Функциональная связь – такая связь, когда каждому возможному значению признака-фактора (Х) соответствует одно или несколько строго определенных значений результативного признака (Y) (рис.12). Она имеет место, когда все факторы, действующие на результативный признак, известны и учтены в модели и ошибки измерения отсутствуют.




У ·

·

·

·

· Х

Х1 Х2 Х3Х4


Рис.12. Функциональная связь между признаками Х и Y.


Модель функциональной связи может быть представлена как:

Y=f(X).

Чаще всего функциональные связи наблюдаются в явлениях, описываемых математикой, физикой и другими точными науками. Имеют место функциональные связи и в социально-экономических процессах, но довольно редко. Примером функциональной связи в экономике может служить связь между показателем фондовооруженности персонала -Y и показателями стоимости основных производственных фондов –Х1 и численностью промышленно-производственного персонала –Х2. Для любого предприятия наблюдается следующая зависимость между показателями: Y=Х1/Х2.

  • По направлению связи делят на прямые и обратные связи.

При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора.

При обратной связи направление изменения результативного признака противоположно направлению изменения признака-фактора.

Например, чем выше квалификация рабочего, тем выше уровень производительности его труда (прямая связь). Чем выше производительность труда, тем ниже себестоимость единицы продукции (обратная связь).

  • По форме связи (виду функции f) связи делят на линейные (прямолинейные) и нелинейные (криволинейные) связи.

^ Линейная связь отображается прямой линией; криволинейная отображается кривой (параболой, гиперболой и т.п.). При линейной связи с возрастанием значения факторного признака происходит равномерное возрастание (убывание) значения результативного признака. При криволинейной связи с возрастанием значения факторного признака возрастание (убывание) результативного признака происходит неравномерно (гиперболическая форма связи) или же направление его изменения меняется на обратное (параболическая форма связи).

  • По количеству факторов, действующих на результативный признак, связи подразделяют на однофакторные (парные) и многофакторные связи.

Порядок изучения статистической связи:

  1. Качественный (содержательный) анализ связи. На этом этапе определяется состав признаков, связь между которыми будет анализироваться. Здесь же производят предварительный анализ формы связи.

  2. Сбор данных (статистическое наблюдение).

  3. Количественная оценка тесноты связи по эмпирическим данным.

Если оценивается взаимосвязь качественных признаков, то данный этап является заключительным.

Если оценивается взаимосвязь количественных признаков, то подтверждение гипотезы о наличии взаимосвязи является основанием для перехода к этапу 4.

  1. Установление аналитической зависимости между признаками (регрессионный анализ):

4.1) выбор формы связи (вида аналитического уравнения связи);

4.2) оценка параметров уравнения;

4.3) оценка адекватности аналитического уравнения связи эмпирическим данным (оценка качества уравнения).

ВОПРОС 36

Количественная оценка тесноты связи по эмпирическим данным: эмпирический коэффициент детерминации, эмпирическое корреляционное отношение.
ОТВЕТ

Количественная оценка тесноты связи по эмпирическим данным состоит в расчете показателей тесноты связи:

  • Эмпирический коэффициент детерминации (эмпирическое дисперсионное отношение) - 2.

Данный показатель рассчитывается по данным аналитической группировки (табл.), как отношение межгрупповой дисперсии признака-результата Y (y2) к общей дисперсии Y (y2):

.

Согласно теореме о разложении дисперсии межгрупповая дисперсия связана с общей дисперсией: y2=y2+y2. Тогда эмпирический коэффициент детерминации может быть рассчитан через остаточную дисперсию по формуле:



где j2 – дисперсия признака-результата Y внутри j-ой группы.


Эмпирический коэффициент детерминации характеризует силу влияния группировочного признака (Х) на образование общей вариации результативного признака Y и показывает процент (долю) вариации признака-результата, обусловленную признаком-фактором, положенным в основу группировки.

Расчет 2 удобно вести в таблице:

Таблица
^

Признак- фактор

Хj


Nj

Среднее значение признака-результата





j2Nj

X1

N1





12N1

X2

N2





22N2

....










...

Xm

Nm





m2Nm

Итого

N

Х



j2

Тогда .


Рассмотрим пример. Пусть дана совокупность из 20 рабочих, характеризующихся признаками: Y - выработка рабочего (шт./смену) и Х- квалификация (разряд). Исходные данные представлены в таблице:

X

4

5

3

6

5

3

4

6

3

5

7

5

8

7

6

6

8

7

8

8

Y

11

13

10

17

12

12

14

18

13

15

18

16

27

20

15

17

24

22

25

23

Требуется оценить тесноту связи между признаками с помощью эмпирического коэффициента детерминации (2).

Для расчета 2 произведем аналитическую группировку совокупности. В качестве признака-фактора возьмем Х (разряд рабочего), в качестве признака-результата – Y выработку рабочего). Аналитическая группировка производится по признаку Х. В данном случае она будет дискретная (т.к. значения признака Х довольно часто повторяются). Количество групп равно числу значений признака Х в совокупности, т.е. 6. Результаты группировки и расчета 2 сведем в таблицу:

Признак-фактор Х

Признак-результат Y

Количество единиц в группе, Nj

Среднее значение признака-результата в группе,

(-)2·Nj

Дисперсия признака-результата в группе, 2j

2j·Nj

3

10

3

(10+12+13)/3=11,7

(11,7-17,1)23=88,56

21=((10-11,7)2+(12-11,7)2+(13-11,7)2)/3=1,56

4,7

12

13

4

11

2

(11+14)/2=12,5

(12,5-17,1)22=42,3

22=((11-12,5)2+(14-12,5)2)/2=2,25

4,5

14

5

12

4

(12+13+15+16)/4= 14

(14-17,1)24=38,4

23=((12-14)2+(13-14)2+(15-14)2+(16-14)2)/4=2,5

10

13

15

16

6

15

4

(15+17+17+18)/4= 16,75

(16,75-17,1)24=0,49

24=((15-16,75)2+(17-16,75)2++(17-16,75)2+(18-16,75)2)/4=1,9

4,75

17

17

18

7

18

3

(18+20+22)/3=20

(20-17,1)23=25,23

25=((18-20)2+(20-20)2+(22-20)2)/3=2,7

8

20

22

8

23

4

(23+24+27+25)/4= 24,75

(24,75-17,1)24=234,1

26=((23-24,75)2+(24-24,75)2+(27-24,75)2+(25-24,75)2)/4=2,19

8,75

24

27

25




=17,1

20




429,1




40,7




оставить комментарий
страница9/12
Дата26.09.2011
Размер1,57 Mb.
ТипДокументы, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   ...   4   5   6   7   8   9   10   11   12
средне
  1
хорошо
  1
отлично
  6
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх