План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения icon

План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения


6 чел. помогло.

Смотрите также:
Предпринимательства...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Приказ от 21 января 2008 г...
2. теория статистического наблюдения 18 Лекция Теория статистического наблюдения 18...
Для объекта статистического наблюдения характерно то...
Указания по заполнению формы федерального статистического наблюдения №спо-1...
Приказ от 21 апреля 2011 г...
Об утверждении статистического инструментария для организации федерального статистического...
Указания по заполнению формы федерального статистического наблюдения №1 (профтех) Форму №1...
В соответствии с Федеральным планом статистических работ на 2005 год и постановлением...



страницы: 1   ...   4   5   6   7   8   9   10   11   12
вернуться в начало
скачать
^

Нормальное распределение и его свойства.


ОТВЕТ

Нормальное распределение может быть представлено графически в виде симметричной куполообразной кривой (рис. 6.). Куполообразная форма кривой показывает, что большинство значений концентрируется вокруг центра измерения. Уравнение нормальной кривой: ,

где Yi- ордината кривой нормального распределения; =3,1415 и е=2,7182 – математические константы, a – математическое ожидание Х (для статистической совокупности a=), - среднее квадратическое отклонение.


Рис. 6. Нормальное распределение.


Основные особенности кривой нормального распределения:

  1. Кривая симметрична относительно максимальной ординаты, которая соответствует значению х=Мо=Ме=, ее величина равна .

  2. Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Следовательно, чем больше значения отклоняются от Х, тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку отклонения значений переменной Х от равновероятны.

  3. Кривая имеет 2 точки перегиба, находящиеся на расстоянии  от .

  4. При =const с увеличением  кривая становится более пологой. При =const с изменением кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.

  5. В промежутке  находится 68,3% всех значений признака. В промежутке 2 находится 95,4% всех значений признака. В промежутке 3 находится 99,7% всех значений признака.

  6. Параметры нормального распределения: Мо=Ме=, Аs=0, Ех=0.

  7. Нормальное распределение с параметрами а=0 и =1 называется стандартным нормальным распределением.



ВОПРОС 26

Сравнение эмпирического и теоретического распределений вариационных рядов.

ОТВЕТ

В вариационных рядах существует определенная связь между изменениями частот и значений варьирующего признака. Такого рода изменения называются закономерностями распределения. Для дискретного признака имеет место зависимость частостей (играющих роль вероятностей) от значения признака Х. Для непрерывного признака – зависимость между плотностями распределения частот и значениями признака.

Теоретическое распределение – хорошо известное и изученное в теории распределение. Оно описывается конкретной функцией (формулой). Параметры данной функции вычисляются по статистическим характеристикам совокупности.

Наиболее широкое практическое использование получили следующие виды распределений:

Для дискретного признака:

  • распределение Пуассона;

для непрерывного признака:

  • нормальное распределение;

  • экспоненциальное распределение

Эмпирические (фактические) закономерности отражают ряды распределения, а графически оно представляется с помощью полигона и гистограммы распределения. Фактическое распределение отличается от теоретического в силу влияния случайных факторов. Их влияние сглаживается с увеличением объема исследуемой совокупности.

Если отличия между теоретическими и эмпирическими частотами небольшое, то можно считать, что признак Х распределен по данному теоретическому закону. Объективную оценку близости эмпирических частот к теоретическим можно получить с помощью определенных критериев согласия. Существует множество таких критериев.

Наиболее широкое распространение получил критерий согласия «хи-квадрат» (или критерий Пирсона). Данный критерий применяется для сгруппированных данных. Он представляет собой случайную величину, имеющую распределение близкое к распределению «хи-квадрат», которую определяют по формуле:

2(X)=j=1;m(Nj- N'j)2/N’j ,

где m-число групп;

Nj – эмпирическая частота в j-ой группе;

N'j – теоретическая частота в j-ой группе.

Если расхождение между сравниваемыми эмпирическими и теоретическими частотами распределения окажется слишком большим, т.е. 2(X) будет принимать большие численные значения, то считают, что эмпирическое распределение сильно отличается от теоретического. А если расхождение окажется небольшим, то предполагают, что эмпирическое распределение близко к теоретическому.

Оценку существенности величины 2(X) можно получить, сравнив вычисленное по наблюдаемым данным значение критерия с табличным (критическим) значением - (2кр). Если 2(X)<2кр, то считают, что отличие фактического распределения от теоретического несущественно; а если 2(X) >2кр, то отличие существенно.

2кр определяют по статистическим таблицам значений 2–критерия Пирсона в зависимости от уровня значимости (вероятности того, что в наших выводах будет допущена ошибка) и параметра k, который равен: k=m-h-1, где h- число оцененных параметров теоретического распределения по наблюдаемым значениям признака.

Если проверяется гипотеза для дискретного ряда распределения, то порядок расчета 2(Х) следующий:

  1. строится эмпирический ряд распределения и находятся эмпирические частоты Nj. При этом может оказаться, что для некоторых групп Nj <5 (обычно в начале или конце ряда). Такие группы следует объединить с соседними, чтобы условие Nj ≥5 выполнялось для всех групп.

  2. рассчитываются теоретические вероятности pj, для объединенных групп соответствующие вероятности суммируются. Если параметры теоретического распределения неизвестны, то их оценивают по наблюдаемым значениям признака (например, методом максимума правдоподобия).

  3. вычисляются ожидаемые частоты: Nj =N· pj , где N – объем совокупности;

  4. вычисляется значение критерия «хи-квадрат» по формуле одноименной формуле.

^ Если исследуемая переменная непрерывна, то порядок расчета остается прежним. При этом эмпирический ряд распределения строится как интервальный. Теоретические вероятности pj рассчитываются через интегральную функцию теоретического распределения - F(Х), как:

pj= F(Хвj) - F(Хнj),

где Хвj и Хнj - соответственно верхняя и нижняя границы j–го интервала.

После этого может быть применена описанная выше методика расчета.


ВОПРОС 27

Понятие выборочного статистического исследования и условия его проведения. Генеральная и выборочная совокупность, их показатели.

ОТВЕТ


^ Выборочное статистическое исследованиеэто обследование выборочной совокупности с целью получения достоверных суждений о характеристиках или параметрах генеральной совокупности (г).

^ Генеральная совокупность – это полная совокупность единиц (статистическая совокупность).

Выборочная совокупность (выборка) - это часть единиц генеральной совокупности, отобранная в соответствии с принципами выборочного метода. Принципы выборочного метода: 1) обеспечение случайности отбора единиц совокупности (т.е. равной возможности попадания единицы в выборку); 2) обеспечение достаточного числа единиц в выборке.

^ Условия, требующие проведения выборочного исследования:

  • экономия времени и средств в результате сокращения объема работы (при выборочном методе обследованию подвергается 5-10%, реже до 15-20% изучаемой совокупности);

  • сведение к минимуму порчи или уничтожения исследуемых объектов (например, при определении прочности пряжи на разрыв нити, при испытании электрических лампочек на продолжительность горения, при проверке консервов на доброкачественность);

  • исследуемая совокупность может быть полностью недоступна;

  • исследуемая совокупность может не иметь конечного объема.

Чаще всего с помощью выборочного метода исследуются следующие характеристики совокупности:

  1. среднее арифметическое значение признака в совокупности ();

  2. доля альтернативного признака (): ,

где  - доля альтернативного признака в генеральной совокупности;

Na – число единиц, обладающих заданным значением альтернативного признака в генеральной совокупности;

N – объем генеральной совокупности.

Альтернативный признак – это признак, принимающий 2 значения. Если одно из этих значений принять как заданное, то доля альтернативного признака будет характеризовать долю (удельный вес) единиц в статистической совокупности, которые имеют заданное значение альтернативного признака. Например, доля нестандартных изделий во всей партии товара, удельный вес продукции собственного производства в товарообороте предприятия, удельный вес продавцов в общей численности работников магазина и т.п.

  1. дисперсия признака в совокупности (2).

Часто с помощью выборочного метода исследуются не просто характеристики генеральной совокупности, а параметры распределения изучаемого признака генеральной совокупности, если удалось установить (из теоретических соображений), какое именно распределение имеет признак. Например, если наперед известно, что изучаемый признак распределен нормально, то исследуемыми параметрами будут: a- математическое ожидание и - среднее квадратическое отклонение. Если же есть основания считать, что признак имеет распределение Пуассона, то необходимо оценить параметр - лямбда, которым это распределение определяется.

По данным выборки мы не можем найти точное значение характеристики или параметра генеральной совокупности (г), однако мы можем получить его приближенное значение (оценку).

^

ВОПРОС 28


Понятие статистической оценки. Свойства сатистических оценок: состоятельность, несмещенность, эффективность.

ОТВЕТ


Статистической оценкой (*) характеристики (параметра) генеральной совокупности называют приближенное значение искомой характеристики (параметра), полученное по некоторой функции от наблюдаемых в выборке значений признака Х, т.е.: *=f(X1, X2,..., Xn), где n – объем выборки; (X1, X2,..., Xn) – рассматриваются как независимые случайные величины. Функцию f называют способом оценивания.

Примером оценки генеральной средней является выборочная средняя, генеральной дисперсии - выборочная дисперсия. Однако совсем не обязательно в качестве статистической оценки характеристики (параметра) генеральной совокупности использовать выборочный статистический показатель. Возможны и другие способы оценивания.

От выборки к выборке статистическая оценка (даже при одном и том же способе оценивания) меняется (*1, *2,…, *m) (рис.7). Получаемая оценка (*j) представляет частный случай случайной переменной, т.к. сочетание значений признака Х в выборке случайно, а, следовательно, случайным будет и значение функции от них.

Таким образом, значение статистической оценки зависит от:

  1. вида характеристики (параметра) генеральной совокупности;

  2. способа оценивания;

  3. конкретной выборки (т.е. сочетания значения признака Х).



Г.С. (N),г





В.С.


1(n1) 2 (n2) ..... m (nm)

f1: *11 *12 *1m

f2: *21 *22 *2m

где nj – объем j-ой выборки;

*ij- оценка г, полученная по данным j–ой выборки при i–ом способе оценивания;

m- число выборок;

f1, f2 – соответственно 1-ый и 2-ой способы оценивания г.


Рис.7. Оценивание генеральной характеристики по данным выборки.


Для одного и того же параметра генеральной совокупности может быть предложено несколько способов оценивания. Таким образом, возникает проблема выбора лучшего способа оценивания. Критерием выбора является требование состоятельности, несмещенности и эффективности оценки, получаемой при данном способе оценивания.

Способ оценивания дает состоятельные оценки, если при бесконечно большом объеме выборки значение статистической оценки стремится к искомому значению параметра генеральной совокупности.

Способ оценивания дает несмещенные оценки, если математическое ожидание оценки при данном способе оценивания тождественно искомому параметру генеральной совокупности (при любом объеме выборки), т.е. Е(*)=г. Если математическое ожидание оценки не равняется характеристике генеральной совокупности, то оценка называется смещенной. И разность (Е(*)-г) называется смещением.

Было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения получаемой оценки могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия оценки может быть значительной. Поэтому еще одним важным требованием, предъявляемым к способам оценивания, является эффективность оценок. Оценка, полученная при данном способе оценивания, называется эффективной, если ее дисперсия минимальна (при заданном объеме выборки n).


ВОПРОС 29

Ошибки репрезентативности. Средние и предельные ошибки выборки.

ОТВЕТ

Выборочные (статистические) оценки отличаются от генеральных параметров за счет ошибки наблюдения (регистрации) и ошибки репрезентативности (выборки):

*=г+ошибка регистрации+ошибка репрезентативности.

Будем считать, что ошибка регистрации равна нулю.

Репрезентативность (представительство) выборки означает, что структура выборки должна быть близка к структуре генеральной совокупности, т.е. выборка должна состоять из тех же типов и в той же пропорции, что и генеральная совокупность. Если структура выборки не соответствует структуре генеральной совокупности, то при оценке характеристик (параметров) будут допущены ошибки репрезентативности.

Ошибки репрезентативности делятся на:

  • систематические – отклонения от схемы (способа отбора);

  • случайные (ошибки выборки) - это отклонения, возникающие из-за недостаточно равномерного представления в выборочной совокупности различных категорий единиц генеральной совокупности, в силу чего распределение отобранной совокупности единиц не вполне точно воспроизводит распределение единиц генеральной совокупности. Величина случайной ошибки репрезентативности равна: =*-г и может быть оценена с помощью соответствующих математических методов.

Различают среднюю и предельную ошибки выборки.

^ Средняя ошибка выборки () вычисляется как средняя из возможных ошибок j, j –номер выборки j=1;m. Она обычно рассчитывается по формуле средней квадратической: .

В каждой конкретной выборке фактическая ошибка выборки может быть меньше средней ошибки, равна ей или больше ее. Причем каждое из этих расхождений имеет различную вероятность.

^ Предельная ошибка выборки () – это максимально возможная при данной вероятности ошибка выборки (рис.8).










0 j i


Рис.8. Предельная ошибка выборки ().


То есть мы с заданной вероятностью гарантируем, что ошибка нашей (j-ой) выборки не превысит предельную ошибку . Заданная вероятность называется доверительной вероятностью - .

Предельная ошибка равна: =t·, где t- коэффициент доверия, значение которого определяется доверительной вероятностью .

Величина случайной ошибки репрезентативности (ошибки выборки) зависит от:

  1. способа формирования выборочной совокупности;

  2. объема выборки (чем больше объем выборки, тем меньше ошибка);

  3. степени колеблемости изучаемого признака в генеральной совокупности (чем больше колеблемость (вариация) признака, тем ошибка больше).



^

ВОПРОС 30


Закон больших чисел – методологическая основа выборочного метода.

ОТВЕТ


Теоретической основой выборочного метода служит закон больших чисел, суть которого состоит в следующем: с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются (чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик).

Математически данный закон записывается через неравенство П.Л.Чебышева: при n, где -выборочная средняя; - сколь угодно малая величина. Следует отметить, что данное неравенство справедливо для генеральной совокупности с ограниченной дисперсией.

Неравенство Чебышева доказывает принципиальную возможность определения генеральной средней по данным простой случайной выборки. Однако, оно не позволяет указать вероятность появления ошибок определенной величины. Это позволяет сделать центральная предельная теорема А.М.Ляпунова (доказанная в 1901 г.), которая гласит:

при достаточно большом числе независимых наблюдений вероятность того, что расхождение между выборочной и генеральной средней не превзойдет по модулю некоторую величину – t·, равна интегралу Лапласа: , где Ф(t)=- интеграл Лапласа.

Данное утверждение справедливо для генеральной совокупности с конечной средней и ограниченной дисперсией.

t

1

2

Ф(t)

0,683

0,954

Из этой теоремы следует важный вывод: при достаточно большом числе независимых наблюдений (объеме выборки) распределение отклонений выборочных средних от генеральной средней, а, следовательно, и самих выборочных средних приближенно нормально. Данное утверждение справедливо и для других видов статистических оценок. То есть можно утверждать, что для выборок большого объема статистические оценки распределены по нормальному закону.

ВОПРОС 31





оставить комментарий
страница8/12
Дата26.09.2011
Размер1,57 Mb.
ТипДокументы, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   ...   4   5   6   7   8   9   10   11   12
средне
  1
хорошо
  1
отлично
  6
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх