План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения icon

План статистического наблюдения. Достоверность статистических данных, ошибки статистического наблюдения


6 чел. помогло.

Смотрите также:
Предпринимательства...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Об утверждении статистического инструментария для организации федерального статистического...
Приказ от 21 января 2008 г...
2. теория статистического наблюдения 18 Лекция Теория статистического наблюдения 18...
Для объекта статистического наблюдения характерно то...
Указания по заполнению формы федерального статистического наблюдения №спо-1...
Приказ от 21 апреля 2011 г...
Об утверждении статистического инструментария для организации федерального статистического...
Указания по заполнению формы федерального статистического наблюдения №1 (профтех) Форму №1...
В соответствии с Федеральным планом статистических работ на 2005 год и постановлением...



страницы: 1   2   3   4   5   6   7   8   9   ...   12
вернуться в начало
скачать
^

С изменением показателя степени k формула степенной средней меняется, и в каждом отдельном случае приходим к определенному виду средней.

Запишем формулы различных видов степенных средних, придавая k значения: -1, 0,1,2.


Виды степенных средних

k

Название средней

Формула расчета средней

Область применения

Простая

Взвешенная

-1

Гармоническая





Усреднение относительных величин (за исключением относительных показателей динамики)

0

Геометрическая





Усреднение относительных показателей динамики, а также для определения равноудаленной величины от максимального и минимального значений признака

1

Арифметическая





Усреднение абсолютных, относительных величин (за исключением относительных показателей динамики)

2

Квадратическая





например, для вычисления средней величины стороны n квадратных участков, средних диаметров n труб, стволов и т.п.

Известно, что степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные значения. Чем больше показатель степени k, тем больше величина соответствующей степенной средней (данное утверждение справедливо для совокупности с положительными значениями признака Х):

Хгарм <Хгеом<Харифм<Хкв

Это свойство степенных средних называется свойством мажорантности средних.
^

Понятие ведущего показателя


Категорию средней величины можно раскрыть через понятие ведущего показателя. Ведущий показатель - это существенная характеристика совокупности как целого, определяемая всеми единицами этой совокупности и определенным образом связанная со всеми индивидуальными значениями признака: W = f(X1, X2, ..., XN), где Xi - индивидуальные значения признака в совокупности. В большинстве случаев ведущий показатель имеет реальный экономический смысл.

Основное свойство ведущего показателя следующее: он должен сохранять свое значение при замене индивидуальных значений признака их средней величиной. Если в формуле ведущего показателя все величины X1, X2, ..., XN заменить их средней величиной , то значение ведущего показателя должно остаться прежним, т.е.:

f(X1, X2, ..., XN ) = f(,,... , ).

Вид степенной средней


Ведущий показатель



















W=X1+X2+...+XN



W=X1·f1+X2·f2+...



W=X12+X22+...+XN2



W=X12·f1+X22·f2+...



Применение конкретной формы средней величины зависит от вида усредняемого признака Х (абсолютная, средняя или относительная величина) и от того, в каком виде представлены исходные данные.

Веса усреднения.

Название «вес» выражает тот факт, что разные значения признака имеют неодинаковую «важность» при расчете средней величины. Величина средней взвешенной зависит уже не только от величины индивидуальных значений признака (как в простой средней), но и от соотношения весов. Например, чем больше веса у малых значений вариантов, тем величина средней меньше. Поэтому важное значение имеет обоснование и выбор веса.

Весом может быть: 1) частота повторения индивидуальных значений признака (Nj);

2) частость: qj=Nj/Nj (qj=1). Тогда формула средней арифметической взвешенной имеет вид: =Xj·qj;

3) объемный показатель, логически связанный с усредняемым признаком (Х). Величина произведения данного показателя на Х, или частного от деления этого показателя на Х или величина, полученная при возведении Х в степень, равную данному показателю, должна иметь смысл, т.е. должна быть некоторым показателем;

4) доля объемного показателя в его суммарном объеме по совокупности в целом.


ВОПРОС 20

Усреднение относительных величин.

ВОПРОС

Если требуется найти среднее значение относительного показателя x, представляющего собой отношение абсолютных показателей (y и z): x=y/z, то используют формулу:

.

В зависимости от имеющихся данных формула расчета среднего значения x может быть сведена к формуле среднего арифметического взвешенного либо среднего гармонического взвешенного.

Когда имеются данные об индивидуальных значениях относительного показателя x и индивидуальных значениях абсолютного показателя знаменателя (z) в совокупности, то значения показателя y могут быть вычислены как: y=z·x и формула расчета будет иметь вид:


.

Это формула среднего арифметического взвешенного, где xi усредняемые значения показателя, zi - веса усреднения.

Когда имеются данные об индивидуальных значениях относительного показателя x и абсолютного показателя числителя (y), то значения показателя z могут быть вычислены как: z=y/x и формула расчета будет иметь вид:

.

Это формула среднего гармонического взвешенного, где xi усредняемые значения показателя, yi - веса усреднения.

Рассмотрим пример. На основе имеющихся данных (табл.) требуется определить среднюю цену:

Таблица


N магазина

Цена картофеля, руб/кг (x)

Выручка от реализации продукции, тыс.руб. (y)

1-ый

6

24

2-ой

5

15

3-ий

4

20

Итого

-

59

Расчет средней цены выражается соотношением:



Выручка от реализации известна, а объем реализации нет. Однако мы можем рассчитать объем реализации как частное от деления выручки на цену. Тогда средняя цена 1 кг картофеля по трем магазинам может быть исчислена по формуле средней гармонической взвешенной:



Этот же результат получится и по формуле средней арифметической взвешенной, если в качестве весов принять объем реализации (кг), который необходимо предварительно рассчитать:



Исчисление средней гармонической взвешенной избавляет от предварительного расчета весов, поскольку эта операция заложена в саму формулу.


ВОПРОС 21

Структурные характеристики распределения: квантили распределения и мода.

ОТВЕТ

К структурным характеристикам ряда распределения относят квантили распределения (медиану, квартили, децили и др.) и моду.

Квантили распределения представляют собой обобщающие показатели, характеризующие структуру распределения признака в совокупности.

Квантиль – это значения признака Х, занимающее определенное место в упорядоченной по данному признаку совокупности.

Виды квантилей:

  1. медиана Ме значение признака, приходящееся на середину упорядоченной совокупности,

  2. квартили Q1/4, Q2/4=Ме, Q3/4 – значения признака, делящие упорядоченную совокупность на 4 равные части,

  3. децили Q0,1,Q0,2,…,Q0,9 – значения признака, делящие упорядоченную совокупность на 10 равных частей,

  4. процентили Q0,01,Q0,02,…,Q0,99 - значения признака, делящие упорядоченную совокупность на 100 равных частей.

Рассмотрим пример. Определим медиану для признака Х «посещаемость практических занятий по статистике» в совокупности 20 студентов. Для этого упорядочим совокупность по Х:

N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

X 0 3 4 5 6 | 7 7 9 10 10 |10 12 12 14 15 | 15 16 16 16 16

Q1/4 Q2/4=Ме Q3/4

В совокупности 20 единиц. Середина приходится на 10 и 11 элементы, значения признака у которых 6 и 7 соответственно. Медианой будет среднее из значений этих элементов Х10=10, Х11=11, т.е. Ме=(10+10)/2=10.

Первый квартиль отделяет первую четверть элементов совокупности (т.е. 5 элементов). Его значение будет равно среднему из значений признака у 5-ого и 6-ого элементов, т.е. Q1/4=(6+7)/2=6,5.

Третий квартиль отделяет последнюю четверть элементов совокупности. Его значение будет равно среднему из значений признака у 15-го и 16-го элементов, т.е. Q3/4=(15+15)/2=15.

Если данные сгруппированы, то значение квантиля определяется по накопленным частотам: номер группы (j), которая содержит i-ый квантиль, определяется как номер первой группы от начала ряда, в которой сумма накопленных частот равна или превышает N·i, где i- индекс квантиля.

Если ряд интервальный, то значение квантиля уточняется по формуле:

(*),

где XQi- нижняя граница интервала, в котором находится i-ый квантиль;

F(-1) – сумма накопленных частот интервалов, предшествующих интервалу, в котором находится i-ый квантиль;

NQi – частота интервала, в котором находится i-ый квантиль.

Рассмотрим пример: определим медиану распределения признака «посещаемость практических занятий по статистике» в совокупности студентов по сгруппированным данным (равноинтервальная группировка):

Таблица 1

Посещаемость –

(Xн i; X вi)

Количество студентов

Накопленная частота (количество студентов нарастающим итогом)

[0 ; 5,3]

4

4

(5,3 ; 10,6]

7

11

(10,6; 16]

9

20

Итого

N=20

Х

Определим номер группы, содержащей Ме. Это будет 2-ая группа, т.к. именно в нее попадают серединные элементы совокупности (Накопленная частота F2=11, что больше N·0,5=10).

Теперь уточним значение Ме по формуле (*) :

Q2/4=Me=5,3+5,3·(10-4)/7=9,84.

XQ2/4=5,3; Q2/4=5,3; F(-1)=F1=4; NQ2/4=7.

Еще один способ определения квантилей - графический по кумуляте распределения (см. рис.1).

Н
апример, для определения медианы высоту наибольшей ординаты кумуляты, которая соответствует общей численности совокупности (N) делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой. Для определения квартилей высоту наибольшей ординаты делят тремя точками на три равные части. Через эти точки проводят прямые параллельные оси абсцисс до пересечения с кумулятой. Абсциссы точек пересечения и будут искомыми значениями квартилей.

Рис. 1. Определение медианы и квартилей по кумуляте.


Наиболее распространенным видом квантилей является медиана. Медиана не требует знания всех индивидуальных значений признака. Она не чувствительна к крайним значениям признака, которые могут резко отличаться от основной массы его значений. Поэтому медиану используют как наиболее надежный показатель типичного значения признака в неоднородной совокупности (включающей резкие отклонения от ).

Медиана находит практическое применение также вследствие особого математического свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая: (Хi-Ме)min.


Мода (Мо[х]) – наиболее часто встречающееся значение признака в совокупности.

Для дискретного ряда мода – это значение признака, которому соответствует наибольшая частота (частость) распределения. Для интервального ряда – это значение признака, которому соответствует наибольшая плотность распределения. Если ряд равноинтервальный, то значение моды можно определить по частотам (частостям): их соотношение будет таким же, что и плотностей распределения. Кроме того, значение моды в случае равноинтервального ряда можно уточнить по формуле:

Мо=ХМо+Мо ·(NMo-NMo-1) / (NMo-NMo-1 +NMo-NMo+1),

где NMо, NMо-1, NMо+1 – частоты, соответственно, модального, предшествующего и последующего интервалов.

Рассмотрим пример: определим моду для распределения признака «посещаемость практических занятий по статистике» в совокупности студентов, используя данные равноинтервальной группировки (табл.1). Модальный интервал будет [10,6 –16], т.к. в этом интервале наибольшая частота (NM0=9). Приближенное значение Мо определим по формуле: Мо=10,6+5,3(9-7)/(9-7+9-0)=11,56.

М
ода равноинтервального ряда графически определяется по гистограмме распределения (см. рис.2). Для этого правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.


Рис.2. Определение моды по гистограмме

Если все значения вариационного ряда имеют одинаковую частоту, то говорят, что этот вариационный ряд не имеет моды. Если две не соседних варианты имеют одинаковую доминирующую частоту, то такой вариационный ряд называют бимодальным; если таких вариант больше двух, то ряд – полимодальный.

Мода также как и медиана не требует знания всех индивидуальных значений признака и поэтому может быть использована в качестве наиболее типичного значения признака в неоднородной совокупности.


ВОПРОС 22

Показатели вариации признака. Свойства и методы расчета показателей вариации.

ОТВЕТ

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два распределения, имеющие одинаковую среднюю арифметическую, могут значительно отличаться друг от друга по степени рассеяния (вариации) признака. Если индивидуальные значения признака ряда мало отличаются друг от друга (рис.3.а), то средняя арифметическая будет достаточно надежной показательной характеристикой типичного уровня в данной совокупности. Если же ряд распределения характеризуется значительным рассеиванием индивидуальных значений признака (рис.3.б), то средняя арифметическая будет ненадежной характеристикой типичного уровня этой совокупности и ее практическое применение будет ограничено.



А) ··········· Х

Б) · · · · · · · · · · · Х



Рис.3. Примеры различных типов вариации признака Х.

Для измерения рассеяния (вариации) признака применяются различные абсолютные и относительные показатели вариации.

К абсолютным показателям вариации относятся:

  • Размах вариации - R (самый элементарный показатель вариации) представляет собой разность между максимальным и минимальным значениями признака в совокупности: R=Xmax-Xmin. Недостатком данного показателя является то, что размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов значений признака.

Среднее по совокупности отклонение значения признака от его среднего уровня измеряют два следующих показателя вариации: среднее линейное и среднее квадратическое отклонение.

  • Среднее линейное отклонение - d представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда полагают, что среднюю вычитают из варианта):



г
де N – объем совокупности; m- число групп;

fj – частота в j–ой группе (у j–ого варианта значения признака).

Математические свойства модулей плохие, поэтому часто на практике применяют другой показатель среднего отклонения от средней - среднеее квадратическое отклонение.

  • С
    реднее квадратическое отклонение - 
    представляет собой среднюю квадратическую из отклонений отдельных вариантов от их средней арифметической:




Среднее линейное и квадратическое отклонение показывают как расположена основная масса единиц совокупности относительно среднего арифметического значения; они выражаются в тех же единицах, что и варианты (Хj), поэтому экономически хорошо интерпретируются.

  • Дисперсия 2 это квадрат среднего квадратического отклонения. Она представляет собой средний квадрат отклонений вариантов от их средней величины. Она может быть также вычислена, как разность среднего квадрата значения признака и квадрата среднего арифметического значения признака:

Для несгруппированных данных:

Д
ля сгруппированных данных:

С
реднее квадратическое отклонение наряду с дисперсией входят в большинство теорем теории вероятности и математической статистики, что обусловливает их широкое применение на практике. Кроме того, дисперсия может быть разложена на составные части, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.


Основные вычислительные свойства дисперсии:

  1. дисперсия постоянной величины равна 0;

  2. если все варианты значений признака уменьшить на одно и то же число, то дисперсия не изменится;

  3. если все варианты значений признака уменьшить в одно и то же число А раз (А-const), то дисперсия уменьшится в А2 раз.

При вычислении показателей вариации сгруппированных данных используют формулу взвешенной средней. Для интервальных рядов распределения в качестве вариантов значений признака используют центральные (серединные) значения. В результате получают приближенные значения статистических показателей.




оставить комментарий
страница6/12
Дата26.09.2011
Размер1,57 Mb.
ТипДокументы, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3   4   5   6   7   8   9   ...   12
средне
  1
хорошо
  1
отлично
  6
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх