Книга рассчитана на читателя, которому нужно применять методы математической статистики. Математическая строгость не преследовалась, однако это не просто список рекомендаций для различных практических приложений, icon

Книга рассчитана на читателя, которому нужно применять методы математической статистики. Математическая строгость не преследовалась, однако это не просто список рекомендаций для различных практических приложений,


Смотрите также:
Книга рассчитана на массового читателя...
Книга рассчитана на массового читателя...
Опыт использования информационных технологий в преподавании курса «Математическая экономика»...
Примерная программа наименование дисциплины «теория вероятностей и математическая статистика»...
Программа дисциплины “ Система национальных счетов ” для направления 521600 экономика (3-я...
Решение задач математической статистики по теме «Проверка статистических гипотез»...
Элементы математической статистики...
2. Исторические условия появления Хартии...
Список литературы социологи...
Программа наименование дисциплины Теория Вероятностей и Математическая Статистика Рекомендуется...
Книга рассчитана на массового читателя...
Книга профессора И. М...



Загрузка...
скачать
Введение в теорию вероятности*


Предисловие

Настоящая книга основана на лекциях, прочитанных в 1967/1968 г. студентам-физикам и специалистам по физике эле­ментарных частиц Гейдельбергского университета. В ней обсуж­даются разделы математической статистики, наиболее полезные для анализа наблюдений. Книга предназначена для студентов и научных работников в области естественных наук, медицины, техники и экономики, сталкивающихся с проблемой обработки экспериментальных данных.

Книга рассчитана на читателя, которому нужно применять методы математической статистики. Математическая строгость не преследовалась, однако это не просто список рекомендаций для различных практических приложений, а попытка объяснить идеи и принципы обсуждаемых статистических методов. Часть мате­риала, представленного в книге, основана на лекциях и обзор­ных статьях, написанных физиками и для физиков [2, 15, 22].

Основные сведения из анализа читателю предполагаются из­вестными. Другой необходимый математический аппарат, в част­ности теория вероятностей, кратко изложен в книге. Существен­ная особенность изложения состоит в использовании матричных обозначений, позволяющих компактно изложить многие вопросы, например метод наименьших квадратов. Основы матричного ис­числения даны в приложении.

Наиболее сложные задачи анализа наблюдений решаются сей­час с помощью ЭВМ; для нескольких таких задач в книге при­ведены программы, написанные на ФОРТРАНе. В приложении даны основные сведения о ФОРТРАНе. Там же приведена крат­кая библиотека подпрограмм для оперирования с матрицами, со­ставленная на основе программ, написанных Бёком в ЦЕРНе (Женева).

Предполагается, что эта книга послужит не только введением в статистический анализ, но и будет использоваться в повседнев­ной работе. Поэтому в книге содержится несколько статисти­ческих таблиц и сводка наиболее важных формул, с тем чтобы их можно было быстро найти.

Мне бы хотелось выразить благодарность проф. Филтусу за проявленный интерес к этой теме, что послужило толчком к чтению курса лекций. Я благодарен группе моих коллег по Гей-дельбергскому университету: д-рам Бендеру, Брокейту, Гизеке, Роте и Шнейдеру за обсуждение книги и в особенности д-ру Шаху за прочтение рукописи и внесение большого числа полез­ных замечаний и улучшений. Хочется поблагодарить также д-ра Теннера (Амстердам) за плодотворные советы по расположению материала в книге. Примеры 8.2, 11.1 и 11.2 принадлежат д-ру Иммичу (Гейдельберг). Гравюру для титульного листа сде­лал д-р Френк (Ветцлар).

Примеры и статистические таблицы напечатаны на ЭВМ 1ВМ-360, Рис. 5.8 выполнен с помощью графопостроителя по программе, написанной д-ром Шнейдером.

3. Брандт

Гейдельберг, январь 1970 г.

^ ГЛАВА 1 ВВЕДЕНИЕ

В любой отрасли экспериментальной науки вслед за более ранней стадией качественного описания интересующего нас явле­ния следует стадия его количественного изучения, т. е. изме­рения. Наряду с планированием и проведением эксперимента важной задачей является точная оценка получаемых данных и полное их использование. Перечислим несколько типичных проб­лем,

1. Изучается воздействие различных средств на увеличение веса в группе подопытных животных. После применения вещества А к 25 животным наблюдалось среднее увеличение веса на 5%. Вещество В, применявшееся к 10 животным, дало увеличение веса на 3 %. Является ли средство А более эффективным? Сред­ние цифры 5 и 3% практически не дают ответа на этот вопрос, так как меньшая цифра могла быть вызвана влиянием какого-то одного животного с самым маленьким весом. Следовательно, не­обходимо изучить распределение весов животных и их отклонения от среднего значения. Кроме того, надо решить, позволит ли количество взятых для испытания животных с определенной точ­ностью различить эффекты от применяемых веществ.

2. В экспериментах по выращиванию кристаллов основной проблемой является поддержание точного соотношения между различными компонентами. Из группы, содержащей 500 кристал­лов, отбираются и анализируются 20 кристаллов. Какие выводы можно сделать относительно остальных 480 кристаллов? Такая задача выборки возникает, например, при контроле на производ­стве, при испытании на надежность автоматических измеритель­ных устройств, при опросе общественного мнения.

3. Получен некоторый экспериментальный результат. Тре­буется выяснить, не противоречит ли он уже известному теоре­тическому значению или ранее проведенным экспериментам? Тем самым эксперимент используется для проверки гипотезы.

4. Известен общий вид закона, выражающего зависимость между измеряемыми величинами; необходимо получить из экспе­римента значения параметров этого закона. Например, при радио­активном распаде число N атомов, распадающихся за секунду, убывает во времени по экспоненциальному закону N (t) = соnst X ехр (- t). Постоянная распада  и ошибка ее измерения должны быть определены с помощью нескольких наблюдений N1 (t1), N2 (t2), … . Эта проблема оценивания параметра, возможно, является наиболее интересной для многих экспериментаторов.

Все эти примеры иллюстрируют характерные особенности анализа данных. В частности, мы видим, что исход эксперимента не однозначно определяется условиями его проведения, а содер­жит элемент случайности, т. е. является случайной величиной. Эта стохастическая тенденция лежит либо в природе экспери­мента (подопытные животные неизбежно различны, радиоактив­ность является случайным явлением), либо в неизбежных погреш­ностях, вносимых применяемым оборудованием, т. е. в ошибках измерения. По этой причине следующая глава посвящена обзору наиболее важных понятий теории вероятности.

В 3-й и 4-й главах вводится понятие случайной величины. Рассматривается распределение случайной величины и параметры, которыми оно характеризуется, такие, например, как среднее значение и дисперсия. Особое внимание уделяется рассмотрению зависимости нескольких случайных величин. В гл. 5 изучаются распределения, представляющие специальный интерес для прило­жений; в частности, подробно рассматриваются свойства нор­мального, или гауссовского, распределения.

На практике распределение должно быть определено с по­мощью конечного числа наблюдений, т. е. выборки. Различные случаи выборочных процедур рассматриваются в гл. 6. Функции от выборки, т, е. функции от отдельных наблюдений, могут быть использованы для оценки параметров, характеризующих распре­деление. Выводятся требования, которым должна удовлетворять хорошая выборочная оценка. На этом этапе вводится величина X2, являющаяся мерой среднего отклонения отдельных наблюде­ний из выборки от среднего значения и, следовательно, служа­щая показателем качества измерений.

^ Метод наибольшего правдоподобия, рассмотренный в гл. 7, составляет ядро современного статистического анализа. Он по­зволяет строить оценки с оптимальными свойствами. Метод рас­смотрен для случаев одного и нескольких параметров и иллюст­рирован рядом примеров.

Глава 8 посвящена способам проверки гипотез. Она содержит наиболее часто используемые критерии Р, I и 1? и основные све­дения из теории.

В гл. 9 предметом обсуждения является метод наименьших квадратов — наиболее широко применяемый статистический метод. Сначала подробно рассмотрены частные случаи прямых и косвен­ных измерений, а также измерений со связями, которые часто встречаются на практике. Затем обсуждается общий случай. Для общей задачи о наименьших квадратах приведена программа на фОРТРАНе, и ее применение проиллюстрировано серией при­меров. Любую задачу о наименьших квадратах можно свести к задаче о нахождении минимума функции нескольких переменных. Это же верно и для оценивания параметров методом наибольшего правдоподобия. В гл. 10 кратко описаны несколько вычислитель­ных методов нахождения таких минимумов.

^ Дисперсионный анализ (гл. 11) можно рассматривать как обоб­щение ^-критерия. Он широко используется в биологии и меди­цине для изучения зависимости или, точнее, для проверки неза­висимости измеряемых величин от условий эксперимента, харак­теризуемых другими переменными. Для нескольких переменных возникают довольно сложные ситуации. С помощью программы на ФОРТРАНе посчитано несколько простых численных примеров.

Линейная регрессия, рассматриваемая в последней главе, пред­ставляет собой специальный случай метода наименьших квадратов и поэтому встречается уже в гл. 9. До появления вычислитель­ных машин обычно поддавались решению лишь линейные задачи наименьших квадратов. В линейной регрессии все еще исполь­зуется специальная терминология, что оправдывает выделение этого вопроса в отдельную главу. В то же время гл. 10 является развитием гл. 9. Так, например, определяются доверительные интервалы для решения и изучаются соотношения между регрес­сией и дисперсионным анализом.

^ ГЛАВА 2 ВЕРОЯТНОСТИ


2.1. ЭКСПЕРИМЕНТЫ, СОБЫТИЯ, ВЫБОРОЧНОЕ ПРОСТРАНСТВО

Так как эта книга посвящена анализу данных, получаемых из эксперимента, нам необходимо сначала выяснить, что пони­мается под экспериментом и его результатом. Аналогично лабо­раторному опыту мы определяем эксперимент как строгую по­следовательность заранее определенных действий, ведущих к получению одной или множества величин, представляющих ре­зультат эксперимента. Эти величины могут изменяться непрерыв­но (температура, длина, электрический ток) или дискретно (число частиц, день рождения человека, один из трех возможных цве­тов). Независимо от точности выполнения условий, при которых проводится эксперимент, результаты повторных экспериментов будут, вообще говоря, различны. Это вызывается либо внутрен­ней природой исследуемого явления, либо ограниченной точностью измерения. Следовательно, для каждой величины возможные ре­зультаты будут лежать в некоторой ограниченной области. Мно­жество этих областей для всех величин, составляющих резуль­тат эксперимента, образует выборочное пространство этого экспе­римента. Так как точное определение допустимых областей для всех величин, измеряемых в данном эксперименте, затруднительно и часто вообще невозможно, фактически пространство выборок берется несколько большим, содержащим истинное выборочное пространство в качестве подпространства. В дальнейшем мы будем пользоваться этим более широким определением выборочного про­странства.

Пример 2.1. При изготовлении сопротивлений важно выдер­жать заданные значения величин R (электрическое сопротивле­ние, измеряемое в омах) и N (максимальное рассеяние мощности, измеряемое в ваттах). Выборочным пространством для Rслужить координатная плоскость с осями R н N. Так как обе величины всегда положительны, то первый квадрант также является выборочным пространством.

Пример 2.2. На практике точные значения R и N несущест­венны, пока они находятся в заданных интервалах (например, 99 кОм < # < 101 кОм; 0,49 Вт < N < 0,60 Вт). В таких слу­чаях будем говорить, что сопротивление обладает свойствами

Rп, Nп. Если значение выходит за нижнюю или верхнюю гра­ницу интервала, то индекс п будем заменять соответственно на

— или +. Следовательно, возможные значения электрического сопротивления и рассеянной мощности будут соответственно R_, Rп, К+ и N_, Nп, N+. Выборочное пространство состоит в этом случае из 9 элементов:

RN, RNn, R---N,+,

Часто представляют интерес некоторые подпространства выбороч­ного пространства. Например, элемент пространства выборок RNNN из примера 2.2 соответствует случаю, когда сопротивле­ние полностью удовлетворяет техническим условиям. Обозначим такие подпространства А, В, ... и будем говорить, что если ре­зультат эксперимента попал внутрь какого-либо подпространства, то произошло соответствующее событие А (или В, С, .,,). Если событие А не произошло, мы будем говорить об осуществлении дополнительного события А (не А). Все выборочное простран­ство соответствует событию, которое осуществляется в каждом эксперименте. Обозначим его через Е, В конце этой главы мы определим, что понимается под вероятностью осуществления события.

^ 2.2. ПОНЯТИЕ ВЕРОЯТНОСТИ

Рассмотрим простейший эксперимент — бросание монеты. Как и подобные ему эксперименты с игральными костями и картами, он не представляет практического интереса, но весьма полезен для целей обучения. Какова вероятность того, что при первом бросании идеальной монеты выпадет «орел»? Интуиция подсказывает нам, что эта вероятность равна 1/2-, Мы исходим из того,что все точки выборочного пространства (здесь мы имеем только две точки: «орел» и «решка») равновероятны и событие Е (в дан­ном случае заключающееся в выпадании «орла» или «решки») на­ступает с вероятностью 1. Этот способ определения вероятности может быть применен лишь в случае абсолютно симметричных экспериментов и, следовательно, имеет очень малое практическое применение. (Однако он крайне важен в статистической физике и квантовой механике, где постулат о равных вероятностях всех допустимых состояний является основой весьма успешных теорий.) Если же абсолютная симметрия отсутствует — например, в случае обычной «физической» монеты, — то целесообразно посту­пить следующим образом. Пусть в большом числе экспериментов N событие А имело место раз. Определим вероятность появления события А как предел

Р(А)=LimN/n

14 N (2.1)

Гл. 2. Вероятности

N событие А имело место п раз. Определим вероятность появ­ления события А как предел

(2.1)

Это несколько неточное частотное определение вероятности удобно для практических целей, хотя оно и не является математически строгим. Одна из трудностей, возникающих при таком определе­нии, заключается в необходимости проведения бесконечного числа экспериментов, что, естественно, невозможно сделать и теорети­чески трудно объяснить. Хотя фактически в этой книге мы будем пользоваться частотным определением вероятности, хотелось бы привести основные понятия аксиоматической теории вероятности, принадлежащей Колмогорову [12]. Обычно используется следую­щий минимальный набор аксиом:

а) Каждому событию ^ А соответствует некоторое неотрицатель­ное число — его вероятность

Р(А)0

б) Событие Е имеет вероятность, равную единице:

Р(Е)=1

в) Если события ^ А и В несовместны, то вероятность наступ­ления события А или В, т. е. события + В), равна

Р (А + В) = Р (А) + Р (В). (2.4)

Из этих аксиом сразу получаются следующие полезные соотно­шения. Из (б) и (в)

Р (A + A) = Р (А) + Р (А) = 1; (2,5) кроме того, из (а) 0P(A)1

Из (в) можно легко получить более общую теорему для взаимно несовместных событий А, В, С, ...

р (А + В + С + • • •) = Р (А) + Р (В) + Р (С) + • • • (2.7)

Необходимо заметить, что единственным способом комбинирования событий является уже упоминавшееся исключающее «или». Любая другая комбинация должна быть получена с помощью этой логической операции. В эксперименте с бросанием играль­ной кости событие А может означать выпадание четного числа очков , В-нечетного числа очков , C-выпадение менее 4 очков или > очков. Заметим , что аксиомы не дают метода полученя конкретной вероятности P(A) .

Слово вероятность мы ипользуем повседневно . Мы имеем в виду субъективную вероятность т . е. Вероятность события .

^ Правила исчисления вероятностей ;

Условная вероятность


Пусть результат эксперимента обладает некоторым свойством Л. Вопрос: какова вероятность того, что эксперимент будет обладать также и свойством В, т. е. какова вероятность В при условии осуществления Л? Определим эту условную вероятность как

P(B|A)=P(AB) /P(A) (3.1) P(A)

Отсюда следует,

P(AB)=P(A)P(B|A). (3.2)

Из примера, показанного на рис. 2.1, видно, Рис. 2.1. Иллюстрация что такое определение разумно. Событие условной вероятности. (А или В) при этом осуществляется, если

точка лежит либо в области А, либо в В. Если точка лежит в области пересечения, то осуществляется событие АВ (А и В). Предположим, что площади различных областей пропорциональны вероятностям соответствующих событий. Тогда вероятность В при условии А равна отношению площадей АВ к А, т. е. равна 1, если А содержится в В, и 0, если области не пересекаются. Используя понятие условной вероятности, мы можем теперь сформулировать правило полной вероятности. Пусть некоторый

эксперимент приводит к одному из п взаимно несовместных событий

^ Е 1 2+…Аn (3,3)

Вероятность осуществления любого события В равна

Р(В)+n (3,4)

I=1

что может быть легко получено из выражений (3.2) и (2.7).

Теперь мы можем дать определение независимости событий. Будем говорить, что события А и В независимы, если осущест­вление А не влияет на вероятность год чеканки каждой появления В и наоборот, т. е, если

Р(В\А)=Р(В) (3.5)

или, используя выражение (3.2),

Р(АВ)=Р(А)Р(В),

Вообще несколько разбиений типа Е=А12+...Аn (3,3)

P(B)=i=1n P(Ai)P(B|Ai) (3.4)

P(B|A)=P(B) (3.5)

P(AB)=P(A)P(B). (3.6)

E=A1+A2+...An

E=B1+B2+...Bn ....

E=Z1+Z2+...Z1


независимы, если для всех возможных комбинаций а, b, ,,. ,w > выполняется условие

Р (Аа..Bb… Zw.) = P (A) P (Bb) ... P(Zw). (3.8)

ГЛАВА 3

^ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ; -РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

3.1. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

Мы не будем сейчас интересоваться вероятностями наблюде­ния каких-либо конкретных событий, а рассмотрим сами события и попробуем найти наиболее простой способ их классификации; поставим, например, в соответствие событию «орел» число О, а событию «решка» — число 1. В общем мы можем классифици­ровать события Ас из разбиения (3.3) гл. 2, поставив в соответст­вие каждому Л( его номер /. При таком способе классификации каждое событие можно характеризовать одним из возможных зна­чений случайной величины. Случайные величины могут быть дискретными и непрерывными. Будем обозначать их символами х, у, ... .

Пример 3.1. Интересно определить число монет, все еще находящихся в обращении, как функцию их возраста. Очевидно, что удобнее всего в качестве (дискретной) случайной величины использовать год чеканки каждой монеты, т. е. х = • • • , 1873, 1874, 1875, ... .

Пример 3.2. Все процессы измерения или производства под­вержены в большей или результатах. Поэтому названные результаты описываются одной или несколькими слу­чайными величинами. Так, величины электрического сопротивле­ния и максимума рассеянной мощности, характеризующие резистор, есть (непрерывные) случайные величины.

^ 3.2. РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Вернемся от классификации событий к рассмотрению вероят­ностей. Рассмотрим случайную величину х и действительное число х, принадлежащее интервалу (—со, + оо), и будем искать вероятность события (х < х). Эта вероятность является функцией от л: и называется функцией распределения вероятностей случай­ной величины х:

Р(х) = Р(г<х). (2.1)

18

Гл. 3. Случайные величины

3.3. Функции одной случайной величины

19

Если случайная величина х принимает лишь конечное число дискретных значений (например, число очков на гранях играль­ной кости), то функция распределения вероятностей этой случай­ной величины представляет собой ступенчатую функцию. Для рассмотренного выше примера функция распределения показана на рис. 3.1. Очевидно, любая функция распределения вероятнос­тей является монотонной и неубывающей.

Как видно из выражения (2.3) гл. 2, в пределе при х-+<х> получаем

1. (2.2) меньшей мере изменениям, или флуктуа-циям, что приводит к отклонениям в





360 х

360

х

Рис. 3.1. Функция распределен ния вероятностей для бросания идеально симметричной играль­ной кости.

О

Нх)

360 X

Рис. 3.2. Функция распределе­ния вероятностей и плотность вероятности для угла положения часовой стрелки.

Применяя (2.5) гл. 2 к (2.1), получим

Р(х > х) = 1 — Р (х) = 1 — Р(х < х)

(2-3)

и, следовательно,

Пт Р (х) = Пт Р (х < х) = 1 — Нт Р (х > х),

Нт/=*(*) = О, (2.4)

Х-*-— оо

Особый интерес представляют непрерывные и дифференцируемые функции распределения вероятностей. Первая производная


* )З.Брандт. Статистические методы анализа наблюдений. М.:Мир. 312с.




Скачать 156,72 Kb.
оставить комментарий
Дата02.10.2011
Размер156,72 Kb.
ТипКнига, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

Рейтинг@Mail.ru
наверх