Все о геологии :: на главную страницу! Геовикипедия 
wiki.web.ru 
Поиск  
  Rambler's Top100 Service
 Главная страница  Конференции: Календарь / Материалы  Каталог ссылок    Словарь       Форумы        В помощь студенту     Последние поступления
   Геология >> Геохимические науки >> Петрология | Курсы лекций
 Обсудить в форуме  Добавить новое сообщение

ЭКСПЕРИМЕНТАЛЬНАЯ И ТЕХНИЧЕСКАЯ ПЕТРОЛОГИЯ

Авторы: Е.Н.Граменицкий, А.Р.Котельников, А.М.Батанова, Т.И.Щекина, П.Ю.Плечов

Лаборатория эспериментальной и технической петрологии МГУ,
к. A-607, тел. 939-20-40

назад | содержание | вперед
Экспериментальная и техническая петрология. - М.: Научный Мир, 2000. - 416 с.

V-2-2. Применение методов математической статистики.

При обработке результатов физических измерений или химических анализов большое значение имеет анализ содержащихся в них различного рода ошибок. Для научно - исследовательских работ по экспериментальной петрологии характерен небольшой объем параллельных измерений, из - за чего затрудняется их статистическая обработка. Иногда она заменяется общим анализом всего хода эксперимента. Петролог - экспериментатор часто имеет дело с результатами комплексных измерений, каждое из которых имеет свои ошибки. Знание методов математической статистики поможет ему выявлять закономерности, зависимости, "отстраиваться от мешающих шумов". Эти методы позволяют грамотно оценивать результаты своей работы, определять "степень доверия" полученным данным. Авторы считают необходимым привести схему и примеры статистической обработки, наиболее полно отвечающей специфике экспериментальных работ по петрологии. Необходимые математические основы и приемы просты, не требуют от экспериментатора специальной подготовки. Для проведения анализа данных не нужно применения сложной вычислительной техники - достаточно калькулятора. Этот анализ не занимает много времени и его желательно проводить при обработке каждой серии экспериментальных данных. Итак, напомним основные понятия и правила математической статистики.

Запись чисел. Правила округления. Результаты любого эксперимента выражаются цифрами. Запись должна быть подчинена определенным правилам, произвол в этом деле недопустим. В этом смысле говорят о правильной и неправильной записи результатов. Следует иметь в виду, что неправильная запись может значительно обесценивать результаты даже блестящей экспериментальной работы, поэтому вопрос этот более серьезен, чем может показаться. Общее правило записи таково: она должна содержать только значащие цифры. Значащими считаются все цифры, кроме нулей в начале десятичной дроби (слева от запятой) и нулей в конце числа, если они поставлены вместо неизвестных цифр.

Рассмотрим пример. В качестве условий проведения опыта указано Р = 30 000 бар. Если все эти цифры значащие, то нули обозначают отсутствие единиц соответствующих разрядов, другими словами, мы ручаемся за то, что точность нашего измерения давления не хуже ± 1 бар. На самом деле это далеко не так: точность ниже на три порядка. Поэтому приведенная запись неверна, она создает совершенно ложное представление о точности эксперимента. Правильной записью будет 30 x 103 бар или 30 кбар. В такой записи только две значащие цифры, и последняя из них соответствует реальной точности эксперимента.Другой пример. В результате серии измерений определена плотность = 13.60 г / cм 3. В этой записи 4 значащие цифры, т.е. плотность измерена с точностью до единицы во втором знаке после запятой - до ± 0.01 г/ cм3 . Если бы реальная точность составляла только ± 0.1 г/см3, правильной записью было бы 13.6 г/см3. Пусть, однако, при реальной точности ± 0.01 г / см3 шкала измерительного прибора позволяет получать значение в следующем разряде (тысячные доли г/см3). Как поступить с этими значениями? Очевидно, что просто отбросить их было бы неверно, ибо значения, например, 13.615 и 13.605 г/см3 заметно отличаются. Такие цифры (в данном случае 0.00n г/см3) называются сомнительными; это значит, что n может принимать любое значение в пределах от 1 до 10. При записи результатов можно поступать двояко: а) отбрасывать все сомнительные цифры, б) оставлять последней сомнительную цифру ("принцип А.Н. Крылова"). Например, число 1.9931 ( 0.0031 - сомнительные цифры) записывается в первом варианте как 1.99, а во втором - 1.993 ( сохраняя последнюю сомнительную цифру 3).

В приведенных примерах мы провели округление результата. Округлением числа называется уменьшение числа значащих цифр. Правила округления сводятся к следующему:

- если отбрасывается цифра меньше 5, то предпоследняя цифра оставляется без изменения: 1.9932 1.993;

- если отбрасывается цифра больше 5, то предпоследняя цифра увеличивается на единицу: 1.9937 1.994;

- если отбрасывается цифра 5, то предпоследняя цифра должна остаться или стать четной: 1.9935 1.994.

Запись надо вести так, чтобы все значащие цифры были верны, и лишь последняя была бы сомнительной:

не Д = 1.4231 ± 0.005, а 1.413 ± 0.005,

не Р = 38.742 ± 0.04 , а 38.74 ± 0.04.

Виды ошибок измерений. Все ошибки измерений подразделяются на:

- систематические ошибки - величина их одинакова во всех видах однотипных измерений, проведенных одинаковым способом;

- случайные - их величина различна даже для измерений, проведенных одинаковым способом; случайные ошибки обязаны своим происхождением ряду причин, действие которых неодинаково в каждом опыте и не может быть учтено;

- промахи (грубые ошибки); чаще всего источник этого вида ошибок - недостаток внимания экспериментатора (например, неправильный отсчет по шкале прибора, неправильная запись результата и т.п.).

Величину ошибки в ряде случаев удобно оценивать не в абсолютной величине, а в относительной, в процентах. Так, если Х абсолютная ошибка величины Х, то относительная ошибка равна отн=( Х/Х)* 100 %

Систематическая ошибка, как правило, имеет одну и ту же размерность с измеряемой величиной и по знаку постоянна, т.е. имеет отклонение от измеряемой величины либо в большую, либо в меньшую сторону.

Систематические ошибки можно подразделить на следующие группы.

1. Ошибки, природа которых нам известна и величина которых может быть достаточно точно определена. Такие ошибки могут быть исключены введением соответствующих поправок. К ошибкам такого рода можно отнести "дрейф" рентгеновского дифрактометра: для каждой серии замеров можно ввести поправку, введя так называемый "стандарт" - вещество, для которого точно известны положения пиков на дифрактограммах. Определив поправки, можно проводить дальнейшие измерения, не вводя стандарт в исследуемый образец.

2. Другой вид систематических ошибок - это ошибки известного происхождения, но неизвестной величины. К их числу относятся погрешности измерительных приборов. Если на приборе указан класс точности 0.5, то это означает, что показания прибора верны с точностью до 0.5% от всей действующей шкалы прибора. Систематической ошибкой такого типа будет погрешность в определении давления манометром (класс 0.5), рассчитанного на измерение давления 4000 атм. Это значит, что давление мы измеряем с точностью 0.5% от всей шкалы, т.е. 20 атм. Систематические ошибки этого типа не могут быть исключены, но их наибольшее значение, как правило, известно. Если, измеряя давление, мы получили значение 2000 атм, то можем написать Р= 2000± 20. Здесь ± 20 означает, что давление лежит в пределах от 1980 до 2020.

3. Третий вид систематических ошибок - самый опасный, это ошибки, о существовании которых мы не подозреваем, хотя величина их может быть очень значительна. Они чаще всего появляются при сложных измерениях. Иногда бывает, что величина, которая измерена, как нам кажется, с точностью 2 - 3%, оказывается в 2 - 3 раза больше или меньше найденной величины. Например, измеряя скорость диффузии какого - либо элемента в твердой фазе, мы можем не учесть, что в данном образце существует сеть дислокаций, за счет которых скорость диффузии увеличится в несколько раз. Распознать такую ошибку будет трудно, т. к. повторные замеры распределения компонентов на микроанализаторах будут давать одну и ту же картину, а краевые зоны разных образцов будут иметь одну и ту же высокую плотность дислокаций. Такая ошибка может быть выявлена только при тщательной проверке всех этапов эксперимента, используя разные методики приготовления образцов и т. п.

Таким образом, при проведении эксперимента необходимо тщательно проанализировать все возможные источники систематических ошибок и исключить их (если это возможно).

Разделение систематических и случайных ошибок до некоторой степени условно. Можно предвидеть ситуацию, в которой систематическая ошибка неизвестного происхождения будет трудно выявляться и не учитываться. В то же время источниками случайных ошибок могут быть неконтролируемые изменения параметров эксперимента в сложной системе: изменения внешней (по отношению к изучаемой системе) среды (Т, Р, f(O)2, pH и т.д.), неоднородность материала исходной навески. Фактически, если эти изменения происходят достаточно быстро, то они должны рассматриваться как фактор, способствующий появлению случайных ошибок опытов.

Случайные ошибки неустранимы из опытных данных, но они могут быть выявлены и количественно оценены при математической обработке экспериментальных данных, в чем и заключается основная цель статистического анализа.

Интересно рассмотреть соотношения величин систематических и случайных ошибок. Возможны два случая. 1) Величина систематической ошибки больше величины случайной. В этом случае, проводя серию опытов, мы будем получать постоянные значения какой - либо величины; подобный вариант встречается сравнительно редко и чаще всего связан с недостаточной чувствительностью измерительного прибора. 2) Случайные ошибки больше систематических. Ясно, что для повышения точности измерений в первом случае надо уменьшать величину систематической ошибки (повысить чувствительность прибора) до тех пор, пока она не станет меньше случайной ошибки. Во втором - необходимо уменьшить величину случайной ошибки, это можно сделать, увеличивая количество измерений. В работе петролога - экспериментатора чаще всего встречается вторая ситуация, и повысить точность измерений можно, только увеличивая их число. Это не всегда возможно из соображений времени, экономики и т.д. В этом случае мы можем только приближенно оценить нижний предел возможной ошибки по так называемым приборным ошибкам; реальная величина ошибки может быть значительно выше.

При хорошо отлаженной методике мы имеем дело со случайными ошибками, величины которых больше систематических. Таким образом, проводя неоднократные замеры, мы получаем набор значений измеряемой величины. Какое же из этих полученных значений мы должны считать наиболее близким к истинному? За наиболее вероятное значение измеряемой величины следует принять ее среднее арифметическое значение, вычисленное из всего ряда измеренных значений по формуле:

Положение о наибольшей вероятности среднеарифметической величины справедливо, если выполняется так называемый нормальный закон распространения случайных ошибок (для большинства простых измерений он выполняется достаточно хорошо, и мы будем пользоваться нормальным распределением).

Нормальное распределение. Параметры нормального распределения. Нормальное распределение (закон Гаусса) обладает следующими свойствами:

1) Ошибки расположены в определенном интервале (относительно истинного значения величины) и могут принимать непрерывный ряд значений.

2) Большие (по абсолютной величине) ошибки встречаются реже, чем меньшие, т.е. вероятность появления ошибки уменьшается с ростом ее абсолютной величины.

3) При достаточно большом числе измерений случайные ошибки одинаковой величины, но разного знака встречаются одинаково часто. Закон распределения ошибок, основанный на этих трех свойствах, описывается следующей функцией (формулой Гаусса):

где Y - частота появления ошибки определенной величины, - дисперсия. Формула Гаусса подвергалась неоднократным экспериментальным проверкам, и было показано, что совпадение частот рассчитанных и наблюдаемых ошибок хорошее. Все приводимые в данной главе формулы основаны на законе Гаусса.

Для оценки величины случайной ошибки измерения чаще всего используют среднеквадратическое отклонение, среднеквадратическую ошибку. Среднеквадратической ошибкой называется величина:

.

При увеличении числа замеров величина стремится к некоторому пределу, квадрат которого называется дисперсией и является одной из основных численных характеристик распределения.

Другая важная характеристика распределения - среднее арифметическое. Одна из задач статистической обработки материала заключается в численном определении среднего и дисперсии. При обработке экспериментальных данных систему наблюдений над некоторой случайной величиной (результаты измерений распределяются по закону нормального распределения случайных величин) принято рассматривать как случайную выборку из некоторой гипотетической генеральной совокупности, которая представляет собой совокупность всех мыслимых наблюдений над случайной величиной при данных условиях эксперимента. Задача статистического анализа состоит в том, чтобы оценить параметры генеральной совокупности по результатам данной случайной выборки с учетом того элемента неопределенности, который вносится ограниченностью экспериментального материала. В математической статистике принято разделять выборочные параметры и параметры генеральной совокупности. Параметрам генеральной совокупности соответствуют следующие выборочные параметры ( табл. 24).

Т а б л и ц а 24. Соответствие параметров генеральной совокупности и выборочных параметров.

Генеральная

совокупность

Выборка

X

SX

2

SX2

Параметры выборки X, Sx, S2x при увеличении объема выборки (n беск. ) приближаются к параметрам генеральной совокупности: lim X = , lim Sx = , lim Sx2 = 2, где - математическое ожидание (среднее арифметическое, генеральное среднее), - генеральное среднеквадратическое отклонение (стандартное отклонение, стандарт), 2 - генеральная дисперсия (теоретическая дисперсия). Этим основным параметрам генеральной совокупности соответствуют выборочные параметры: Х - выборочное среднее (среднее выборки), Sx - среднеквадратическая ошибка выборки, Sx2 - выборочная дисперсия.

Следует отметить, что объем генеральной совокупности может быть ограничен каким - то большим, но конечным числом.

Практически мы всегда имеем дело с выборками. Выборкой может быть определенное число реальных объектов (зерен минерала, образцов пород, шлифов) или измерений, наблюдений. Количество объектов выборки обозначают n. Как уже упоминалось, цель статистической обработки - оценка параметров генеральной совокупности по данным выборки. Эти n объектов выборки подвергаются детальному изучению, по результатам которого рассчитывают характеристики (выборочные параметры); они являются приближенной оценкой истинных характеристик всей реальной совокупности объектов (всей генеральной совокупности).

Примеры. 1. На микрозонде измерен состав минерала в 5 - 10 зернах. Полученные величины будут выборкой; они отражают состав минерала во всей навеске (генеральной совокупности).

2. Определение состава двух сосуществующих минералов (выборка) позволяет определить Т - Р параметры образования данной породы (генеральной совокупности).

3. Количество фазы, определенное в поле зрения шлифа (выборка), принимается соответствующим содержанию ее во всем образце, во всей породе (генеральная совокупность).

Связь параметров - среднего арифметического, среднеквадратической ошибки, доверительных интервалов - показаны графически на рис. 154. S - среднеквадратическое отклонение - определяет ширину кривой распределения; величина S увеличивается от 0.015 до 0.06 (сверху вниз по рядам); d - доверительный интервал в абсолютных единицах ( ). Расстояние между двумя вертикальными линиями соответствует максимально допустимому отклонению переменной величины. Для левого вертикального столбца его абсолютная величина 0.03 ± 0.015, для среднего - 0.06 ± 0.03, для правого - 0.12 ± 0.06. Z - доверительный интервал в долях S изменяется на графиках от ± 1/4 для нижней левой кривой до ± 4 для верхней правой кривой; - доверительная вероятность (степень надежности, коэффициент надежности ) - доля площади, ограниченная кривой распределения и пределами доверительного интервала. Доверительная вероятность - вероятность попадания переменной величины в заданный доверительный интервал. Доверительная вероятность возрастает при увеличении доверительного интервала и уменьшается с возрастанием среднеквадратического отклонения. p - уровень значимости - доля площади, ограниченная кривой распределения за пределами доверительного интервала p = 1 - . Уровень значимости равен вероятности непопадания переменной величины в заданный доверительный интервал или равен вероятности отклонения от принятых пределов

Значимыми ( важными ) могут быть отклонения в обе стороны от доверительного интервала, это соответствует недопустимости как положительных, так и отрицательных отклонений и называется двусторонним критерием. В других случаях существенны отклонения только одного знака; это соответствует одностороннему критерию значимости, и его величина при этом уменьшается.

Процесс статистической обработки начинается с исследования единичных результатов, из их совокупности оцениваются параметры, характеризующие выборку.

Объем выборки. Реальный объем выборки при экспериментальных исследованиях зависит от задачи исследований. В табл. 25 приводятся возможные количества параллельных определений для некоторых распространенных типов экспериментов.

Таблица 25. Возможности статистической обработки результатов экспериментов.

Тип эксперименталь- ного исследования

Числовые характеристики, получаемые в опытах

Возможности парал-

лельных определений

Использование стати-

стических методов

1. Изучение моновари- антных равновесий с минералами постоян-

ного состава, изучение плавления.

Наличие или отсут-ствие минерала, стекла, пиков на дифрактограммах, рентгеновская интенсивность.

Не проводится вслед-

ствие длительности

опытов и экономичес-

ких соображений. В ответственных случа-

ях возможны 2 - 3 па-

раллельных опреде-ления (ампулы с параллельными опытами в одном реакторе, повторение опытов)

Точность результатов

определяется классом точности прибора. Статистическая обработка не проводится. Лишь в особо ответственных опытах выполняется минимальный объем параллельных опре-делений (2 - 3)

2. Изучение свойств

флюидов

Определение состава смеси газов в зависи

мости от Р,V,T.

Определение давле

ния как функции T,V,

состава смеси.

- " -

- " -

3. Изучение равнове-

сий минералов пере

менного состава, про

цессов упорядочения твердых растворов.

Химический состав фаз, положение пиков

на дифрактограмме.

Определение состава

фаз по многим зернам, параллель-ные химические определения, перенабивка кювет для дифрактометра и т.д.

Возможно проведение статистической обработки.

4. Измерения в проце-ссе опытов спектров,

электропроводности, летучести кислорода (на электрохимичес-ких ячейках) и др.

Длины волн, электро-

сопротивление, э.д.с. и др.

Многократные замеры легко осуществимы.

Статистическая обра-

ботка необходима; ва-

жен вопрос об опти-

мальном объеме вы-

борки.

Для первых двух (табл. 25) случаев (n < 3) говорить о статистической обработке результатов отдельного опыта не приходится, так как фактически мы не можем рассчитать ни одного параметра. В этом случае точность работы оценивается только по приборным ошибкам:

где R = f ( X1, X2, . . . , Xn); Х1 . . . Хn - параметры измеряемые в опыте (например, T, P, fO2 и др. ), R - функция от параметров Х1 . . . Хn ( например, координаты точки равновесия реакции); Х1, Х2, . . . Хn - ошибки в оценке параметров Х1 . . . Хn.

Минимальный объем выборки n = 3. Для самых ответственных определений этот минимум нужно выполнить. В группах экспериментов 3 и 4 (см. табл. 25) практически необходимо оценить число замеров (объектов), которые надо взять из генеральной совокупности, чтобы характеризовать ее достаточно полно. Например: сколько зерен в препарате для микрозондового анализа необходимо изучить? Обычно в таблетке содержится 50 - 100 зерен минералов. Все их проанализировать бывает невозможно. В то же время ясно, что чем больше объем выборки (количество изученных зерен), тем более точную оценку параметров генеральной совокупности мы получим. Надо представлять, что минимальный объем выборки зависит также от характеристик рассеяния генеральной совокупности - гомогенности навески по составу, зональности зерен и т.д. Зачастую до анализа эти характеристики нам неизвестны. Поэтому минимальный объем выборки определяется для каждого конкретного объекта. Так, для изучения равновесия плагиоклаз - раствор достаточно проанализировать 5 - 10 зерен, для равновесия гранат - кордиерит - 20 - 50 зерен ( двух минералов). Таким образом, объем выборки должен быть не меньше 5 - 10; только в отдельных случаях ( трудность анализа, очень малое количество фазы) можно ограничиться n = 3.

Выборку необходимо не только выбрать, но и оценить, насколько надежно распространение ее параметров на генеральную совокупность и какова вероятность существенного различия между ними, т.е. вычислить ее параметры. Последовательность вычислений следующая:

1. Исключить известные систематические ошибки ( введением поправок).

2. Исключить " анормальные " результаты ( промахи). 3. Вычислить среднеарифметическое исправленных результатов (эта величина и будет считаться наиболее достоверным результатом измерений).

4. Вычислить среднеквадратическую ошибку результатов измерений.5. Оценить доверительные интервалы (погрешности) результатов измерений.

Среднее арифметическое. Среднеквадратическое отклонение. Среднее арифметическое выборки - выборочное среднее - лучшая оценка генерального среднего. Поэтому при измерении какой-либо величины за результат принимается среднеарифметическое результатов отдельных замеров (после исключения систематических ошибок). Среднее из определений (замеров) обозначается как n:

.

Среднеквадратическое отклонение результатов измерения Sx - наиболее обоснованная и распространенная мера случайных погрешностей. В случае, когда имеется n единичных измерений величины Х, среднеквадратическое отклонение рассчитывается по формуле:

или

,

где n - объем выборки (число замеров), Sx - среднеквадратическое отклонение, Х1, Х2,.....Хn - результаты замеров, n - выборочное среднее. Последняя формула более удобна при расчетах на калькуляторах. При вычислениях по этим двум формулам возведение в квадрат должно выполняться без округления результатов (причем точность резко уменьшается при малых n). Величина Sx называется среднеквадратичной погрешностью результатов отдельного измерения. Она имеет ту же размерность, что и переменная Х. Относительная точность расчета Sx от 50 до 100 относительных %, поэтому для Sx записываются 1 - 2 значащие цифры.

Величина среднеквадратического отклонения выборки S при больших n (~ 100) может быть довольно близка к среднеквадратическому отклонению генеральной совокупности . При малых n значения S могут сильно отличаться от "истинного значения" . Поэтому желательно оценивать доверительные интервалы по следующей схеме.

  • Рассчитывают среднеквадратическое отклонение Sx по приведенным формулам.
  • Задают необходимую доверительную вероятность . Обычно = 0.95.
  • Доверительная вероятность измерений должна задаваться самим экспериментатором. Эта величина, определяющая надежность результатов. Чем более ответственны результаты, тем более высокую доверительную вероятность надо принимать. Для технических и аналитических определений ( например состав фаз, параметров элементарной ячейки и других очень точных измерений) обычно принимается доверительная вероятность 0.95. Для важных измерений ( на которых базируется новый закон, новое положение или от которых зависит безопасность людей) = 0.99.

    3.По таблице 26 для принятой и n находят доверительные границы отклонения величины Sx (в долях Sx ) 1 и 2 .

    Таблица 26. Коэффициенты 1 и 2 для оценки доверительных интервалов ошибок расчета среднеквадратического отклонения.

     

    = 0.95

    = 0.90

    n

    1

    2

    1

    2

    2

    3

    4

    5

    6

    7

    8

    9

    10

    12

    14

    16

    18

    20

    25

    30

    50

    100

    200

    0.42

    0.52

    0.57

    0.60

    0.62

    0.64

    0.66

    0.68

    0.69

    0.71

    0.73

    0.74

    0.75

    0.76

    0.78

    0.80

    0.84

    0.88

    0.91

    32

    6.3

    3.7

    2.9

    2.5

    2.2

    2.0

    1.9

    1.8

    1.7

    1.6

    1.5

    1.5

    1.5

    1.4

    1.3

    1.2

    1.2

    1.1

    0.51

    0.58

    0.62

    0.65

    0.67

    0.69

    0.70

    0.72

    0.73

    0.75

    0.76

    0.77

    0.79

    0.79

    0.81

    0.83

    0.86

    0.90

    0.93

    16

    4.4

    2.9

    2.4

    2.1

    1.9

    1.8

    1.7

    1.6

    1.5

    1.5

    1.4

    1.4

    1.4

    1.3

    1.3

    1.2

    1.1

    1.1

    4. Находят доверительные границы отклонения Sx:

    Sмин = SX 1,

    Sмакс= SX 2,

    Полученные значения Sмин и Sмакс означают, что с вероятностью величина Sx лежит между ними. С учетом доверительных интервалов Sx далее рассчитываются доверительные интервалы погрешности измерения.

    Рассмотрим пример. Sx = 0.03, n = 3. Оценим границы доверительных интервалов.

    1. Принимаем =0.95.

    2. По табл. 6 для =0.95 и n = 3 находим 1 = 0.52, 2 = 6.3.

    3. Sмин = 0.52 0.03 = 0.015, Sмакс=0.19. Так, с вероятностью 0.95 Sx может находиться в интервале от 0.015 до 0.19.

    Следует помнить, что величина среднеквадратического отклонения выборки сама по себе хотя и несет некоторую информацию о параметрах выборки, но не является достаточной характеристикой. Об этом нельзя забывать и считать статистическую обработку законченной.

    Пример. При определении состава синтезированного в опыте плагиоклаза получили путем замеров на микрозонде 10 значений ХPlAn: 0.30,0.31, 0.28, 0.29, 0.32, 0.31, 0.27, 0.29, 0.29, 0.30. Необходимо определить среднее арифметическое и среднеквадратическую ошибку (Sx) и доверительные интервалы для Sx.

    1. Обозначим ХPlAn за Х, Х1=0.3, Х2= 0.31, ........, Х10= 0.30.

    2. Вычислим среднее

    3. Вычислим Sx

    4. Оценим границы доверительного интервала для Sx (n = 10, задаем = 0.95), по табл. 6 находим ( для n = 10 и = 0.95 ) величины 1 и 2 : 1 = 0.69, 2 =1.8, Sмин=0.02 0.69 = 0.014 @ 0.01, Sмакс=0.02 1.8 = 0.036@ 0.04.

    5. Среднее значение ХPlAn= 0.30; среднеквадратическая ошибка Sx= 0.02.

    6. С вероятностью 0.95 0.04 Sx 0.01

    Коэффициентом вариации результатов наблюдений (измерений) является относительная величина среднеквадратического отклонения:

    Vx = [Sx /n] 100%.

    Коэффициент вариации позволяет сравнивать влияние случайных погрешностей на результат измерения в разных сериях или проводимых различными методами.

    Исключение выпадающих (анормальных) результатов измерений.

    Очень часто при замерах (определениях) какой-либо величины возникают сомнения: надо ли отбрасывать результаты замера, несколько отличающихся от всех, какова значимость такого отклонения. Может быть два варианта существования "анормальных" замеров.

    1. Замер принадлежит к той же генеральной совокупности, но вероятность его появления мала. В этом случае его исключать нельзя, и расчеты среднего арифметического и среднеквадратического отклонения необходимо проводить с учетом этого замера.

    2. Отклоняющийся результат - следствие ошибки в записи (промаха) и не подчиняется случайным законам отклонения от генерального среднего. В этом случае его надо отбросить.

    Решение задачи об отбрасывании какого-либо значения надо проводить с большой осторожностью, предварительно проанализировав условия, в которых он получен. Может быть удастся оценить достоверность этого результата и без вероятностного подхода. В противном случае нужно воспользоваться следующими методами.

    1. Среди n результатов находят Хмин и Хмакс, которые подлежат проверке.

    2. Подсчитывают среднее данной выборки:

    3. Подсчитывают выборочное среднеквадратическое отклонение: .

    4. Находят следующие отношения:

    .

    5.Принимают необходимый уровень надежности (для наших целей =0.95).

    6. Находят величину по табл. 27 при принятом значении и выборке объема n.

    7. Uмакс и Uмин, полученные в п. 4, сравнивают с величиной по п. 6 . Если Uмакс , то проверяемый результат может быть исключен.

    Пример. При определении состава синтетического санидина получены следующие содержания К2О в минерале: 13,1; 12,9; 13,3; 14,1 весовых процентов.

    1. Сомнительное значение 14,1.

    2.

    3.

    4.

    5. Принимаем = 0.95.

    6. Для = 0.95 и n =4 = 1.46 (по табл. 27). U< (1.4<1.46), результат 14.1 не может быть исключен.

    Другой пример. Было получено 5 значений рН для равновесия минерал - раствор: 4.3, 4.2, 4.3, 4.1, 5.3

    1. Необходимо проверить 5.3 .

    2.` Х=4.4 .

    3.

    4.

    5. Принимаем = 0.95.

    6. По табл. 27 = 1.67 (n = 5, = 0.95).

    7. U> , результат 5.3 можно исключить.

    Таблица 27. Коэффициенты для различных значений доверительной вероятности.

    Доверительный интервал

    n

    0.90

    0.95

    0.99

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    18

    20

    1.15

    1.42

    1.60

    1.73

    1.83

    1.91

    1.98

    2.03

    2.09

    2.13

    2.17

    2.21

    2.25

    2.28

    2.34

    2.38

    1.15

    1.46

    1.67

    1.82

    1.94

    2.03

    2.11

    2.18

    2.23

    2.29

    2.33

    2.37

    2.41

    2.44

    2.50

    2.56

    1.15

    1.48

    1.72

    1.89

    2.02

    2.13

    2.21

    2.29

    2.36

    2.41

    2.47

    2.50

    2.55

    2.58

    2.66

    2.71

     

    Оценка границ доверительного интервала величины ошибки для малых выборок. Ошибка анализа определяется по формуле

    где Sx - среднеквадратическое отклонение, tn - специальный коэффициент для оценки погрешности при малых n (20) ( коэффициент Стьюдента).

    Стьюдент - псевдоним английского химика В.Госсета, предложившего в 1908 г. применять коэффициент tn.

    Фактически tn применяется вместо Z при n<10. При n стремящемся к бесконечности распределение Стьюдента совпадает с нормальным распределением с единичной дисперсией: tn значения коэффициентов приведены в табл. 28

    Таблица 28. Значения коэффициентов Стьюдента tn (для двусторонней проверки).

     

    Доверительная вероятность

    n

    0.3

    0.5

    0.8

    0.9

    0.95

    0.99

    0.999

    2

    3

    4

    5

    6

    7

    8

    9

    10

    12

    14

    16

    20

    30

    ¥

    0.51

    0.45

    0.42

    0.41

    0.41

    0.40

    0.40

    0.40

    0.40

    0.40

    0.39

    0.39

    0.39

    0.39

    0.39

    1.00

    0.82

    0.77

    0.74

    0.73

    0.72

    0.71

    0.71

    0.70

    0.70

    0.69

    0.69

    0.69

    0.68

    0.67

    3.1

    1.9

    1.6

    1.5

    1.5

    1.4

    1.4

    1.4

    1.4

    1.4

    1.4

    1.4

    1.3

    1.3

    1.3

    6.3

    2.9

    2.4

    2.1

    2.0

    1.9

    1.9

    1.9

    1.8

    1.8

    1.8

    1.8

    1.7

    1.7

    1.6

    12.7(6.3)*

    4.3(2.9)

    3.2( 2.4)

    2.8( 2.1)

    2.6( 2.0)

    2.4(1.9)

    2.4(1.9)

    2.3(1.9)

    2.3(1.8)

    2.2(1.8)

    2.2(1.8)

    2.2(1.8)

    2.1(1.7)

    2.0(1.7)

    2.0(1.6)

    63.7

    9.9

    5.8

    4.6

    4.0

    3.7

    3.5

    3.4

    3.3

    3.1

    3.0

    2.9

    2.9

    2.8

    2.6

    636.6

    31.6

    12.9

    8.6

    6.9

    6.0

    5.4

    5.0

    4.8

    4.3

    4.2

    4.0

    3.9

    3.7

    3.3

    *В скобках даны величины tn для = 0.95 при односторонней проверке. Проверка называется двусторонней или односторонней в зависимости от того, как оценивать ошибки величины Х - по обе стороны среднего значения (± ) или по одну сторону от среднего соответственно.

    Рассмотрим еще пример. При измерении плотности минерала получен ряд следующих значений (n=5): 2.75, 2.78, 2.76, 2.77, 2.76. Определить среднее значение и границы доверительного интервала при вероятности = 0.95.

    1. Вычислим

    2. Вычислим SX

    3. По табл. 27 находим: для = 0.95 и n= 5 tn = 2.78.

    4. Находим , если n<20, то = tnSx .

    5. Итак, плотность минерала = 2.76± 0.07, т.е. вероятность отклонения в замерах за интервал ± 0.07 - 5%.

    Расчеты точности методики и ошибок комплексных измерений.

    Лучшей мерой, характеризующей точность метода, является коэффициент вариации . Для определения Vx какой-либо методики используют, как правило, большое количество измерений n> 20. В ряде случаев сделать это как правило затруднительно. Поэтому прибегают к приближенной оценке коэффициента вариации на основании оценок вероятностных погрешностей исходных величин, используемых в расчете. Следует учесть, что полученные таким образом значения Sx ,Vx , весьма приближенные и требуют уточнения экспериментальным путем. Если результат определения R есть функция независимых друг от друга исходных величин X, Y, Z [R = F(X,Y,Z)], то квадратическое отклонение единичного определения SR вычисляют по формулам:

    где ... - частные производные функции R от переменных X, Y, Z ...; SX, SY, SZ - квадратичные отклонения единичных замеров исходных величин X, Y, Z ...; X, Y, Z - погрешность исходных величин X, Y, Z . Расчет точности комплексных измерений проводится по той же формуле, что расчет приборной ошибки.

    Порядок вычислений:

  • Записывают формулу, вид функций R= f (X, Y, Z).
  • Путем дифференцирования R по X, Y, Z находят формулы для расчета SR, R.
  • Принимают необходимый уровень значимости ().
  • Рассчитывают SR, R
  • Так, например, по формуле 6 таблицы 29 рассчитывают коэффициенты разделения , а по формуле 7 - коэффициент распределения и т. д.

    Пример. При микрозондовом анализе плагиоклаза получены значения содержания Na2O - 5.2%, CaO - 8.3%. Известно, что коэффициенты вариации при определении Na2O и CaO составляют соответственно 4 и 2%.

    Рассчитать мольную долю Са в плагиоклазе, среднеквадратическую ошибку и доверительные интервалы ( = 0.95). Количество проанализированных зерен (n=3).

    1. Рассчитывают атомные количества Na и Ca:

    Ат .к. Na = 5.2 2/ 30.99 =0.34; Ат. к. Са = 8.3/58.08 = 0.15.

    2. Вычисляют SNa и Sca:

    SNa = VNa (0.34/100)=(4 0.34)/ 100 = 0.013,

    SCa = Vca (0.15/100)= (2 0.15)/100 = 0.003.

    3. Записывают общую формулу для вычисления ХСаPl

    Ат. к. Са / (Ат. к.Са + Ат. к. Na) = 0.15 / (0/34+0.15) = 0.31.

    4. Находят доверительные интервалы (погрешности в определении Na и Са):

    а) по табл. 28 для n=3 и = 0.95 находят tn =4.3,

    б) по формуле Na= tanSNa / n находят Na и Ca :

    Na = (4.3 0.013)/ 3= 0.03;

    Ca= (4.3 0.003)/ 3= 0.01.

    5. По формуле 7 табл. 29 находят значения xCaPl :

    6. Определяют величину :

  • Итак, ХСаPl = 0.31 ± 0.03.
  • Таблица 29.

    Приближенное определение погрешностей (ошибок расчета) функций нескольких переменных.

    Вид функции

    R=f( X,Y,Z)

    Абсолютная погрешность

    ( )

    Относительная погрешность ,

    Q = / R

    1

     

    2

     

     

    3

     

    4

     

    5

     

    6

     

    7

     

    8

    A X + B X

     

    A X - B X

     

     

    AX+BY+
    CZ

     

    X Y

     

    XY Z

     

    X / Y

     

    X / X + Y

     

    XY + Z

     

     

     

    Сравнение двух выборочных средних при известных параметрах двух выборок. В практике петрологического эксперимента часто возникает вопрос о значимости различий двух (двух или больше) серий замеров. Например, изменился ли состав минерала в результате опыта (произошло ли смещение реакции) или нет? Для этого необходимо выполнить статистический анализ.

    Ход анализа. Гипотеза: средние значения обеих серий замеров совпадают, т.е. в пределах точности различия нет.

    1. Устанавливают объем выборок n1 и n2.

    2. Вычисляют S1 и S2 для обеих выборок. Вычисляют S1,2:

    3. Вычисляют

    4. Принимают доверительную вероятность (= 0.95).

    5. Определяют, какую проверку надо произвести (скорее всего, двустороннюю).

    6. По значению и n находим табличное значение tn (cм. табл. 28). При этом надо учесть, что по таблице n=n1+n2-1.

    7. Сравнивают абсолютную величину tpn c tn:

    а) если tpn > tn, гипотеза отбрасывается, т.е. результаты статистически значимы.

    б) если tpn tn , гипотеза принимается, т.е. разница величин статистически не значима.

    Рассмотрим пример. В ходе реакции мольная доля Mg в гранате изменилась от ХGrMg = 0.21 до ХGrMg =0.24. Можно ли приписать это изменение только погрешности анализа (другими словами, считать, что состав граната не изменился)? Условия: S1 и S2 (для исходного и конечного материалов навески граната) соответственно равны 0.005 и 0.020 при n1 = 10 и n2 = 5.

    Гипотеза: средние значения не отличаются друг от друга.

    1. S1 = 0.005 и S2 = 0.02.

    2.

    3. Принимаем = 0.95.

    4. Для = 0.95 и двусторонней проверки n =10+5-1=14, tn = 2.2 ( см. табл. 28).

    5. Сравниваем рассчитанную величину (tpn) с табличным tn : tpn > tn (4.55 > 2.2). Таким образом, с вероятностью 0.95 произошла реакция с изменением состава граната.

    Еще пример. В одном шлифе габбро найдены 2 зерна плагиоклаза состава An50 и An55 (ХPlСа = 0.50 и 0.55 соответственно ). Можно ли считать составы плагиоклазов одинаковыми? Условия : S1 = S2 = 0.03, n1 = n2= 3, = 0.95.

    1. Рассчитываем S1,2:

    2. Рассчитываем tpn:

    3. Находим по табл. 28 значения tn. n=3+3-1=5. tn=2.8.

    4. Сравниваем tpn и tn:

    tpn < tn .

    Таким образом, составы плагиоклазов (An50 и An55) значимо не различаются, и разница в составах обусловлена лишь погрешностями в определении составов плагиоклазов.


    назад | содержание | вперед

     См. также
    СообщениеФазовые отношения во фторсодержащей гранитной и нефелин-сиенитовой системах и распределение элементов между фазами:
    Биографии ученыхБатанова Анна Михайловна
    Курсы лекцийУральская полевая геологическая практика. Книга 2 (Описание учебных объектов): Использованная литература:
    Биографии ученыхГраменицкий Евгений Николаевич
    СообщениеФазовые отношения во фторсодержащей гранитной и нефелин-сиенитовой системах и распределение элементов между фазами: 2. ЭКСПЕРИМЕНТАЛЬНЫЕ И АНАЛИТИЧЕСКИЕ ПРОЦЕДУРЫ; ОЦЕНКА ТОЧНОСТИ; КРИТЕРИИ РАВНОВЕСИЯ В ОПЫТАХ

    Проект осуществляется при поддержке:
    Геологического факультета МГУ,
    РФФИ
       
    TopList Rambler's Top100