Электромонтаж Ремонт и отделка Укладка напольных покрытий, теплые полы Тепловодоснабжение

Коэффициенты подобия и корреляция

07.05.2019


Можно различными методами определить «коэффициенты подобия» между аналогичными объектами (в данном случае гранитами), в которых измерено некоторое количество признаков, или же рассчитать коэффициенты корреляции между измеренными признаками этих различных объектов, рассматриваемых в качестве подобных. Как показывают предыдущие примеры, характерные признаки, которые можно принимать во внимание, чрезвычайно разнообразны. Они обычно бывают числовыми, но могут также и не быть таковыми (наличие или отсутствие какого-либо свойства). Эти методы позволяют сгруппировать вместе объекты с повышенной степенью подобия или же признаки, которые кажутся взаимообусловливающими, если они проявляют тесную корреляцию. Первое действие ведет, очевидно, к классификациям; второе — к выявлению естественных связей, существование которых является интересным само по себе (например, петрогенетические проблемы).

Анализ групп


Этот метод, называемый также «cluster analysis», позволяет устанавливать распределение на группы в совокупности объектов или случаев, каждый из которых определяется большим количеством признаков (тех же самых для различных объектов). Он базируется на вычислении коэффициентов подобия между объектами. Эти вычисления производятся различными методами, опирающимися на довольно сложные математические соображения. В одну группу объединяют объекты, имеющие наиболее высокий коэффициент. Таким образом продолжают постепенно эту перегруппировку, принимая во внимание все менее и менее высокие коэффициенты. Графически строят «дендрограмму», т. е. нечто вроде разветвления ветвей, начало которых соответствует исходным объектам и которые последовательно объединяются, примыкая к единому стволу. Практически ветви прерывают до их окончания таким образом, чтобы выявить небольшое количество ветвей, т. е. отчетливых групп. Можно оценить степень подобия в каждой из этих ветвей.

Упрощенное изложение метода дается М. Деманжем, а приложение его к совокупности гранитов Марш, Центральный Французский массив, указано в «Учении...».

Факториальный анализ


Целью является извлечение из весьма многочисленной совокупности данных более сокращенной совокупности, которая сохраняет суть информации. Исходят из матрицы данных, которые являются значениями «признаков» (или «переменных») для различных «объектов» (или «случаев»). Горизонтальные линии матрицы группируют значения для одного и того же объекта, а вертикальные линии — для одного и того же признака.

Метод состоит в расчете замещения переменных «факторами», которые представляют собой линейные функции переменных, выбранных среди измеренных. Эти факторы играют роль новых переменных. Они определяются с таким расчетом, что являются менее многочисленными, чем первоначальные переменные, и, таким образом, являются достаточными для объяснения повышенного количества вариации признаков в матрице данных.

Эти сложные расчеты позволяют выразить численно вклад каждого выбранного фактора в вариации каждой переменной, вклад совокупности факторов в эту вариацию, а также вклад каждого фактора в общую вариацию переменных. Сравнительное обсуждение полученных цифр позволяет с высокой вероятностью рассматривать физическое значение использованных факторов, поскольку это физическое значение нормально выражается в наборе переменных таблицы начальных данных. Для этого принимают во внимание те переменные, веса которых высоки для каждого из факторов.

В уже цитированном «Учении об информатике» можно найти развитое изложение этих методов и пример применения также для гранитов Марш, сделанное П. Иснаром, Ж.Л. Малле, П. Kaзом и В. Саттраном. Факторы в этом примере числом 5 для 10 переменных, по-видимому, соответствуют петрологическим явлениям: пневматолизу, плагиоклазификации, микроклинизации, обогащению биотитом, мусковитизации.

Метод факториального анализа заслуживает критики в случае, когда явления не могут быть представлены в виде линейных отношений с данными. Он, в частности, не вполне пригоден, если данные сильно рассеяны. В действительности, обоснованность применения этого метода будет оцениваться эмпирически, путем умозаключения по его результатам, принимая во внимание те понятия, которые навязывает петрология.

Анализ путем применения регрессий


Как указывает М. Ванье, принцип состоит в том, чтобы представить, графически или нет, какую-либо переменную в функции от двух других сложных переменных и попытаться найти аналитическое выражение этому представлению. Эти комплексные переменные можно выбирать, комбинируя данные по петрологическим соображениям.

Интересное приложение, сделанное З. Жоанном и М. Ванье, касается изучения химических содержаний главных элементов и элементов-примесей группы гранитов предыдущего параграфа. Они показали, что содержания главных элементов могут быть перегруппированы в один единственный признак, определяемый значением функции D, представляемый выражением:
Коэффициенты подобия и корреляция

где FM — сумма (Fe+Mg) в атом-граммах в 10в4 г, a Alk представляет собой отношение K/Na в атомарных числах. Эти множители были выбраны по петрологическим соображениям. Авторы показали, что величины D имеют весьма высокую положительную или отрицательную корреляцию с содержаниями различных элементов-примесей, учтенных в этом исследовании. Следовательно, единственный признак D достаточен для определения содержаний примесей этой группы гранитов. С другой стороны, точность результата в региональном плане такова, что она узаконивает точное определение геохимических аномалий. Действительно, величина D позволяет рассчитать «нормальное» значение рассматриваемого элемента-примеси. И следовательно, значительные случайные отношения по отношению к этому нормальному значению, составляют геохимические аномалии для данного элемента-примеси.

Дискриминантный анализ


Целью является отнесение к известным группам случая или образца с неопределенной принадлежностью. Эти группы и случай определяются рядом соответствующим образом выбранных числовых признаков. Основа метода следующая (вероятностные основы его даны в цитированном «Учении об информатике». Для каждой группы устанавливается характерная дискриминантная функция, которая приводит в действие совокупность признаков группы и значение их дисперсии. Затем для групп вычисляют численное значение этой функции. Тот же расчет, проведенный для изучаемого случая, позволяет отнести его к той или иной группе в зависимости от того, как полученная величина приближается или удаляется от значений дискриминантной функции для этих групп.

Показательный пример дан для классификации гранитов Богемского леса на оловоносные и золотоносные по отношению к химическому составу главных элементов для выборки из 40 оловоносных гранитов Мира и выборки золотоносных гранитов, причем и те и другие были выбраны вдали от них. Расчет подтверждает, что граниты, известные как золотоносные или оловоносные, в этом районе проявляют те же самые геохимические признаки, что и мировые выборки гранитов этого рода и что диагностика, сделанная по дискриминантной функции, обоснована.

Имя:*
E-Mail:
Комментарий: