ФУНКЦИОНАЛЬНАЯ ВЗАИМОСВЯЗЬ МЕЖДУ ПЕРЕМЕННЫМИ

Во многих подсистемах имеет место функциональная связь между двумя и более переменными, которую необходимо выявить. В связи с этим мы можем столкнуться с необходимостью ввести некоторую гипотезу о характере функциональной зависимости, т. е. аппроксимировать ее некоторым относительно простым математическим выражением, например линейным выражением или многочленом. Для этого можно использовать методы регрессионного и корреляционного анализа. Регрессионный анализ дает возможность построить, исходя их имеющейся совокупности экспериментальных данных, уравнение вид которого задает аналитик, а корреляционный анализ позволяет судить о том, насколько хорошо экспериментальные точки согласуются с выбранным уравнением («ложатся» на соответствующую кривую).

Подбор кривых

Рис. 10 Рис. 11

Первым шагом при выводе уравнения, аппроксимирующего требуемую зависимость, является сбор данных, отражающих соответствующие значения рассматриваемых переменных. Пусть, например, что в процессе механической обработки детали шероховатость поверхности является функцией подачи инструмента. Обозначим через y величину шероховатости и через х подачу. Тогда из данных, полученных в ходе эксперимента, можно взять выборку объемом N значений и N соответствующих значений .

Следующим шагом является построение графика в прямоугольной системе координат, представляющего собой диаграмму разброса и позволяющего визуальным способом найти плавную кривую, аппроксимирующую функциональную зависимость. Например, из графика (рис. 10) видно, что экспериментальные точки хорошо ложатся на прямую линию. В тоже время точки, нанесенные на рис. 11, по-видимому, лучше ложатся на некоторую кривую. Прежде всего, следует выбрать вид кривой, для которой будем искать аппроксимирующее уравнение. Поэтому приведем наиболее распространенные аппроксимирующие уравнения и соответствующие им кривые (рис. 12).

Рис. 12. Различные виды регрессионных кривых

- прямая линия;

- квадратная парабола;

- кубическая парабола;

- парабола четвертой степени;

- парабола n–й степени;

, или - гипербола;

, или - экспонента;

- логарифмическая кривая;

- кубическая логарифмическая кривая.

Рис. 13

Могут найти применение кривые других видов. Чтобы решить, какую аппроксимацию использовать, следует изучить диаграмму разброса и сравнить ее форму с формой нескольких кривых. Иногда бывает полезно также исследовать диаграмму, преобразовав переменные. Для этого можно воспользоваться специальной полулогарифмической или логарифмической сеткой, на которой соответственно масштаб по одной или обеим осям координат выбран логарифмическим. При этом, например, если диаграмма разброса в системе координат оказывается линейной, следует воспользоваться уравнением экспоненты. Подобным же образом, если диаграмма линейна в масштабе , следует взять аппроксимирующее уравнение кубической логарифмической кривой.



В качестве критерия «наилучшего приближения» наиболее часто используется метод наименьших квадратов. Пусть через ( ), ( ), …, ( ) обозначены координаты экспериментальных точек, для любого заданного х, скажем х1, будет иметь место разница между у1 и соответствующим значением, получающимся по теоретической кривой (рис. 13). Обозначим эту разницу символом D1 и назовем ее отклонением. Это отклонение может быть положительным, отрицательным или нулевым. Соответственно для каждой экспериментальной точки можно вычислить значения D2, …, DN . Тогда мерой качества приближения кривой к экспериментальным данным можно считать сумму абсолютных отклонений, т. е. . Поскольку отклонения могут быть положительными или отрицательными, с математической точки зрения проще возвести их значения в квадрат и иметь дело с квадратичными отклонениями. Сумма последних, очевидно, даст такую же хорошую меру качества приближения. Поэтому будем считать, что из всех возможных аппроксимирующих кривых кривой наилучшего приближения для данной совокупности экспериментальных точек будет та, для которой сумма .минимальна.

Регрессионный анализ

Математический метод, обеспечивающий такую подгонку выбранной кривой, при которой экспериментальные точки ложатся на нее наилучшим образом в смысле критерия наименьших квадратов, называется регрессионным анализом. Под приближением кривой к экспериментальным значениям понимается только процесс вычисления значений констант или параметров таким образом, чтобы сумма квадратичных отклонений была минимальной. Рассмотрим простейший случай, когда ожидается, что у является линейной функцией одной переменной х.



Основная модель линейного соотношения записывается в виде уравнения

,

где - начальное значение у; - тангенс угла наклона прямой; - случайная ошибка.

Таблица 7.1 Линейная аппроксимация экспериментальных данных
х у х2 ху
0 2 2 3 Суммы 7 1 4 3 5 13 0 4 4 9 17 0 8 6 15 29

Величины , и неизвестны и их следует определить. Для этого воспользуемся следующими уравнениями:

, .

Пусть имеем четыре экспериментальные точки (n=4) и хотим получить линейную аппроксимацию этой совокупности. Вычисления проведены в таблице 7.1. В итоге получим .

Корреляция

Рис. 14

Наилучшее приближение нашей прямой (или кривой) к экспериментальным данным вовсе не означает, что реально существующая физическая зависимость наилучшим образом описывается аппроксимирующим уравнением, соответствующим именно этой прямой. Наглядный этому пример дает рис. 14. Из него видно, что экспериментальные данные не соответствуют линейной зависимости, хотя прямая подобрана так, что обеспечивает наилучшее приближение к этим данным.

Для оценки того, насколько хорошо наша прямая (и соответствующее ей уравнение) в действительности согласуется с экспериментальными данными, необходимо ввести понятие корреляции. Сильная корреляция между переменными означает, что их изменения взаимосвязаны (рис. 15), однако это еще не доказывает наличия причинно-следственной связи между переменными. При регрессионном анализе предполагается наличие причинно-следственной связи между зависимой и независимой переменными: при корреляционном анализе нет.

Коэффициент корреляции лежит в пределах от –1 до +1. Однако крайние случаи –1, 0 и +1 встречаются редко. Обычно коэффициент корреляции имеет дробное значение, и его следует проверить на статистическую значимость.

Рис.15

Для случая простой линейной регрессионной задачи (т. е. для одной зависимой и одной независимой переменной, связанных между собой линейно) коэффициент корреляции r вычисляется по формуле

.

Используя данные предыдущего примера, коэффициент корреляции вычислим, как показано в табл. 7.2. То есть r=0,969.

Таблица 7.2
х у ху х2 у2
Суммы 7

Общий разброс у определяется как , т. е. равен сумме квадратов отклонений у от среднего значения . Отношение величины разброса к общему наблюдаемому разбросу называется коэффициентом детерминации (или коэффициент смешанной корреляции) и равно квадрату коэффициента корреляции, т. е. r2. Для рассмотренного примера коэффициент детерминации R=r2=0,939. Это значит, что в 93,9% случаев отклонение у при изменениях х соответствует выведенному нами уравнению .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий. – М.: Наука, 1976.

2. Спиридонова А.А. Планирование эксперимента при исследовании технологических процессов. – М.: Машиностроение, 1981.

3. Гмурман В.Е. Руководство к решению задач по теории вероятности и математической статистике. – М.: Высшая школа, 1975.

4. Дрейпер Н., Смит Г. Прикладной регрессионный анализ/Пер. с англ. Ю. П. Адлера, В. Г. Горского. – 2-е изд., перераб. и доп. – М.: Финансы и статистика, 1986. - 266 с. Кн. I.

5. Дитрих Я. Проектирование и конструирование: Системный подход. Пер. с польск. - М.: Мир, 1981. - 456 с.

6. Коршунов Ю.М. Математические основы кибернетики. – М.: Энергия, 1980.

7. Математическая статистика: Учебник / Иванова В.М. и др. – 2-е изд. М.: Высшая школа. 1981.

8. Шеннон Р. Имитационное моделирование систем – искусство и наука./Пер. с англ. – М.: Мир, 1978. – 418 с.


7394073012355017.html
7394183931489745.html
    PR.RU™