KNOWLEDGE HYPERMARKET


Метод наименьших квадратов
 
(6 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
'''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов ''' ''<br><metakeywords>Метод наименьших квадратов</metakeywords>''  
+
<metakeywords>Информатика, класc, урок, на тему, 11 класc, Метод наименьших квадратов, регрессионная, график, диаграмма</metakeywords>
 +
 
 +
'''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов '''  
<br>  
<br>  
-
'''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>''  
+
'''Метод наименьших квадратов'''  
-
<br> ''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;''
+
<h2>Что такое метод наименьших квадратов?</h2>
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.''
+
Сегодняшний наш урок будет посвящен изучению темы о методах наименьших квадратов. Что же это за метод? Давайте начнем с его определения.  
-
''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.''
+
Методом наименьших квадратов называют такой метод, при котором нахождение
 +
оптимальных параметров линейной регрессии, имеет в сумме квадратов регрессионных остатков минимальное количество ошибок.
-
''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:''
+
В этом методе ключевым моментом выступает, минимизация евклидова расстояния
 +
<br>
 +
[[Image:11kl_MNK01.jpg|100x100px|МНК]]
 +
<br>
 +
 +
между вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.
-
''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; ''
+
Для линейных экономических моделей метод наименьших квадратов является не только самым распространенным, но и наиболее простым и эффективным методом оценки данных параметров Уt.
-
''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;''
+
Но даже при том, что этот метод принято считать наиболее эффективным, все же при его применении следует быть осторожными, так как построенные по методу наименьших квадратов модели, не всегда соответствуют требованиям к качеству их параметров и поэтому не всегда способны с точностью отображать все закономерности, участвующие в развитии процесса.
-
''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;''
+
Ну а сейчас давайте более подробно попробуем рассмотреть процесс оценки параметров линейной эконометрической модели, используя метод наименьших квадратов.
-
''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;''
+
В общем виде эта модель может иметь уравнение такого вида, как:
-
''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.''
+
<br>
 +
[[Image:11kl_MNK02.jpg|400x200px|МНК]]
 +
<br>
 +
 +
При оценке таких параметров, как a0 , a1 ,..., an, его исходными данными будет вектор, у которого значения зависимой переменной y = (y1 , y2 , ... , yT )', а также матрица значений независимых переменных:
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.''
+
<br>
 +
[[Image:11kl_MNK03.jpg|400x200px|МНК]]
 +
<br>
 +
 +
если рассматривать первый столбец, то он состоит из единиц, которые соответствуют коэффициенту этой модели.
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.''
+
Метод наименьших квадратов свое название приобрел, благодаря принципу, которому
 +
должны удовлетворять оценки параметров, полученные на его основе. Притом, что касается оценки его параметров, то сумма квадратов ошибки данной модели должна быть минимальной.
-
''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит&nbsp; ♦ «располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. ''
+
Теперь давайте более наглядно метод наименьших квадратов рассмотрим на примере:
-
''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.''
+
В таблице наведен перечень предприятий, которые выпускают один и тот же товар. Давайте рассмотрим функции издержек:
-
''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br>[[Image:Инф96.jpg]]<br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Рис. 2.14. Использование метода наименьших квадратов<br><br>&nbsp;&nbsp;&nbsp;&nbsp; Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское слово trend можно перевести как общее направление, или тенденция.''<br>
+
<br>
 +
[[Image:11kl_MNK04.jpg|800x400px|МНК]]
 +
<br>
 +
 
 +
В этом случае мы с вами видим, что система нормальных уравнений предоставлена в таком виде:
-
''&nbsp;&nbsp;&nbsp; Уже с первого взгляда хочется отбраковать вариант линейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:''<br>
+
<br>
 +
[[Image:11kl_MNK05.jpg|200x200px|МНК]]
 +
<br>
 +
 +
Из этого следует, что:
-
''&nbsp;&nbsp;&nbsp;&nbsp; линейная функция: у =46,361х - 99,881;''<br>
+
а = - 5,79; b = 36,84.
-
''&nbsp;&nbsp;&nbsp; экспоненциальная функция: у = 3,4302 е<sup>0.7555x</sup>;''<br>
+
Получаем уравнение регрессии:
-
''&nbsp;&nbsp;&nbsp; квадратичная функция: у = 21,845х<sup>2</sup> - 106,97x +150,21.''
+
<br>
 +
[[Image:11kl_MNK06.jpg|200x200px|МНК]]
 +
<br>
 +
 +
В итоге мы видим, что общая сумма квадратов будет равна:
-
''&nbsp;&nbsp;&nbsp; На графиках присутствует еще одна величина, полученная в результате построения трендов. Она обозначена как R<sup>2</sup>. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессионной модели предельно неудачен. Чем R<sup>2</sup> ближе к 1, тем удачнее регрессионная модель.''
+
<br>
 +
[[Image:11kl_MNK07.jpg|500x200px|МНК]]
 +
<br>
-
''&nbsp;&nbsp;&nbsp;&nbsp; Из трех выбранных моделей значение R<sup>2</sup> наименьшее у линейной. Значит, она самая неудачная (нам и так это было понятно). Значения же R<sup>2</sup> у двух других моделей достаточно близки (разница меньше одной 0,01). Если определить погрешность решения данной задачи как 0,01, по критерию R<sup>2</sup> эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные соображения. ''
+
Из этого следует, что факторная сумма квадратов приобретает такой вид:
-
''&nbsp;&nbsp;&nbsp; Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при больших величинах, то глядя на графики, предпочтение следует отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси.''
+
<br>
 +
[[Image:11kl_MNK08.jpg|500x200px|МНК]]
 +
<br>
-
''&nbsp;&nbsp;&nbsp; Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны вокруг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; '''Коротко о главном'''<br><br>&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов используется для вычисления параметров регрессионной модели. Этот метод содержится в математическом арсенале электронных таблиц (в том числе и в MS Excel).''
+
Ну и остаточная сумма квадратов выходит:
-
''&nbsp;&nbsp;&nbsp; Выбор типа регрессионной модели пользователь производит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.''
+
<br>
 +
[[Image:11kl_MNK09.jpg|600x400px|МНК]]
 +
<br>
 +
 +
Приходим к такому выводу, что уравнение регрессии значимо и F факт больше F табл.
-
''&nbsp;&nbsp;&nbsp; Характеристикой построенной модели является параметр R<sup>2</sup> — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше.''
+
<h2>Дисперсионный анализ результатов регрессии</h2>
-
 
+
-
''&nbsp;&nbsp;&nbsp; Может оказаться, что несколько моделей имеют близкий параметр R<sup>2</sup>. В этом случае пользователь выбирает из них наиболее подходящую, исходя из эмпирических соображении.''
+
-
 
+
-
''<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'''Вопросы и задания'''<br><br><br>&nbsp;&nbsp; 1.&nbsp; а) Для чего используется метод наименьших квадратов?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; б) Что такое тренд?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; в) Как располагается линия тренда, построенная по МНК, относительно экспериментальных точек?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; г)&nbsp; Может ли тренд, построенный по МНК, пройти выше всех экспериментальных точек?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp; 2. а) В чем смысл параметра R<sup>2</sup>? Какие значения он принимает?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; б) Какое значение примет параметр R<sup>2</sup> если тренд точно проходит через экспериментальные точки?''
+
-
 
+
-
''&nbsp;&nbsp;&nbsp; 3.&nbsp; По данным из следующей таблицы постройте с помощью MP Excel линейную, квадратичную, экспоненциальную и логариф-<br>мическую регрессионные модели. Определите параметры, выберите лучшую модель.<br><br>&nbsp;&nbsp; '''<br><br><br>'''Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11''
+
-
 
+
-
''Отослано читателями из интернет-сайтов''<br><br>  
+
 +
<br>
 +
[[Image:11kl_MNK10.jpg|800x400px|МНК]]
<br>  
<br>  
-
'''<u>Содержание урока</u>'''
+
<h2>Использование методов наименьших квадратов</h2>
-
'''[[Image:1236084776 kr.jpg|10x10px]] конспект урока                      '''
+
-
[[Image:1236084776 kr.jpg|10x10px]] опорный каркас 
+
-
[[Image:1236084776 kr.jpg|10x10px]] презентация урока
+
-
[[Image:1236084776 kr.jpg|10x10px]] акселеративные методы
+
-
[[Image:1236084776 kr.jpg|10x10px]] интерактивные технологии
+
-
+
-
'''<u>Практика</u>'''
+
-
[[Image:1236084776 kr.jpg|10x10px]] задачи и упражнения
+
-
[[Image:1236084776 kr.jpg|10x10px]] самопроверка
+
-
[[Image:1236084776 kr.jpg|10x10px]] практикумы, тренинги, кейсы, квесты
+
-
[[Image:1236084776 kr.jpg|10x10px]] домашние задания
+
-
[[Image:1236084776 kr.jpg|10x10px]] дискуссионные вопросы
+
-
[[Image:1236084776 kr.jpg|10x10px]] риторические вопросы от учеников
+
-
 
+
-
'''<u>Иллюстрации</u>'''
+
-
'''[[Image:1236084776 kr.jpg|10x10px]] аудио-, видеоклипы и мультимедиа '''
+
-
[[Image:1236084776 kr.jpg|10x10px]] фотографии, картинки
+
-
[[Image:1236084776 kr.jpg|10x10px]] графики, таблицы, схемы
+
-
[[Image:1236084776 kr.jpg|10x10px]] юмор, анекдоты, приколы, комиксы
+
-
[[Image:1236084776 kr.jpg|10x10px]] притчи, поговорки, кроссворды, цитаты
+
-
+
-
'''<u>Дополнения</u>'''
+
-
'''[[Image:1236084776 kr.jpg|10x10px]] рефераты'''
+
-
[[Image:1236084776 kr.jpg|10x10px]] статьи
+
-
[[Image:1236084776 kr.jpg|10x10px]] фишки для любознательных
+
-
[[Image:1236084776 kr.jpg|10x10px]] шпаргалки
+
-
[[Image:1236084776 kr.jpg|10x10px]] учебники основные и дополнительные
+
-
[[Image:1236084776 kr.jpg|10x10px]] словарь терминов                         
+
-
[[Image:1236084776 kr.jpg|10x10px]] прочие
+
-
+
-
<u>Совершенствование учебников и уроков
+
-
</u>'''[[Image:1236084776 kr.jpg|10x10px]] исправление ошибок в учебнике'''
+
-
[[Image:1236084776 kr.jpg|10x10px]] обновление фрагмента в учебнике
+
-
[[Image:1236084776 kr.jpg|10x10px]] элементы новаторства на уроке
+
-
[[Image:1236084776 kr.jpg|10x10px]] замена устаревших знаний новыми
+
-
 
+
-
'''<u>Только для учителей</u>'''
+
-
'''[[Image:1236084776 kr.jpg|10x10px]] идеальные уроки '''
+
-
[[Image:1236084776 kr.jpg|10x10px]] календарный план на год 
+
-
[[Image:1236084776 kr.jpg|10x10px]] методические рекомендации 
+
-
[[Image:1236084776 kr.jpg|10x10px]] программы
+
-
[[Image:1236084776 kr.jpg|10x10px]] обсуждения
+
-
+
-
+
-
'''<u>Интегрированные уроки</u>'''<u>
+
-
</u>
+
-
 
+
-
<br>  
+
-
Если у вас есть исправления или предложения к данному уроку, [http://xvatit.com/index.php?do=feedback напишите нам].  
+
Возникает вполне закономерный вопрос, зачем нам нужен и где может быть использован метод наименьших квадратов? Ну, естественно, что в первую очередь МНК нашел свое применение в математике. А именно:
-
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - [http://xvatit.com/forum/ Образовательный форум].
+
• Во-первых, он необходим в как, так и в теории вероятности, так и в математической статистике;<br>
 +
• Во-вторых, наибольшее распространение МНК получил при решении задач на фильтрацию, где необходимо отмежевать полезный сигнал от шума, который на него накладывается.<br>
 +
• В-третьих, МНК, применяют в математическом анализе для приближённого представления заданной функции более простыми функциями.<br>
 +
• В-четвертых, его применяют тогда, когда нужно решить систему уравнений, в которых количество неизвестных меньше, чем количество уравнений.<br>

Текущая версия на 08:41, 6 июля 2015

Гипермаркет знаний>>Информатика>>Информатика 11 класс>>Информатика: Метод наименьших квадратов


Метод наименьших квадратов

Что такое метод наименьших квадратов?

Сегодняшний наш урок будет посвящен изучению темы о методах наименьших квадратов. Что же это за метод? Давайте начнем с его определения.

Методом наименьших квадратов называют такой метод, при котором нахождение оптимальных параметров линейной регрессии, имеет в сумме квадратов регрессионных остатков минимальное количество ошибок.

В этом методе ключевым моментом выступает, минимизация евклидова расстояния
МНК

между вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.

Для линейных экономических моделей метод наименьших квадратов является не только самым распространенным, но и наиболее простым и эффективным методом оценки данных параметров Уt.

Но даже при том, что этот метод принято считать наиболее эффективным, все же при его применении следует быть осторожными, так как построенные по методу наименьших квадратов модели, не всегда соответствуют требованиям к качеству их параметров и поэтому не всегда способны с точностью отображать все закономерности, участвующие в развитии процесса.

Ну а сейчас давайте более подробно попробуем рассмотреть процесс оценки параметров линейной эконометрической модели, используя метод наименьших квадратов.

В общем виде эта модель может иметь уравнение такого вида, как:


МНК

При оценке таких параметров, как a0 , a1 ,..., an, его исходными данными будет вектор, у которого значения зависимой переменной y = (y1 , y2 , ... , yT )', а также матрица значений независимых переменных:


МНК

если рассматривать первый столбец, то он состоит из единиц, которые соответствуют коэффициенту этой модели.

Метод наименьших квадратов свое название приобрел, благодаря принципу, которому должны удовлетворять оценки параметров, полученные на его основе. Притом, что касается оценки его параметров, то сумма квадратов ошибки данной модели должна быть минимальной.

Теперь давайте более наглядно метод наименьших квадратов рассмотрим на примере:

В таблице наведен перечень предприятий, которые выпускают один и тот же товар. Давайте рассмотрим функции издержек:


МНК

В этом случае мы с вами видим, что система нормальных уравнений предоставлена в таком виде:


МНК

Из этого следует, что:

а = - 5,79; b = 36,84.

Получаем уравнение регрессии:


МНК

В итоге мы видим, что общая сумма квадратов будет равна:


МНК

Из этого следует, что факторная сумма квадратов приобретает такой вид:


МНК

Ну и остаточная сумма квадратов выходит:


МНК

Приходим к такому выводу, что уравнение регрессии значимо и F факт больше F табл.

Дисперсионный анализ результатов регрессии


МНК

Использование методов наименьших квадратов

Возникает вполне закономерный вопрос, зачем нам нужен и где может быть использован метод наименьших квадратов? Ну, естественно, что в первую очередь МНК нашел свое применение в математике. А именно:

• Во-первых, он необходим в как, так и в теории вероятности, так и в математической статистике;
• Во-вторых, наибольшее распространение МНК получил при решении задач на фильтрацию, где необходимо отмежевать полезный сигнал от шума, который на него накладывается.
• В-третьих, МНК, применяют в математическом анализе для приближённого представления заданной функции более простыми функциями.
• В-четвертых, его применяют тогда, когда нужно решить систему уравнений, в которых количество неизвестных меньше, чем количество уравнений.