KNOWLEDGE HYPERMARKET


Метод наименьших квадратов
 
(7 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
'''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов ''' ''<br><metakeywords>Метод наименьших квадратов</metakeywords>''  
+
<metakeywords>Информатика, класc, урок, на тему, 11 класc, Метод наименьших квадратов, регрессионная, график, диаграмма</metakeywords>
 +
 
 +
'''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов '''  
<br>  
<br>  
-
'''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>''  
+
'''Метод наименьших квадратов'''  
-
<br> ''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;''
+
<h2>Что такое метод наименьших квадратов?</h2>
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.''
+
Сегодняшний наш урок будет посвящен изучению темы о методах наименьших квадратов. Что же это за метод? Давайте начнем с его определения.  
-
''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.''
+
Методом наименьших квадратов называют такой метод, при котором нахождение
 +
оптимальных параметров линейной регрессии, имеет в сумме квадратов регрессионных остатков минимальное количество ошибок.
-
''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:''
+
В этом методе ключевым моментом выступает, минимизация евклидова расстояния
 +
<br>
 +
[[Image:11kl_MNK01.jpg|100x100px|МНК]]
 +
<br>
 +
 +
между вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.
-
''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; ''
+
Для линейных экономических моделей метод наименьших квадратов является не только самым распространенным, но и наиболее простым и эффективным методом оценки данных параметров Уt.
-
''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;''
+
Но даже при том, что этот метод принято считать наиболее эффективным, все же при его применении следует быть осторожными, так как построенные по методу наименьших квадратов модели, не всегда соответствуют требованиям к качеству их параметров и поэтому не всегда способны с точностью отображать все закономерности, участвующие в развитии процесса.
-
''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;''
+
Ну а сейчас давайте более подробно попробуем рассмотреть процесс оценки параметров линейной эконометрической модели, используя метод наименьших квадратов.
-
''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;''
+
В общем виде эта модель может иметь уравнение такого вида, как:
-
''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.''
+
<br>
 +
[[Image:11kl_MNK02.jpg|400x200px|МНК]]
 +
<br>
 +
 +
При оценке таких параметров, как a0 , a1 ,..., an, его исходными данными будет вектор, у которого значения зависимой переменной y = (y1 , y2 , ... , yT )', а также матрица значений независимых переменных:
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.''
+
<br>
 +
[[Image:11kl_MNK03.jpg|400x200px|МНК]]
 +
<br>
 +
 +
если рассматривать первый столбец, то он состоит из единиц, которые соответствуют коэффициенту этой модели.
-
''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.''
+
Метод наименьших квадратов свое название приобрел, благодаря принципу, которому
 +
должны удовлетворять оценки параметров, полученные на его основе. Притом, что касается оценки его параметров, то сумма квадратов ошибки данной модели должна быть минимальной.
-
''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. ''
+
Теперь давайте более наглядно метод наименьших квадратов рассмотрим на примере:
-
''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.''
+
В таблице наведен перечень предприятий, которые выпускают один и тот же товар. Давайте рассмотрим функции издержек:
-
''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br>[[Image:инф96.jpg]]<br><br>Рис. 2.14. Использование метода наименьших квадратов<br><br>Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское<br>слово trend можно перевести как общее направление, или тенденция.<br>Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:<br>линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.<br>На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.<br>Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,<br>Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>Коротко о главном<br>4<br>Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).<br>Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.<br>Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-<br>Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.<br>Вопросы и задания<br><br><br>1.&nbsp;&nbsp;&nbsp; а) Для чего используется метод наименьших квадратов?<br>б)&nbsp;&nbsp;&nbsp; Что такое тренд?<br>в)&nbsp;&nbsp;&nbsp; Как располагается линия тренда, построенная по МНК, отно-<br>сительно экспериментальных точек?<br>г)&nbsp;&nbsp;&nbsp; Может ли тренд» построенный по МНК, пройти выше всех эк-<br>спериментальных точек?<br>2.&nbsp;&nbsp;&nbsp; а) В чем смысл параметра f?2? Какие значения он принимает?<br>б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?<br>3.&nbsp;&nbsp;&nbsp; По данным из следующей таблицы постройте с помощью MP<br>Excel линейную, квадратичную, экспоненциальную и логариф"<br>мическую регрессионные модели. Определите параметры, вы*<br>берите лучшую модель.<br><br>&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1—■"|"&nbsp;&nbsp; \<br>4&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp; 10&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp; 14&nbsp;&nbsp;&nbsp; 16&nbsp;&nbsp;&nbsp; 1S&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 22&nbsp;&nbsp;&nbsp; 24&nbsp;&nbsp;&nbsp; 26&nbsp;&nbsp;&nbsp; 28 Л<br>&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp; 32&nbsp;&nbsp;&nbsp; 35&nbsp;&nbsp;&nbsp; 40&nbsp;&nbsp;&nbsp; 30&nbsp;&nbsp;&nbsp; 27&nbsp;&nbsp;&nbsp; 21&nbsp;&nbsp;&nbsp; 25&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 23 ,&nbsp;&nbsp;&nbsp; 18&nbsp;&nbsp;&nbsp; 19&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 16 J''''<br><br><br>Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11'''''
+
<br>
 +
[[Image:11kl_MNK04.jpg|800x400px|МНК]]
 +
<br>
 +
 
 +
В этом случае мы с вами видим, что система нормальных уравнений предоставлена в таком виде:
-
''Отослано читателями из интернет-сайтов''<br><br>  
+
<br>
 +
[[Image:11kl_MNK05.jpg|200x200px|МНК]]
 +
<br>
 +
 +
Из этого следует, что:
-
<br>
+
а = - 5,79; b = 36,84.
-
'''<u>Содержание урока</u>'''
+
Получаем уравнение регрессии:
-
'''[[Image:1236084776 kr.jpg|10x10px]] конспект урока                      '''
+
 
-
[[Image:1236084776 kr.jpg|10x10px]] опорный каркас 
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] презентация урока
+
[[Image:11kl_MNK06.jpg|200x200px|МНК]]
-
[[Image:1236084776 kr.jpg|10x10px]] акселеративные методы
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] интерактивные технологии
+
   
   
-
'''<u>Практика</u>'''
+
В итоге мы видим, что общая сумма квадратов будет равна:
-
[[Image:1236084776 kr.jpg|10x10px]] задачи и упражнения
+
 
-
[[Image:1236084776 kr.jpg|10x10px]] самопроверка
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] практикумы, тренинги, кейсы, квесты
+
[[Image:11kl_MNK07.jpg|500x200px|МНК]]
-
[[Image:1236084776 kr.jpg|10x10px]] домашние задания
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] дискуссионные вопросы
+
 
-
[[Image:1236084776 kr.jpg|10x10px]] риторические вопросы от учеников
+
Из этого следует, что факторная сумма квадратов приобретает такой вид:
-
 
+
 
-
'''<u>Иллюстрации</u>'''
+
<br>
-
'''[[Image:1236084776 kr.jpg|10x10px]] аудио-, видеоклипы и мультимедиа '''
+
[[Image:11kl_MNK08.jpg|500x200px|МНК]]
-
[[Image:1236084776 kr.jpg|10x10px]] фотографии, картинки
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] графики, таблицы, схемы
+
 
-
[[Image:1236084776 kr.jpg|10x10px]] юмор, анекдоты, приколы, комиксы
+
Ну и остаточная сумма квадратов выходит:
-
[[Image:1236084776 kr.jpg|10x10px]] притчи, поговорки, кроссворды, цитаты
+
 
-
+
<br>
-
'''<u>Дополнения</u>'''
+
[[Image:11kl_MNK09.jpg|600x400px|МНК]]
-
'''[[Image:1236084776 kr.jpg|10x10px]] рефераты'''
+
<br>
-
[[Image:1236084776 kr.jpg|10x10px]] статьи
+
-
[[Image:1236084776 kr.jpg|10x10px]] фишки для любознательных
+
-
[[Image:1236084776 kr.jpg|10x10px]] шпаргалки
+
-
[[Image:1236084776 kr.jpg|10x10px]] учебники основные и дополнительные
+
-
[[Image:1236084776 kr.jpg|10x10px]] словарь терминов                         
+
-
[[Image:1236084776 kr.jpg|10x10px]] прочие
+
-
+
-
<u>Совершенствование учебников и уроков
+
-
</u>'''[[Image:1236084776 kr.jpg|10x10px]] исправление ошибок в учебнике'''
+
-
[[Image:1236084776 kr.jpg|10x10px]] обновление фрагмента в учебнике
+
-
[[Image:1236084776 kr.jpg|10x10px]] элементы новаторства на уроке
+
-
[[Image:1236084776 kr.jpg|10x10px]] замена устаревших знаний новыми
+
-
 
+
-
'''<u>Только для учителей</u>'''
+
-
'''[[Image:1236084776 kr.jpg|10x10px]] идеальные уроки '''
+
-
[[Image:1236084776 kr.jpg|10x10px]] календарный план на год 
+
-
[[Image:1236084776 kr.jpg|10x10px]] методические рекомендации 
+
-
[[Image:1236084776 kr.jpg|10x10px]] программы
+
-
[[Image:1236084776 kr.jpg|10x10px]] обсуждения
+
   
   
-
+
Приходим к такому выводу, что уравнение регрессии значимо и F факт больше F табл.
-
'''<u>Интегрированные уроки</u>'''<u>
+
-
</u>
+
 +
<h2>Дисперсионный анализ результатов регрессии</h2>
 +
 +
<br>
 +
[[Image:11kl_MNK10.jpg|800x400px|МНК]]
<br>  
<br>  
-
Если у вас есть исправления или предложения к данному уроку, [http://xvatit.com/index.php?do=feedback напишите нам].  
+
<h2>Использование методов наименьших квадратов</h2>
 +
 
 +
Возникает вполне закономерный вопрос, зачем нам нужен и где может быть использован метод наименьших квадратов? Ну, естественно, что в первую очередь МНК нашел свое применение в математике. А именно:
-
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - [http://xvatit.com/forum/ Образовательный форум].
+
• Во-первых, он необходим в как, так и в теории вероятности, так и в математической статистике;<br>
 +
• Во-вторых, наибольшее распространение МНК получил при решении задач на фильтрацию, где необходимо отмежевать полезный сигнал от шума, который на него накладывается.<br>
 +
• В-третьих, МНК, применяют в математическом анализе для приближённого представления заданной функции более простыми функциями.<br>
 +
• В-четвертых, его применяют тогда, когда нужно решить систему уравнений, в которых количество неизвестных меньше, чем количество уравнений.<br>

Текущая версия на 08:41, 6 июля 2015

Гипермаркет знаний>>Информатика>>Информатика 11 класс>>Информатика: Метод наименьших квадратов


Метод наименьших квадратов

Что такое метод наименьших квадратов?

Сегодняшний наш урок будет посвящен изучению темы о методах наименьших квадратов. Что же это за метод? Давайте начнем с его определения.

Методом наименьших квадратов называют такой метод, при котором нахождение оптимальных параметров линейной регрессии, имеет в сумме квадратов регрессионных остатков минимальное количество ошибок.

В этом методе ключевым моментом выступает, минимизация евклидова расстояния
МНК

между вектором восстановленных значений зависимой переменной и вектором фактических значений зависимой переменной.

Для линейных экономических моделей метод наименьших квадратов является не только самым распространенным, но и наиболее простым и эффективным методом оценки данных параметров Уt.

Но даже при том, что этот метод принято считать наиболее эффективным, все же при его применении следует быть осторожными, так как построенные по методу наименьших квадратов модели, не всегда соответствуют требованиям к качеству их параметров и поэтому не всегда способны с точностью отображать все закономерности, участвующие в развитии процесса.

Ну а сейчас давайте более подробно попробуем рассмотреть процесс оценки параметров линейной эконометрической модели, используя метод наименьших квадратов.

В общем виде эта модель может иметь уравнение такого вида, как:


МНК

При оценке таких параметров, как a0 , a1 ,..., an, его исходными данными будет вектор, у которого значения зависимой переменной y = (y1 , y2 , ... , yT )', а также матрица значений независимых переменных:


МНК

если рассматривать первый столбец, то он состоит из единиц, которые соответствуют коэффициенту этой модели.

Метод наименьших квадратов свое название приобрел, благодаря принципу, которому должны удовлетворять оценки параметров, полученные на его основе. Притом, что касается оценки его параметров, то сумма квадратов ошибки данной модели должна быть минимальной.

Теперь давайте более наглядно метод наименьших квадратов рассмотрим на примере:

В таблице наведен перечень предприятий, которые выпускают один и тот же товар. Давайте рассмотрим функции издержек:


МНК

В этом случае мы с вами видим, что система нормальных уравнений предоставлена в таком виде:


МНК

Из этого следует, что:

а = - 5,79; b = 36,84.

Получаем уравнение регрессии:


МНК

В итоге мы видим, что общая сумма квадратов будет равна:


МНК

Из этого следует, что факторная сумма квадратов приобретает такой вид:


МНК

Ну и остаточная сумма квадратов выходит:


МНК

Приходим к такому выводу, что уравнение регрессии значимо и F факт больше F табл.

Дисперсионный анализ результатов регрессии


МНК

Использование методов наименьших квадратов

Возникает вполне закономерный вопрос, зачем нам нужен и где может быть использован метод наименьших квадратов? Ну, естественно, что в первую очередь МНК нашел свое применение в математике. А именно:

• Во-первых, он необходим в как, так и в теории вероятности, так и в математической статистике;
• Во-вторых, наибольшее распространение МНК получил при решении задач на фильтрацию, где необходимо отмежевать полезный сигнал от шума, который на него накладывается.
• В-третьих, МНК, применяют в математическом анализе для приближённого представления заданной функции более простыми функциями.
• В-четвертых, его применяют тогда, когда нужно решить систему уравнений, в которых количество неизвестных меньше, чем количество уравнений.