Transcript
Page 1: Статистическое моделирование на ЭВМ: Лабораторный практикум

АСТРАХАНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ

УНИВЕРСИТЕТ Кафедра

«Информационные системы управления и информатика»

ЛАБОРАТОРНЫЙ ПРАКТИКУМ по дисциплине «Статистическое моделирование на ЭВМ»

Учебно-методическое пособие для студентов специальности 250400 «ХИМИЧЕСКАЯ ТЕХНОЛОГИЯ ПРИРОДНЫХ

ЭНЕРГОНОСИТЕЛЕЙ И УГЛЕРОДНЫХ МАТЕРИАЛОВ»

СБОРНИК ПРИМЕРОВ И ЗАДАЧ

Астрахань

2007

Page 2: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 2

Составитель методического пособия:

Мартьянова А.Е.; доц., канд. техн. наук.

Рецензент:

Летичевская Н.Н.; доц., канд. хим. наук.

Методические указания рассмотрены и одобрены к публикации на заседании

кафедры «Информационные системы управления и информатика».

Протокол № ___3__ от ____22.03.07____ г.

Page 3: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 3

СОДЕРЖАНИЕ

ВВЕДЕНИЕ……………………………………………………………………….. 4

РАЗДЕЛ I. Расчеты в электронных таблицах Excel………………………… 5

РАЗДЕЛ II. Построение диаграмм и графиков

в электронных таблицах Excel……………………………………………….. 15

РАЗДЕЛ III. Адресация в электронных таблицах Excel……………………. 26

РАЗДЕЛ IV. Обработка блоков в электронных таблицах Excel…………… 34

РАЗДЕЛ V. Табличные формулы и матричные операции

в электронных таблицах Excel……………………………………………….. 39

РАЗДЕЛ VI. Итоговые функции, статистические

расчеты и теория вероятности в электронных таблицах Excel…………….. 52

РАЗДЕЛ VII. Регрессионный анализ в электронных

таблицах Excel………………………………………………………………… 106

РАЗДЕЛ VIII. Решение задач оптимизации

в электронных таблицах Excel……………………………………………….. 132

ЛИТЕРАТУРА……………………………………………………………………. 156

Page 4: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 4

ВВЕДЕНИЕ

Легкость освоения математического пакета Excel и его широкие

возможности позволяют использовать его как эффективный инструмент

обучения студентов различных специальностей вычислительным приемам и

практическим навыкам освоения материала различных дисциплин.

Использование Excel для расчетов позволяет отвлечься от выполнения

рутинных расчетов и обратиться к содержательной части задач, что

способствует, в свою очередь, лучшему пониманию соответствующих курсов.

Настоящая работа имеет целью научить пользоваться возможностями Excel при

решении учебных и практических задач.

При написании работы использовался опыт проведения автором

лабораторных занятий на кафедре «Информационные системы управления и

информатика» АГТУ, в частности, по дисциплинам «Статистическое

моделирование на ЭВМ» и «Компьютерная обработка информации» для

студентов специальности 254000 «Химическая технология природных

энергоносителей и углеродных материалов». Представляется оправданным

использование в процессе изучения дисциплины «Статистическое

моделирование на ЭВМ» электронных таблиц Excel, поскольку этот пакет

изучается студентами еще в курсе информатики. В то время как

специализированные математические пакеты требуют специального освоения

студентами, электронные таблицы Excel легко позволяют выполнять

большинство математических расчетов необходимых в практической

деятельности химиков-технологов.

Большинство задач имеет прикладное значение, сведения и данные взяты

из учебной и справочной литературы [1 – 8]. Методическое пособие адресовано

студентам, использующим вычисления в своей практике, но может быть

полезно преподавателям технических дисциплин и инженерам.

Page 5: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 5

Раздел I. Расчеты в электронных таблицах Excel

В этом разделе мы освоим вычисления с помощью электронных таблиц

MS Excel.

ПРИМЕР I.1. ПРИМЕР ПРОЕКТИРОВАНИЯ РАСЧЕТОВ НА РАБОЧЕМ ЛИСТЕ

Вычисление элементов треугольника. Даны три стороны треугольника

a, b, c. Требуется вычислить его площадь по формуле Герона

))()(( cpbpappS −−−= , где p – полупериметр: 2

cbap ++= , а также радиус

вписанной окружности pSr = и радиус описанной окружности

SabcR4

= .

Решение. План решения: три ячейки отведем для ввода сторон

треугольника, отдельно вычислим полупериметр, а на его основе площадь

треугольника. Потом в отдельных ячейках расположим формулы вычисления

радиусов. В ячейках, расположенных слева от ячеек с числами и формулами,

разместим обозначения величин.

Переименуйте рабочий лист, дайте ему имя «Треугольник». Введите

данные, как показано на рис. I.1. В ячейку B6 введите формулу

=(B2+B3+B4)/2.

A B C 1 Стороны треугольника 2 a 3 3 b 4 4 c 5 5 6 p 6 7 8 S

Рис. I.1.

Page 6: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 6

Использование имен. В ячейку B8 нужно ввести формулу Герона. Чтобы

упростить ввод, дадим имена ячейкам B2, B3, B4, B6. Выделите блок A2:B6,

выберите в меню команду «Вставка/Имя/Создать». Excel предложит вариант «в

столбце слева», то есть взять в качестве имен для ячеек B2, B3, B4, B6

текстовые строки (в нашем случае однобуквенные), хранящиеся в ячейках A2,

A3, A4, A6. Нажмите «ОК». Теперь, выделяя ячейку B2, в окошке слева от

строки ввода Вы увидите не адрес B2, а имя a. Для ячейки B4 имя не c, как

можно было ожидать, а c_. Это связано с тем, что имена c и r в Excel

зарезервированы (с – column – столбец, r – row - строка). Поэтому Excel ввел в

имя символ подчеркивания.

Введите в B8 формулу =корень(p*(p-a)*(p-b)*(p-c_)). После нажатия Enter

(или щелчка по зеленой галочке слева от строки ввода) название функции будет

отображено прописными буквами. Это означает, что мы правильно набрали

имя функции. Если бы не введенные имена, нам пришлось бы набирать

формулу

=КОРЕНЬ(B6*(B6-B2)*(B6-B3)*(B6-B4)),

что намного труднее для восприятия.

Форматирование ячеек. Итак, пользуясь таблицей, можно вычислить

площадь треугольника. Но хотелось бы придать таблице более читабельный

вид.

Выровняем названия величин по правому краю. Выделите блок A2:A8 и на

панели «Форматирование» нажмите кнопку «По правому краю».

Введите длину стороны a, равную 2. Тогда S=3.799671. Предположим, нам

нужна точность - три знака после точки. Для этого выделите B8 и несколько раз

нажмите кнопку «Уменьшить разрядность», пока число не приобретет нужный

формат 3.800. Важно понимать, что «внутренние» вычисления выполняются с

прежней точностью, но число, отображаемое в ячейке, округлено до трех

десятичных знаков. Отмените форматирование (Ctrl+Z) и испытайте другой

способ: выберите в меню «Формат/Ячейки» (Ctrl+1), в диалоговом окне –

Page 7: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 7

вкладку «Число», в списке «Числовые форматы:» - «Числовой». Далее

самостоятельно разберитесь, как задать нужное количество разрядов.

«Развитие» таблицы. Дополним таблицу вычислением радиусов

вписанной и описанной окружностей.

Создайте для ячейки B8 имя, взятое из соседней ячейки A8 (то есть ячейка

B8 должна получить имя S). Можно воспользоваться другим приемом

(выделить A8:B8 и «Вставка/Имя/Создать»), но так как здесь всего одно имя,

проще поступить так: выделите B8 и в окне имен над столбцом A (там сейчас

отображается адрес B8) введите имя S, нажмите Enter.

В ячейки D10 и F10 введите r и R, а в E10 и G10 – соответствующие

формулы. Наложите на эти ячейки такие же форматы, как и ранее. Для этого

воспользуйтесь формулой «Формат по образцу» (на ней показана кисть).

Например, выделите A8, нажмите кнопку и «покрасьте» кистью E10.

У Вас должен получиться следующий результат (рис. I.2).

Исследование зависимостей. Выделите G10 и выберите в меню пункт

«Сервис/Зависимости/Влияющие ячейки». На экране протянутся синие стрелки

от ячеек, содержащих длины сторон и площадь треугольник, к ячейке G10.

Исследуйте зависимости и для других ячеек. Уберите стрелки соответствующей

командой меню.

Удобнее работать с помощью панели кнопок «Зависимости». Выведите на

экран панель «Зависимости» (меню «Вид/Панели инструментов/Зависимости»;

в Excel 97 «Сервис/Зависимости/Панель зависимостей») и изучите работу

кнопок этой панели. Например, выделите ячейку G10, а затем несколько раз

нажмите на самую левую кнопку панели: «Влияющие ячейки». (Если у Вас

возникнут затруднения при выполнении этого упражнения, обратитесь к

Справке: «Создание формул и проверка книг/Проверка книг/Поиск зависимых

и влияющих ячеек».)

Page 8: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 8

A B C D E F G 1 Стороны треугольника 2 a 3 3 b 4 4 c 5 5 6 p 5.5 7 8 S 3.800 9 10 r 0.691 R 2.632

Рис. I.2.

Задайте длину стороны a, равную 10. В ячейках с результатами появится

сообщение об ошибке #ЧИСЛО!. Дело в том, что стороны 10, 4, 5 не образуют

треугольника. При вычислении площади под корнем получится отрицательное

число. Выделите ячейку G10 и выберите «Сервис/Зависимости/Источник

ошибки» (или соответствующую кнопку на панели «Зависимости»). Вы

наглядно увидите, за счет каких влияющих ячеек получен неверный результат.

Уберите с экрана стрелки, закройте панель «Зависимости».

Сообщение об ошибочных данных. Нужно переделать таблицу.

Пользователь должен получать сообщение, почему не могут быть вычислены S,

R и r, а в ячейках с результатами вычислений R и r ничего не должно

выводиться.

Будем вычислять отдельно подкоренное выражение p*(p-a)*(p-b)*(p-c_) и

определять его знак. Если оно положительно, вычисляем S, R и r. Если же нет,

то в ячейке B8 выведем текстовую строку «Это не треугольник!», а в ячейках

E10 и G10 выведем пустые строки.

Перетащите мышью содержимое B8 в B7. Отредактируйте B7, убрав

КОРЕНЬ. В ячейке останется формула =p*(p-a)*(p-b)*(p-c_). Теперь имя S

имеет ячейка B7. Вновь дайте B8 имя S («Вставка/Имя/Присвоить» и измените

ссылку для S на $B$8).

В B8 разместим формулу

Page 9: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 9

=ЕСЛИ(B7>0;КОРЕНЬ(B7); «Это не треугольник!»).

В E10 разместим формулу

=ЕСЛИ(B7>0;S/p; “”).

Аналогично измените формулу в G10.

Скрытие строк. В 6-й 7-й строках расположены результаты

промежуточных вычислений, видеть которые пользователю таблицы ни к чему.

Выделите на левой адресной полосе строки 6 и 7 и в контекстном меню

выберите «Скрыть». Если Вы заходите вернуть эти строки на экран, выделите

5-ю и 8-ю строки и в контекстном меню выберите «Показать».

Аналогично можно скрывать и показывать столбцы.

Поэкспериментируйте.

Защита листа. Чтобы предохранить таблицу от непреднамеренной порчи

неопытным пользователем (вдруг он попытается задать радиус вписанной

окружности и при этом уничтожит формулу), нужно защитить рабочий лист.

Но сначала нужно «объявить беззащитными» ячейки с исходными данными.

Выделите ячейки, содержащие длины сторон (В2:B4), нажмите Ctrl+1,

выберите вкладку «Защита» и снимите флажок «Защищаемая ячейка».

Выберите в меню команду «Сервис/Защита/Защитить лист». Попробуйте

теперь ввести данные вне диапазона B2:B4 и посмотрите реакцию Excel.

Снимите защиту: «Сервис/Защита/Снять защиту листа».

Ограничение ввода (для Excel 97/2000). Разрешите пользователю вводить

только положительные длины сторон треугольника (пункт меню

«Данные/Проверка»).

Имитация печати. Выберите в меню пункт «Файл/Предварительный

просмотр». Изучите назначение кнопок в окне предварительного просмотра.

Нажмите кнопку «Закрыть». Рабочий лист разбит пунктирными линиями на

прямоугольники, соответствующие листам формата A4.

Подбор параметра. Итак, мы вычислили радиус описанной окружности R

по трем сторонам треугольника a, b, c. Если зафиксировать длины сторон b и c

Page 10: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 10

(пусть a=2, b=4, c=5), то можно считать, что мы вычисляем R как функцию a.

Но Excel дает нам возможность решить обратную задачу: по заданному R

вычислить a. При этом не нужно решать вручную громоздкую задачу

отыскания a как функции R. Формул на рабочем листе для этой цели вполне

достаточно. Например, мы хотим определить величину a при R=3. Выделим

ячейку G10, в которой вычисляется R. В меню выберем «Сервис/Подбор

параметра». Выводится диалоговое окно «Подбор параметра». Поле

«Установить в ячейке:» уже содержит адрес выделенной ячейки G10.

Нажатием Tab перемещаемся в поле «Значение:» и вводим 3. Еще раз

нажимаем Tab и в поле «Изменяя значение ячейки:» вводим адрес ячейки B2,

содержащей величину стороны a (если мы щелкнем мышью по этой ячейке, то

в поле ввода окажется адрес $B$2). Щелкаем кнопку «ОК». выводится новое

окно «Результаты подбора параметра». Разберитесь с его содержимым

самостоятельно. Если увеличить разрядность числа в ячейке G10, то Вы

увидите, что R достигло значения 2,9999996362. При этом a =2,118384464.

А можно ли определить величину a еще точнее? – Да, можно. Выберите в

меню «Сервис/Параметры/Вычисления». На вкладке имеется поле ввода

«Относительная погрешность». Значение по умолчанию: 0.001. Введите число

0.00001. Повторите подбор параметра a для R =3. Верните прежнее значение

относительной погрешности подбора параметра.

ПРИМЕР I.2. Решение уравнений средствами программы Excel Задача. Найти решение уравнения x3-3x2+x=-1.

1. Запустите программу Excel (Пуск ► Программы ►Microsoft

Excel).

2. Занесите в ячейку A1 значение 0.

3. Занесите в ячейку B1 левую часть уравнения, используя в качестве

независимой переменной ссылку на ячейку A1. Соответствующая формула

может, например, иметь вид =A1^3-3*A1^2+A1.

Page 11: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 11

4. Дайте команду Сервис ► Подбор параметра.

5. В поле Установить в ячейке укажите B1, в поле Значение

задайте – 1 , в поле Изменяя значение ячейки укажите A1.

6. Щелкните на кнопке OK и посмотрите на результат подбора,

отображаемый в диалоговом окне Результат подбора параметра. Щелкните

на кнопке OK, чтобы сохранить полученные значения ячеек, участвовавших в

операции.

7. Повторите расчет, задавая в ячейке A1 другие начальные значения,

например 0,5 или 2. Совпали ли результаты вычислений? Чем можно

объяснить различия?

8. Сохраните рабочую книгу.

Задания к разделу I. «Расчеты в электронных таблицах Excel».

1. Решить уравнение cos x = 0 в диапазоне x ∈ [0; 2].

2. Решить уравнение 2x2 –3x + 1 = 0.

3. Решить уравнение x3 –3x2 + x = 0.

4. Вычислить длину и площадь окружности по заданному радиусу.

5. Вычислить объемы и площади поверхностей (основания, боковой и

полной) цилиндра и конуса по заданным радиусу основания и высоте.

6. Вычислить расстояние между двумя точками на плоскости, заданными

своими координатами.

7. Вычислить общее сопротивление трех параллельных сопротивлений по

формуле

321

1111

RRR

R++

= .

8. Найти действительные корни квадратного уравнения x2 + px + q = 0

по заданным коэффициентам p и q. Если действительных корней нет,

вывести об этом сообщение.

9. Дан прямоугольный параллелепипед со сторонами a, b, c. Вычислить:

Page 12: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 12

• объем V=abc;

• площадь поверхности S=2(ab+bc+ac);

• длину диагонали 222 cbad ++= ;

• угол между диагональю и плоскостью основания φ ⎟⎟⎠

⎞⎜⎜⎝

+=

22 ba

carctg ;

• угол между диагональю и боковым ребром −=2πα φ;

• объем шара, диаметром которого является диагональ, 6

3dπVШ = .

10. В правильной треугольной пирамиде заданы: длина стороны основания a

и высота h. Вычислить:

• объем 12

32haV = ;

• угол наклона бокового ребра к плоскости основания a

harctgα 3= ;

• длину бокового ребра 3

22 ahb += ;

• радиус описанного около пирамиды шара h

ahR6

3 22 += ;

• угол наклона боковой грани к основанию a

harctgβ 32= ;

• радиус вписанного в пирамиду шара 26

3 βtgar = ;

• площадь полной поверхности пирамиды rVS 3

= .

11. В правильной четырехугольной пирамиде заданы: длина стороны

основания a и высота h. Вычислить:

• объем 3

2haV = ;

Page 13: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 13

• угол наклона бокового ребра к плоскости основания a

harctgα 2= ;

• длину бокового ребра 2

22 ahb += ;

• радиус описанного около пирамиды шара h

ahR4

2 22 += ;

• угол наклона боковой грани к основанию aharctgβ 2

= ;

• радиус вписанного в пирамиду шара 22βtgar = ;

• площадь полной поверхности пирамиды rVS 3

= .

Далее можно вычислять объемы и площади поверхности шаров,

отношение объемов и т.д.

Эти задачи выполняются по образцу примера на вычисление элементов

треугольника: области входных и выходных данных должны располагаться на

рабочем листе отдельно, все входные и выходные элементы должны иметь

названия, расположенные в соседних ячейках. На весь рабочий лист, кроме

входных данных, следует наложить защиту.

Принимая работу, преподаватель дает следующие задания:

1. Снять защиту с листа.

2. Переместить блоки с исходными данными и с результатами в новое

положение, указанное преподавателем.

3. Проследить зависимости на рабочем листе.

4. Изменить формат выходных данных (например, увеличить или

уменьшить количество цифр в результате, изменить размер шрифта).

Page 14: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 14

5. С помощью команды «Сервис./Подбор параметра» найти, при каком

значении одной из выходных величин принимает заданное значение

выходная величина, указанная преподавателем.

6. Выполнить имитацию печати (предварительный просмотр).

7. Добавить на рабочий лист формулу, которая выводит сообщение, если

указанная преподавателем выходная величина превысит некоторое

пороговое значение, хранящееся в отдельной ячейке.

8. Вновь выполнить имитацию печати.

9. Установить защиту листа.

Page 15: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 15

Раздел II. Построение диаграмм и графиков в электронных таблицах Excel

Графическое представление помогает осмыслить закономерности,

лежащие в основе больших объемов данных. Один взгляд на диаграмму иной

раз дает больше, чем скрупулезное изучение длинных колонок цифр. Excel

предлагает богатые возможности визуализации данных.

ПРИМЕР II.1. МАСТЕР ДИАГРАММ Имеются обобщенные данные о работе фирмы за несколько лет. Они

приведены в условных единицах на рис. II.1.

Год Приход Расход 1992 200 150 1993 360 230 1994 410 250 1995 200 180

Рис. II.1.

Построить диаграмму прихода и расхода в зависимости от года.

Решение. Дважды щелкните по ярлыку первого рабочего листа «Лист 1» и

введите его новое название «Фирма». На рабочем листе введите исходные

данные. В первой строке разместим заголовки: в ячейке A1 запищите «Год», в

ячейке B1 – «Приход», в ячейке C1 – «Расход» (кавычки вводить не нужно).

Это текстовые строки. В ячейку A2 поместите число 1992. Конечно, можно

«вручную» внести в столбец A и другие годы. Но так как они образуют

арифметическую прогрессию с шагом 1, проще воспользоваться меню

«Правка/Заполнить/Прогрессия».

Page 16: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 16

Заполнение ячеек исходными данными. Столбцы B и C заполним

исходными данными. Продемонстрируем прием, помощью которого можно

немного ускорить эту процедуру. Выделите блок B2:C5. Начните выделение с

ячейки B2. Диапазон будет окрашен черным цветом, но ячейка B2 останется

белой – это активная ячейка. Внесите в нее число 200 и нажмите клавишу Tab.

Активной станет ячейка C2. Введите в нее число 150 и вновь нажмите Tab.

Активной станет ячейка B3. Продолжая заносить в ячейки числа и нажимая

Tab, мы обойдем все ячейки выделенного интервала. (Если нажимать клавишу

Enter, то мы будем продвигаться сверху вниз). Для снятия выделения

достаточно щелкнуть мышью по любой ячейке рабочего листа.

У Вас должна получиться таблица (рис. II.2).

Построение гистограммы. Построим столбиковую диаграмму

(гистограмму) прихода и расхода в зависимости от года.

Наша таблица задает две функции, у каждой функции аргументом является

Год, у первой функции значения в столбце Приход, а у второй – в столбце

Расход. В Excel имеется своя терминология. Значения аргумента – категории.

Значения функции – ряд данных. В нашем примере категории расположены под

заголовком «Год», первый ряд данных – под заголовком «Приход», второй ряд

данных – под заголовком «Расход». В процессе построения графика Excel не

всегда правильно решает, что является категориями, а что рядами данных, и

тогда это приходится явно ему указывать.

A B C D 1 Год Приход Расход 2 1992 200 150 3 1993 360 230 4 1994 410 250 5 1995 200 180 6

Рис. II.2.

Page 17: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 17

Диаграмму можно строить на отдельном листе или на рабочем листе с

таблицей.

Сначала нужно выделить на рабочем листе данные, на основе которых мы

хотим построить диаграмму. В нашем случае выделим A1:C5 (включаем

заголовки столбцов!). Вообще-то достаточно было выделить одну ячейку

внутри таблицы, и Excel сам распознает и выделит текущую область. А вот

если бы мы хотели построить гистограмму только для прихода в зависимости

от года, то следовало бы выделить A1:B5 (хотя и это необязательно, потом все

можно изменить в Мастере диаграмм).

Excel 97/20000. Щелкаем кнопку «Мастер диаграмм» на панели

инструментов «Стандартная» или выбираем пункт меню «Вставка/Диаграмма».

Запускается Мастер диаграмм. Он последовательно предъявляет пользователю

4 диалоговых окна – 4 шага.

Шаг 1. Выбор типа и варианта типа диаграммы. В этом окне две

вкладки: «Стандартные» и «Нестандартные». Оставаясь на вкладке

«Стандартные», выбираем тип «Гистограмма» и первый из предлагаемых

вариантов. Под вариантами гистограммы можно прочитать описание

выбранного типа: «Обычная гистограмма отображает значения различных

категорий». В нижней части окна имеется кнопка «Просмотр результата». Если

нажать ее и удерживать, то в диалоговом окне появится предварительный

результат построения диаграммы. Щелкнем кнопку «Далее>».

Шаг 2. Исходные данные для диаграммы. Окно содержит две вкладки:

«Диапазон данных» и «Ряд». В первой вкладке ничего не меняем, так как в поле

ввода «Диапазон» правильно отображается адрес выделенного нами заранее

блока =Фирма!$A$1:$C$5. На знаки доллара перед компонентами адреса

внимание обращать не нужно - так обозначается абсолютный адрес. Перед

восклицательным знаком указано имя рабочего листа «Фирма». Это

необходимое уточнение – ведь диаграмма может быть построена на новом

листе и поэтому надо точно определить, с какого листа выбирается блок

Page 18: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 18

данных. Переключатель «Ряды в:» поставлен в положение «в столбцах». Это

правильно – ряд данных «Приход» расположен в столбце B2:B5, аналогично и

ряд «Расход».

Щелкаем по вкладке «Ряд». Здесь показан предварительный вид

диаграммы. По оси категорий проставлены порядковые номера 1, 2, 3, 4, а

каждому номеру соответствуют три столбика. Excel рассматривает «Год» как

ряд данных. Нас это не устраивает. В диалоговом окне «Ряд» выделяем «Год» и

щелкаем кнопку «Удалить». Столбики, отвечающие ряду «Год», исчезают.

Помещаем курсор в поле ввода «Подписи оси X» и выделяем на рабочем листе

«Фирма» диапазон A2:A5, содержащий годы. Теперь вместо порядковых

номеров по оси категорий проставлены годы, а в поле ввода появится адрес

=Фирма!$A$2:$A$5.

Обратимся теперь к полям ввода «Имя:» и «Значения:». Если в подокне

«Ряд» Вы выделите имя рада «Приход», то в поле ввода «Имя:» Вы увидите

«=Фирма!$B$1», то есть адрес ячейки с заголовком «Приход», а в поле ввода

«Значения:» - «=Фирма!$B$2:$B$5», то есть адрес блока с данными. Если же в

подокне «Ряд» Вы выделите «Расход», то в полях ввода Вы увидите

соответствующие адреса уже для другого ряда. В поле ввода «Имя:» можно

ввести другое название для ряда, но мы этого делать не будем. Щелкнем кнопку

«Далее>».

Шаг 3. Параметры диаграммы. Окно содержит шесть вкладок. На

вкладке «Заголовки» дадим диаграмме название «Итоги работы», оси X –

заголовок «Годы». На вкладке «Линии сетки» откажемся от линий сетки

(снимем флажки). На вкладке «Подписи данных» выделим переключатель

«значение» - над столбиками появятся числовые значения из таблицы.

Щелкнем кнопку «Далее>».

Шаг 4. Размещение диаграммы. Предлагается на выбор «Поместить

диаграмму на листе»: отдельном (создается новый лист, ему предлагается

название «Диаграмма 1», которое можно тут же заменить) или имеющемся, то

Page 19: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 19

есть на рабочем листе с таблицей. Выбираем размещение таблицы на

отдельном листе и щелкаем кнопку «Готово». (На рабочем листе диаграмму

имеет смысл размещать, если таблица, невелика. Обычно удобнее размещать

диаграмму на отдельном листе.)

Диаграмма построена.

В рабочей книге появился лист с именем «Диаграмма 1».

Диаграмму можно было построить намного быстрее, если бы ячейка A1

была пустой. Тогда Excel однозначно определяет, что B2:B5 и C2:C5 – это

ряды данных. (По умолчанию Excel считает, что длина ряда больше количества

рядов. Если эти число совпадают, то Excel считает, что ряды данных

расположены в столбцах.) Тогда в B1 и C1 – имена рядов, а в A2:A5 –

категории. Достаточно выделить одну ячейку в таблице и нажать

функциональную клавишу F11 – диаграмма будет построена, и нужно будет

только отформатировать ее элементы. Тогда почему в примере присутствует

заголовок у первого столбца таблицы? Дело в том, что в Excel имеются

развитые средства работы со списками (однотабличными базами данных).

Правильно оформленный список должен иметь текстовый заголовок для

каждого столбца.

ПРИМЕР II.2. МАСТЕР ДИАГРАММ Изменение диаграммы с использованием Главного меню. Перейдите на

лист с диаграммой, построенной в примере II.1. Скопируйте этот лист и

назовите новый лист «Пример II.2». Обратимся к Главному меню. Оно

изменилось.

В меню «Вид», находясь на листе «Диаграмма 1», испытайте пункт «Во

весь экран» (в Excel 5/0 «Полный экран») и «По размеру окна». Сначала

выберите пункт «По размеру окна». Диаграмма вытянется по горизонтали,

чтобы полностью занять окно. Если Вы еще раз войдете в меню «Вид», Вы

Page 20: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 20

увидите, что возле пункта «По размеру окна» появилась галочка. Теперь

выберите пункт «Вид/ Во весь экран» и верните экран к прежнему размеру.

В Главном меню Excel 97/2000 появился пункт «Диаграммы». Раскройте

это меню. Первые четыре пункта меню: «Тип диаграммы», «Исходные

данные», «Параметры диаграммы», «Размещение». По очереди войдите в эти

пункты меню и убедитесь, что появляющиеся диалоговые окна аналогичны

диалоговым окнам Мастера диаграмм (но не вполне!). Вы можете с помощью

этих пунктов вносить изменения в вид диаграммы. Например, добавьте

горизонтальные линии сетки, таблицу значений (обратите внимание, что

таблица транспонирована по сравнению с исходной, расположенной на рабочем

листе).

ПРИМЕР II.3. МАСТЕР ДИАГРАММ Скопируйте лист с диаграммой, построенной в примере II.1.

Изменение диаграммы с использованием контекстного меню. Для

вызова контекстного меню нужно сначала выделить форматируемый элемент.

Это можно сделать левой или правой кнопкой мыши. Можно выделить элемент

с помощью клавиатуры. Для этого последовательно нажимайте клавишу

«Стрелка вверх» или «Стрелка вниз». Вокруг выделяемого элемента

появляются маркеры. При этом в окне имен появляется название элемента

(Область диаграммы, Область построения, Легенда, Ось значений и т.д.).

Внутри элементов диаграммы имеются свои элементы, например элементы

легенды, элементы ряда. Они выделяются последовательным нажатием клавиш

«Стрелка влево» и «Стрелка вправо». (Поэкспериментируйте.) Если элементы

достаточно крупные, то проще выделять их с помощью мыши. Например, мы

хотим выделить самый левый столбик гистограммы. Один щелчок мышью по

столбику выделит все столбики, отвечающие первому ряду, второй щелчок

выделяет элемент ряда (следите только, чтобы эти два последовательных

Page 21: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 21

щелчка не слились в двойной щелчок – это вызовет диалоговое окно «Формат

ряда данных»).

Выделив элемент, подлежащий форматированию, нажмите правую кнопку

мыши и выберите в контекстном меню пункт «Формат…» либо нажмите

комбинацию клавиш Ctrl+1.

1. Сделаем фон диаграммы прозрачным. Щелкаем правой кнопкой мыши на

свободной области диаграммы и выберем в контекстном меню пункт

«Форматирование области построения». В диалоговом окне выберем

«Заливка: прозрачная». Выйдя из окна диалога, нажмите Esc, чтобы снять

выделение.

2. Изменим шкалу значений. Выделим ось значений. Выберем пункт

контекстного меню «Формат оси». Укажем для шкалы максимальное

значение 500, цену основных делений 100. Вернемся к диаграмме и

снимем выделение.

3. Установите перекрытие столбиков на диаграмме -20 (отрицательное

число) и ширину зазора 70 («Формат рядов данных/ Параметры»).

4. Покрасьте другим цветом второй столбик первого ряда данных.

5. Выведите легенду внизу, окружив ее рамкой с тенью.

6. Значения (подписи) рядов данных выведите шрифтом величиной 8

пунктов.

7. Выберите подходящий узор для второго ряда данных («Формат рядов

данных/Вид/Способы заливки/Узор»).

Вам нужно самостоятельно поэкспериментировать с различными

элементами диаграммы. Вы всегда можете отменить результаты своих

действий нажатием клавиш Ctrl+Z.

ПРИМЕР II.4. МАСТЕР ДИАГРАММ Скопируйте лист с диаграммой предыдущего примера на новый лист.

Page 22: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 22

Добавление данных на диаграмму. Предположим, в таблицу (в блок

A6:C6) добавлены новые данные: 1996 320 270. Нужно добавить их и на

диаграмму, не перестраивая ее заново. Скопируйте новые данные в буфер

(клавиши Ctrl+C), перейдите на лист с диаграммой, извлеките данные из буфера

(клавиши Ctrl+V). В нашем случае получилось не совсем то, что нужно:

добавились два столбика, отвечающие числам 320 и 270, но на оси категорий

под ними не появились отметки 1996. Поэтому выполните откат (Ctrl+Z) и

воспользуйтесь более строгим средством. Находясь на листе с диаграммой,

выберите в меню «Диаграмма/ Добавить данные». Появляется диалоговое окно

«Новые данные». Вводим в него диапазон =Фирма!$A$6:$C$6. Появляется

диалоговое окно «Специальная вставка». Устанавливаем переключатель

«Добавить новые элементы рядов» и устанавливаем флажок «Категории

(подписи оси X) в первом столбце». В результате этой операции данные

добавлены на диаграмму корректно.

УПРАЖНЕНИЕ II.1. ПОСТРОЕНИЕ ЛИНЕЙНОГО ГРАФИКА. Для исходных данных примера II.1. постройте диаграмму, на первом шаге

выберите тип «График». Остальные шаги делаются аналогично построению

гистограммы.

В полученном графике имеется особенность: порядковые номера годов

расположены между метками делений на оси категорий. Для графика уместнее

было бы видеть подписи под метками оси. Чтобы добиться этого, вызовите

контекстное меню для оси категорий, выберите пункт «Формат оси/Шкала» и

снимите флажок «Пересечение с осьюY (значений) между категориями».

График примет привычный вид.

ПРИМЕР II.5. ПОСТРОЕНИЕ ГРАФИКА ОКРУЖНОСТИ Общее уравнение окружности имеет следующий вид:

Ax2 + Ay2 + 2Dx + 2Ey + F = 0.

Page 23: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 23

Окружностью называется множество точек плоскости, находящихся на

одинаковом расстоянии от одной, называемой центром.

Обычно общее уравнение приводят к виду нормальных уравнений

окружности:

х2 + у2 = R2 — уравнение окружности с центром в начале координат и

радиусом R.

(х - а)2 +(у -b )2 = R2 — уравнение окружности с центром (a; b).

Задача построения окружности по сравнению с параболой и гиперболой

имеет небольшие отличия, связанные с приведением уравнений к виду у = f(x).

В качестве примера рассмотрим построение верхней полуокружности

х2 + у2 = 4 в диапазоне ∈x [-2, 2] с шагом ∆ = 0,25.

Решение. Открываем чистый рабочий лист (команда Вставка ► Лист).

Этап 1. Ввод данных. Составляем таблицу данных (х и у). Пусть первый

столбец будет значениями х, а второй соответствующими показателями у. Для

этого в ячейку А1 вводим слово Аргумент, а в ячейку В1 — слово

Окружность. В ячейку А2 вводится первое значение аргумента — левая

граница диапазона (-2). В ячейку A3 вводится второе значение аргумента —

левая граница диапазона плюс шаг построения (-1,75). Затем, выделив блок

ячеек А2:А3, автозаполнением получаем все значения аргумента (за правый

нижний угол блока протягиваем до ячейки А18).

Далее вводим значения верхней полуокружности. В ячейку B2 необходимо

ввести ее уравнение, разрешенное относительно 24 xy −= . Для этого

табличный курсор необходимо поставить в ячейку В2 и на панели

инструментов Стандартная нажать кнопку Вставка функции (fx). В

появившемся диалоговом окне Мастер функций-шаг1 из 2 слева в поле

Категория указаны виды функций. Выбираем вид Математические. Справа в

поле Функция выбираем функцию Корень. Нажимаем кнопку OK. Появляется

диалоговое окно Корень. В рабочее поле вводим подкоренное выражение: 4 -

А2*А2. Нажимаем кнопку OK. В ячейке В2 появляется 0. Теперь необходимо

Page 24: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 24

скопировать функцию из ячейки В2. Автозаполнением копируем эту формулу в

диапазон В2:В18.

В результате должна быть получена таблица данных для построения

верхней полуокружности.

Этап 2. Выбор типа диаграммы. На панели инструментов Стандартная

необходимо нажать кнопку Мастер диаграмм. В появившемся диалоговом

окне Мастер диаграмм (шаг 1 из 4): тип диаграммы выберем тип — График,

вид — График с маркерами (левую среднюю диаграмму в правом окне).

После чего нажимаем кнопку Далее в диалоговом окне.

Этап 3. Указание диапазона. В появившемся диалоговом окне Мастер

диаграмм (шаг 2 из 4): источник данных диаграммы необходимо выбрать

вкладку Диапазон данных и в поле Диапазон указать интервал данных.

Для этого с помощью клавиши Delete необходимо очистить рабочее поле

Диапазон и. убедившись, что в нем остался только мигающий курсор, навести

указатель мыши на левую верхнюю ячейку данных (В1), нажать левую кнопку

мыши и, не отпуская ее, протянуть указатель мыши к правой нижней ячейке,

содержащей выносимые на диаграмму данные (В18), затем отпустить левую

кнопку мыши.

Далее необходимо указать в строках или столбцах расположены ряды

данных. Переключатель Ряды в с помощью указателя мыши следует

установить в положение столбцах (черная точка должна стоять около слова

столбцах).

Этап 4. Ввод подписей по оси Х (горизонтальной) В диалоговом окне

Мастер диаграмм (шаг 2 из 4): источник данных диаграммы необходимо

выбрать вкладку Ряд (щелкнув на ней указателем мыши) и в поле Подписи оси

Х указать диапазон подписей (в примере — Аргумент). Для этого следует

активизировать поле Подписи оси X, щелкнув в нем указателем мыши, и,

наведя указатель мыши на левую верхнюю ячейку подписей (А2), нажать

левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к правой

Page 25: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 25

нижней ячейке, содержащей выносимые на ось Х подписи (А18), затем

отпустить левую кнопку мыши.

После появления требуемой записи диапазона необходимо нажать кнопку

Далее.

Этап 5. Введение заголовков. В третьем окне требуется ввести заголовок

диаграммы и названия осей. Для этого необходимо выбрать вкладку

Заголовки, щелкнув на ней указателем мыши. Щелкнув в рабочем поле

Название диаграммы указателем мыши, ввести с клавиатуры в поле название

График полуокружности Затем аналогичным образом ввести в рабочие поля

Ось Х (категорий) и Ось Y (значений) соответствующие названия: Аргумент

и Значения.

После чего нажать кнопку Далее.

Этап 6. Завершение. Необходимо нажать кнопку Готово.

На текущем листе должна появиться следующая диаграмма.

Задания к разделу II. «Построение диаграмм и графиков в электронных

таблицах Excel».

1. Построить прямую 3x + 2y – 4 = 0 в диапазоне x ∈ [-1; 3] с шагом ∆=0,25.

2. Построить прямую 3x - 5y +15 = 0 в диапазоне x ∈ [-1; 3] с шагом ∆=0,25.

3. Построить параболу y=x2 в диапазоне x ∈ [-3; 3] с шагом ∆=0,25.

4. Построить график окружности 24 xy −= в диапазоне x ∈ [-2; 2] с шагом

∆=0,25. Указание. Использовать «точечный» график в «Мастере

диаграмм».

5. Построить график эллипса ⎟⎟⎠

⎞⎜⎜⎝

⎛−⋅=

914

2xy в диапазоне x [-3; 3] с шагом

∆=0,25. Указание. Использовать «точечный» график в «Мастере

диаграмм».

6. Треугольник на плоскости задан координатами своих вершин. Изобразить

его на диаграмме.

Page 26: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 26

Раздел III. Адресация в электронных таблицах Excel

Благодаря механизму «размножения» формул при их копировании удается

проводить вычисления над многими величинами.

ПРИМЕР III.1. СМЕШАННАЯ АДРЕСАЦИЯ Спроектировать на рабочем листе таблицу умножения чисел от 1 до 10.

Решение. Конечно, можно «вручную» набрать числа, составляющие

таблицу умножения, но лучше автоматизировать этот процесс, добиваясь как

можно меньшего количества нажатий клавиш.

Арифметическая прогрессия. Заполним первую строку, начиная с ячейки

B1 числами от одного до десяти. В ячейку B1 поместим число 1 и щелкнем по

зеленой галочке, чтобы остаться в этой ячейке. Выберем в меню пункт

«Правка/Заполнить/Прогрессия». Появится диалоговое окно «Прогрессия».

Укажем «Расположение» - «по строкам», «Тип» - «Арифметическая», «Шаг» -

1, «Предельное значение» - 10. Нажмем кнопку «OK».

Выделение и транспонирование. Теперь нужно разместить ту же

последовательность в первом столбце, в диапазоне A2:A11. Можно опять

воспользоваться диалоговым окном «Прогрессия», однако для разнообразия

освоим еще один полезный прием – транспонирование, но сначала посмотрим

методы выделения достаточно большого диапазона.

Как быстро выделить диапазон B1:K1? Он выходит за пределы экрана,

поэтому «красить» его мышью затруднительно. Выделим ячейку B1. Далее

можно предложить одни из следующих приемов:

• нажать клавиши Shift+Ctrl+→. Здесь Ctrl+→ - перемещение к

последней заполненной ячейке диапазон, а Shift – выделение;

• нажать Ctrl+* (* берется на цифровой клавиатуре). Это выделение

текущей области (current region), то есть области, содержащей

активную ячейку и ограниченной пустыми строками и столбцами;

Page 27: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 27

• в меню «Вид/Масштаб» указать 75 %. Теперь диапазон целиком

размещен в окне. В дальнейшем возвращаем прежний масштаб.

Итак, диапазон выделен. Скопируем его в буфер (Clipboard), нажав

Ctrl+Insert или Ctrl+C. Вокруг выделенного диапазона появится бегущая

пунктирная рамка. В строке подсказки появится сообщение: «Укажите ячейку и

нажмите Enter или выберите “Вставить”». Выделим ячейку A2. Нажмем правую

кнопку мыши. Появится контекстное меню. Выберем пункт «Специальная

вставка». Появится диалоговое окно «Специальная вставка». Установим

флажок «Транспонировать» и щелкнем кнопку «OK». Диапазон A2:A11 будет

заполнен числами от одного до десяти. Нажмем клавишу Esc (чтобы исчезла

бегущая пунктирная рамка, буфер при этом очистится).

Ввод формулы. В ячейку B2 нужно ввести формулу, которой потом можно

будет заполнить весь диапазон B2:K11. Введем в B2 формулу =A2*B1. Она

даст правильный ответ: 1. Что получится, если этой формулой заполнить

диапазон B2:B11? Результат представлен на рис. III.1. A B C D 1 1 2 32 1 13 2 24 3 65 4 246 5 1207 6 7208 7 50409 8 40320

10 9 36288011 10 3628800

Рис. III.1

Вместо ожидаемой последовательности 1, 2, …, 10 появились какие-то

огромные числа. Это значения факториала, которые вычисляются по формуле

n!=n(n-1)…1. Опять произошла путаница с адресацией! Какая, например,

Page 28: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 28

формула получилась в ячейке B11? Нетрудно убедиться, что =A11*B10. А

хотелось бы получить =A11*B1. Вроде бы мы знаем выход из положения.

Заменим в ячейке B2 формулу =A2*B1 на =A2*$B$1. Скопируем ее в интервал

B2:B11 и убедимся, что теперь в столбце B правильный результат. Теперь

выделим диапазон B2:K11 и нажмем клавиши Ctrl+R (R – Right - вправо).

Формулы распространятся на всю таблицу, но результат будет

неутешительным: содержимое B2:B11 будет повторено десять раз. В ячейке C3

мы прочитаем формулу =B3*$B$1, а нужно =A3*С1. Сформулируем: нужно,

чтобы в первом сомножителе не менялось обозначение столбца (A), номер

строки должен изменяться, а во втором сомножителе неизменным должен быть

номер строки (1), в то время как имя столбца должно изменяться. Как же этого

достичь?

Вспомним, что ранее, чтобы сделать ссылку абсолютной, мы ставили знак

доллара ($) перед именем столбца и номером строки. А что если оставить знак

доллара только перед одним из компонентов адреса? Тогда формула в ячейке

B2 примет вид =$A2*B$1. Скопируйте ее в остальные ячейки диапазона

B2:K11 и Вы получите таблицу умножения. А теперь посмотрим формулы в

стиле R1C1. Мы увидим во всех ячейках одну и ту же формулу RC1*R1C. Для

Вас должен быть ясен ее смысл, но все-таки повторим: первый сомножитель –

из текущей строки и первого столбца, второй сомножитель – из первой строки

и текущего столбца. Верните тип ссылок «A1».

Ранее у нас было два типа адресации ячеек: абсолютная ($B$3) и

относительная (B3). Теперь появилась еще и смешанная адресация ($B3 или

B$3). Как набирать в строке ввода такой адрес? Можно вводить знаки доллара

непосредственно с клавиатуры, но проще воспользоваться уже знакомой нам

функциональной клавишей F4. Поэкспериментируйте: ее последовательные

нажатия циклически меняют тип адресации ближайшей к курсору ввода

ссылке:

B3 ► $B$3 ► B$3 ► $B3 ► B3.

Page 29: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 29

Еще остановимся на вопросе, как быстрее выполнить копирование

формулы из ячейки B2 в диапазон B2:K11. Пусть мы создаем таблицу на

рабочем листе, где ранее ничего не вводилось (тогда корректно будет выделена

«последняя ячейка»). После заполнения блоков B1:K1 и A2:A11 и ввода

формулы в B2 нажмете клавиши Ctrl+Shift+End. Будет выделена область

B2:K11. Последовательно нажмите клавиши Ctrl+D (копирование вниз) Ctrl+R

(копирование вправо). Таблица создана. Напомним, что нажатие клавиш

Ctrl+End приводит к выделению «последней ячейки».

Форматирование. Сделаем вид таблицы умножения более

привлекательным. Выделим диапазоны с аргументами (B1:K1 и A2:A11) и

щелчком по кнопке «Полужирный» на панели инструментов

«Форматирование» отобразим их полужирным шрифтом.

Выполним подгонку ширины столбцов: поместим курсор внутрь таблицы,

выделим текущую область (клавиши Ctrl+*), в меню вберем команду

«Формат/Столбец/Подгонка ширины», снимем выделение.

Мы научились табулировать функцию двух переменных.

ПРИМЕР III.2. Построение эллипсоида Эллипсоидом называется поверхность, которая в некоторой системе

декартовых прямоугольных координат определяется уравнением:

12

2

2

2

2

2

=++cz

by

ax .

Это уравнение называется каноническим уравнением эллипсоида.

Эллипсоид представляет собой замкнутую овальную поверхность,

обладающую тремя взаимно перпендикулярными плоскостями симметрии.

Для построения эллипсоида в Excel каноническое уравнение необходимо

разрешить относительно переменной z (представить в виде z = f(x, y)).

Рассмотрим построение эллипсоида в Excel на примере уравнения:

Page 30: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 30

149

222

=++ zyx .

Пусть необходимо построить верхнюю часть эллипсоида, лежащую в

диапазонах: ∈x [–3; 3], [–2; 2] с шагом ∆ = 0,5 для обеих переменных. ∈y

Решение. Вначале необходимо разрешить уравнение относительно

переменной z. В примере

491

22 yxz −−= .

Введем значения переменной х в столбец A. Для этого в ячейку А1 вводим

символ х. В ячейку А2 вводится первое значение аргумента — левая граница

диапазона (-3). В ячейку A3 вводится второе значение аргумента — левая

граница диапазона плюс шаг построения (-2,5). Затем, выделив блок ячеек

А2:А3, автозаполнением получаем все значения аргумента (за правый нижний

угол блока протягиваем до ячейки А14).

Значения переменной y вводим в строку 1. Для этого в ячейку В1 вводится

первое значение переменной — левая граница диапазона (-2). В ячейку С1

вводится второе значение переменной — левая граница диапазона плюс шаг

построения (-1,5). Затем, выделив блок ячеек В1:С1, автозаполнением

получаем все значения аргумента (за правый нижний угол блока протягиваем

до ячейки J1).

Далее вводим значения переменной z. Для этого табличный курсор

необходимо поместить в ячейку В2 и на панели инструментов Стандартная

нажать кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер

функций-шаг 1 из 2 слева в поле Категория выбираем Математические.

Справа в поле Функция выбираем функцию Корень. Нажимаем кнопку OK.

Появляется диалоговое окно Корень. В рабочее поле вводим подкоренное

выражение: 1-$A2/\2/9-B$1/\2/4. Обращаем внимание, что символы $

предназначены для фиксации адреса столбца А — переменной х и строки 1 —

переменной у. Нажимаем кнопку ОK. В ячейке В2 появляется #ЧИСЛО! (при х

Page 31: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 31

= -3 и у = -2 точек рассматриваемого эллипсоида не существует). Теперь

необходимо скопировать функцию из ячейки В2. Для этого автозаполнением

(протягиванием вправо) копируем эту формулу вначале в диапазон B2:J2,

после чего (протягиванием вниз) — в диапазон B3:J14.

Для построения диаграммы на панели инструментов Стандартная

необходимо нажать кнопку Мастер диаграмм. В появившемся диалоговом

окне Мастер диаграмм (шаг 1 из 4): тип диаграммы указываем тип

диаграммы — Поверхность, и вид — Проволочная (прозрачная) поверхность

(правую верхнюю диаграмму в правом окне). После чего нажимаем кнопку

Далее в диалоговом окне.

В появившемся диалоговом окне Мастер диаграмм (шаг 2 из 4):

источник данных диаграммы необходимо выбрать вкладку Диапазон

данных и в поле Диапазон мышью указать интервал данных B2:J14.

Далее необходимо указать в строках или столбцах расположены ряды

данных. Это определит ориентацию осей х и у. В примере переключатель Ряды

в с помощью указателя мыши установим в положение столбцах.

Выбираем вкладку Ряд и в поле Подписи оси Х указываем диапазон

подписей. Для этого щелкните в нем указателем мыши и введите диапазон

подписей оси х — А2:А14.

Вводим значения подписей оси у. Для этого в рабочем поле Ряд указываем

первую запись Ряд 1 и в рабочее поле Имя, активизировав его указателем

мыши, вводим первое значение переменной у — -2. Затем в поле Ряд указываем

вторую запись Ряд 2 и в рабочее поле Имя вводим второе значение переменной

у — -1,5. Повторяем таким образом до последней записи — Ряд 9.

После появления требуемых записей необходимо нажать кнопку Далее.

В третьем окне требуется ввести заголовок диаграммы и названия осей.

Для этого необходимо выбрать вкладку Заголовки, щелкнув на ней указателем

мыши. Щелкнув в рабочем поле Название диаграммы указателем мыши,

ввести с клавиатуры в поле название: Эллипсоид. Затем аналогичным образом

Page 32: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 32

ввести в рабочие поля Ось Х (категорий), Ось Y (рядов данных) и Ось Z

(значений) соответствующие названия; х, у и z.

Далее следует нажать кнопку Готово, и после небольшого редактирования

будет получена диаграмма.

Задания к разделу III. «Адресация в электронных таблицах Excel».

1. Построить верхнюю часть эллипсоида: 1494

222

=++zyx . Диапазоны

изменения переменных x и y: x ∈ [-2; 2] с шагом ∆=0,5 и y ∈ [-3; 3] с

шагом ∆=1.

2. Построить верхнюю часть однополосного гиперболоида: 1494

222

=−+zyx .

Диапазоны изменения переменных x и y: x ∈ [-3; 3] с шагом ∆=0,5 и

y ∈ [-4; 4] с шагом ∆=1.

3. Построить эллиптический параболоид: zyx 294

22

=+ . Диапазоны изменения

переменных x и y: x ∈ [-2; 2] с шагом ∆=0,5 и y ∈ [-3; 3] с шагом ∆=1.

4. Построить верхнюю часть конуса: 0494

222

=++zyx . Диапазоны изменения

переменных x и y: x ∈ [-2; 2] с шагом ∆=0,5 и y ∈ [-3; 3] с шагом ∆=1.

5. Вычислить таблицу значений функции , где x меняется от

–2 до 3 с шагом 0.25, а y – от 0 до 2 с шагом 0.1. Результаты отображать с

тремя знаками после точки. Подгоните ширину столбцов. Постройте

график поверхности.

22),( yxyxf −=

6. Рассчитать таблицу значений синуса от 0° до 89° с шагом 1° с четырьмя

десятичными цифрами. Таблица должна выглядеть, как на рис. III.2.

Page 33: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 33

SIN 0 1 … 9

0 0.0000 0.0175 … 0.1564 10 0.1736 0.1908 … 03256 … … … … … 80 0.9848 0.9877 … 0.9998

Рис. III.2

(на пересечении третьей строки и третьего столбца sin (10°+1)=sin 11°).

Page 34: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 34

Раздел IV. Обработка блоков в электронных таблицах Excel

Здесь рассмотрены средства извлечения информации из блоков.

ПРИМЕР IV.1. ПОИСК ПОЗИЦИИ Введите на новом рабочем листе данные (рис. IV.1).

A B C D E F 1 4 1 4 3 2 2

Рис. IV.1

В A1 – искомое значение, в B1:E1 – массив, в F1 – формула

=ПОИСКПОЗ(A1, B1:E1, 0). Формула возвращает значение 2, так как 4 –

второй элемент в массиве. Если Вы введете в A1 число 5, то в F1 появится

сообщение об ошибке #Н/Д. Замените последний аргумент функции на 1. Если

Вы теперь введете в A1 число 3, то в F1 появится неверное значение 1.

Причина: последний аргумент, равный 1, требует, чтобы массив был

упорядочен по возрастанию. Иначе результат непредсказуем.

ПРИМЕР IV.2. ДРУГИЕ ФУНКЦИИ Введите в диапазон B4:D6 числа (рис. IV.2). Тогда формула

=ИНДЕКС(B4:D6, 2, 3) вернет значение 6, а формула =ИНДЕКС(B4:D6, 2, 4) вернет сообщение об ошибке #ССЫЛКА!, так как в блоке всего три столбца.

1 2 34 5 67 8 9

Рис. IV.2

Page 35: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 35

ПРИМЕР IV.3. Линейная интерполяция. Пусть функция задана таблицей (рис. IV.3).

X Y x1 y1x2 y2… … xn yn

Рис. IV.3

Значения аргумента расположены в порядке возрастания, но необязательно

равномерно. Требуется для данного значения x вычислить значение y,

используя линейную интерполяцию (то есть предполагая, что точки (xi, yi)

последовательно соединены отрезками прямых линий; для промежуточного

значения x отыскивается ордината точки на отрезке).

Английский математик Уиттекер остроумно заметил, что интерполяция –

это наука чтения между строк математической таблицы.

Решение. Прямая, проходящая через точки (xi, yi) и (xi+1, yi+1), описывается

уравнением ( ) iiii

ii yxxxxyy

y +−−−

=+

+

1

1 . Итак, план решения следующий: добавить

к таблице еще один столбец, в котором вычислить угловые коэффициенты

отрезков прямых по формуле ii

ii

xxyy

y−−

=+

+

1

1 , дать блоку с таблицей имя и

извлекать из таблицы нужные для расчета значения с помощью функции ВПР.

Попробуйте реализовать эту программу действий самостоятельно, а потом

читайте дальше.

Пусть таблица имеет вид (рис. IV. 4):

Page 36: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 36

A B C D E F 1 x y k x y 2 2 3 -1 3 2 3 4 1 1.333333 4 7 5 2 5 8 7 0

Рис. IV.4

В C2 введена формула =(B3-B2)/(A3-A2) и скопирована в C3:C4, в C5

введен 0. Блоку A2:C5 дано имя blk, ячейке E2 – имя x. В F3 введена формула

=ВПР(x, blk, 3)*(x- ВПР(x, blk, 1))+ВПР(x, blk, 2). Формула правильно работает для x>xi, в нашем случае для x>2. Для x>8

формула возвращает значение 7 (то есть функция экстраполируется справа

горизонтальной линией y=yn). Но если мы введем в E2 значение 1, то в F2

появится сообщение #Н/Д (НеДоступно). Нужно исправить формулу, чтобы

функция экстраполировалась слева горизонтальной линией y=y1. Для этого

воспользуемся функцией ЕНД. Эта функция возвращает значение ИСТИНА,

если ее аргументом является #Н/Д, и ЛОЖЬ в противном случае. Формула

принимает вид

=ЕСЛИ(ЕНД(ВПР(x,blk,1)),ИНДЕКС(blk,1,2),ВПР(x,blk,3)* (x-ВПР(x,blk,1))+ВПР(x,blk,2)).

ПРИМЕР IV.4. Построение линейного графика при неравномерной шкале

аргументов. Продолжим предыдущий пример. Если построить линейный

график на основе блока A1:B5, то график будет иметь искаженный вид, так как

на оси категорий расстояние между точками 4 и 7 равно расстоянию между 7 и

8. Как построить график на основе равномерной шкалы категорий?

Решение. Скопируем заголовки таблицы из A1:B1 в A7:B7. В A8:A14

разместим арифметическую прогрессию с начальным значением 2 и шагом 1. В

B8 разместим формулу =ВПР(A8, blk, 2, 0) и скопируем ее в B9:B14.

Page 37: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 37

Обратите внимание на последний аргумент функции ВПР: 0 соответствует

логическому значению ЛОЖЬ, то есть функции ВПР отыскивает точное

соответствие значению x, а не отыскивает наибольшее значение, не

превышающее заданное. Получим таблицу (рис. IV.5).

A B 7 x y 8 2 39 3 #Н/Д

10 4 111 5 #Н/Д12 6 #Н/Д13 7 514 8 7

Рис.IV.5

Значения 3, 5, 7 отсутствуют в исходной таблице, поэтому ВПР

возвращает #Н/Д. При построении линейного графика эти значения на

диаграмме не отображаются, зато шкала равномерная.

Если в функции ИНДЕКС опустить номер_строки, то функция вернет

весь столбец из массива, а если опустить номер_столбца, то вернет всю

строку (формулы, возвращающие массив значений, мы научимся создавать в

следующей главе). Этим можно воспользоваться, включив вызов функции

ИНДЕКС в качестве аргумента итоговой функции.

При работе с блоками полезно уметь автоматически определять их

положение и размер.

ПРИМЕР IV.5. Дадим диапазону B3:D6 имя «блок» (рис. IV.6).

Page 38: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 38

A B C D 1 2 3 1 2 3 4 4 5 6 5 7 8 9 6 10 11 12 7 8 начальная строка 3 9 начальный столбец 2 10 число строк 4 11 число столбцов 3

Рис. IV.6

В D8:D11 содержатся формулы: в D8 =СТРОКА(блок), в D9

=СТОЛБЕЦ(блок), в D10 =ЧСТРОК(блок), в D11 =ЧИСЛСТОЛБ(блок). Самостоятельно изучите эти функции по Справке.

Задания к разделу IV. «Обработка блоков в электронных таблицах Excel».

1. В блоке A1:A8 расположены числа. Найти порядковый номер

наименьшего числа. (Если таких чисел несколько, то найдите позицию

первого такого числа.)

2. Дан блок чисел размером 5 на 6 с именем tabl. Найти:

а) максимальный элемент в третьем столбце;

б) среднее арифметическое элементов четвертой строки.

Page 39: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 39

Раздел V. Табличные формулы и матричные операции в электронных таблицах

Excel

Табличные формулы позволяют в формулах обращаться с блоками, как с

обычными ячейками.

ПРИМЕР V.1. ВВОД И РЕДАКТИРОВАНИЕ ТАБЛИЧНЫХ ФОРМУЛ

Обратимся к задаче о вычислении дохода как разности прихода и расхода.

Введите исходные данные или, еще лучше скопируйте их из рабочей книги

(рис. V.1).

A B C D 1 Год Приход Расход 2 1992 200 150 3 1993 360 230 4 1994 410 250 5 1995 200 180

Рис. V.1.

Для расчета дохода мы вводили в ячейку D2 формулу =B2-C2, а затем

копировали ее в D3:D5. В этих ячейках появлялись формулы =B3-C3 и т.д.

Фактически здесь из вектор-столбца B2:B5 вычитается вектор-столбец C2:C5.

Можно ли непосредственно вычесть из вектора вектор одной формулой, а не

создавать отдельные формулы для компонент вектора? Да, это возможно.

Создание имен. Для наглядности дадим векторам имена. Выделите

диапазон со вторым и третьим столбцами таблицы (B1:C5) и дайте команду

меню «Вставка/Имя/Создать». Диапазон B2:B5 получит имя «Приход», а

диапазон C2:C5 получит имя «Расход». Убедитесь, что теперь можно выделять

эти блоки, выбирая из выпадающего списка в поле имени соответствующее

имя.

Page 40: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 40

Ввод табличной формулы с использованием имен диапазонов. Прежде мы

вводили формулу в отдельную ячейку. А сейчас введем ее в диапазон.

Подробно опишем шаги.

1. Выделим блок D2:D5. В этом блоке активна ячейка D2.

2. Наберем знак равенства =.

3. Нажмем функциональную клавишу F3. Появится диалоговое окно

«Вставка имени». Выберем имя «Приход» и щелкнем «OK». Формула

примет вид =Приход.

4. Наберем знак минус -.

5. Вновь нажмем клавишу F3. В диалоговом окне «Вставка имени»

выберем имя «Расход» и щелкнем «OK». Формула примет вид

=Приход-Расход.

6. Нажмем сочетание клавиш Ctrl+Shift+Enter. Во всех ячейках блока

появится формула {=Приход-Расход}.

Прокомментируем шаги. На третьем и пятом шаге мы выбираем имя из

списка имен. Можно было ввести имя непосредственно с клавиатуры, но

предложенный метод проще и нет риска ошибиться в наборе имени. На шестом

шаге мы нажимаем не Enter, как ранее при вводе формулы, а Ctrl+Shift+Enter

(при нажатии клавиши Enter должны быть нажаты обе клавиши Ctrl и Shift).

Это очень важно. Если бы мы нажали Enter, то формула была бы введена

только в активную ячейку блока D2 (Проверьте!). Фигурные скобки,

окружающие формулу, говорят о том, что это табличная формула. Эти скобки

нельзя набирать вручную (формула будет воспринята как текст).

Ввод табличной формулы. Разумеется, табличную формулу можно вводить

и без использования имен. Скопируйте блок A1:C5 в A11:C15. Повторим все

шаги. Выделим блок D12:D15. В этом блоке активной ячейкой является D12.

Наберем знак равенства =. Выделим блок B12:B15, наберем знак минус -,

выделим блок C12:C15, нажмем сочетание клавиш Ctrl+Shift+Enter. Во всех

Page 41: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 41

ячейках блока появится формула {=B12:B15-C12:C15}. Мы получили две

идентичные таблицы.

Выделение блока с табличной формулой. Выделите одну из ячеек блока,

например D2, и нажмите клавишиCtrl+/. Будет выделен весь блок. Если

проделать эту операцию над обычной ячейкой, будет выведено сообщение «Не

найдено ни одной ячейки, удовлетворяющей указанным условиям».

Есть и другой способ выделения. Нажмите клавишу F5 (эквивалент пункта

меню «Правка/Перейти»). В диалоговом окне щелкните кнопку «Выделить»,

установите переключатель «Текущий массив».

Изменение табличной формулы. Попытаемся очистить одну из ячеек,

занятую табличной формулой. Например, выделим ячейку D2 и нажмем

клавишу Del. Получим сообщение «Нельзя изменить часть массива». Удалить

блок можно только целиком.

Отредактировать формулу можно так: выделить блок с формулой

(клавиши Ctrl+/), нажать функциональную клавишу F2, ввести изменения в

формулу, нажать сочетание клавиш Ctrl+Shift+Enter. (Попробуйте, например,

ввести формулу {=Приход-Расход-1}, потом отмените это).

Коррекция табличной формулы при увеличении блока. Добавьте в обе

таблицы на рабочем листе строку

1996 240 200

Как теперь подсчитать доход за 1996 г.? Раньше, когда формулы

записывались в отдельные ячейки, мы бы поступили просто: скопировали бы

формулу из ячейки D5 в D6 (двойной щелчок мышью по маркеру заполнения).

Проделаем это для первой таблицы. Вместо ожидаемого результат 40 получим

результат 50, то есть число из первой ячейки блока с табличной формулой. Та

же операция для второй таблицы даст правильный результат 40, но в строке

формул мы увидим {=B16:B19-C16:C19} – образовался второй блок, что вовсе

не входило в наши планы. Легко убедиться (выделить D12 и нажать Ctrl+/), что

Page 42: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 42

размер исходного блока с табличной формулой остался неизменным. Удалим

формулы в ячейках D6 и D16.

Правильное решение для первой и второй таблиц разное. Для первой

таблицы изменим именованные блоки (выделим B1:B6 и

«Вставка/Имя/Создать», для каждого имени Excel задаст вопрос: «Заменить

существующее определение имени?» Отвечаем «Да»). Выделяем D2:D6,

нажимаем клавишу F2 (редактирование) и, ничего не меняя в формуле,

нажимаем клавиши Ctrl+Shift+Enter. Для второй таблицы выделяем D12:D16,

нажимаем клавишу F2 и редактируем формулу. Выделим в формуле подстроку

B12:B15 и выделим блок B12:B16, так же поступим с блоком C12:C15 либо

просто заменим в адресах блоков цифру 5 на цифру 6. нажимаем сочетание

клавиш Ctrl+Shift+Enter.

Коррекция табличной формулы при уменьшении блока. Теперь мы хотим

удалить из каждой строки строку для 1996 г. Для первой таблицы вновь

изменяем поименованные блоки (в ячейке D6 результат отображается как #Н/Д

- недоступно). Выделяем блок с табличной формулой, нажимая F2 и добавляем

в самое начало формулы апостроф (он расположен на клавише с буквой «Э»).

Формула превращается в текст. Вводим этот текст во все ячейки (клавиши

Ctrl+Enter). Табличная формула прекратила свое существование. Очищаем

последнюю строку таблицы. Выделяем блок D2:D5, нажимаем клавишу F2,

удаляем апостроф, нажимаем клавиши Ctrl+Shift+Enter. Аналогично поступаем

со второй таблицей.

Как видим, процедура непростая и неприятная. Для решения задачи проще

было воспользоваться другими методами. Но применение табличных формул,

как мы убедимся, дает такие дополнительные возможности, что с

неудобствами, связанными с изменениями этих формул, приходится смириться.

УПРАЖНЕНИЕ V.1. ВЫЧИСЛЕНИЕ ВЕКТОРОВ Перейдите на новый рабочий лист и назовите его «Векторы».

Page 43: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 43

Векторы – это наборы чисел, расположенные горизонтально (вектор-

строка) или вертикально (вектор-столбец). Основные операции над векторами:

- сложение;

- умножение.

В диапазоне A1:A4 дан вектор-столбец v с компонентами 3, -2, 4, 7. С

помощью табличной формулы вычислите вектор w=2v, расположив его в

соседнем столбце. Отработайте два способа: не используя имен и дав диапазону

имя v. Добавьте к вектору v пятую и шестую компоненты –12 и 8. Измените

табличную формулу. Удалите пятую компоненту вектора. Еще раз решите эту

задачу, но при условии, что v – вектор-строка (например, в D1:G1; результат

соответственно в D2:G2).

Замечание. Табличная формула {=2*v} означает умножение вектора v на

скаляр 2. Табличная формула {=2*v-1} с точки зрения векторного вычисления

бессмысленна (из вектора вычитается скаляр). Испытайте эту формулу. Она

эквивалентна векторной формуле 2v-(1, 1, …, 1).

ПРИМЕР V.2. ТАБЛИЧНЫЕ КОНСТАНТЫ

В блоке (векторе-столбце) A2:A5 записаны числа: 1, 2, 3, 4. Требуется

получить в блоке B2:D5 три вектора-столбца, каждый из которых представляет

собой результат умножения исходного вектора-столбца на числа 2, -3, 4.

Решение. Этот пример мы можем решить уже известным нам методом:

поместить числа 2, -3, 4 в диапазоне B1:D1, записать в ячейку B2 формулу

=$A2*B$1 и скопировать ее в остальные ячейки диапазона B2:D5.

Дадим более экономное решение. Выделим блок B2:D5. Запишем его в

табличную формулу {=A2:A5*{2; -3; 4}}. Получается тот же результат, но мы

сэкономили место на рабочем листе: теперь блок B1:D1 пуст.

Проанализируем решение. Табличный массив {2; -3; 4} можно

интерпретировать как вектор-строку, а блок A2:A5 как вектор-столбец.

Page 44: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 44

Получается, то мы перемножили вектор-столбец (4х1) на вектор-строку (1х3) и

получили матрицу (4х3):

[ ]⎥⎥⎥⎥

⎢⎢⎢⎢

−−−−

=−

⎥⎥⎥⎥

⎢⎢⎢⎢

161281296864432

432

4321

Но если мы введем формулу {={2; -3; 4}* A2:A5}, то получим тот же

результат, хотя с позиций матричной алгебры вектор-строку (1х3) нельзя

умножать на вектор-столбец (4х1) из-за несогласованности размеров (число

столбцов в первом сомножителе должно равняться числу строк во втором

сомножителе).

Итак, массив чисел, разделенных точкой с запятой и заключенных в

фигурные скобки, можно рассматривать как вектор-строку.

Если вместо точки с запятой использован другой разделитель – двоеточие,

то массив можно интерпретировать как вектор-столбец.

ПРИМЕР V.3. ФУНКЦИИ, ВОЗВРАЩАЮЩИЕ БЛОК

Получение части блока. Можно получить часть блока, если

воспользоваться функцией: СМЕЩ(ссылка, смещение_по строкам,

смещение_по столбцам, высота, ширина).

Пусть в блоке F3:H5 расположена матрица (рис. V.2).

Тогда для получения копии блока G4:H5 в блоке F9:G10 нужно выделить

F9:G10 и ввести табличную формулу {=СМЕЩ(F3, 1,1,2,2)}. Расшифруем эту

формулу: от ячейки F3 отступить вправо на один столбец и вниз на одну

строку, взять блок из двух строк и двух столбцов. Эта функция может быть

внутри итоговой функции, например, формула =МИН(СМЕЩ(F3, 1,1,2,2)) вернет число 11. Эту формулу не нужно вводить как табличную, так как

функция СМЕЩ в данном случае возвращает адрес G4:H5.

Page 45: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 45

6 5 103 14 118 12 24

Рис. V.2

Здесь приведена неполная информация о функции СМЕЩ. Прочитайте о

ней в Справке.

Для получения строки или столбца матрицы можно воспользоваться

функцией ИНДЕКС. Например, чтобы получить третий столбец блока tabl

(допустим, имеющего размер 5 на 5), введите в блок размером 5 на 1 табличную

формулу {=ИНДЕКС(tabl,,3)}.

ПРИМЕР V.4. МАТРИЧНЫЕ ОПЕРАЦИИ Перейдите на новый рабочий лист и назовите его «Матрицы».

Простейшие операции, которые можно проделывать с матрицами:

сложение (вычитание), умножение на число, перемножение, транспонирование,

вычисление обратной матрицы.

Сложение матриц и умножение матрицы на число. Сложить матрицы M

и N, где

⎥⎦

⎤⎢⎣

⎡−

−=

651732

M и ⎥⎦

⎤⎢⎣

⎡−

−=

532401

N .

Решение. Введем матрицы M и N в блоки A1:C2 и E1:G2. В блок A4:C5

введем табличную формулу {=A1:C2+E1:G2}. Обратите внимание, что

выделен блок, имеющий те же размеры, что и исходные матрицы.

Что произойдет, если перед вводом формулы выделить блок A4:D6? В

«лишних» ячейках появится #Н/Д, то есть «НеДоступно». А если выделить

A4:B5? Будет выведена только часть матрицы, без каких-либо сообщений.

Проверьте.

Page 46: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 46

Использование имен делает процедуру ввода табличной формулы намного

проще. Дайте диапазонам A1:C2 и E1:G2 имена M и N. В блок E4:G5 введите

табличную формулу {=M+N}. Результат, естественно, тот же.

Теперь вычислим линейную комбинацию матриц 2M - N. В блок A7:C8

введtv табличную формулу {=2*M-N}. У Вас должны получиться результаты

⎥⎦

⎤⎢⎣

⎡−−

=+11211131

NM ⎥⎦

⎤⎢⎣

⎡−

−=−

71341065

2 NM .

Рассмотренные примеры и упражнения подводят нас к мысли, что обычная

операция умножения применительно к блокам не вполне эквивалентна

перемножению матриц. И действительно, для матричных операций в Excel

предусмотрены функции, входящие в категорию «Математические».

Перечислим эти функции:

МОПРЕД – вычисление определителя матрицы;

МОБР – вычисление обратной матрицы;

МУМНОЖ – перемножение матриц;

ТРАНСП - транспонирование.

Первая из этих функций возвращает число, поэтому вводится как обычная

формула. Остальные функции возвращают блок ячеек, поэтому они должны

вводиться как табличные формулы. (Примеры, которые мы рассматривали в

этой главе ранее, можно было выполнить и без табличных формул. А вот для

матричных операций без табличных формул не обойтись.) Первая буква «М» в

названии трех функций – сокращение от слова «матрица».

ПРИМЕР V.5. МАТРИЧНЫЕ ОПЕРАЦИИ

Вычислить определитель и обратную матрицу для матрицы

⎥⎥⎥

⎢⎢⎢

−=

103780256692247873

A .

Page 47: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 47

Проверьте правильность вычисления обратной матрицы умножением ее на

исходную. Повторить эти действия для той же матрицы, но с элементом

a33=10.01.

Решение. Разместим исходную матрицу в блоке A1:C3.

В ячейке B5 поместим формулу для вычисления определителя

=МОПРЕД(A1:C3).

В блок A7:C9 введем формулу для вычисления обратной матрицы. Для

этого выделим блок A7:C9 (он имеет три строки и три столбца, как и исходная

матрица). Введем формулу {=МОБР(A1:C3)}. Даже если Вы используете

Мастер функций, нужно завершить ввод нажатием комбинации клавиш

Ctrl+Shift+Enter (вместо щелчка по кнопке «OK»). Если Вы забыли

предварительно выделить блок A7:C9, а ввели формулу в ячейку A7 как

обычную формулу Excel (закончив ввод нажатием Enter), то не нужно вводить

ее заново: выделите A7:C9, нажмите клавишу F2 (редактирование), но не

изменяйте формулу, просто нажмите Ctrl+Shift+Enter.

Скопируйте блок A1:C9 в блок E1:G9. Чуть-чуть изменим один элемент

исходной матрицы: в ячейку G3 вместо 10 введите 10.01. Изменения в

определителе и в обратной матрице разительны! Этот специально подобранный

пример иллюстрирует численную неустойчивость вычисления определителя и

обратной матрицы: малое возмущение на входе дает большое возмущение на

выходе.

Для дальнейших вычислений присвоим матрицам на рабочем листе имена:

A1:C3 – A, A7:C9 – Ainv, E1:G3 – AP, E7:G9 – Apinv. Чтобы в уже введенных

формулах появились эти имена, выберите в меню пункт

«Вставка/Имя/Применить», выделите в диалоговом окне нужные имена и

щелкните «OK».

Теперь проверим правильность вычисления обратной матрицы. В блок

A12:C14 введем формулу {=МУМНОЖ(A, Ainv)}, а в блок E12:G14 - формулу

Page 48: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 48

{=МУМНОЖ(AP, APinv)}. У Вас должен получиться результат, как на рис.

V.3.

A B C D E F G 1 -73 78 24 -73 78 24 2 92 66 25 92 66 25 3 -80 37 10 -80 37 10,01 4 5 1 -118,94 6 7 -256 108 366 2,222 -0,901 -3,077 8 -2920 1190 4033 24,558 -9,999 -33,907 9 8684 -3539 -11994 -37,012 29,754 100,840 10 11 12 1 -2,91E-11 -5,82E-11 1 1,14E-13 1,82E-12 13 0 1 0 0 1 0 14 0 0 1 -1,147E-13 5,68E-13 1

Рис. V.3

Как и следовало ожидать, получились матрицы, близкие к единичным.

В матричных операциях можно использовать массив констант. Это

матрицы, в которых элементы строк разделены точкой с запятой, а строки

отделяются двоеточием. С частными случаями (вектор-строкой и вектор-

столбцом) мы уже встречались. Вот пример вычисления определителя матрицы

A, введенной в формулу как массив констант:

=МОПРЕД({-73;78;24: 92;66;25: -80;37;10}). Заметим, что набор матричных операций в Excel беден. Если Вам нужно

серьезно работать с матрицами, лучше прибегнуть к помощи таких серьезных

математических пакетов, как MatLAB (Matrix LABoratory), Mathematica, Derive.

ПРИМЕР V.6. КОГДА БЕЗ ТАБЛИЧНЫХ ФОРМУЛ МОЖНО ОБОЙТИСЬ

В книгах по Excel нередко приводятся примеры решения задач с

использованием табличных формул, хотя можно обойтись и без них.

Page 49: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 49

Вычисление скалярного произведения двух векторов. Ему

соответствует известная практическая задача: в первом столбце даны цены на

единицу товара, в другом столбце – количество единиц товара. Нужно

вычислить общую стоимость, не заполняя вспомогательного столбца для

стоимости каждого товара (рис. V.4).

Здесь напрашивается ввод в ячейку B5 табличной формулы

{=СУММ(A2:A4*B2:B4)}. Но можно ввести обычную формулу

=СУММПРОИЗВ(A2:A4, B2:B4).

A B 1 Цена Количество 2 12,44 233 23,18 194 16,70 305 1227,54

Рис. V.4

ПРИМЕР V.7. КОГДА БЕЗ ТАБЛИЧНЫХ ФОРМУЛ МОЖНО ОБОЙТИСЬ

В блоке A1:A20 содержатся заглавные латинские буквы (в каждой ячейке

одна буква). Сосчитать количество букв «А». Предлагается формула

{=СУММ(ЕСЛИ(A1:A20=”A”, 1, 0))}. Но решение проще осуществить с

помощью обычной формулы {=СЧЕТЕСЛИ(A1:A20, “А”)}.

Задания к разделу V. «Табличные формулы и матричные операции в

электронных таблицах Excel».

1. Найти произведение матриц A × B, где . ( )⎟⎟⎟

⎜⎜⎜

⎛==

654

,321 BA

Page 50: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 50

2. Найти произведение матриц B × A, где . ( )321,654

=⎟⎟⎟

⎜⎜⎜

⎛= AB

3. Найти произведение матриц C = A × E,

где . ⎟⎟⎟

⎜⎜⎜

⎛=

⎟⎟⎟

⎜⎜⎜

⎛=

100010001

,027314532

EA

4. Найти матрицу, обратную данной: ⎟⎟⎟

⎜⎜⎜

−−−

−=

523432

321A .

5. Найти матрицу, обратную данной: ⎟⎟⎟

⎜⎜⎜

−−−

=513421342

A .

6. Найти матрицу, обратную данной: ⎟⎟⎟

⎜⎜⎜

−=

121223112

B .

7. Найти матрицу, обратную данной: . ⎟⎟⎟

⎜⎜⎜

−−=

421514132

C

8. Решить систему уравнений ⎩⎨⎧

=−=+

4054723

yxyx

.

9. Решить систему уравнений ⎪⎩

⎪⎨

=+−+=+−+=−+−

043405450232

zyxzyxzyx

.

10. Даны матрицы

⎥⎥⎥

⎢⎢⎢

⎡=

321212121

P и . ⎥⎥⎥

⎢⎢⎢

⎡−=

021024114

Q

Page 51: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 51

Вычислить определитель коммутатора этих матриц det(PQ-QP). Все

вычисления должны быть сосредоточены в одной ячейке.

11. Дана матрица

⎥⎦

⎤⎢⎣

⎡=

31142123

S .

Вычислить матрицу 2SST - E, где Т – операция транспонирования, E –

единичная матрица.

12. Решить систему уравнений Ax=b по формуле x=A-1 b.

⎪⎩

⎪⎨

−=−+=+−=+−

2073943

1452

zyxzyxzyx

13. Вычислить обратную матрицу для

⎥⎥⎥

⎢⎢⎢

−−−−

11027321114

и применить форматирование, чтобы элементы матрицы представляли собой

правильные дроби. Выбрать формат на основе величины определителя

матрицы.

14. В блоке A1:A5 и B1:B5 расположены векторы v и w. Вычислить квадрат

расстояния между этими векторами, то есть сумму квадратов разностей

элементов этих векторов, 1) используя табличную формулу, 2) подобрав

соответствующую функцию Excel.

Page 52: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 52

Раздел VI. Итоговые функции, статистические расчеты и теория вероятности в

электронных таблицах Excel

ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ЧИСЕЛ Одним из аспектов использования законов распределения вероятностей

является генерация случайных чисел. Бывают ситуации, когда необходимо

получить последовательность случайных чисел. Это, в частности, требуется для

моделирования объектов, имеющих случайную природу, по известному

распределению вероятностей. Например, можно использовать нормальное

распределение для моделирования совокупности данных по росту

индивидуумов, или использовать биномиальное распределение для двух

вероятных исходов, чтобы описать совокупность результатов бросания

монетки.

В этом случае можно воспользоваться процедурой Генерация случайных

чисел, которая является одним из инструментов пакета анализа. Эта процедура

используется для заполнения диапазона случайными числами, извлеченными из

одного или нескольких распределений.

Можно также воспользоваться функциями из категории Математические

Мастера функций: СЛЧИС() (в результате ее выполнения на листе

вычислений будет получено равномерно распределенное случайное число,

большее или равное 0 и меньшее 1) и СЛУЧМЕЖДУ() (в результате будет

получено случайное число, лежащее между произвольными заданными

значениями).

В случае использования процедуры Генерация случайных чисел

необходимо заполнить рабочие поля диалогового окна Генерация случайных

чисел.

В поле Число переменных вводится число столбцов значений, которые

необходимо разместить в выходном диапазоне. Если это число не введено, то

все столбцы в выходном диапазоне будут заполнены.

Page 53: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 53

В поле Число случайных чисел вводится число случайных значений,

которое необходимо вывести для каждой переменной. Каждое случайное

значение будет помещено в строке выходного диапазона. Если число

случайных чисел не будет введено, все строки выходного диапазона будут

заполнены.

В поле Распределение необходимо выбрать тип распределения, которое

следует использовать для генерации случайных переменных.

В их число входят:

• равномерное — характеризуется верхней и нижней границами.

Переменные извлекаются с одной и той же вероятностью для всех

значений интервала. Обычно приложения используют равномерное

распределение в интервале 0...1;

• нормальное — характеризуется средним значением и стандартным

отклонением. Обычно приложения для этого распределения

используют среднее значение 0 и стандартное отклонение 1;

• биномиальное — характеризуется вероятностью успеха (величина р)

для некоторого числа попыток. Например, можно сгенерировать

случайные двухальтернативные переменные по числу попыток,

сумма которых будет биномиальной случайной переменной;

• дискретное — характеризуется значением и соответствующим ему

интервалом вероятности. Диапазон должен состоять из двух

столбцов: левого, содержащего значения, и правого, содержащего

вероятности, связанные со значением в данной строке. Сумма

вероятностен должна быть равна 1;

• распределения Бернулли, Пуассона и Модельное.

В рабочее поле Параметры вводятся параметры выбранного

распределения.

Page 54: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 54

В поле Случайное рассеивание вводится произвольное значение, для

которого необходимо генерировать случайные числа. Впоследствии можно

снова использовать это значение для получения тех же самых случайных чисел.

В поле Выходной диапазон вводится ссылка на левую верхнюю ячейку

выходного диапазона. Размер выходного диапазона будет определен

автоматически, и на экран будет выведено сообщение в случае возможного

наложения выходного диапазона на исходные данные.

Если необходимо получить случайные числа на новом листе или в новой

книге — в полях Новый лист и Новая книга устанавливаются

соответствующие переключатели.

ПРИМЕР VI.1. ПОЛУЧЕНИЕ СЛУЧАЙНЫХ ЧИСЕЛ Вычисление числа π методом Монте_Карло. Будем бросать точку со

случайными координатами в единичный квадрат (его вершины имеют

координаты (0, 0), (1, 0), (1, 1), (0, 1)). Этот квадрат высекает из окружности

единичного радиуса с центром в начале координат сектор, площадь которого

составляет четверть площади окружности, то есть 4π . Если точка оказалась

внутри сектора, то фиксируем «удачное попадание» единицей, если точка

оказалась вне сектора, записываем нуль. После многократных бросаний

вычислим отношение числа удачных исходов к общему количеству бросаний.

Это число умножим на 4. Получим приближение к числу π.

Теперь организуем вычисления на рабочем листе. В A1:B1 поместим

заголовки: x и y. В A2 и B2 поместим формулы =СЛЧИС() – координаты

случайной точки внутри единичного квадрата. В C2 введем формулу

=ЕСЛИ(A2^2+B2^2<=1, 1, 0). (В Excel 97 можно ввести более изящную

формулу: =ЕСЛИ(x^2+y^2<=1, 1, 0).) Скопируем формулы в блок A3:C1001.

В C1002 разместим формулу =СУММ(C2:C1001)/250. (Проще всего ввести ее,

щелкнув кнопку «Автосумма» или нажав Alt+=, после нажатия наF2 добавить

Page 55: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 55

деление на 250). Таблица сконструирована. Теперь, нажимая F9, Вы увидите,

как в ячейке C1002 сменяют друг друга десятичные приближения (не слишком

точные) числа π.

ИТОГОВЫЕ ФУНКЦИИ Перечислим некоторые итоговые функции: МАКС и МИН – вычисление

максимального и минимального значений, СРЗНАЧ – среднее арифметическое

значение, ДИСП и СТАНДОТКЛОН – дисперсия и среднеквадратичное

отклонение от среднего значения. Прочие итоговые функции Вы можете найти

в Справке.

К итоговым можно отнести две очень интересные функции:

НАИБОЛЬШИЙ(блок, k) и НАИМЕНЬШИЙ(блок, k). Первая из этих функций

возвращает k-е наибольшее значение из множества данных, вторая –

наименьшее.

ПРИМЕР VI.2. ИТОГОВЫЕ ФУНКЦИИ Если внимательно изучить список функций, нетрудно заметить, что среди

них имеются функции, названия которых незначительно отличаются друг от

друга. Чтобы уяснить разницу между ними, рассмотрим следующую таблицу,

которую Вы легко можете воспроизвести (рис. VI.1).

Page 56: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 56

A B C D 1 7 3 =СЧЕТ($A1$:$A$4) 2 1 4 =СЧЕТЗ($A1$:$A$4) 3 куб 1 =МИН($A1$:$A$4) 4 4 0 =МИНА($A1$:$A$4) 5 7 =МАКС($A1$:$A$4) 6 7 =МАКСА($A1$:$A$4) 7 4 =СРЗНАЧ($A1$:$A$4) 8 3 =СРЗНАЧА($A1$:$A$4) 9 9 =ДИСП($A1$:$A$4) 10 10 =ДИСПА($A1$:$A$4) 11 6 =ДИСПР($A1$:$A$4) 12 7.5 =ДИСПРА($A1$:$A$4) 13 3 =СТАНДОТКЛОН($A1$:$A$4) 14 3.162 =СТАНДОТКЛОНА($A1$:$A$4) 15 2 =СРОТКЛ($A1$:$A$4)

Рис. VI.1

Здесь в блок A1:A4 введены три числа и строка «куб». К этому блоку

применены 15 итоговых функций. У них один и тот же аргумент $A1$:$A$4.

Функция СЧЕТ подсчитывает количество числовых значений в блоке, а

СЧЕТА – количество всех значений, не различая числовых и текстовых.

Серия функций отличается наличием или отсутствием на конце названия

буквы А (начиная с Excel 7.0). Если буква А отсутствует, то из блока для

расчета выбираются только числовые значения, а текстовые игнорируются.

Если имя итоговой функции заканчивается на букву А, то считается, что строка

имеет нулевое значение (если в диапазон входит ИСТИНА, то оно считается

эквивалентным значению 1). Формула =МИН($A1$:$A$4) возвращает значение

1, а формула =МИНА($A1$:$A$4) – значение 0, соответствующее строке

«куб».

Функция =СРЗНАЧ($A1$:$A$4) вычисляет свое значение по формуле

=СУММ($A$1:$A$4)/СЧЕТ($A$1:$A$4)=(7+1+4)/4,

а функция =СРЗНАЧА($A1$:$A$4) вычисляет свое значение по формуле

=СУММ($A$1:$A$4)/СЧЕТ($A$1:$A$4)=(7+1+0+4)/3.

Page 57: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 57

Помимо среднего значения, важной характеристикой набора точек

является разброс точек вокруг среднего значения. Для измерения степени

разброса служат дисперсия и квадратный корень из дисперсии –

среднеквадратичное отклонение. Но здесь есть одна тонкость. В

математической статистике различают генеральную совокупность наблюдений

(все возможные наблюдения) и выборку из генеральной совокупности. Для

расчета дисперсии выборки и дисперсии генеральной совокупности

используются разные формулы. Формула для дисперсии выборки реализована в

функции ДИСП, а для расчета дисперсии генеральной совокупности

используется несколько отличная формула – она реализована в функции

ДИСПР.

Сами формулы Вы можете найти в Справке, а также в любом курсе

математической статистики. Для больших размеров генеральной совокупности

и выборки значения, вычисленные по обеим формулам, различаются

незначительно. Чаще всего применяется ДИСП, и поэтому функция

СТАНДОТКЛОН – это квадратный корень из ДИСП. Окончание А в этих

функциях означает, что в расчет включаются текстовые величины, которые

полагаются равными нулю.

Для измерения разброса изредка применяется функция СРОТКЛ, которая

вычисляется как среднее арифметическое абсолютных величин отклонений от

среднего значения.

ПРИМЕР VI.3. Применение итоговых функций

1. Запустите программу Excel (Пуск ► Программы ►Microsoft

Excel).

2. Сделайте текущей ячейку A1 и введите в нее заголовок Результаты

измерений.

Page 58: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 58

3. Введите произвольные числа в последовательные ячейки столбца A,

начиная с ячейки A2.

4. Сделайте текущей первую свободную ячейку в столбце A.

5. Щелкните на кнопке Автосумма на стандартной панели

инструментов.

6. Убедитесь, что программа автоматически подставила в формулу

функцию СУММ и правильно выбрала диапазон ячеек для суммирования.

Нажмите клавишу ENTER.

7. Сделайте текущей следующую свободную ячейку в столбце A.

8. Щелкните на кнопке Вставка функции на стандартной панели

инструментов.

9. В списке Категория выберите пункт Статистические.

10. В списке Функция выберите функцию СРЗНАЧ и щелкните на

кнопке ОК.

11. Переместите методом перетаскивания палитру формул, если она

заслоняет нужные ячейки. Обратите внимание, что автоматически выбранный

диапазон включает все ячейки с числовым содержимым, включая и ту, которая

содержит сумму. Выделите правильный диапазон методом протягивания и

нажмите клавишу ENTER.

12. Используя порядок действий, описанный в пп. 6 – 10, вычислите

минимальное число в заданном наборе (функция МИН), максимальное число

(МАКС), количество элементов в наборе (СЧЕТ).

13. Сохраните рабочую книгу.

ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ В Excel для построения выборочных функций распределения

используются специальная функция ЧАСТОТА и процедура пакета анализа

Гистограмма.

• Функция ЧАСТОТА вычисляет частоты появления случайной

Page 59: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 59

величины в интервалах значений и выводит их как массив цифр.

Функция задается в качестве формулы массива.

ЧАСТОТА(массив_данных; массив_карманов). Здесь:

• массив_данных — это массив или ссылка на множество данных, для

которых вычисляются частоты.

• массив_карманов — это массив или ссылка на множество интервалов, в

которые группируются значения аргумента массив_данных. Отметим, что

количество элементов в возвращаемом массиве на единицу больше числа

элементов в массив_карманов. Дополнительный элемент в возвращаемом

массиве содержит количество значений, больших, чем максимальное значение

в интервалах.

• Процедура Гистограмма используется для вычисления выборочных

и интегральных частот попадания данных в указанные интервалы

значений. Процедура выводит результаты в виде таблицы и

гистограммы. Параметры диалогового окна Гистограмма:

• во Входной диапазон вводится диапазон исследуемых данных;

• в поле Интервал карманов (необязательный параметр) может вводиться

диапазон ячеек или необязательный набор граничных значений, определяющих

выбранные интервалы (карманы). Эти значения должны быть введены в

возрастающем порядке. В MS Excel вычисляется число попаданий данных

между началом интервала и соседним большим по порядку. При этом

включаются значения на нижней границе интервала и не включаются значения

на верхней границе. Если диапазон карманов не был введен, то набор

интервалов, равномерно распределенных между минимальным и

максимальным значениями данных, будет создан автоматически;

• рабочее поле Выходной диапазон предназначено для ввода ссылки на

левую верхнюю ячейку выходного диапазона. Размер выходного диапазона

будет определен автоматически;

Page 60: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 60

• переключатель Интегральный процент позволяет установить режим

генерации интегральных процентных отношений и включения в гистограмму

графика интегральных процентов;

• переключатель Вывод графика позволяет установить режим

автоматического создания встроенной диаграммы на листе, содержащем

выходной диапазон.

ПРИМЕР VI.4. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ЧАСТОТА Построить эмпирическое распределение веса студентов в килограммах для

следующей выборки: 64, 57, 63, 62, 58, 61, 63, 60, 60, 61, 65, 62, 62, 60, 64, 61,

59, 59, 63, 61, 62, 58, 58, 63, 61, 59, 62, 60, 60, 58, 61, 60, 63, 63, 58, 60, 59, 60, 59,

61, 62, 62, 63, 57, 61, 58, 60, 64, 60, 59, 61, 64, 62, 59, 65.

Решение

1. В ячейку А1 введите слово Наблюдения, а в диапазон А2:Е12 —

значения веса студентов.

2. Выберите ширину интервала 1 кг. Тогда при крайних значениях веса 57

кг и 65 кг получится 9 интервалов. В ячейки G1 и G2 введите названия

интервалов Вес и кг, соответственно. В диапазон G4:G12 введите граничные

значения интервалов (57, 58, 59, 60, 61, 62, 63, 64, 65).

3. Введите заголовки создаваемой таблицы: в ячейки Н1:Н2 —

Абсолютные частоты, в ячейки I1:I2 — Относительные частоты, в ячейки

J1:J2 — Накопленные частоты.

4. Заполните столбец абсолютных частот. Для этого выделите для них блок

ячеек Н4:H12 (используемая функция ЧАСТОТА задается в виде формулы

массива). С панели инструментов Стандартная вызовите Мастер функций

(кнопка fx). В появившемся диалоговом окне Мастер функций выберите

категорию Статистические и функцию ЧАСТОТА, после чего нажмите кнопку

OK. Появившееся диалоговое окно ЧАСТОТА необходимо за серое поле

Page 61: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 61

мышью отодвинуть вправо на 1-2 см от данных (при нажатой левой кнопке).

Указателем мыши в рабочее поле Массив_данных введите диапазон данных

наблюдений (А2:Е12). В рабочее поле Двоичный_массив мышью введите

диапазон интервалов (G4:G12). Последовательно нажмите комбинацию

клавиш Ctrl+Shift+Enter. В столбце Н4:Н12 появится массив абсолютных

частот.

5. В ячейке Н13 найдите общее количество наблюдений. Табличный

курсор установите в ячейку Н13. На панели инструментов Стандартная

нажмите кнопку Автосумма. Убедитесь, что диапазон суммирования указан

правильно (Н4:Н12), и нажмите клавишу Enter. В ячейке Н13 появится число

55.

6. Заполните столбец относительных частот. В ячейку I4 введите формулу

для вычисления относительной частоты: =Н4/Н$13. Нажмите клавишу Enter.

Протягиванием (за правый нижний угол при нажатой левой кнопке мыши)

скопируйте введенную формулу в диапазон I5:I12. Получим массив

относительных частот.

7. Заполните столбец накопленных частот. В ячейку J4 скопируйте

значение относительной частоты из ячейки I4 (0,036364). В ячейку J5 введите

формулу: =J4+I5. Нажмите клавишу Enter. Протягиванием (за правый нижний

угол при нажатой левой кнопке мыши) скопируйте введенную формулу в

диапазон J6:J12. Получим массив накопленных частот.

8. В результате, после форматирования получим таблицу.

9. Постройте диаграмму относительных и накопленных частот. Щелчком

указателя мыши по кнопке на панели инструментов вызовите Мастер

диаграмм. В появившемся диалоговом окне выберите вкладку Нестандартные

и тип диаграммы График/гистограмма2. После нажатия кнопки Далее

окажите диапазон данных — I1:J12 (с помощью мыши). Проверьте положение

переключателя Ряды в: столбцах. Выберите вкладку Ряд и с помощью мыши

введите в рабочее поле Подписи оси Х диапазон подписей оси Х: G4:G12.

Page 62: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 62

Нажав кнопку Далее, введите названия осей Х и Y в рабочее поле. Ось Х

(категорий) — Вес, Ось Y (значений) — Относ.частота, Вторая ось Y

(значений) — Накоплен.частота Нажмите кнопку Готово.

ПРИМЕР VI.5. ИСПОЛЬЗОВАНИЕ ПРОЦЕДУРЫ ГИСТОГРАММА

Для данных из предыдущего примера построить эмпирические

распределения, воспользовавшись процедурой Гистограмма.

Решение

1. В ячейку А1 введите слово Наблюдения, а в диапазон А2:Е12 —

значения веса студентов.

2. Для вызова процедуры Гистограмма выберите из меню Сервис

подпункт Анализ данных и в открывшемся окне в поле Инструменты

анализа укажите процедуру Гистограмма.

3. В появившемся окне Гистограмма заполните рабочие поля:

• во Входной диапазон введите диапазон исследуемых данных (А2:Е12);

• в Выходной диапазон — ссылку на левую верхнюю ячейку выходного

диапазона (F1). Установите переключатели в положение Интегральный

процент и Вывод графика;

После этого нажмите кнопку OK. В результате появляется таблица и

диаграмма.

Как видно, эта диаграмма несколько отличается от диаграммы

предыдущего примера. Это объясняется тем, что диапазон карманов не был

введен. Количество и границы интервалов определялись в процедуре

ГИСТОГРАММА автоматически. Если бы в рабочее поле Интервал карманов

был бы введен диапазон ячеек, определяющих выбранные интервалы, как в

предыдущем примере (57, 58, 59, ..., 65), то полученная диаграмма была бы

идентична предыдущей.

Page 63: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 63

ОПРЕДЕЛЕНИЕ ОСНОВНЫХ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК

В результате наблюдений или эксперимента получаются наборы данных,

называемые выборками. Для проведения их анализа данные подвергаются

статистической обработке. Первое, что всегда делается при обработке данных,

это вычисление элементарных статистических характеристик выборок (как

минимум: среднего, среднеквадратичного отклонения, ошибки среднего) по

каждому параметру и по каждой группе. Полезно также вычислить эти

характеристики для объединения родственных групп и суммарно по всем

данным.

ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ФУНКЦИЙ В мастере функций Excel имеется ряд специальных функции,

предназначенных для вычисления выборочных характеристик. Прежде всего,

это функции, характеризующие центр распределения.

• Функция СРЗНАЧ вычисляет среднее арифметическое из

нескольких массивов (аргументов) чисел. Аргументы число 1,

число2, ... — это от 1 до 30 массивов, для которых вычисляется

среднее. Например, если ячейки А1:А7 содержат числа 10, 14, 5, 6,

10,12 и 13, то средним арифметическим СРЗНАЧ(A1:А7) является

10.

• Функция СРГАРМ позволяет получить среднее гармоническое

множества данных. Среднее гармоническое — это величина,

обратная к среднему арифметическому обратных величин.

Например, СРГАРМ (10;14;5;6;10;12;13) равняется 8,317.

• Функция СРГЕОМ вычисляет среднее геометрическое значений

массива положительных чисел. Функцию СРГЕОМ можно

использовать для вычисления средних показателей динамического

ряда. Например, СРГЕОМ(10;14;5;6;10;12;13) равняется 9,414.

Page 64: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 64

• Функция МЕДИАНА позволяет получать медиану заданной

выборки. Медиана — это элемент выборки, число элементов

выборки со значениями больше которого и меньше которого равно.

Например, МЕДИАНА(10;14;5;6;10;12;13) равняется 10.

• Функция МОДА вычисляет наиболее часто встречающееся значение

в выборке. Например, МОДА(10;14;5;6;10;12;13) равняется 10.

К специальным функциям, вычисляющим выборочные характеристики,

характеризующие рассеяние вариант, относятся ДИСП, СТАНДОТКЛОН,

ПЕРСЕНТИЛЬ.

• Функция ДИСП позволяет оценить дисперсию по выборочным

данным. Например. ДИСП(10;14;5;6:10;12;13) равняется 11,667.

• Функция СТАНДОТКЛОН вычисляет стандартное отклонение.

Например, СТАНДОТКЛОН(10;14;5;6;10;12;13) равняется 3,416.

• Функция ПЕРСЕНТИЛЬ позволяет получить квантили заданной

выборки. Например, если ячейки А1:А7 содержат числа 10, 14, 5, 6,

10, 12 и 13, то квантилью со значением 0,1 является

ПЕРСЕНТИЛЬ(A1:A7;0,1) равная 5,6.

Форму эмпирического распределения позволяют оценить специальные

функции ЭКСЦЕСС и СКОС.

• Функция ЭКСЦЕСС вычисляет оценку эксцесса по выборочным

данным. Например, ЭКСЦЕСС(10;14;5;6;10;12;13) равняется -1,169.

• Функция СКОС позволяет оценить асимметрию выборочного

распределения. Например, СКОС(10;14;5;6;10;12;13) равняется

-0,527.

ПРИМЕР VI.6. ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ФУНКЦИЙ Рассматриваются ежемесячные количества реализованных турфирмой

путевок за периоды до и после начала активной рекламной компании. Ниже

приведены количества реализованных путевок по месяцам.

Page 65: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 65

С рекламой Без рекламы 162 135 156 126 144 115 137 140 125 121 145 112 151 130

Требуется найти средние значения и стандартные отклонения этих данных.

Решение

1. Для проведения статистического анализа прежде всего необходимо

ввести данные в рабочую таблицу. Откройте новую рабочую таблицу. Введите

в ячейку А1 слово Реклама, затем в ячейки А2:А8 — соответствующие

значения числа реализованных путевок. В ячейку В1 введите слова Без

рекламы, а в В2:В8 — значения числа реализованных путевок до начала

рекламной компании. Отметим, что рассматриваемые группы данных со

статистической точки зрения являются выборками.

2. При статистическом анализе прежде всего необходимо определить

характеристики выборки, и важнейшей характеристикой является среднее

значение. Для определения среднего значения в контрольной группе

необходимо установить табличный курсор в свободную ячейку (А9). На панели

инструментов нажмите кнопку Вставка функции (fx). В появившемся

диалоговом окне Мастер функций выберите категорию Статистические и

функцию СРЗНАЧ, после чего нажмите кнопку OK. Появившееся диалоговое

окно СРЗНАЧ за серое поле мышью отодвиньте вправо на 1-2 см отданных

(при нажатой левой кнопке). Указателем мыши введите диапазон данных

контрольной группы для определения среднего значения (А2:А8). Нажмите

кнопку OK. В ячейке А9 появится среднее значение выборки — 145,714.

В качестве упражнения определите в ячейке В9 среднее значение числа

реализованных путевок без активной рекламы. Для этого табличный курсор

установите в ячейку В9. На панели инструментов нажмите кнопку Вставка

функции (fx). В появившемся диалоговом окне выберите категорию

Page 66: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 66

Статистические и функцию СРЗНАЧ, после чего нажмите кнопку OK.

Появившееся диалоговое окно СРЗНАЧ за серое поле мышью отодвиньте

вправо на 1-2 см отданных (при нажатой левой кнопке). Указателем мыши

введите диапазон данных для определения среднего значения (В2:В8).

Нажмите кнопку OK. В ячейке В9 появится среднее значение выборки —

125,571.

3. Следующей по важности характеристикой выборки является мера

разброса элементов выборки от среднего значения. Такой мерой является

среднее квадратичное или стандартное отклонение. Для определения

стандартного отклонения в контрольной группе необходимо установить

табличный курсор в свободную ячейку (А10). На панели инструментов

нажмите кнопку с В появившемся диалоговом окне Мастер функций выберите

категорию Статистические и функцию СТАНДОТКЛОН, после чего нажмите

кнопку OK. Появившееся диалоговое окно СТАНДОТКЛОН за серое поле

мышью отодвиньте вправо на 1-2 см отданных (при нажатой левой кнопке).

Указателем мыши введите диапазон данных контрольной группы для

определения стандартного отклонения (А2:А8). Нажмите кнопку OK. В ячейке

А10 появится стандартное отклонение выборки — 12,298. Существует правило,

согласно которому при отсутствии артефактов данные должны лежать в

диапазоне М ± 3σ (в примере 145,7±36,9).

В качестве упражнения требуется в ячейке В10 определить стандартное

отклонение числа проданных путевок до начала рекламной компании. Для

этого установите табличный курсор в ячейку В10. На панели инструментов

нажмите кнопку Вставка функции (fx). В появившемся диалоговом окне

выберите категорию Статистические и функцию СТАНДОТКЛОН, после чего

нажмите кнопку OK. Появившееся диалоговое окно СТАНДОТКЛОН за серое

поле мышью отодвиньте вправо на 1-2 см от данных (при нажатой левой

кнопке). Указателем мыши введите диапазон данных для определения

Page 67: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 67

стандартного отклонения (В2:В8). Нажмите кнопку OK. В ячейке B10

появится стандартное отклонение выборки — 10,277.

ИСПОЛЬЗОВАНИЕ ИНСТРУМЕНТОВ ПАКЕТА АНАЛИЗА В пакете Excel помимо мастера функций имеется набор более мощных

инструментов для работы с несколькими выборками и углубленного анализа

данных, называемый Пакет анализа, который может быть использован для

решения задач статистической обработки выборочных данных.

Для установки раздела Анализ данных в пакете Excel сделайте

следующее:

• в меню Сервис выберите команду Надстройки;

• в появившемся списке установите флажок Пакет анализа.

Ввод данных. Исследуемые данные следует представить в виде таблицы,

где столбцами являются соответствующие показатели. При создании таблицы

Excel информация вводится в отдельные ячейки. Совокупность ячеек,

содержащих анализируемые данные, называется входным диапазоном.

Последовательность обработки данных. Для использования

статистического пакета анализа данных необходимо:

• указать курсором мыши на пункт меню Сервис и щелкнуть левой

кнопкой мыши;

• в раскрывающемся списке выбрать команду Анализ данных (если

команда Анализ данных отсутствует в меню Сервис, то

необходимо установить в Excel пакет анализа данных);

• выбрать необходимую строку в появившемся списке Инструменты

анализа;

• ввести входной и выходной диапазоны и выбрать необходимые

параметры.

Нахождение основных выборочных характеристик. Для определения

характеристик выборки используется процедура Описательная статистика.

Page 68: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 68

Процедура позволяет получить статистический отчет, содержащий

информацию о центральной тенденции и изменчивости входных данных. Для

выполнения процедуры необходимо:

• выполнить команду Сервис ► Анализ данных;

• в появившемся списке Инструменты анализа выбрать строку

Описательная статистика и нажать кнопку OK;

• в появившемся диалоговом окне указать входной диапазон, то есть

ввести ссылку на ячейки, содержащие анализируемые данные. Для

этого следует навести указатель мыши на левую верхнюю ячейку

данных, нажать левую кнопку мыши и, не отпуская ее, протянуть

указатель мыши к правой нижней ячейке, содержащей

анализируемые данные, затем отпустить левую кнопку мыши;

• указать выходной диапазон, то есть ввести ссылку на ячейки, в

которые будут выведены результаты анализа. Для этого следует

поставить переключатель в положение Выходной диапазон (навести

указатель мыши и щелкнуть левой клавишей), далее навести

указатель мыши в поле ввода Выходной диапазон и щелкнуть левой

кнопкой мыши, затем указатель мыши навести на левую верхнюю

ячейку выходного диапазона и щелкнуть левой кнопкой мыши;

• в разделе Группировка переключатель установить в положение по

столбцам;

• установить флажок в поле Итоговая статистика;

• нажать кнопку OK.

В результате анализа в указанном выходном диапазоне для каждого

столбца данных выводятся следующие статистические характеристики:

среднее, стандартная ошибка (среднего), медиана, мода, стандартное

отклонение, дисперсия выборки, эксцесс, асимметричность, интервал,

минимум, максимум, сумма, счет, наибольшее, наименьшее, уровень

надежности.

Page 69: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 69

ПРИМЕР VI.7. ИСПОЛЬЗОВАНИЕ ПАКЕТА АНАЛИЗА Рассматривается зарплата основных групп работников гостиницы:

администрации, обслуживающего персонала и работников ресторана. Были

получены следующие данные: Администрация Персонал Ресторан 4500 2100 3200 4000 2100 3000 3700 2000 2500 3000 2000 2000 2500 2000 1900 1900 1800 1800 1800

Необходимо определить основные статистические характеристики в

группах данных.

Решение

1. Для использования инструментов анализа исследуемые данные следует

представить в виде таблицы, где столбцами являются соответствующие

показатели. Значения зарплат сотрудников администрации введите в диапазон

А1:А5, обслуживающего персонала — в диапазон В1:В8 и т.д. В результате

получится таблица, представленная выше.

2. Далее необходимо провести элементарную статистическую обработку

Для этого, указав курсором мыши на пункт меню Сервис, выберите команду

Анализ данных. Затем в появившемся списке Инструменты анализа

выберите строку Описательная статистика.

3. В появившемся диалоговом окне в рабочем поле Входной интервал

укажите входной диапазон — A1:C8. Активировав переключателем рабочее

поле Выходной интервал, укажите выходной диапазон — ячейку А9. В

разделе Группировка переключатель установите в положение по столбцам.

Установите флажок в поле Итоговая статистика и нажмите кнопку OK.

Page 70: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 70

В результате анализа в указанном выходном диапазоне для каждого

столбца данных получим соответствующие результаты.

Все полученные характеристики были рассмотрены ранее в разделе

«Выборочные характеристики», за исключением последних четырех:

• минимум — значение минимального элемента выборки;

• максимум — значение максимального элемента выборки;

• сумма — сумма значений всех элементов выборки;

• счет — количество элементов в выборке.

Среди этих характеристик наиболее важными являются показатели

Среднее, Стандартная ошибка (среднего) и Стандартное отклонение.

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Помимо описательной статистики, важной областью является также

аналитическая статистика. Аналитическая статистика или теория

статистических выводов ориентирована на обработку данных, полученных в

ходе эксперимента, с целью формулировки выводов, имеющих прикладное

значение. Здесь решается вопрос, отражают ли наблюдаемые данные

объективно существующую реальность. Указанный вопрос решается проверкой

соответствующих статистических гипотез. При этом могут выявляться

достоверности различий между выборками, взаимосвязи между выборками,

влияющие факторы и т.п.

АНАЛИЗ ОДНОЙ ВЫБОРКИ В MS Excel для более точного вычисления границ доверительного

интервала и при числе элементов в выборке п < 30 можно воспользоваться

функцией ДОВЕРИТ или процедурой Описательная статистика.

Функция ДОВЕРИТ(альфа; станд_откл; размер) определяет полуширину

доверительного интервала и содержит следующие параметры:

• Альфа — уровень значимости, используемый для вычисления

Page 71: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 71

доверительной вероятности. Доверительная вероятность равняется

100*(1 - алъфа)% процентам, или, другими словами, альфа, равное

0,05, означает 95%-ный уровень доверительной вероятности;

• Станд_откл — стандартное отклонение генеральной совокупности

для интервала данных, предполагается известным;

• Размер — это размер выборки.

ПРИМЕР VI.8. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ДОВЕРИТ Найти границы 95%-ного доверительного интервала для среднего

значения, если у 25 телефонных аккумуляторов среднее время разряда в

режиме ожидания составило 140 часов, а стандартное отклонение — 2,5 часа.

Решение

1. Откройте новую рабочую таблицу. Установите табличный курсор в

ячейку А1.

2. Для определения границ доверительного интервала необходимо на

панели инструментов Стандартная нажать кнопку Вставка функции (fx). В

появившемся диалоговом окне Мастер функций выберите категорию

Статистические и функцию ДОВЕРИТ, после чего нажмите кнопку OK.

3. В рабочие поля появившегося диалогового окна ДОВЕРИТ с

клавиатуры введите условия задачи: Альфа - 0,05; Станд_откл - 2,5; Размер -

25. Нажмите кнопку OK.

4. В ячейке А1 появится полуширина 95%-ного доверительного интервала

для среднего значения выборки — 0,979981. Другими словами, с 95%-ным

уровнем надежности можно утверждать, что средняя продолжительность

разряда аккумулятора составляет 140 ± 0,979981 часа или от 139,02 до 140,98

часа.

Page 72: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 72

ПРИМЕР VI.9. ИСПОЛЬЗОВАНИЕ ПАКЕТА АНАЛИЗА Пусть имеется выборка, содержащая числовые значения: 13, 15, 17, 19, 22,

25, 19. Необходимо определить границы 95%-ного доверительного интервала

для среднего значения и для нахождения «выскакивающей» варианты.

Решение

1. В диапазон А1:А7 введите исходный ряд чисел.

2. Далее вызовите процедуру Описательная статистика. Для этого,

указав курсором мыши на пункт меню Сервис, выберите команду Анализ

данных. Затем в появившемся списке Инструменты анализа выберите

строку Описательная статистика.

3. В появившемся диалоговом окне в рабочем поле Входной интервал:

укажите входной диапазон — А1:А7. Переключателем активизируйте

Выходной интервал и укажите выходной диапазон — ячейку В1. В разделе

Группировка переключатель установите в положение по столбцам. Установите

флажок в левое поле Уровень надежности: и в правом поле (%) — 95. Затем

нажмите кнопку OK.

4. В результате анализа в указанном выходном диапазоне для

доверительной вероятности 0,95 получаем значения доверительного интервала.

Уровень надежности — это половина доверительного интервала для

генерального среднего арифметического. Из полученного результата следует,

что с вероятностью 0,95 среднее арифметическое для генеральной

совокупности находится в интервале 18,571 ± 3,77. Здесь 18,571 — выборочное

среднее M для рассматриваемого примера, которое находится обычно

процедурой Описательная статистика одновременно с доверительным

интервалом.

5. Для нахождения доверительных границ для «выскакивающей» варианты

необходимо полученный выше доверительный интервал умножить на n (в

примере — 7 , то есть 3,77* 7 = 9,975). В Excel это можно выполнить

следующим образом. Табличный курсор установите в свободную ячейку С4;

Page 73: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 73

введите с клавиатуры знак =; мытью укажите на ячейку СЗ (в которой

находится результат вычислений); введите с клавиатуры знак *; с панели

инструментов Стандартная вызовите Вставка функции (fx); выберите

категорию Математические, тип функции Корень; нажмите OK, введите с

клавиатуры число п = 7 и нажмите OK. В результате получим в ячейке С4

значение доверительного интервала — 9,975.

Таким образом, варианта, попадающая в интервал 18,571 ± 9,975,

считается принадлежащей данной совокупности с вероятностью 0,95

Выходящая за эти границы может быть отброшена с уровнем значимости α =

0,05.

Проверка соответствия теоретическому распределению. Следующей

задачей, возникающей при анализе одной выборки, является оценка меры

соответствия (расхождения) полученных эмпирических данных и каких-либо

теоретических распределений. Это связано с тем, что в большинстве случаев

при решении реальных задач закон распределения и его параметры неизвестны.

В то же время применяемые статистические методы в качестве предпосылок

часто требуют определенного закона распределения.

Наиболее часто проверяется предположение о нормальном распределении

генеральной совокупности, поскольку большинство статистических процедур

ориентировано на выборки, полученные из нормально распределенной

генеральной совокупности.

Для оценки соответствия имеющихся экспериментальных данных

нормальному закону распределения обычно используют графический метод,

выборочные параметры формы распределения и критерии согласия.

Графический метод позволяет давать ориентировочную оценку

расхождения или совпадений распределений.

При большом числе наблюдений (п > 100) неплохие результаты дает

вычисление выборочных параметров формы распределения: эксцесса и

Page 74: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 74

асимметрии. Принято говорить, что предположение о нормальности

распределения не противоречит имеющимся данным, если асимметрия близка к

нулю, то есть лежит в диапазоне от -0,2 до 0,2, а эксцесс — от -1 до 1.

Наиболее убедительные результаты дает использование критериев

согласия. Критериями согласия называют статистические критерии,

предназначенные для проверки согласия опытных данных и теоретической

модели. Здесь нулевая гипотеза Но представляет собой утверждение о том, что

распределение генеральной совокупности, из которой получена выборка, не

отличается от нормального. Среди критериев согласия большое

распространение получил непараметрический критерий χ2 (хи-квадрат). Он

основан на сравнении эмпирических частот интервалов группировки с

теоретическими (ожидаемыми) частотами, рассчитанными по формулам

нормального распределения.

Отметим, что сколько-нибудь уверенно о нормальности закона

распределения можно судить, если имеется не менее 50 результатов

наблюдений. В случаях меньшего числа данных можно говорить только о том,

что данные не противоречат нормальному закону, и в этом случае обычно

используют графические методы оценки соответствия. При большем числе

наблюдений целесообразно совместное использование графических и

статистических (например, тест хи-квадрат или аналогичные) методов оценки,

естественно дополняющих друг друга.

Использование критерия согласия хи-квадрат. Для применения

критерия желательно, чтобы объем выборки п ≥ 40, выборочные данные были

сгруппированы в интервальный ряд с числом интервалов не менее 7, а в каждом

интервале находилось не менее 5 наблюдений (частот).

Отметим, что сравниваться должны именно абсолютные частоты, а не

относительные (частости). При этом, как и любой другой статистический

критерий, критерий хи-квадрат не доказывает справедливость нулевой

гипотезы (соответствие эмпирического распределения нормальному), а лишь

Page 75: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 75

может позволить ее отвергнуть с определенной вероятностью (уровнем

значимости).

В MS Excel критерий хи-квадрат реализован в функции ХИ2ТЕСТ.

Функция ХИ2ТЕСТ вычисляет вероятность совпадения наблюдаемых

(фактических) значений и теоретических (гипотетических) значений. Если

вычисленная вероятность ниже уровня значимости (0,05), то нулевая гипотеза

отвергается и утверждается, что наблюдаемые значения не соответствуют

нормальному закону распределения. Если вычисленная вероятность близка к 1,

то можно говорить о высокой степени соответствия экспериментальных данных

нормальному закону распределения.

Функция имеет следующие параметры:

ХИ2ТЕСТ(фактический_интервал; ожидаемый_интервал). Здесь:

• фактический_интервал — это интервал данных, которые содержат

наблюдения, подлежащие сравнению с ожидаемыми значениями;

• ожидаемый_интервал — это интервал данных, который содержит

теоретические (ожидаемые) значения для соответствующих

наблюдаемых.

ПРИМЕР VI. 10. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ХИ2ТЕСТ Проверить соответствие выборочных данных 64, 57, 63, 62, 58, 61, 63, 60,

60, 61, 65, 62, 62, 60, 64, 61, 59, 59, 63, 61, 62, 58, 58, 63, 61, 59, 62, 60, 60, 58, 61,

60, 63, 63, 58, 60, 59, 60, 59, 61, 62, 62, 63, 57, 61, 58, 60, 64, 60, 59, 61, 64, 62, 59,

65 нормальному закону распределения.

Решение

1. Повторите пункты 1-7 решения примера VI.4.

2. Найдите теоретические частоты нормального распределения. Для этого

предварительно необходимо найти среднее значение и стандартное отклонение

выборки.

Page 76: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 76

В ячейке I13 с помощью функции СРЗНАЧ найдите среднее значение для

данных из диапазона А2:Е12 (60,855). В ячейке J13 с помощью функции

СТАНДОТКЛОН найдите стандартное отклонение для этих же данных (2,05). В

ячейки K1 и K2 введите название столбца — Теоретические частости. Затем с

помощью функции НОРМРАСП найдите теоретические частости. Установите

курсор в ячейку K4, вызовите указанную функцию и заполните ее рабочие

поля: х — G4; Среднее - $I$13; Стандартное_откл — $J$13. Интегральный —

0. Получим в ячейке K4 0,033. Далее протягиванием скопируйте содержимое

ячейки K4 в диапазон ячеек K5:K12. Затем в ячейки L1 и L2 введите название

нового столбца — Теоретические частоты. Установите курсор в ячейку L4 и

введите формулу =Н$13*K4. Далее протягиванием скопируйте содержимое

ячейки L4 в диапазон ячеек L5:L12.

3. С помощью функции ХИ2ТЕСТ определите соответствие данных

нормальному закону распределения. Для этого установите табличный курсор в

свободную ячейку L13. На панели инструментов Стандартная нажмите кнопку

Вставка функции (fx). В появившемся диалоговом окне Мастер функций

выберите категорию Статистические и функцию ХИ2ТЕСТ, после чего

нажмите кнопку OK. Появившееся диалоговое окно ХИ2ТЕСТ отодвиньте

вправо на 1-2 см от данных. Указателем мыши в рабочие поля введите

фактический Н4:Н12 и ожидаемые L4:L12 диапазоны частот. Нажмите кнопку

OK. В ячейке L13 появится значение вероятности того, что выборочные

данные соответствуют нормальному закону распределения — 0,9842.

4. Поскольку полученная вероятность соответствия экспериментальных

данных р = 0,98 много больше, чем уровень значимости α = 0,05, то можно

утверждать, что нулевая гипотеза не может быть отвергнута и, следовательно,

данные не противоречат нормальному закону распределения. Более того,

поскольку полученная вероятность р = 0,98 близка к 1, можно говорить о

высокой степени вероятности того, что экспериментальные данные

соответствуют нормальному закону.

Page 77: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 77

АНАЛИЗ ДВУХ ВЫБОРОК Выявление достоверности различий. Следующей задачей

статистического анализа, решаемой после определения основных выборочных

характеристик и анализа одной выборки, является совместный анализ

нескольких выборок. Важнейшим вопросом, возникающим при анализе двух

выборок, является вопрос о наличии различий между этими выборками.

Обычно для этого проводят проверку статистических гипотез о

принадлежности обеих выборок одной генеральной совокупности или о

равенстве генеральных средних. В рассмотренном ранее такие различия

выявляются путем сравнения данных реализации турфирмой путевок за

периоды до и после начала активной рекламной компании. Если сопоставить

средние значения числа реализованных за месяц путевок до (125,6) и после

(145,7) начала рекламной компании, видно, что они различаются. Можно ли по

этим данным сделать вывод об эффективности рекламной компании?

Для решения задач такого типа используются так называемые критерии

различия. Для проверки одной и той же гипотезы могут быть использованы

разные статистические критерии. Правильный выбор критерия определяется

как спецификой данных и проверяемых гипотез, так и уровнем статистической

подготовки исследователя.

Статистические критерии различия подразделяются на параметрические и

непараметрические критерии. Параметрические критерии служат для проверки

гипотез о параметрах определенных распределений генеральной совокупности

(чаще всего нормального распределения). Непараметрнческие критерии для

проверки гипотез не используют предположений о законе распределения

генеральной совокупности и не требуют знания параметров распределения.

Параметрические критерии. Параметрические критерии служат для

проверки гипотез о положении и рассеивании. Из параметрических критериев

наибольшей популярностью при проверке гипотез о равенстве генеральных

Page 78: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 78

средних (математических ожиданий) пользуется t-критерий Стьюдента (t-

критерий различия).

Критерий Стьюдента (t) наиболее часто используется для проверки

гипотезы: «Средние двух выборок относятся к одной и той же совокупности».

Критерий позволяет найти вероятность того, что оба средних относятся к одной

и той же совокупности. Если эта вероятность р ниже уровня значимости (р <

0,05), то принято считать, что выборки относятся к двум разным

совокупностям.

При использовании t-критерия можно выделить два случая. В первом

случае его применяют для проверки гипотезы о равенстве генеральных средних

двух независимых, несвязанных выборок (так называемый двухвыборочный t-

критерий). В этом случае есть контрольная группа и опытная группа,

состоящие, например, из разных пациентов, количество которых в группах

может быть различно.

Во втором случае, когда одна и та же группа объектов порождает числовой

материал для проверки гипотез о средних, используется так называемый

парный t-критерий. Выборки при этом называют зависимыми, связанными.

Например, измеряется содержание лейкоцитов у здоровых животных, а затем у

тех же самых животных после облучения определенной дозой излучения.

В обоих случаях в принципе должно выполняться требование

нормальности распределения исследуемого признака в каждой из

сравниваемых групп и равенства дисперсий в сравниваемых совокупностях.

Однако на практике по большому счету корректное применение t-критерия

Стьюдента для двух групп часто бывает затруднительно, поскольку достоверно

проверить эти условия удается далеко не всегда.

Для оценки достоверности отличий по критерию Стьюдента принимается

нулевая гипотеза, что средние выборок равны между собой. Затем вычисляется

значение вероятности того, что изучаемые события (например, количества

реализованных путевок в обеих выборках) произошли случайным образом.

Page 79: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 79

В MS Excel для оценки достоверности отличий по критерию Стьюдента

используются специальная функция ТТЕСТ и процедуры пакета анализа (см.

раздел «Использование Пакета анализа для выявления различий» ниже).

Все перечисленные инструменты вычисляют вероятность,

соответствующую критерию Стьюдента, и используются, чтобы определить,

насколько вероятно, что две выборки взяты из генеральных совокупностей,

которые имеют одно и то же среднее.

Функция ТТЕСТ использует следующие параметры:

ТТЕСТ(массив1;массив2;хвосты;тип). Здесь:

• массив 1 — это первое множество данных;

• массив2 — это второе множество данных;

• хвосты — число хвостов распределения. Обычно число хвостов

равно 2;

• тип — это вид исполняемого t-теста. Возможны 3 варианта выбора:

1 — парный тест, 2 — двухвыборочный тест с равными

дисперсиями, 3 — двухвыборочный тест с неравными дисперсиями.

ПРИМЕР VI.11. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ТТЕСТ Выявить, достоверны ли отличия при сравнении данных реализации

турфирмой путевок за периоды до и после начала активной рекламной

компании (VI.5).

Решение

1. Введите данные (как в пункте 1 примера VI.6).

2. Для выявления достоверности отличий табличный курсор установите в

свободную ячейку (A11). На панели инструментов необходимо нажать кнопку

Вставка функции (fx). В появившемся диалоговом окне Мастер функций

выберите категорию Статистические и функцию ТТЕСТ, после чего нажмите

кнопку OK. Появившееся диалоговое окно ТТЕСТ за серое поле мышью

отодвиньте вправо на 1-2 см от данных (при нажатой левой кнопке).

Page 80: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 80

Указателем мыши введите диапазон данных контрольной группы в поле

Массив 1 (A2:A8). В поле Массив 2 введите диапазон данных исследуемой

группы (В2:В8). В поле Хвосты всегда вводится с клавиатуры цифра 2 (без

кавычек), а в поле Тип с клавиатуры введите цифру 3. Нажмите кнопку OK. В

ячейке А11 появится значение вероятности - 0,006295.

3. Поскольку величина вероятности случайного появления анализируемых

выборок (0,006295) меньше уровня значимости (α = 0,05), то нулевая гипотеза

отвергается. Следовательно, различия между выборками не случайные и

средние выборок считаются достоверно отличающимися друг от друга.

Поэтому на основании применения критерия Стьюдента можно сделать вывод о

большей эффективности реализации путевок после начала рекламной компании

(p < 0,05).

Как указывалось выше, при использовании t-критерия выделяют два

основных случая. В первом случае его применяют для проверки гипотезы о

равенстве генеральных средних двух независимых, несвязанных выборок (так

называемый двухвыборочный t-критерий). В этом случае есть две различных

выборки, количество элементов в которых может быть также различно. При

заполнении диалогового окна ТТЕСТ при этом указывается Тип 3.

Во втором случае, когда одна и та же группа объектов порождает числовой

материал для проверки гипотез о средних, используется так называемый

парный t-критерий. Выборки при этом называют зависимыми, связанными (при

заполнении диалогового окна ТТЕСТ указывается Тип 1). Например,

сравнивается реализация путевок двумя фирмами в соответствующие месяцы.

В качестве упражнения рассмотрим пример.

ПРИМЕР VI.12. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ТТЕСТ Сравнивается количество наличных денег у двух групп студентов (в

рублях): 30 10

Page 81: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 81

30 20 40 30 50 40 60 50

Необходимо определить достоверность различия между группами при

двух вариантах постановки задачи:

• группы состоят из различных студентов (тип 3);

• группы состоят из одних и тех же студентов, но первая — до

посещения буфета, а вторая — после (тип 1).

Решение. В ячейки С1:С5 введите количество денег у студентов первой

группы. В ячейки D1:D5 введите количество денег у студентов второй группы.

1. Табличный курсор установите в свободную ячейку (С6). На панели

инструментов необходимо нажать кнопку Вставка функции (fx). В

появившемся диалоговом окне Мастер функций выберите категорию

Статистические и функцию ТТЕСТ, после чего нажмите кнопку OK.

Появившееся диалоговое окно ТТЕСТ за серое поле мышью отодвиньте вправо

на 1-2 см от данных (при нажатой левой кнопке). Указателем мыши ввести

диапазон данных первой группы в поле Массив 1 (С1:С5). В поле Массив 2

введите диапазон данных второй группы (D1:D5). В поле Хвосты всегда

вводится цифра 2 (без кавычек), а в поле Тип введите цифру 3. Нажмите кнопку

OK. В ячейке С6 появится значение вероятности - 0,228053.

Поскольку величина вероятности случайного появления анализируемых

выборок (0,228053) больше уровня значимости (α = 0,05), то нулевая гипотеза

не может быть отвергнута (принимается). Следовательно, различия между

выборками могут быть случайными и средние выборок не считаются

достоверно отличающимися друг от друга. Поэтому на основании применения

критерия Стьюдента нельзя сделать вывод о достоверности отличий двух групп

студентов по количеству карманных денег, имеющихся у них (р > 0,05).

2. Табличный курсор установите в свободную ячейку (D6). На панели

инструментов нажмите кнопку Вставка функции (fx). В появившемся

Page 82: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 82

диалоговом окне Мастер функций выберите категорию Статистические и

функцию ТТЕСТ, после чего нажмите кнопку OK. Появившееся диалоговое

окно ТТЕСТ за серое поле мышью отодвиньте вправо на 1-2 см от данных (при

нажатой левой кнопке). Указателем мыши введите диапазон данных первой

группы в поле Массив 1 (С1:С5). В поле Массив 2 введите диапазон данных

второй группы (D1:D5). В поле Хвосты всегда вводится цифра 2 (без кавычек),

а в поле Тип введите цифру 1. Нажмите кнопку OK. В ячейке D6 появится

значение вероятности — 0,003883.

Поскольку величина вероятности случайного появления анализируемых

выборок (0,003883) меньше уровня значимости (α = 0,05), то нулевая гипотеза

отвергается. Следовательно, различия между выборками не могут быть

случайными и средние выборок считаются достоверно отличающимися друг от

друга. Поэтому на основании применения критерия Стьюдента можно сделать

вывод о том, что в двух группах студентов выявлены достоверные отличия по

количеству карманных денег (р < 0,05), что явилось результатом посещения

буфета.

Таким образом, ясно, что применение различных типов критерия

Стьюдента может приводить к различным результатам на основании одних и

тех же исходных данных. Можно предложить следующий приблизительный

способ выбора типа критерия: если не ясно, какой тип критерия выбирать,

выбирается тип 3; если очевидно, что выборки зависимы, связаны (например,

это одни и те же студенты), то следует выбирать тип 1.

Критерий Фишера. Критерий Фишера используют для проверки гипотезы

о принадлежности двух дисперсий одной генеральной совокупности и,

следовательно, их равенстве. При этом предполагается, что данные независимы

и распределены по нормальному закону. Гипотеза о равенстве дисперсий

принимается, если отношение большей дисперсии к меньшей меньше

критического значения распределения Фишера.

Page 83: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 83

критFFssF <= ,2

1

21 ,

где зависит от уровня значимости и числа степеней свободы для

дисперсий в числителе и знаменателе.

критF

В MS Excel для расчета уровня вероятности выполнения гипотезы о

равенстве дисперсий могут быть использованы функция ФТЕСТ(массив

1;массив2) и процедура пакета анализа Двухвыборочный F-тест для

дисперсий.

Непараметрические критерии. Непараметрические критерии

используются в тех случаях, когда закон распределения данных отличается от

нормального или неизвестен. Из большого числа непараметрических критериев

рассмотрим критерий хи-квадрат.

Критерий согласия χ2. Бывают ситуации, когда необходимо сравнить две

относительные или выраженные в процентах величины (доли). Примером

может служить случай проверки успешности трудоустройства молодых

специалистов, когда известен процент трудоустроившихся выпускников двух

институтов. Для проверки достоверности различий здесь критерий Стьюдента

применить не удастся. В таких задачах обычно используют критерий χ2 (хн-

квадрат). Критерий хи-квадрат относится к непараметрическим критериям.

Здесь, как и в случае с критерием Стьюдента, принимается нулевая

гипотеза о том, что выборки принадлежат к одной генеральной совокупности.

Кроме того, определяется ожидаемое значение результата. Обычно это среднее

значение между выборками рассматриваемого показателя. Затем оценивается

вероятность того, что ожидаемые значения и наблюдаемые принадлежат к

одной генеральной совокупности.

В MS Excel критерий хи-квадрат реализован в функции ХИ2ТЕСТ

Функция ХИ2ТЕСТ вычисляет вероятность совпадения наблюдаемых

(фактических) значений и теоретических (гипотетических) значений. Если

вычисленная вероятность ниже уровня значимости (0,05), то нулевая гипотеза

Page 84: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 84

отвергается и утверждается, что наблюдаемые значения не соответствуют

теоретическим (ожидаемым) значениям.

Функция имеет следующие параметры:

ХИ2ТЕСТ(фактический_интервал;ожидаемый_интервал). Здесь:

• фактический _интервал — это интервал данных, которые содержат

наблюдения, подлежащие сравнению с ожидаемыми значениями;

• ожидаемый _интервал — это интервал данных, который содержит

теоретические (ожидаемые) значения для соответствующих

наблюдаемых.

ПРИМЕР VI. 13. ИСПОЛЬЗОВАНИЕ ФУНКЦИИ ХИ2ТЕСТ Пусть после окончания двух институтов экономического профиля

трудоустроилось по специальности из первого института 90 человек, а из

второго 60 (обе группы молодых специалистов включали по 100 человек).

Решение

1. Принимается нулевая гипотеза, что выборки принадлежат к одной

генеральной совокупности.

2. Определяется ожидаемое значение результата (среднее значение между

выборками): (60 + 90)/2 = 75, то есть мы ожидали, что разницы между группами

нет, и в обоих случаях должно было трудоустроиться по 75 человек.

3. Затем вычисляется значение вероятности того, что изучаемые события

(трудоустройство в обеих выборках) произошли случайным образом. Для этого

введите данные в рабочую таблицу: 90 — в ячейку Е1, 60 — в F1, 75 — в E2,

F2. Табличный курсор установите в свободную ячейку (ЕЗ). На панели

инструментов нажмите кнопку Вставка функции (fx). В появившемся

диалоговом окне Мастер функций выберите категорию Статистические и

функцию ХИ2ТЕСТ, после чего нажмите кнопку OK. Появившееся диалоговое

окно ХИ2ТЕСТ за серое поле мышью отодвиньте вправо на 1-2 см от данных

(при нажатой левой кнопке). Указателем мыши введите диапазон данных

Page 85: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 85

наблюдавшегося количества трудоустроившихся в поле Фактический

интервал (E1:F1). В поле Ожидаемый интервал введите диапазон данных

предполагаемого количества трудоустроившихся (E2:F2). Нажмите кнопку

OK. В ячейке ЕЗ появится значение вероятности — 0,014306.

4. Поскольку величина вероятности случайного появления анализируемых

выборок (0,0143) меньше уровня значимости (α = 0,05), то нулевая гипотеза

отвергается. Следовательно, различия между выборками не могут быть

случайными и выборки считаются достоверно отличающимися друг от друга.

Поэтому на основании применения критерия хи-квадрат можно сделать вывод о

том, что в двух группах выпускников выявлены достоверные отличия по

успешности трудоустройства (р < 0,05), что, по-видимому, явилось результатом

более высокой репутации выпускников первого института.

ИСПОЛЬЗОВАНИЕ ИНСТРУМЕНТА ПАКЕТ АНАЛИЗА ДЛЯ ВЫЯВЛЕНИЯ РАЗЛИЧИЙ МЕЖДУ ВЫБОРКАМИ

Для анализа двух выборок с помощью t-теста Стьюдента могут быть

использованы следующие процедуры: Парный двухвыборочный t-тест для

средних; Двухвыборочный t-тест с одинаковыми дисперсиями и

Двухвыборочный t-тест с различными дисперсиями. Как указывалось в

разделе «Анализ двух выборок», в общем случае необходимо воспользоваться

процедурой Двухвыборочный t-тест с различными дисперсиями, так как

процедуры Парный двухвыборочный t-тест для средних и Двухвыборочный t-

тест с одинаковыми дисперсиями относятся к частным, специальным случаям.

Для выполнения процедуры анализа необходимо:

• выполнить команду Сервис ► Анализ данных;

• в появившемся списке Инструменты анализа выбрать строку

Двухвыборочный t-тест с различными дисперсиями, щелкнуть

левой кнопкой мыши и нажать кнопку OK;

• в появившемся диалоговом окне указать Интервал переменной 1,

Page 86: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 86

то есть ввести ссылку на первый диапазон анализируемых данных,

содержащий один столбец данных. Для этого следует навести

указатель мыши на верхнюю ячейку первого столбца данных, нажать

левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к

нижней ячейке, содержащей анализируемые данные, затем отпустить

левую кнопку мыши;

• указать Интервал переменной 2, то есть ввести ссылку на второй

диапазон анализируемых данных, содержащий один столбец данных.

Для этого следует навести указатель мыши в поле ввода Интервал

переменной 2 и щелкнуть левой кнопкой мыши, затем навести

указатель мыши на верхнюю ячейку второго столбца данных, нажать

левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к

нижней ячейке, содержащей анализируемые данные, затем отпустить

левую кнопку мыши;

• указать выходной диапазон, то есть ввести ссылку на ячейки, в

которые будут выведены результаты анализа. Для этого следует

поставить флажок в левое поле Выходной диапазон (навести

указатель мыши и щелкнуть левой кнопкой), далее навести указатель

мыши на правое поле ввода Выходной диапазон и щелкнуть левой

кнопкой мыши, затем указатель мыши навести на левую верхнюю

ячейку выходного диапазона и щелкнуть левой кнопкой мыши.

Размер выходного диапазона будет определен автоматически, и на

экран будет выведено сообщение в случае возможного наложения

выходного диапазона на исходные данные.

• нажать кнопку OK.

Результаты анализа. В выходной диапазон будут выведены: средняя,

дисперсия и число наблюдений для каждой переменной, гипотетическая

разность средних, df (число степеней свободы), значение t-статистики, Р(Т<= t)

Page 87: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 87

одностороннее, t критическое одностороннее, Р(Т<= t) двухстороннее, t

критическое двухстороннее.

Интерпретация результатов. Если величина вероятности случайного

появления анализируемых выборок (Р(Т<= t) двухстороннее) меньше уровня

значимости (α = 0,05). принято считать, что различия между выборками не

случайные, то есть различия достоверные.

ПРИМЕР VI.14. ИСПОЛЬЗОВАНИЕ ПАКЕТА АНАЛИЗА Рассматривается заработная плата обслуживающего персонала и

работников ресторана.

Персонал Ресторан 2100 3200 2100 3000 2000 2500 2000 2000 2000 1900 1900 1800 1800 1800

Можно ли по этим данным сделать вывод о большей зарплате работников

ресторана?

Решение. Для решения задач такого типа используются так называемые

критерии различия, в частности, t-критерий Стьюдента.

1. Введите данные: для персонала — в диапазон А1:А8; работников

ресторана — в диапазон В1:В6.

2. Выбор процедуры осуществляется из трех вариантов t- теста. Поскольку

данные не имеют попарного соответствия, число их различно и говорить о

равенстве дисперсий затруднительно, выберите процедуру Двухвыборочный

t-тест с различными дисперсиями.

Page 88: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 88

Для реализации процедуры в пункте меню Сервис выберите строку

Анализ данных и далее укажите курсором мыши на строку Двухвыборочный

t-тест с различными дисперсиями.

3. В появившемся диалоговом окне задайте Интервал переменной 1. Для

этого наведите указатель мыши на верхнюю ячейку столбца (А1), нажмите

левую кнопку мыши и, не отпуская ее, протяните указатель мыши к нижней

ячейке (А8), затем отпустите левую кнопку мыши.

4. Аналогично укажите Интервал переменной 2, то есть введите ссылку

на диапазон второго столбца В1:В6.

5. Далее укажите выходной диапазон. Для этого поставьте переключатель

в положение Выходной диапазон (наведите указатель мыши и щелкните левой

кнопкой), затем наведите указатель мыши на правое поле ввода Выходной

диапазон и, щелкнув левой кнопкой мыши, указатель мыши наведите на левую

верхнюю ячейку выходного диапазона (С1). Щелкните левой кнопкой мыши и

нажмите кнопку OK.

Результаты анализа. В выходном диапазоне С1:Е13 появятся результаты

процедуры Двухвыборочный t-тест с различными дисперсиями.

Интерпретация результатов. Средние значения заработной платы (1962

руб. для персонала и 2400 руб. для работников ресторана) довольно сильно

отличаются. Тем не менее нулевая гипотеза о том, что разницы между

группами нет (то есть средние выборок равны между собой), отвергнута быть

не может. Это следует из того, что величина вероятности случайного появления

анализируемых выборок (P(T<= t двухстороннее) больше уровня значимости (α

= 0,05). А это позволяет говорить, что различия между выборками могут быть

случайными, то есть различия недостоверные.

Таким образом, из полученных результатов исследования вытекает, что на

основании приведенных данных нельзя сделать вывод о достоверно большей

зарплате работников ресторана.

Page 89: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 89

ДИСПЕРСИОННЫЙ АНАЛИЗ В случае необходимости оценить достоверность различия между

несколькими группами наблюдений (выборками) используют методы

дисперсионного анализа.

Дисперсионный анализ предназначен для исследования задачи о действии

на измеряемую случайную величину (отклик) одного или нескольких

независимых факторов, имеющих несколько градаций. Причем в

однофакторном, двухфакторном и т.д. анализе влияющие на результат факторы

считаются известными, и речь идет только о выяснении существенности или

оценке этого влияния.

Применение дисперсионного анализа возможно, если можно предполагать

соответствие выборочных групп генеральным совокупностям с нормальным

распределением и независимость распределений наблюдений в группах.

В дальнейшем ограничимся рассмотрением простейшего случая

дисперсионного анализа — однофакторного анализа. При этом задача

заключается в том, чтобы сравнить дисперсию, обусловленную случайными

причинами, с дисперсией, вызываемой наличием исследуемого фактора. Если

они значимо различаются, то считают, что фактор оказывает статистически

значимое влияние на исследуемую переменную. Значимость различий

проверяется по критерию Фишера.

Влияние случайной составляющей характеризуют внутригрупповая

дисперсия, а влияние изучаемого фактора — межгрупповая. Внутригрупповая

дисперсия рассчитывается по формуле:

∑∑= =

−−

=n

i

m

jiij Mx

nms

1 1

222 )(

)1(1 ,

межгрупповая:

∑=

−−

=m

ii MM

ms

1

221 )(

11 .

Page 90: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 90

Здесь М — общее среднее, ∑=

=n

jiji x

nM

1

1 , т — количество групп, п —

количество элементов в группе.

В MS Excel для проведения однофакторного дисперсионного анализа

используется процедура Однофакторный дисперсионный анализ.

Для проведения дисперсионного анализа необходимо:

• ввести данные в таблицу, так чтобы в каждом столбце оказались

данные, соответствующие одному значению исследуемого фактора, а

столбцы располагались в порядке возрастания (убывания) величины

исследуемого фактора;

• выполнить команду Сервис ► Анализ данных;

• в появившемся диалоговом окне Анализ данных в списке

Инструменты анализа выбрать процедуру Однофакторный

дисперсионный анализ, указав курсором мыши и щелкнув левой

кнопкой мыши. Затем нажать кнопку OK;

• в появившемся диалоговом окне задать Входной интервал, то есть

ввести ссылку на диапазон анализируемых данных, содержащий все

столбцы данных. Для этого следует навести указатель мыши на

верхнюю левую ячейку диапазона данных, нажать левую кнопку

мыши и, не отпуская ее, протянуть указатель мыши к нижней правой

ячейке, содержащей анализируемые данные, затем отпустить левую

кнопку мыши;

• в разделе Группировка переключатель установить в положение по

столбцам;

• указать выходной диапазон, то есть ввести ссылку на ячейки, в

которые будут выведены результаты анализа. Для этого следует

поставить переключатель в положение Выходной интервал

(навести указатель мыши и щелкнуть левой кнопкой), далее навести

указатель мыши на правое поле ввода Выходной интервал и

Page 91: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 91

щелкнуть левой кнопкой мыши, затем указатель мыши навести на

левую верхнюю ячейку выходного диапазона и щелкнуть левой

кнопкой мыши. Размер выходного диапазона будет определен

автоматически, и на экран будет выведено сообщение в случае

возможного наложения выходного диапазона на исходные данные.

• нажать кнопку OK.

Результаты анализа. Выходной диапазон будет включать в себя

результаты дисперсионного анализа: средние, дисперсии, критерий Фишера и

другие показатели.

Интерпретация результатов. Влияние исследуемого фактора

определяется по величине значимости критерия Фишера, которая находится в

таблице Дисперсионный анализ на пересечении строки Между группами и

столбца P-Значение. В случаях, когда P-Значение < 0,05, критерий Фишера

значим и влияние исследуемого фактора можно считать доказанным.

Кроме рассмотренной процедуры однофакторного дисперсионного

анализа, для проведения двухфакторного дисперсионного анализа в пакете

анализа реализованы процедуры Двухфакторный дисперсионный анализ с

повторениями и Двухфакторный дисперсионный анализ без повторений.

ПРИМЕР VI.15. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ Необходимо выявить, влияет ли расстояние от центра города на степень

заполняемости гостиниц. Пусть введены 3 уровня расстояний от центра города:

1) до 3 км, 2) от 3 до 5 км и 3) свыше 5 км. Данные заполняемости

представлены в таблице.

Расстояние Заполняемость, % до 3 км 92 98 89 97 90 94 от З до 5 км 90 86 84 91 83 82 свыше 5 км 87 79 74 85 73 77

Page 92: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 92

Решение

1. Исследуемые данные введите в рабочую таблицу Excel по столбцам: в

столбец А — заполняемость гостиниц в центре города, в столбец В — гостиниц,

находящихся на расстоянии от 3 до 5 км и т.д. (диапазон А1:С6).

2. Выполните команду Сервис ► Анализ данных. В появившемся

диалоговом окне Анализ данных в списке Инструменты анализа щелчком

мыши выберите процедуру Однофакторный дисперсионный анализ. Нажмите

кнопку OK.

3. В появившемся диалоговом окне Однофакторный дисперсионный

анализ в поле Входной интервал задайте A1:С6. Для этого наведите указатель

мыши на ячейку А1 и протяните его к ячейке С6 при нажатой левой кнопке

мыши.

4. В разделе Группировка переключатель установите в положение по

столбцам.

5. Далее необходимо указать выходной диапазон. Для этого поставьте

переключатель в положение Выходной интервал (наведите указатель мыши и

щелкните левой кнопкой), затем щелкните указателем мыши в правом поле

ввода Выходной интервал, и щелчком мыши на ячейке А8 укажите

расположение выходного диапазона. Нажмите кнопку OK.

Результаты анализа. В результате будет получена таблица, содержащая

результаты однофакторного дисперсионного анализа.

Интерпретация результатов. В таблице Дисперсионный анализ на

пересечении строки Между группами и столбца P-Значение находится

величина 0,0002684. Величина P-Значение < 0,05, следовательно, критерий

Фишера значим и влияние фактора расстояния от центра города на

эффективность заполнения гостиниц доказано статистически.

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Page 93: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 93

Важным разделом статистического анализа является корреляционный

анализ, служащий для выявления взаимосвязей между выборками.

Коэффициент корреляции

Выявление взаимосвязей. Одна из наиболее распространенных задач

статистического исследования состоит в изучении связи между некоторыми

наблюдаемыми переменными. Знание взаимозависимостей отдельных

признаков дает возможность решать одну из кардинальных задач любого

научного исследования: возможность предвидеть, прогнозировать развитие

ситуации при изменении конкретных характеристик объекта исследования.

Например, основное содержание любой экономической политики в конечном

счете может быть сведено к регулированию экономических переменных,

осуществляемому на базе выявленной тем или иным образом информации об

их взаимовлиянии. Поэтому проблема изучения взаимосвязей показателей

различного рода является одной из важнейших в статистическом анализе.

Обычно взаимосвязь между выборками носит не функциональный, а

вероятностный (или стохастический) характер. В этом случае нет строгой,

однозначной зависимости между величинами. При изучении стохастических

зависимостей различают корреляцию и регрессию.

Регрессионный анализ (см. раздел «Регрессионный анализ») устанавливает

формы зависимости между случайной величиной хi и значениями одной или

нескольких переменных величин.

Корреляционный анализ состоит в определении степени связи между

двумя случайными величинами Х и Y. В качестве меры такой связи

используется коэффициент корреляции. Коэффициент корреляции оценивается

по выборке объема п связанных пар наблюдений (хi, yi,) из совместной

генеральной совокупности Х и Y. Существует несколько типов коэффициентов

корреляции, применение которых зависит от предположений о совместном

распределении величин Х и Y.

Page 94: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 94

Для оценки степени взаимосвязи наибольшее распространение получил

коэффициент линейной корреляции (Пирсона), предполагающий нормальный

закон распределения наблюдений.

Коэффициент корреляции (R,r) — параметр, характеризующий степень

линейной взаимосвязи между двумя выборками. Коэффициент корреляции

изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая

пропорциональная зависимость). При значении 0 линейной зависимости между

двумя выборками нет. Здесь под прямой зависимостью понимают зависимость,

при которой увеличение или уменьшение значения одного признака ведет,

соответственно, к увеличению или уменьшению второго. Например, при

увеличении температуры возрастает давление газа, а при уменьшении —

снижается (при постоянном объеме). При обратной зависимости увеличение

одного признака приводит к уменьшению второго и наоборот. Примером

обратной корреляционной зависимости может служить связь между

температурой воздуха на улице и количеством топлива, расходуемого на

обогрев помещения.

Выборочный коэффициент линейной корреляции между двумя

случайными величинами Х и Y рассчитывается по формуле

∑∑

−−

−−=

22 )()(

))((

yx

yx

MyMx

MyMxr .

Коэффициент корреляции является безразмерной величиной и его

значение не зависит от единиц измерения случайных величин Х и Y.

На практике коэффициент корреляции принимает некоторые

промежуточные значения между 1 и -1. Для оценки степени взаимосвязи можно

руководствоваться следующими эмпирическими правилами. Если коэффициент

корреляции (r) по абсолютной величине (без учета знака) больше, чем 0,95, то

принято считать, что между параметрами существует практически линейная

зависимость (прямая — при положительном r и обратная — при отрицательном

r). Если коэффициент корреляции r лежит в диапазоне от 0,8 до 0,95, говорят о

Page 95: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 95

сильной степени линейной связи между параметрами. Если 0,6 < r < 0,8,

говорят о наличии линейной связи между параметрами. При r < 0,4 обычно

считают, что линейную взаимосвязь между параметрами выявить не удалось.

• В MS Excel для вычисления парных коэффициентов линейной

корреляции используется специальная функция КОРРЕЛ.

Параметрами функции являются КОРРЕЛ(массив1,массив2), где:

массив1 — это диапазон ячеек первой случайной величины;

• массив2 — это второй интервал ячеек со значениями второй

случайной величины.

ПРИМЕР VI. 16. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Имеются результаты семимесячных наблюдений реализации путевок двух

туристских маршрутов тура А и тура В. Тур А Тур В 120 110 121 119 105 100 92 95 113 110 90 95 80 85

Необходимо определить, имеется ли взаимосвязь между количеством

продаж путевок обоих маршрутов.

Решение. Для выявления степени взаимосвязи прежде всего необходимо

ввести данные в рабочую таблицу. Откройте новую рабочую таблицу. Введите

в ячейку А1 слова Тур А. Затем в ячейки А2:А8 — соответствующие значения

числа продаж. В ячейки В1:В8 введите название и значения для тура В. Затем

вычисляется значение коэффициента корреляции между выборками. Для этого

табличный курсор установите в свободную ячейку (А9). На панели

инструментов нажмите кнопку Вставка функции (fx). В появившемся

диалоговом окне Мастер функций выберите категорию Статистические и

Page 96: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 96

функцию КОРРЕЛ, после чего нажмите кнопку OK. Появившееся диалоговое

окно КОРРЕЛ за серое поле мышью отодвиньте вправо на 1-2 см от данных

(при нажатой левой клавише). Указателем мыши введите диапазон данных Тур

А в поле Массив 1 (А2:А8). В поле Массив 2 введите диапазон данных Тур В

(В2:В8). Нажмите кнопку OK. В ячейке А9 появится значение коэффициента

корреляции — 0,966751. Значение коэффициента корреляции больше чем 0,95.

Значит, можно говорить о том, что в течение периода наблюдения имелась

высокая степень прямой линейной взаимосвязи между количествами

проданных путевок обоих маршрутов (r = 0,966751).

КОРРЕЛЯЦИОННАЯ МАТРИЦА При большом числе наблюдений, когда коэффициенты корреляции

необходимо последовательно вычислять из нескольких рядов числовых

данных, для удобства получаемые коэффициенты сводят в таблицы,

называемые корреляционными матрицами.

Корреляционная матрица — это квадратная (или прямоугольная) таблица,

в которой на пересечении соответствующих строки и столбца находится

коэффициент корреляции между соответствующими параметрами.

В MS Excel для вычисления корреляционных матриц используется

процедура Корреляция. Процедура позволяет получить корреляционную

матрицу, содержащую коэффициенты корреляции между различными

параметрами.

Для реализации процедуры необходимо:

• выполнить команду Сервис ► Анализ данных;

• в появившемся списке Инструменты анализа выбрать строку

Корреляция и нажать кнопку OK;

• в появившемся диалоговом окне указать Входной интервал, то есть

ввести ссылку на ячейки, содержащие анализируемые данные. Для

этого следует навести указатель мыши на левую верхнюю ячейку

Page 97: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 97

данных, нажать левую кнопку мыши и, не отпуская ее, протянуть

указатель мыши к правой нижней ячейке, содержащей

анализируемые данные, затем отпустить левую кнопку мыши.

Входной интервал должен содержать не менее двух столбцов.

• в разделе Группировка переключатель установить в соответствии с

введенными данными;

• указать выходной диапазон, то есть ввести ссылку на ячейки, в

которые будут выведены результаты анализа. Для этого следует

поставить флажок в левое поле Выходной интервал (навести

указатель мыши и щелкнуть левой кнопкой), далее навести указатель

мыши на правое поле ввода Выходной интервал и щелкнуть левой

кнопкой мыши, затем указатель мыши навести на левую верхнюю

ячейку выходного диапазона и щелкнуть левой кнопкой мыши.

Размер выходного диапазона будет определен автоматически, и на

экран будет выведено сообщение в случае возможного наложения

выходного диапазона на исходные данные.

• нажать кнопку OK.

Результаты анализа. В выходной диапазон будет выведена

корреляционная матрица, в которой на пересечении каждых строки и столбца

находится коэффициент корреляции между соответствующими параметрами.

Ячейки выходного диапазона, имеющие совпадающие координаты строк и

столбцов, содержат значение 1, так как каждый столбец во входном диапазоне

полностью коррелирует с самим собой.

Интерпретация результатов. Рассматривается отдельно каждый

коэффициент корреляции между соответствующими параметрами. Его

числовое значение оценивается по эмпирическим правилам, изложенным в

разделе «Коэффициент корреляции». Отметим, что хотя в результате будет

получена треугольная матрица, корреляционная матрица симметрична, и

коэффициенты корреляции rij =rji.

Page 98: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 98

ПРИМЕР VI.17. КОРРЕЛЯЦИОННАЯ МАТРИЦА Имеются ежемесячные данные наблюдений за состоянием погоды и

посещаемостью музеев и парков. Число ясных дней Количество посетителей

музея Количество посетителей парка

8 495 132 14 503 348 20 380 643 25 305 865 20 348 743 15 465 541

Необходимо определить, существует ли взаимосвязь между состоянием

погоды и посещаемостью музеев и парков.

Решение. Для выполнения корреляционного анализа введите в диапазон

A1:G3 исходные данные.

Затем в меню Сервис выберите пункт Анализ данных и далее укажите

строку Корреляция. В появившемся диалоговом окне укажите Входной

интервал В1:G3. Укажите, что данные рассматриваются по строкам. Укажите

выходной диапазон. Для этого поставьте флажок в левое поле Выходной

интервал и в правое поле ввода Выходной интервал введите А4. Нажмите

кнопку OK.

Результаты анализа. В выходном диапазоне получаем корреляционную

матрицу.

Интерпретация результатов. Из таблицы видно, что корреляция между

состоянием погоды и посещаемостью музея равна – 0,92, а между состоянием

погоды и посещаемостью парка -0,97, между посещаемостью парка и музея – r

= -0,92.

Таким образом, в результате анализа выявлены зависимости: сильная

степень обратной линейной взаимосвязи между посещаемостью музея и

количеством солнечных дней (r = -0,92) и практически линейная (очень сильная

прямая) связь между посещаемостью парка и состоянием погоды (r = 0,97).

Page 99: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 99

Между посещаемостью музея и парка имеется сильная обратная взаимосвязь (r

= -0,92).

Подразумевается, что в пустых клетках в правой верхней половине

таблицы находятся те же коэффициенты корреляции, что и в нижней левой

(симметрично расположенные относительно диагонали).

Задания к разделу VI. «Итоговые функции, статистические расчеты и теория

вероятности в электронных таблицах Excel».

1. Найти математическое ожидание и стандартное отклонение дискретного

распределения 0,2; 0,5; 2; 3; 5,1; 8; 2; 3.

2. Найти дисперсию для дискретного распределения 0,2; 0,5; 2; 3; 5,1; 8; 2;

3.

3. Построить диаграмму нормальной функции плотности вероятности f(x)

при M = 10 и σ = 2.

4. Создать последовательность, состоящую из 10 действительных

случайных чисел, равномерно распределенных в диапазоне от 3 до 7.

5. Создать последовательность из 10 случайных числе из диапазона 2, 3, 4,

5, с равной вероятностью попадания.

6. Постройте эмпирические функции распределения (относительные и

накопленные частоты) для роста (в см) группы из 20 мужчин: 181, 169,

178, 178, 171, 179, 172, 181, 179, 168, 174, 167, 169, 171, 181, 181, 183,

172, 176.

7. Найти распределение по абсолютным частотам для следующих

результатов тестирования в баллах: 79, 85, 78, 85, 83, 81, 95, 88, и 97

(используйте границы интервалов 70, 79, 89).

8. Построить эмпирические функции распределения (относительные и

накопленные частоты) успеваемости в группе из 20 студентов: 4, 4, 5, 3,

4, 5, 4, 5, 3, 5, 3, 3, 5, 4, 5, 4, 3, 5, 3, 5.

Page 100: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 100

9. Найти среднее значение и стандартное отклонение результатов бега на

дистанцию 100 м у группы студентов: 12,8; 13,2; 13,0; 12,9; 13,5; 13,1.

10. Найти выборочные среднее, медиану, моду, дисперсию и стандартное

отклонение для следующей выборки 26, 35, 29, 27, 33, 35, 30, 33, 31, 29.

11. Найти наиболее популярный туристический маршрут из четырех

реализуемых фирмой, если за неделю последовательно были

реализованы следующие маршруты (приводятся номера маршрутов): 1, 3,

3, 2, 1, 1, 4, 4, 2, 4, 1, 3, 2, 4, 1, 4, 4, 3, 1, 2, 3, 4, 1, 1, 3.

12. В рабочей зоне производились замеры концентрации вредного вещества.

Получен ряд значений (в мг/м3) 12, 16, 15, 14, 10, 20, 16, 14, 18, 14, 15, 17,

23, 16. Необходимо определить основные выборочные характеристики.

13. Определить, лежит ли значение 19 внутри границ 95%-ного

доверительного интервала выборки 2, 3, 5, 7, 4, 9, 6, 4, 9, 10, 4, 7, 19.

14. Определить с уровнем значимости α = 0,05 максимальное отклонение

среднего значения генеральной совокупности от среднего выборки 3, 4,

4, 2, 5, 3, 4, 3, 5, 4, 3, 5, 6.

15. Найти соответствие экспериментальных данных нормальному закону

распределения для следующей выборки весов детей (кг): 21, 21, 22, 22,

22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24,

24, 24, 24,25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26,

26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27.

16. Даны результаты бега на дистанции 100 м в секундах в двух группах

студентов. Студенты первой группы в течение года посещали

факультативные занятия по физкультуре. Определить, достоверны ли

отличия по результатам бега в этих группах.

Посещавшие факультатив Не посещавшие 12,6 12,8 12,3 13,2 11,9 13,0 12,2 12,9

Page 101: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 101

13,0 13,5 12,4 13,1

17. В ходе социологического опроса на вопрос о перенесенном в детстве

заболевании ответы распределились следующим образом: Да Нет Не помню Мужчины 58 11 10 Женщины 35 25 23

Есть ли достоверные отличия в ответах женщин и мужчин?

18. Приведены данные ежемесячной результативности (количество голов)

футбольной команды в двух сезонах: Месяц 3 4 5 6 7 8 9 10 11 2000г. 3 4 5 8 9 1 2 4 5 2001г. 6 19 3 2 14 4 5 17 1

Определить, есть ли статистические различия в ежемесячной

результативности команды в рассматриваемых сезонах?

19. Определить, имеют ли выборки {6; 7; 9; 15; 21} и {20; 28; 31; 38; 40}

различные уровни разнородности (отличаются ли дисперсии)?

20. Определить, достоверны ли различия в количестве приобретаемых

туристских путевок семейными парами и отдельными туристами. Количество приобретаемых путевок Месяцы 1 2 3 4 5 6 Пары 67 75 58 89 96 94 Одиночки 43 56 78 87 85 90

21. В таблице приведены результаты группы студентов по скоростному

чтению до и после специального курса по быстрому чтению.

Студент 1 2 3 4 5 6 7 8 9 10

До курса

86 83 86 70 66 90 70 85 77 86

После 82 79 91 77 68 86 81 90 85 94

Произошли ли статистически значимые изменения скорости чтения у

студентов?

22. Определить, влияет ли фактор образования на уровень зарплаты в

гостинице на основании следующих данных: Образование Зарплата сотрудника

Page 102: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 102

высшее 3200 3000 2600 2000 1900 1900 среднее спец 2600 2000 2000 1900 1800 1700 среднее 2000 2000 1900 1800 1700 1700

23. Определить, имеется ли взаимосвязь между рождаемостью и

смертностью (количество на 1000 человек) в Санкт-Петербурге: Годы Рождаемость Смертность 1991 9,3 12,5 1992 7,4 13,5 1993 6,6 17,4 1994 7,1 17,2 1995 7,0 15,9 1996 6,6 14,2

24. Определить, имеется ли взаимосвязь между годовым уровнем инфляции

(%), ставкой рефинансирования (%) и курсом доллара (руб /$), по

следующим данным ежегодных наблюдений: Уровень инфляции Ставка рефинансирования Курс

84 85 6,3 45 55 14 56 65 20 34 40 28 23 28 29

25. Группе студентов из 24 человек была выдана одновременно одна и та же

задача на титриметрическое определение меди йодометрическим

методом. Задачу выдавал лаборант в виде строго дозированной порции

раствора (V=20,0 мл) соли меди II (CuSO4), содержащей ~ 600 мг меди.

Студенты получали задачу в мерные колбы на 250 мл, доводили объем в

мерных колбах дистиллированной водой до метки, перемешивали и

отбирали по 5 – 6 аликвот объемом в 25 мл для параллельных

определений. Затем по известной методике последовательно определяли

медь в каждой из аликвот, титруя рабочим раствором тиосульфата

(концентрация – нормальность рабочего раствора Na2S2O4 установлена

лаборантом заранее). Индиктор – раствор крахмала; титрование проводят

в растворах минеральных кислот HCl или H2 SO4 .

Последовательность реакций, лежащих в основе определения:

Page 103: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 103

.22

,)(42234

2322

2222

−−−

−+

+→+

+↓→+

OSJOSJ

JJCuизбJCu

Содержание Cu2+ студенты вычисляли по формуле

TTCuTT

CuVNЭVNq ⋅⋅⋅=

⋅⋅⋅=+ 1054,63

25250

2 ,

где - нормальность тиосульфата ( = 0,09132); - эквивалентный объем

тиосульфата, мл. Всем студентам было предложено сдать результаты 5

параллельных определений, округлив ответы до 0,5 мг.

TN TN TV

Для дальнейшего расчета были отобраны 100 результатов от 20 студентов,

которые решили задачу первыми. Их ответы в порядке увеличения найденного

содержания меди сведены в таблице. 600 607 609,5 611 613,5

601,5 607 609,5 611,5 614602,5 607 609,5 611,5 614

603 607,5 609,5 611,5 614604 607,5 609,5 611,5 614,5604 607,5 610 612 614,5

604,5 607,5 610 612 614,5604,5 608 610 612 615

605 608 610 612 615605 608 610 612,5 615,5605 608 610,5 612,5 615,5605 608 610,5 612,5 616

605,5 608,5 610,5 612,5 616605,5 608,5 610,5 612,5 616,5605,5 608,5 610,5 613 617

606 608,5 611 613 617606,5 609 611 613 617,5606,5 609 611 613 618606,5 609 611 613,5 618,5

607 609,5 611 613,5 621Выбрать границы интервалов согласно следующей таблице.

Границы интервалов 602 604 606

Page 104: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 104

608 610 612 614 616 618 620 622

Оценить характер распределения случайной величины: построить

выборочную функцию распределения, рассчитать выборочные характеристики

по всей совокупности, произвести анализ выборки: определить доверительный

интервал для среднего, произвести проверку соответствия теоретическому

распределению с использованием критерия согласия хи-квадрат, построить

график теоретических и абсолютных частот.

Указание. Для расчетов используйте процедуры Пакета анализа –

Гистограмма и Описательная статистика. Проверка соответствия

теоретическому распределению с использованием критерия согласия хи-

квадрат осуществляется с помощью функции ХИ2ТЕСТ (см. ПРИМЕР VI.10).

Результатом решения будут следующие таблицы и диаграмма. Карман Частота Интегральный %

602 604 606 608 610 612 614 616 618 620 622

Еще

Page 105: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 105

Гистограмма

05

101520

602

606

610

614

618

622

Карман

Частота

,00%

50,00%

100,00%

150,00%

ЧастотаИнтегральный %

Наблюдения

Среднее Стандартная ошибка Медиана Мода Стандартное отклонение Дисперсия выборки Эксцесс Асимметричность Интервал Минимум Максимум Сумма Счет Уровень надежности (95,0%)

26. Среднее из 8 определений содержания никеля в стали равно 1,76%.

Стандартное отклонение определения S8 равно 0,08%. Определить

ширину доверительного интервала для среднего из восьми, отвечающего

95-процентной доверительной вероятности.

Указание. Используйте статистическую функцию ДОВЕРИТ.

27. Найти среднее и медиану результатов определения сульфат-иона в

растворе серной кислоты (%): 24.05; 24.21; 24.33; 24.05; 24.22.

28. Рассчитайте дисперсию и стандартное отклонение результатов

определения объема колбы (мл): 50.05; 50.15; 49.90; 50.16; 50.00.

Page 106: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 106

Раздел VII. Регрессионный анализ в электронных таблицах Excel

РЕГРЕССИОННЫЙ АНАЛИЗ При исследовании взаимосвязей между выборками помимо корреляции

различают также и регрессию. Регрессия используется для анализа воздействия

на отдельную зависимую переменную значений одной или более независимых

переменных. Соответственно, наряду с корреляционным анализом еще одним

инструментом изучения стохастических зависимостей является регрессионный

анализ.

Регрессионный анализ устанавливает формы зависимости между

случайной величиной Y (зависимой) и значениями одной или нескольких

переменных величин (независимых), причем значения последних считаются

точно заданными. Такая зависимость обычно определяется некоторой

математической моделью (уравнением регрессии), содержащей несколько

неизвестных параметров. В ходе регрессионного анализа на основании

выборочных данных находят оценки этих параметров, определяются

статистические ошибки оценок или границы доверительных интервалов и

проверяется соответствие (адекватность) принятой математической модели

экспериментальным данным.

В линейном регрессионном анализе связь между случайными величинами

предполагается линейной. В самом простом случае в линейной регрессионной

модели имеются две переменные Х и Y. И требуется по п парам наблюдений

(X1, Y1), (X2, Y2), ..., (Xn, Yn) построить (подобрать) прямую линию, называемую

линией регрессии, которая «наилучшим образом» приближает наблюдаемые

значения. Уравнение этой линии Y = аХ + b является регрессионным

уравнением. С помощью регрессионного уравнения можно предсказать

ожидаемое значение зависимой величины Y0, соответствующее заданному

значению независимой переменной X0.

Page 107: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 107

Таким образом, можно сказать, что линейный регрессионный анализ

заключается в подборе графика и его уравнения для набора наблюдений. В

регрессионном анализе все признаки (переменные), входящие в уравнение,

должны иметь непрерывную, а не дискретную природу.

В случае, когда рассматривается зависимость между одной зависимой

переменной Y и несколькими независимыми X1, X2, ..., Xn, говорят о

множественной линейной регрессии. В этом случае регрессионное уравнение

имеет вид

Y = a0 + a1X1 + a2X2 + … + anXn,

где a1, a2, …, an — требующие определения коэффициенты при независимых

переменных X1, X2, ..., Xn; a0 – константа.

Мерой эффективности регрессионной модели является коэффициент

детерминации R2 (R-квадрат). Коэффициент детерминации (R-квадрат)

определяет, с какой степенью точности полученное регрессионное уравнение

описывает (аппроксимирует) исходные данные.

Исследуется также значимость регрессионной модели с помощью F-

критерия (Фишера). Если величина F-критерия значима (р < 0,05), то

регрессионная модель является значимой.

Достоверность отличия коэффициентов a0, a1, a2, …, an от нуля

проверяется с помощью критерия Стьюдента. В случаях, когда р > 0,05,

коэффициент может считаться нулевым, а это означает, что влияние

соответствующей независимой переменной на зависимую переменную

недостоверно, и эта независимая переменная может быть исключена из

уравнения.

В MS Excel экспериментальные данные аппроксимируются линейным

уравнением до 16 порядка:

Y = a0 + a1X1 + a2X2 + … + a16X16,

где Y — зависимая переменная, X1, X2, ..., X16 – независимые переменные, a0, a1,

a2, …, a16 – искомые коэффициенты регрессии.

Page 108: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 108

Для получения коэффициентов регрессии используется процедура

Регрессия из пакета анализа. Кроме того, могут быть использованы функция

ЛИНЕЙН для получения параметров регрессионного уравнения и функция

ТЕНДЕНЦИЯ для получения предсказанных значений Y в требуемых точках.

Для реализации процедуры Регрессия необходимо:

• выполнить команду Сервис ► Анализ данных;

• в появившемся диалоговом окне Анализ данных в списке

Инструменты анализа выбрать строку Регрессия, указав курсором

мыши и щелкнув левой кнопкой мыши. Затем нажать кнопку OK;

• в появившемся диалоговом окне задать Входной интервал Y, то

есть ввести ссылку на диапазон анализируемых зависимых данных,

содержащий один столбец данных. Для этого следует навести

указатель мыши на верхнюю ячейку столбца зависимых данных,

нажать левую кнопку мыши и, не отпуская ее, протянуть указатель

мыши к нижней ячейке, содержащей анализируемые данные, затем

отпустить левую кнопку мыши;

• указать Входной интервал X, то есть ввести ссылку на диапазон

независимых данных, содержащий до 16 столбцов анализируемых

данных. Для этого следует навести указатель мыши на поле ввода

Входной интервал Х и щелкнуть левой кнопкой мыши, затем

навести указатель мыши на верхнюю левую ячейку диапазона

независимых данных, нажать левую кнопку мыши и, не отпуская ее,

протянуть указатель мыши к нижней правой ячейке, содержащей

анализируемые данные, затем отпустить левую кнопку мыши;

• указать выходной диапазон, то есть ввести ссылку на ячейки, в

которые будут выведены результаты анализа. Для этого следует

поставить переключатель в положение Выходной интервал

(навести указатель мыши и щелкнуть левой кнопкой), далее навести

указатель мыши на правое поле ввода Выходной интервал и

Page 109: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 109

щелкнуть левой кнопкой мыши, затем указатель мыши навести на

левую верхнюю ячейку выходного диапазона и щелкнуть левой

кнопкой мыши. Размер выходного диапазона будет определен

автоматически, и на экран будет выведено сообщение в случае

возможного наложения выходного диапазона на исходные данные;

• если необходимо визуально проверить отличие экспериментальных

точек от предсказанных по регрессионной модели, следует

установить флажок в поле График подбора;

• нажать кнопку OK.

Результаты анализа. Выходной диапазон будет включать в себя

результаты дисперсионного анализа, коэффициенты регрессии, стандартную

погрешность вычисления Y, среднеквадратичные отклонения, число

наблюдений, стандартные погрешности для коэффициентов.

Интерпретация результатов. Значения коэффициентов регрессии

находятся в столбце Коэффициенты и соответствуют:

• Y-пересечение — a0;

• переменная Х1 — a1;

• переменная X2 — a2 и т.д.

В столбце P-Значение приводится достоверность отличия

соответствующих коэффициентов от нуля. В случаях, когда P > 0,05,

коэффициент может считаться нулевым, что означает, что соответствующая

независимая переменная практически не влияет на зависимую переменную.

Приводимое значение R-квадрат (коэффициент детерминации)

определяет, с какой степенью точности полученное регрессионное уравнение

аппроксимирует исходные данные. Если R-квадрат > 0,95, говорят о высокой

точности аппроксимации (модель хорошо описывает явление). Если R-квадрат

лежит в диапазоне от 0,8 до 0,95, говорят об удовлетворительной

аппроксимации (модель в целом адекватна описываемому явлению). Если R-

квадрат < 0,6, принято считать, что точность аппроксимации недостаточна и

Page 110: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 110

модель требует улучшения (введения новых независимых переменных, учета

нелинейностей и т.д.).

ПРИМЕР VII.1. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ Дан набор точек (xi,yi): (0, 3), (1, 1), (2, 6), (3, 3), (4, 7). Найти

коэффициенты m и b прямой линии y=mx+b, наилучшим образом

аппроксимирующей эти данные по критерию наименьших квадратов.

Решение. Разместим координаты точек в диапазоне A2:B6, как показано

ниже. В ячейках A9 и B9 поместим начальные значения коэффициентов m и b и

дадим им имена. В C2:C6 вычислим yi=mxi+b. В D2:D6 вычислим остатки

(например, в D2 формула =B2-C2). Наконец, в D9 вычислим сумму квадратов

остатков (для этого воспользуйтесь функцией СУММКВ(диапазон)). У Вас

должен получиться следующий результат (рис. VII.1).

A B C D 1 2 0 3 0 33 1 1 0 14 2 6 0 65 3 3 0 36 4 7 0 77 8 m b 9 0 0 104

Рис. VII.1

Проще воспользоваться формулой =СУММКВРАЗН(B2:B6, C2:C6) и

тогда не надо использовать блок D2:D6. Но анализ остатков очень полезен, их

всегда надо вычислять.

А теперь решим задачу оптимизации. Выделим ячейку D9, вызовем

Решатель и поставим задачу минимизации D9 путем изменения A9:B9.

Ограничений нет. Результат представлен на рис. VII.2.

Page 111: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 111

A B C D 1 2 0 3 2 13 1 1 3 -24 2 6 4 25 3 3 5 -26 4 7 6 17 8 m b 9 1 2 14

Рис. VII.2

ПРИМЕР VII.2. ЛИНЕЙНАЯ РЕГРЕССИЯ Заново решим задачу выбора линейной функции из примера VII.1, на этот

раз с помощью функций Excel, предназначенных для расчета линейной

регрессии. Скопируйте исходные данные (блок A2:B6) на новый рабочий лист.

Воспользуемся функцией

ЛИНЕЙН( известные_значения_y, известные_значения_x, конст,

статистика)

В нашем случае известные_значения_y находятся в диапазоне B2:B6, а

известные_значения_x находятся в диапазоне A2:A6. Два последние

аргумента – логические. Если конст – ИСТИНА или опущено, то свободный

член b в регрессионном уравнении может быть любым, а если конст – ЛОЖЬ,

то b принудительно полагается равным нулю. Если последний аргумент

статистика – ЛОЖЬ или опущен, то вычисляются только коэффициенты m и b,

а если ИСТИНА, то выдаются дополнительные статистические характеристики.

Вместо ИСТИНА и ЛОЖЬ в функции можно вводить аргументы 1 и 0, что

намного удобнее.

Так как функция возвращает сразу несколько значений, формулу с этой

функцией надо вводить как табличную. Если мы хотим ввести полную

статистику, то надо выделить блок из пяти строк и двух столбцов. Выделим

Page 112: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 112

блок F2:G6, щелкнем по кнопке со знаком равенства, в Мастере функций

выберем в категории «Статистические» функцию ЛИНЕЙН. Первым

аргументом укажем блок B2:B6, вторым аргументом – блок A2:A6, в третьем и

четвертом поле ввода проставим 1. Не щелкаем по кнопке «OK», а нажимаем

Ctrl+Shift+Enter (находясь в диалоговом окне)! Получим следующую таблицу

(рис. VII.3).

A B

2 1 2 3 0.68313 1.67332 4 0.416667 2.160247 5 2.142857 3 6 10 14

Рис. VII.3

В ячейку F2 записан коэффициент m, в G2 – коэффициент b. Под этими

коэффициентами записаны стандартные отклонения (то есть

среднеквадратичные отклонения, или корни квадратные из дисперсий) для этих

коэффициентов.

В ячейку F4 записан так называемый коэффициент детерминации R2. Этот

коэффициент лежит на отрезке [0; 1]. Считается, что чем ближе этот

коэффициент к 1, тем лучше регрессионное уравнение описывает зависимость.

В ячейке G4 находится стандартная ошибка для оценки y. В ячейку F5

записано значение F-статистики, а в G5 – количество степеней свободы. Число

степеней свободы нужно для расчета критических значений F-статистики

(этого вопроса мы касаться не будем).

В последней строке таблицы записаны регрессионная сумма квадратов (10)

и остаточная сумма квадратов (14). Последнее число нам знакомо из примера

VII.1. Это сумма квадратов остатков.

Page 113: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 113

УПРАЖНЕНИЕ VII.1. Наиболее важными для нас, естественно, являются коэффициенты m и b.

Их можно вычислить с помощью функций НАКЛОН и ОТРЕЗОК, не прибегая

к функции ЛИНЕЙН. Названия этих функций отвечают геометрическому

смыслу коэффициентов регрессии: m – это тангенс угла наклона прямой

регрессии, а b – отрезок, отсекаемый этой прямой на оси ординат. Вычислите

для примера VII.2 коэффициенты m и b с помощью этих функций.

ПРИМЕР VII.3. Для набора данных (3, 5), (5, 5), (9, -8), (11, -18), (15, -56) построить

квадратичную регрессию с помощью функции ЛИНЕЙН.

Решение. Постановка задачи выглядит на первый взгляд парадоксально.

Ведь функция ЛИНЕЙН даже по своему названию предназначена для

отыскания именно линейной регрессии. Но в уравнение регрессии dx2 +ex+f

коэффициенты входят линейно.

Поместим на новый рабочий лист исходные данные (рис. VII.4). Сначала

дадим не самое эффективное решение. Сейчас x-данные занимают диапазон

A1:A5, а y-данные – диапазон B1:B5. Нам нужно ввести новый фактор: x2. Для

этого переместим B1:B5 вправо, в столбец C. В ячейку B1 введем формулу

=A1^2. Для функции ЛИНЕЙН (со статистикой) нужно выделить блок,

состоящий из пяти строк (для статистики) и трех столбцов (для коэффициента

перед x2, для коэффициента перед x, для свободного члена – коэффициенты

идут в обратном порядке по сравнению со столбцами исходных данных).

Введем функцию в F1:H5. У Вас должен получиться результат (рис. VII.4).

Page 114: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 114

A B C D E F G H 1 3 9 5 -0,51245 4,17316 -3,041672 5 25 5 0,032111 0,582671 2,242093 9 81 -8 0,999051 1,097025 #Н/Д 4 11 121 -18 1053,124 2 #Н/Д 5 15 225 -56 2534,793 2,406926 #Н/Д

Рис. VII.4

Вычислим значения квадратичной функции и остатки. Теперь мы не

можем воспользоваться функциями ТЕНДЕНЦИЯ и ПРЕДСКАЗ, потому что

их использование предполагает лишь один фактор, а не два, как в нашем

случае. Итак, введем в D1 формулу =$F$1*B1+$G$1*A1+$H$1 и скопируем ее

вниз. В столбце E посчитайте остатки.

А теперь более эффективное решение. Выделите F7:H7 и введите в этот

диапазон табличную формулу {=ЛИНЕЙН(C1:C5, A1:A5^{1; 2}, 1, 0)}. На

этот раз промежуточный блок B1:B5 Вам не понадобился: нужный блок,

состоящий из факторов и их квадратов, сконструирован непосредственно как

аргумент табличной формулы.

УПРАЖНЕНИЕ VII.2. Аппроксимируйте эти данные кубическим полиномом. Сравните

остаточную сумму квадратов для трех регрессионных многочленов:

кубического, квадратичного и линейного.

ПРИМЕР VII.4

Для набора данных (3, 5), (5, 5), (9, -8), (11, -18), (15, -56) построить график

и определить уравнение тренда по графику.

Решение. Чтобы не загромождать текущий рабочий лист, перейдите на

новый лист. Скопируйте в блок A2:B6 x- и y-значения. В блоке G1:I5 заново

вычислите коэффициенты квадратичной функции и статистику регрессии с

Page 115: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 115

помощью функции ЛИНЕЙН так, как это сделано во второй части решения

предыдущего примера. В C2 введите формулу =$G$1*A2^2+$H$1*A2+$I$1 и

скопируйте ее вниз.

Построение графика. Введите в ячейку B2 название ряда «y». Выделите

блок A1:B6 и постройте линейный график на отдельном листе. Уберите линии

сетки и легенду. Сделайте фон прозрачным. Снимите флажок «пересечение с

осью Y между категориями».

Добавление линии тренда. Выделите ряд. В контекстном меню выберите

«Добавить линию тренда». Появится диалоговое окно «Линия тренда». На

вкладке «Тип» выберите тип тренда «Полиномиальный» и укажите, что он

имеет степень 2. На вкладке «Параметры» установите флажок «показывать

уравнение на диаграмме». После закрытия окна Вы увидите на диаграмме

график параболы и ее уравнение. Выделите уравнение, перетащите его мышью

в центр графика, увеличьте размер шрифта до 16 пунктов. Вы увидите

уравнение

-5.2143 x2 + 16.786 x – 7.4.

Коэффициенты квадратичного трехчлена совершенно не похожи на те,

которые мы только что нашли! Дело в том, что уравнение линии тренда на

диаграмме строится в предположении, что по оси категорий расположен

натуральный ряд 1, 2, 3, … . Убедимся в этом.

Введите в блок D2:В6 прогрессию 1, 2, …, 5. В ячейку E2 введите

формулу для расчета квадратного трехчлена, полученного на диаграмме, =0-5.2143*D2^2+16.786*D2-7.4 (замечание: приоритет унарного минуса выше,

чем возведение в степень, а у бинарного минуса – ниже). Мы видим, что

получены значения, близкие к исходным y-значениям. Подтвердим этот расчет

еще одним способом: рассчитайте коэффициенты и статистику регрессии для

значений y в интервале B2:B6 и x-значений в интервале D2:D6. Результаты

поместите в G7:I11. На основе коэффициентов регрессии рассчитайте оценки y

в диапазоне F2:F6. Вы должны получить результат, как на рис. VII.5.

Page 116: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 116

Обратите внимание, что остаточная сумма квадратов получилась

существенно худшей: вместо 2.41 в первом случае 54.06 во втором случае. Но и

x-значения изменились: вместо 3, 5, 9, 11, 15 они образуют прогрессию 1, 2, 3,

4, 5. Расстояния между точками были различными, а стали одинаковыми.

y -0.51245 4.17316 -3.04167 3 5 4.865801 1 4.1717 4.171429 0.032111 0.582671 2.24209 5 5 5.012987 2 5.3148 5.314286 0.999051 1.097025 #Н/Д 9 -8 -6.99134 3 -3.9707 -3.97143 1053.124 2 #Н/Д 11 -18 -19.1429 4 -23.6848 -23.6857 2534.793 2.406926 #Н/Д 15 -56 -55.7446 5 -53.8286 -53.8286 -5.21429 16.78571 -7.4 1.389465 8.497347 11.1504 0.978694 5.198901 #Н/Д 45.93552 2 #Н/Д 2483.143 54.05714 #Н/Д

Рис. VII.5

Можно улучшить результат. Построим график в равномерной шкале. Для

этого в A12:A24 введем ряд чисел 1, 2, 3, …, 13. В B12:D24 введем ряд чисел 3,

4, 5, …,15. В ячейку С12 введем формулу =ВПР(B12, $A$2:$B$6, 2, 0) и

скопируем ее вниз. Получится таблица (рис. VII.6).

1 3 52 4 #Н/Д 3 5 54 6 #Н/Д 5 7 #Н/Д 6 8 #Н/Д 7 9 -88 10 #Н/Д 9 11 -18

10 12 #Н/Д 11 13 #Н/Д 12 14 #Н/Д 13 15 -56

Рис. VII.6

Page 117: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 117

Построим для нее график, а для ряда данных построим полиномиальный

тренд второй степени. На этот раз мы получим квадратный трехчлен

-0.5124 x2 + 2.1234 x + 3.2549.

С его помощью вычислим оценки. В ячейку D12 введем формулу

=0-0.52143*(B12-2)^2+2.1234*(B12-2)+3.2549. Пришлось осуществить сдвиг

аргумента на 2 единицы, чтобы перейти от значений x 3, …, 15 к значениям 1,

…, 13.

Получим те же коэффициенты, что и на диаграмме, с помощью функции

ЛИНЕЙН. Скопируйте исходные данные в блок A27:B31. В ячейку C27

введите формулу =A27-1 и скопируйте ее вниз. Тем самым мы сдвинем x-

значения так, чтобы они начинались с 1. В блок E27:G31 введите табличную

формулу {=ЛИНЕЙН(B27:B31, C27:C31^{1; 2}, 1, 1)}. Будет получен

результат, как на рис. VII.7.

3 5 1 -0,51245 2,123377 3,25487 5 5 3 0,032111 0,45745 1,302037 9 -8 7 0,999051 1,097025 #Н/Д

11 -18 9 1053,124 2 #Н/Д 15 -56 13 2534,793 2,406926 #Н/Д

Рис. VII.7

Как видите, коэффициенты полинома получились такие же, как на

диаграмме. Остаточная сумма квадратов равна 2.41.

ПРИМЕР VII.5. ЭКСПОНЕНЦИАЛЬНАЯ РЕГРЕССИЯ В газете «The Chicago Maroon» за пятницу 10 ноября 1972 г. сообщалось,

что на оптовом рынке ожидаются следующие цены на марочные портвейны в

расчете на бутылку (рис. VII.8):

Page 118: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 118

Год Цена Год Цена

1890 50.00 1941 10.00 1900 35.00 1944 5.99 1920 25.00 1948 8.98 1931 11.98 1950 6.98 1934 15.00 1952 4.99 1935 13.00 1955 5.98 1940 6.98 1960 4.98

Рис. VII.8

Построить регрессию для цен на марочное вино в зависимости от года

закладки вина. Имея формулу регрессии, обоснованно назначить цену на вино,

год закладки которого (1926) отсутствует в таблице.

Решение. Перейдите на новый рабочий лист и назовите его «вино».

Введите исходные данные в диапазон A2:B15. В ячейку A1 введите «Год», в

ячейку B1 – «Цена».

График. Построим график зависимости цены от года. Для этого сделаем

шкалу равномерной. (Попробуйте это сделать самостоятельно, потом читайте

дальше.) Введите в A19:A89 прогрессию 1890, …, 1960. В ячейку A18 введите

строку «Цена». В ячейку B19 введите формулу =ВПР(A19, $A$2:$B$15, 2, 0) и скопируйте ее вниз. Выделите текущую область и постройте график.

Построение линии тренда. График напоминает убывающую экспоненту.

Выделите ряд. В контекстном меню выберите «Добавить линию тренда».

Появится диалоговое окно «Линия тренда». На вкладке «Тип» выберите линию

тренда «Экспоненциальная». На вкладке «Параметры» установите флажок

«показывать уравнение на диаграмме». После закрытия окна Вы увидите на

диаграмме график экспоненты (хорошо приближающий исходный график

цены) и ее уравнение. Выделите уравнение, перетащите его мышью в центр

графика, увеличьте размер шрифта до 18 пунктов. Вы увидите уравнение

55.7 e-0.0347x.

Page 119: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 119

Вычисление коэффициентов экспоненциальной регрессии. Вернемся на

рабочий лист с исходными данными. Для вычисления коэффициентов

регрессии воспользуемся функцией ЛГРФПРИБЛ. Прочитайте о ней в Справке.

Ее аргументы такие же, как у функции ЛИНЕЙН. Она возвращает в первой

строке коэффициенты m и b, которые служат параметрами функции b mx . Итак,

выделим блок G1:H5 и введем табличную формулу {=ЛГРФПРИБЛ(B2:B15,

A2:A15, 1, 1)}. Получим в первой строке коэффициенты m=0.965942,

b=1.49114E+30. Второй коэффициент имеет устрашающий вид, но все равно

попробуем им воспользоваться для получения оценок. Введите в ячейку D2

формулу =$H$1*$G$1^A2 и скопируйте ее вниз. Вы получите оценки

значений ряда.

Теперь попытаемся получить уравнение тренда, которое было выведено на

диаграмме. Для этого рассчитаем в столбце C x-значения, сдвинутые к 1. Для

этого введем в C2 формулу =A2-$A$2+1 и скопируем ее вниз. Для этих x-

значений заново рассчитаем коэффициенты. Введем в блок G8:H12 табличную

формулу {=ЛГРФПРИБЛ(B2:B15, C2:C15, 1, 1)}. На этот раз

коэффициент b=55.70021074. Обратите внимание, что остальные

статистические показатели остались неизменными (кроме стандартного

отклонения b). Рассчитайте в столбце E оценки для этих коэффициентов и Вы

увидите, что они получились такими же, как в столбце D.

Нужно разобраться, почему на диаграмме уравнение тренда 55.7 e-0.0347x, а

на рабочем листе 55.7 0.966x. Приравняем эти две функции и

прологарифмируем их по основанию e. Получим соотношение-0.0347=ln(0.966).

Чтобы убедиться в его справедливости, введем в ячейку G15 формулу

=LN(G8). Функция РОСТ. Эта функция для экспоненциальной регрессии имеет тот

же смысл, что и функция ПРЕДСКАЗ для линейной регрессии. Введите в

ячейку F2 формулу =РОСТ($B$2:$B$15, $A$2:$A$15, A2, 1) и скопируйте

ее вниз. Описание функции прочитайте в Справке.

Page 120: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 120

Теперь, если будет задан вопрос, какую цену назначить за бутылку

портвейна 1926 г., ответ на него можно получить из уравнения регрессии.

Проще всего воспользоваться функцией РОСТ. Скопируйте формулу в ячейку

F17, а в A17 введите 1926. Вы получите ответ: 15.45.

Результаты работы (после форматирования до трех цифр после точки)

приведены в таблице (рис. VII.9).

A B C D E F G H 1 Год Цена 0.966 1E+302 1890 50.00 1 53.803 53.803 53.803 0.003 5.3533 1900 35.00 11 38.047 38.047 38.047 0.929 0.2024 1920 25.00 31 19.026 19.026 19.026 157.049 125 1931 11.98 42 12.966 12.966 12.966 6.406 0.4896 1934 15.00 45 11.712 11.712 11.712 7 1935 13.00 46 11.314 11.314 11.314 8 1940 6.98 51 9.514 9.514 9.514 0.966 55.7009 1941 10.00 52 9.190 9.190 9.190 0.003 0.140

10 1944 5.99 55 8.282 8.282 8.282 0.929 0.20211 1948 8.98 59 7.210 7.210 7.210 157.049 1212 1950 6.98 61 6.728 6.728 6.728 6.406 0.48913 1952 4.99 63 6.277 6.277 6.277 14 1955 5.98 66 5.657 5.657 5.657 15 1960 4.98 71 4.757 4.757 4.757 -0.0347 16 17 1926 15.454

Рис. VII.9

Продолжим цитирование. «В следующем объявлении в той же газете три

года спустя 25 ноября 1975 г., во вторник, говорилось, что предлагается

марочный портвейн 1937 г. по цене 20 долл. За бутылку». Соответствует ли это

нашему прогнозу? Если проанализировать этот вопрос, можно прийти к

выводу, что мы построили неудачную модель. Она была верна для 1972 г., но

не понятно, как ее применять для 1975г. Мы неправильно выбрали в качестве

фактора год закладки вина. Правильно было выбрать другой фактор – возраст

вина.

Page 121: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 121

Заметим, что задача регрессии включена в «Пакет анализа». Если Вы

выберите в меню «Сервис/Анализ данных/Регрессия», то получите при

решении задачи регрессионного анализа намного больше статистической

информации.

ПРИМЕР VII.6. ИСПОЛЬЗОВАНИЕ ПАКЕТА АНАЛИЗА В отделе снабжения гостиницы имеется информация об изменении

стоимости стирального порошка за длительный период времени. Сопоставляя

его с изменениями курса доллара за этот же период времени, можно построить

регрессионное уравнение. Ниже приведены стоимость пачки стирального

порошка (в руб.) и соответствующий курс доллара (руб./USD). № Порошок Курс 1 5 6,3 2 7 9 3 9 12 4 12 15 5 15 19 6 16 21 7 20 25 8 25 29,3

Необходимо на основании этих данных построить регрессионное

уравнение, позволяющее по курсу доллара определять предполагаемую

стоимость пачки стирального порошка.

Решение

1. Введите данные в рабочую таблицу: стоимость пачки порошка — в

диапазон А1:А8; курс доллара в диапазон В1:В8 (заметим, что знаку запятой,

отделяющей целую часть от дробной, соответствует «запятая»).

2. В пункте меню Сервис выберите строку Анализ данных и далее

укажите курсором мыши на строку Регрессия.

3. В появившемся диалоговом окне задайте Входной интервал Y. Для

этого наведите указатель мыши на верхнюю ячейку столбца зависимых данных

(А1), нажмите левую кнопку мыши и, не отпуская ее, протяните указатель

Page 122: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 122

мыши к нижней ячейке (А8), затем отпустите левую кнопку мыши. (Обратите

внимание, что зависимые данные — это те данные, которые предполагается

вычислять.)

4. Так же укажите Входной интервал X, то есть введите ссылку на

диапазон независимых данных В1:В8. (Независимые данные — это те данные,

которые будут измеряться или наблюдаться.)

5. Установите флажок в поле График подбора.

6. Далее укажите выходной диапазон. Для этого поставьте переключатель

в положение Выходной интервал (наведите указатель мыши и щелкните левой

кнопкой), затем наведите указатель мыши на правое поле ввода Выходной

интервал и, щелкнув левой кнопкой мыши, указатель мыши наведите на левую

верхнюю ячейку выходного диапазона (С1). Щелкните левой кнопкой мыши.

Нажмите кнопку OK.

Результаты анализа. В выходном диапазоне появятся результаты и

график подбора.

Интерпретация результатов. В таблице Дисперсионный анализ

оценивается общее качество полученной модели ее достоверность по уровню

значимости критерия Фишера — р, который должен быть меньше, чем 0,05

(строка Регрессия, столбец Значимость F, в примере - 1,58Е-07 (0,000000158),

то есть p =0,000000158 и модель значима) и степень точности описания

моделью процесса — R-квадрат (вторая строка сверху в таблице

Регрессионная статистика, в примере R-квадрат = 0,992). Поскольку R-

квадрат > 0,95, можно говорить о высокой точности аппроксимации (модель

хорошо описывает явление.

Далее необходимо определить значения коэффициентов модели. Они

определяются из таблицы в столбце Коэффициенты — в строке Y-

пересечение приводится свободный член, в строках соответствующих

переменных приводятся значения коэффициентов при этих переменных. В

столбце p-значение приводится достоверность отличия соответствующих

Page 123: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 123

коэффициентов от нуля. В случаях, когда р > 0,05, коэффициент может

считаться нулевым. Это означает, что соответствующая независимая

переменная практически не влияет на зависимую переменную и коэффициент

может быть убран из уравнения.

Отсюда выражение для определения стоимости пачки порошка в рублях

будет иметь следующий вид: -0,83 + 0,847 * (Курс доллара, руб /USD).

Полученная модель с высокой точностью позволяет определять стоимость

пачки стирального порошка (R2 = 99,2%).

Воспользовавшись полученным уравнением, можно рассчитать

ожидаемую стоимость пачки стирального порошка при изменениях курса

доллара. Например, для расчета при курсе доллара 35 руб./USD необходимо

поставить табличный курсор в любую свободную ячейку (А10); ввести с

клавиатуры знак =, щелкнуть указателем мыши по ячейке D17, ввести с

клавиатуры знак +, щелкнуть по ячейке D18, ввести с клавиатуры знак * и

число 35. В результате в ячейке А10 будет получена ожидаемая стоимость

пачки порошка — 28,8 руб.

ПРИМЕР VII.7. ИСПОЛЬЗОВАНИЕ ПАКЕТА АНАЛИЗА

Построить регрессионную модель для предсказания изменений уровня

заболеваемости органов дыхания (Y) в зависимости от содержания в воздухе

двуокиси углерода (X1) и степени запыленности (X2). В таблице приведены

данные наблюдений в течение 29 месяцев.

Page 124: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 124

X1 X2 Y 1 1,3 1160 1 1,3 1155 1,1 1,4 1158 1,1 1,4 1157 1,1 1,5 1160 1,1 1,5 1161 1 1,4 1157 1 1,5 1159 1,2 1,6 1256 1,2 1,7 1260 0,6 1 1040 0,6 1 1039 0,7 1,1 1039 0,7 1,15 1040 0,75 1,2 1040 0,7 1,2 1039 0,7 1,3 1040 0,7 1,3 1039 0,8 1,4 1140 0,8 1,4 1138 0,78 1,5 1240 0,8 1,5 1239 0,78 1,5 1241 0,78 1,6 1240 0,8 1,7 1239 0,8 1,8 1239 0,75 1,8 1240 0,78 1,9 1238 0,75 1,9 1238

Решение

1. Введите данные наблюдений в диапазон А1:С30 рабочей таблицы Excel.

2. В пункте меню Сервис выберите строку Анализ данных и далее

укажите курсором мыши на строку Регрессия. Нажмите кнопку OK.

3. В появившемся диалоговом окне задаем Входной интервал Y. Для

этого наведите указатель мыши на верхнюю ячейку столбца зависимых данных

(С2), нажмите левую кнопку мыши и, не отпуская ее, протяните указатель

мыши к нижней ячейке (C30), затем отпустите левую кнопку мыши. (Обратите

внимание, что зависимые данные — это те данные, которые предполагается

вычислять).

Page 125: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 125

4. Так же укажите Входной интервал X, то есть введите ссылку на

диапазон независимых данных А2:B30. (Независимые данные — это те данные,

которые будут измеряться или наблюдаться).

5. Установите флажок в поле График подбора.

6. Далее укажите выходной диапазон. Для этого поставьте переключатель

в положение Выходной интервал (наведите указатель мыши и щелкните левой

кнопкой), затем наведите указатель мыши на правое поле ввода Выходной

интервал и, щелкнув левой кнопкой мыши, указатель мыши наведите на левую

верхнюю ячейку выходного диапазона (D1). Щелкните левой кнопкой мыши.

Нажмите кнопку OK.

7. В выходном диапазоне появятся результаты регрессионного анализа и

графики предсказанных точек.

Интерпретация результатов. В таблице Дисперсионный анализ

оценивается достоверность полученной модели по уровню значимости

критерия Фишера (строка Регрессия, столбец Значимость F, в примере —

1.4Е-09 (1,4*10^-9), то есть p << 0,05 и модель значима) и степень описания

моделью процесса — R-квадрат (вторая строка сверху в таблице

Регрессионная статистика, в примере R-квадрат = 0,89). Поскольку R-

квадрат > 0,8, можно говорить о довольно высокой точности аппроксимации

(модель хорошо описывает зависимость заболеваемости от содержания

углекислого газа и запыленности воздуха.

Далее необходимо определить значения коэффициентов модели. Они

определяются из таблицы в столбце Коэффициенты — в строке Y-

пересечение приводится свободный член a0 = 682; в строках соответствующих

переменных приводятся значения коэффициентов при этих переменных a1 = 91

и a2 = 275. В столбце p-значение приводится достоверность отличия

соответствующих коэффициентов от нуля. Все коэффициенты значимы, то есть

p < 0,05, и коэффициенты могут считаться не равными нулю.

Page 126: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 126

Поэтому выражение для определения уровня заболеваемости органов

дыхания в зависимости от содержания углекислого газа и пыли в воздухе будет

иметь вид: Y = 682 + 91*Х1 + 275 * Х2 .

УПРАЖНЕНИЕ VII.3. ПРИМЕНЕНИЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ ДЛЯ ОПИСАНИЯ ЛИНЕЙНЫХ ЗАВИСИМОСТЕЙ

При изучении экстракционного распределении карбоновой кислоты

RCOOH между водой и экстрагентом S обнаружено, что экстракция из водной

фазы молекул кислоты сопровождается одновременной экстракцией воды в

количествах, пропорциональных количеству экстрагированной кислоты. В

целях более точного изучения «транспорта» воды, сопутствующего экстракции

кислоты экстрагеном S, проведено параллельное аналитическое определение

равновесных концентраций кислоты в экстрагенте методом

потенциометрического титрования и воды методом Фишера в аликвотных

порциях экстрагента для 8 различных начальных (и равновесных)

концентраций кислоты в водной фазе (при заданном исходном cooтношении

объемов фаз, равном 1:1). Для повышения надежностн результатов все

определения проведены пятикратно, и конечный результат в определении

обеих концентраций охарактеризован средним значением.

Сводка экспериментальных данных по равновесным концентрациям имеет

следующий вид (данные округлены с точностью до 0,1 ммоль/л):

№ опыта RCOOHC (в экстрагенте) OHC

2

1 2,0 5,6 2 3,5 7,3 3 4,7 8,3 4 5,4 8,8 5 6,5 9,8 6 8,0 11,2 7 9,2 12,3 8 10,0 13,3

Page 127: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 127

Анализ этих данных позволяет предположить следующую возможную

схему транспорта воды, сопутствующего экстракции кислоты:

)(21)(21)( оргоргВ bSOHaRCOOHbSOHaRCOOH ⋅⋅⇔++ (VII.1)

Согласно этой схеме конкретная функциональная зависимость между

равновесными концентрациями воды (у) и кислоты (х) в экстрагенте имеет вид

у=а0 + а1 х, (VII.2)

где а0 – равновесная растворимость воды в чистом экстрагенте (молярная

концентрация); а1 – гидратное число кислоты 1 (число молекул воды на 1

молекулу кислоты) в составе гидратосольвата bSOHaRCOOH ⋅⋅ 21 ,

образующегося при экстракции.

Требуется оценить достоверность принятой схемы транспорта воды и в

случае ее хорошего согласия с экспериментом найти оптимальные параметры

а0 и а1.

Решение

Прежде всего, построим на графике все 8 точек, соответствующих

экспериментальным данным. График показывает, что точки с небольшой

погрешностью ложатся на прямую линию. Следовательно, принятую схему

транспорта воды следует считать весьма вероятной, равно как и вытекающую

из нее функциональною зависимость (VII.2). Поэтому применение метода

наименьших квадратов для отыскания оптимальных параметров а0 и а1 в

данном случае вполне оправдано.

Расчет рекомендуется выполнить самостоятельно с помощью Пакета

анализа процедуры Регрессия (см. ПРИМЕР VII.6 и ПРИМЕР VII.7).

Необходимо определить значения коэффициентов модели. Они

определяются из таблицы в столбце Коэффициенты — в строке Y-

пересечение приводится свободный член, в строках соответствующих

переменных приводятся значения коэффициентов при этих переменных. В

столбце p-значение приводится достоверность отличия соответствующих

Page 128: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 128

коэффициентов от нуля. В случаях, когда р > 0,05, коэффициент может

считаться нулевым. Это означает, что соответствующая независимая

переменная практически не влияет на зависимую переменную и коэффициент

может быть убран из уравнения. Все коэффициенты значимы, то есть p < 0,05, и

коэффициенты могут считаться не равными нулю.

Отсюда уравнение, связывающее равновесные концентрации (моль/л) воды

и кислоты в фазе экстрагента, имеет вид

RCOOHOH CC 929,010851,3 32

+⋅= − ,

откуда равновесная растворимость воды в экстрагенте

a0 = 3,851*10^-3 X Мол. вес.H2O = 68 мг/л, а гидратное число a1 = 0,929 ≈ 1.

Если величина а0 для температуры, при которой производилась

экстракция, известна из справочных данных, близкое совпадение

экспериментальной и справочной величин может служить хорошим

подтверждением справедливости принятой схемы транспорта воды (VII.1).

Равным образом, близость углового коэффициента а1 (гидратного числа) к

единице дает основание утверждать, что принятая схема является весьма

вероятной.

Однако некоторое несовпадение величин а0,опт с а0,справ и углового

коэффициента а1,опт = 0,929 с 1 может рассматриваться как значимое и, строго

говоря, требует дополнительного статистического исследования, конечная цель

которого – принять или отвергнуть гипотезу о правомочности принятой схемы

транспорта воды.

Не исключено, например, что образующийся гидратосольват относительно

непрочен и его частичная диссоциация по схеме

)(21)()()(2 )( Воргоргорг OHScbRCOOHсSbSOHRCOOH ++⇔+⋅⋅

приводит к некоторому снижению гидратного числа. Другая возможная

причина его снижения – частичная димеризация кислоты с ростом ее брутто

концентрации в органической фазе. В обоих случаях учет этих дополнительных

Page 129: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 129

взаимодействий в фазе экстрагента приведет к замене функциональной

зависимости (47) на более сложную.

Интерпретация результатов В таблице Дисперсионный анализ

оценивается общее качество полученной модели ее достоверность по уровню

значимости критерия Фишера — р, который должен быть меньше, чем 0,05

(строка Регрессия, столбец Значимость F, в примере – 4,18Е-09

(0,00000000418), то есть p = 0,00000000418 и модель значима) и степень

точности описания моделью процесса — R-квадрат (вторая строка сверху в

таблице Регрессионная статистика, в примере R-квадрат = 0,997). Поскольку

R-квадрат > 0,95, можно говорить о высокой точности аппроксимации (модель

хорошо описывает явление.

Задания к разделу VII. «Регрессионный анализ в электронных таблицах Excel».

1. Построить зависимость зарплаты (руб.) от возраста сотрудника

гостиницы по следующим данным: Возраст Зарплата 20 800 50 2500 45 2500 40 2000 25 1200 30 1800

2. Построить зависимость жизненной емкости легких в литрах (Y) от роста в

метрах (X1) и возраста в годах (X1) для группы мужчин:

X1 X2 Y 1,85 18 5,4 1,8 25 5,7 1,75 20 4,8 1,7 24 5,1 1,68 21 4,5 1,73 19 4,8 1,77 22 5,1 1,81 23 5,6 1,76 18 4,7

Page 130: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 130

3. Определить должное значение жизненной емкости легких для мужчины

возраста 22 лет и роста 183 см из регрессионного уравнения, полученного

в предыдущем упражнении.

4. Имеются данные о цене на нефть х (ден. ед.) и индексе акций нефтяных

компаний y (усл. ед.): x y 17,28 537 17,05 534 18,30 550 18,80 555 19,20 560 18,50 552

Построить зависимость индекса акций нефтяных компаний от цены на

нефть.

5. Построить функцию, наилучшим образом отражающую данную

зависимость: X 1,0 1,5 3,0 4,5 5,0 Y 1,25 1,4 1,5 1,75 2,25

6. Исследовать характер изменения с течением времени уровня

производства некоторой продукции и подобрать аппроксимирующую

функцию, располагая следующими данными: Год Производство продукции 1997 17,1 1998 18,0 1999 18,9 2000 19,7 2001 19,7 7. Для набора данных (3, 5), (5, 5), (9, -8), (11, -18), (15, -56). Вычислить

методом наименьших квадратов коэффициенты параболы dx2 +ex+f.

8. Можно и не вычислять коэффициенты регрессионного уравнения. Ведь

оно нужно нам, чтобы вычислить оценки откликов для старых и новых

значений факторов. (Старые значения – те, на основе которых

вычислялось уравнение регрессии). Для этого служат две функции:

ТЕНДЕНЦИЯ и ПРЕДСКАЗ. Выясните, в чем разница между этими

двумя функциями. Вычислите оценки откликов для примера VII.2 тремя

Page 131: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 131

способами: на основе функции ПРЕДСКАЗ (в блоке C2:C6), на основе

функции ТЕНДЕНЦИЯ (в блоке D2:D6), на основе уже вычисленных

коэффициентов m и b (в блоке E2:E6).

9. Решить задачу построения экспоненциальной регрессии для модели, где

фактором является возраст вина, а откликом – цена вина. Построить

также квадратичную и кубическую регрессионную функцию и сравнить

сумму квадратов остатков для всех трех функций. Соответствует ли

прогнозу цена 20 долл. в 1975 г. за бутылку портвейна 1937 г.

10. На основании эксперимента получены четыре значения искомой

функции )(xφy = при четырех значениях аргумента, которые записаны в табл.

X 1 2 3 5 y 3 4 2,5 0,5

Получить функцию на основании этих экспериментальных данных по

методу наименьших квадратов. Функцию )(xφy = искать в виде линейной

функции . baxy +=

11. При распределении салициловой кислоты между бензолом и водой

при 298 K были получены следующие данные: с1 0,0363 0,0668 0,0940 0,126 0,210 0,283 0,558 0,756 0,912 с2 0,0184 0,0504 0,0977 0,146 0,329 0,553 0,650 2,810 4,340

где c1 – концентрация салициловой кислоты в водном слое, моль/л,

c2 – концентрация салициловой кислоты бензольном слое, моль/л.

Написать уравнение распределения.

Page 132: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 132

Раздел VIII. Решение задач оптимизации в электронных таблицах Excel

В Excel имется надстройка «Поиск решения», которая позволяет решать

задачи отыскания наибольших и наименьших значений, а также решать

уравнения.

ОПТИМИЗАЦИЯ. ОСНОВНЫЕ ПОНЯТИЯ

Под оптимизацией понимают процесс выбора наилучшего варианта из

всех возможных. С точки зрения инженерных расчетов методы оптимизации

позволяют выбрать наилучший вариант конструкции, наилучшее

распределение ресурсов и т.п.

В процессе решения задачи оптимизации обычно необходимо найти

оптимальные значения некоторых параметров, определяющих данную задачу.

При решении инженерных задач их принято называть проектными

параметрами, а в экономических задачах их обычно называют параметрами

плана. В качестве проектных параметров могут быть, в частности, значения

линейных размеров объекта, массы, температуры и т. п. Число п проектных

параметров x1, x2, ..., xn характеризует размерность (и степень сложности)

задачи оптимизации.

Выбор оптимального решения или сравнение двух альтернативных

решений проводится с помощью некоторой зависимой величины (функции),

определяемой проектными параметрами. Эта величина называется целевой

функцией (или критерием качества). В процессе решения задачи оптимизации

должны быть найдены такие значения проектных параметров, при которых

целевая функция имеет минимум (или максимум). Таким образом, целевая

функция — это глобальный критерий оптимальности в математических

моделях, с помощью которых описываются инженерные или экономические

задачи.

Целевую функцию можно записать в виде

Page 133: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 133

u = f(x1, x2, ..., xn). (VIII.1)

Примерами целевой функции, встречающимися в инженерных и

экономических расчетах, являются прочность или масса конструкции,

мощность установки, объем выпуска продукции, стоимость перевозок грузов,

прибыль и т.п.

В случае одного проектною параметра (n = 1) целевая, функция (VIII.1)

является функцией одной переменной, и ее график — некоторая кривая на

плоскости. При п == 2 целевая функция является функцией двух переменных, и

ее графиком является поверхность.

Следует отметить, что целевая функция не всегда может быть

представлена в виде формулы. Иногда она может принимать только некоторые

дискретные значения, задаваться в виде таблицы и т.п. Во всех случаях она

должна быть однозначной функцией проектных параметров.

Целевых функций может быть несколько. Например, при проектировании

изделий машиностроения одновременно требуется обеспечить максимальную

надежность, минимальную материалоемкость, максимальный полезный объем

(пли грузоподъемность). Некоторые целевые функции могут оказаться

несовместимыми. В таких случаях необходимо вводить приоритет той или иной

целевой функции.

ЗАДАЧИ ОПТИМИЗАЦИИ

Можно выделить два типа задач оптимизации — безусловные и условные.

Безусловная задача оптимизации состоит в отыскании максимума или

минимума действительной функции (VIII.1) от п действительных переменных и

определении соответствующих значений аргументов на некотором множестве σ

n-мерного пространства. Обычно рассматриваются задачи минимизации; к ним

легко сводятся и задачи на поиск максимума путем замены знака целевой

функции на противоположный.

Page 134: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 134

Условные задачи оптимизации, или задачи с ограничениями,— это такие,

при формулировке которых задаются некоторые условия (ограничения) на

множестве σ. Эти ограничения задаются совокупностью некоторых функций,

удовлетворяющих уравнениям или неравенствам.

Ограничения-равенства выражают зависимость между проектными

параметрами, которая должна учитываться при нахождении решения. Эти

ограничения отражают законы природы, наличие ресурсов, финансовые

требования и т.п.

В результате ограничений область проектирования σ, определяемая всеми

п проектными параметрами, может быть существенно уменьшена в

соответствии с физической сущностью задачи. Число m ограничений-равенств

может быть произвольным. Их можно записать

в виде

g1(x1, x2, ..., xn) = 0,

g2(x1, x2, ..., xn) = 0, (VIII.2)

……………………

gm(x1, x2, ..., xn) = 0.

В ряде случаев из этих соотношений можно выразить одни проектные

параметры через другие. Это позволяет исключить некоторые параметры из

процесса оптимизации, что приводит к уменьшению размерности задачи и

облегчает ее решение. Аналогично могут вводиться также ограничения-

неравенства имеющие вид

a1 ≤ φ1(x1, x2, ..., xn) ≤ b1,

a2 ≤ φ2(x1, x2, ..., xn) ≤ b2, (VIII.3)

…………………………

ak ≤ φk(x1, x2, ..., xn) ≤ bk.

Следует отметить особенность в отыскании решения при наличии

ограничений. Оптимальное решение здесь может соответствовать либо

локальному экстремуму (максимуму или минимуму) внутри области

Page 135: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 135

проектирования, либо значению целевой функции на границе области. Если же

ограничения отсутствуют, то ищется оптимальное решение на всей области

проектирования, то есть глобальный экстремум.

Теория и методы решения задач оптимизации при наличии ограничений

составляют предмет исследования одного из важных разделов прикладной

математики — математического программирования.

ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ. ЗАДАЧИ НА ЭКСТРЕМУМ Одномерная задача оптимизации в общем случае формулируется

следующим образом. Найти наименьшее (пли наибольшее) значение целевой

функции y = f(x), заданной на множестве σ, и определить значение проектного

параметра σ∈x , при котором целевая функция принимает экстремальное

значение. Существование решения поставленной задачи вытекает из

следующей теоремы.

Теорема Вейерштрасса. Всякая функция f(x), непрерывная на отрезке

[a, b], принимает на этом отрезке наименьшее и наибольшее значения, то

есть на отрезке [a, b] существуют такие точки x1 и x2, что для любого

имеют место неравенства [ bax ,∈ ]f(x1) ≤ f(x) ≤ f(x2).

Эта теорема не доказывает единственности решения. Не исключена

возможность, когда равные экстремальные значения достигаются сразу в

нескольких точках данного отрезка. В частности, такая ситуация имеет место

для периодической функции, рассматриваемой на отрезке, содержащем

несколько периодов.

Будем рассматривать методы оптимизации для разных классов целевых

функций. Простейшим из них является случай дифференцируемой функции f(x)

на отрезке [a, b], причем функция задана в виде аналитической зависимости

y=f(x), и может быть найдено явное выражение для ее производной f'(x).

Нахождение экстремумов таких функций можно проводить известными из

Page 136: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 136

курса высшей математики методами дифференциального исчисления.

Напомним вкратце этот путь.

Функция f(x) может достигать своего наименьшего и наибольшего

значений либо в граничных точках отрезка [a, b], либо в точках минимума и

максимума. Последние точки обязательно должны быть критическими, то есть

производная f'(x) в этих точках обращается в нуль, — это необходимое условие

экстремума. Следовательно, для определения наименьшего или наибольшего

значений функции f(x) на отрезке [a, b] нужно вычислить ее значения во всех

критических точках данного отрезка и в его граничных точках и сравнить

полученные значения; наименьшее или наибольшее из них и будет искомым

значением.

МНОГОМЕРНЫЕ ЗАДАЧИ ОПТИМИЗАЦИИ. МИНИМУМ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Выше мы рассмотрели одномерные задачи оптимизации, в которых

целевая функция зависит лишь от одного аргумента. Однако в большинстве

реальных задач оптимизации, представляющих практический интерес, целевая

функция зависит от многих проектных параметров. Минимум

дифференцируемой функции многих переменных u = f(x1, x2, ...,

xn). можно найти, исследуя ее значения в критических точках, которые

определяются из решения системы дифференциальных уравнений

.0...,,0,021

=∂∂

=∂∂

=∂∂

nxf

xf

xf

Page 137: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 137

ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ В случае, когда оптимизируемая целевая функция и ограничения линейны,

задача оптимизации решается методами линейного программирования и

обычно называется задачей линейного программирования.

Процесс решения задачи линейного программирования обычно состоит из

ряда этапов:

• 1-й этап: осмысление задачи, выделение наиболее важных качеств,

свойств, величин, параметров. Это можно делать, составляя схемы,

таблицы, графики и т.п.;

• 2-й этап: введение обозначений (неизвестных). Желательно

ограничиваться как можно меньшим количеством неизвестных, выражая

по возможности одни величины через другие;

• 3-й этап: создание целевой функции. Обычно в качестве цели могут

выступать максимальная стоимость всего объема продукции,

максимальная прибыль, минимальные затраты и т.п. Целевая функция

записывается в виде(VIII.1);

• 4-й этап: составление системы ограничений, которым должны

удовлетворять введенные величины (VIII.2) или (VIII.3);

• 5-й этап: решение задачи на компьютере.

Инструментом для поиска решений задач оптимизации в Excel служит

процедура Поиск решения (Сервис ► Поиск решения). При этом

открывается диалоговое окно Поиск решения. Оно содержит следующие

рабочие поля:

• Установить целевую ячейку — служит для указания целевой ячейки,

значение которой необходимо максимизировать, минимизировать или

установить равным заданному числу. Эта ячейка должна содержать

формулу;

• Равной — служит для выбора варианта оптимизации значения целевой

ячейки (максимизация, минимизация или подбор заданного числа). Чтобы

Page 138: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 138

установить число, необходимо ввести его в поле;

• Изменяя ячейки — служит для указания ячеек, значения которых

изменяются в процессе поиска решения до тех пор, пока не будут

выполнены наложенные ограничения и условие оптимизации значения

ячейки, указанной в поле Установить целевую ячейку;

• Предположить — используется для автоматического поиска ячеек,

влияющих на формулу, ссылка на которую дана в поле Установить

целевую ячейку. Результат поиска отображается в поле Изменяя

ячейки;

• Ограничения — служит для отображения списка граничных условий

поставленной задачи;

• Добавить — используется для отображения диалогового окна Добавить

ограничение;

• Изменить — применяется для отображения диалогового окна Изменить

ограничение;

• Удалить — служит для снятия указанного ограничения;

• Выполнить — используется для запуска поиска решения поставленной

задачи;

• Закрыть — служит для выхода из окна диалога без запуска поиска

решения поставленной задачи. При этом сохраняются установки,

сделанные в окнах диалога, появлявшихся после нажатий на кнопки

Параметры, Добавить, Изменить или Удалить;

• Параметры — применяется для отображения диалогового окна

Параметры поиска решения, в котором можно загрузить или сохранить

оптимизируемую модель и указать предусмотренные варианты поиска

решения;

• Восстановить — служит для очистки полей окна диалога и

восстановления значений параметров поиска решения, используемых по

Page 139: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 139

умолчанию.

ПРИМЕР VIII.1. ЛИНЕЙНАЯ ОПТИМИЗАЦИЯ Фирма производит две модели A и B сборных книжных полок. Их

производство ограничено наличием сырья (высококачественных досок) и

временем машинной обработки. Для каждого изделия модели A требуется

3 м2 досок, а для изделия модели B - 4 м2. Фирма может получить от своих

поставщиков до 1700 м2 в неделю. Для каждого изделия модели A требуется 12

мин машинного времени, а для изделия модели B – 30 мин. В неделю можно

использовать 160 ч машинного времени. Сколько изделий каждой модели

следует выпускать фирме в неделю, если каждое изделие модели A приносит 2

долл. Прибыли, а каждое изделие модели В – 4 долл. прибыли?

Решение. Составим математическую модель. Обозначим: x – количество

изделий модели A, выпускаемых в течение недели, y – количество изделий

модели B. Прибыль от этих изделий равна 2x+4y долл. Эту прибыль нужно

максимизировать. Функция, для которой ищется экстремум (максимум или

минимум), носит название целевой функции. Беспредельному увеличению

количества изделий препятствуют ограничения. Ограничено количество

материала для полок, отсюда неравенство 3x+4y≤1700. Ограничено машинное

время на изготовление полок. На изделие A уходит 0.2 часа, на изделие B – 0.5

часа, а всего не более 160 ч, поэтому 0.2x+0.5y≤160. Кроме того, количество

изделий – неотрицательное число, поэтому x≥0, y≥0.

Формально наша задача оптимизации записывается так:

⎪⎪⎩

⎪⎪⎨

≥≥≤+

≤+→+

0,01605.02.0

170043max42

yxyx

yxyx

Теперь решим эту задачу в Excel. Создайте новую рабочую книгу и

сохраните ее. Дайте первому листу имя «Полки».

Page 140: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 140

Введите в ячейки рабочего листа информацию (рис. VIII.1). Ячейкам B2 и

B3 присвойте имена x и y. В ячейках C6, C9 и C10 представлены формулы,

занесенные в соответствующие ячейки столбца B.

Выделим ячейку, в которой вычисляется целевая функция, и вызовем

Решатель («Сервис/Поиск решения»). В диалоговом окне в поле ввода

«Установить целевую ячейку:» уже содержится адрес ячейки с целевой

функцией $B$6. Установим переключатель: «Равной максимальному

значению». Перейдем к полю ввода «Изменяя ячейки:». В нашем случае

достаточно щелкнуть кнопку «Предположить» и в поле ввода появится адрес

блока $B$2:$B$3.

Перейдем к вводу ограничений. Щелкнем кнопку «Добавить». Появится

диалоговое окно «Добавление ограничения». В поле ввода «Ссылка на ячейку:»

укажите $B$9. Правее расположен выпадающий список с условными

операторами (раскройте его и посмотрите). Выберем условие <=. В поле ввода

«Ограничение:» введите число 1700. У нас есть еще одно ограничение,

поэтому, не выходя из этого диалогового окна, щелкните кнопку «Добавить» и

введите ограничение $B$10<=160. Ввод ограничений закончен, поэтому

нажмите «OK». Вы вновь окажитесь в диалоговом окне «Поиск решения». Вы

увидите введенные ограничения $B$10<=160 и $B$9<=1700. Справа имеются

кнопки «Изменить» и «Удалить». С их помощью Вы можете изменить

ограничение или стереть его. (Если Вы используете Excel 5.0/7.0, то Вы должны

ввести еще одно ограничение $B$2:$B$3>=0).

Page 141: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 141

A B C D 1 Переменные 2 Изделие A 0 X 3 Изделие B 0 Y 4 5 Целевая функция 6 Прибыль 0 =2*x+4*y 7 8 Ограничения 9 Материал 0 =3*x+4*y <=1700

10 Время изготовления 0 =0.2*x+0.5*y <=160

Рис. VIII.1

Щелкните кнопку «Параметры». Вы окажитесь в диалоговом окне

«Параметры поиска решения». Чтобы узнать назначение полей ввода этого

окна, щелкните кнопку «Справка». Менять ничего не будем, только установим

два флажка: «Линейная модель» (так как наши ограничения и целевая функция

являются линейными по переменным x и y) и «Неотрицательные значения» (для

переменных x и y). В Excel 5.0/7.0 этот последний флажок отсутствует, поэтому

и нужно было вводить ограничение $B$2:$B$3>=0. Щелкнем «OK» и

окажемся в исходном окне.

Мы полностью подготовили задачу оптимизации. Нажимаем кнопку

«Выполнить». Появляется диалоговое окно «Результаты поиска решения». В

нем мы читаем сообщение: «Решение найдено. Все ограничения и условия

оптимальности выполнены». На выбор предлагаются варианты: «Сохранить

найденное решение» или «Восстановить исходные значения». Выбираем

первое. Можно также вывести отчеты: по результатам, по устойчивости, по

пределам. Выделите их все, чтобы иметь представление о том, какая

информация в них размещена. Здесь мы не будем комментировать эти отчеты,

так как их полное понимание требует существенного углубления в методы

оптимизации.

После нажатия «OK» вид таблицы меняется: в ячейках x и y появляются

оптимальные значения. Числовые данные примера специально подобраны,

Page 142: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 142

поэтому в отчет получились круглые цифры: изделие A нужно выпускать в

количестве 300 штук в неделю, изделие B – 200 штук. Соответственно

пересчитываются все формулы. Целевая функция достигает значения 1400.

На самом деле эту задачу надо было формулировать как целочисленную,

ведь нельзя выпустить дробное число полок. Как поставить целочисленную

задачу оптимизации, мы увидим далее.

Ограничения можно было ввести в решатель быстрее. Нужно было ввести

в B9:B10 формулы =3*x+4*y-1700 и =0.2*x+0.5*y-160. Тогда ограничения

можно было задать блоком $B$9:$B$10<=0. В случае большого количества

ограничений это существенно ускорит подготовку задачи.

УПРАЖНЕНИЕ VIII.1. ЛИНЕЙНАЯ ОПТИМИЗАЦИЯ

Недельный фонд времени уменьшился из-за планового ремонта и

составляет 150 ч. Измените ограничения и убедитесь, что получатся дробные

решения.

ПРИМЕР VIII.2. ЛИНЕЙНАЯ ОПТИМИЗАЦИЯ

При решении следующего примера мы познакомимся с очень полезным

средством Excel: сценариями.

Имеются три сплава. Первый сплав содержит 70 % олова и 30 % свинца,

второй – 80 % олова и 20 % цинка, третий – 50 % олова, 10 % свинца и 40 %

цинка. Из них необходимо изготовить новый сплав, содержащий 15 % свинца.

Какое наибольшее и наименьшее процентное содержание олова может быть в

этом сплаве?

Решение. Пусть u – количество первого сплава, v – количество второго

сплава, w- количество третьего сплава, взятые для изготовления нового сплава.

Так как в сплаве должно быть 15 % свинца, получим уравнение

Page 143: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 143

15.01.003.0=

++++

wvuwvu .

Количество олова в новом сплаве

wvuwvu

++++ 5.08.07.0 .

Для этой функции трех неотрицательных переменных нужно найти

наибольшее и наименьшее значения. Уместно перейти к новым переменным:

.,,wvu

wzwvu

vywvu

ux++

=++

=++

=

Тогда мы получим ограничения: 0.3x+0.1z-0.15=0 и x+y+z-1=0, причем

переменные x, y, z неотрицательные. Целевая функция имеет вид:

0.7x+0.8y+0.5z. Заполним рабочий лист (рис. VIII.2).

x 0 y 0 z 0 -0.15 =0.3*x+0.1*z-0.15 -1 =x+y+x-1 0% =0.7*x+0.8*y+0.5*z

Рис. VIII.2

В столбце C показаны формулы из столбца B. На ячейку B8 наложен

процентный формат. Выделим ячейку B8 и вызовем Решатель. Обычным

порядком зададим ячейку с целевой функцией (B8), изменяемые переменные

(B1:B3) и ограничения (B5:B6=0). Щелкнув кнопку «Параметры», установим

флажки «Линейная модель» и «Неотрицательные значения» (в Excel 5.0/7.0)

последнего флажка нет; там нужно добавить ограничение B1:B3>=0). Сначала

укажем, что нужно искать максимальное значение. После выполнения расчетов

получим уже знакомое диалоговое окно «Результаты поиска решения».

Page 144: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 144

Щелкнем кнопку «Сохранить сценарий». Появится диалоговое окно

«Сохранение сценария». Введем название сценария «max». Вновь появится

окно «Результаты решения». Установим переключатель «Восстановить

исходные значения» и закроем это окно. Вновь вызовем Решатель и найдем

минимальное значение целевой функции, дав сценарию название «min».

Сценарии. Прежде чем дать определение, что такое сценарий, выполним

команду меню «Сервис/сценарии». Появится диалоговое окно «Диспетчер

сценариев». В нем перечислены сценарии текущего рабочего листа: min и max.

Ниже указаны адреса изменяемых ячеек: $B$1:$B$3. Выделим в списке имен

сценариев строку max и щелкнем кнопку «Вывести». На рабочем листе

появятся числа (рис. VIII.3).

x 0.5y 0.5z 0 -1.5E-13 4.55E-12 75%

Рис.VIII.3

Изменились числа в B1:B3, но, следовательно, изменились и числа в

ячейках, зависящих от B1:B3. В B8 мы видим максимальное значение 75 %.

Вновь вызовем «Сервис/Сценарии». На этот раз выделим сценарий min и

щелкнем кнопку «Вывести» (Рис. VIII.4).

x 0.25y 0z 0.75 -1.5E-13 4.55E-12 55%

Рис.VIII.4

Page 145: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 145

Изменились x, y, z. Минимальное значение 55 %. Итак, сценарий – это

набор значений для изменяемых ячеек, этому набору дано имя. Благодаря этому

средству пользователь таблицы может хранить в ней несколько вариантов

расчетов и обращаться к ним при необходимости.

Хотелось бы, однако, иметь перед глазами все сценарии вместе. Для этого

в Диспетчере сценариев имеется командная кнопка «Отчет». Вызовем

Диспетчер сценариев и щелкнем по этой кнопке.

Появится диалоговое окно «Отчет по сценарию». На выбор предлагается

тип отчета: «структура» или «сводная таблица». Внизу, в поле ввода «Ячейки

результата:» уже выставлены адреса ячеек: B5, B6, B8. Не будем пока изменять

это поле, а установим переключатель «структура». Появится новый рабочий

лист «Структура сценария» (рис. VIII.5). (Удалена грубая и пугающая

раскраска таблицы).

Структура сценария

Текущие значения: max min Изменяемые: x 0.25 0.5 0.25y 0 0.5 0z 0.75 0 0.75Результат:

$B$5 -1.4988E-13 -1.49991E-13 -1.4988E-13$B$6 4.55103E-12 4.55103E-12 4.55103E-12$B$8 55 % 75 % 55 %

Рис. VIII.5

Слева и сверху имеются символы двухуровневой структуры. Столбец

«Текущие значения» (то есть значения, которые выводились на рабочем листе в

момент создания отчета), как правило, не нужен и его можно удалить. Вообще,

при желании легко переоформить эту в целом полезную таблицу.

Теперь посмотрим, как выглядит отчет в форме сводной таблицы. Вызовем

Диспетчер сценариев, щелкнем кнопку «Отчет», установим переключатель

Page 146: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 146

«сводная таблица». Появится новый рабочий лист «Сводная таблица по

сценарию» (рис. VIII.6).

$B$1:$B$3 на (Все) Ячейки результата $B$1:$B$3 $B$5 $B$6 $B$8 max -1.49991E-13 4.55103E-12 0.75 min -1.4988E-13 4.55103E-12 0.55

Рис. VIII.6

Здесь в отличие от предыдущей таблицы не выведены значения ячеек

B1:B3, а только приведены названия сценариев.

Чтобы включить в таблицу значения B1:B3, вызовите Диспетчер сценариев

и в окне «Отчет по сценарию» добавьте в поле ввода «Ячейки результата:»

адрес блока B1:B3 перед адресами ячеек B5, B6, B8. В поле ввода: B1:B3, B5,

B6, B8. Теперь сводная таблица имеет вид (рис. VIII.7).

$B$1:$B$3 на

(Все)

Ячейки

результата

$B$1:$B$3 x y z $B$5 $B$6 $B$8max 0.5 0.5 0 -1.49991E-13 4.55103E-12 0.75min 0.25 0 0.75 -1.4988E-13 4.55103E-12 0.55

Рис. VIII.7

В таблице представлены значения не только результирующих, но и

исходных ячеек.

Page 147: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 147

ПРИМЕР VIII.3 ЦЕЛОЧИСЛЕННАЯ ОПТИМИЗАЦИЯ Фирма выпускает два набора удобрений для газонов: обычный и

улучшенный. В обычный набор входят 3 фунта азотных, 4 фунта фосфорных и

один фунт калийных удобрений, а в улучшенный – 2 фунта азотных, 6 фунтов

фосфорных и 2 фунта калийных удобрений. Известно, что требуется по

меньшей мере 10 фунтов азотных, 20 фунтов фосфорных и 7 фунтов калийных

удобрений. Обычный набор стоит 3 долл., а улучшенный – 4 долл. Сколько и

каких наборов удобрений надо купить, чтобы обеспечить эффективное питание

почвы и минимизировать себестоимость?

Решение. Как и в предыдущем примере, задачу нужно перевести на

математический язык. Пусть x – количество обычных наборов удобрений, y –

количество улучшенных наборов удобрений. f(x, y)=3x+4y→min при

ограничениях:

⎪⎪⎩

⎪⎪⎨

≥≥≥+≥+≥+

0,07220641023

yxyxyxyx

Мы воспользуемся возможностями Excel, чтобы сделать решение более

выразительным (рис. VIII.8).

A B C D E F 1 азотные Фосфор-

ные калиевые цена количество

2 обычный набор 3 4 1 3 03 улучшенный

набор 2 6 2 4 0

4 5 требуется >= 10 20 7 Общая

цена 6 ограничения -10 -20 -7 0

Рис. V.III.8

Page 148: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 148

В таблице имеются формулы. В B6

=СУММПРОИЗВ(B2:B3, $F$2:$F$3)-B5. Она скопирована в C6:D6. Она

скопирована также в E6 и там скорректирована (убрано вычитаемое E5).

Выделим ячейку с целевой функцией и вызовем «Сервис/Поиск решения».

В диалоговом окне укажем: «Установить целевую ячейку:» $E$6,

«минимальное значение», «изменяя ячейки» $F$2:$F$3, «ограничения»

$B$6:$D$6>=0. В окне «Параметры» установим флажок «Линейная модель» и

«Неотрицательные значения». Запустим выполнение. Поиск решения вернет

результат: x=1.5, y=2.75. Целевая функция равна 15.5.

Но наборы удобрений нельзя покупать частями! Нужно наложить еще

одно ограничение: x, y – целые числа. Вновь вызовем Решатель, нажимаем

кнопку «Добавить» и в диалоговом окне «Добавление ограничения» указываем,

что $F$2:$F$3 – целые (в том же выпадающем списке, откуда ранее мы

выбирали символ для ограничения). Нажимаем «OK». Видим, что добавлено

новое ограничение: $F$2:$F$3=целое. Запустим выполнение. На этот раз

получим значение целевой функции 17 (естественно, оно ухудшилось), а

количество наборов стало таким: x=3, y=2. Обратите внимание, что эти

значения вовсе не являются результатом округления в большую сторону

значений x и y, полученных без ограничения целочисленности. (Проверьте, что

x=2, y=3 дают худший результат).

ПРИМЕР VIII.4. НЕЛИНЕЙНАЯ ОПТИМИЗАЦИЯ В отличие от задачи линейного программирования здесь нельзя

рассчитывать, что с помощью Решателя получено действительно оптимальное

решение.

Найти максимум функции f(x)=x2, [ ]2;1−∈x . Ответ очевиден: максимум

равен 4 и достигается при x=2. Попытайтесь найти ответ с помощью Решателя.

Задайте для x следующие начальные приближения: 0, -0.1 и 0.1. Вы

получите три разных ответа: 0, 1, 4. Причина этого следующая. В точке 0

Page 149: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 149

производная f´(x)=2x обращается в 0. Следовательно, мы находимся в точке

экстремума (делает вывод Решатель), и можно выдавать ответ 0. Если Вы

посмотрите отчет по пределам, то увидите вычисленные значения функции на

концах отрезка. Эти значения превышают 0, но Решателя это «не волнует».

Решатель продвигается в сторону увеличения значений функции и добирается

до точки x = -1. И только при начальном значении 0.1 Решатель находит

правильный ответ.

Этот пример весьма поучителен. Он показывает, что в нелинейных задачах

оптимизации на ответ, выдаваемый Решателем, нельзя полагаться. Ответ

зависит от выбора начального приближения. К сожалению, достаточно общих

методов отыскания глобального экстремума не разработано. Если функция

зависит от одной или двух переменных, старайтесь проверить ответ на

графиках. Дело еще осложняют нелинейные ограничения.

ПРИМЕР VIII.5. РЕШЕНИЕ СИСТЕМ УРАВНЕНИЙ. Уравнение с одним неизвестным мы успешно решали с помощью

«Сервис/Подбор параметра». Но если имеется система уравнений с

несколькими неизвестными, то «Подбор параметра» не поможет. Здесь можно

попытаться использовать Решатель.

Решим систему двух уравнений с двумя неизвестными:

⎩⎨⎧

=+=−

51

2

3

yyxyxy

Составим целевую функцию

F=(x y-y3-1)2+(x2 y+y-5)2.

Эта функция принимает минимальное значение, равное нулю, для x и y,

служащих решениями исходной системы уравнений. Серьезная проблема:

Page 150: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 150

какое выбрать начальное приближение. Для этого нужно рассчитать таблицу

значений функции F и выбрать значения x и y, при которых функция принимает

значения близкие к нулю. Полезно также построить график поверхности для

функции F, чтобы примерно определить зону, в которой надо выбирать

значения, близкие к нулю. Оставим это читателю в качестве полезного

упражнения. (Рассчитайте таблицу для x и y, изменяющихся от –5 до 5 с шагом

0.25. Постройте вспомогательный столбец из минимальных значений по

строкам, превратите формулы в этом столбце в значения и отсортируйте их.

Далее отыскивайте минимальные значения в таблице с помощью клавиш

Ctrl+F. Перед этим закрепите шапку и боковик таблицы, чтобы легче было

определить значения x и y.) На основе этого исследования выберем два

начальных значения: (1.75, 1.00) и (3.75, 0.25).

На примере этой системы ознакомимся с двумя возможными подходами.

Первый подход – минимизировать функцию F. Составим таблицу,

представленную на рис. VIII.9.

x 1.75 y 1

F 0.066406 =(x*y-y^3-1)^2+(x^2*y+y-4)^2

Рис. VIII.9

и вызовем Решатель. Минимизируем функцию F и сохраним результат как

сценарий. Введем новые начальные значения (3.75, 0.25), вызовем Решатель,

вновь решим задачу минимизации F и сохраним результат как сценарий. Далее

сделаем отчет по сценариям в виде структуры. После редактирования сценария,

получим следующую таблицу (рис. VIII.10).

Page 151: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 151

Структура сценария Изменяемые: x 1.904173106 3.638369656 y 0.864701369 0.280943574Результат: F 1.21996E-11 3.63619E-12

Рис. VIII.10

Второй подход – приравнять одно из уравнений к нулю, рассматривая

второе уравнение как ограничение. На другом рабочем листе сформируем

таблицу (рис. VIII.11).

A B C

1 p 1.75 2 q 1 3 4 -0.25 =p*q-q^3-1 5 0.0625 =p^2*q+q-4

Рис. VIII.11

В диалоговом окне Решателя укажем, что ячейку $B$5 нужно установить

равной нулю, и добавим ограничение $B$4=0. Сохраним результат как

сценарий, а затем повторим вычисления с другими начальными значениями.

Сформируем отчет по сценариям. После редактирования он примет вид,

показанный на рис. VIII.12.

Структура сценария Изменяемые: p 1.904179972 3.638378892 q 0.864698785 0.280942223Результат: $B$4 5.23944E-07 -1.04978E-07 $B$5 4.24988E-07 -5.53939E-07

Рис. VIII.12

Page 152: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 152

Итак, получено два решения системы уравнений, но, разумеется, нет

никакой гарантии, что не пропущено еще одно решение.

В этом иллюстративном примере следовало действовать по-другому. Из

второго уравнения легко выразить y через x и подставить в первое уравнение

системы. Получим уравнение, в левой части которого полином шестой степени

относительно x. (Полезно использовать для этих действий какую-либо систему

символьной математики, например, Derive.). Построив график этого полинома,

нетрудно убедиться, что действительных корней только два. Их можно

отыскать с помощью «Сервис/Подбор параметра». Попробуйте реализовать эту

программу.

Задания к разделу 8 «Решение задач оптимизации в электронных таблицах

Excel».

1. Каждому животному нужно ежедневно выдать не менее 6 единиц белков,

8 единиц жиров и 12 единиц углеводов. Есть два вида корма. Одна

единица первого корма содержит 21 единицу белка, 2 единицы жира, 4

единицы углеводов и стоит 3 рубля. Для второго корма соответствующие

цифры следующие: 3, 2, 2 и 2. Составить математическую модель и

найдите оптимальный рацион питания.

2. Завод производит электронные приборы трех видов (прибор А, прибор

В и прибор С), используя при сборке микросхемы трех видов (тип 1, тип

2 и тип 3). Расход микросхем задается следующей таблицей: Прибор А Прибор В Прибор СТип 1 2 5 1 Тип 2 2 0 4 Тип 3 2 1 1

Стоимость изготовленных приборов одинакова.

Ежедневно на склад завода поступает 500 микросхем типа 1 и 400

микросхем типов 2 и 3. Каково оптимальное соотношение дневного

Page 153: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 153

производства приборов различного типа, если производственные мощности

завода позволяют использовать запас поступивших микросхем полностью?

3. Фирма производит три вида продукции (A, B, C), для выпуска каждого из

них требуется определенное время обработки на всех четырех

устройствах I, II, III, IV. Время обработки, ч Вид продукции

I II III IV Прибыль, долл.

A 1 3 1 2 3 B 6 1 3 3 6 C 3 3 2 4 4

Пусть время работы на устройствах соответственно 84, 42, 21 и 42 часа.

Определить, какую продукцию и в каких количествах стоит производить для

максимизации прибыли. (Рынок сбыта для каждого продукта неограничен).

4. Фирме требуется уголь с содержанием фосфора не более 0.03 % и с

примесью пепла не более 3.25 %. Доступны три сорта угля A, B, C по

следующим ценам (за одну тонну): Сорт угля

Содержание примеси фосфора, %

Содержание примеси пепла, %

Цена, долл.

A 0.06 2.0 30 B 0.04 4.0 30 C 0.02 3.0 45

Как их следует смешать, чтобы удовлетворить ограничениям на

применение и минимизировать цену?

5. Фирма производит два продукта A и B, рынок сбыта которых

неограничен. Каждый продукт должен быть обработан каждой машиной

I, II, III. Время обработки в часах для каждого из изделий A и B

приведено ниже. I II III

A 0.5 0.4 0.2 B 0.25 0.3 0.4

Время работы машин I, II, III соответственно 40, 36 и 36 часов в неделю.

Прибыль от изделий A и B составляет соответственно 5 и 3 доллара. Фирме

Page 154: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 154

надо определить недельные нормы выпуска изделий A и B, максимизирующие

прибыль.

6. Фирма занимается составление диеты, содержащей по крайней мере 20

единиц белков, 30 единиц углеводов, 10 единиц жиров и 40 единиц

витаминов. Как дешевле всего достичь этого при указанных ценах (в

рублях) на 14 кг (или 1 л) пяти имеющихся продуктов? Хлеб Соя Сушеная

рыба Фрукты Молоко

Белки 2 12 10 1 2 Углеводы 12 0 0 4 3 Жиры 1 8 3 0 4

Витамины 2 2 4 6 2 Цена 12 36 32 18 10

7. «Ученики трех классов проводили КВН. Известно, что когда на сцену

вышли команды классов «А» и «Б», то доля мальчиков среди участников

оказалась равно 2/5. Когда же на сцене были команды классов «Б» и «В»,

то доля мальчиков оказалось равной 3/7. В каких пределах заключена

доля мальчиков в трех командах вместе?» Сделать дополнительное

разумное предположение, что в каждом классе обучается не более 99

человек, и представьте верхний и нижний пределы в форме правильных

дробей.

8. В контейнер упакованы комплектующие изделия трех типов. Стоимость и

вес одного изделия составляют 400 руб. и 12 кг для первого типа, 500 руб.

и 16 кг для второго типа, 600 руб. и 15 кг для третьего типа. Общий вес

комплектующих равен 326 кг. Определить максимальную и

минимальную возможную суммарную стоимость находящихся в

контейнере комплектующих изделий.

9. Найти минимум функции Розенброка 22 1100 )x()xy()y,x(fz −+−==

Page 155: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 155

с начальным условием x = -1.2, y = 1. Построить поверхность, отвечающую этой

функции, и график ее линий уровня. Эта функция относится к так называемым

«овражным» функциям и служит в качестве тестовой для пакетов оптимизации.

Page 156: Статистическое моделирование на ЭВМ: Лабораторный практикум

Мартьянова А.Е. Статистическое моделирование на ЭВМ 156

ЛИТЕРАТУРА

1. Информатика. Базовый курс. /Под ред. С.В.Симоновича. – СПб.: Питер,

1999

2. Гельман В.Я. Решение математических задач средствами Excel:

Практикум – СПб: Питер, 2003

3. Дорохова Е.Н., Прохорова Г.В. Задачи и вопросы по аналитической

химии. – М.: Мир, 2001

4. Кудряшов И.В., Каретников Г.С. Сборник примеров и задач по

физической химии. – М.: Высш. школа, 1991

5. Лавренов С.М. Excel: Сборник примеров и задач. – М.: Финансы и

статистика, 2002

6. Пискунов Н.С. Дифференциальное и интегральное исчисления для

втузов. В двух томах. Т 1 – 2, М.: Наука, 1985

7. Турчак Л. И. Основы численных методов: Учеб. пособие. – М.: Наука,

1987

8. Чарыков А.К. Математическая обработка результатов химического

анализа. Учебное пособие. Л.: Изд-во Ленингр. ун-та, 1977


Recommended