Что такое вариационный ряд и вариационная кривая
Построение вариационной кривой
Главная > Документ
Информация о документе | |
Дата добавления: | |
Размер: | |
Доступные форматы для скачивания: |
Построение вариационной кривой
Количественные признаки поддаются определенному описанию. Если измерить величину семян тыквы одного растения, то окажется, что они имеют разную длину. То же самое можно наблюдать, если измерить высоту стеблей различных особей одного сорта гороха. Следовательно, для того чтобы охарактеризовать количественные признаки организмов (величину семян или длину стебля), необходимо произвести множество измерений и определить среднее значение признака.
В качестве примера определим среднюю величину семян тыквы одного сорта. Измерим длину (в мм) 50 взятых произвольно семян.
Для определения предела изменчивости признака определим частоту встречаемости каждой варианты. Подсчитаем количество семян, имеющих одинаковую величину. Составим на основе данных первый ряд чисел, отображающий величину изменения признака, и второй ряд чисел, соответствующий частоте встречаемости этих изменений (количество семян каждой величины).
Из графика видно, что варианты со средним значением встречаются наиболее часто. Варианты с двумя крайними значениями встречаются наиболее редко.
Они являются отклонениями от средней величины нормы. Чем сильнее отклонение, тем меньше частота встречаемости варианты.
Эта закономерность касается не только рассмотренного примера, а распространяется и на другие количественные признаки. Впервые на это свойство обратил внимание датский ученый В.Иогансен, изучая варьирование массы семян в чистой линии фасоли. Так как в чистой линии фасоли все семена имели одинаковый генотип, то различия в их массе были связаны с влиянием каких-либо внешних факторов (глубины заделки семян, различий в количестве влаги, структуре почвы, распределении минеральных веществ почвы). Комбинация благоприятных и неблагоприятных факторов оказывает влияние на формирование семян, что приводит к различию в массе.
Для объективной характеристики изменчивости признака определяется среднее значение по формуле:
Определим среднее значение величины семян тыквы, исходя из данных, приведенных в таблице.
Распределение значений признака. вариационный ряд и вариационная кривая
РАСПРЕДЕЛЕНИЕ ЗНАЧЕНИЙ ПРИЗНАКА. ВАРИАЦИОННЫЙ РЯД И ВАРИАЦИОННАЯ КРИВАЯ
Множество отдельных сходных в основных чертах, но в то же время отличающихся один от другого объектов составляет так называемую совокупность. Совокупностями являются партия цыплят, выведенных в инкубатории в одно время, стадо коров одного хозяйства, поголовье овец одной отары. В совокупность входят отдельные составляющие ее члены или объекты. Число составляющих совокупность объектов называют объемом совокупности, обозначаемым латинской буквой «n». У различных членов совокупности каждый изучаемый признак принимает разные значения, то есть в пределах совокупности варьирует. У отдельных коров одного стада удой за лактацию неодинаков, живая масса поросят одного опороса колеблется и т. д. Значение (меру) признака того или иного члена совокупности называют датой, или вариантой, и обозначают буквой «xi» где буква «i» свидетельствует, что это может быть любая, взятая из совокупности варианта.
В совокупности различные значения признака встречаются неодинаковое число раз: одни чаще, другие реже. Расположение количества объектов соответственно значению признака по мере его порядкового изменения называется распределением признака. Распределение особей по величине признака чаще всего изображается вариационным рядом или вариационной кривой.
Пример. Группа в 100 кур-несушек при индивидуальном учете яйценоскости показала следующую продуктивность за месяц:
по 15 яиц снесли 4 курицы
Это двойной ряд чисел и есть вариационный ряд, состоящий из обозначений классов и соответствующих частот. Вариационный ряд обычно изображается следующим образом (табл.1):
В примере приведены целые прерывные вариации, выраженные целым числом, такой ряд называется дискретным. Ряд может быть непрерывным, когда вариации выражаются в зависимости от точности целым или дробным числом.
Изображение вариационного ряда графически в виде кривой, ординаты которой пропорциональны частотам, называется вариационной кривой (рис.1).
Рис. 1. Нормальная вариационная кривая, характеризующая
При большом числе определений вариационная кривая становится близкой к биноминальной кривой, хорошо соответствующей рядам разложения бинома (а + в),
(а + в)3 = а3+ За2в + Зав2+ в3
(а + в)4 = а4+ 4а3в + 6а2в2+ 4ав3+ в4
(а + в)5 = а5+ 5а4в + 10а3в2+ 10а2в3+ 5ав4+ в5 и так далее.
Коэффициенты этих разложений бинома дают так называемый арифметический треугольник Паскаля, который образует фигуру, соответствующую конфигурации вариационной кривой.
Вариацийнный ряд
— последовательность численных показателей проявлений определенного признака (вариант), расположенных в порядке их возрастания или убывания. Особенности вариационного ряда можно изобразить графически, в виде вариационной кривой.
Пример:
Число зерен в одном колосе Варианта- V |
Частота встречаемости- p Количество колосьев пшеницы |
При исследовании признаков чаще всего проявляется ряд статистических закономерностей.
—Большинство организмов имеют величину признака среднюю или близкую к средней. Это объясняется тем, что сочетание только благоприятных или только неблагоприятных условий случается редко. Организмов с большими отклонениями признаков от средних величин в природе очень мало.
— На размах модификационной изменчивости влияют внешние и внутренние условия. Чем однородные внешние условия развитияданных особей, тем меньше проявляется модификационная изменчивость. На фенотипические проявления гена значительное влияние оказывают другие гены (например, рост человека определяется несколькими парами полимерных генов). На развитие признака влияют и регуляторные системы организма (например, яркая окраска перьев у петухов обусловлено действием мужского полового гормона, а введение ему женских гормонов подавляет развитие этого признака).
Контроль знаний и умений:
Дать ответы на вопросы:
1. Что такое взаимодействие генов?
2.Какие цитологические механизмы положены в основу внеядерной наследственности?
3.Как значение взаимодействие генов имеет для практической деятельности человека?
4.Как значение внеядерная наследственность имеет для практической деятельности человека?
Домашнее задание:пересказ §7, §8, отвечать на вопросы, Лек.№ 18
ВАРИАЦИОННЫЙ РЯД И ЕГО ПОСТРОЕНИЕ
При анализе совокупности часто полученные данные нужно сгруппировать и представить их в виде таблицы или ряда. При характеристике количественных признаков и большом числе вариант производят группировку данных и их разноску по классам, т. е. строят вариационный ряд.
Вариационный ряд — это упорядоченное изображение реально существующего распределения особей в группе по величине признака. Вариационный ряд — это двойной ряд чисел, состоящий из обозначения классов и соответствующих частот. Он показывает, как изменяется признак от минимальной до максимальной величины, какая частота вариант в каждом классе. Класс, в котором встречается наибольшее число вариант, называется модальным.
Для построения вариационного ряда необходимо: 1) из всей выборки (в нашем задании п = 64) найти максимальную (в данном примере max = 11,4), минимальную (min = 3,2) варианты и разность между ними (max—min = 11,4—3,2 = 8,2); 2) определить число классов, которое зависит от объема выборки:
Число вариант Число классов
Найти классный промежуток (к) путем деления разности на предполагаемое число классов (к — 8,2: 8» 1,0); 3) установить начало классов, для чего к минимальному значению признака 3,2 (лучше округленному в меньшую сторону до 3,0, но не больше, чем на величину к) прибавляют классный промежуток (к = 1,0), пока не включится максимальное значение (11,4) признака (3,0; 4,0;. ;11,0); 4) установить верхние границы классов, которые должны быть меньше начала последующих классов на величину, равную точности измерения признака (3,0—3,9; 4,0—4,9;. ;11,0—11,9); 5) последовательно, начиная с первой, разнести варианты по классам (табл. 9).
9. Распределение сухостойных хорош черно-пестрой породы
Вершининского комплекса по количеству лейкоцитов н крови
(по данным П. Н. Ннконорова)
Показатель Шифр частот Число коров | Классы по количеству лейкоцитов в 1 мм 1 крови (тыс.) | Всего 64 | ||||||
3,0-3,9 | 4,0-4,9 | 5,0-5.9 | 6,0-6.9 | 7,0-7,9 | 8,0-8,9 | 9.0-9.9 | 10,0— 10,9 | 11,0-П.9 |
1 1 | 2 4 | Я П | 4 Я Я | П | Г. | 7 2 | 8 2 | 9 1 |
По вариационному ряду можно судить о распределении признака в данной группе. В крайних классах находится наименьшее число вариант, а в средних — большее. Причем видно смещение распределения вариант от середины вариационного ряда в сторону больших значений классов. Наибольшее число вариант (48) относится к 3—5-му классам.
— Модальным классом (обладающим наибольшей частотой — 24) является 4-й класс (границы 6—6,9).
При рассмотрении вариационного ряда можно приблизительно определить среднее значение признака, находящееся между 6 и 6,9, вероятно, недалеко от 6,5, а также лимиты — 3,5—11,5 = 8 (взяты средние значения крайних классов). Среднее квадратичес-кое отклонение, исходя из лимита, равно 8 :6 = 1,3, потому что весь размах изменчивости охватывается шестью сигмами. Фактически полученные величины были близки к предсказанным х = 6,65; а — 1,51.
Графическое изображение вариационного ряда дает наглядное представление о характере распределения признака в изучаемой совокупности. Вариационный ряд можно представить в виде ступенчатой кривой, называемой гистограммой. Для этого на горизонтальной линии (ось абсцисс) наносятся классы, а на вертикальной (ось ординат) — частоты. Основанием каждого столбика является соответствующее значение класса, а высотой — число
Рис. 31. Распределение коров по количеству лейкоцитов в 1 мм 3 крови:
1 — гистограмма; 2 — полигон
особей в нем. Если соединить прямыми линиями середины всех столбиков, получается вариационная кривая, или полигон распре-деления. Полигон распределения своими ветвями должен касаться на’ оси абсцисс середины соседних классов.
При анализе графика (рис. 31) можно видеть: 1) около середины вариационной кривой располагается наибольшее число вариант; 2) распределение вариант по обе стороны от вершины вариационной кривой примерно симметрично; 3) число вариант (коров) убывает к краям вариационного ряда. Вышеназванные закономерности характерны для большинства вариационных рядов. Для сравнения на одном графике нескольких распределений удобно пользоваться не гистограммой, а полигоном распределения.
Встречаются асимметричные вариационные кривые со смеще-|Нием влево или вправо, т. е: положительная или отри-|ц а т е л ь н а я асимметрия. Это объясняется неоднородностью условий развития животных данной совокупности, наличием в изучаемой группе большого количества особей с лучшими худшими наследственными задатками,, отбором. В нашем примере (см. рис. 31) наблюдается небольшая положительная асимметрия, т. е. вершина смещена влево. Если в средних классах вариационного ряда наблюдается преобладание вариант, то получается островершинная кривая, называемая эксцессом.
Содержание:
В результате статистической обработки материалов, полученных при измерении величины явления, можно подсчитать число единиц, обладающих конкретным значением того или иного признака.
Условились каждое отдельное значение признака обозначать
Если мы расположим отдельные значения признака (варианты) в возрастающем или убывающем порядке и укажем относительно каждого варианта, как часто он встречался в данной совокупности, то получим распределение признака, или вариационный ряд.
Вариационные ряды и их характеристики
Построим вариационный ряд для приведенного выше примера. Для этого находим наименьший вариант, равный 79 г, и, располагая варианты в возрастающем порядке, подсчитываем их частоту. Так, вариант 79 г встречается 4 раза, вариант 80 г — 5 раз и т. д. Расположим полученные варианты следующим образом (см. табл. 1).
Такой ряд называется вариационным рядом; он характеризует изменение (варьирование) какого-нибудь количественного признака (в нашем примере варьирование веса деталей). Следовательно, вариационный ряд представляет собой две строки (или колонки). В одной из них приводятся варианты, а в другой частоты.
Виды вариации
Вариация признака может быть дискретной и непрерывной. Дискретной вариацией признака называется такая, при которой отдельные значения признака (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число), т. е. даны в виде прерывных чисел. Непрерывной называется вариация, при которой значения признака могут отличаться одно от другого на сколь угодно малую величину. В качестве примера можно привести: для дискретной вариации признака — число станков, обслуживаемых одним рабочим, число семян в 1 кг и т. д.; для непрерывной вариации признака— процент выполнения рабочим нормы выработки, вес одного семени и т. д.
При непрерывной вариации распределение признака называется интервальным. Частоты относятся не к отдельному значению признака, как это бывает при дискретной вариации, а ко всему интервалу. Часто за значение интервала принимают его середину, т. е. центральное значение. В качестве примера можно привести интервальный вариационный ряд по проценту выполнения норм выработки.
Пример 1.
Распределение рабочих по проценту выполнения норм выработки.
Частость
Нередко вместо абсолютных значений. частот используют относительные величины. Для этой цели можно использовать долю частоты того или иного варианта (а также интервала) в сумме всех частот. Такая величина называется частостью и обозначается
Мы имеем частоты
Для получения суммы всех частот их нужно сложить
В математике используется знак (греческая буква сигма заглавная), означающий суммирование.
Следовательно, можно записать:
где значки 1=1 и i=n под и над показывают, что суммированию подлежат все
при условии, что i принимает все целые значения от 1 до n.
В дальнейшем в подобных случаях (т. е. при суммировании по подстрочному номеру i) мы не будем записывать значения, принимаемые i, но будем помнить смысл записи (уже без указания значений, принимаемых i).
Для получения частости каждого варианта или интервала-нужно его частоту разделить на
и т.д.,
где — частость первого варианта или интервала,
— второго и т. д.
Вычислим частости, используя данные табл. 1:
Сумма всех частостей равна 1:
В нашем примере
0,08+0,1+0,2+0,28+0,16+0,08+0,1 = 1,00.
Частости можно выражать и в процентах (тогда сумма всех частостей равна 100%).
Границы интервалов
В интервальном вариационном ряду в каждом интервале различают нижнюю и верхнюю границы интервала:
При построении интервальных вариационных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней грани це. Так, в табл.12 в интервал 95—100% попадают все рабочие, выполнившие нормы выработки от 95 до 100% включительно. Рабочие, выполнившие план на 100,01%, попадают в следующий интервал. Разумеется надо стремиться строить интервалы так, чтобы избегать попадания значительного числа случаев на границы интервалов.
Интервальные вариационные ряды бывают с одинаковыми и неодинаковыми интервалами. В последнем случае чаще всего встречаются интервалы последовательно увеличивающиеся.
Пример 2.
Вариационный ряд с равными интервалами:
Пример 2а.
Вариационный ряд с последовательно увеличивающимися интервалами:
Свойства сумм
Как видно (и из дальнейшего изучения материала), нам приходится иметь дело с суммами. Рассмотрим некоторые свойства сумм.
1) Сумма ограниченного числа слагаемых, имеющих одну и ту же величину (сумма постоянной), равна произведению величины слагаемых на их число:
2) Постоянный множитель может быть вынесен из-под знака суммы и введен под знак суммы:
3) Сумма алгебраической суммы нескольких переменных равна алгебраической сумме сумм каждой переменной:
(легко обобщается на большее число слагаемых).
Величина интервала
Для выбора оптимальной величины интервала, т. е. такой величины интервала, при которой вариационный ряд не будет очень громоздким и в нем не исчезнут особенности явления, можно рекомендовать формулу:
где n — число единиц в совокупности.
Так, если в совокупности 200 единиц наибольший вариант равен 49,961, а наименьший — 49,918, то
Следовательно, в данном случае оптимальной величиной интервала может служить величина 0,005.
Плотность распределения
В качестве характеристики ряда распределения применяют плотность распределения, которую вычисляют как отношение-частот или частостей к величине интервала.
Различают абсолютную плотность распределения:
и относительную плотность распределения:
где -— плотности распределения, абсолютная (со значком А) и относительная (со значком О).
Пример 3.
По данным примера 2 вычислим относительную плотность распределения. Для первого интервала
для второго интервала
Расщепление интервалов
Часто возникает необходимость в расщеплении интервалов. Для этой цели можно воспользоваться следующим методом для интервальных вариационных рядов с равными интервалами.
Расщепление производится при предположении, что плотность вариационного ряда изменяется по параболе второго порядка. Имеется в виду, что весь интервал разбивается на две части: первую, составляющую долю в величине интервала, и вторую 1—
. Соответственно частость расщепляемого интервала F распадается на
В этом случае:
где А — частость интервала, предшествующего расщепляемому;
В — частость расщепляемого интервала;
С — частость интервала, последующего за расщепляемым;
— приращение частости интервала, предшествующего расщепляемому (
);
— второе приращение частостей
— (В—А)=С—2В+А].
Пример 4.
По данным примера 2 произведем расщепление интервала 100—125% на две части, выделим часть интервала 100—120% и определим удельный вес рабочих, выполняющих норму выработки от 100 до 120%.
Имеем:
Получаем частость по соответствующей формуле:
В случае неравных интервалов вычисление усложняется.
Графические методы изображения вариационных рядов
Большое значение для наглядного представления вариационного ряда имеют графические методы его изображения. Вариационный ряд графически может быть изображен в виде полигона, гистограммы, кумуляты и огивы.
На оси абсцисс отмечаются точки, соответствующие, величине вариантов, и из них восстанавливаются ординаты (перпендикуляры), длина которых соответствует численности этих вариантов. Вершины ординат соединяются прямыми линиями. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но могут быть применены и для интервальных рядов. В этом случае ординаты, пропорциональные частоте или частости интервала, восстанавливаются перпендикулярно оси абсцисс в точке, соответствующей середине данного интервала. Для замыкания крайние ординаты соединяются с •серединой интервалов, в которых частоты или частости равны нулю.
Пример 5.
По данным примера 1 строим полигон.
Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс берутся не точки, а отрезки, изображающие интервал, а вместо ординат, соответствующих частотам или частостям отдельных вариантов, строят прямоугольники с высотой, пропорциональной частотам или частостям интервала.
В случае неравенства интервалов гистограмма распределения строится не по частотам или частостям, а по плотности интервалов (абсолютной или относительной). При этом общая площадь гистограммы равна численности совокупности, если построение производится по абсолютной плотности, или единице, если гистограмма построена по относительной плотности.
Если соединить прямыми линиями середины верхних сторон прямоугольников, то получим полигоны распределения.
Разбивая интервалы на несколько частей и исходя из того, что вся площадь гистограммы должна остаться при этом неизменной, можно получить мелкоступенчатую гистограмму, которая в пределе (за счет уменьшения величины интервала) перейдет в плавную кривую, называемую кривой распределения.
Пример 6.
Имеются данные о диаметре 200 валиков (см. табл. 4).
Чтобы по этим данным построить вариационный ряд с равными интервалами, изобразить его с помощью гистограммы, а затем превратить ее в мелкоступенчатую, производим следующие действия:
а) Выбираем наименьший вариант, а затем наибольший и находим между ними разность. Делим полученную разность на число проектируемых интервалов и получаем величину каждого интервала.
Так, наименьший интервал 49,918, наибольший — 49,961. Разность 49,961—49,918=0,043.
Допустим, мы хотим получить пять интервалов, тогда величина каждого интервала равна
Следовательно, будем иметь такие интервалы:
49,918—49,928; 49,928—49,938 и т. д.
На основании рабочей таблицы получаем следующий вариационный ряд (см. табл. 6).
б) По полученному вариационному ряду строим гистограмму распределения: на оси абсцисс откладываем диаметры валиков, начиная с 49,918 до 49,968, а на оси ординат проставляем масштаб; далее строим прямоугольники с высотой, пропорциональной количеству валиков в каждом интервале.
Соединяем прямыми линиями середины верхних сторон прямоугольников и получаем полигон (см. график 2).
Для получения мелкоступенчатой гистограммы разбиваем интервалы на две равные части и получаем:
Если построить гистограмму по новому вариационному ряду, с уменьшенными интервалами, то получим гистограмму с более мелкими ступенями. Учет требования о неизменности площади гистограммы приводит к необходимости увеличить масштаб оси ординат вдвое.
Можно продолжить процесс расчленения интервалов и дальше, получая все более и более мелкоступенчатую гистограмму.
Кумулятивная кривая (кривая сумм — кумулята) получается при изображении вариационного ряда с накопленными частотами или частостями в прямоугольной системе координат. При построении кумуляты дискретного признака на ось абсцисс наносятся значения признака (варианты). Ординатами служат вертикальные отрезки, длина которых пропорциональна накопленной частоте или частости того или иного варианта. Соединением вершин ординат прямыми линиями получаем ломаную (кривую) кумуляту.
Пример 7.
По данным табл. 4 построить кумуляту.
Составляем дискретный вариационный ряд с накопленными частотами (при наличии частостей можно для построения кумуляты пользоваться ими; см. табл. 8).
Накопленная частота определенного варианта получается суммированием всех частот вариантов, предшествующих данному, с частотой этого варианта.
Используя накопленные частоты, строим кумуляту.
При построении кумуляты- интервального вариационного ряда нижней границе первого интервала соответствует частота, равная нулю, а верхней границе — вся частота интервала. Верхней границе второго интервала соответствует накопленная частота первых двух интервалов (т. е. сумма частот этих интервалов) и т. д. Верхней границе последнего (максимального) интервала соответствует накопленная частота, равная сумме всех частот.
Пример 8.
По данным табл. 7 построить кумуляту.
Составляем интервальный вариационный ряд с накопленными частотами (см. табл. 9). По полученным накопленным частотам строим кумуляту (см. график 5).
Огива строится аналогично кумуляте с той лишь разницей, что на ось абсцисс наносят накопленные частоты, а на ось ординат — значения признака. Если лист бумаги, на котором изображена кумулята, повернуть на 90° и посмотреть на него с обратной стороны на свет, то можно увидеть огиву.
График 5. Кумулята интервального вариационного ряда
Пример 9. По данным табл. 9 построим огиву (см. график 6)-
Накопленные частоты можно получать не только в восходящем порядке, но и в нисходящем, тогда частоты вариантов суммируются снизу вверх.
Пример 10.
По данным табл. 7. вычислить накопленные частоты в нисходящем порядке.
Средние величины
В качестве одной из важнейших характеристик вариационного ряда применяют среднюю величину. Математическая статистика различает ряд типов средних величин: арифметическую, геометрическую, гармоническую, квадратическую, кубическую и др. Все перечисленные типы средних могут быть исчислены для случаев, когда каждый из вариантов вариационного ряда встречается только один раз, — тогда средняя называется простой или невзвешенной, — и для случаев, когда варианты или интервалы повторяются различное число раз. При этом число повторений вариантов или интервалов называют частотой или статистическим весом, а среднюю, вычисленную с учетом статистического веса, —взвешенной средней.
Выбор одного из перечисленных типов средних для характеристики вариационного ряда производится не произвольно, а в зависимости от особенностей изучаемого явления и цели, для которой средняя исчисляется.
Практически при выборе того или другого типа средней следует исходить из принципа осмысленности результата при суммировании или при взвешивании. Только тогда средняя применена правильно, когда в результате взвешивания или суммирования получаются величины, имеющие реальный смысл.
Обычно затруднения при выборе типа средней возникают лишь в использовании средней арифметической или гармонической. Что же касается геометрической и квадратической средних, то их применение ограничено особыми случаями (см. далее).
Степенная средняя
Все указанные типы средних величин могут быть получены из формул степенной средней. Если имеются варианты то средняя из вариант тов может быть исчислена по формуле простой невзвешенной степенной средней порядка z
При наличии соответствующих частот средняя исчисляется по формуле взвешенной степенной средней
где — степенная средняя;
z — показатель степени, определяющий тип средней;
m — частоты или статистические веса вариантов.
Средняя арифметическая получается из формулы степенной средней при подстановке z=1
средняя арифметическая невзвешенная и
средняя арифметическая взвешенная.
Пример 11.
Измерения 20 единиц продукции дали следующие результаты (колонки 1 и 2):
Вычислить средний размер единицы продукции.
Находим среднюю арифметическую. Для этого исчисляем в табл. 11 колонку 3
Здесь умножение значения признака на вес и суммирование этих произведений дает общий размер продукции, т. е. имеет реальный смысл.
Средняя гармоническая получается при подстановке в формулу степенной средней значения z =—1.
Средняя гармоническая простая
Средняя гармоническая взвешенная
Средняя гармоническая вычисляется в тех случаях, когда средняя предназначается для расчета сумм слагаемых, обратно пропорциональных величине данного признака, т. е. когда суммированию подлежат не сами варианты, а обратные им величины
Пример 12.
По следующим данным о работе 22 рабочих в течение 6 часов вычислить среднюю гармоническую взвешенную.
В данном случае взвешивание состоит в делении по каждой группе количества рабочих (m) на затраты времени по изготовлению одной детали (х). Для проверки правильности выбора типа средней осмыслим результат взвешивания. Исходя из того, что все рабочие работали по 6 часов, количество рабочих можно рассматривать как величину, определяющую общие затраты времени. Тогда результат деления представит вполне осмысленную величину:
Таким образом, средняя гармоническая в данном примере применена правильно. При использовании средней гармонической для упрощения расчетов целесообразно пользоваться таблицами обратных чисел (см. приложение VIII).
Средняя квадратическая получается из формулы степенной средней при подстановке z=2
средняя квадратическая невзвешенная и
средняя квадратическая взвешенная.
Средняя квадратическая используется только в тех случаях, когда варианты представляют собой отклонения фактических величин от их средней арифметической или от заданной нормы.
Пример 13.
Имеются результаты измерения отклонений фактической длины изделий от заданной нормы.
Вычислим среднюю величину отклонений.
Находим среднюю квадратическую взвешенную; для этого исчисляем в табл. 13 колонки 3 и 4:
Значит, средняя величина отклонений фактической длины изделий от заданной нормы составляет 1,08 мм. В данном случае средняя арифметическая была бы непригодна, так как в результате мы получили бы нуль
Средняя геометрическая получается из формулы степенной средней при подстановке z=0:
Для раскрытия неопределенности этого вида прологарифмируем обе части равенства:
Теперь при подстановке z в правую часть равенства получаем неопределенность вида Используя правило Лопиталя и дифференцируя отдельно числитель и знаменатель по переменной z, получаем:
Таким образом:
Потенцируя, находим среднюю:
Это и есть формула средней геометрической невзвешенной, которая записывается сокращенно так:
где П — знак произведения;
n — число вариантов.
Если использовать частоты (m), то средняя геометрическая взвешенная примет следующий вид:
Вычисления средней геометрической в значительной мере упрощаются применением логарифмирования. Для невзвешенной средней геометрической получаем:
Для взвешенной средней геометрической:
Таким образом, логарифм средней геометрической есть средняя арифметическая, из логарифмов вариантов (см. формулы средней арифметической).
Средняя геометрическая используется главным образом при изучении динамики (см. раздел II).
Расчет средних коэффициентов и темпов. роста производится по формулам средней геометрической.
Пример 14.
Выпуск промышленной продукции производился предприятием в следующих размерах:
Чтобы найти средний месячный коэффициент и темп роста промышленной продукции, определяем помесячные коэффициенты роста , которые в данном случае и являются вариантами:
Из найденных трех помесячных коэффициентов роста (вариантов) определяем средний месячный коэффициент роста по формуле средней геометрической. Для этого найденные коэффициенты роста перемножаются и из произведения извлекается корень третьей степени
Из разобранного примера можно сделать два вывода: во-первых, что произведение трех найденных коэффициентов роста можно получить без их предварительного исчисления путем деления апрельского объема продукции (12,0) на январский объем (10,2):
и, во-вторых, что показатель степени корня, равный трем (число коэффициентов роста), можно получить вычитанием единицы из числа приведенных в примере месяцев (четыре).
Таким образом, наиболее удобной для исчисления среднего коэффициента роста следует считать формулу:
где n — число приведенных дат или периодов;
— последний член ряда;
— первый член ряда.
Математические свойства средней арифметической
Из вышеуказанных средних наиболее часто применяется средняя арифметическая. Знание свойств средней арифметической позволяет упрощенно ее вычислять.
Математические свойства средней арифметической:
1) Средняя постоянной величины равна этой же постоянной
2) Сумма отклонений от средней, умноженных на веса (частоты), равна нулю:
(если все веса равны единице)
или
Докажем это свойство для средней взвешенной.
Имеем: варианты
частоты
откуда
и
Подводя под общий знак суммы, получаем:
Следовательно,
Пример 15.
Вычислить среднюю (по колонкам 1 и 2) и убедиться в правильности выведенной формулы.
3) Если у всех вариантов х частоты m равны друг другу, то средняя арифметическая взвешенная равна средней арифметической невзвешенной.
Имеем
4) Если из всех вариантов (х) вычесть постоянную величину и из результатов вычитания, т. е. из отклонений вариантов от этой постоянной величины
вычислить среднюю
то она окажется меньше искомой средней на эту постоянную величину
Поэтому, чтобы получить среднюю из вариантов
нужно к найденной средней
прибавить ту же постоянную величину:
если
Имеем отклонения от постоянной величины обозначенные
Находим среднюю из
Откуда
Пример 16.
Вычислить среднюю путем вычитания 1000 из всех вариантов по следующим данным (колонки 1 и 2). .
Пример 17.
Используя данные прёдыдущего примера, можно убедиться, что если за взять не 1000, а 1004, то величина средней не изменится.
5) Если все варианты (х) уменьшить в одно и то же число раз, т. е. разделить на постоянную величину (k), и из частных вычислить среднюю, то онa окажется уменьшенной в такое же число раз, а поэтому, чтобы получить среднюю из вариантов
нужно найденную среднюю
умножить на ту же постоянную величину (k):
Доказательство.
Имеем частные от деления вариантов х на постоянную величину k, обозначенные х’:
Находим среднюю из
откуда
Пример 18.
Вычислить среднюю путем деления всех вариантов на 100 по следующим данным (колонки 1 и 2):
6) При вычислении средней вместо абсолютных значений весов (m) можно использовать относительные величины структуры (частости), т. е. удельные веса отдельных частот в общей сумме всех частот (см. § 4), или относительные величины координации, которые получаются путем отношения частот всех вариантов к одной из частот, принятой за единицу
Если же удельные веса частот выражены в процентах, то
где — частость, т. е. доля частоты варианта в общей сумме частот.
Значит
Пример 19.
Вычислить средний размер детали по следующим данным (колонки 1 и 2):
Предварительно найдем относительные величины структуры (колонка 3), а затем вычислим средний размер детали, используя их в качестве весов:
Если теперь вычислить средний размер детали, используя в качестве весов частоты, то получим:
что согласуется с результатом, полученным ранее.
Для вычисления средней можно было использовать колонку 4 :
7) Если в частотах (m) имеется общий множитель (A), то его можно при вычислении средней не принимать во внимание т. е. взвешивание производить по сокращенным частотам
Численное значение средней от замены частот (m) на сокращенные частоты
не изменится
Доказательство.
Имеем:
Разделим частоты на общий множитель А, содержащийся в них:
Тогда
Пример 20.
Вычислить среднюю по данным табл. 20 (колонки 1 и 2), произведя взвешивание вариантов по сокращенным весам.
Вычисляем среднюю по указанной формуле, предварительно сократив веса и заполнив колонки 3 и 4.
8) Общая средняя равна-.-взвешенной средней из частных средних:
где — частные средние, т. е. средние для отдельных групп совокупности;
— средняя из вариантов первой группы;
— средняя из вариантов второй группы и т. д.;
— частоты отдельных групп;
— частота первой группы;
— частота второй группы и т. д.
Пусть имеются частные средние:
Найдем среднюю для всей совокупности:
Пример 21.
В трех, партиях продукции численностью 1000, 2000 и 500 единиц найден средний вес детали (в кг): 3,3; 3,1; 3,7. Вычислить средний вес детали во всех трех партиях
9) Сумма квадратов отклонений от средней меньше суммы квадратов отклонений от произвольной величины (В) на величину поправки С, равной произведению объема совокупности на квадрат разности между средней и данной произвольной величиной:
для случая невзвешенной средней или
для случая взвешенной средней.
Доказательство для случая невзвешенной средней.
Пользуясь свойствами сумм (см. стр. 11), производим преобразования:
На основании второго свойства средней арифметической а поэтому
Пример 22.
По данным табл. 21 (колонки 1 и 2) убедиться в правильности указанных соотношений.
Вычисляем колонки 3, 4, 5, 6, 7, 8, 9 и находим:
Подставляя полученные результаты в формулу
имеем:
Метод отсчета от условного нуля
Упрощенное вычисление средней, состоящее в использовании ряда ее свойств, называется методом отсчета от условного нуля и предполагает:
Кроме того, в качестве весов используют сокращенные частоты или относительные величины (структуры или координации).
Формула исчисления средней методом отсчета от условного нуля:
где , т. е. отклонение от начала отсчета делится на общий множитель, а исчисление средней из
в зависимости от того, какими весами мы располагаем, производится по одной из следующих формул:
где — относительные величины координации (см. табл. 19).
Пример 23.
Вычислить средний вес зерен (на ) по данным колонок 1 и 2 табл. 22 (см. стр. 38), используя метод отсчета от условного нуля.
Используем формулу предварительно заполнив колонки 3, 4, 5 и 6 табл. 22:
Метод стандартизации средних
Метод стандартизации средних наиболее разработан в статистике населения (демографической) и медицинской статистике, когда производится сравнение совокупностей с различными Структурами. Стандартизация достигается элиминированием (устранением) влияния различия в структурах совокупностей. Результат сравнения характеризует различие в средних при условии, что структура сравниваемых совокупностей одинакова.
Рассмотрим применение метода стандартизации на примере из медицинской статистики. Имеются данные о двух больницах А и Б по отделениям и в целом.
Получается парадоксальное положение, при котором по больнице Б итоговая (общая) летальность (8,4%) ниже, чем в больнице А (9,2%), хотя по всем отделениям летальность в больнице Б выше (см. последние две колонки).
Причиной этого парадокса является отличие удельных весов разных отделений в больницах. Доля терапевтического отделения (по числу больных) с самой высокой летальностью составляет в больнице А 60%„ а в больнице Б — 20%, а доля хирургического отделения, с самой низкой летальностью, в больнице А — 20%, а в больнице Б — 60%.
Устраним влияние различия в структурах и стандартизуем распределение больных по отделениям. В качестве стандарта можно взять распределение больных по отделениям в любой больнице или привлечь данные о распределении больных нескольких других больниц. Возьмем за стандарт распределение больных в больнице А. Тогда по больнице А общая летальность (9,2%) останется без изменения. По больнице Б произведем пересчет.
Находим среднюю стандартизованную летальность больных больницы Б:
Таким образом, после стандартизации летальность в больнице Б оказалась значительно выше,, чем в больнице А:
Следует иметь в виду, что полученное значение стандартизованной средней может служить только для сравнительных целей, абсолютное же ее значение принимать во внимание не следует.
Если за стандарт принять распределение больных в больнице Б, то получим следующую стандартизованную летальность для больницы А:
а отношение стандартизованных средних почти не изменится:
Мажорантность средних
Если вычислить различные типы средних для одного и того же вариационного ряда, то численные их значения будут отличаться друг от друга. При этом средние по своей величине расположатся в определенном порядке. Наименьшей из перечисленных средних окажется средняя гармоническая, затем геометрическая и т. д., наибольшей — средняя квадратическая. Порядок возрастания средних при этом определяется показателем степени z в формуле степенной средней и вытекает из «правила мажорантности».
Так,
при z= —1 получаем среднюю гармоническую,
при z= 0 »» геометрическую,
при z= 1 »» арифметическую,
при z= 2 »» квадратическую:
Подробное выяснение общего условия мажорантности впервые было произведено А. Я. Боярским, доказавшим, что если две средние должны удовлетворять соответственно уравнениям
то первая из них мажорантна в отношении
если при любом значении аргумента
Для степенной средней порядка z имеем:
Это отношение для положительных значений с показателем x растет вместе с показателем z.
Пример 24.
Вычислить различные типы средних,по следующим данным (колонки 1 и 2) и убедиться в правильности порядка возрастания средних:
Заполняем колонки с 3-й по 8-ю и по соответствующим формулам исчисляем средние взвешенные:
Порядок средних определился в соответствии с правилом мажорантности:
При копировании любых материалов с сайта evkova.org обязательна активная ссылка на сайт www.evkova.org
Сайт создан коллективом преподавателей на некоммерческой основе для дополнительного образования молодежи
Сайт пишется, поддерживается и управляется коллективом преподавателей
Whatsapp и логотип whatsapp являются товарными знаками корпорации WhatsApp LLC.
Cайт носит информационный характер и ни при каких условиях не является публичной офертой, которая определяется положениями статьи 437 Гражданского кодекса РФ. Анна Евкова не оказывает никаких услуг.