Найти среднее квадратичное отклонение пример. Оценка дисперсии, среднеквадратичное отклонение

Среднеквадрати́ческое отклоне́ние (синонимы: среднее квадрати́ческое отклоне́ние , среднеквадрати́чное отклоне́ние , квадрати́чное отклоне́ние ; близкие термины: станда́ртное отклоне́ние , станда́ртный разбро́с ) - в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания . При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическое совокупности выборок.

Энциклопедичный YouTube

  • 1 / 5

    Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического , при построении доверительных интервалов , при статистической проверке гипотез , при измерении линейной взаимосвязи между случайными величинами. Определяется как квадратный корень из дисперсии случайной величины .

    Среднеквадратическое отклонение:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; {\displaystyle s={\sqrt {{\frac {n}{n-1}}\sigma ^{2}}}={\sqrt {{\frac {1}{n-1}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}};}
    • Примечание: Очень часто встречаются разночтения в названиях СКО (Среднеквадратического отклонения) и СТО (Стандартного отклонения) с их формулами. Например, в модуле numPy языка программирования Python функция std() описывается как "standart deviation", в то время как формула отражает СКО (деление на корень из выборки). В Excel же функция СТАНДОТКЛОН() другая (деление на корень из n-1).

    Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии) s {\displaystyle s} :

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . {\displaystyle \sigma ={\sqrt {{\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}}.}

    где σ 2 {\displaystyle \sigma ^{2}} - дисперсия ; x i {\displaystyle x_{i}} - i -й элемент выборки; n {\displaystyle n} - объём выборки; - среднее арифметическое выборки:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\ldots +x_{n}).}

    Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной .

    В соответствии с ГОСТ Р 8.736-2011 среднеквадратическое отклонение считается по второй формуле данного раздела. Пожалуйста, сверьте результаты.

    Правило трёх сигм

    Правило трёх сигм ( 3 σ {\displaystyle 3\sigma } ) - практически все значения нормально распределённой случайной величины лежат в интервале (x ¯ − 3 σ ; x ¯ + 3 σ) {\displaystyle \left({\bar {x}}-3\sigma ;{\bar {x}}+3\sigma \right)} . Более строго - приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина x ¯ {\displaystyle {\bar {x}}} истинная, а не полученная в результате обработки выборки).

    Если же истинная величина x ¯ {\displaystyle {\bar {x}}} неизвестна, то следует пользоваться не σ {\displaystyle \sigma } , а s . Таким образом, правило трёх сигм преобразуется в правило трёх s .

    Интерпретация величины среднеквадратического отклонения

    Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

    Например, у нас есть три числовых множества: {0, 0, 14, 14}, {0, 6, 8, 14} и {6, 6, 8, 8}. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения - значения внутри множества сильно расходятся со средним значением.

    В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить. отождествляется с риском портфеля.

    Климат

    Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

    Спорт

    Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

    Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

    Дисперсия. Среднее квадратическое отклонение

    Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. В зависимости от исходных данных дисперсия может быть невзвешенной (простой) или взвешенной.

    Дисперсия рассчитывается по следующим формулам:

    · для несгруппированных данных

    · для сгруппированных данных

    Порядок расчета дисперсии взвешенную:

    1. определяют среднюю арифметическую взвешенную

    2. определяются отклонения вариант от средней

    3. возводят в квадрат отклонение каждой варианты от средней

    4. умножают квадраты отклонений на веса (частоты)

    5. суммируют полученные произведения

    6. полученную сумму делят на сумму весов

    Формула для определения дисперсии может быть преобразована в следующую формулу:

    - простая

    Порядок расчета дисперсии простой:

    1. определяют среднюю арифметическую

    2. возводят в квадрат среднюю арифметическую

    3. возводят в квадрат каждую варианту ряда

    4. находим сумму квадратов вариант

    5. делят сумму квадратов вариант на их число, т.е. определяют средний квадрат

    6. определяют разность между средним квадратом признака и квадратом средней

    Также формула для определения дисперсии взвешенной может быть преобразована в следующую формулу:

    т.е. дисперсия равна разности средней из квадратов значений признака и квадрата средней арифметической. При пользовании преобразованной формулой исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от х и исключается ошибка в расчете, связанная с округлением отклонений

    Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:

    1) дисперсия постоянной величины равна нулю;

    2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;

    3) если все варианты значений признака уменьшить в одно и то же число раз ( раз), то дисперсия уменьшится в раз

    Среднее квадратичное отклонение S - представляет собой корень квадратный из дисперсии:

    · для несгруппированных данных:

    ;

    · для вариационного ряда:

    Размах вариации, среднее линейное и среднее квадратичное отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

    Дисперсия и среднее квадратическое отклонение наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащей фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.

    Расчет показателей вариации для банков, сгруппированных по размеру прибыли, показан в таблице.

    Размер прибыли, млн. руб. Число банков расчетные показатели
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Итого: 121,70 17,640 23,126

    Среднее линейное и среднее квадратичное отклонение показывают на сколько в среднем колеблется величина признака у единиц и исследуемой совокупности. Так, в данном случае средняя величина колеблености размера прибыли составляет: по среднему линейному отклонению 0,882 млн. руб.; по среднему квадратическому отклонению - 1,075 млн. руб. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака, близко к нормальному, то между S и d существует взаимосвязь: S=1,25d, или d=0,8S. Среднее квадратическое отклонение показывает как расположена основная масса единиц совокупности относительно средней арифметической. Независимо от формы распределения 75 значений признака попадают в интервал х 2S, а по крайне мере 89 всех значений попадают интервал х 3S (теорема П.Л.Чебышева).

    • Ответы на экзаменационные вопросы по общественному здоровью и здравоохранению.
    • 1. Общественное здоровье и здравоохранение как наука и область практической деятельности. Основные задачи. Объект, предмет изучения. Методы.
    • 2. Здравоохранение. Определение. История развития здравоохранения. Современные системы здравоохранения, их характеристика.
    • 3. Государственная политика в области охраны здоровья населения (Закон Республики Беларусь "о здравоохранении"). Организационные принципы государственной системы здравоохранения.
    • 4. Страховая и частная формы здравоохранения.
    • 5. Профилактика, определение, принципы, современные проблемы. Виды, уровни, направления профилактики.
    • 6. Национальные программы профилактики. Роль их в укреплении здоровья населения.
    • 7. Врачебная этика и деонтология. Определение понятия. Современные проблемы врачебной этики и деонтологии, характеристика.
    • 8. Здоровый образ жизни, определение понятия. Социальные и медицинские аспекты здорового образа жизни (зож).
    • 9. Гигиеническое обучение и воспитание, определение, основные принципы. Методы и средства гигиенического обучения и воспитания. Требования к лекции, санитарному бюллетеню.
    • 10. Здоровье населения, факторы, влияющие на здоровье населения. Формула здоровья. Показатели, характеризующие общественное здоровье. Схема анализа.
    • 11. Демография как наука, определение, содержание. Значение демографических данных для здравоохранения.
    • 12. Статика населения, методика изучения. Переписи населения. Типы возрастных структур населения.
    • 13. Механическое движение населения. Характеристика миграционных процессов, влияние их на показатели здоровья населения.
    • 14. Рождаемость как медико-социальная проблема. Методика вычисления показателей. Уровни рождаемости по данным воз. Современные тенденции.
    • 15. Специальные показатели рождаемости (показатели фертильности). Воспроизводство населения, типы воспроизводства. Показатели, методика вычисления.
    • 16. Смертность населения как медико-социальная проблема. Методика изучения, показатели. Уровни общей смертности по данным воз. Современные тенденции.
    • 17. Младенческая смертность как медико-социальная проблема. Факторы, определяющие ее уровень.
    • 18. Материнская и перинатальная смертность, основные причины. Показатели, методика вычисления.
    • 19. Естественное движение населения, факторы на него влияющие. Показатели, методика вычисления. Основные закономерности естественного движения в Беларуси.
    • 20. Планирование семьи. Определение. Современные проблемы. Медицинские организации и службы планирования семьи в рб.
    • 21. Заболеваемость как медико-социальная проблема. Современные тенденции и особенности в Республике Беларусь.
    • 22. Медико-социальные аспекты нервно-психического здоровья населения. Организация психоневрологической помощи
    • 23. Алкоголизм и наркомания как медико-социальная проблема
    • 24. Болезни системы кровообращения как медико-социальная проблема. Факторы риска. Направления профилактики. Организация кардиологической помощи.
    • 25. Злокачественные новообразования как медико-социальная проблема. Основные направления профилактики. Организация онкологической помощи.
    • 26. Международная статистическая классификация болезней. Принципы построения, порядок пользования. Значение ее в изучении заболеваемости и смертности населения.
    • 27. Методы изучения заболеваемости населения, их сравнительная характеристика.
    • Методика изучения общей и первичной заболеваемости
    • Показатели общей и первичной заболеваемости.
    • Показатели инфекционной заболеваемости.
    • Основные показатели, характеризующие важнейшую неэпидемическую заболеваемость.
    • Основные показатели "госпитализированной" заболеваемости:
    • 4) Заболевания с временной утратой трудоспособности (вопрос 30)
    • Основные показатели для анализа заболеваемости с вут.
    • 31. Изучение заболеваемости по данным профилактических осмотров населения, виды профилактических осмотров, порядок проведения. Группы здоровья. Понятие «патологическая пораженность».
    • 32. Заболеваемость по данным о причинах смерти. Методика изучения, показатели. Врачебное свидетельство о смерти.
    • Основные показатели заболеваемости по данным о причинах смерти:
    • 33. Инвалидность как медико-социальная проблема Определение понятия, показатели. Тенденции инвалидности в Республике Беларусь.
    • Тенденции инвалидности в рб.
    • 34. Первичная медико-санитарная помощь (пмсп), определение, содержание, роль и место в системе медицинского обслуживания населения. Основные функции.
    • 35. Основные принципы первичной медико-санитарной помощи. Медицинские организации первичной медико-санитарной помощи.
    • 36. Организация медицинской помощи, предоставляемой населению амбулаторно. Основные принципы. Учреждения.
    • 37. Организация медицинской помощи в условиях стационара. Учреждения. Показатели обеспеченности стационарной помощью.
    • 38. Виды медицинской помощи. Организация специализированной медицинской помощи населению. Центры специализированной медицинской помощи, их задачи.
    • 39. Основные направления совершенствования стационарной и специализированной помощи в Республике Беларусь.
    • 40. Охрана здоровья женщин и детей в Республике Беларусь. Управление. Медицинские организации.
    • 41. Современные проблемы охраны здоровья женщин. Организация акушерско-гинекологической помощи в Республике Беларусь.
    • 42. Организация лечебно-профилактической помощи детскому населению. Ведущие проблемы охраны здоровья детей.
    • 43. Организация охраны здоровья сельского населения, основные принципы оказания медицинской помощи сельским жителям. Этапы. Организации.
    • II этап – территориальное медицинское объединение (тмо).
    • III этап – областная больница и медицинские учреждения области.
    • 45. Медико-социальная экспертиза (мсэ), определение, содержание, основные понятия.
    • 46. Реабилитация, определение, виды. Закон Республики Беларусь «о предупреждении инвалидности и реабилитации инвалидов».
    • 47. Медицинская реабилитация: определение понятия, этапы, принципы. Служба медицинской реабилитации в Республике Беларусь.
    • 48. Городская поликлиника, структура, задачи, управление. Основные показатели деятельности поликлиники.
    • Основные показатели деятельности поликлиники.
    • 49. Участковый принцип организации амбулаторной помощи населению. Виды участков. Территориальный терапевтический участок. Нормативы. Содержание работы участкового врача-терапевта.
    • Организация работы участкового терапевта.
    • 50. Кабинет инфекционных заболеваний поликлиники. Разделы и методы работы врача кабинета инфекционных заболеваний.
    • 52. Основные показатели, характеризующие качество и эффективность диспансерного наблюдения. Методика их вычисления.
    • 53. Отделение медицинской реабилитации (омр) поликлиники. Структура, задачи. Порядок направления больных в омр.
    • 54. Детская поликлиника, структура, задачи, разделы работы. Особенности оказания медицинской помощи детям в амбулаторных условиях.
    • 55. Основные разделы работы участкового педиатра. Содержание лечебно-профилактической работы. Связь в работе с другими лечебно-профилактическими учреждениями. Документация.
    • 56. Содержание профилактической работы участкового врача-педиатра. Организация патронажного наблюдения за новорожденными.
    • 57. Структура, организация, содержание работы женской консультации. Показатели работы по обслуживанию беременных женщин. Документация.
    • 58. Родильный дом, структура, организация работы, управление. Показатели деятельности родильного дома. Документация.
    • 59. Городская больница, ее задачи, структура, основные показатели деятельности. Документация.
    • 60. Организация работы приемного отделения больницы. Документация. Мероприятия по профилактике внутрибольничных инфекций. Лечебно-охранительный режим.
    • Раздел 1. Сведения о подразделениях, установках лечебно-профилактической организации.
    • Раздел 2. Штаты лечебно-профилактической организации на конец отчетного года.
    • Раздел 3. Работа врачей поликлиники (амбулаторий), диспансера, консультации.
    • Раздел 4. Профилактические медицинские осмотры и работа стоматологических (зубоврачебных) и хирургических кабинетов лечебно-профилактической организации.
    • Раздел 5. Работа лечебно-вспомогательных отделений (кабинетов).
    • Раздел 6. Работа диагностических отделений.
    • 62. Годовой отчет о деятельности стационара (ф. 14), порядок составления, структура. Основные показатели деятельности стационара.
    • Раздел 1. Состав больных в стационаре и исходы их лечения
    • Раздел 2. Состав больных новорожденных, переведенных в другие стационары в возрасте 0-6 суток и исходы их лечения
    • Раздел 3. Коечный фонд и его использование
    • Раздел 4. Хирургическая работа стационара
    • 63. Отчет о медицинской помощи беременным, роженицам и родильницам (ф. 32), структура. Основные показатели.
    • Раздел I. Деятельность женской консультации.
    • Раздел II. Родовспоможение в стационаре
    • Раздел III. Материнская смертность
    • Раздел IV. Сведения о родившихся
    • 64. Медико-генетическое консультирование, основные учреждения. Его роль в профилактике перинатальной и младенческой смертности.
    • 65. Медицинская статистика, ее разделы, задачи. Роль статистического метода в изучении здоровья населения и деятельности системы здравоохранения.
    • 66. Статистическая совокупность. Определение, виды, свойства. Особенности проведения статистического исследования на выборочной совокупности.
    • 67. Выборочная совокупность, требования, предъявляемые к ней. Принцип и способы формирования выборочной совокупности.
    • 68. Единица наблюдения. Определение, характеристика учетных признаков.
    • 69. Организация статистического исследования. Характеристика этапов.
    • 70. Содержание плана и программы статистического исследования. Виды планов статистического исследования. Программа наблюдения.
    • 71. Статистическое наблюдение. Сплошное и несплошное статистическое исследование. Виды несплошного статистического исследования.
    • 72. Статистическое наблюдение (сбор материалов). Ошибки статистического наблюдения.
    • 73. Статистическая группировка и сводка. Типологическая и вариационная группировка.
    • 74. Статистические таблицы, виды, требования к построению.

    81. Среднее квадратическое отклонение, методика расчета, применение.

    Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного приз­нака в пределах вариационного ряда является среднее квадратичес­кое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень ко­леблемости данного ряда выше.

    Методика расчета среднего квадратического отклонения включает следующие этапы:

    1. Находят среднюю арифметическую величину (Μ).

    2. Определяют отклонения отдельных вариант от средней арифмети­ческой (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех от­клонений равняется нулю.

    3. Возводят каждое отклонение в квадрат d 2 .

    4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.

    5. Находят сумму произведений (d 2 *p)

    6. Вычисляют среднее квадратическое отклонение по формуле:

    при n больше 30, или
    при n меньше либо равно 30, где n - число всех вариант.

    Значение среднего квадратичного отклонения:

    1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.

    2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.

    Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.

    Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.

    Установлено, что при нормальном распределении признака:

    68,3% значений вариант находится в пределах М1

    95,5% значений вариант находится в пределах М2

    99,7% значений вариант находится в пределах М3

    3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.

    4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды

    5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.

    Величина среднего квадра­тического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратичес­кое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv ) , представляющий собой относительную величину: процентное отноше­ние среднего квадратического отклонения к средней арифметической.

    Коэффициент вариации вычисляется по формуле:

    Чем выше коэффициент вариации, тем большая изменчивость данно­го ряда. Считают, что коэффициент вариации свыше 30 % свиде­тельствует о качественной неоднородности совокупности.

    В данной статье я расскажу о том, как найти среднеквадратическое отклонение . Этот материал крайне важен для полноценного понимания математики, поэтому репетитор по математике должен посвятить его изучению отдельный урок или даже несколько. В этой статье вы найдёте ссылку на подробный и понятный видеоурок, в котором рассказано о том, что такое среднеквадратическое отклонение и как его найти.

    Среднеквадратическое отклонение дает возможность оценить разброс значений, полученных в результате измерения какого-то параметра. Обозначается символом (греческая буква «сигма»).

    Формула для расчета довольно проста. Чтобы найти среднеквадратическое отклонение, нужно взять квадратный корень из дисперсии. Так что теперь вы должны спросить: “А что же такое дисперсия?”

    Что такое дисперсия

    Определение дисперсии звучит так. Дисперсия — это среднее арифметическое от квадратов отклонений значений от среднего.

    Чтобы найти дисперсию последовательно проведите следующие вычисления:

    • Определите среднее (простое среднее арифметическое ряда значений).
    • Затем от каждого из значений отнимите среднее и возведите полученную разность в квадрат (получили квадрат разности ).
    • Следующим шагом будет вычисление среднего арифметического полученных квадратов разностей (Почему именно квадратов вы сможете узнать ниже).

    Рассмотрим на примере. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.

    Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.

    Сперва найдём среднее значение . Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:

    Среднее мм.

    Итак, среднее (среднеарифметическое) составляет 394 мм.

    Теперь нужно определить отклонение роста каждой из собак от среднего :

    Наконец, чтобы вычислить дисперсию , каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:

    Дисперсия мм 2 .

    Таким образом, дисперсия составляет 21704 мм 2 .

    Как найти среднеквадратическое отклонение

    Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:

    Мм (округлено до ближайшего целого значения в мм).

    Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).

    Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.

    То есть с помощью среднеквадратического отклонения мы получаем “стандартный” метод, который позволяет узнать, какое из значений является нормальным (среднестатистическим), а какое экстраординарно большим или, наоборот, малым.

    Что такое стандартное отклонение

    Но… все будет немного иначе, если мы будем анализировать выборку данных. В нашем примере мы рассматривали генеральную совокупность. То есть наши 5 собак были единственными в мире собаками, которые нас интересовали.

    Но если данные являются выборкой (значениями, которые выбрали из большой генеральной совокупности), тогда вычисления нужно вести иначе.

    Если есть значений, то:

    Все остальные расчеты производятся аналогично, в том числе и определение среднего.

    Например, если наших пять собак – только выборка из генеральной совокупности собак (всех собак на планете), мы должны делить на 4, а не на 5, а именно:

    Дисперсия выборки = мм 2 .

    При этом стандартное отклонение по выборке равно мм (округлено до ближайшего целого значения).

    Можно сказать, что мы произвели некоторую “коррекцию” в случае, когда наши значения являются всего лишь небольшой выборкой.

    Примечание. Почему именно квадраты разностей?

    Но почему при вычислении дисперсии мы берём именно квадраты разностей? Допустим при измерении какого-то параметра, вы получили следующий набор значений: 4; 4; -4; -4. Если мы просто сложим абсолютные отклонения от среднего (разности) между собой … отрицательные значения взаимно уничтожатся с положительными:

    .

    Получается, этот вариант бесполезен. Тогда, может, стоит попробовать абсолютные значения отклонений (то есть модули этих значений)?

    На первый взгляд получается неплохо (полученная величина, кстати, называется средним абсолютным отклонением), но не во всех случаях. Попробуем другой пример. Пусть в результате измерения получился следующий набор значений: 7; 1; -6; -2. Тогда среднее абсолютное отклонение равно:

    Вот это да! Снова получили результат 4, хотя разности имеют гораздо больший разброс.

    А теперь посмотрим, что получится, если возвести разности в квадрат (и взять потом квадратный корень из их суммы).

    Для первого примера получится:

    .

    Для второго примера получится:

    Теперь – совсем другое дело! Среднеквадратическое отклонение получается тем большим, чем больший разброс имеют разности … к чему мы и стремились.

    Фактически в данном методе использована та же идея, что и при вычислении расстояния между точками, только примененная иным способом.

    И с математической точки зрения использование квадратов и квадратных корней дает больше пользы, чем мы могли бы получить на основании абсолютных значений отклонений, благодаря чему среднеквадратическое отклонение применимо и для других математических задач.

    О том, как найти среднеквадратическое отклонение, вам рассказал , Сергей Валерьевич

    Определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, т.е. корень из и может быть найдена так:

    1. Для первичного ряда:

    2. Для вариационного ряда:

    Преобразование формулы среднего квадратичного отклонени приводит ее к виду, более удобному для практических расчетов:

    Среднее квадратичное отклонение определяет на сколько в среднем отклоняются конкретные варианты от их среднего значения, и к тому же является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому хорошо интерпретируется.

    Примеры нахождения cреднего квадратического отклонения: ,

    Для альтернативных признаков формула среднего квадратичного отклонения выглядит так:

    где р - доля единиц в совокупности, обладающих определенным признаком;

    q - доля единиц, не обладающих этим признаком.

    Понятие среднего линейного отклонения

    Среднее линейное отклонение определяется как средняя арифметическая абсолютных значений отклонений отдельных вариантов от .

    1. Для первичного ряда:

    2. Для вариационного ряда:

    где сумма n - сумма частот вариационного ряда .

    Пример нахождения cреднего линейного отклонения:

    Преимущество среднего абсолютного отклонения как меры рассеивания перед размахом вариации, очевидно, так как эта мера основана на учете всех возможных отклонений. Но этот показатель имеет существенные недостатки. Произвольные отбрасывания алгебраических знаков отклонений могут привести к тому, что математические свойства этого показателя являются далеко не элементарными. Это сильно затрудняет использование среднего абсолютного отклонения при решении задач, связанных с вероятностными расчетами.

    Поэтому среднее линейное отклонение как мера вариации признака применяется в статистической практике редко, а именно тогда, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется оборот внешней торговли, состав работающих, ритмичность производства и т. д.

    Среднее квадратическое

    Среднее квадратическое применяется , например, для вычисления средней величины сторон n квадратных участков, средних диаметров стволов, труб и т. д. Она подразделяется на два вида.

    Средняя квадратичная простая. Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратичной средней величиной.

    Она является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:

    Средняя квадратичная взвешенная вычисляется по формуле:

    где f - признак веса.

    Средняя кубическая

    Средняя кубическая применяется , например, при определении средней длины стороны и кубов. Она подразделяется на два вида.
    Средняя кубическая простая:

    При расчете средних величин и дисперсии в интервальных рядах распределения истинные значения признака заменяются центральными значениями интервалов, которые отличны от средней арифметической значений, включенных в интервал. Это приводит к возникновению систематической погрешности при расчете дисперсии. В.Ф. Шеппард определил, что погрешность в расчете дисперсии , вызванная применением сгруппированных данных, составляет 1/12 квадрата величины интервала как в сторону повышения, так и в сторону понижения величины дисперсии.

    Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по значительному количеству исходных данных (n > 500). Однако исходя из того, что в ряде случаев обе погрешности, действуя в разных направлениях компенсируют друг друга, можно иногда отказаться от введения поправок.

    Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичной будет средняя величина.
    В практике статистики часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для таких сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

    Для осуществления таких сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с разными средним арифметическим используется относительный показатель вариации - коэффициент вариации.

    Структурные средние

    Для характеристики центральной тенденции в статистических распределениях не редко рационально вместе со средней арифметической использовать некоторое значение признака X, которое в силу определенных особенностей расположения в ряду распределения может характеризовать его уровень.

    Это особенно важно тогда, когда в ряду распределения крайние значения признака имеют нечеткие границы. В связи с этим точное определение средней арифметической, как правило, невозможно, либо очень сложно. В таких случаях средний уровень можно определить, взяв, например, значение признака, которое расположено в середине ряда частот или которое чаще всего встречается в текущем ряду.

    Такие значения зависят только от характера частот т. е. от структуры распределения. Они типичны по месту расположения в ряду частот, поэтому такие значения рассматриваются в качестве характеристик центра распределения и поэтому получили определение структурных средних. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся .