Вариация

Применение XYZ анализа при подготовке данных к прогнозу

Работая с большим массивом данных при подготовке данных к прогнозу, необходим индикатор, который будет подсказывать, на какие временные ряды в первую очередь стоит обратить внимание. В качестве индикатора вы можете использовать «коэффициент вариации» или XYZ анализ

Если коэффициент вариации больше 10 — 25% или для Y и Z рядов, то изучаем данные (например, продажи товара по месяцам в разрезе направлений продаж) и определяем факторы, повлиявшие на отклонение.

Добавляем фильтр на столбец XYZ анализ и анализируем ряды.

Сначала отфильтруем ряды с коэффициентом вариации больше 25% или Z

 

Изучаем ряды с большими отклонениями фактических данных за последние 4-5 месяцев. Определяем причины провалов или резких подъёмов продаж. Готовим данные для прогноза.  Очищаем данные от влияния случайных факторов или корректируем дефицит. 

Также, если в ряду большая неоднородность, то имеет смысл группировать временной ряд. Например,

  • Неоднородные продажи по месяцам свернуть до продаж по кварталам,
  • Продажи по неделям свернуть до продаж по месяцам,
  • Продажи по товарам свернуть до товарных групп…

Сделать прогноз по однородной группе более высокого уровня, а затем распределить пропорционально логики внутри группы. 

О том, как сгруппировать временной ряд, читайте статью «Как сделать сводную и сгруппировать временные ряды?»

Затем выделяем ряды с коэффициентом вариации Y

Аналогично просматриваем каждый ряд, и в случае, если замечаете нестандартное поведение ряда, выявляете причины и в случае необходимости очищаете данные.

Рекомендуем создать список факторов (например, акции по стимулированию сбыта, отсутствие товара на складе, спец клиенты…), и для каждого из факторов определить показатель, который вычитаем или прибавляем к данным для прогноза.

После того, как данные очищены от факторов, которые в будущем не повторятся и  подготовлены для прогноза, мы рассчитываем прогноз продаж.

Теперь при расчете прогноза на большом количестве временных рядов, вы можете придерживаться следующей схемы:

  1. Рассчитываем коэффициент вариации;
  2. Делаем XYZ анализ;
  3. Готовим данные для прогноза (очищаем от случайных факторов или группируем временные ряды);
  4. Строим прогноз;
  5. Учитываем дополнительные факторы в прогнозе;

  • Novo Forecast Lite — автоматический расчет прогноза в Excel.
  • 4analytics — ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition — BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

Novo Forecast PRO — прогнозирование в Excel для больших массивов данных.

Получите 10 рекомендаций по повышению точности прогнозов до 90% и выше.

Интерпретация результатов

Прежде чем включить в инвестиционный портфель дополнительный актив, финансовый аналитик должен обосновать свое решение. Один из способов – расчет коэффициента вариации.

Ожидаемая доходность ценных бумаг составит:

Среднеквадратическое отклонение доходности для активов компании А и В составляет:

Ценные бумаги компании В имеют более высокую ожидаемую доходность. Они превышают ожидаемую доходность компании А в 1,14 раза. Но и инвестировать в активы предприятия В рискованнее. Риск выше в 1,7 раза. Как сопоставить акции с разной ожидаемой доходностью и различным уровнем риска?

Для сопоставления активов двух компаний рассчитан коэффициент вариации доходности. Показатель для предприятия В – 50%, для предприятия А – 33%. Риск инвестирования в ценные бумаги фирмы В выше в 1,54 раза (50% / 33%). Это означает, что акции компании А имеют лучшее соотношение риск / доходность. Следовательно, предпочтительнее вложить средства именно в них.

Таким образом, коэффициент вариации показывает уровень риска, что может оказаться полезным при включении нового актива в портфель. Показатель позволяет сопоставить ожидаемую доходность и риск. То есть величины с разными единицами измерения.

Инструкция к калькулятору, если неизвестен объем закупки

С 01.07.2019 заказчики вправе проводить закупки, даже если объем ТРУ неизвестен (71-ФЗ от 01.05.2019). А с 01.10.2019 это правило действует и в закупках лекарств. В такой ситуации НМЦК обосновывают по средней стоимость для каждого товара, работы или услуги. Для расчета калькулятором НМЦК по 44 ФЗ online не заполняйте поле «Количество», оставьте в нем значение по умолчанию — 1.

Шаг 1. Введите расценки за первый товар! Поле «Количество» не заполняйте!

Шаг 2. Если требуется, нажмите на «Добавить позицию» и введите цифры по следующему товару.

Шаг 3. Когда все заполнено, нажмите на кнопку «Рассчитать». Для обоснования используйте значение НМЦК, если объем закупки неизвестен. Процедуру проводите по средней стоимости единицы ТРУ.

Коэффициент вариации

Все показатели, рассмотренные выше, имеют привязку к масштабу исходных данных и не позволяют получить образное представление о вариации анализируемой совокупности. Для получения относительной меры разброса данных используют коэффициент вариации, который рассчитывается путем деления среднего квадартического отклонения на среднее арифметическое значение. Математическая формула такова:

В Экселе нет готовой функции для расчета коэффициента вариации, что не есть большая проблема. Расчет можно произвести простым делением стандартного отклонения на среднее значение. Для этого в строке формул пишем:

=СТАНДОТКЛОН.Г(диапазон)/СРЗНАЧ(диапазон)

В скобках должен быть указан диапазон данных. При необходимости используется среднее квадратическое отклонение по выборке (СТАНДОТКЛОН.В).

Коэффициент вариации обычно выражается в процентах, поэтому ячейку с формулой можно обрамить процентным форматом. Нужная кнопка находится на ленте на закладке «Главная»:

Изменить формат также можно, выбрав «Формат ячеек» из выпадающего списка после выделения нужной ячейки правой кнопкой мышки.

Коэффициент вариации, в отличие от других показателей разброса значений, используется как самостоятельный и весьма информативный индикатор вариации данных. В статистике принято считать, что если коэффициент вариации менее 33%, то совокупность данных является однородной, если более 33%, то – неоднородной. Эта информация может быть полезна для предварительного описания данных и определения возможностей проведения дальнейшего анализа. Кроме того, коэффициент вариации, измеряемый в процентах, позволяет сравнивать степень разброса различных данных независимо от их масштаба и единиц измерений. Полезное свойство.

В целом, с помощью Excel все, или почти все, статистические показатели рассчитываются очень просто. Если что-то непонятно, всегда можно воспользоваться окошком для поиска в Мастере функций. Ну, и Гугл в помощь.

Легкой работы в Excel и до встречи на блоге statanaliz.info.

Оригинал и другие статьи http://statanaliz.info/index.php/excel/formuly/37-raschet-pokazatelej-variatsii-v-excel

Показатели вариации в статистике

Статистика широко применяется в самых различных областях. Она доказала свою пользу не только в естественных науках, но и в изучении различных социологических явлений, изменений цен, а также в других ситуациях.

Эта наука имеет дело со случайными величинами, изменение которых требует для своего описания использования специальных характеристик. Наиболее известной из них является средняя. Однако, хотя она и включает в себя некоторый объём информации, тем не менее не даёт возможности найти информацию о разбросе случайных данных, а также дать понятие о динамике изменения и наиболее вероятных тенденциях в дальнейшем.

Математический аппарат для изучения вариационных процессов использует характеристики, способы расчёта которых можно разделить на три группы.

В их число входят:

  1. Показатели размаха.
  2. Цифры, дающие понятие о величине отклонения.
  3. Относительные показатели, которые относятся к вариации.

Показатели размаха изменений говорят о том, какова разница между максимальными отклонениями исследуемых чисел:

  • вариационный размах,
  • децильный размах,
  • квартильный размах.

Данные, относящиеся ко второй категории, можно считать так:

  • среднее линейное отклонение,
  • среднее квадратическое,
  • дисперсия.

Для расчёта относительных показателей применяется:

  • относительный квартильный размах,
  • линейный коэффициент,
  • коэффициент вариации.

Далее будет рассказано о наиболее часто применяемых математических характеристиках рассматриваемого понятия.

При проведении статистических вычислениях удобно пользоваться электронными таблицами Excel.

Отклонение вариации

Здесь рассматривается отклонение изучаемой случайной величины. Для того, чтобы его вычислить, необходимо сначала определить её среднее значение.

Чтобы посчитать, необходимо просуммировать все значения случайных данных и затем разделить на их количество. Получившаяся величина представляет собой нужный результат.

В некоторых формулах используются значения весов, придаваемых каждому значению. Кратко говоря, они назначаются в соответствии с целями проведения статистического исследования. Веса обычно подбираются таким образом, чтобы их сумма была равна единице.

Среднее линейное простое

Оценка величины отклонения рассчитывается так:

  1. Сначала нужно определить для каждого случайного значения разницу со средним и взять от неё абсолютную величину.
  2. Затем все эти цифры суммируют и делят полученный результат на количество значений величины, которая изменяется.

Формула выглядит таким образом:

СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|) / n,

где:

  • СЛП — искомая величина;
  • x(i) – i-е значение случайной величины;
  • x0 – среднее значение;
  • n – количество имеющихся цифр.

Вертикальные чёрточки используются для того, чтобы показать, что здесь вычисляется абсолютная разность.

Среднее линейное взвешенное

Для этого потребуется формула:

СЛВ = (|x(1) – x0|*f(1) + |x(2) – x0|*f(2) + … + |x(n) – x(0)|*f(n)) / n,

где:

  • СЛВ — искомая величина;
  • f(i) — вес, который придаётся каждому из значений случайной величины.

Остальные обозначения рассмотрены ранее.

Среднее квадратическое отклонение

В этом случае результат определяется по другому правилу, чем в прежних случаях:

СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2) / n),

где:

  • СКО представляет собой квадратическое отклонение;
  • x**2 представляет собой возведение в квадрат;
  • SQRT() — это операция взятия квадратного корня.

Дисперсия (простая, взвешенная)

Простая дисперсия равна СКО, возведённому в квадрат.

Взвешенная называется так потому, что каждое слагаемое умножается на свой вес.

Здесь применяется формула:

ДВ = (f(1)*(x(1) – x0)**2 + f(2)*(x(2) – x0)**2 + … + f(n)*(x(n) – x(0))**2) / n*(f(1) + f(2) + … + f(n)),

где: ДВ представляет собой дисперсию взвешенную.

Вариация альтернативного признака

Это понятие характеризует те ситуации, когда часть предметов выборки обладает определённым свойством, а другая — нет:

СРЕД = ((1-p) + (0-p)) / (p+q) = p;

ВАР = (q*(1-p)**2+ q*(0-p)**2) / (p+q) = pq.

Здесь СРЕД обозначает среднее, а p и q представляют собой положительные числа, в сумме дающие единицу.

ВАР обозначает искомую величину.

Задача №6. Расчёт показателей вариации

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

До 400 400 – 600 600 – 800 800 – 1000 Свыше 1000
32 56 120 104 88

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

200 – 400 400 – 600 600 – 800 800 – 1000 1000 – 1200
32 56 120 104 88

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго – 500 и т. д.

Занесём результаты вычислений в таблицу:

200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 23040000

5) Среднее квадратическое отклонение размера вклада определяется как корень квадратный из дисперсии:

6) Коэффициент вариации – это отношение среднего квадратического отклонения к средней арифметической:

По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений признаков вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.

Расчёт действующего значения

В качестве примера рассчитаем среднеквадратичное значение синусоидального напряжения.

Запишем выражение U rms с применением интеграла функции U = U ampsin(t) для одного периода 2π :

Вынесем U amp из под знака радикала. Воспользуемся табличным интегралом , перепишем и решим последнее выражение с применением формулы Ньютона-Лейбница:

Так как sin(2π), sin(4π) и sin(0) равны нулю, вычисляем RMS синусоиды следующим образом:

В результате решения в итоге получим:

Расчёт RMS для напряжения или тока треугольной и пилообразной формы можно рассмотреть на примере одного периода T для функции , представленной на рисунке:

Выразим U rms искомой функции с помощью определённого интеграла:

Используя табличный интеграл и формулу Ньютона-Лейбница, получаем:

В итоге преобразований получим:

Ток или напряжение любой сложной формы можно рассмотреть, как набор функций в пределах периода. Тогда значением RMS будет квадратный корень из среднеарифметического значения интегралов для квадрата каждой функции, ограниченной её интервалом времени в периоде. Например, для множества функций F1(t) , F2(t) , . , F n(t) в соответствующих им интервалах времени (0 – T1), (T1T2), . (T nT), составляющих период T, действующее напряжение (RMS) определится выражением:

Для вариантов однополярного или двуполярного напряжения пилообразной и треугольной формы в периоде 2T или 4T, представленных на рисунке ниже, T и U amp имеют те же расчётные величины, что и в рассмотренном случае c функцией , а интегралы, определённые в интервалах, равных T, для квадратов используемых функций , будут иметь одно и то же значение

Следовательно, вышеуказанные варианты однополярного или двуполярного напряжения пилообразной и треугольной формы будут иметь среднеквадратичное значение .

В заключении рассмотрим пример вычисления действующего значения положительных прямоугольных импульсов длительностью T i .

Выразим U rms одного периода T, как квадратный корень из среднеарифметического значения интегралов, определённых в интервалах 0 – T i и T iT для квадратов всех значений периода.

В результате получаем значение RMS, равное произведению амплитуды импульсов U amp на квадратный корень из коэффициента заполнения (T i / T).

В качестве дополнительного материала предлагаем рассмотреть расчёт средеквадратичного значения напряжения накала кинескопа цветного телевизора, исходя из амплитуды и формы напряжения.

Замечания и предложения принимаются и приветствуются!

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение ( ) равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение:

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Способы уменьшения RWD

В первую очередь необходимо лечить основное заболевание – причину повышенных значений RDW. Ниже перечислены дополнительные возможности, которые могут помочь вам повысить свой уровень здоровья и снизить показатели RDW.

Сбалансированная диета

Соблюдение здоровой и сбалансированной диеты помогает предотвратить недостаток питательных веществ

Особенно важно, чтобы рацион содержал рекомендованное количество железа, фолиевой кислоты и витамина В12. Исправление дефицита в питании может улучшить производство клеток крови и снизить значения RDW

Снизить потребление алкоголя

Уменьшение потребления алкоголя может помочь снизить повреждение эритроцитов.   Кроме того, алкоголь также снижает поглощение питательных веществ, таких как витамин В12 и фолиевая кислота, которые необходимы для производства красных кровяных клеток.

Больше физической нагрузки

Люди, которые немного или практически не занимаются физической активностью, показывают более высокие уровни RDW.

Физические упражнения, включая упражнения легкой интенсивности, как было показано в исследованиях, улучшают показатели RDW.

В исследовании с участием более чем 8.000 человек, при увеличении количества времени физических тренировок в неделю, риск показать повышенный уровень RDW уменьшался на 11%. 

Бросить курить

Курение увеличивает окислительный стресс. У курильщиков определяется более высокие RDW и они связаны с количеством выкуриваемых сигарет в день, а также с продолжительностью курения. 

Достаточный сон

В исследовании с  участием 17.500 взрослых людей, те, кто спал 7-8 часов, показывали самые низкие значения RDW. Люди, которые спали менее 6 часов, около 10 часов и более 10 часов демонстрировали увеличение RDW на 23%, 29% и 67% соответственно. 

Оцените эту статью

Среднее 4.8 Всего голосов (5)

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1. При изучении влияния рекламы на размер среднемесячного вклада в банках района
обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой. Для определения среднего размера
вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно
приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

= 29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

= 23 400/50 = 468

Аналогичные действия произведем для банка без рекламы:

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ2=pq (формула
дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5,
тогда σ2=0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов
кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= / 100= 34 596/ 100=345,96

σ2 = σ2факт + σ2ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η2 = σ2факт / σ2 =
345,96/898,04 = 0,39 = 39% — размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2. Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент
вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину
интервала (х’). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с
верхней границей — как разность между этой верхней границей и половиной размера следующего за ним интервала
(200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала
(800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х’-a):k)×f):Σf)+a. Здесь а=500 — размер варианта при наибольшей частоте, k=600-400=200 — размер
интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Показатели вариации

Вариация — это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации: , , , , , .

Размах вариации

Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.

Cреднее линейное отклонение

Cреднее линейное отклонение — это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой — получим среднее линейное отклонение простое:

Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной — получим среднее линейное отклонение взвешенное:

Линейный коэффициент вариации

Линейный коэффициент вариации — это отношение среднего линейного отклонение к средней арифметической:

С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.

Дисперсия

Дисперсия — это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой — получим дисперсию простую:

Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной — получим дисперсию взвешенную:

Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:

Если значения X — это , то для расчета дисперсии используют частную формулу дисперсии доли:

.

Cреднее квадратическое отклонение

Выше уже было рассказано о , которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:

Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:

Квадратический коэффициент вариации

Квадратический коэффициент вариации — это самый популярный относительный показатель вариации:

Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 — вариация считает слабой, а если больше 0,333 — сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина — нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.

Предыдущая лекция…Следующая лекция…

Задача

Рассчитать показатели вариации выручки (в интервальном ряду распределения):

  1. Размах вариации.
  2. Среднее линейное отклонение.
  3. Дисперсию.
  4. Среднее квадратическое отклонение.
  5. Коэффициенты осцилляции и вариации.

  Таблица 1

Интервальный ряд распределения хозяйств по выручке на 100 га

Выручка на 100 га угодий, тыс. руб. Число хозяйств
0-50
51-100 5
101-150 16
151-200 5
201-250 4
Всего: 30

Решение

К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Размах вариации – показатель, определяющий насколько велико различие между единицами совокупности, имеющими наибольшее и наименьшее значение признака. Зависимость для его расчета имеет вид:

Размах вариации определяется для несгруппированных данных (табл. 1.1). Максимальное значение выручки на 100 га угодий равно 244,6 тыс. руб., а минимальное – 77,0 тыс. руб. Тогда размах вариации составит:

R = 244.6 – 77.0 = 167.6

Среднее линейное отклонение – показатель, отражающий типичный размер признака. Расчетная зависимость для его определения имеет вид:

где:   xi – варианты признака (выручки на 100 га угодий). В интервальном ряду за значения признака принимается середина интервала;fi – частота интервала.

Расчет среднего линейного отклонения приведен в табл. 2

Таблица 2

Расчет среднего линейного отклонения интервального вариационного ряда

Выручка на 100 га Число хозяйств Середина интервалов, xi
0-50 25 113,3
51-100 5 75 63,3 316,7
101-150 16 125 13,3 213,3
151-200 5 175 36,7 183,3
201-250 4 225 86,7 346,7
Всего: 30 313,3 1060,0

Среднее линейное отклонение интервального ряда равно:

Дисперсия – средняя величина квадратов отклонений индивидуальных значений признака от их средней величины. Формула для расчета дисперсии для интервального вариационного ряда имеет вид:

Расчет дисперсии интервального ряда приведен в табл. 3.

Таблица 3

Расчет дисперсии интервального вариационного ряда

Выручка на 100 га Число хозяйств Середина интервалов, xi
0-50 25 12844,4 0,0
51-100 5 75 4011,1 20055,6
101-150 16 125 177,8 2844,4
151-200 5 175 1344,4 6722,2
201-250 4 225 7511,1 30044,4
Всего: 30 25888,9 59666,7

Дисперсия равна:

Среднеквадратическое отклонение рассчитывается как корень из дисперсии:

К относительным показателям вариации относятся:

  1. Линейный коэффициент вариации:

Анализ дискретного ряда распределения показывает, что наиболее распространенным значением (5 торговых точек) является медианное значение.

Средняя выручка на 100 га угодий составила 138,3 тыс. руб. на 100 га. Наиболее распространенное значение (мода) — 125,5 тыс. руб. К абсолютным показателям вариации относятся: размах вариации (167,6), среднее линейное отклонение (35,3), дисперсия (1988,9) и среднее квадратическое отклонение (44,6).

Относительные показатели вариации: коэффициент осцилляции (1,21), линейный коэффициент вариации (0,255) и коэффициент вариации (0,322).

Относительные показатели вариации

В данном случае рассматриваются отношение отклонения и среднего конкретной выборки. Для различных характеристик используются различные способы определения среднего отклонения.

Чем меньше полученный коэффициент, тем более сгруппированы данные. Этот коэффициент не имеет единиц измерения.

Коэффициент вариации

Такой коэффициент можно рассчитать путём деления линейного отклонения на такой же знаменатель, как в предыдущем случае.

Относительное линейное отклонение

В данном случае искомое значение рассчитывается как результат деления среднего квадратического на этот же знаменатель.

Относительные показатели вариации

В данном случае рассматриваются отношение отклонения и среднего конкретной выборки. Для различных характеристик используются различные способы определения среднего отклонения.

Чем меньше полученный коэффициент, тем более сгруппированы данные. Этот коэффициент не имеет единиц измерения.

Коэффициент вариации

Такой коэффициент можно рассчитать путём деления линейного отклонения на такой же знаменатель, как в предыдущем случае.

Относительное линейное отклонение

В данном случае искомое значение рассчитывается как результат деления среднего квадратического на этот же знаменатель.

Формула коэффициента вариации.

Коэффициент вариации или CV (от англ. ‘coefficient of variation’), представляет собой отношение стандартного отклонения набора наблюдений к их среднему значению:

\(\mathbf{ \left. CV = s \middle/ \ \overline X  \right. }\), (формула 15)

где s — стандартное отклонение выборки, а \(\overline X \) — среднее значение выборки.

(на практике CV обычно рассчитывается в процентах, как \(100( s / \ \overline X) \) ).

Например, когда наблюдения представляют собой ставки доходности, коэффициент вариации измеряет величину риска (стандартное отклонение) на единицу средней доходности. Выражая величину вариации относительно среднего значения наблюдений, коэффициент вариации позволяет напрямую сравнивать дисперсию для различных наборов данных.

Коэффициент вариации не привязан к шкале измерения (то есть он не имеет единиц измерения).

Мы можем проиллюстрировать применение коэффициента вариации на нашем предыдущем примере двух выборок финансовых данных компаний.

  • Коэффициент вариации для первой выборки составляет (€16.8 млн.) / (€70 млн.) = 0,24.
  • Коэффициент вариации для второй выборки составляет (€16.8 млн.) / (€820 млн.) = 0,02.

Это подтверждает нашу интуитивную догадку о том, что первая выборка имеет гораздо большую изменчивость продаж, чем вторая выборка.

Обратите внимание, что 0,24 и 0,02 являются «чистыми числами» в том смысле, что они не содержат единиц измерения (поскольку мы разделили стандартное отклонение на среднее значение, которое измеряется в тех же единицах, что и стандартное отклонение). Если нам нужно сравнить дисперсию наборов данных, выраженных в разных единицах измерения, коэффициент вариации может быть весьма полезен, поскольку он не привязан к единицам измерения

Если нам нужно сравнить дисперсию наборов данных, выраженных в разных единицах измерения, коэффициент вариации может быть весьма полезен, поскольку он не привязан к единицам измерения.

Приведенный ниже пример иллюстрирует расчет коэффициента вариации.

RDW повышен: связь с заболеваниями

Повышенные значения RDW могут указывать, но не диагностировать и не подтверждать, следующие заболевания: 

  • Недостаток железа в организме или авитаминоз
  • Недостаток витаминов группы В, включая В12 и фолиевой кислоты
  • Анемия (различные типы, включая серповидноклеточную анемию)
  • Воспаление
  • Бессонница
  • Сердечно-сосудистые заболевания
  • Кровопотеря из-за кровотечения (включая хирургию)
  • Талассемия
  • Заболевание печени
  • Заболевание почек
  • Рак
  • Болезнь Альцгеймера
  • Алкоголизм
  • и другие.

Однако, показатель RDW может все еще находиться на нормальном уровне у людей с лейкемией, или с некоторыми типами анемий (как апластическая анемия). Поэтому важно смотреть не только на значение RDW, но и на взаимосвязь с другими маркерами. 

Повышенные значения

Если уровень эритроцитов повышен более чем на 15%, это значит, что в крови человека есть неоднородные по объему клетки. К ним причисляют макроциты, нормоциты и шизоциты. Чем выше значение показателя, тем больше расхождение красных частиц в размерах и объеме.

Данный диагноз принято считать анизоцитозом.

Уровень эритроцитов может быть повышен по следующим причинам:

  • При наличии микроцитарной или железодефицитной анемии;
  • Необратимых патогенных процессов;
  • Эритмии, хронического лейкоза;
  • Порока сердца;
  • Трансфузии кровяного потока;
  • Увеличении вязкости крови;
  • Недостатка фолиевой кислоты;
  • Миелодиспластического синдрома, а также болезней Аэрза, Пиквика;
  • Врожденного или приобретенного алкоголизма;
  • Употребления загрязненной или хлорированной воды;
  • Онкологической патологии с наличием метастаз в костном мозге;
  • Пневмонии, нарушения функции дыхательных путей, воспаления бронхов;
  • Долгого пребывания в гористой местности, в которой недостаточно воздуха;

Признаками повышенного уровня до 8-12 единиц является наличие эритремии, а также острой формы лейкоза. В этом случае у людей начинается усиленная выработка кровяных частиц. Может наблюдаться легочная или сердечная недостаточность. Может начаться патология сосудов. В качестве признаков наблюдается вязкость крови, которая вызывает нарушение режима, диарею, обезвоживание организма.

Оцените статью
Рейтинг автора
5
Материал подготовил
Илья Коршунов
Наш эксперт
Написано статей
134
Добавить комментарий