реклама
Бургер менюБургер меню

Антон Владзимирский – Проведение статистического анализа на языке программирования R в медико-биологических исследованиях. Учебное пособие (страница 7)

18

#=====================================================

[1] 0.4904568

#=====================================================

print (sdBT)

#=====================================================

[1] 0.4246912

2.1.3. Вычисление доверительного интервала

Вычислив значения выборочной средней величины (или средневзвешенной величины)48 и среднего квадратического отклонения, можно построить доверительный интервал средней величины. Вычисление доверительного интервала для средней величины тесно связано с понятием доверительной вероятности, ошибки средней величины и предельной ошибкой выборки.

Доверительная вероятность определяет степень уверенности того факта, что измеренная величина находится вблизи среднего значения. Средняя ошибка выборки показывает объективно возникающее расхождение между характеристиками выборки и генеральной совокупностью, а предельная ошибка выборки – это ошибка выборки, исчисляемая с заданной степенью вероятности. Ошибка средней величины в выборке для количественного признака вычисляется по уравнению (8):

где S – выборочное среднее квадратическое отклонение; N – количество исследований.

Ошибка средней величины для долей вхождения признака в данные также вычисляется по уравнению (8) с той лишь разницей, что вместо выборочного среднего квадратического отклонения в уравнение подставляется среднее квадратическое отклонение долей исследуемого признака (уравнение 5).

Предельная ошибка выборки вычисляется по уравнению (9):

где значение t представлено в таблице 4.

В медицинских исследованиях доверительный интервал принимается равным (10)49:

где  – среднее значение исследуемой величины; Δlim – предельная ошибка выборки исследуемой величины.

В случае оценки доли фактора и отклонения долей величина доверительного интервала вычисляется по уравнению (11):

где – средняя доля исследуемого признака, определенная по уравнению (3); Δelim – предельная ошибка выборки долей вхождения признака в данные.

На рисунке 6 изображено графическое представление доверительного интервала при условии данных, распределенных в соответствии с нормальным (Гауссовым) законом.

Рисунок 6 – Доверительный интервал (уравнение 10) выборочного среднего значения (расстояние от белой вертикальной линии до зеленой вертикальной линии)

Пример вычисления доверительных интервалов

На примере значений веса пациентов с подтвержденным диагнозом «анорексия» (набор данных anorexia пакета MASS) проведем анализ доверительных интервалов весов и долей пациентов в контрольной группе, группе с когнитивно-поведенческой терапией и в группе с назначенной семейной терапией.

Листинг 5

library (MASS) # Подключаем библиотеку, содержащую набор данных anorexia

library (ggplot2)

#========================================================

# Выделяем из набора данных подгруппы пациентов с разным типом лечения

#========================================================

contData <– anorexia [anorexia$Treat==«Cont», ] $Prewt

cbtData <– anorexia [anorexia$Treat==«CBT», ] $Prewt

ftData <– anorexia [anorexia$Treat==«FT», ] $Prewt

#=====================================================

# Вычисляем средние значения

#=====================================================

meanCont <– mean (contData) # Средний вес в контрольной группе

meanCBT <– mean (cbtData) # Средний вес в когнитивно-поведенческой группе

meanFT <– mean (ftData) # Средний вес в группе семейной терапии

#========================================================

# Вычисляем среднее квадратическое отклонение

#========================================================

sdCont <– sd (contData) / (sqrt (length (contData))) # Среднее квадратическое

# отклонение веса в контрольной группе

Продолжение листинга 5

sdCBT <– sd (cbtData) / (sqrt (length (cbtData))) # Среднее квадратическое отклонение

# веса в когнитивно-поведенческой группе

sdFT <– sd (ftData) / (sqrt (length (ftData))) # Среднее квадратическое отклонение

# веса в группе семейной терапии

#=====================================================

# Вычисление доверительных интервалов в группах

#=====================================================

upCont <– meanCont+2*sdCont # Верхняя граница доверительного интервала в

# контрольной группе

downCont <– meanCont-2*sdCont # Нижняя граница доверительного интервала в

# контрольной группе

#=====================================================

upCBT <– meanCBT+2*sdCBT # Верхняя граница доверительного интервала в

# группе с когнитивно-поведенческой терапией

downCBT <– meanCBT-2*sdCBT # Нижняя граница доверительного интервала в

# группе с когнитивно-поведенческой терапией

#=====================================================

upFT <– meanFT+2*sdFT # Верхняя граница доверительного интервала в

# группе с семейной терапией

downFT <– meanFT-2*sdFT # Нижняя граница доверительного интервала в

# группе с семейной терапией

#=====================================================

# Построение графика средних значений и доверительных интервалов