#=====================================================
[1] 0.4904568
#=====================================================
print (sdBT)
#=====================================================
[1] 0.4246912
2.1.3. Вычисление доверительного интервала
Вычислив значения выборочной средней величины (или средневзвешенной величины)48 и среднего квадратического отклонения, можно построить доверительный интервал средней величины. Вычисление доверительного интервала для средней величины тесно связано с понятием доверительной вероятности, ошибки средней величины и предельной ошибкой выборки.
Доверительная вероятность определяет степень уверенности того факта, что измеренная величина находится вблизи среднего значения. Средняя ошибка выборки показывает объективно возникающее расхождение между характеристиками выборки и генеральной совокупностью, а предельная ошибка выборки – это ошибка выборки, исчисляемая с заданной степенью вероятности. Ошибка средней величины в выборке для количественного признака вычисляется по уравнению (8):
где S – выборочное среднее квадратическое отклонение; N – количество исследований.
Ошибка средней величины для долей вхождения признака в данные также вычисляется по уравнению (8) с той лишь разницей, что вместо выборочного среднего квадратического отклонения в уравнение подставляется среднее квадратическое отклонение долей исследуемого признака (уравнение 5).
Предельная ошибка выборки вычисляется по уравнению (9):
где значение t представлено в таблице 4.
В медицинских исследованиях доверительный интервал принимается равным (10)49:
где X̅ – среднее значение исследуемой величины; Δlim – предельная ошибка выборки исследуемой величины.
В случае оценки доли фактора и отклонения долей величина доверительного интервала вычисляется по уравнению (11):
где X̅e – средняя доля исследуемого признака, определенная по уравнению (3); Δelim – предельная ошибка выборки долей вхождения признака в данные.
На рисунке 6 изображено графическое представление доверительного интервала при условии данных, распределенных в соответствии с нормальным (Гауссовым) законом.
Рисунок 6 – Доверительный интервал (уравнение 10) выборочного среднего значения (расстояние от белой вертикальной линии до зеленой вертикальной линии)
Пример вычисления доверительных интервалов
На примере значений веса пациентов с подтвержденным диагнозом «анорексия» (набор данных anorexia пакета MASS) проведем анализ доверительных интервалов весов и долей пациентов в контрольной группе, группе с когнитивно-поведенческой терапией и в группе с назначенной семейной терапией.
Листинг 5
library (MASS) # Подключаем библиотеку, содержащую набор данных anorexia
library (ggplot2)
#========================================================
# Выделяем из набора данных подгруппы пациентов с разным типом лечения
#========================================================
contData <– anorexia [anorexia$Treat==«Cont», ] $Prewt
cbtData <– anorexia [anorexia$Treat==«CBT», ] $Prewt
ftData <– anorexia [anorexia$Treat==«FT», ] $Prewt
#=====================================================
# Вычисляем средние значения
#=====================================================
meanCont <– mean (contData) # Средний вес в контрольной группе
meanCBT <– mean (cbtData) # Средний вес в когнитивно-поведенческой группе
meanFT <– mean (ftData) # Средний вес в группе семейной терапии
#========================================================
# Вычисляем среднее квадратическое отклонение
#========================================================
sdCont <– sd (contData) / (sqrt (length (contData))) # Среднее квадратическое
# отклонение веса в контрольной группе
Продолжение листинга 5
sdCBT <– sd (cbtData) / (sqrt (length (cbtData))) # Среднее квадратическое отклонение
# веса в когнитивно-поведенческой группе
sdFT <– sd (ftData) / (sqrt (length (ftData))) # Среднее квадратическое отклонение
# веса в группе семейной терапии
#=====================================================
# Вычисление доверительных интервалов в группах
#=====================================================
upCont <– meanCont+2*sdCont # Верхняя граница доверительного интервала в
# контрольной группе
downCont <– meanCont-2*sdCont # Нижняя граница доверительного интервала в
# контрольной группе
#=====================================================
upCBT <– meanCBT+2*sdCBT # Верхняя граница доверительного интервала в
# группе с когнитивно-поведенческой терапией
downCBT <– meanCBT-2*sdCBT # Нижняя граница доверительного интервала в
# группе с когнитивно-поведенческой терапией
#=====================================================
upFT <– meanFT+2*sdFT # Верхняя граница доверительного интервала в
# группе с семейной терапией
downFT <– meanFT-2*sdFT # Нижняя граница доверительного интервала в
# группе с семейной терапией
#=====================================================
# Построение графика средних значений и доверительных интервалов