Критерий \(\chi^2\) можно использовать, когда ожидаемые значения в ячейках таблицы \(>=\) 5. Если \(\chi^2\) не применим, то необходимо использовать точный тест Фишера.
Исход+ | Исход- | Сумма | |
---|---|---|---|
1 метод | \[ O_{11} \] | \[ O_{12} \] | \[ R_1 \] |
2 метод | \[ O_{21} \] | \[ O_{22} \] | \[ R_2 \] |
Сумма | \[ C_1 \] | \[ C_2 \] | \[ N \] |
Н0 : различий от применений методов нет
Н1 : эффективность методов различается
\[ P = \frac{\frac{R_1!R_2!R_3!R_4!} {N!}} {O_{11}!O_{12}!O_{21}!O_{22}!} \]
Значения ожидаемых частот должны быть маленькими!
Когда будут разные О без изменения С и R, мы получаем все такие же вероятности. Имеется в виду перебор - не меняя суммы по строкам и столбцам, изменять значения О. Мы получаем некоторое количество вероятностей, и, если мы эти вероятности просуммируем для разных О при сохранении С и R, то мы получим величину P для двустороннего критерия Фишера. Вариантов не очень много, так как в ячейках таблицы маленькие числа.
Алгоритм:
Перебрать все значения в ячейках
Для каждой отдельной таблицы посчитать Р
Просуммировать Р: \[P_{дв} = \sum_{i}{P_i}\]
Критерий \(\chi^2\) имеет только односторонний вариант, а тест Фишера может быть как одно-, так и двусторонним. Чаще используют односторонний критерий, так как используемые и получаемые значения меньше. Если есть различия по одностороннему, то берут меньшее.
Одна группа авторов решила выяснить, сколько раз в медицинских статьях указан тип критерия. Использовали 2 журнала: NEJM и Lancet. Смотрели критерий Фишера: могут использовать как одно-, так и двусторонний.
Указан | Не указан | ||
---|---|---|---|
NEJM | 1 | 8 | 9 |
Lancet | 10 | 4 | 14 |
11 | 12 | 23 |
Есть частоты, равные 1 или 4. Даже если 0, можем посчитать вероятность.
\[ p_1 = \frac{\frac{9!14!11!12!}{23!}}{1!8!10!4!} = 0,00666 \]
Самое маленькое число - 1. Уменьшим число на 1. Для того, чтобы, сохранить постоянство с и R, надо изменить значения в соседних ячейках на 1. Считаем новую вероятность.
Указан | Не указан | ||
---|---|---|---|
NEJM | 0 | 9 | 9 |
Lancet | 11 | 3 | 14 |
11 | 12 | 23 |
\[ p_1 = \frac{\frac{9!14!11!12!}{23!}}{0!9!11!3!} = 0,0016 \]
У нас 2 таблицы, в левой верхней клетке число уменьшено до минимума. Это говорит о том, что мы остановились. Суммируем вероятности.
\[ p_1 + p_2 = 0.0083 < 0.05 => H_1 \]
Это p для одностороннего критерия Фишера. Чтобы получить двусторонний, надо перебрать доп. варианты заполнения таблицы. мы смотрим все варианты уменьшения значения в клетках при постоянстве сумм по строкам и столбцам. Таких 8 вероятностей записанной таблицы. Просуммировав их, получим вероятность для двустороннего критерия Фишера. Если p одностороннего отличаются относительно уровня 0,05, то берется наименьший.
Критерий Манна-Уитни - непараметрический аналог Т-критерия Стьюдента.
7 добровольцев. Изучение действие фарм.препарата с диуретический эффектом.
3 человека - контроль (плацебо)
4 человека - исследуемый препарат
У пациентов изменился суточный диурез.
Сут. диурез, мл (плацебо) | Ранг | Сут. диурез, мл (препарат) | Ранг |
---|---|---|---|
1000 | 1 | 1400 | 6 |
1330 | 5 | 1600 | 7 |
1200 | 3 | 1180 | 2 |
1220 | 4 | ||
9 | 19 |
Ранг - номер места в отсортированном общем массиве. Если группы значимо отличаются, то и суммы рангов должны значимо отличаться.
Н0: препарат не влияет на диурез
Н1: не Н0
Мы должны перечислить все варианты распределения 7 рангов по двум группам. 3 ранга из 7 - 35 способов. Каждому способу соответствует величина Т. Это сумма рангов меньшей группы. Это статистика данного критерия.
Т = 9 - 3 способа
Т = 12 - 5 способов
Т = 15 - 3 способа
Если Н0 верна, то все сочетания рангов равновероятны. И если построить график плотности вероятности, то получится кривая, напоминающая нормальное распределение. Нормальное распределение непрерывно и бесконечно на области определения, а распределение Т конечное и дискретное. По точным таблицам критерия Манна-Уитни можно увидеть, что различие незначимо. Принимаем нулевую гипотезу, препарат не является диуретиком.
Данные обеих групп объединить и упорядочить по возрастанию
Присвоить ранги (порядковые номера). Если элементы совпадают присваиваем им ранг, равный среднему арифметическому порядковых номеров в массиве.
Для меньшей группы вычисляют сумму рангов Т. Если группы одинаковые - для любой.
Сравнить полученное Т с критическим.
Сделать вывод
Если численность групп > 8, то можно считать, что распределение Т близко к нормальному.
\[ \mu_T = \frac{n_м(n_м + n_б + 1)}{2} \]
\[ \sigma_T = \sqrt{\frac{n_мn_б (n_м + n_б + 1)}{12}} \]
\[ z_T = \frac{T - \mu_T}{\sigma_T} \]
Z имеет нормальное распределение.
С поправкой Йетса
\[ z_T = \frac{|T - \mu_T|-0,5}{\sigma_T} \]
Критерий Вилкоксона очень похож на критерий Манна-Уитни и является непараметрическим аналогом Т-критерия Стьюдента для связанных выборок. Различия:
Работа идет не с измерениями, а с разностью измернений в двух группах.
Общий ряд составляется по модулю разностей и ранги назначаются также, невзирая на знак.
Отдельно подсчитывается сумма рангов для положительных и отрицательных значений. Для сравнения с критическим берется наименьшая сумма рангов.
Неоднократные исследования (до курса/во время/после курса). 1 параметр в разных временных срезах.
Вместо критерия Фридмана, можно использовать критерий Краскела-Уоллиса при множественном сравнении и ненормальном распределении. При попарном сравнении: Т-тест или критерий Вилкоксона.
n больных, k метода лечения. Эффективность оценивается по балльной шкале, где 1 - наименьший эффект, 4 наибольший эффект
Отличается ли эффективность методов лечения?
Определяем средний ранг эффективности для каждого метода.
Если каждым методом лечили каждого больного, то сумма рангов будет равна.\[R_i\] сумма рангов для каждого метода
\[ S = \sum{(R_i - \frac{n(k+1)}{2})^2} \]
\[ \chi^2 = \frac{12}{nk(k+1)}S \]
Сравнить с критическим (df = n - k + 1)
Применение динитрохлорбензола(ДНХБ) у онкологических больных.
Проба применяется для оценки сохранности иммунитета
ДНХБ наносится на кожу шпателем. Результат оценивается через 48 часов.
Проба положительная, если развивается выраженная местная воспалительная реакция, что говорит о сохранности иммунитета.
Некоторые оспаривают информативность пробы, поэтому было проведено сравнение с кротоновым маслом, которое показывает местнораздражающий эффект независимо от иммунного статуса.
ДНХБ+ | ДНХБ- | |
---|---|---|
Кротон+ | 81 | 48 |
Кротон- | 23 | 21 |
Критерий Хи-квадрат не выявит различий, однако разница между “только ДНХБ+” и “только кротон+” больше, чем в 2 раза. С помощью критерия Мак-Немара покажем, что ДНХБ дает меньше положительных результатов, чем кротоновое масло.
Если оба вещества действует одинаково, то
\[ \frac{23+48}{2} = 35,5 \]
\[ \chi^2_{Yates} = \frac{(23-35,5-0,5)^2}{35,5} + \frac{(48-35,5-0,5)^2}{35,5} = 8,807 \]
И Хи-квадрат с поправкой Йетса будет больше критического уровня (df = 1). Следовательно, действие ДНХБ отличается от кротонового масла.
Не рассматриваем больных, у которых неизменна на оба агента.
Отдельно считаем тех, чья реакция положительна по одному методу.
Считаем среднее арифметическое из п.2
Вычислить расстояние Пирсона между наблюдаемым(п.1) и ожидаемыми величинами(п.3)
Применить Хи-квадрат с поправкой Йетса и числом степеней свободы равным 1.
Т. Бишоп (Т. Bishop. High frequency neural modulation in dentistry. J. Am. Dent. Assoc., 112:176—177, 1986) изучил эффективность высокочастотной стимуляции нерва в качестве обезболивающего средства при удалении зуба. Все больные подключались к прибору, но в одних случаях он работал, в других был выключен. Ни стоматолог, ни больной не знали, включен ли прибор. Позволяют ли следующие данные считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством?
## Прибор включен Прибор выключен
## Боль есть 24 3
## Боли нет 6 17
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 17.878, df = 1, p-value = 2.356e-05
Вывод: данные позволяют считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством.
Синдром внезапной детской смерти — основная причина смерти детей в возрасте от 1 недели до 1 года. Обычно смерть наступает на фоне полного здоровья незаметно, во сне, поэтому определение факторов риска имеет первостепенное значение. Считается, что синдром внезапной детской смерти чаще случается у недоношенных детей, негров, а также в семьях с низкими доходами. Н. Левак и соавт. (N. Lewak et al. Sudden infant death syndrome risk factors: prospective data review. Clin. Pediatr., 18: 404—411, 1979) решили уточнить эти данные. Исследователи собрали сведения о 19047 детях, родившихся в одном из роддомов Окленда, штат Калифорния, с 1960 по 1967 г. Судьбу детей проследили до 1 года. Данных о 48 детях получить не удалось. От синдрома внезапной детской смерти умерли 44 ребенка. Данные о предполагаемых факторах риска представлены в табл. 5,14. Найдите признаки, связанные с риском синдрома внезапной детской смерти.
## ВДС+ ВДС-
## < 25 лет 29 7301
## >= 25 лет 15 11241
## ВДС+ ВДС-
## < 1 года 23 4694
## >= 1 года 11 7339
## ВДС+ ВДС-
## Нет 23 7654
## Да 5 4253
## ВДС+ ВДС-
## Нет 36 12987
## Да 8 4999
## ВДС+ ВДС-
## Нет 10 9595
## Да 24 5228
## ВДС+ ВДС-
## < 11 раз 31 10512
## >= 11 раз 11 8154
## ВДС+ ВДС-
## < 12 мг% 26 12613
## >=12 мг% 7 2678
## ВДС+ ВДС-
## Белые 31 12240
## Негры 9 4323
## Другие 4 2153
## Factors p.value adjust p.value
## 5 smoke 3.733512e-05 0.000298681
## 1 mother.age 5.760213e-04 0.004032149
## 2 t.previous 1.189648e-03 0.007137890
## 6 doctor.visit 3.336892e-02 0.166844607
## 3 is.planned 7.620263e-02 0.304810518
## 4 repet 2.100723e-01 0.630216929
## 7 hemoglobin 7.420876e-01 1.000000000
## 8 race 7.685108e-01 1.000000000
Из имеющихся данных можно сделать вывод, что значимыми факторами риска являются курение во время беременности, возраст матери и время до окончания предыдущей беременности.
Могло ли повлиять отсутствие данных о 48 детях на результаты исследования? Если да, то как?
Р. Феннел и соавт. (R. Fennell et al. Urinary tract infections in children effect of short course antibiotic therapy on recurrence rate in children with previous infections. Clin. Pediatr., 19:121—124, 1980) сравнили эффективность трех антибиотиков при рецидивиру-ющей инфекции мочевых путей у девочек 3—16 лет. После короткого курса одного из антибактериальных препаратов (назначенного случайным образом) в течение года делали повторные посевы мочи. При выявлении бактериурии констатировали рецидив. Есть ли основания говорить о разной эффективности препаратов? Если да, то какой лучше?
## Рецидив+ Рецидив-
## Ампициллин 20 7
## Триметоприм/сульфаметоксазол 24 21
## Цефалексин 14 2
##
## Fisher's Exact Test for Count Data hybrid using asym.chisq. iff (exp=5,
## perc=80, Emin=1)
##
## data: .
## p-value = 0.02858
## alternative hypothesis: two.sided
Различия в эффективности препаратов есть. Теперь необходимо попарно их сравнить.
## n p p.adj
## 1 Ампициллин vs Триметоприм/сульфаметоксазол 0.06589292 0.13178584
## 2 Ампициллин vs Цефалексин 0.26026937 0.26026937
## 3 Триметоприм/сульфаметоксазол vs Цефалексин 0.01392723 0.04178169
Однако одназначного вывода, который из препаратов лучше нельзя. Можно сделать вывод, что триметоприм/сульфаметоксазол хуже цефалексина.
А. О’Нил и соавт. (A. O’Neil et al. A waterborn epidemic of acute infectious non-bacterial gastroenteritis in Alberta, Canada. Can. J. Public Health, 76:199—203, 1985) недавно сообщили о вспышке гастроэнтерита в маленьком канадском городке. Исследователи предположили, что источником инфекции была водопроводная вода. Они исследовали зависимость между количеством выпитой воды и числом заболевших. Какие выводы можно сделать из приводимых данных?
## Гастроэнтерит+ Гастроэнтерит-
## < 1 39 121
## [1;4] 265 258
## > 5 265 146
##
## Pearson's Chi-squared test
##
## data: .
## X-squared = 74.925, df = 2, p-value < 2.2e-16
Попарные сравнения
## n p p.adj
## 1 < 1 vs [1;4] 8.145027e-09 1.629005e-08
## 2 < 1 vs > 5 1.440090e-17 4.320270e-17
## 3 [1;4] vs > 5 3.161730e-05 3.161730e-05
Можно сделать вывод о том, что есть разница в заболеваемости гастроэнтеритом в исследуемой выборке в зависимости от количества выпитой воды.
Как правило, качество исследования выше, а соответствие собираемых данных поставленному вопросу точнее, если данные собираются специально для этого исследования после его планирования. Р. и С. Флетчеры (R. Fletcher, S. Fletcher. Clinical research in general medical journals: а 30-year perspective. N. Engl. J. Med., 301:180—183, 1979) исследовали 612 работ, случайным образом выбранных из журналов Journal of American Medical Association, Lancet и New England Journal of Medicine, чтобы определить, собирали ли их авторы свои данные до или после планирования исследования.Оцените статистическую значимость различия долей. Если различия есть, то можно ли сказать, что положение меняется к лучшему?
##
## Pearson's Chi-squared test
##
## data: .
## X-squared = 47.954, df = 3, p-value = 2.178e-10
Есть различия в сборе данных за 40 лет.
## n p p.adj
## 1 1946 vs 1956 0.3950617838 0.7901235675
## 2 1956 vs 1966 0.0001416772 0.0004250316
## 3 1966 vs 1976 0.4402306207 0.7901235675
Между 1956 и 1966 году произошел качественный скачок, когда данные стали собирать после планирования эксперимента.
Одна из причин инсульта — окклюзия сонной артерии. Чтобы выяснить, какое лечение — медикаментозное или хирургическое — дает в этом случае лучшие результаты, У. Филдс и соавт. (W. Fields et al. Joint study of extracranial arterial occlusion,V: Progress report of prognosis following surgery or nonsurginal treatment for transient ishemic attacks and cervical carotid artery lesions. JAMA, 211:1993—2003, 1970) сравнили долгосрочный прогноз у леченных двумя методами. Можно ли говорить о превосходстве одного из видов лечения?
## Неблагоприятный Благоприятный
## Хирургическое 43 36
## Медикаментозное 53 19
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 5.1849, df = 1, p-value = 0.02278
Эффективность двух методов лечения не равна. Можно говорить, что хирургическое лечение лучше медикаментозного, так как у медикаментозного варианта больше неблагоприятных исходов, а благоприятных меньше почти в 2 раза, чем при хирургическом.
В диагностике ишемической болезни сердца используют нагрузочную пробу, с помощью физической нагрузки вызывают ишемию миокарда, которую выявляют на ЭКГ. Существует другой метод, ишемию вызывают внутривенным введением дипиридамола, а выявляют с помощью эхокардиографии. Ф. Латтанци и соавт. (F. Lattanzi et al. Inhibition of dipyndamole-induced ishemia by antianginal therapy in humans: correlation with exercise electrocardiography. Circulation, 83:1256—1262, 1991) сравнили результаты двух методов у больных, получавших и не получавших антиангинальную терапию.Оцените различия между результатами двух методов.
Без антиангинальной терапии
## Р+ Р-
## Р+ 38 2
## Р- 14 3
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 1.0659, df = 1, p-value = 0.3019
На фоне антиангинальной терапии
## Р+ Р-
## Р+ 21 6
## Р- 16 14
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 2.7321, df = 1, p-value = 0.09835
Нет разницы между двумя методами, независимо давалась ли терапия пациентам или нет.
Д. Сакетт и М. Гент (D. Sackett, M. Gent. Controversy in counting and attributing events in clinical trials. N. Engl. J. Med., 301:1410—1412, 1979) сделали важное замечание относительно методики сбора данных в исследовании результатов медикаментозного и хирургического лечения окклюзии сонной артерии (задача 5.7). Так как изучался «долгосрочный прогноз», в исследование включали только тех больных, которые не умерли и у которых не было повторного инсульта во время госпитализации. В результате из рассмотрения были исключены 15 оперированных (5 из них умерли, а у 10 инсульт произошел вскоре после операции) и только 1 больной, лечившийся медикаментозно. Что теперь можно сказать о предпочтительности одного из видов лечения? Какое сравнение более верно — с учетом этих 16 больных или без их учета (как в задаче 5.7)? Почему?
## Неблагоприятный+ Неблагоприятный-
## Хирургическое 58 36
## Медикаментозное 54 19
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 2.273, df = 1, p-value = 0.1316
Теперь нельзя говорить о предпочтительности какого-либо метода. Верно сравнение с учетом этих 16 больных, так как нельзя говорить о “долгосрочном прогнозе”, если пациенты умирают через несколько часов-дней после вмешательства.
Распространенность болезни X равна 10%. Болезнью Y страдает 1000 человек, болезнью Z — также 1000 человек. Болезнь X с равной вероятностью поражает страдающих болезнями Y и Z. Вероятность госпитализации при этих болезнях разная: для болезни X она составляет 40%, Y — 50%, Z — 20%. Посмотрим, сколько больных с разными сочетаниями болезней окажется в больнице. Из 1000 человек, страдающих болезнью Y, болезнь X имеют 10%, то есть 100 человек. Из них 50% (50 человек) будут госпитализированы в связи с болезнью Y, из оставшихся 50 человек в связи с болезнью X госпитализируют 40%, то есть 20 человек. Таким образом, в больнице окажется 70 больных с сочетанием болезней Y и X. Из 900 человек, страдающих болезнью Y, но не X, будут госпитализированы 50%, то есть 450 человек. Такой же расчет для болезни Z показывает, что в больницу попадет 52 человека с сочетанием болезней Z и X, а с болезнью Z, но не Х, — 180 человек. Оцените статистическую значимость различий частоты болезни X среди страдающих болезнями Y и Z. Можно ли по этим данным судить о связи болезней Y и Z с болезнью X? (Приведенный пример заимствован из работы: D. Mainland. The risk of fallacious conclusions from autopsy data on the incidence of diseases with applications to heart disease. Am. Heart J., 45:644—654, 1953).
## X+ X-
## Y 70 450
## Z 52 180
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 8.8124, df = 1, p-value = 0.002992
Оценка двух средств для предупреждения образования зубного налёта: хлоргексидин и хлорид аммония. Каждый из участников исследования в течение 48 часов полоскал рот одним из средств, после чего налет оценивали визуально. Через некоторое время опыт повторялся с другим средством (очередность выбиралась случайно). Эффективно ли полоскание хлоридом аммония?
## Хлорид аммония Хлоргексидин
## 1 32 14
## 2 60 39
## 3 25 24
## 4 45 13
## 5 65 9
## 6 60 3
## 7 68 10
## 8 83 14
## 9 120 1
## 10 110 36
##
## Wilcoxon signed rank exact test
##
## data: df$`Хлорид аммония` and df$Хлоргексидин
## V = 55, p-value = 0.0009766
## alternative hypothesis: true location shift is greater than 0
Чем выше балл, тем больше налета. Количество баллов больше у хлорида аммония, поэтому он менее эффективен для профилактики зубного налета, чем хлоргексидин.
Вводили пневмококковую вакцину 20 женщинам и определяли уровень антистрептококковых антител до и после вакцинации. Оценить статистическую значимость изменения уровня антител.
## До После
## 1 79 163
## 2 100 127
## 3 133 288
## 4 141 1154
## 5 43 666
## 6 63 156
## 7 127 644
## 8 140 273
## 9 145 231
## 10 217 1097
## 11 551 227
## 12 170 310
## 13 1049 1189
## 14 986 1695
## 15 436 1180
## 16 1132 1194
## 17 129 1186
## 18 228 444
## 19 135 2690
## 20 110 95
## До После
## 1 0.4 0.4
## 2 0.4 0.5
## 3 0.4 0.5
## 4 0.4 0.9
## 5 0.5 0.5
## 6 0.5 0.5
## 7 0.5 0.5
## 8 0.5 0.5
## 9 0.5 0.5
## 10 0.6 12.2
## 11 0.6 0.6
## 12 0.7 1.1
## 13 0.7 1.2
## 14 0.8 0.8
## 15 0.9 1.2
## 16 0.9 1.9
## 17 1.0 2.0
## 18 1.0 0.9
## 19 1.6 8.1
## 20 2.0 3.7
##
## Wilcoxon signed rank test with continuity correction
##
## data: pneumo$До and pneumo$После
## V = 13, p-value = 0.0003175
## alternative hypothesis: true location shift is less than 0
##
## Wilcoxon signed rank test with continuity correction
##
## data: strepto$До and strepto$После
## V = 2, p-value = 0.00206
## alternative hypothesis: true location shift is less than 0
Уровень антител к стрептококкам и пневмококкам статистически меньше до вакцинации, чем после.
Чему равна вероятность обнаружить не менее чем двукратное увеличение концентрации антител к пневмококкам и стрептококкам при уровне значимости 0,05? Графики чувствительности критерия Стьюдента, изображенные на рис. 6.9, применимы к парному критерию Стьюдента, если используемое в них приравнять к удвоенному объему выборки.
Решите задачу 9.2 с помощью дисперсионного анализа повторных измерений. Как связаны между собой значения F и парного критерия Стьюдента?
При ишемической болезни сердца курение может вызвать приступ стенокардии. Это связано с тем, что никотин увеличивает потребность миокарда в кислороде, а окись углерода связывается с гемоглобином, тем самым снижая поступление кислорода. Однако не способствуют ли развитию приступов и другие компоненты табачного дыма? Чтобы выяснить это, У. Аронов (W. Aronow. Effect of non-nicotine cigarettes and carbonmonoxide on angina. Circulation, 61:262—265, 1979) определил у 12 больных ишемической болезнью сердца продолжительность физической нагрузки до развития приступа стенокардии. У каждого больного опыт проводили до и после выкуривания пяти безникотиновых сигарет, а затем до и после вдыхания эквивалентного количества окиси углерода. Были получены следующие результаты. Длительность нагрузки до развития приступа стенокардии измерялась в секундах. Какие выводы позволяют сделать эти данные?
## До После
## 1 289 155
## 2 203 117
## 3 359 187
## 4 243 134
## 5 232 135
## 6 210 119
## 7 251 145
## 8 246 121
## 9 224 136
## 10 239 124
## 11 220 118
## 12 211 107
## До После
## 1 281 177
## 2 186 125
## 3 372 238
## 4 254 165
## 5 219 153
## 6 225 148
## 7 264 180
## 8 237 144
## 9 212 152
## 10 250 147
## 11 209 138
## 12 226 141
##
## Wilcoxon signed rank exact test
##
## data: notnikotin$До and notnikotin$После
## V = 78, p-value = 0.0002441
## alternative hypothesis: true location shift is greater than 0
##
## Wilcoxon signed rank exact test
##
## data: CO$До and CO$После
## V = 78, p-value = 0.0002441
## alternative hypothesis: true location shift is greater than 0
Вывод: курение безникотиновых сигарет, так же как и вдыхание эквивалентного количества окиси углерода значимо уменьшает толерантность сердечной мышцы к физической нагрузке.
Определяя эффективность гидралазина, Л. Рубин и Р.Питер измеряли не только легочное сосудистое сопротивление, но и сердечный выброс. Менялся ли сердечный выброс?
## 1 2 3
## [1,] 3.5 8.6 5.1
## [2,] 3.3 5.4 8.6
## [3,] 4.9 8.8 6.7
## [4,] 3.6 5.6 5.0
##
## Friedman rank sum test
##
## data: .
## Friedman chi-squared = 6.5, df = 2, p-value = 0.03877
Обнаружены статистически значимые различия между измерениями сердечного выброса.
Существует операция ушивания желудка для похудания. Уменьшенный желудок наполняется быстрее и чувство насыщения возникает при меньшем объеме съеденной пиши. Нельзя ли обойтись без операции и ограничиться сдавливанием живота надувным поясом? При оценке эффективности последнего метода А. Гелибтер и соавт. (A. Geliebter et al. Extraabdominal pressure alters food intake, intragastric pressure, and gastric emptying rate. Am. J. Physiol., 250:R549—R552, 1986) наблюдали, какой объем пищи съедают добровольцы. Однако истинная цель исследования была скрыта. Участникам опыта объясняли, что по давлению внутри поясов измеряется увеличение живота во время еды и что исследователям нужно подобрать такое исходное давление, при котором измерения были бы наиболее точны. От участников требовалось есть до появления сытости. Что позволяют заключить эти данные?
## 0 10 20
## [1,] 448 470 292
## [2,] 472 424 390
## [3,] 631 538 508
## [4,] 634 496 560
## [5,] 734 547 602
## [6,] 820 578 508
## [7,] 643 711 724
##
## Friedman rank sum test
##
## data: .
## Friedman chi-squared = 3.7143, df = 2, p-value = 0.1561
Нет разницы от давления в поясе и количеством съеденной еды до насыщения.
По данным предыдущей задачи определите вероятность выявить снижение объема съеденной пищи на 100 мл при уровне значимости 5%.
У плода легкие не функционируют. Артериальный проток — сосуд, соединяющий аорту и легочную артерию, — позволяет крови, минуя легкие, попадать в плаценту, где и происходит газообмен. После рождения артериальный проток закрывается; если этого не происходит, то кровь, по-прежнему минуя легкие, не насыщается кислородом и не очищается от двуокиси углерода. Закрытию артериального протока способствует индометацин. Однако на результаты лечения влияет множество обстоятельств — гестационный возраст, возраст начала лечения, сопутствующие заболевания и их лечение. В таких случаях для оценки лечения можно применить следующий метод: найти пары детей с совпадающими значениями всех факторов, которые могут повлиять на результат терапии, затем случайным образом одному ребенку из пары назначить индометацин, а другому — плацебо. Эффективен ли индометацин?
## Р+ Р-
## Р+ 65 13
## Р- 27 40
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: .
## X-squared = 26.956, df = 1, p-value = 2.082e-07
Индометацин эффективнее плацебо.
Анализы, инструментальные исследования и лекарственные средства назначает врач, а платит за них главным образом больной. Многие врачи весьма смутно представляют себе стоимость своих назначений и не озабочены тем, чтобы уменьшить расходы больного. Чтобы побудить врачей задуматься об этом, все шире практикуется учет затрат на обследование и лечение. Есть ли основания считать, что это сделает врача более экономным? Интересное исследование провели С. Шредер и соавт. (S. Schroeder et al. Use of laboratory tests and pharmaceuticals:variation among physicians and effect of cost audit on subsequent use. JAMA, 225:969—973, 1973). В течение трех месяцев они регистрировали расходы на обследование и лечение амбулаторных больных, которых наблюдали врачи из клиники Вашингтонского университета. Данные собирали по больным со сходными заболеваниями. Рассчитав для каждого врача среднегодовые расходы на обследование и лечение одного больного, составили общий список, который раздали врачам. Каждый врач знал свой номер в списке, но не знал номеров своих коллег, таким образом он мог сравнить свои расходы с расходами дру- гих, но не знал, кого именно. Через некоторое время исследователи проверили, какие изменения произошли в расходовании средств у тех же врачей. Произошли ли изменения в расходах на обследование и лечение? Есть ли связь между расходами на обследование и лечение? Как можно объяснить полученные результаты?
## До После
## 1 20 20
## 2 17 26
## 3 14 1
## 4 42 24
## 5 50 1
## 6 62 47
## 7 8 15
## 8 49 7
## 9 81 65
## 10 54 9
## 11 48 21
## 12 55 36
## 13 56 30
##
## Wilcoxon signed rank test with continuity correction
##
## data: df$До and df$После
## V = 75, p-value = 0.002678
## alternative hypothesis: true location shift is greater than 0
## До После
## 1 32 42
## 2 41 90
## 3 51 71
## 4 29 47
## 5 76 56
## 6 47 43
## 7 60 137
## 8 58 63
## 9 40 28
## 10 64 60
## 11 73 87
## 12 66 69
## 13 73 50
##
## Wilcoxon signed rank test with continuity correction
##
## data: df1$До and df1$После
## V = 31.5, p-value = 0.8447
## alternative hypothesis: true location shift is greater than 0
Расходы на диагностику сократились, на лечение не уменьшились.
##
## Spearman's rank correlation rho
##
## data: df$До and df1$До
## S = 290.9, p-value = 0.5106
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.2008255
##
## Spearman's rank correlation rho
##
## data: df$После and df1$После
## S = 502.19, p-value = 0.2007
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## -0.3796427
Связи между расходами на диагностику и лечение не обнаружено. Объяснить эти данные можно, тем, что стоимость диагностических и лечебных процедур - вторичный фактор при выборе назначения. Возможно, исследуемые врачи стали меньше увлекаться гипердиагностикой, поэтому затраты на диагностичекие процедуры снизились.
При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmol., 104:545—548, 1986) измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. С помощью непараметрического метода проверьте, подтверждают ли эти данные гипотезу о различии в проницаемости сосудов сетчатки? После этого воспользуйтесь соответствующим параметрическим методом. Если выводы окажутся иными, объясните, в чем причина различия.
## Здоровые Больные
## 1 0.5 1.2
## 2 0.7 1.4
## 3 0.7 1.6
## 4 1.0 1.7
## 5 1.0 1.7
## 6 1.2 1.8
## 7 1.4 2.2
## 8 1.4 2.3
## 9 1.6 2.4
## 10 1.6 6.4
## 11 1.7 19.0
## 12 2.2 23.6
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$Здоровые and df1$Больные
## W = 19, p-value = 0.001176
## alternative hypothesis: true location shift is less than 0
##
## Two Sample t-test
##
## data: df1$Здоровые and df1$Больные
## t = -1.9079, df = 22, p-value = 0.03477
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -0.4190994
## sample estimates:
## mean of x mean of y
## 1.250000 5.441667
Проницаемость сосудов у здоровых меньше, чем у больных.
Данные задачи 10.2 — часть более широкого исследования проницаемости сетчатки. Сравните данные, относящиеся к разным видам поражений.
## Норма Центр.ямка Центр.ямка + периферия
## 1 0.5 1.2 6.2
## 2 0.7 1.4 12.6
## 3 0.7 1.6 12.8
## 4 1.0 1.7 13.2
## 5 1.0 1.7 14.1
## 6 1.2 1.8 15.0
## 7 1.4 2.2 20.3
## 8 1.4 2.3 22.7
## 9 1.6 2.4 27.7
## 10 1.6 6.4 NA
## 11 1.7 19.0 NA
## 12 2.2 23.6 NA
##
## Kruskal-Wallis rank sum test
##
## data: list(df1$Норма, df1$Центр.ямка, df1$`Центр.ямка + периферия`)
## Kruskal-Wallis chi-squared = 20.712, df = 2, p-value = 3.18e-05
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$Норма and df1$Центр.ямка
## W = 19, p-value = 0.001176
## alternative hypothesis: true location shift is less than 0
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$Центр.ямка and df1$`Центр.ямка + периферия`
## W = 15, p-value = 0.0031
## alternative hypothesis: true location shift is less than 0
Группы отличаются по проницаемости сосудов сетчатки, причем чем тяжелее поражение, тем больше отличие.
В гл. 3 на примере больных пиелонефритом была рассмотрена зависимость продолжительности госпитализации от правильности лечения. Д. Кнапп и соавт. решили выяснить, наблюдается ли такая зависимость при лечении пневмонии. Изучив 28 историй болезни, исследователи обнаружили следующее. Есть ли разница в продолжительности госпитализации?
## Правильное лечение Неправильное лечение
## 1 3.7 3.8
## 2 2.5 6.8
## 3 2.8 7.9
## 4 3.0 8.8
## 5 5.5 9.0
## 6 6.4 9.3
## 7 NA 1.7
## 8 NA 2.5
## 9 NA 2.9
## 10 NA 3.0
## 11 NA 3.4
## 12 NA 3.7
## 13 NA 4.8
## 14 NA 5.3
## 15 NA 5.5
## 16 NA 5.8
## 17 NA 7.1
## 18 NA 6.6
## 19 NA 8.6
## 20 NA 9.0
## 21 NA 10.3
## 22 NA 11.0
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$`Правильное лечение` and df1$`Неправильное лечение`
## W = 33, p-value = 0.03431
## alternative hypothesis: true location shift is less than 0
При правильном лечение длительность госпитализации меньше.
Предсердный натрийуретический гормон усиливает выведение натрия и воды почками. В. Хименес и соавт. (W. Jimenez et al. Atrial natriuretic factor: reduced cardiac content in cirrhotic rats with ascites. Am. J. Physiol., 250:F749—F752, 1986) исследовали его роль в задержке натрия и воды при циррозе печени. Крысам вводили экстракт предсердия: одной группе — экстракт, полученный от здоровых крыс, другой — от крыс с циррозом печени. Регистрировали изменение выделения натрия с мочой (в процентах от исходного). Какой вывод можно сделать по результатам опыта?
## Здоровые Цирроз
## 1 760 8
## 2 1000 80
## 3 1370 80
## 4 1680 210
## 5 1970 210
## 6 2420 320
## 7 3260 500
## 8 5000 610
## 9 5400 760
## 10 7370 760
## 11 NA 890
## 12 NA 890
## 13 NA 1870
## 14 NA 1950
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$Здоровые and df1$Цирроз
## W = 129, p-value = 0.0003011
## alternative hypothesis: true location shift is greater than 0
У здоровых крыс содержание гормона в экстракте больше, чем у крыс с циррозом.
Введя изотоп внутривенно и наблюдая за его распространением с помощью гамма-камеры, можно определить кровенаполнение различных органов, в том числе легких. Р. Окада и соавт. (R. Okada et al. Radionuclide-determined change in pulmonary blood volume with exercise: improved sensitivity ofmultigated blood pool scanning in detecting coronary-artery disease. N. Engl. J. Med., 301:569—576, 1979) решили использовать этот метод для локализации поражения коронарных артерий при ишемической болезни сердца. Правая коронарная артерия снабжает кровью главным образом правый желудочек, левая — главным образом левый. Левый желудочек перекачивает кровь, которая поступает в него из легких, по всему телу. При поражении левой коронарной артерии кровоснабжение левого желудочка ухудшается. В покое, когда объем перекачиваемой крови невелик, это никак не проявляется, однако при физической нагрузке это приводит к накоплению крови в легких. При поражении правой коронарной артерии этого не происходит. Примерно так рассуждали авторы, приступая к работе. Было обследовано 33 человека: 9 здоровых (1-я группа) и 24 больных ишемической болезнью сердца, из них 5 с поражением только правой коронарной артерии (2-я группа) и 19 с поражением обеих коронарных артерий или только левой (3-я группа). Рассчитывали отношение кровенаполнения легких при физической нагрузке к кровенаполнению в покое: по мысли авторов, в 3-й группе этот показатель должен быть выше, чем в первых двух. Различаются ли группы межцу собой? Если да, то как именно и достаточно ли велико различие, чтобы исследуемый показатель можно было использовать для определения пораженной коронарной артерии?
## 1 2 3
## 1 0.83 0.86 0.98
## 2 0.89 0.92 1.02
## 3 0.91 1.00 1.03
## 4 0.93 1.02 1.04
## 5 0.94 1.20 1.05
## 6 0.97 NA 1.06
## 7 0.97 NA 1.07
## 8 0.98 NA 1.22
## 9 1.02 NA 1.07
## 10 NA NA 1.23
## 11 NA NA 1.13
## 12 NA NA 1.08
## 13 NA NA 1.32
## 14 NA NA 1.10
## 15 NA NA 1.15
## 16 NA NA 1.37
## 17 NA NA 1.18
## 18 NA NA 1.12
## 19 NA NA 1.58
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$`1` and df1$`3`
## W = 2, p-value = 2.202e-05
## alternative hypothesis: true location shift is less than 0
##
## Wilcoxon rank sum test with continuity correction
##
## data: df1$`2` and df1$`3`
## W = 16.5, p-value = 0.01504
## alternative hypothesis: true location shift is less than 0
Исследуемый показатель действительно в 3 группе выше, чем в 1 и 2. Однако группы несбалансированы и показатель в группых отличается не сильно, так что использовать его в практике в таком виде опасно.
Грезя о славе, автор этих строк предложил новый метод оценки эффективности лечения. Преимущество метода — его простота. Он состоит в следующем. Если у больного интересующий нас показатель увеличивается, ставится оценка +1, если уменьшается — 0 (допустим, случай неизменности показателя исключен). Сумма оценок по всем больным и есть значение критерия G. Значение критерия G = 1 + 1 + 0 + 1 = 3. Является ли G полноценным критерием? Постройте распределение G и найдите критическое значение для случаев, когда число больных равно 4 и 6.