Лекция по непараметрическим критериям

Точный тест Фишера

Теория

Критерий \(\chi^2\) можно использовать, когда ожидаемые значения в ячейках таблицы \(>=\) 5. Если \(\chi^2\) не применим, то необходимо использовать точный тест Фишера.

Исход+ Исход- Сумма
1 метод \[ O_{11} \] \[ O_{12} \] \[ R_1 \]
2 метод \[ O_{21} \] \[ O_{22} \] \[ R_2 \]
Сумма \[ C_1 \] \[ C_2 \] \[ N \]

Н0 : различий от применений методов нет

Н1 : эффективность методов различается

Вероятность получить некоторую таблицу

\[ P = \frac{\frac{R_1!R_2!R_3!R_4!} {N!}} {O_{11}!O_{12}!O_{21}!O_{22}!} \]

Значения ожидаемых частот должны быть маленькими!

Когда будут разные О без изменения С и R, мы получаем все такие же вероятности. Имеется в виду перебор - не меняя суммы по строкам и столбцам, изменять значения О. Мы получаем некоторое количество вероятностей, и, если мы эти вероятности просуммируем для разных О при сохранении С и R, то мы получим величину P для двустороннего критерия Фишера. Вариантов не очень много, так как в ячейках таблицы маленькие числа.

Алгоритм:

  1. Перебрать все значения в ячейках

  2. Для каждой отдельной таблицы посчитать Р

  3. Просуммировать Р: \[P_{дв} = \sum_{i}{P_i}\]

Критерий \(\chi^2\) имеет только односторонний вариант, а тест Фишера может быть как одно-, так и двусторонним. Чаще используют односторонний критерий, так как используемые и получаемые значения меньше. Если есть различия по одностороннему, то берут меньшее.

Пример

Одна группа авторов решила выяснить, сколько раз в медицинских статьях указан тип критерия. Использовали 2 журнала: NEJM и Lancet. Смотрели критерий Фишера: могут использовать как одно-, так и двусторонний.

Указан Не указан
NEJM 1 8 9
Lancet 10 4 14
11 12 23

Есть частоты, равные 1 или 4. Даже если 0, можем посчитать вероятность.

\[ p_1 = \frac{\frac{9!14!11!12!}{23!}}{1!8!10!4!} = 0,00666 \]

Самое маленькое число - 1. Уменьшим число на 1. Для того, чтобы, сохранить постоянство с и R, надо изменить значения в соседних ячейках на 1. Считаем новую вероятность.

Указан Не указан
NEJM 0 9 9
Lancet 11 3 14
11 12 23

\[ p_1 = \frac{\frac{9!14!11!12!}{23!}}{0!9!11!3!} = 0,0016 \]

У нас 2 таблицы, в левой верхней клетке число уменьшено до минимума. Это говорит о том, что мы остановились. Суммируем вероятности.

\[ p_1 + p_2 = 0.0083 < 0.05 => H_1 \]

Это p для одностороннего критерия Фишера. Чтобы получить двусторонний, надо перебрать доп. варианты заполнения таблицы. мы смотрим все варианты уменьшения значения в клетках при постоянстве сумм по строкам и столбцам. Таких 8 вероятностей записанной таблицы. Просуммировав их, получим вероятность для двустороннего критерия Фишера. Если p одностороннего отличаются относительно уровня 0,05, то берется наименьший.

Критерий Манна-Уитни

Критерий Манна-Уитни - непараметрический аналог Т-критерия Стьюдента.

7 добровольцев. Изучение действие фарм.препарата с диуретический эффектом.

  • 3 человека - контроль (плацебо)

  • 4 человека - исследуемый препарат

У пациентов изменился суточный диурез.

Сут. диурез, мл (плацебо) Ранг Сут. диурез, мл (препарат) Ранг
1000 1 1400 6
1330 5 1600 7
1200 3 1180 2
1220 4
9 19

Ранг - номер места в отсортированном общем массиве. Если группы значимо отличаются, то и суммы рангов должны значимо отличаться.

Н0: препарат не влияет на диурез

Н1: не Н0

Мы должны перечислить все варианты распределения 7 рангов по двум группам. 3 ранга из 7 - 35 способов. Каждому способу соответствует величина Т. Это сумма рангов меньшей группы. Это статистика данного критерия.

  • Т = 9 - 3 способа

  • Т = 12 - 5 способов

  • Т = 15 - 3 способа

Если Н0 верна, то все сочетания рангов равновероятны. И если построить график плотности вероятности, то получится кривая, напоминающая нормальное распределение. Нормальное распределение непрерывно и бесконечно на области определения, а распределение Т конечное и дискретное. По точным таблицам критерия Манна-Уитни можно увидеть, что различие незначимо. Принимаем нулевую гипотезу, препарат не является диуретиком.

Алгоритм

  1. Данные обеих групп объединить и упорядочить по возрастанию

  2. Присвоить ранги (порядковые номера). Если элементы совпадают присваиваем им ранг, равный среднему арифметическому порядковых номеров в массиве.

  3. Для меньшей группы вычисляют сумму рангов Т. Если группы одинаковые - для любой.

  4. Сравнить полученное Т с критическим.

  5. Сделать вывод

Если численность групп > 8, то можно считать, что распределение Т близко к нормальному.

\[ \mu_T = \frac{n_м(n_м + n_б + 1)}{2} \]

\[ \sigma_T = \sqrt{\frac{n_мn_б (n_м + n_б + 1)}{12}} \]

\[ z_T = \frac{T - \mu_T}{\sigma_T} \]

Z имеет нормальное распределение.

С поправкой Йетса

\[ z_T = \frac{|T - \mu_T|-0,5}{\sigma_T} \]

Критерий Вилкоксона

Критерий Вилкоксона очень похож на критерий Манна-Уитни и является непараметрическим аналогом Т-критерия Стьюдента для связанных выборок. Различия:

  • Работа идет не с измерениями, а с разностью измернений в двух группах.

  • Общий ряд составляется по модулю разностей и ранги назначаются также, невзирая на знак.

  • Отдельно подсчитывается сумма рангов для положительных и отрицательных значений. Для сравнения с критическим берется наименьшая сумма рангов.

Лекция по повторным измерениям.

Критерий Фридмана.

Неоднократные исследования (до курса/во время/после курса). 1 параметр в разных временных срезах.

Вместо критерия Фридмана, можно использовать критерий Краскела-Уоллиса при множественном сравнении и ненормальном распределении. При попарном сравнении: Т-тест или критерий Вилкоксона.

Пример

n больных, k метода лечения. Эффективность оценивается по балльной шкале, где 1 - наименьший эффект, 4 наибольший эффект

Отличается ли эффективность методов лечения?

  1. Определяем средний ранг эффективности для каждого метода.

  2. Если каждым методом лечили каждого больного, то сумма рангов будет равна.\[R_i\] сумма рангов для каждого метода

  3. \[ S = \sum{(R_i - \frac{n(k+1)}{2})^2} \]

  4. \[ \chi^2 = \frac{12}{nk(k+1)}S \]

  5. Сравнить с критическим (df = n - k + 1)

Критерий Мак-Немара

Применение динитрохлорбензола(ДНХБ) у онкологических больных.

  • Проба применяется для оценки сохранности иммунитета

  • ДНХБ наносится на кожу шпателем. Результат оценивается через 48 часов.

  • Проба положительная, если развивается выраженная местная воспалительная реакция, что говорит о сохранности иммунитета.

Некоторые оспаривают информативность пробы, поэтому было проведено сравнение с кротоновым маслом, которое показывает местнораздражающий эффект независимо от иммунного статуса.

ДНХБ+ ДНХБ-
Кротон+ 81 48
Кротон- 23 21

Критерий Хи-квадрат не выявит различий, однако разница между “только ДНХБ+” и “только кротон+” больше, чем в 2 раза. С помощью критерия Мак-Немара покажем, что ДНХБ дает меньше положительных результатов, чем кротоновое масло.

Если оба вещества действует одинаково, то

\[ \frac{23+48}{2} = 35,5 \]

\[ \chi^2_{Yates} = \frac{(23-35,5-0,5)^2}{35,5} + \frac{(48-35,5-0,5)^2}{35,5} = 8,807 \]

И Хи-квадрат с поправкой Йетса будет больше критического уровня (df = 1). Следовательно, действие ДНХБ отличается от кротонового масла.

Алгоритм

  1. Не рассматриваем больных, у которых неизменна на оба агента.

  2. Отдельно считаем тех, чья реакция положительна по одному методу.

  3. Считаем среднее арифметическое из п.2

  4. Вычислить расстояние Пирсона между наблюдаемым(п.1) и ожидаемыми величинами(п.3)

  5. Применить Хи-квадрат с поправкой Йетса и числом степеней свободы равным 1.

Задачи главы 5

5.1

Т. Бишоп (Т. Bishop. High frequency neural modulation in dentistry. J. Am. Dent. Assoc., 112:176—177, 1986) изучил эффективность высокочастотной стимуляции нерва в качестве обезболивающего средства при удалении зуба. Все больные подключались к прибору, но в одних случаях он работал, в других был выключен. Ни стоматолог, ни больной не знали, включен ли прибор. Позволяют ли следующие данные считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством?

##           Прибор включен Прибор выключен
## Боль есть             24               3
## Боли нет               6              17
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 17.878, df = 1, p-value = 2.356e-05

Вывод: данные позволяют считать высокочастотную стимуляцию нерва действенным анальгезируюшим средством.

5.2

Синдром внезапной детской смерти — основная причина смерти детей в возрасте от 1 недели до 1 года. Обычно смерть наступает на фоне полного здоровья незаметно, во сне, поэтому определение факторов риска имеет первостепенное значение. Считается, что синдром внезапной детской смерти чаще случается у недоношенных детей, негров, а также в семьях с низкими доходами. Н. Левак и соавт. (N. Lewak et al. Sudden infant death syndrome risk factors: prospective data review. Clin. Pediatr., 18: 404—411, 1979) решили уточнить эти данные. Исследователи собрали сведения о 19047 детях, родившихся в одном из роддомов Окленда, штат Калифорния, с 1960 по 1967 г. Судьбу детей проследили до 1 года. Данных о 48 детях получить не удалось. От синдрома внезапной детской смерти умерли 44 ребенка. Данные о предполагаемых факторах риска представлены в табл. 5,14. Найдите признаки, связанные с риском синдрома внезапной детской смерти.

##           ВДС+  ВДС-
## < 25 лет    29  7301
## >= 25 лет   15 11241
##           ВДС+ ВДС-
## < 1 года    23 4694
## >= 1 года   11 7339
##     ВДС+ ВДС-
## Нет   23 7654
## Да     5 4253
##     ВДС+  ВДС-
## Нет   36 12987
## Да     8  4999
##     ВДС+ ВДС-
## Нет   10 9595
## Да    24 5228
##           ВДС+  ВДС-
## < 11 раз    31 10512
## >= 11 раз   11  8154
##          ВДС+  ВДС-
## < 12 мг%   26 12613
## >=12 мг%    7  2678
##        ВДС+  ВДС-
## Белые    31 12240
## Негры     9  4323
## Другие    4  2153
##        Factors      p.value adjust p.value
## 5        smoke 3.733512e-05    0.000298681
## 1   mother.age 5.760213e-04    0.004032149
## 2   t.previous 1.189648e-03    0.007137890
## 6 doctor.visit 3.336892e-02    0.166844607
## 3   is.planned 7.620263e-02    0.304810518
## 4        repet 2.100723e-01    0.630216929
## 7   hemoglobin 7.420876e-01    1.000000000
## 8         race 7.685108e-01    1.000000000

Из имеющихся данных можно сделать вывод, что значимыми факторами риска являются курение во время беременности, возраст матери и время до окончания предыдущей беременности.

5.3 TODO

Могло ли повлиять отсутствие данных о 48 детях на результаты исследования? Если да, то как?

5.4

Р. Феннел и соавт. (R. Fennell et al. Urinary tract infections in children effect of short course antibiotic therapy on recurrence rate in children with previous infections. Clin. Pediatr., 19:121—124, 1980) сравнили эффективность трех антибиотиков при рецидивиру-ющей инфекции мочевых путей у девочек 3—16 лет. После короткого курса одного из антибактериальных препаратов (назначенного случайным образом) в течение года делали повторные посевы мочи. При выявлении бактериурии констатировали рецидив. Есть ли основания говорить о разной эффективности препаратов? Если да, то какой лучше?

##                              Рецидив+ Рецидив-
## Ампициллин                         20        7
## Триметоприм/сульфаметоксазол       24       21
## Цефалексин                         14        2
## 
##  Fisher's Exact Test for Count Data hybrid using asym.chisq. iff (exp=5,
##  perc=80, Emin=1)
## 
## data:  .
## p-value = 0.02858
## alternative hypothesis: two.sided

Различия в эффективности препаратов есть. Теперь необходимо попарно их сравнить.

##                                            n          p      p.adj
## 1 Ампициллин vs Триметоприм/сульфаметоксазол 0.06589292 0.13178584
## 2                   Ампициллин vs Цефалексин 0.26026937 0.26026937
## 3 Триметоприм/сульфаметоксазол vs Цефалексин 0.01392723 0.04178169

Однако одназначного вывода, который из препаратов лучше нельзя. Можно сделать вывод, что триметоприм/сульфаметоксазол хуже цефалексина.

5.5

А. О’Нил и соавт. (A. O’Neil et al. A waterborn epidemic of acute infectious non-bacterial gastroenteritis in Alberta, Canada. Can. J. Public Health, 76:199—203, 1985) недавно сообщили о вспышке гастроэнтерита в маленьком канадском городке. Исследователи предположили, что источником инфекции была водопроводная вода. Они исследовали зависимость между количеством выпитой воды и числом заболевших. Какие выводы можно сделать из приводимых данных?

##       Гастроэнтерит+ Гастроэнтерит-
## < 1               39            121
## [1;4]            265            258
## > 5              265            146
## 
##  Pearson's Chi-squared test
## 
## data:  .
## X-squared = 74.925, df = 2, p-value < 2.2e-16

Попарные сравнения

##              n            p        p.adj
## 1 < 1 vs [1;4] 8.145027e-09 1.629005e-08
## 2   < 1 vs > 5 1.440090e-17 4.320270e-17
## 3 [1;4] vs > 5 3.161730e-05 3.161730e-05

Можно сделать вывод о том, что есть разница в заболеваемости гастроэнтеритом в исследуемой выборке в зависимости от количества выпитой воды.

5.6

Как правило, качество исследования выше, а соответствие собираемых данных поставленному вопросу точнее, если данные собираются специально для этого исследования после его планирования. Р. и С. Флетчеры (R. Fletcher, S. Fletcher. Clinical research in general medical journals: а 30-year perspective. N. Engl. J. Med., 301:180—183, 1979) исследовали 612 работ, случайным образом выбранных из журналов Journal of American Medical Association, Lancet и New England Journal of Medicine, чтобы определить, собирали ли их авторы свои данные до или после планирования исследования.Оцените статистическую значимость различия долей. Если различия есть, то можно ли сказать, что положение меняется к лучшему?

## 
##  Pearson's Chi-squared test
## 
## data:  .
## X-squared = 47.954, df = 3, p-value = 2.178e-10

Есть различия в сборе данных за 40 лет.

##              n            p        p.adj
## 1 1946 vs 1956 0.3950617838 0.7901235675
## 2 1956 vs 1966 0.0001416772 0.0004250316
## 3 1966 vs 1976 0.4402306207 0.7901235675

Между 1956 и 1966 году произошел качественный скачок, когда данные стали собирать после планирования эксперимента.

5.7

Одна из причин инсульта — окклюзия сонной артерии. Чтобы выяснить, какое лечение — медикаментозное или хирургическое — дает в этом случае лучшие результаты, У. Филдс и соавт. (W. Fields et al. Joint study of extracranial arterial occlusion,V: Progress report of prognosis following surgery or nonsurginal treatment for transient ishemic attacks and cervical carotid artery lesions. JAMA, 211:1993—2003, 1970) сравнили долгосрочный прогноз у леченных двумя методами. Можно ли говорить о превосходстве одного из видов лечения?

##                 Неблагоприятный Благоприятный
## Хирургическое                43            36
## Медикаментозное              53            19
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 5.1849, df = 1, p-value = 0.02278

Эффективность двух методов лечения не равна. Можно говорить, что хирургическое лечение лучше медикаментозного, так как у медикаментозного варианта больше неблагоприятных исходов, а благоприятных меньше почти в 2 раза, чем при хирургическом.

5.8

В диагностике ишемической болезни сердца используют нагрузочную пробу, с помощью физической нагрузки вызывают ишемию миокарда, которую выявляют на ЭКГ. Существует другой метод, ишемию вызывают внутривенным введением дипиридамола, а выявляют с помощью эхокардиографии. Ф. Латтанци и соавт. (F. Lattanzi et al. Inhibition of dipyndamole-induced ishemia by antianginal therapy in humans: correlation with exercise electrocardiography. Circulation, 83:1256—1262, 1991) сравнили результаты двух методов у больных, получавших и не получавших антиангинальную терапию.Оцените различия между результатами двух методов.

Без антиангинальной терапии

##    Р+ Р-
## Р+ 38  2
## Р- 14  3
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 1.0659, df = 1, p-value = 0.3019

На фоне антиангинальной терапии

##    Р+ Р-
## Р+ 21  6
## Р- 16 14
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 2.7321, df = 1, p-value = 0.09835

Нет разницы между двумя методами, независимо давалась ли терапия пациентам или нет.

5.9

Д. Сакетт и М. Гент (D. Sackett, M. Gent. Controversy in counting and attributing events in clinical trials. N. Engl. J. Med., 301:1410—1412, 1979) сделали важное замечание относительно методики сбора данных в исследовании результатов медикаментозного и хирургического лечения окклюзии сонной артерии (задача 5.7). Так как изучался «долгосрочный прогноз», в исследование включали только тех больных, которые не умерли и у которых не было повторного инсульта во время госпитализации. В результате из рассмотрения были исключены 15 оперированных (5 из них умерли, а у 10 инсульт произошел вскоре после операции) и только 1 больной, лечившийся медикаментозно. Что теперь можно сказать о предпочтительности одного из видов лечения? Какое сравнение более верно — с учетом этих 16 больных или без их учета (как в задаче 5.7)? Почему?

##                 Неблагоприятный+ Неблагоприятный-
## Хирургическое                 58               36
## Медикаментозное               54               19
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 2.273, df = 1, p-value = 0.1316

Теперь нельзя говорить о предпочтительности какого-либо метода. Верно сравнение с учетом этих 16 больных, так как нельзя говорить о “долгосрочном прогнозе”, если пациенты умирают через несколько часов-дней после вмешательства.

5.10 TODO

Распространенность болезни X равна 10%. Болезнью Y страдает 1000 человек, болезнью Z — также 1000 человек. Болезнь X с равной вероятностью поражает страдающих болезнями Y и Z. Вероятность госпитализации при этих болезнях разная: для болезни X она составляет 40%, Y — 50%, Z — 20%. Посмотрим, сколько больных с разными сочетаниями болезней окажется в больнице. Из 1000 человек, страдающих болезнью Y, болезнь X имеют 10%, то есть 100 человек. Из них 50% (50 человек) будут госпитализированы в связи с болезнью Y, из оставшихся 50 человек в связи с болезнью X госпитализируют 40%, то есть 20 человек. Таким образом, в больнице окажется 70 больных с сочетанием болезней Y и X. Из 900 человек, страдающих болезнью Y, но не X, будут госпитализированы 50%, то есть 450 человек. Такой же расчет для болезни Z показывает, что в больницу попадет 52 человека с сочетанием болезней Z и X, а с болезнью Z, но не Х, — 180 человек. Оцените статистическую значимость различий частоты болезни X среди страдающих болезнями Y и Z. Можно ли по этим данным судить о связи болезней Y и Z с болезнью X? (Приведенный пример заимствован из работы: D. Mainland. The risk of fallacious conclusions from autopsy data on the incidence of diseases with applications to heart disease. Am. Heart J., 45:644—654, 1953).

##   X+  X-
## Y 70 450
## Z 52 180
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 8.8124, df = 1, p-value = 0.002992

Задачи главы 9

9.1

Оценка двух средств для предупреждения образования зубного налёта: хлоргексидин и хлорид аммония. Каждый из участников исследования в течение 48 часов полоскал рот одним из средств, после чего налет оценивали визуально. Через некоторое время опыт повторялся с другим средством (очередность выбиралась случайно). Эффективно ли полоскание хлоридом аммония?

##    Хлорид аммония Хлоргексидин
## 1              32           14
## 2              60           39
## 3              25           24
## 4              45           13
## 5              65            9
## 6              60            3
## 7              68           10
## 8              83           14
## 9             120            1
## 10            110           36
## 
##  Wilcoxon signed rank exact test
## 
## data:  df$`Хлорид аммония` and df$Хлоргексидин
## V = 55, p-value = 0.0009766
## alternative hypothesis: true location shift is greater than 0

Чем выше балл, тем больше налета. Количество баллов больше у хлорида аммония, поэтому он менее эффективен для профилактики зубного налета, чем хлоргексидин.

9.2

Вводили пневмококковую вакцину 20 женщинам и определяли уровень антистрептококковых антител до и после вакцинации. Оценить статистическую значимость изменения уровня антител.

##      До После
## 1    79   163
## 2   100   127
## 3   133   288
## 4   141  1154
## 5    43   666
## 6    63   156
## 7   127   644
## 8   140   273
## 9   145   231
## 10  217  1097
## 11  551   227
## 12  170   310
## 13 1049  1189
## 14  986  1695
## 15  436  1180
## 16 1132  1194
## 17  129  1186
## 18  228   444
## 19  135  2690
## 20  110    95
##     До После
## 1  0.4   0.4
## 2  0.4   0.5
## 3  0.4   0.5
## 4  0.4   0.9
## 5  0.5   0.5
## 6  0.5   0.5
## 7  0.5   0.5
## 8  0.5   0.5
## 9  0.5   0.5
## 10 0.6  12.2
## 11 0.6   0.6
## 12 0.7   1.1
## 13 0.7   1.2
## 14 0.8   0.8
## 15 0.9   1.2
## 16 0.9   1.9
## 17 1.0   2.0
## 18 1.0   0.9
## 19 1.6   8.1
## 20 2.0   3.7
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  pneumo$До and pneumo$После
## V = 13, p-value = 0.0003175
## alternative hypothesis: true location shift is less than 0
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  strepto$До and strepto$После
## V = 2, p-value = 0.00206
## alternative hypothesis: true location shift is less than 0

Уровень антител к стрептококкам и пневмококкам статистически меньше до вакцинации, чем после.

9.3 TODO

Чему равна вероятность обнаружить не менее чем двукратное увеличение концентрации антител к пневмококкам и стрептококкам при уровне значимости 0,05? Графики чувствительности критерия Стьюдента, изображенные на рис. 6.9, применимы к парному критерию Стьюдента, если используемое в них приравнять к удвоенному объему выборки.

9.4 TODO

Решите задачу 9.2 с помощью дисперсионного анализа повторных измерений. Как связаны между собой значения F и парного критерия Стьюдента?

9.5

При ишемической болезни сердца курение может вызвать приступ стенокардии. Это связано с тем, что никотин увеличивает потребность миокарда в кислороде, а окись углерода связывается с гемоглобином, тем самым снижая поступление кислорода. Однако не способствуют ли развитию приступов и другие компоненты табачного дыма? Чтобы выяснить это, У. Аронов (W. Aronow. Effect of non-nicotine cigarettes and carbonmonoxide on angina. Circulation, 61:262—265, 1979) определил у 12 больных ишемической болезнью сердца продолжительность физической нагрузки до развития приступа стенокардии. У каждого больного опыт проводили до и после выкуривания пяти безникотиновых сигарет, а затем до и после вдыхания эквивалентного количества окиси углерода. Были получены следующие результаты. Длительность нагрузки до развития приступа стенокардии измерялась в секундах. Какие выводы позволяют сделать эти данные?

##     До После
## 1  289   155
## 2  203   117
## 3  359   187
## 4  243   134
## 5  232   135
## 6  210   119
## 7  251   145
## 8  246   121
## 9  224   136
## 10 239   124
## 11 220   118
## 12 211   107
##     До После
## 1  281   177
## 2  186   125
## 3  372   238
## 4  254   165
## 5  219   153
## 6  225   148
## 7  264   180
## 8  237   144
## 9  212   152
## 10 250   147
## 11 209   138
## 12 226   141
## 
##  Wilcoxon signed rank exact test
## 
## data:  notnikotin$До and notnikotin$После
## V = 78, p-value = 0.0002441
## alternative hypothesis: true location shift is greater than 0
## 
##  Wilcoxon signed rank exact test
## 
## data:  CO$До and CO$После
## V = 78, p-value = 0.0002441
## alternative hypothesis: true location shift is greater than 0

Вывод: курение безникотиновых сигарет, так же как и вдыхание эквивалентного количества окиси углерода значимо уменьшает толерантность сердечной мышцы к физической нагрузке.

9.6

Определяя эффективность гидралазина, Л. Рубин и Р.Питер измеряли не только легочное сосудистое сопротивление, но и сердечный выброс. Менялся ли сердечный выброс?

##        1   2   3
## [1,] 3.5 8.6 5.1
## [2,] 3.3 5.4 8.6
## [3,] 4.9 8.8 6.7
## [4,] 3.6 5.6 5.0
## 
##  Friedman rank sum test
## 
## data:  .
## Friedman chi-squared = 6.5, df = 2, p-value = 0.03877

Обнаружены статистически значимые различия между измерениями сердечного выброса.

9.7

Существует операция ушивания желудка для похудания. Уменьшенный желудок наполняется быстрее и чувство насыщения возникает при меньшем объеме съеденной пиши. Нельзя ли обойтись без операции и ограничиться сдавливанием живота надувным поясом? При оценке эффективности последнего метода А. Гелибтер и соавт. (A. Geliebter et al. Extraabdominal pressure alters food intake, intragastric pressure, and gastric emptying rate. Am. J. Physiol., 250:R549—R552, 1986) наблюдали, какой объем пищи съедают добровольцы. Однако истинная цель исследования была скрыта. Участникам опыта объясняли, что по давлению внутри поясов измеряется увеличение живота во время еды и что исследователям нужно подобрать такое исходное давление, при котором измерения были бы наиболее точны. От участников требовалось есть до появления сытости. Что позволяют заключить эти данные?

##        0  10  20
## [1,] 448 470 292
## [2,] 472 424 390
## [3,] 631 538 508
## [4,] 634 496 560
## [5,] 734 547 602
## [6,] 820 578 508
## [7,] 643 711 724
## 
##  Friedman rank sum test
## 
## data:  .
## Friedman chi-squared = 3.7143, df = 2, p-value = 0.1561

Нет разницы от давления в поясе и количеством съеденной еды до насыщения.

9.8 TODO

По данным предыдущей задачи определите вероятность выявить снижение объема съеденной пищи на 100 мл при уровне значимости 5%.

9.9

У плода легкие не функционируют. Артериальный проток — сосуд, соединяющий аорту и легочную артерию, — позволяет крови, минуя легкие, попадать в плаценту, где и происходит газообмен. После рождения артериальный проток закрывается; если этого не происходит, то кровь, по-прежнему минуя легкие, не насыщается кислородом и не очищается от двуокиси углерода. Закрытию артериального протока способствует индометацин. Однако на результаты лечения влияет множество обстоятельств — гестационный возраст, возраст начала лечения, сопутствующие заболевания и их лечение. В таких случаях для оценки лечения можно применить следующий метод: найти пары детей с совпадающими значениями всех факторов, которые могут повлиять на результат терапии, затем случайным образом одному ребенку из пары назначить индометацин, а другому — плацебо. Эффективен ли индометацин?

##    Р+ Р-
## Р+ 65 13
## Р- 27 40
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  .
## X-squared = 26.956, df = 1, p-value = 2.082e-07

Индометацин эффективнее плацебо.

9.10 TODO

Задачи главы 10

10.1

Анализы, инструментальные исследования и лекарственные средства назначает врач, а платит за них главным образом больной. Многие врачи весьма смутно представляют себе стоимость своих назначений и не озабочены тем, чтобы уменьшить расходы больного. Чтобы побудить врачей задуматься об этом, все шире практикуется учет затрат на обследование и лечение. Есть ли основания считать, что это сделает врача более экономным? Интересное исследование провели С. Шредер и соавт. (S. Schroeder et al. Use of laboratory tests and pharmaceuticals:variation among physicians and effect of cost audit on subsequent use. JAMA, 225:969—973, 1973). В течение трех месяцев они регистрировали расходы на обследование и лечение амбулаторных больных, которых наблюдали врачи из клиники Вашингтонского университета. Данные собирали по больным со сходными заболеваниями. Рассчитав для каждого врача среднегодовые расходы на обследование и лечение одного больного, составили общий список, который раздали врачам. Каждый врач знал свой номер в списке, но не знал номеров своих коллег, таким образом он мог сравнить свои расходы с расходами дру- гих, но не знал, кого именно. Через некоторое время исследователи проверили, какие изменения произошли в расходовании средств у тех же врачей. Произошли ли изменения в расходах на обследование и лечение? Есть ли связь между расходами на обследование и лечение? Как можно объяснить полученные результаты?

##    До После
## 1  20    20
## 2  17    26
## 3  14     1
## 4  42    24
## 5  50     1
## 6  62    47
## 7   8    15
## 8  49     7
## 9  81    65
## 10 54     9
## 11 48    21
## 12 55    36
## 13 56    30
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  df$До and df$После
## V = 75, p-value = 0.002678
## alternative hypothesis: true location shift is greater than 0
##    До После
## 1  32    42
## 2  41    90
## 3  51    71
## 4  29    47
## 5  76    56
## 6  47    43
## 7  60   137
## 8  58    63
## 9  40    28
## 10 64    60
## 11 73    87
## 12 66    69
## 13 73    50
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  df1$До and df1$После
## V = 31.5, p-value = 0.8447
## alternative hypothesis: true location shift is greater than 0

Расходы на диагностику сократились, на лечение не уменьшились.

## 
##  Spearman's rank correlation rho
## 
## data:  df$До and df1$До
## S = 290.9, p-value = 0.5106
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.2008255

## 
##  Spearman's rank correlation rho
## 
## data:  df$После and df1$После
## S = 502.19, p-value = 0.2007
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.3796427

Связи между расходами на диагностику и лечение не обнаружено. Объяснить эти данные можно, тем, что стоимость диагностических и лечебных процедур - вторичный фактор при выборе назначения. Возможно, исследуемые врачи стали меньше увлекаться гипердиагностикой, поэтому затраты на диагностичекие процедуры снизились.

10.2

При заболеваниях сетчатки повышается проницаемость ее сосудов. Дж. Фишмен и соавт. (G. Fishman et al. Blood-retinal barrier function in patients with cone or cone-rod dystrophy. Arch. Ophthalmol., 104:545—548, 1986) измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. С помощью непараметрического метода проверьте, подтверждают ли эти данные гипотезу о различии в проницаемости сосудов сетчатки? После этого воспользуйтесь соответствующим параметрическим методом. Если выводы окажутся иными, объясните, в чем причина различия.

##    Здоровые Больные
## 1       0.5     1.2
## 2       0.7     1.4
## 3       0.7     1.6
## 4       1.0     1.7
## 5       1.0     1.7
## 6       1.2     1.8
## 7       1.4     2.2
## 8       1.4     2.3
## 9       1.6     2.4
## 10      1.6     6.4
## 11      1.7    19.0
## 12      2.2    23.6
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$Здоровые and df1$Больные
## W = 19, p-value = 0.001176
## alternative hypothesis: true location shift is less than 0
## 
##  Two Sample t-test
## 
## data:  df1$Здоровые and df1$Больные
## t = -1.9079, df = 22, p-value = 0.03477
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##        -Inf -0.4190994
## sample estimates:
## mean of x mean of y 
##  1.250000  5.441667

Проницаемость сосудов у здоровых меньше, чем у больных.

10.3

Данные задачи 10.2 — часть более широкого исследования проницаемости сетчатки. Сравните данные, относящиеся к разным видам поражений.

##    Норма Центр.ямка Центр.ямка + периферия
## 1    0.5        1.2                    6.2
## 2    0.7        1.4                   12.6
## 3    0.7        1.6                   12.8
## 4    1.0        1.7                   13.2
## 5    1.0        1.7                   14.1
## 6    1.2        1.8                   15.0
## 7    1.4        2.2                   20.3
## 8    1.4        2.3                   22.7
## 9    1.6        2.4                   27.7
## 10   1.6        6.4                     NA
## 11   1.7       19.0                     NA
## 12   2.2       23.6                     NA
## 
##  Kruskal-Wallis rank sum test
## 
## data:  list(df1$Норма, df1$Центр.ямка, df1$`Центр.ямка + периферия`)
## Kruskal-Wallis chi-squared = 20.712, df = 2, p-value = 3.18e-05
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$Норма and df1$Центр.ямка
## W = 19, p-value = 0.001176
## alternative hypothesis: true location shift is less than 0
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$Центр.ямка and df1$`Центр.ямка + периферия`
## W = 15, p-value = 0.0031
## alternative hypothesis: true location shift is less than 0

Группы отличаются по проницаемости сосудов сетчатки, причем чем тяжелее поражение, тем больше отличие.

10.5

В гл. 3 на примере больных пиелонефритом была рассмотрена зависимость продолжительности госпитализации от правильности лечения. Д. Кнапп и соавт. решили выяснить, наблюдается ли такая зависимость при лечении пневмонии. Изучив 28 историй болезни, исследователи обнаружили следующее. Есть ли разница в продолжительности госпитализации?

##    Правильное лечение Неправильное лечение
## 1                 3.7                  3.8
## 2                 2.5                  6.8
## 3                 2.8                  7.9
## 4                 3.0                  8.8
## 5                 5.5                  9.0
## 6                 6.4                  9.3
## 7                  NA                  1.7
## 8                  NA                  2.5
## 9                  NA                  2.9
## 10                 NA                  3.0
## 11                 NA                  3.4
## 12                 NA                  3.7
## 13                 NA                  4.8
## 14                 NA                  5.3
## 15                 NA                  5.5
## 16                 NA                  5.8
## 17                 NA                  7.1
## 18                 NA                  6.6
## 19                 NA                  8.6
## 20                 NA                  9.0
## 21                 NA                 10.3
## 22                 NA                 11.0
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$`Правильное лечение` and df1$`Неправильное лечение`
## W = 33, p-value = 0.03431
## alternative hypothesis: true location shift is less than 0

При правильном лечение длительность госпитализации меньше.

10.6

Предсердный натрийуретический гормон усиливает выведение натрия и воды почками. В. Хименес и соавт. (W. Jimenez et al. Atrial natriuretic factor: reduced cardiac content in cirrhotic rats with ascites. Am. J. Physiol., 250:F749—F752, 1986) исследовали его роль в задержке натрия и воды при циррозе печени. Крысам вводили экстракт предсердия: одной группе — экстракт, полученный от здоровых крыс, другой — от крыс с циррозом печени. Регистрировали изменение выделения натрия с мочой (в процентах от исходного). Какой вывод можно сделать по результатам опыта?

##    Здоровые Цирроз
## 1       760      8
## 2      1000     80
## 3      1370     80
## 4      1680    210
## 5      1970    210
## 6      2420    320
## 7      3260    500
## 8      5000    610
## 9      5400    760
## 10     7370    760
## 11       NA    890
## 12       NA    890
## 13       NA   1870
## 14       NA   1950
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$Здоровые and df1$Цирроз
## W = 129, p-value = 0.0003011
## alternative hypothesis: true location shift is greater than 0

У здоровых крыс содержание гормона в экстракте больше, чем у крыс с циррозом.

10.7

Введя изотоп внутривенно и наблюдая за его распространением с помощью гамма-камеры, можно определить кровенаполнение различных органов, в том числе легких. Р. Окада и соавт. (R. Okada et al. Radionuclide-determined change in pulmonary blood volume with exercise: improved sensitivity ofmultigated blood pool scanning in detecting coronary-artery disease. N. Engl. J. Med., 301:569—576, 1979) решили использовать этот метод для локализации поражения коронарных артерий при ишемической болезни сердца. Правая коронарная артерия снабжает кровью главным образом правый желудочек, левая — главным образом левый. Левый желудочек перекачивает кровь, которая поступает в него из легких, по всему телу. При поражении левой коронарной артерии кровоснабжение левого желудочка ухудшается. В покое, когда объем перекачиваемой крови невелик, это никак не проявляется, однако при физической нагрузке это приводит к накоплению крови в легких. При поражении правой коронарной артерии этого не происходит. Примерно так рассуждали авторы, приступая к работе. Было обследовано 33 человека: 9 здоровых (1-я группа) и 24 больных ишемической болезнью сердца, из них 5 с поражением только правой коронарной артерии (2-я группа) и 19 с поражением обеих коронарных артерий или только левой (3-я группа). Рассчитывали отношение кровенаполнения легких при физической нагрузке к кровенаполнению в покое: по мысли авторов, в 3-й группе этот показатель должен быть выше, чем в первых двух. Различаются ли группы межцу собой? Если да, то как именно и достаточно ли велико различие, чтобы исследуемый показатель можно было использовать для определения пораженной коронарной артерии?

##       1    2    3
## 1  0.83 0.86 0.98
## 2  0.89 0.92 1.02
## 3  0.91 1.00 1.03
## 4  0.93 1.02 1.04
## 5  0.94 1.20 1.05
## 6  0.97   NA 1.06
## 7  0.97   NA 1.07
## 8  0.98   NA 1.22
## 9  1.02   NA 1.07
## 10   NA   NA 1.23
## 11   NA   NA 1.13
## 12   NA   NA 1.08
## 13   NA   NA 1.32
## 14   NA   NA 1.10
## 15   NA   NA 1.15
## 16   NA   NA 1.37
## 17   NA   NA 1.18
## 18   NA   NA 1.12
## 19   NA   NA 1.58
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$`1` and df1$`3`
## W = 2, p-value = 2.202e-05
## alternative hypothesis: true location shift is less than 0
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  df1$`2` and df1$`3`
## W = 16.5, p-value = 0.01504
## alternative hypothesis: true location shift is less than 0

Исследуемый показатель действительно в 3 группе выше, чем в 1 и 2. Однако группы несбалансированы и показатель в группых отличается не сильно, так что использовать его в практике в таком виде опасно.

10.8 TODO

Грезя о славе, автор этих строк предложил новый метод оценки эффективности лечения. Преимущество метода — его простота. Он состоит в следующем. Если у больного интересующий нас показатель увеличивается, ставится оценка +1, если уменьшается — 0 (допустим, случай неизменности показателя исключен). Сумма оценок по всем больным и есть значение критерия G. Значение критерия G = 1 + 1 + 0 + 1 = 3. Является ли G полноценным критерием? Постройте распределение G и найдите критическое значение для случаев, когда число больных равно 4 и 6.