По роду занятий автору пришлось работать с малоизвестными разделами математики, образующими фундамент теории «стохастических моделей», и преподавать теорию и приложения этого подхода в разных странах. В основе таких моделей лежат выдающиеся идеи и работы российского математика Андрея Андреевича Маркова. Для понимания происходящего и прогноза я использую известные методы дескриптивной и аналитической статистик, кластерный анализ фрагментированных множеств и стохастический анализ последовательностей событий. Математика рассматривает идеальное развитие эпидемиологического очага как рост кривой насыщения, которую можно представить либо в форме гистограммы событий — так называемая дифференциальная форма гистограммы, либо в форме сумм событий — интегральная форма гистограммы. Соответственно есть формулы, описывающие такие процессы, например, кривая Гаусса и ряд других математических формул или моделей.

Коронавирус
Коронавирус
Иван Шилов © ИА REGNUM
Два типа идеализированных кривых представления данных
Два типа идеализированных кривых представления данных
© Валентин Сгибнев

Наиболее удобными для анализа современной пандемии короновируса мне представились данные Университета Джонса Хопкинса, США. Данные именно этого университета имеют определенные преимущества перед национальными и тем более региональными, поскольку приведены «к общему знаменателю». Доступные группы данных имеют одну структуру, синхронизированы и сгруппированы по ряду признаков. Данные находятся в открытом доступе, что делает возможным работу без значимых ограничений. Я ограничился данными по странам, которые либо формируют географические региональные кластеры, либо понятно раскладываются на временной оси, либо позволяют наблюдать хронологические изменения структуры в одном отдельно избранном региональном кластере. При таком подходе выделяются две группы. Первая — Италия, Испания, Бельгия, Германия, Великобритания и для сравнения США, вторая группа — Китай, Южная Корея и Иран. В заключение рассмотрим пример эпидемиологического очага (западной) России. Вопросы количества зараженных, больных и погибших при таком подходе становятся вторичными, но никак не второстепенными.

Наложенные гистограммы для 1-го кластера (sub)phase I+Sp+D+Gb+Us 17042020
Наложенные гистограммы для 1-го кластера (sub)phase I+Sp+D+Gb+Us 17042020
© Валентин Сгибнев

Европейский кластер. На графике, в качестве примера, совмещены гистограммы роста числа заболевших в Италии, Испании, Германии, Великобритании и США в едином временном масштабе — горизонтальная ось. Масштабирование по вертикальной оси — число заболевших — пропорционально изменено для каждой страны. Гистограммы сдвинуты по временной оси: Италия и Испания, далее Германия и Бельгия и далее Великобритания и США. Смещенное наложение гистограмм позволяет определить, как наличие первичного ареала эпидемии — север Италии, так и временное соотношение внутренних фаз развития внутри выбранных региональных очагов. Таких внутренних фаз — максимумов второго порядка — на данный момент выделяется от от шести до семи.

Продолжительности существования каждой фазы образуют незавершенную цепочку событий второго порядка и одновременно так называемую марковскую цепь, как последовательность 4−4-4−3-4−4-х… дня. Конечное число максимумов определить на данный момент для европейского кластера не представляется возможным, поскольку формирование и тем более завершение развития эпидемиологических очагов не закончено. Китайский кластер проявил суммарную продолжительность событий немногим более 28 дней. Такие наблюдения свидетельствуют о продолжающемся формировании всех без исключения очагов европейского кластера, а также США.

Рассмотренные гистограммы имеют и заметные различия в проявлении событий третьего порядка. Причинами таких особенностей формирования могут быть локальные всплески числа заболевших в отдельно взятой стране или специфические решения на национальном уровне в борьбе с короновирусом.

Наиболее ярко различия в развитии региональных очагов проявились не в последовательности событий — один тип вируса — а в интенсивности событий. В Германии на 100 000 зараженных на 18.04.2020 примерно трое умерших, в Испании на 100 000 зараженных число умерших выше более чем в двенадцать раз. Это наблюдение имеет стратегические значение.

Германия разместила в самоизоляцию население по местам первичной прописки почти своевременно. Италия и Испания долго решали, что с этим делать, пока отделения интенсивной терапии и морги не оказались переполненными. США, как и Великобритания, по примеру Голландии и Швеции решили решить проблему путем «дарвинского» самоотбора, наверное, поэтому в штате Нью-Йорк пришлось организовывать массовые захоронения. Позже срочно понадобились другие решения, но стало поздно что-либо менять.

Основной вывод — изоляция населения практически не влияет на последовательность и длительность отдельных фаз развития «национальных» эпидемиологических очагов, однако снижает риск заболевания и тем более уровень смертности. Оправдывает ли себя такой подход экономически, вопрос, прежде всего, этический и политический.

Азиатский кластер. К нему я отнес Китай, Южная Корея и Иран. Такое сопоставление позволило рассмотреть изменение структуры развития отдельных множеств внутри кластера и возможные особенности регионального развития.

Гистограммы изменения заболевших 2-го кластера 11042020
Гистограммы изменения заболевших 2-го кластера 11042020
© Валентин Сгибнев

Прежде всего, заметно, что суммарная гистограмма показывает три фазы развития эпидемиологических очагов. Первая, продолжительностью от 24 до 28 дней, отчетливо наблюдается в Южной Корее и Иране, в Китае же выражена рудиментарно. Вторая фаза, продолжительностью от 28 до 32 дней, имеет схожую структуру и примерно равную продолжительность, независимо от национальных усилий по минимизации числа зараженных. Максимальные различия как по продолжительности, так в форме и интенсивности, наблюдаются в третьей фазе. Ее продолжительность можно предварительно оценить от 46 до 56 дней. Заметно также, что локальные события внутри кластера имеют определенный «ритм» развития или внутреннюю цикличность событий. Вторая фаза развития эпидемиологических очагов «азиатского кластера» показывает общность структур китайского и южнокорейского очагов и принципиальное отличие иранского от первых двух.

Вышеизложенные наблюдения приводят нас неизбежно к ряду допущений, которые максимально отчетливо демонстрирует гистограмма «азиатского» кластера в финальной стадии развития очага коронавируса:

  • первое — принимая полимодальное распределение числа зараженных, мы обязаны допустить либо существование нескольких полиморфных подформ вируса, вторая из которых появляется примерно через две недели после первой, либо вынуждены сделать как миниму, еще одно допущение;
  • второе — третий пик резкого увеличения числа заболевших связан с формированием эндемичного и асинхронного, более позднего источника заражения, настолько различны морфология и структура третьего пика для каждой страны;
  • третье — наличие нескольких асинхронных субрегиональных географически изолированных очагов заражения в Иране.

Появляется неизбежный вопрос: сколько (под)видов вируса участвуют в настоящее время в формировании пандемии? По теме неожиданно высказались генетики Харм ван Бакел из медицинской школы Икан и коллеги школы Гроссмана. По их данным, в Нью-Йорке распространяется европейский тип вируса. Группа генетиков из Великобритании полагает, что в США сформировались два самостоятельных эпидемиологических очага: Западного побережья и Восточного побережья. Таким образом, консолидируется допущение: есть вирус «А» первой фазы для Китая и всего региона, есть вирус второй фазы «Б» (см. Иран), есть «В», сформировавший итальяно-европейский кластер с «метастазами» на территорию США, и есть ряд «переходных» форм вируса. Степень генетического родства китайского и европейского вирусов для генетиков в настоящее время в любом случае является величиной умалчиваемой, но неизбежно известной. Генетики полагают, что между «уханьским» вирусом и «евровирусом» можно предположить переходной «гонконгский» субвариант. Используемый в данной работе анализ не дает ни малейшего повода указывать на эволюционное или техногенное происхождение вирусного материала. Можно лишь уверенно указать на наличие нескольких форм этого материала. Самым важным выводом глобальной дискуссии и всестороннего анализа развития пандемии является признание факта полиморфности вируса и, неизбежно, формирование новых очагов.

Крайне интересным и показательным с точки зрения выбора и приложения методов математического описания, анализа и стохастического моделирования эпидемии представляется (западно) российский региональный очаг. Его особенностью является известная предистория и структура как формирования, так и развития «материнского» европейского «субстрата», со всеми имеющими место успехами и неудачами. Такая предыстория позволяет детально и максимально точно — значение коэффициента детерминации R2 превышает 0,99 — подобрать регрессионную модель развития очага. Правильность выбора регрессионной модели не является, к глубочайшему сожалению, гарантией надежного прогноза развития эпидемиологической ситуации даже на локальном уровне.

Математическая модель развития эпидемии в (западной) России 18.04.2020
Математическая модель развития эпидемии в (западной) России 18.04.2020
© Валентин Сгибнев

Причин для короткой жизни прогноза, как показано выше, может быть достаточно, начиная от политической организации отдельного государства — централизованное, федеральное и т.п. — или от содержания и реализации санитарно-эпидемиологических решений, принимаемых в том или ином регионе или государстве. Эпидемиологическая модель, вне сомнений, и поливариантна, и всегда строго ограничена смыслом и сроком годности, и сама по себе является вероятностной моделью или, как принято называть еще, моделью стохастической. Прежде всего этим можно объяснить существование ряда на первый взгляд крайне корректных «прогнозов» с крайне малым периодом действия. Уменьшить влияние посторонних факторов и определить не столько полноту соответствия числового ряда конкретной выбранной математической модели/функции можно и необходимо признанием не столько допустимости, но более признанием (мало или очень, или крайне) вероятности избранной модели.

Для определения значимости моделей роста числа заболевших в среднесрочной перспективе эти модели были рассмотрены в рамках так называемого анализа марковских цепей. В рамках этого подхода исходная точка цепи событий обозначается, скажем, «а». Количество заболевших на следующий день может быть либо больше «б», либо меньше «м», либо остаться таким же, как в первый день «а». И так далее. Такая, формализация позволяет определить вероятность либо увеличения числа зараженных, либо их уменьшения в пределах заданного временного интервала. Таким путем рассчитывается индивидуальность конкретного очага, при учете всех значимых признаков схожести между отдельными очагами.

Графическая основа для расчета марковской модели Russia 13042020
Графическая основа для расчета марковской модели Russia 13042020
© Валентин Сгибнев

Анализ вероятностей повышения и снижения числа заболевших для России показывает, что для последних сорока дней наблюдений вероятность перехода числа «мало» зараженных к «больше» зараженным составляет примерно 65%. Снизить вероятность такого роста можно, например, рядом административных решений, как введением режимов самоизоляции, карантина и т. д. Немцы и австрийцы использовали им доступный арсенал таких мероприятий и смогли снизить вероятность реализации рассчитанной математической модели экспоненциального роста числа заболевших. Переход от «много» к «еще больше» в Российской Федерации составил, однако, около 80%. Последнее замечание поддерживает правильность выбранной модели развития роста больных в России на уровне 99% в ближайшее время. Описанная выше стохастическая модель, в основе которой лежит гауссова или вещественная функция, получает катастрофическую возможность для «самореализации». Дискуссия о том, какие организационные меры должны быть приняты, чтобы купировать такой подъем числа заболевающих в условиях наблюдаемого зачастую отсутствия инстинкта самосохранения у значительной части населения, лежит вне рамок предложенной работы.

Основной вывод — вероятность роста числа зараженных на данном этапе развития эпидемических очагов в России подавляюще выше, чем минимально желаемая вероятность их сокращения. Результаты стохастического прогнозирования позволяют полагать также, что и другие страны Европы и других континентов, как США, Великобритания, Бельгия и Турция и ряд других, упустившие момент эффективного детерминистического вмешательства в процесс возможной самореализации гипотетического стохастического сценария, стоят перед такой же убийственной в прямом смысле этого слова проблемой.