При перепечатке материалов просим публиковать ссылку на портал Finversia.ru с указанием гиперссылки.
Статистика.
Пока я продолжаю наблюдение за коронавирусом в Китае, борьба с которым, к моему сожалению, никак не сломит тренд по увеличению заболевших, я решил немного освежить в памяти у своих подписчиков школьный курс математики и физики, чтобы более наглядно продемонстрировать, в чём же я вижу опасность, и когда её можно будет считать взятой под контроль, а когда идущей на спад.
На графиках, которые я публикую вы видите две регрессии. Одна экспоненциальная – и её я считаю, как показатель «условно» свободного распространения вируса, а вторая линейная.
Линейная функция позволяет мне легко визуализировать скорость нарастания заболевших.
Когда мы с вами пишем уравнение линейной функции в виде y=k*x+b, то с точки зрения физики коэффициент — k - это скорость, или количество больных заболевших за один день. Но проблема в том, что если считать количество заболевших от дня к дню, то показатель не будет статистически значимым. Поэтому проще прибегнуть к методу, когда мы берем несколько точек, и с помощью специального метода наименьших квадратов ищем такую прямую линию и определяем значения k и b в уравнении, при которых отклонение всех точек от неё будет минимальным. Чем больше будет точек, тем более статистически значимым будет результат. Есть ещё в регрессиях такой коэффициент R^2 – он показывает достоверность или, лучше сказать, соответствие регрессии той последовательности точек, за которой мы наблюдаем. Если он равен 1 – то значит мы имеем 100% соответствие. В большинстве случаев для социальных сфер, функция регрессии считается достоверной, если коэффициент больше 0.7. Для наблюдаемых мной точек на текущий момент он равен 0.96, что можно считать очень высоким уровнем достоверности.
Таким образом, если посмотреть как менялись значение линейных регрессий с поступлением новых данных, можно проследить как менялся у них коэффициент k в уравнение y=k*x+b. Его рост нам будет говорить о нарастании скорости заболевших с каждым днём, а его падение об уменьшении прироста, что будет явно позитивными новостями. С физической точки зрения, мы измеряем изменение скорости или ускорение.
На втором графике представлены три линии:
Голубая – это коэффициенты k регрессий, посчитанные по 5 точкам
Зелёная – это коэффициенты k регрессий, посчитанные по 10 точкам
Красная – это коэффициенты k регрессий, посчитанные по методу накопления. То есть начиналось с расчёта 5, дальше бралось 6, потом 7 и т.д.
Все эти графики нам показывают, что наблюдается постоянное увеличение числа заболевших за один день.
Стоит добавить еще расчёт по 15 точкам, но пока он просто будет не информативен, хотя и будет самым важным❗️
Почему?
Инкубационный период вируса 14 дней, значит если коэффициент «к» перестанет расти на 15 дневных регрессиях, то можно сказать, что ситуацию удалось взять под контроль, когда же он начнёт падать, то можно будет считать о эффективной борьбе с ним. Эффективность борьбы будет хорошо демонстрировать красный график, как подтверждение устойчивости результатов борьбы. А синий и зелёный будут своего рода опережающими, которые могут подавать сигналы возможных изменений тенденций.
Вот такой вот «технический анализ» коронавируса.
Информация по статистике здесь: https://bnonews.com/…/2020/02/the-latest-coronavirus-cases/… (смотреть через Tor)
Профиль автора в соцсети: https://www.facebook.com/alexey.bacherov
обсуждение