來自美國華盛頓大學的一項流行病數據研究表明,“封城”令武漢的新冠肺炎疫情基本傳染數R0從2.7-4.2降到1,有效地阻斷了更大規(guī)模疫情暴發(fā)。
新冠疫情蔓延以來,R0、拐點、放平曲線,變成大家耳熟能詳的熱詞。“約翰斯·霍普金斯大學如何成為全球疫情數據網紅”“全球超100萬人感染新冠!自然雜志揭秘帝國理工如何預測疫情趨勢”“斯坦福教授聲明疫情很快終結,不必恐慌”……這樣標題的報道經常出現。
很少有一個時刻,專業(yè)化的流行病學數據研究這樣吸引大眾關注;很少有一個時期,公眾意識到準確理解數據變化對自己影響重大。流行病學數據研究項目是怎么興起的?數據是怎么產生的? 數據研究和決策如何發(fā)生互動?人民網美西記者就這些問題先后采訪了美國華盛頓大學陳迎慶教授和羅切斯特大學羅杰波教授。
數據研究顯示武漢“封城”效果顯著
在最近發(fā)表的一篇論文中,美國西雅圖華盛頓大學陳迎慶教授研究團隊,用統(tǒng)計模型分析了新冠病毒在武漢市的早期傳播情況。這個模型依據病毒傳播自然史,用每天新發(fā)病數,提出了疑似的發(fā)病前無癥狀傳染途徑。按照他們的分析,估算新冠病毒早期基本傳染數R0約為2.7-4.2。但2020年1月23日開始,武漢封城后的4-5天內,實際傳染數很快降至1,證明了“封城”策略有效阻斷更大規(guī)模的暴發(fā)。
陳迎慶教授也是美國ASA(美國統(tǒng)計協(xié)會)會士,他的研究項目更多關注于全球。在新冠疫情暴發(fā)期間,他的團隊另一項研究以肯尼亞為研究對象,采集數據研究新冠疫情對艾滋病預防的影響。他認為,在人類社會活動如此發(fā)達的今天,任何傳染病都具備了全球傳染的可能。陳教授關心的顆粒度是多元化、多層次的,可以細致到病毒本身的基因序列演化和個人行為差異,也可以涵蓋社區(qū)防疫、各國以及世界衛(wèi)生組織(WHO)的政策影響。“更重要的一點是,這些項目是動態(tài)的,會隨著時間不斷地調整項目的數據采集和分析方向。”他說。
大數據能夠對控制流行病有用,還取決于一些條件。“能夠及時、準確地采集各種數據,是有效的治療和預防的前提。”陳教授舉例說,中國的傳染病數據檢測系統(tǒng)很發(fā)達,過去也做得很成功,尤其是2009年內蒙爆發(fā)豬流感的時候,運作很有效。因為很有效,所以早期就遏制住了,也沒有引起公眾注意和恐慌。“這次COVID-19的隱匿性太強大,很多感染者前期并沒有癥狀,很容易造成檢測系統(tǒng)的錯失和被動。”他說。
始于九十年代人類基因組的研究,借助于日益提高的計算能力和算法,大大推動了利用大數據來研究人類健康和公共衛(wèi)生的發(fā)展。傳染病預防是遏制傳染病進一步傳播的關鍵,預防措施取決于對傳染病本身的了解,從而對現有手段和資源的掌握、調度和實施。所以,大數據研究往往能夠未雨綢繆。
“抗擊新冠病毒已經進行了幾個月,世界各國人民已經付出了巨大犧牲,未來可能要進行長期的艱苦努力,相信大數據研究一定會繼續(xù)積極促進科學決策,為人類文明勝利戰(zhàn)勝新冠病毒做出貢獻。”陳教授認為,這次新冠肺炎疫情災害的影響是前所未有的。道高一尺,魔高一丈。當人類的抵御手段加強,病毒的感染和致病能力也會加強。人類已經無法回到小國相鄰雞犬相聞、老死不相往來的時代。要阻斷病毒流行,需要更多的全球合作和協(xié)調,重視數據采集和共享,提高公共衛(wèi)生決策和疾病預防的反應。
大數據研究促進科學決策
美國羅切斯特大學羅杰波教授目前正在研究比對不同城市的公交系統(tǒng)對疫情蔓延的影響,比如紐約和洛杉磯,華盛頓和西雅圖。通過比對不同城市的應對,檢查公交系統(tǒng)和干預手段在疾病流行中的影響,測定預防干預效果。
羅教授指出,在數據采集方面,直接的追蹤固然是個好辦法,問卷調查也是一個好辦法。但是由于各種社會和心理因素對結果的干擾,數據需要“清洗”才能相對準確。羅教授希望采用觀察、間接、不干預的方式獲取數據,例如調查谷歌搜索中,在特定時間、特定區(qū)域查找疾病關鍵詞的頻度,了解流行病區(qū)域分布情況;在社交媒體追蹤人們情緒和關注點數據等。這是獲取更準確研究結果的一個辦法。
他介紹,學術上大數據與流行疾病傳染研究項目的興起有很多因素,根本動力來自于用大數據研究促進社會健康的公益目的,來自于對疾病預防的意義。
事實上,并沒有一個機制或者“文件”保證這些研究機構的研究數據和成果能被運用于決策。但他們的確在決策中發(fā)生了重要作用。包括人們熟悉的疫情數據,目前被引用最多的就是約翰·霍普金斯大學的疫情數據,華盛頓大學的疫情數據,以及以留學生和硅谷工程師為技術團隊的“一畝三分地”疫情數據,這些數據因為實時更新快,統(tǒng)計準確而為大家所信服。
來自美國疾病控制與預防中心CDC的一份報告顯示,正在美國流行的疫情讓全美50個州選擇隔離在家的政策。但很少為人所知,正是來自加州舊金山灣區(qū)圣塔克拉拉縣的一份獨特的早期研究報告幫助當地官員們意識到危機來臨,并制定了美國首個防疫點,也成為美國最早宣布進入緊急狀態(tài)、最早命令居家隔離、最早全州“關閉”的地方。
今年2月底,1例無武漢旅行史的新冠疫情患者在圣塔克拉拉縣發(fā)現,按照當時的政策,任何無武漢旅行史的人、或者無確認接觸過已知感染者的人不能獲得新冠病毒檢測。但這位患者令當地敏感意識到這可能已經是社區(qū)擴散的開始。
圣塔克拉拉縣衛(wèi)生局緊急上報美國CDC,聯(lián)合加州衛(wèi)生廳和CDC,一起做了小規(guī)模的流行病盯梢監(jiān)視調查。從3月4日到3月15日進行的小規(guī)模研究,印證了社區(qū)傳播的判斷。“這很重要。因為它表明,這種疾病在社區(qū)中有傳播,而且這種疾病的傳播范圍可能比以前所了解的更廣,”圣塔克拉拉縣衛(wèi)生副局長喬治?韓博士說。“正因為如此,我們能夠將這些數據作為一項數據,告知我們如何向公眾提出建議和命令。”
美國流行病數據研究機構如何運行?
陳迎慶說,通常情況下,決策機構本身不會參與大數據科研項目的日常運作,但可以請求為項目提供數據支持、模型分析和疫情預報。無論是聯(lián)邦政府還是地方政府,直接行政干預很少。有些時候,政府會用特定的招標來資助一些項目和科研網絡。不同的研究團隊,會通過各種方式來進行交流和學習。流行病數據研究的生態(tài)圈整體是有活力的,既有競爭也有合作。
流行病數據研究公開向全社會提供,政府在學界研究中尋求決策的參考和依據,實際上是長期以來形成的社會生態(tài)鏈。
而所謂國家級研究機構,比如NSF(美國國家科學基金會)、NIH(國立衛(wèi)生研究院)、CDC的研究機構等,這些“國家隊”往往并不解決尖端創(chuàng)新問題。羅杰波教授告訴記者,像NSF、NIH這些機構,內部負責管理資金、負責項目的科學家,他們的研究目標并不是攻克這個專業(yè)的頂尖問題,他們最重要的責任是始終不脫離學術界,始終保持對學術界創(chuàng)新和動態(tài)最敏感的觸覺。一旦碰到相應問題,這些機構一定要最清楚去找誰來解決。
不以營利為目的,參與政府招標項目也“非主流”,項目研究的經費從哪里來?陳迎慶教授告訴記者,項目的經費來源很多樣。在美國,美國國立衛(wèi)生研究院和疾控中心是項目最主要的經費資助機構。其他各種基金會,還有各類高校、科研機構以及商業(yè)機構,都投入大量經費支持此類研究。
對學者來說,只要把研究觸角放到新領域,致力于新研究,就會有“新錢”(新投資)。羅杰波教授解釋,創(chuàng)新的、尖端的研究和探索往往是獲得更多資金的資格。學術界回饋社會的方式,主要途徑包括發(fā)表論文,不僅僅是刊登在“核心”期刊,而是去增加全社會對問題的認識,促進社會大眾建立基于科學研究的共識。