中國網/中國成長門戶網訊 在20世紀中葉,研討者在物理學和化學之實際與試驗技巧的推進下,勝利解析了卵白質的空間構造并提出了DNA雙螺旋模子;分子生物學在此基本上出生,進而開啟了在分子程度上研討性命及其運動的古代性命迷信時期。性命迷信樹立在復原論的基本之上,即生物體與非性命物體沒有實質的差別,都要遵守嚴厲的物理學和化學的紀律,可以在分子層面上經由過程對個體基因或卵白質的構造與效能來熟悉和說明細胞甚至個別的性命運動。這個時代的研討者采用“碎片化”的形式來研討性命及其心理或病理運動。
可是,研討者逐步熟悉到,性命運動并非是由一個個基因或卵白質“零件”自力完成的,而是樹立在性命體內浩繁基因、卵白質和其他化學小分子構成的復雜彼此感化之上;對于高級生物而言,除了分子層面復雜的彼此感化收集外,還有著細胞、組織和器官等分歧介不雅層面各類組分之間的彼此感化。是以,性命運動是如許一種復雜體系的全體行動。顯然,要真正揭開性命的奧妙,需求從全體角度來研討性命復雜體系的各類彼此感化收集,以及響應的心理病理運動。跟著20世紀末基因組測序技巧和其他研討技巧的成長,國際迷信界啟動了跨世紀的“人類基因組打算”。在這個國際年夜迷信打算的推進下,性命迷信的研討范式慢慢從部分研討戰略改變到全體研討戰略,正如Nature雜志在一篇評論該打算的社論中所說:“似乎在一夜之間就從一個基因、一個卵白質、一個分子、一次研討一個,改變為一切基因、一切卵白質、一切分子、一次研討一切。一切都按組學的範圍停止。”
分子層面的多組學研討
20世紀中葉鼓起的古代性命迷信研討表示出典範的“個別戶”特征,即以浩繁項目擔任人(PI)引導的小範圍試驗室為研討主體,可以稱為“小迷信”形式。跟著世紀之交“人類基因組打算”的啟動,性命迷信範疇呈現了全新的年夜迷信研討形狀。由多個科研團隊組織起來,針對某一詳細研討目的配合展開研討的“結合體”(consortium)曾經成為性命迷信範疇的常態,如:研討精力決裂癥的國際“精力病基因組學結合體”(Psychiatric Genomics Consortium),以及美國國立衛生研討院(NIH)組建的“國際十萬人隊列結合體”(International Hundred Thousand Plus Cohort Consortium)——觸及43個國度100多小我群隊列的研討。可是,性命年夜迷信并不只僅表示為研討步隊的範圍年夜,還有其他值得追蹤關心的特征——在此筆者側重會商以下兩個方面。
數據驅動的研討新范式
樹立在分子生物學基本上的古代性命迷信之主流是假定驅動的研討范式:凡是以處理詳細的迷信題目為重要目的,采用生物學試驗往剖析和驗證針對特定迷信題目的相干迷信假定。
但是,“人類基因組打算”等性命年夜迷信研討卻不是迷信假定所驅動,表示出一種數據驅動的研討新范式,其重要目的是往獲取海量的生物學數據。自“人類基因組打算”實行以來,不只有針對各類生物年夜分子的組學研討,如研討RNA表達譜的轉錄組學、研討卵白質構成和豐度的卵白質組學,並且還衍生出很多相干的組學研討,如研討DNA或RNA潤飾的表不雅遺傳組學、研討卵白質翻譯后潤飾的卵白質潤飾組學。此外,還發生了針對糖類分子的糖組學、針對脂類分子的脂組學、針對代謝物等生物小分子的代謝組學。可以說,基于數據驅動的組學研討戰略曾經被普遍地用于分子條理的各類類型的生物分子研討,其特色就是全局性的高通量數據采集與剖析。例如,2022年Science雜志頒發了一項觸及英國12000多名癌癥患者的全基因組測序任務,研討者從中發明了近3億個單堿基置換(substitutions)、260多萬個雙堿基置換(double substitutions)、1.5億多個拔出或缺掉(indels)和近200萬個重排(rearrangements)。
更主要的是,這些性命迷信年夜數據剖析可以或許供給曩昔生物學小數據所不克不及供給的信息。例如,研討者經由過程對27萬名歐洲血緣介入者的全外顯子組序列數據剖析,發明了很多罕見疾病的罕有基因變異。2024年Nature雜志頒發了一篇今朝世界上最年夜的人類全基因組等位基因頻率的數據庫(Genome Aggregation Database)的剖析文章,研討者從76156個別的全基因組測序數據中提掏出各類基因變異,進而構建了用來懷抱天然選擇對人類基因組各個區域產生漸變的限制水平之“變異受限圖譜”(genomic mutational constraint map)。
由于數據驅動的項目之研討目的和內在的事務不依靠于單一的迷信假定或迷信題目,所以其研討數據可以用來停止浩繁迷信題目的研討。這一特色在安康醫學範疇有著凸起的表示,最勝利的案例是英國的UK Biobank——該生物銀行搜集了50萬名中老年英國志愿者的血液和唾液等生物學樣本,以及電子安康檔案和全外顯子測序等生物學數據。自2012年建成至今,全球來自90多個國度的3萬多名注冊用戶應用了該數據庫,并基于這些數據頒發了9000多篇與安康和疾病相干的研討論文。UK Biobank于2023年11月30日正式宣布完成了這50萬名志愿者的全基因組測序,經批準的研討者可以在“UK Biobank Research Analysis Platform”上拜訪這些數據。UK Biobank的數據量估計在2025年將到達40 PB。在UK Biobank勝利的基本上,英國又在2022年10月啟動了一個更巨大的研討項目——“我們將來的安康”(Our Future Health)。該項目打算招募500萬名英國志愿者,以獲取他們的生物學樣本和安康信息及生物學數據;盼望經由過程該項目標實行為抗擊疾病的“關隘前移”供給迷信領導和技巧支撐,并借此推進安康新業態、新財產的成長。中國迷信院2020年啟動的計謀性先導科技專項(B類)“多維年夜數據驅包養動的中國人群精準安康研討”也異樣屬于數據驅動的性命安康年夜迷信研討項目;該專項打算在5年時光內停止年夜範圍人群生物學樣本和響應的多組學數據的采集和剖析,進而基于這些數據展開中國人群性命安康方面的各類研討。
生物學年夜數據今朝曾經成為性命迷信研討的主要計謀資本。在國度數據局等部分最新結合發布的《“數據要素×”三年舉動打算(2024—2026年)》中,第9條明白提出,“增進嚴重科技基本舉措措施、科技嚴重項目等發生的各類迷信數據互聯互通,支撐和培養具有國際影響力的科包養學數據庫扶植,依托國度迷信數據中間等平臺強化高東西的品質迷信數據資本扶植和場景利用。以迷信數據助力前沿研討,面向基本學科,供給高東西的品質迷信數據資本與常識辦事,驅動迷信立異發明。……摸索科研新范式,充足依托各類數據庫與常識庫,推動跨學科、跨範疇協同立異,以數據驅動發明新紀律,發明新常識,加快迷信研討范式變更”。由此可見,中國迷信院在2019年啟動的“國度生物信息中間”扶植顯然就是國度迷信數據計謀的一個主要構成部門。
迭代演進的研討新形式
數據驅動的性命年夜迷信研討新范式的另一個主要特色是“迭代”(iterate),即組學研討的結果凡是不是完整的,其每一次組學研討任務相似于盤算機軟件開闢——研討者可以在舊版軟件的基本上不斷地迭代出新版本,組學數據或研討結果可以不竭被完美。“人類基因組打算”就是性命組學“迭代”的典範:2001年2月,Nature雜志頒發了人類基因組測序“草圖”,它僅僅籠罩了人類基因組90%核酸序列;在2003年“人類基因組打算”正式宣布完成后,2004年10月在Nature雜志頒發的論文也只給出了人類基因組常染色質區域內年夜約99%核酸測序成果;2022年4月,研討者在時隔基因組草圖頒發22年之后于Science雜志頒發了“人類基因組完全序列”——終于完成了人類全基因組30億個堿基對的測定,比2004年頒發的基因組測序版本增添了近2億個堿基對和近2000個新基因。
需求指出的是,“人類基因組打算”是一個目的明白的年夜迷信打算——測定人體基因組所有的堿基序列,其目的的完成情形在一次次迭代中可以停止正確的評價。可是,對于檢測基因組基因表達情形的“轉錄組學”和卵白質品種與多少數字的“卵白質組學”等其他類型的組學研討則很難依照基因組研討的方法停止,由於這些生物年夜分子在機體內的總數很難斷定。例如,一個卵白質組的一切卵白質品種不只與其基因組的基因總數及mRNA的可變剪切有關,並且還與卵白質翻譯后潤飾有關。人類基因組內的基因多少數字估量在2萬個擺佈,但卵白質品種估量在20萬到200萬之間。2014年5月,2篇人類卵白質組草圖的文章在Nature雜志上頒發;此中,一篇采用質譜技巧檢測到了來自17294個編碼基因的卵白質類型,另一篇異樣應用質譜技巧檢測到了18097個基因編碼的卵白質。顯然,這些卵白質組草圖離完全地反應人類卵白質品種還差得很遠。
更具挑釁性的是,在多細胞生物體中,轉錄組或卵白質組的組成分歧于基因組的組成。后者在個別的一切細胞里基因組堿基序列基礎是分歧的和穩固的,而前者在分歧品種的細胞里有著分歧的構成類型和豐度,並且在分歧發育階段和分歧保存周遭的狀況下不斷地變更。不久前,我國迷信家啟動了一個國際年夜迷信打算——“人體卵白質組導航打算”(Proteomic Navigator of the Human Body,π-HuB);該打算為期30年(2023—2052年),將在首個10年完成對人體近40萬億細胞的卵白質組圖譜,以及與生涯方法相干的卵白質組圖譜的體系繪制息爭析。可以如許說,即便到2052年之后,人類卵白質組研討仍然處于“迭代”經過歷程中;正如π-HuB打算首席迷信家賀福初所說:“π是一個無限無盡的數,而迷信是‘無盡的前沿’,我們盼望經由過程‘π’致敬對迷信的無窮尋求。”
介不雅層面的多組學研討
細胞是生物體的基礎構造單位和效能單位。對于多細胞生物而言,個別是由多少數字浩繁的、分歧品種的細胞組成——單個受精卵細胞在發育經過歷程中經由過程細胞增殖方法增添細胞的多少數字,并應用細胞分化的方法構成分歧的細胞類型,進而發育成為各類組織和器官。傳統的細胞分類重要是根據細胞形狀、空間地位和心理性質等表型特征。據此研討者猜測,構成人體的近40萬億個細胞能夠由200—300種細胞類型所組成。
跟著單細胞核酸測序技巧的成熟,國際性命迷信範疇啟動了一個比“人類基因組打算”更為巨大的年夜迷信研討打算——“人類細胞圖譜”(Human Cell Atlas,HCA)。該打算今朝有近100個國度約3000名迷信家介入,其總體目的是“采用特定的分子表達譜來斷定人體的一切細胞類型,并將此類信息與經典的細胞空間地位和形狀的描寫銜接起來”。從此,單細胞組學成為性命迷信一個新的前沿範疇:從個別發育到腫瘤產生/成長等各類心理或病理運動的研討中都能看到大批基于單細胞組學的研討任務,研討者的視野從分子層面進進到細胞層面甚至組織器官層面。2024年1月22日,Nature雜志發布了2024年值得追蹤關心的七年夜技巧,此中就包含了細胞圖譜。
時空交匯的細胞圖譜研討
細胞圖譜的研討最後是基于單細胞轉錄組測序技巧。浙江年夜學的研討者于2018年在Cell雜志上頒發了全球首個哺乳植物細胞圖譜,觸及小鼠近50種組織的40余萬個細胞;2020年,該研討團隊在Nature雜志報道了他們的另一項任務——應用高通量單細胞轉錄組測序技巧構建了人體細胞圖譜,從胎兒和成人的8個重要器官的60種組織中判定出100余種細胞年夜類和800余種細胞亞類。
固然“人類細胞圖譜”以後最常用的單細胞研討技巧是轉錄組測序,可是在分子程度對細胞停止分類的丈量技巧顯然不會局限于此:“這種分子標志物的聚集還將包含非編碼基因的表達程度、轉錄本可變剪接的程度,每個啟動子和加強子的染色質狀況,以及每個卵白質表達程度和它們的每一種翻譯后潤飾狀況等”。為此,研討者成長了一系列可用于單細胞研討的組學技巧。例如,北京年夜學研討者成長了一種組學程度的單細胞染色質測序包養網價錢技巧(single-cell chromatin overall omic-scale landscape sequencing),可以對1個單細胞同時停止染色質狀況、DNA甲基化、基因組拷貝數變異及染色體倍性的全基因組測序技巧。由于卵白質構成的復雜性和不成報酬擴增性,單細胞卵白質組研討一向是該範疇的技巧難點。2023年,國際卵白質組學威望及其一起配合者頒發了一篇關于單細胞卵白質組研討技巧的文章,為處理該困難供給了能夠的處理計劃。
跟著單細胞測序技巧的提高,組學研討進進了更年夜的介不雅條理——組織甚至器官。研討者成長了把記憶技巧和單細胞轉錄組測序聯合在一路的“空間轉錄組學”(spatial transcriptomics)。瑞典研討者包養應用這種技巧檢測了人體胚胎心臟發育經過歷程中分歧時光點的組織切片,構建了首個具有單細胞空間辨別率的人體心臟發育圖譜。近年來,研討者進一個步驟成長了多種技巧整合的“空間組學”(spatial omics)。例如,美國耶魯年夜學研討者成長的一種空間組學技巧“DBiT-seq”,可以同時完成組織切片的空間轉錄組測序和卵白質組檢測。此外,深圳華年夜性命迷信研討院牽頭的時空組學同盟(The Spatio Temporal Omics Consortium)將“DNA納米球陣列”(DNA nanoball-patterned arrays)與“原位RNA捕捉”包養(in situ RNA capture)整合構成一種新的“Stereo-seq”技巧,其辨別率可達500 nm,視野可達13 cm×13 cm;研討者應用該技巧取得了單細胞辨別率程度小鼠器官構成的時空轉錄圖譜。2023年,一篇題為“空間組學的曙光”的綜述文章具體地先容了用于空間組學的各類技巧,以及這些技巧之間的組合與應用。
空間組學技巧今朝曾經用于解析復雜的腦組織。例如,2023韶華年夜性命迷信研討院結合中國迷信院神經迷信研討所等單元在Cell雜志上發布了迄今為止最完全的靈長類腦皮層細胞圖譜——研討者應用其成長的“Stereo-seq”技巧及高通量單細胞核轉錄組測序技巧等,對獼猴年夜腦皮層的143個腦區停止了空間轉錄組研討,取得了基于特定轉錄組形式的264種皮層細胞類型。2023年10月13日,Science雜志頒發了題為“腦細胞普查”(Brain cell census)的專輯,一共21篇關于人類和非人靈長類植物年夜腦細胞圖譜的研討論文同時在該雜志及其子刊頒發。可以說,以後空間組學技巧正在為人們熟悉性命的復雜構造和心理病理運動供給著史無前例的高精度圖像和信息。
整合視野下的性命組學
超出了分子條理和細胞條理的空間組學不只供給了組織器官構造的精緻信息,並且為熟悉生物體全體演變和調控紀律首創了新途徑。美國NIH于2019年啟動了一個名為“人類生物分子圖譜打算”(Human Biomolecular Atlas Program,HuBMAP),旨在開闢在細胞辨別率程度繪制人體組織器官圖譜的開放式框架和技巧,其焦點就是要樹立一個涵蓋分歧標準的人體整合組織圖譜。Nature雜志在2023年發布了一個先容了HuBMAP停頓的論文集(go.nature.com/3vbznk7)。2023年,我國中山年夜學研討者和英國劍橋年夜學研討者牽頭的國際一起配合團隊在Nature雜志頒發了一篇關于肢體發育的文章,研討者基于空間轉錄組技巧構建了人胚胎肢體發育經過歷程中的細胞圖譜;不只斷定了構成胚胎期肢體的67個特定細胞簇,並且還提醒出分歧時空的基因表達若何調控了準確的細胞逝世亡,從而包管了肢體的對的外形之完成。
細胞圖譜研討戰略打破了傳統的復原論研討范式——將高條理的性命運動“復原”到分子條理停止研討息爭釋,提倡從全體的角度研討和懂得性命。2024年,美國洛克菲勒年夜學的研討者在Science雜志上頒發了一篇從“超細胞標準”(supracellular)來研討形狀產生的論文;研討者以雞胚胎的皮膚作為研討模子,體系地剖析了形狀因子(morphogen)對分歧空間地位細胞的物感性質之影響,并明白指出“懂得這一多標準經過歷程需求區分細胞標準上形狀構成的近端效應和超細胞標準上形狀構成的效能效應”。2024年,我國研討者報道了一種單細胞程度的轉錄因子時序熒光原位雜交技巧(TF-seqFISH),研討者應用該技巧解析了各類轉錄因子在人脊髓發育經過歷程中的空間表達紀律,進而提醒了分歧的神經祖細胞亞型沿背腹軸的空間分布形式,以及在表裡軸標的目的長進行的神經產生、分化、遷徙及成熟等經過歷程。
這種研討范式的改變不只產生在正常的心理經過歷程研討,並且也被用于病理經過歷程的研討。美國國立腫瘤研討所(NCI)于2020年啟動了一個名為“人類腫瘤圖譜收集”(The Human Tumor Atlas Network)的年夜迷信研討項目,打算從分子、細胞、組織器官等分歧條理獲取各類類型腫瘤的數據,并與腫瘤患者的臨床數據停止整合,從而構成多標準的腫瘤圖譜,為腫瘤患者和高危人群停止更好的醫學干涉供給迷信根據。2023年,芬蘭研討者在一篇論文中報道了應用單細胞轉錄組測序和CRISPR基因編纂技巧等方式對人體免疫體系里的“天然殺傷”(NK)細胞與血液癌細胞的彼此感化之研討,提醒出分歧血液癌細胞對NK細胞的敏理性存在明顯差別,並且分歧的癌細胞會惹起NK細胞產生分歧的轉錄組變更。
我國在整合型性命年夜迷信研討標的目的最具代表性的是由復旦年夜學研討團隊牽頭的人類表型組國際年夜迷信打算——“國際人類表型組打算”(Human Phenome Project)。該打算在2017年立項,現已進進項目實行的“二期”階段,其焦點目的是對人體從分子層面到細胞層面、組織器官層面甚至個別層面臨各類人體特征停止緊密丈量和剖析。今朝,該打算曾經獲得了4個“全球第一”,包含:研發了“中華家系1號”——全球第一套多組學尺度物資;樹立了國際上首個天然人群深度表型組隊列——每個介入者被丈量了近2.5萬個表型;繪制了第1張人類表型組導航圖;建成第1個多維度的人類表型組緊密丈量平臺。中國迷信家與美國和歐洲多國迷信家構成了國際人類表型組研討協作組(International Human Phenome Consortium),打算終極將在全球各年夜洲代表性人群中停止5萬人、每人10萬個以上表型目標的全景丈量和跨越50萬人的特定表型利用示范丈量。
綜上所述,以“人類基因組打算”為代表的性命年夜迷信之鼓起正在轉變著性命安康範疇的研討“邦畿”。今朝,我國科研氣力在國際性命年夜迷信範疇總體處于“并跑”的地位,在一些研討標的目的上處于“領跑”的地位。為了更好地推動我國性命年夜迷信的成長,需求留意加大力度3個方面的任務:進一個步驟加大力度和完美有組織的科研之治理機制體系體例。這類性命組學研討凡是都觸及多個試驗室甚至多個研討單元的介入,國際一起配合項目還要觸及分歧國度的科研氣力;需求施展好牽頭單元的組織氣力,在課題治理和資本分派及結果共享方面要賜與響應的保證。樹立或完美相干的範圍化組學研討技巧平臺。這些集中了大批進步前輩儀器裝備和技巧的平臺是支持範圍化組學研討高效實行的基本。例如,在卵白質組研討範疇,新成立的廣州“慧眼”年夜迷信舉措措施就是支持“人體卵白質組導航打算”實行的需要前提。加大力度對性命安康迷信年夜數據的開放與共享。一方面要包管這些項目履行中發生的組學研討數據和其他相干數據的平安和倫理管理,另一方面也要落實項目表裡研討者對相干數據的共享與應用。
(作者:吳家睿,中國迷信院分子細胞迷信出色立異中間 上海路況年夜學自動安康計謀與成長研討院。《中國迷信院院刊》供稿)