單細胞基因組學(xué),表觀基因組學(xué),轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)研究揭示出了即使是在同一組織中遺傳相同的細胞之間,基因和蛋白質(zhì)表達依然存在差異。但是來自美國Parker癌癥免疫療法研究所的生物學(xué)家Pier Federico Gherardini指出,目前大多數(shù)此類研究只檢查了每個細胞的單層信息,這可能會產(chǎn)生偏差?!澳悴荒苤粶y量RNA,就由此推測蛋白質(zhì)看起來都一樣?!?br>
現(xiàn)階段,科學(xué)家們已經(jīng)開始以單細胞分辨率組合多層信息。這些“多組學(xué)”技術(shù)可以更仔細地觀察細胞之間的可變性,更清楚地識別特定細胞及其功能。分析基因組DNA揭示了單細胞基因組,甲基化組織或染色質(zhì),而分析RNA和蛋白質(zhì)則能分別產(chǎn)生轉(zhuǎn)錄組和蛋白質(zhì)組數(shù)據(jù)。
“多組學(xué)比單一層的組學(xué)分析更強大,”英國Sanger研究所的分子生物學(xué)家Lia Chappell說,“這樣才能開始解開所有異質(zhì)性的真正含義,能夠深入挖掘生物機制?!?br>
維也納CeMM分子醫(yī)學(xué)研究中心的基因組研究員Christoph Bock認(rèn)為,單細胞多組學(xué)特別適用于檢查發(fā)生快速變化的細胞,如活化的免疫細胞,或非常異質(zhì)組織中的細胞,包括腫瘤。
這種方法還可以識別在大量群體中被掩蓋的罕見但具有生物學(xué)重要性的細胞。 Chappell說:“一個典型的例子是那些抗藥性低的細胞,在群體研究中我們無法找到它們,因為他們被上千倍更多的細胞淹沒了?!?br>
然而,單細胞多組學(xué)研究并不容易。目前對于任何單細胞多組學(xué)技術(shù),還沒有可用的商業(yè)試劑盒,并且許多技術(shù)還存在限制。研究人員必須修改現(xiàn)有的單細胞方案,使其與多種類型的分子兼容,并且要非常小心地將樣品的損失或污染降至zui低。
基因組和轉(zhuǎn)錄組
同時對來自相同細胞的DNA和RNA進行測序可以揭示單個細胞之間的基因組變異,解釋其轉(zhuǎn)錄水平的變化。這樣做還可以更準(zhǔn)確地檢測DNA突變。
DR-seq(DNA-mRNA sequencing)這種測序方法發(fā)表于Nature Biotechnology[1],通過裂解單細胞,并同時擴增裂解物中的DNA和RNA。然后將裂解物分成兩半,一個用于RNA測序(RNA-seq),另一個用于基因組測序。這樣在擴增過程中將DNA和RNA保持在一起,可以zui大限度地減少核酸的損失,但可能會導(dǎo)致潛在的交叉污染。
G&T-seq(genome and transcriptome sequencing)則是另外一種重要方法[2],早在2015年生物通就報道過這種技術(shù)(Nature Methods發(fā)布重磅測序技術(shù):基因組和轉(zhuǎn)錄組平行測序),研究人員當(dāng)時用G&T-seq對220個小鼠和人類細胞進行測序,獲得了空前詳細的信息。
具體來說,這種技術(shù)就是利用涂有結(jié)合mRNA的短寡核苷酸序列的磁珠,物理性地從完全裂解的細胞中分離mRNA和DNA。然后將DNA和mRNA分別擴增和測序。這樣讓保持mRNA和DNA分離,允許研究人員使用他們選擇的方案分析每種分子,但這可能導(dǎo)致核酸的損失。 目前G&T-seq已實現(xiàn)自動化,通量相對較高。
表觀基因組和轉(zhuǎn)錄組
分析細胞表觀基因組和轉(zhuǎn)錄組的技術(shù)可以揭示甲基化和染色質(zhì)可接近性(chromatin accessibility,生物通注)對基因表達的調(diào)控作用。
“在腫瘤發(fā)生等復(fù)雜的生物過程中,異質(zhì)性同時存在于基因組,表觀基因組和轉(zhuǎn)錄組中,單獨分析它們可能不起作用,”北京大學(xué)分子生物學(xué)家湯富酬教授說。基因相同的腫瘤細胞可能具有不同的DNA甲基化或基因表達模式,可能需要多組學(xué)技術(shù)才能明確地將它們分類為亞群。
scM&T-seq(simultaneous single-cell methylome and transcriptome sequencing)能同時完成單細胞甲基化組和轉(zhuǎn)錄組測序分析[3],這種方法基于G&T-seq,采用相同的方法從單個細胞中分離DNA和RNA,并擴增和測序RNA。對基因組DNA進行亞硫酸氫鹽處理,將未甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶,然后擴增并測序以測定甲基化組。
研發(fā)技術(shù)人員表示,“這一新的實驗方案讓你可以并行分析同一單細胞中的DNA甲基化和RNA。我們的方法提供了有關(guān)單細胞DNA甲基化異質(zhì)性與特定基因表達差異之間關(guān)系的shou個直觀視圖?!保∟ature Methods:突破性單細胞表觀基因組與轉(zhuǎn)錄組分析新技術(shù))
scNMT-seq(single-cell nucleosome, methylation, and transcription sequencing)則是在scM和T-seq基礎(chǔ)上發(fā)展起來的[4],不過這種技術(shù)需要將單細胞分離出來,進行處理,檢測全基因組染色質(zhì)可接近性。不同基因組位置的可接近性,或者保護性會影響基因表達,使用scNMT-seq可以發(fā)現(xiàn)小鼠胚胎干細胞中表觀基因組和轉(zhuǎn)錄組之間的新關(guān)聯(lián)。
scMT-seq(another method of simultaneously sequencing single cells’ methylomes and transcriptomes)是同時測序單細胞的甲基化組和轉(zhuǎn)錄組的另一種方法[5],這種是加州大學(xué)范國平教授和同濟大學(xué)薛志剛教授研發(fā)的,他們利用這種方法對感覺神經(jīng)元進行研究,揭示了細胞間的轉(zhuǎn)錄組和甲基化組異質(zhì)性。不過,這些差異大多不是啟動子甲基化造成的。舉例來說,啟動子帶CpG島的基因,表達水平與基因體甲基化正相關(guān)。這項研究表明,scMT-seq可以用來檢測單細胞中的轉(zhuǎn)錄組、甲基化組和單核苷酸多態(tài)性信息,進而解析表觀遺傳學(xué)基因調(diào)控機制。(同濟大學(xué)發(fā)布單細胞測序新技術(shù))
scTrio-seq(single-cell triple omics sequencing是一種單細胞三重組學(xué)測序方法[6],由北京大學(xué)湯富酬教授等人研發(fā),這種全新的單細胞三重組學(xué)測序方法在國際上首次從同一個單細胞中實現(xiàn)對三種組學(xué)高通量測序信息的同時獲取,并從單細胞水平發(fā)現(xiàn)肝癌細胞在三種組學(xué)上存在密切相互關(guān)聯(lián)的高度異質(zhì)性。
scTrio-seq選擇性裂解細胞膜,將細胞質(zhì)中的mRNA與完整細胞核中的基因組DNA分開。對于scMT-seq,實驗人員是利用微量移液管收集細胞核,而在scTrio-seq中,則是通過離心分離細胞核。兩種情況中,基因組DNA都是進行的改良亞硫酸鹽處理和測序方法來檢測甲基化組,而來自細胞裂解物的mRNA則是平行擴增和測序。
“基本上在基因組和轉(zhuǎn)錄組數(shù)據(jù)之間沒有交叉污染,”湯教授表示。scTrio-seq使用甲基化組序列數(shù)據(jù)計算評估基因組拷貝數(shù)變異,這種技術(shù)已用于分析人結(jié)直腸癌樣本中的異質(zhì)性。
蛋白質(zhì)組和轉(zhuǎn)錄組
還有幾種技術(shù)可以同時測定來自單個細胞的轉(zhuǎn)錄物和蛋白質(zhì)。這些方法為科學(xué)家提供了轉(zhuǎn)錄后的研究,分析導(dǎo)致蛋白質(zhì)和轉(zhuǎn)錄水平之間的差異。
PLAYR(proximity ligation assay for RNA)技術(shù)中,蛋白質(zhì)被不同金屬同位素的抗體標(biāo)記。同時,RNA轉(zhuǎn)錄物被同位素標(biāo)記的探針結(jié)合。利用一種稱為質(zhì)譜流式細胞技術(shù)(mass cytometry)的方法測量同位素,并且這種技術(shù)也可以同時檢測每秒數(shù)千個單細胞中的40多種不同的mRNA和蛋白質(zhì)。
CITE-seq(cellular indexing of transcriptomes and epitopes by sequencing)采用寡核苷酸標(biāo)記的抗體靶向細胞表面蛋白。這種技術(shù)分離并裂解單個細胞,并將它們的mRNA和寡標(biāo)記抗體與涂有短寡核苷酸序列的磁珠結(jié)合。擴增RNA和抗體標(biāo)簽并按大小分離,通過測序定量分析蛋白質(zhì)和轉(zhuǎn)錄物。CITE-seq還可同時檢測約100種蛋白質(zhì)以及數(shù)萬種RNA轉(zhuǎn)錄物。
Marlon Stoeckius是紐約基因組中心的分子生物學(xué)家,他是這項技術(shù)的研發(fā)者。目前Stoeckius正致力于將該方法擴展到細胞內(nèi)蛋白質(zhì),不過這需要固定和透化細胞,這可能會降低RNA質(zhì)量或?qū)е缕鋸募毎袧B出。
REAP-seq(RNA expression and protein sequencing assay)類似于CITE-seq,采用寡核苷酸交聯(lián)抗體來檢測細胞蛋白質(zhì)和轉(zhuǎn)錄物水平(基于測序)。
REAP-seq和CITE-seq都可以檢測很多的轉(zhuǎn)錄本,但與PLAYR相比,每次檢測的細胞數(shù)量更少。
“我認(rèn)為它們是互補的方法,”PLAYR的首席開發(fā)人員Gherardini說,“如果你有一個大的隊列或臨床研究,像PLAYR這樣的東西會更加經(jīng)濟有效”。
CITE-seq還有一個優(yōu)點就是蛋白質(zhì)定量可以在通常單細胞RNA測序制備中丟棄的部分進行,因此“對RNA測序文庫的質(zhì)量沒有任何損害,”紐約基因組中心的Peter Smibert說,“我們認(rèn)為如果采用RNA-seq作為讀數(shù),那么就可以使用CITE-seq?!?br>
如何做出選擇
有了這么多種的檢測方法可供選擇,研究人員還需要根據(jù)他們提出的生物學(xué)問題,特定技術(shù)的成本,勞動密集程度和技術(shù)要求來決定使用哪些檢測方法。
“通常這需要技術(shù)專家團隊,計算人員和了解實驗系統(tǒng)的生物學(xué)家合作才能很好地完成這些類型項目的研究,”Bock說。
如何制定技術(shù)方案,選擇方法取決于很多因素,各種技術(shù)的實驗指南存在的一大差異是如何從組織中分離單個細胞,口腔移液和連續(xù)稀釋是相對快速,簡便和低成本的方法,可以zui大限度地降低RNA或蛋白質(zhì)降解的風(fēng)險,但它們通量也相對較低。FACS,機器人操作和微流體是高通量的,但它們很昂貴并且可能在細胞分離上沒有那么精細。
成本是另一個因素?;谥改虾驮噭┑捏w積(例如酶和抗體),上述這些技術(shù)的價格每個樣品從幾美元到幾百美元不等(這不包括測序的成本,當(dāng)然測序也可能是限制性的問題)。 “沒有多少科學(xué)家能夠從單個細胞中測序十萬個單基因組,”Chappell說。
對于一批樣品,單細胞多組學(xué)測定可以需要花費超過24小時到近一周的時間,其中涉及手動將細胞核與細胞質(zhì)分離的方法往往較慢,且勞動強度較大,而基于FACS的方法更方便,通量更高。
生物信息學(xué)專業(yè)知識是一個優(yōu)勢。 Stoeckius說:“對于所有的這些分析,你需要一點計算機背景和一些R經(jīng)驗,”這是一種用于統(tǒng)計計算和數(shù)據(jù)分析的編程語言和軟件環(huán)境。
不過這種情況也可能很快就會改變,因為越來越多的人開始使用這種分析,一些公司開發(fā)了易于使用的軟件來分析單細胞多組學(xué)數(shù)據(jù)。目前,諸如SEURAT和MOFA之類的計算軟件包可以集成來自兩個或多個組學(xué)層的數(shù)據(jù)。
隨著單細胞單組學(xué)技術(shù)變得更加靈敏,準(zhǔn)確和高通量,相應(yīng)的多組學(xué)技術(shù)也可能得到改善。研究人員還致力于將單細胞技術(shù)與其它數(shù)據(jù)層相結(jié)合,例如空間信息(如CODEX)和功能分析。將細胞的空間信息鏈接到其他組學(xué)層可以幫助研究人員在組織內(nèi)映射不同的細胞類型和功能。
zui終的目標(biāo)還是從單個細胞中捕獲所有分子的信息——一種“全方位”的信息,但這仍然需要幾年時間。目前,單細胞多組學(xué)正在改變科學(xué)家處理分子生物學(xué)的方式。