似乎每次你轉(zhuǎn)過(guò)身,有人都在談?wù)撊斯ぶ悄芎蜋C(jī)器學(xué)習(xí)的重要性,“加州大學(xué)圣地亞哥分校醫(yī)學(xué)院和摩爾癌癥中心教授Trey Ideker博士說(shuō)?!暗羞@些系統(tǒng)都是所謂的”黑匣子“。它們可以非常具有預(yù)測(cè)性,但我們實(shí)際上并不了解它們的工作方式?!?/p>
Ideker舉了一個(gè)例子:機(jī)器學(xué)習(xí)系統(tǒng)可以分析數(shù)百萬(wàn)人的在線行為,將個(gè)人標(biāo)記為潛在的“恐怖分子”或“自殺風(fēng)險(xiǎn)”。“但我們不知道機(jī)器如何得出這個(gè)結(jié)論,”他說(shuō)。
為了使機(jī)器學(xué)習(xí)在醫(yī)療保健中變得有用和值得信賴,Ideker說(shuō),從業(yè)者需要打開(kāi)黑匣子并了解系統(tǒng)如何做出決定。
機(jī)器學(xué)習(xí)系統(tǒng)建立在人工神經(jīng)元層上,稱為神經(jīng)網(wǎng)絡(luò)。這些層通過(guò)神經(jīng)元之間看似隨機(jī)的連接而連接在一起。系統(tǒng)通過(guò)微調(diào)這些連接來(lái)“學(xué)習(xí)”。
在最近發(fā)表在Nature Methods上的一項(xiàng)研究中,Ideker的研究團(tuán)隊(duì)最近開(kāi)發(fā)了他們所謂的“可見(jiàn)”神經(jīng)網(wǎng)絡(luò),并用它來(lái)構(gòu)建DCell,這是一種功能正常的啤酒酵母細(xì)胞模型,通常用作基礎(chǔ)研究的模型。為此,他們?cè)谝粋€(gè)地方積累了細(xì)胞生物學(xué)的所有知識(shí),并創(chuàng)建了這些細(xì)胞成分的層次結(jié)構(gòu)。然后他們將標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)算法映射到該知識(shí)庫(kù)。
但最令I(lǐng)deker興奮的是DCell不是黑盒子;這種聯(lián)系并不是一個(gè)謎,也不能通過(guò)偶然事件來(lái)形成。相反,“學(xué)習(xí)”僅由現(xiàn)實(shí)世界的細(xì)胞行為和約2,500個(gè)已知細(xì)胞成分編碼的約束引導(dǎo)。該團(tuán)隊(duì)輸入有關(guān)基因和基因突變的信息,DCell預(yù)測(cè)細(xì)胞行為,如生長(zhǎng)。他們對(duì)數(shù)百萬(wàn)基因型的DCell進(jìn)行了培訓(xùn),發(fā)現(xiàn)虛擬細(xì)胞可以模擬細(xì)胞生長(zhǎng),幾乎與實(shí)驗(yàn)室培養(yǎng)的真細(xì)胞一樣準(zhǔn)確。
“人類的知識(shí)是不完整的,”思科的實(shí)驗(yàn)室助理研究科學(xué)家馬建柱博士說(shuō),他領(lǐng)導(dǎo)了建立DCell的工作?!拔覀兿M瓿蛇@些知識(shí),以幫助指導(dǎo)醫(yī)療保健和其他方面的預(yù)測(cè)。”
Ideker和Ma也對(duì)DCell進(jìn)行了測(cè)試。如果他們故意給系統(tǒng)提供虛假信息,那就不行了。以核糖體為例。細(xì)胞利用這些微小的生物機(jī)器將遺傳信息轉(zhuǎn)化為蛋白質(zhì)。但是,如果研究人員將核糖體連接到一個(gè)不相關(guān)的過(guò)程,如細(xì)胞凋亡,系統(tǒng)細(xì)胞就會(huì)自殺,DCell就無(wú)法預(yù)測(cè)細(xì)胞的生長(zhǎng)。虛擬小區(qū)“知道”新的安排在生物學(xué)上是不可能的。
Ideker和他的共同指導(dǎo)的癌細(xì)胞地圖計(jì)劃的同事現(xiàn)在正在產(chǎn)生他們?yōu)槿祟惏┌Y建立DCell所需的一些實(shí)驗(yàn)數(shù)據(jù)。然后,他們將確定如何最好地個(gè)性化這種虛擬細(xì)胞方法,以獲得患者獨(dú)特的生物學(xué)。
“我們希望有一天能夠輸入您特定的癌癥相關(guān)基因突變,并獲得有關(guān)癌癥侵襲性的最新信息,以及預(yù)防其生長(zhǎng)和轉(zhuǎn)移的最佳治療方法,”Ideker說(shuō),他也是加州大學(xué)圣地亞哥分校計(jì)算生物學(xué)和生物信息學(xué)中心。