在過去的幾十年里,基因治療在罕見病方面取得了重大進展。隨著社會各界對罕見病的重視,各國開始推出多種政策支持罕見病藥物研發(fā),從臨床前藥物發(fā)現(xiàn)到藥品上市后均有政策驅(qū)動,罕見病藥物研發(fā)逐漸成為企業(yè)逐鹿的領(lǐng)域。動脈網(wǎng)特邀賽業(yè)生物董事長、清華珠三角研究院AI中心主任韓藍青,對罕見病基因治療進行深入探討。
我們注意到賽業(yè)生物在罕見病及基因治療領(lǐng)域正在積極布局,賽業(yè)生物是做大小鼠基因編輯的公司,為什么會進入這個領(lǐng)域呢?
通過制作體內(nèi)和體外的基因編輯及基因人源化鼠模型,可以幫助基礎(chǔ)研究者進行基因功能研究,也可以幫助藥物開發(fā)者進行藥效學研究。過去十幾年我們主要做這類大小鼠基因編輯模型和細胞基因編輯模型,當然我們的工作還遠不局限于此。
罕見病多由單基因突變引起,大多數(shù)病人都無藥可醫(yī),他們只能默默承受甚至早早夭折。近年來隨著我國國力增強,罕見病這個不被制藥業(yè)看重的領(lǐng)域開始受到更多關(guān)注,我國也開始制定罕見病的種類名錄。近幾年西方國家在基因治療上的突破也使領(lǐng)域迅速升溫。這個領(lǐng)域,在小鼠模型上開展研究幾乎是不可逾越的第一步,這正好是我們賽業(yè)生物的專長。
罕見病的發(fā)病機理都清楚了嗎?罕見病為什么要用基因治療呢?
本世紀初科學家剛剛拿到人類基因組計劃的第一個草本的時候異常激動,認為我們很快可以通過解讀基因組來攻克人類疾病,隨后,一大批基于基因組學的生物制藥公司也應(yīng)運而生。但很快大家發(fā)現(xiàn)事情沒有這么簡單。人類基因組是一本沒有太多注釋的天書,要解讀它還要拿出比完成人類基因組計劃大百倍千倍的努力。20年過去了,雖然問題仍然是遠遠多于答案,但卻已經(jīng)發(fā)生了翻天覆地的變化。在全球數(shù)以萬計的科學家的共同努力下,數(shù)以千計的基因病與數(shù)以千計的基因之間已經(jīng)建立起關(guān)聯(lián),我們對罕見病的發(fā)病機理也越來越清楚了,這就給我們下一步對癥下藥創(chuàng)造了條件。
事實上,我們每個人身上都攜一些隱性致病突變,沒有一個人的基因是完美的。人群中單個基因上的致病突變大都是小概率事件,因此這些單基因突變導(dǎo)致的疾病往往也是罕見病,但由于罕見病種類繁多,已知的就不下七千種,所以涉及全球的病人總數(shù)也達到了3.5億。這些疾病幾乎都是由于基因缺陷所致,現(xiàn)有的治療手段效果甚微,而在基因?qū)用嫔先ジ深A(yù)有可能在根本上解決問題。
那罕見病基因治療為什么現(xiàn)在會熱起來呢?
基于二代測序的基因組學和數(shù)據(jù)共享加速了新的致病基因的發(fā)現(xiàn),基因治療領(lǐng)域的技術(shù)進步和成功案例讓我們對罕見病治療燃起了希望。在這個近些年熱起來的新領(lǐng)域,我們賽業(yè)有天然優(yōu)勢來伴跑領(lǐng)域的研究者。過去十多年,賽業(yè)生物的工作主要是用基因編輯鼠模型和基因編輯細胞模型幫助科學家解讀人類基因組這本天書,在這個過程中,我們積累了大量的生物信息及基因編輯方面的數(shù)據(jù),在本領(lǐng)域持續(xù)的深耕也讓我們在基因編輯技術(shù)方面一直走在行業(yè)前沿,結(jié)合賽業(yè)生物在人工智能領(lǐng)域的深度探索,相信我們可以給科學家們提供更高效的基因功能解析與基因治療解決方案。
您提到了人工智能,人工智能在這里面能起到什么作用?
首先沒有大數(shù)據(jù),AI就很難有用武之地。隨著二代測序技術(shù)的普及和數(shù)據(jù)的全球共享,生物醫(yī)學研究早已進入大數(shù)據(jù)時代,但生信分析的手段還相對滯后,比如傳統(tǒng)的GWAS在過去20年中雖然中規(guī)中舉,但并沒有給我們帶來什么驚喜。相比之下,去年Alphafold2預(yù)測蛋白結(jié)構(gòu)給生物界帶來了巨大震動,我們已經(jīng)看到AI全面進軍生物界的前兆。
自然界很多東西的特征的所有可能性排列組合可以理解為一個超高維空間的集合,在這個幾乎有無限可能性的混沌的超高維空間里,存在著極少數(shù)有邏輯的特征,比如在所有氨基酸序列排列組合的可能性中存在著可以折疊成蛋白質(zhì)的序列,這些序列只有全部序列的10的20次方分之一,而生命需要的蛋白質(zhì)又是這些可折疊的蛋白質(zhì)中的極少數(shù),要找到它們?nèi)缤蠛漆。AI可以對海量但有限的數(shù)據(jù)進行學習,從而對這個超高維空間的特征形成一種理解,之后AI可以在這個理解的基礎(chǔ)上做出預(yù)測,指導(dǎo)我們迅速找到我們想要的邏輯。
生命的一個重要特性是突變引入多樣性并通過迭代不斷適應(yīng)新環(huán)境。基因和蛋白的多樣性可以體現(xiàn)在它們在各自的超高維可能性空間中的大量可存活形式,Alphafold2就是在過去50年積累的海量蛋白結(jié)構(gòu)的數(shù)據(jù)基礎(chǔ)上用電腦神經(jīng)網(wǎng)絡(luò)建立了基因序列和蛋白結(jié)構(gòu)在兩個超高維空間的映射關(guān)系,它的應(yīng)用將是顛覆性的。同樣,我們也可以建立基因突變與疾病、蛋白結(jié)構(gòu)與功能、人的基因與小鼠的基因等等之間的映射關(guān)系,讓AI指導(dǎo)我們?nèi)プ鰧嶒,這樣不但可以大大提高效率,節(jié)省成本,甚至可以把我們帶到以前去不到的遠方,比如AI+合成生物學可能找到生物體中不存在但又對我們有用的抗體。
賽業(yè)也在做AI方面的工作嗎?
去年我們便組建了生物大數(shù)據(jù)AI加生信的復(fù)合背景團隊,團隊成員包括生物學家、AI算法工程師、生信工程師和IT人員,我們正在罕見病基因治療領(lǐng)域建立數(shù)據(jù)集和算法模型,其中兩個方面是我們關(guān)注的重點:一個是人類基因突變的致病風險預(yù)測以及相應(yīng)的小鼠疾病模型的設(shè)計;另一個是目前作為基因治療最好載體的AAV病毒衣殼蛋白的設(shè)計優(yōu)化。這個團隊將和我們現(xiàn)有的業(yè)務(wù)團隊緊密配合為研究罕見病及開發(fā)下游基因治療的客戶提供從突變基因的致病風險評估到小鼠模型制作,到表型分析,到基因治療方案,到AAV載體設(shè)計直至小鼠模型藥效驗證的全套服務(wù),而AI的引入會大大提高這一進程的準確性和效率,這將是我們的核心競爭力。
您提到了人類基因突變的致病風險預(yù)測,能具體介紹一下嗎?客戶為什么會找你們評估?
我們的客戶群中很大一部分是臨床研究者,他們經(jīng)常會接觸到各種特殊的臨床案例,尤其是家族基因病的案例,在采集病人樣本做二代測序和生信分析后數(shù)據(jù)會給研究人員提示一系列有可能致病的突變,這些研究人員往往找我們做點突變小鼠模型,希望通過在小鼠上做相應(yīng)的基因突變來模擬人的疾病表型。
由于難以在數(shù)百甚至上千個突變中確定哪些突變位點最終導(dǎo)致疾病的發(fā)生,在經(jīng)過繁瑣費時的生信分析以及濕實驗驗證后,研究人員仍需要做多個甚至幾十個基因突變小鼠模型對前期預(yù)測的致病突變做驗證,然后對這些小鼠進行表型分析,進一步確定哪些突變會導(dǎo)致小鼠出現(xiàn)人類基因突變后的癥狀。
由于現(xiàn)有的研究手段難以對大量突變位點做精準的分析,研究人員做的大量的點突變小鼠往往看不到表型,這造成了極大的資源浪費和時間浪費。所以對于這樣的客戶,我們都建議由我們來為他們做一個數(shù)據(jù)分析,對他們手里的一系列基因突變位點進行風險評估并根據(jù)風險程度高低排序,這樣可以大幅度節(jié)省科研經(jīng)費,縮短研究時長。
目前我們的方法主要是在現(xiàn)有數(shù)據(jù)基礎(chǔ)上結(jié)合機器學習和深度學習訓練各種模型,對基因突變做各個層面的分析。我們對疾病類型、受影響的蛋白結(jié)構(gòu)、組織類型、突變位置等進行分類評估,充分考慮各種因素,并考慮之前可能被忽略的因素,這樣可以大大提高命中率。要考慮突變影響的是結(jié)構(gòu)性蛋白還是功能性蛋白,突變對蛋白質(zhì)折疊的影響,對RNA剪接的影響等等。我們用先驗性的知識對模型進行訓練,并且不斷改進和豐富模型,以達到業(yè)內(nèi)最高水平。我們計劃于今年年底以數(shù)據(jù)庫形式開放給全球研究人員使用。
您提到基因治療的第一步是拿到合適的小鼠模型,每種罕見病都對應(yīng)一種小鼠模型嗎?
我們盤點了過往這些年做過的小鼠模型,其中數(shù)以百計的模型是和罕見病相關(guān)的。但現(xiàn)在我們會把工作做得更細致。我們調(diào)查了很多國內(nèi)外的基因治療研究,第一步無一例外的是獲得合適的小鼠模型。首先我們要了解客戶需求,客戶要解決什么問題,有多少成分是做科研,有多少成分是做轉(zhuǎn)化,我們會對癥下藥建議一個最佳的研究路徑。比如dystrophin的突變會引起DMD或BMD,但已知的致病突變就有三千多個了,未知的可能更多?梢宰鲆粋簡單的dystrophin敲除小鼠,也可以做模仿發(fā)病突變的點突變小鼠,模型的制作方法也可以多種多樣,這些都可以根據(jù)治療方案來確定。dystrophin這條基因太大了,但我們可以把一個小型化的micro-dystrophin用AAV帶進體內(nèi),也可以用CRISPR或者單堿基編輯器去修正致病突變,或者用反義寡核苷酸來造成致病外顯子的跳躍,不同的方案需要不同的模型。
你提到了目前熱門的基因治療載體AAV,這個你們也做嗎?你們的優(yōu)勢是什么?
設(shè)計包裝AAV并在小鼠上做實驗是我們一直在做的事情。最近我們開始做AAV的AI輔助定向進化。AAV的不同血清型及突變有不同特性,比如包裝效率、組織特異性、免疫逃逸等等。我們通過合成突變庫的方法去獲得多樣性的AAV,并進行體內(nèi)和體外的實驗以獲得大量數(shù)據(jù),再用這些數(shù)據(jù)去訓練我們的機器學習或深度學習模型,并用這些模型去做我們需要的AAV衣殼蛋白的序列預(yù)測。這樣的平臺非常強大,能夠使AAV優(yōu)化的效率有數(shù)量級的提高,并找到傳統(tǒng)理性設(shè)計和定向進化找不到的更優(yōu)序列。我們認為制藥業(yè)的一個大趨勢就是AI+合成生物學,一場革命已經(jīng)悄悄興起了。
AAV是基因治療的一個非常好的載體,具體的基因治療可以有哪些方案呢?
目前基因治療體外主要用的是慢病毒,體內(nèi)主要用的是AAV,做到臨床階段最多的還是用AAV把表達缺失或缺陷蛋白的基因帶到體內(nèi)。AAV+CRISPR或者單堿基編輯器還大多停留在動物實驗階段。我們還通過跟業(yè)內(nèi)優(yōu)秀的合作單位建立戰(zhàn)略伙伴關(guān)系來利用最有效的基因編輯器來達到修復(fù)基因的目的,這項工作目前正在進行。
您也提到你們的客戶可能會做轉(zhuǎn)化,就是上臨床對吧?
是的,我們的一些客戶是希望能上臨床的。如果在小鼠上的實驗結(jié)果滿意,下一步可以在大動物上做藥效和安全性評價,這也是我們希望看到的。因為治病救人是我們和客戶的最終目的。我們的合作伙伴中也有可以生產(chǎn)GMP級別AAV的公司,我們也歡迎我們的臨床客戶開展研究者發(fā)起的臨床研究。
您是怎么看待基因治療這種新興治療方式的?有倫理問題嗎?
有人說人類改變自身的基因是動了上帝的奶酪。確實如此,人類已從改造自然發(fā)展到改造自我,我認為基因治療只要不涉及生殖遺傳,就沒有什么可擔憂的。目前的科學發(fā)展已經(jīng)具備了基因治療的各種要素。時不我待,對于罕見病患者、面對罕見病患者而束手無策的臨床醫(yī)生和從事罕見病研究的科學家來說,這扇大門打開得已經(jīng)太遲了,但一旦打開,后面會一片光明。
韓藍青簡介
賽業(yè)生物科技董事長
清華珠三角研究院人工智能創(chuàng)新中心主任
國家重大人才工程入選者
韓藍青先生本科畢業(yè)于清華大學,后獲得加拿大麥吉爾大學工程碩士和加拿大女王大學工商管理碩士,并于麻省理工學院研修,曾任職三洋電器和阿爾卡特等公司。2006年韓藍青回國創(chuàng)立了賽業(yè)生物科技并任董事長至今。公司專業(yè)從事基因工程模式動物、細胞生物學產(chǎn)品及服務(wù)等前沿技術(shù)的研究開發(fā)。在韓藍青先生的帶領(lǐng)下,賽業(yè)生物已成為知名的基于模式動物的國際化創(chuàng)新性CRO公司。
2017年韓藍青先生受聘于清華珠三角研究院任人工智能創(chuàng)新中心主任,承擔過多個國家和省市級科研項目,深入探究AI在生物醫(yī)學領(lǐng)域的應(yīng)用。韓藍青帶領(lǐng)的團隊已經(jīng)在專業(yè)頂級學術(shù)刊物發(fā)表數(shù)篇重要文獻,獲得大量發(fā)明專利。