中國·濟南
山東產業技術研究院智能計算研究院
2022
05 / 24
智研簡報
智/能/計/算? ? ? 計/算/未/來
陳益強院長應邀作題為“數據驅動的認知
行為計算”的學術報告
智研院農業團隊到淄博省級農高區調研
5 / 30
Nature子刊 | NUS、字節首次將AI元學習引入
腦成像領域
開啟未來之窗:AI與藥物研發的共舞
CONTENTS
目錄
面向“政產學研金服用”,打造研究機構與企業間體系化、標桿化及標準化合作模式
01
智研快訊
技術前沿
《山東省科學技術獎定向獎勵實施辦法(試行)》
Nature子刊 | NUS、字節
首次將AI元學習引入腦成像領域
陳益強院長應邀作題為“數據驅動的認知行為計算”的學術報告
04
05
02
《濟南市工程研究中心管理辦法》
政策解讀
陳益強院長應邀作題為
“數據驅動的認知行為計算”的學術報告
? ? ? ?5月12日下午,中國科學院計算技術研究所研究員、山東產業技術研究院智能計算研究院院長陳益強受邀為洛陽理工學院計算機與信息工程學院師生作題為《數據驅動的認知行為計算》的學術報告。報告會由計算機與信息工程學院院長石念峰主持,學院全體教師參加了本次報告會。
智研快訊
NEWSLETTERS
? ? ? ?報告從多個神經疾病輔診的實際應用案例出發,介紹智能時代下一代認知行為計算的新型研究范式——OODA(“O”:感知、“O”:判斷、“D”:決策、“A”:干預),進而針對數據驅動研究中面臨的數據孤島問題,提出一種基于聯邦學習的醫療科研平臺,在多方數據可用不可見的情況下,解決分布個性化和標簽質控難等問題,從而實現多方數據的高效協同建模。
? ? ? ?報告會持續了近一個半小時。在報告會結束后,陳益強院長與學院領導和部分年輕教師代表就學院科研方向凝練、科研組織管理、學術研究方法等問題進行了交流與互動,帶領大家了解到數據建模、分析和應用最新的研究范式,在多個醫療數據應用案例中感受計算機相關應用領域的前景和研究思路,對計算機相關行業的未來發展方向有了更加深刻的思考。
政策導讀
06
開啟未來之窗:AI與藥物研發的共舞
智研院農業團隊專家到淄博省級農高區調研
07
03
項目進展
面向異構邊緣計算環境的聯邦協作平臺
行業資訊
高新技術產業示范區規劃(2022-2035年)》,接下來,將不遺余力的開展創新發展,聚引技術與人才,積極策劃產業布局和重點項目,尤其在農業智能裝備方向和生態循環農業,開展數字化、智慧化農業研究與實踐。
? ? ?
? ? ? 山東省產業技術研究院為推進與淄博省級農高區技術合作,組織山東產業技術研究院智能計算研究院(簡稱智研院)農業團隊專家,于5月25日前往淄博省級農高區調研交流。農高區黨工委書記、管委會主任徐其錄、黨工委副書記宋愛國熱情接待。
? ? ? 智研院農業數據智能研究中心陳海華博士一行,在農高區管委會領導的帶領下,先后參觀考察了魯供齊豐農業公司、禾豐種業無人農場、巧媳婦自動化生產線、思遠農業、天天優鮮等品牌企業與設施蔬菜智能化示范場景。重點圍繞開展智慧農機試驗示范和建立“數智化”農業生產推廣基地進行考察、座談交流。
? ? ? 徐其錄主任介紹,淄博區有悠久的農耕文明和文化傳承,高度重視農業發展,充分發揮地理優勢和資源優勢,委托農業農村部設計研究院編制了《淄博省級農業
智研快訊
NEWSLETTERS
智研院農業團隊專家到淄博省級農高區調研
? ? ? ?陳海華博士表示,淄博省級農高區現代農業特色產業成效明顯,農業基礎良好,具有很好的科技創新環境和氛圍。依據農業數據智能研究中心研發成果,未來將會有非常多的合作空間:在推行規模化管理經營、加快傳統農機自動化智能化改造,開展智能化大型青儲飼料機械研發、農業裝備社會化服務和無人農場第三代智能農機示范等方面進行緊密的合作與交流。同時,將不斷發揮自身科研優勢,在創新農業管理等重點項目方面為地方賦能,為進一步推動淄博省級農高區跨越式發展貢獻力量!
? ? ? 項目主要的創新點:
? ? ? 1.異構加速邊緣終端。協同使用GPU、CPU、加速卡等計算設備,適配ARM、X86等多種CPU架構,實現邊緣計算環境下聯邦學習模型訓練與邊緣推理任務。
? ? ? 2.FATE+架構。基于FATE開源架構底層進行升級,擴展自定義聯邦學習算法,解決多聯邦方網絡連接、動態加入退出等問題。
? ? ? 3.構建DMA服務中臺。為聯邦邊緣計算提供計算、存儲及網絡的統一調度支持,為上層應用提供聯邦MaaS能力支撐,提供聯邦學習數據、任務、算法、模型的統一管理,并簡化聯邦平臺使用流程。
? ? ? 4.模型路由機制。訓練完成的聯邦模型可以在平臺中進行遷移學習或增量學習,不斷提高模型泛化能力。
? ? ? 項目應用案例:
? ? ? 以醫療行業入手,建成的聯邦邊緣計算平臺以其平臺化、能力化等特性可以最小成本遷移至諸多行業,可進一步擴展至智能制造、智能物流、智慧農業、智慧城市等不同類型、不同需求的產業,加速聯邦學習和邊緣計算系統的落地應用,加速人工智能進入傳統領域的各個方面,提升各行業的服務水平,帶來產業轉型與升級,加速地方產業結構調整,具備極為廣闊的市場前景。
? ? ? 聯邦學習作為機器學習新興研究方向,融合了機器學習、分布式系統、密碼學等多學科知識,能實現多地多聯邦方的模型協同訓練及優化。可以有效緩解數據安全問題,合理、高效地利用分散在各個企業內部的數據及硬件資源。
? ? ? 面向異構邊緣計算環境的聯邦協作平臺由中國科學院計算技術研究所陳益強研究員帶領團隊研發。基于聯邦學習FATE開源框架,構建了對象化DMA服務中臺,包括數據池(Data Pool)、任務池(Mission Pool)、算法池(Algorithms Pool),提供了用戶進行便捷二次開發所需的接口定義與框架流程,可以實現模型訓練及推理任務的智能化管理。另外,平臺基于MaaS(Model as a Service)服務模式,支持模型在整個平臺中智能路由。目前針對醫療科研領域,構建了聯邦醫療科研平臺“聯智鵲華”,已在帕金森病輔助診斷、圍術期并發癥預測、數字眼科的協作科研和臨床應用等多個場景進行了落地應用。 后期將在智慧電力、智慧城市、智慧農業、智慧通信等領域形成廣泛支撐合作。
? ? ? 團隊在聯邦學習、隱私計算等研究方面發表相關論文30余篇,申請相關專利8項,提出面向醫療領域的FedHealth聯邦遷移學習框架,獲得FL-IJCAI2019最佳應用論文獎,收錄于聯邦學習英文專著《Federated Learning》,并獲得首個國家自然科學基金支持的聯邦學習研究項目。團隊牽頭IEEE標準P2961“協同邊緣計算基礎架構與應用”的制定工作;參與IEEE P3652.1“聯邦機器學習”(已發布)等三項標準制定工作。
項目進展
PROJECT PROGRESS
面向異構邊緣計算環境的
聯邦協作平臺
政策導讀
《山東省科學技術獎定向獎勵實施辦法(試行)》
“
”
? ? ? 為充分發揮山東省科學技術獎勵的激勵導向作用,獎勵真正作出創造性貢獻的科學家和一線科技人員,加快樹立以創新質量、績效、貢獻為核心的科技評價導向,推動產出更多高質量成果、營造良好創新生態,省科技廳研究制定了《山東省科學技術獎定向獎勵實施辦法(試行)》(以下簡稱《實施辦法》)。
? ? ? ?一、出臺背景
? ? ? ?近年來,我省持續深化科技獎勵制度改革,2018年出臺《山東省深化科技獎勵制度改革實施方案》,2020年出臺《山東省科學技術進步獎產業突出貢獻類項目管理辦法》,在全國率先開展科技獎勵“懸賞制”改革,對市場份額高、引領行業發展成果按程序直接授予省科技進步一等獎。我省科技獎勵改革得到社會各界特別是科技界充分肯定,2021年11月,科技部等十部門聯合印發《關于組織開展科技成果評價改革試點工作的通知》,明確山東省作為全國唯一省份開展科技獎勵改革試點。
? ? ? ?為扎實推進科技獎勵改革,省科技廳在科技獎勵“懸賞制”改革基礎上,廣泛深入座談調研、大膽探索,研究提出了《實施辦法》,征求了一線科研人員代表以及省直相關部門、地方科技主管部門、部分高校和科研院所意見建議,經多次討論,對《實施辦法》進行了修改完善。
? ? ? ?二、主要內容
? ? ? ?《實施辦法》共二十條,主要內容如下:
? ? ? ?一是明確定向獎勵功能定位。明確了定向獎勵導向、適用范圍、獎勵重點以及授獎數量,提出定向獎勵是對山東省科技獎勵提名和評審方式的豐富和完善,是對完成重大科技任務、解決我省經濟社會發展重大需求的科技人員和團隊實行定向獎勵的評審機制。
? ? ? ?二是提出定向獎勵授獎條件。定向獎勵人選和項目以使命激勵、貢獻激勵為導向,聚焦國家和省重大科技計劃、重大創新平臺以及企業自主創新的人才和成果,分別提出最高獎和自然、發明、進步獎的定向獎勵條件。
? ? ? ?三是完善定向獎勵評審程序。定向獎勵評審貫徹中央關于科技成果評價改革精神,按照基礎研究、應用研究、技術開發與產業化等不同類型創新活動的人才和成果特點,實行分類評審機制。按照《山東省科學技術獎勵辦法》有關規定,定向獎勵人選和項目由省科技廳提出,省獎勵辦公室組織考察、論證后,提交省獎勵委員會審議,獎勵建議并入當年度科學技術獎勵決議,按程序報省政府常務會議研究。
? ? ? ?二是關于申報認定。工程研究中心認定原則上每年開展一次。由市發展改革委委托第三方機構,組織專家對申請材料進行綜合評審,擇優確定年度認定工程研究中心名單,正式公開發布。申報應具備的基本條件主要包括:申請單位在本領域技術創新中具有領先地位和競爭優勢;依托單位或牽頭單位應當是本市內注冊的獨立法人單位,參與單位與其在產學研用等方面具有密切協同性;申請單位應具有較強的綜合實力;較高水平的創新團隊和研發條件;申報單位信用狀況良好等條件。明確規定:鼓勵有條件的市工程研究中心采用獨立法人形式組建運行,對于采取非法人形式組建的市工程研究中心,需要與依托單位在人、財、物的管理上保持清晰邊界,評價指標數據能夠獨立核算、有據可查。
? ? ? ?三是關于運行評價和監督管理。市工程研究中心實行優勝劣汰、動態調整的運行評價制度。市發展改革委原則上每兩年組織一次評價,主管部門每年組織一次自查。評價結果評價得分85分及以上為優秀;60分至85分(不含85分)為合格;低于60分為不合格。對運行評價不合格的、提供虛假材料和數據、發生重大質量事故或重大安全事故、存在司法或行政機關認定的嚴重違法失信行為的撤銷市工程研究中心稱號。
政策導讀
POLICY INTERPRETATION
《濟南市工程研究中心管理辦法》
政策解讀
? ? ? ?一、修改背景
? ? ? ?2020年12月份,山東省人民政府辦公廳印發了《關于深化科技改革攻堅的若干措施的通知》(魯政辦發〔2020〕26號),《通知》按照黨中央、國務院和國家部委關于國家科技創新基地平臺建設發展改革有關部署要求,根據戰略需求和不同類型科研功能定位,對現有省級基地平臺進行分類梳理,分基礎研究、技術創新與成果轉化、創新創業與科技資源支撐服務三類對進行優化整合,明確說明:不再新建省工程實驗室和省工程技術研究中心,并于2021年7月份修改并印發了《山東省工程研究中心管理辦法》,刪除了工程實驗室相關內容,在組建方式、建設任務和認定條件上都做了明確的規定。為進一步加強和規范濟南市工程研究中心管理,促進工程研究中心健康發展,充分發揮對全市新舊動能轉換和高質量發展的重要支撐作用,需要修改2019年印發的《濟南市工程實驗室管理辦法》,并與國家和省形成體系發展。
? ? ? ?二、主要法律、法規、規章和政策依據
? ? ? ?一是《山東省科技進步條例》第十九條規定,縣級以上人民政府鼓勵企業設立科學技術研究開發機構,對經認定的工程(技術)研究中心、重點實驗室、工程實驗室、企業技術中心等科學技術研究開發機構及其創新能力建設項目給予扶持;鼓勵企業與高等學校、科學技術研究開發機構聯合建立技術創新平臺,構建產業技術創新戰略聯盟。
? ? ? ?二是《山東省工程研究中心管理辦法》(魯發改高技〔2021〕427號 )第七條第五款規定,優先支持擁有市級工程實驗室或工程研究中心的單位牽頭申報。
? ? ? ?三、主要內容說明
? ? ? ?《濟南市工程研究中心管理辦法》(征求意見稿)主要參照《山東省工程研究中心管理辦法》,在參考外地經驗基礎上,結合濟南市創新驅動發展實際,綜合考慮各方面因素,經過深入研究討論擬訂形成的。共包含六章二十六條。主要包含總則、申報認定、運行評價、鼓勵政策、監督管理、附則等內容。
? ? ? ?一是關于總則部分。說明了工程研究中心功能定位、建設宗旨和主要任務,明確了市發展改革委負責全市工程研究中心建設總體布局,組織開展工程研究中心的申報、認定、評價等工作。各區縣發展改革部門、市政府派出機構規定承擔此項工作的部門(單位)是市工程研究中心的主管部門的責任區分。
? ? ? ?近期,新加坡國立大學、字節跳動智能創作新加坡團隊等機構合作的一項技術成果被全球頂級學術期刊Nature的子刊Nature Neuroscience收錄。這項研究首次將人工智能領域的元學習方法引入到神經科學及醫療領域,能在有限的醫療數據上訓練可靠的AI模型,提升基于腦成像的精準醫療效果。
? ? ? ?一、研究背景
? ? ? ?腦成像技術是神經科學發展的一個重要領域,能夠直接觀察大腦在信息處理和應對刺激時的神經化學變化、從而對疾病的診斷和治療提供重要參照。理論上,基于腦成像的機器學習模型可應用于預測個人(individual)的一些非腦成像(non-brain-imaging)的表征特性(phenotypes) ,例如,流動智力 (fluid intelligence)、臨床結果(clinical outcomes)等,從而促進針對個人的精準醫療( precision medicine)。
? ? ? ?一個現實的問題在于,雖然現在已經有英國生物銀行(UK Biobank)這樣的大規模人類神經科學數據集,在研究臨床人群或解決重點神經科學的問題時,幾十到上百人的小規模數據樣本依舊是常態。在精確標注的醫療數據量有限的情況下,很難訓練出一個可靠的機器學習模型來預測個人表征特性。
? ? ? ?論文提出一個新的思路來解決這一數據匱乏所帶來的根本限制:在給定一個大規模(N>10,000)的帶有多種表征特性標注的腦成像數據集,可以將在該數據集上訓練的機器學習模型遷移到一個獨立的小規模(N<200)的帶有新的表征特性的數據集上,從而使得在新的數據集上訓練的模型能夠準確預測新的表征特性。
? ? ? ?二、研究方法
? ? ? ?研究者通過對先前的小樣本數據分析發現,個體的認知、心理健康、人口統計學和其他健康屬性等表征特性與大腦成像數據之間存在一種內在的相關性。這意味著,小數據集當中的某些獨特表型可能與大規模數據集當中的某些預先存在的特定表型相關,利用這種相關性,研究者提出了一個新的基于元學習的元匹配方法建立了一種框架機制,可利用大規模腦成像數據集來促進對小數據集當中一些全新的、未知的表型的預測,從而訓練出可靠的用于表征特性預測的機器學習模型。
? ? ? ?論文提出了一種新的元匹配(meta-matching)方法,來解決小規模數據集上的表征特性預測模型的訓練問題。元匹配是一種高度靈活的學習框架,可以用于各種不同的機器學習方法。論文主要研究了將元匹配方法應用于核嶺回歸(kernel ridge regression, KRR)以及全連接的深度神經網絡(DNN).
技術前沿
ADVANCED TECHNOLOGY
Nature子刊 | NUS、字節
首次將AI元學習引入腦成像領域
? ? ? ?三、實驗設置
? ? ? ?論文在英國生物銀行(UK Biobank)和人類連接組計劃(Human Connectome Project)數據集上進行了測評。所有數據的使用均已經過了相關研究部門批準。其中 UK Biobank 包含36,848名參與者的結構MRI以及靜息fMRI腦成像數據,以及被篩選出的67個非腦成像的表征特性。而HCP包含 1,019 名參與者的結構MRI以及靜息fMRI數據,以及被篩選出的58個表征特性。所篩選的表征特性涵蓋了意識(cognition)、情緒(emotion)以及個人特質(personality)。
? ? ? ?UK Biobank數據集被用作訓練集,用于使用元匹配來訓練預測模型。其被隨機分為元訓練集(26,848名參與者,33個表征特性)以及元測試集(10,000名參與者,34個表征特性)。而HCP數據集則被用作測試集、測試預測模型在新的表征特性上的預測準確率。其被隨機分為K個參與者用于訓練以及(1,019-K)個參與者用來測試。其中K取值為19,20,50,100和200。
△ 圖. HCP表據集表形特性示例
? ? ? ?四、實驗結論
? ? ? ?上述方法已經在英國生物銀行(UK Biobank)的 36,848 名參與者和來自人類連接組計劃(Human Connectome Project)的 1,019 名參與者的樣本評估中顯示出有效性。
? ? ? ?在元匹配的學習框架中,大規模的訓練數據被分為元訓練集 (training meta-set) 以及元測試集 (testing meta-set)。這兩個數據集包含不同的個體和表征特性標注。元訓練集被用來訓練DNN預測模型,而元測試集則用來評估當前DNN模型在新的表征特性上的預測準確率(也即泛化性能)。特別的,隨機挑選的K個(K<5)個體數據被選作測試樣本。而在元測試集上表現最好的一個DNN輸出節點(output node)將被保留,而其他節點被移除。之后在該K個測試個體數據,微調(fine-tune)該保留的節點以及DNN模型之前與該節點相連的隱藏層參數。注意與一般的元學習或者微調策略不同的是,這里只微調DNN模型中的一個子網絡,而不是微調整個模型參數。該過程將被重復M次,直到DNN模型在元測試集上預測穩定為止。
? ? ? ?在完成上述的元訓練過程以后,得到的DNN模型已具有了較強的在新的預測任務上的泛化能力。該模型可以直接遷移到新的表征特性數據集上,用少量的標注樣本進行訓練,即可有較好的預測性能。
? ? ? ?在BioBank測試集上性能超過經典的核嶺回歸(KRR)
? ? ? ?下圖展示了在UK Biobank元測試集 基于Pearson’s相關系數的準確性比較。在所有的樣本數量設置上(K值),所提出的元匹配方法在34個表征特性準確率大幅超過經典的KRR方法 (偽發現率FDR q<0.05). 例如在fMRI研究中常見的樣本數量K=20 (20-shot),基本的DNN meta-matching 方法準確率超過KRR 100% (0.124 vs. 0.052). 而如果采用coefficient of determinant (COD)作為性能指標,DNN meta-matching方法則超過KRR 400% .
? ? ? ?
? ? ? ?在HCP小規模新數據集上顯著超過KRR
? ? ? ?為了測試元匹配在全新的測試集上的表現,論文進一步測試了其在HCP數據集上的性能。發現同樣的,所提出的元匹配方法準確率大幅超過經典的KRR方法。例如在K=20時,元匹配方法準確率超過KRR 100% (0.123 vs. 0.047). 而在K=100時,以COD為指標,元匹配方法準確率超過KRR 800%.
? ? ? ?五、討論與總結
? ? ? ?考慮到所提出的元匹配方法是利用表征特性之間的相關性來輔助預測,其背后的預測機制有可能是非因果的。然后該研究的主要目標是提高預測準確率,并且即使是非因果預測,所得到的預測模型也有很多的應用場景。例如,抗抑郁藥物至少要4周以上才會起效,而少于50%的病人會對第一次給藥反應良好。因此,即使是非因果的預測,提高表征特性的預測能力在臨床上仍具有巨大價值。
? ? ? ?論文所提出的元匹配方法,是基于機器學習領域中的元學習,多任務學習以及遷移學習等。例如在DNN模型上先訓練再微調可認為是遷移學習的一種形式。但是,值得注意的是,實驗表明最大的準確率提升是來自于論文提出的核心算法—元匹配。當然,更先進的機器學習算法有希望在這個方向上帶來更大的預測準確率的提升。
? ? ? ?雖然最初的腦成像數據集來自于年輕健康的成年人,現在有越來越多的數據集側重不同的人群,例如老年人、兒童、不同的疾病等。論文提出的方法在將來也可以用于其他人群數據集的表征特性預測,例如最近的ABCD數據集包含了精神健康癥狀。
? ? ? ?字節跳動智能創作團隊是字節跳動音視頻創新技術和業務中臺,覆蓋了機器學習、計算機視覺、圖形學、語音、拍攝編輯、特效、客戶端、服務端工程等技術領域,在部門內部實現了前沿算法—工程系統—產品全鏈路的閉環,旨在以多種形式向公司內部各業務線以及外部合作客戶提供業界前沿的內容理解、內容創作、互動體驗與消費的能力和行業解決方案。
? ? ? ?智能創作基礎研究團隊旨在探索前沿機器學習以及計算機視覺、自然語言處理技術,解決人工智能領域里的挑戰性問題。
? ? ? ?Nature Neuroscience是神經生物學領域最頂級的刊物之一,該雜志發表的論文涉及神經科學的各個領域,包括分子、細胞、系統、行為、認知和計算研究。
摘自《量子位》
? ? ? ?在過去的幾年里,制藥行業的數據數字化有了很大的增長。然而,數字化帶來的挑戰是如何應用這些數據來解決復雜的臨床問題。這激發了人工智能的使用,因為它可以通過增強的自動化處理大量數據。人工智能是一個以技術為基礎的系統,包括各種先進的工具和網絡,可以模仿人類的智能。同時,它不會威脅到完全取代人類的存在。人工智能利用能夠解釋和學習輸入數據的系統和軟件,為實現特定的目標做出獨立的決定。人工智能在醫藥領域的應用正在不斷擴大。
?? ? ? 一、人工智能
? ? ? ?人工智能涉及多個方法領域,如推理、知識表示、解決方案搜索,其中包括機器學習(ML)的基本范式。ML的一個子領域是深度學習(DL),它涉及人工神經網絡(ANN)。它們包括一組相互關聯的復雜計算元素,涉及類似于人類生物神經元的“感知”,模擬人類大腦中電脈沖的傳輸。神經網絡涉及各種類型,包括多層感知器(MLP)網絡、遞歸神經網絡(RNNs)、和卷積神經網絡(CNNs)。更復雜的形式包括Kohonen網絡、RBF網絡、LVQ網絡、反向傳播網絡和ADALINE網絡。下圖總結了人工智能的方法域示例。
? ? ? ?二、人工智能助力藥物篩選
? ? ? ?發現和開發一種化學藥物的過程可能需要10年以上,平均花費28億美元。即便如此,90%的治療性分子未能通過II期臨床試驗和監管機構的批準。最近鄰近算法、RF、極限學習、SVMs和深度神經網絡(DNNs)等算法可用于基于合成可行性的虛擬篩選(VS),也可預測體內的活性和毒性。一些大型生物制藥公司,如拜耳、羅氏和輝瑞,已經與IT公司開展合作開發人工智能平臺,用于在腫瘤免疫學和心血管疾病等領域發現治療方法。
? ? ?? 1、理化性質預測
? ? ? ?藥物的物理化學性質,如溶解度、分配系數(logP)、電離度和內在通透性,都會間接影響藥物的藥代動力學特性和靶向受體,因此,在設計新藥時必須加以考慮。不同的人工智能工具可以用來預測物理化學性質。例如,ML使用之前在復合優化過程中產生的大數據集來訓練程序。藥物設計的算法包括分子描述、勢能測量、分子周圍的電子密度和三維原子坐標,通過DNN生成可行的分子,從而預測其性質。
? ? ? ?2、生物活性預測
? ? ? ?藥物分子的療效取決于它們對靶蛋白或受體的親和力。對靶蛋白沒有任何相互作用或親和力的藥物分子將不能提供治療反應。在某些情況下,開發出的藥物分子可能與非預期的蛋白質或受體相互作用,導致毒性。因此,藥物靶向結合親和力(DTBA)是預測藥物與靶點相互作用的關鍵。基于人工智能的方法可以通過考慮藥物及其靶點的特性或相似性來測量藥物的結合親和力。基于特征的相互作用識別藥物和靶點的化學成分以確定特征向量。相反,基于相似性的相互作用考慮了藥物與靶點之間的相似性,并假設相似的藥物將與相同的靶點相互作用。
行業資訊
INDUSTRY INFORMATION
開啟未來之窗:AI與藥物研發的共舞
? ? ? ?網絡應用程序,如ChemMapper和相似集成方法(SEA)可用于預測藥物與靶點的相互作用。許多涉及ML和DL的策略已被用于確定DTBA,如KronRLS、SimBoost、DeepDTA和PADME。基于ML的方法,如KronRLS,評估藥物和蛋白質分子之間的相似性以確定DTBA。類似地,SimBoost使用回歸樹來預測DTBA,同時考慮基于特征和基于相似性的交互。
? ? ? ?3、毒性預測
? ? ? ?預測藥物分子的毒性對于避免毒性作用至關重要。以細胞為基礎的體外試驗通常被用作初步研究,然后是動物研究來確定化合物的毒性,增加了藥物發現的費用。一些基于網絡的工具,如LimTox、pkCSM、admetSAR和Toxtree,可以幫助降低成本。先進的基于人工智能的方法尋找化合物之間的相似性或根據輸入特征預測化合物的毒性。由美國國家衛生研究院、環境保護署(EPA)和美國食品和藥物管理局(FDA)組織的Tox21數據挑戰賽是一項倡議,旨在評估幾種預測12707種環境化合物和藥物毒性的計算技術。名為DeepTox的ML算法脫穎而出,它通過識別分子化學描述內的靜態和動態特征,如分子量(MW)和范德華力,并可根據預定義的2500個毒性基團特征有效地預測分子的毒性。藥物發現中使用的不同人工智能工具如下表所示。
? ? ? ?三、人工智能助力藥物設計
? ? ? ?1、靶蛋白結構預測
? ? ? ?在開發化學藥物的過程中,預測靶蛋白的結構對于設計藥物分子至關重要。人工智能可以通過預測3D蛋白質結構來幫助基于結構的藥物發現,因為設計要符合目標蛋白位點的化學環境,從而有助于在合成或生產前預測化合物對靶點的影響以及安全考量。以DNNs為基礎的人工智能工具AlphaFold分析了相鄰氨基酸之間的距離和肽鍵的對應角度,預測了靶點蛋白的三維結構,并在43個結構中正確預測了25個。
? ? ? ?2、藥物-蛋白質相互作用預測
? ? ? ?藥物與蛋白質的相互作用對治療的成功起著至關重要的作用。預測藥物與受體或蛋白質的相互作用對于理解藥物的療效和有效性、允許藥物的再利用以及防止多藥理學是至關重要的。各種人工智能方法在精確預測配體-蛋白質相互作用方面非常有用,確保了更好的治療效果。
? ? ? ?人工智能預測藥物-靶點相互作用的能力也被用來幫助改變現有藥物的用途和避免多藥理學。改變現有藥物的用途可以直接用于第二階段臨床試驗。這也減少了開支,因為與新開發的藥品實體相比(4130萬美元),重新啟動現有藥品的成本約為840萬美元。“罪惡關聯”方法可用于預測藥物和疾病的創新關聯,這是一個基于知識或計算驅動的網絡。在計算驅動的網絡中,ML方法被廣泛應用,它利用了支持向量、神經網絡、邏輯回歸和DL等技術。
? ? ? ?藥物-蛋白質的相互作用也可以預測多藥理學的機會,這是藥物分子與多個受體相互作用的趨勢,產生非靶向不良反應。人工智能可以根據多藥理學的基本原理設計一種新的分子,并幫助產生更安全的藥物分子。像SOM這樣的人工智能平臺,加上現有的龐大數據庫,可以用來將幾種化合物與眾多目標和非目標聯系起來。貝葉斯分類器和SEA算法可用于建立藥物藥理特征與其可能靶點之間的聯系。
? ? ? ?3、從頭藥物設計
? ? ? ?在過去的幾年里,從頭設計藥物的方法被廣泛應用于藥物分子的設計。傳統的從頭設計方法正在被進化的DL方法所取代,前者存在合成路線復雜、難以預測新分子生物活性的缺點。Popova等人開發了用于從頭藥物合成的結構進化策略的強化學習,包括生成和預測DNN來開發新化合物。Merk等人同時利用生成性AI模型來設計維甲酸X和PPAR激動劑分子,在不需要復雜規則的情況下具有理想的治療效果。作者成功地設計了五個分子,其中四個在細胞檢測中表現出良好的調節活性。人工智能參與分子的從頭設計對制藥行業是有益的,因為它具有各種優勢,例如提供在線學習和同時優化已經學習的數據,以及建議化合物的可能合成路線,從而實現快速的先導設計和開發。
? ? ? 四、?人工智能助力制藥制造
? ? ? ?隨著制造過程的日益復雜,以及對效率和更好產品質量要求的不斷提高,現代制造系統正試圖將人類知識傳授給機器,不斷改變制造實踐。人工智能在制造業中的應用可以證明是對制藥行業的一個推動。流體動力學計算(CFD)等工具使用雷諾平均Navier-Stokes求解器技術,研究不同設備(如攪拌槽)中攪拌和應力水平的影響,使制藥操作自動化。類似的系統,如直接數值模擬和大渦模擬,涉及到解決制藥生產中復雜流動問題的先進方法。
? ? ? ?五、人工智能助力質量控制和質量保證
? ? ? ?從原材料生產所需產品包括各種參數的平衡。產品的質量控制測試以及批次間一致性的維護都需要人工干預。在多種情況下,這可能不是最好的方法,表明了現階段人工智能實現的必要性。FDA修訂了現行的良好生產規范(cGMP),引入了一種“按設計質量”的方法來理解控制藥品最終質量的關鍵操作和具體標準。
? ? ? ?人工智能也可用于在線制造過程的監管,以達到產品的預期標準。采用了基于人工神經網絡的凍干過程監測,結合了自適應進化算法和局部搜索和反向傳播算法。這可用于預測特定操作條件下未來時間點(t+Δt)的溫度和干燥濾餅厚度,最終有助于對最終產品質量進行檢查。此外,全面質量管理專家系統中的數據挖掘和各種知識發現技術可作為制定復雜決策的有價值方法,為智能質量控制創造新技術。
? ? ? ?六、人工智能助力臨床試驗設計
? ? ? ?臨床試驗的目的是確定一種藥物在人類特定疾病條件下的安全性和有效性,需要6-7年的時間和大量的資金支持。然而,進入臨床試驗的小分子十個里可能只有一個獲得成功,過低的成功率對工業界來說是一個巨大的損失。這些失敗可能是由于病人選擇不當、技術要求不足和基礎設施差造成的。然而,有了大量可用的數字醫療數據,這些故障可以通過人工智能的實施而減少。
? ? ? ?病人的登記需要臨床試驗時間的三分之一。臨床試驗的成功可以通過招募合適的患者來保證,否則會導致約86%的失敗病例。AI可以通過使用患者特定基因組-暴露組分析,幫助選擇特定的疾病人群,以便在臨床試驗的第二和第三階段招募,這有助于早期預測所選患者的可用藥物靶點。臨床前發現分子以及在臨床試驗開始前通過使用人工智能的其他方面(如預測性ML和其他推理技術)預測先導化合物,有助于早期預測通過臨床試驗的先導分子,并考慮選定的患者群體。
? ? ? ?從臨床試驗中退出的病人占臨床試驗失敗的30%,為完成試驗創造了額外的招募要求,造成了時間和金錢的浪費。這可以通過密切監視患者并幫助他們遵循臨床試驗的預期方案來避免。AiCure開發的移動軟件在第二階段試驗中監測精神分裂癥患者的常規藥物攝入,使患者的依從率提高了25%,確保了臨床試驗的成功完成。
? ? ? ?七、人工智能在制藥工業的市場前景
? ? ? ?為了降低與醫藥開發相關的財務成本和失敗幾率,制藥公司正轉向人工智能。人工智能市場從2015年的2億美元增加到2018年的7億美元,預計到2024年將增至50億美元。從2017年到2024年,預計增長40%,這表明人工智能可能會徹底改變制藥和醫療行業。許多制藥公司已經并正在繼續投資于人工智能,并與人工智能公司合作開發必要的醫療保健工具。
不完全統計,國外領先的AI制藥平臺有: Exscientia、AbCellera Biologics、Recursion Pharmaceuticals、Atomwise、Benevolent 、 Insilico 、硅康醫藥、Insitro、Cyclica等等。
? ? ? ?國內利用AI從事藥物研發領域相關開發的企業有:湃隆生物、望石智慧、晶泰科技、宇道生物、費米子、燧坤智能、未知君、METiS、星亢原生物、奧睿藥業、水木未來、科輝智藥、武漢智化科技、新合生物、云深智藥、百圖生科、阿爾脈生物、康邁迪森、英飛智藥、億藥科技、智藥科技、賽恪科技、南京雙運生物、深度智耀、星藥科技等。
? ? ? ?八、采用人工智能的持續挑戰
? ? ? ?人工智能的整個成功取決于大量數據的可用性,因為這些數據用于為系統提供的后續訓練。從不同的數據庫提供商訪問數據可能會給公司帶來額外的成本,數據也應該是可靠的和高質量的,以確保準確的結果預測。阻礙人工智能在制藥行業全面采用的其他挑戰包括:缺乏操作基于人工智能平臺的熟練人員、小型組織的預算有限、擔心替換人類導致失業、對人工智能產生的數據持懷疑態度以及黑箱現象。
? ? ? ?盡管如此,人工智能已被多家制藥公司采用,預計到2022年,制藥行業通過基于人工智能的解決方案將創造21.99億美元的收入。制藥組織需要弄清楚人工智能技術在解決問題方面的潛力,并了解可以實現的合理目標。擁有熟練的數據科學家、對人工智能技術有充分了解的軟件工程師,對公司的業務目標和研發目標有清晰的理解,才可以充分利用人工智能平臺的潛力。
? ? ?? 九、展望
? ? ? ?人工智能的進步正不斷地致力于減少制藥公司面臨的挑戰,影響藥物開發過程以及產品的整個生命周期,這表現在該行業初創企業數量的增加。當前的醫療保健部門正面臨著一些復雜的挑戰,例如藥物和治療費用的增加,而社會需要在這一領域進行具體的重大變革。隨著人工智能在醫藥產品制造中的應用,可以根據患者個人的需要制造具有所需劑量、釋放參數和其他所需方面的個性化藥物。使用最新的基于人工智能的技術不僅可以加快產品上市所需的時間,而且還可以提高產品質量和生產過程的整體安全性,在提高成本效益的同時,更好地利用現有資源。
? ? ? ?對于這些技術的應用,最令人擔憂的是隨之而來的失業以及實施人工智能所需的嚴格法規。然而,這些系統只是為了使工作更簡單,而不是完全取代人類。人工智能不僅有助于快速、無障礙地識別符合的化合物,而且有助于為這些分子的合成路線提供建議,以及對所需化學結構的預測,以及對藥物-靶相互作用及其SAR的理解。
? ? ? ?人工智能還可以為進一步將開發的藥物納入其正確的劑型以及優化其做出重大貢獻,此外,它還可以幫助快速決策,從而加快生產質量更好的產品,同時保證批次間的一致性。人工智能也有助于在臨床試驗中確定產品的安全性和有效性,并通過全面的市場分析和預測確保產品在市場上的適當定位和成本。雖然目前市場上還沒有采用基于人工智能的方法開發的藥物,而且在實施這項技術方面仍然存在一些具體的挑戰,但人工智能很可能在不久的將來成為制藥工業中一種無價的工具。
掃一掃關注我們
物端AI芯片??
邊緣AI計算設備?高通量AI服務器認知智能與協作計算