專訪智化科技創(chuàng)始人夏寧:從0開始,深耕10年,化學合成走向數(shù)字化自動化智能化
以下文章來源于ScienceAI ,作者ScienceAI
編輯/凱霞
新****研發(fā)面臨著成本高,時間長,成功率低的巨大痛點。隨著人工智能(AI)的發(fā)展,為新****研發(fā)帶來了新的技術手段。
化學合成在臨床前****物研發(fā)中是一個非常重要的步驟。如果能夠提高合成分子的速度,將加速新****研發(fā)。AI 可以幫助化學家進行合成路線的設計和優(yōu)化,極大地減少設計需要的時間,提高路線成功率。
武漢智化科技有限公司(「智化科技」)專注于 AI 輔助化學合成路線設計,其獨立研發(fā)的算法基于數(shù)據(jù)學習和化學知識進行分解,解決了可解釋性、化學反應數(shù)據(jù)量兩大問題。
智化科技推出的國產(chǎn)「計算機輔助合成規(guī)劃平臺」—— ChemAIRS,只需數(shù)秒至幾分鐘就可找到合成路線,為科研人員推薦最合適的合成方案。
智化科技創(chuàng)始人夏寧有著 IT 與化學雙重學術背景,帶領團隊在化學信息學領域深耕十余年,有著豐富的研發(fā)經(jīng)驗,并積累了大量化學化工的專業(yè)數(shù)據(jù),是國內(nèi)從事 AI 賦能化學合成領域的先行者。
機器之心·ScienceAI 對智化科技創(chuàng)始人、董事長兼 CEO 夏寧進行了獨家專訪。CNRS有機化學博士,化學/計算機雙背景。博士畢業(yè)后在法國參與創(chuàng)建了 eNovalys 公司,任 CTO,負責化學信息學的研發(fā)產(chǎn)品設計,自主研發(fā)了多項核心技術。2015 年回國加入上海網(wǎng)化化工科技,任化學信息總監(jiān)。2018 年創(chuàng)立武漢智化科技并兼任 CEO。在化學信息學領域深耕多年,掌握多項核心技術。
夏寧,智化科技創(chuàng)始人、董事長兼 CEO
01 化學/AI雙背景,10 年堅持做一件事
ScienceAI: 您早期的個人求學以及職業(yè)經(jīng)歷能給我們分享一下嗎?
夏寧:2003 年,我從同濟大學畢業(yè)之后,當時有一個去法國留學的機會,也可以說第一批到法國的高等工程師學校去學習化學的人,在我們學校我是第一個中國人。我母親是程序員,我早年就比較喜歡編程,在高中的時候,化學競賽獲得了河北省第一名,所以后來選了化學專業(yè),但我在求學的過程中,一直想把我的這兩個技能都能夠用在我未來的工作中,所以我在法國讀到有機化學博士之后找的第一份工作,就在網(wǎng)上找這種既能夠用到計算機,又同時能用到化學專業(yè)的工作,但沒有找到這樣的工作。后來我聯(lián)系上了法國斯特拉斯堡的一家剛成立的公司-eNovalys 的創(chuàng)始人,入職時我是一號員工。那個時候我們就開始用計算機來解決化學中研發(fā)效率的問題。所以,從那時一直到現(xiàn)在,其實我們做的都是這一件事情——用計算機幫助提升化學研發(fā)效率。
ScienceAI: 您是因何創(chuàng)立智化科技的。您的創(chuàng)業(yè)成功經(jīng)驗能給我們分享一下嗎?
夏寧:其實在這個領域,我們做了將近 10 年,但它真正迎來一個快速發(fā)展,是大概在 2018 年的時候,那時深度學習剛剛變得很火熱,特別是當時 AlphaGo 打敗了李世石,讓人們看到人工智能在一些領域的潛力。我們在這個領域已經(jīng)做了很多年了,突然間發(fā)現(xiàn)大家都開始關注這個領域。早在2016 年,我們就做了一個網(wǎng)上的逆合成工具,給很多用戶來用。但直到 2018 年我們才決定從上海網(wǎng)化化工科技獨立出來,創(chuàng)立新的公司——智化科技。之后我們開始專注于的逆合成產(chǎn)品的研發(fā)。ScienceAI: 您對國內(nèi)創(chuàng)業(yè)情況的判斷是怎樣的?夏寧:從創(chuàng)業(yè)的角度,我覺得國內(nèi)的創(chuàng)業(yè)環(huán)境一直是非常不錯的,從大概 2015 年之后,我們國家就成為全世界創(chuàng)業(yè)最火熱的國家之一。我很有幸正好回國之后趕上了這波浪潮,所以能夠在創(chuàng)業(yè)初期就進展比較順利,從融資和業(yè)務上都比較順利。一直到今天,我還是覺得中國是創(chuàng)業(yè)最好的地方。
02 交叉型人才緊缺,助力培養(yǎng)「化學+AI」跨界人才
ScienceAI: 基于目前大多數(shù)人才相對偏向于單學科人才,對于「化學+AI」 跨學科研究,公司在這方面是怎么協(xié)調(diào)的?不同類型的人才如何在新****研發(fā)過程中發(fā)揮優(yōu)勢和潛能?
夏寧:對,這個確實是當前我們做交叉領域創(chuàng)新的一個最大的痛點。你可以找到一個很厲害的化學家,你也可以找到一個很厲害的做算法做 AI 的人,但是你基本上找不到兩個專業(yè)都很厲害的人,甚至不是說稀少,幾乎是沒有,因為很少有人能夠在兩個領域都做到非常的專精。對我們來說,有幾方面的努力。一方面我們也會自己去培養(yǎng)人才。在我們的內(nèi)部找一些有潛質(zhì)的,特別是他已經(jīng)有一個專業(yè),同時又對另一個專業(yè)愿意去學習的人,我們就給他更多的機會去培養(yǎng)去成長。同時,我們也和高校,比如我們和華中科技大學有一些合作項目,從本科開始讓這些化學系的學生能夠去學一些編程知識,甚至是學一些 AI,自動化等知識。他們在未來,比如 5、6 年后,他們能夠成為這個領域的一些核心人才。當然,我們也在全球范圍內(nèi)在去找這樣的人,這樣的人他確實非常的少,但還是有那么一些。但確實對于所有當前在我們這個交叉領域創(chuàng)業(yè)的大部分公司來講,大家都面臨這個問題,因為就那么幾個人,但是要做的事情太多。
ScienceAI: 對于您剛提到的華中科技大學和智化科技聯(lián)合創(chuàng)辦「人工智能化學試驗班」,這些人才是否作為公司的儲備人才?這對現(xiàn)階段的人才培養(yǎng)體系有什么啟發(fā)?
夏寧:其實我們的初衷不是說讓他們就一定要來我們公司,因為他們現(xiàn)在還是本科,等到他們博士畢業(yè)之后可能已經(jīng)過了四五年,再加上他們未來還可能繼續(xù)去深造去學習,最后也可能去別的公司。但我覺得這對整個行業(yè)是有好處的,因為一個行業(yè)要想做得好,你必須有一個長期的人才培訓機制直到能夠滿足我們的行業(yè)的需求,所以這本身就是個周期很長的事情。我覺得國外可能在這方面做的也不錯,可能甚至比我們做的更好一點,因為我們發(fā)現(xiàn)這方面最牛的一些人很多都是國外像 MIT、劍橋、瑞士聯(lián)邦理工等,有一些國外的名校,他們確實善于培養(yǎng)這類復合型人才。我們國內(nèi)的大學早期確實是沒有這樣的一個專業(yè),但是現(xiàn)在大家逐漸都有這個意識,我們與華科的合作,我覺得只是一個開始,已經(jīng)越來越多的大學開展了交叉學科的建設。
03 從零開始,不斷升級
ScienceAI: 貴公司推出的「計算機輔助合成規(guī)劃平臺」—— ChemAIRS,與其它合成路線規(guī)劃工具相比,有什么優(yōu)勢呢?還有哪些不足需要改進嗎?
夏寧:我們平臺最大的一個優(yōu)勢是,我們的技術完全是從 0 開始做的,就是說我們所做的在全球來說是最早的一批,大概當時算我們在內(nèi)可能也就三家公司,到現(xiàn)在有了很多新跟進的公司,但是相比來說,我們的底層技術完全是自己從零開始搭建的,這就形成了我們一個獨特的技術壁壘,就是說別人其實很難去復制我們所做的,因為很簡單,我們已經(jīng)做了接近超過 10 年的時間,中間研究了大量的底層技術,別人如果想一步跨過這些來追我們,幾乎是不可能的。當然,現(xiàn)在也有很多新的技術,這些技術可能能夠在某個層面上解決問題,比如說我們看到的一些競爭對手,他也用了很多的機器學習技術,包括一些新的 AI 算法,但他們的問題就在于,對化學的理解可能沒有那么深。我認為一個不懂化學,或者說化學方面沒有那么專精的人,他想把這個事情做好是有相當大的一個難度,這個可能就是我們最大的優(yōu)勢,就是我們既懂化學又懂算法。
ScienceAI: AI 自動化合成平臺有其它功能正在開發(fā),或升級嗎,方便透漏一下嗎?
夏寧:我們的平臺今年做了一個比較大的升級,我們已經(jīng)對公眾開放三個月的試用,讓所有的化學家都可以來我們網(wǎng)上免費去嘗試這個平臺。我們認為這次大的升級,能夠讓它在整體水平上或者說路線設計能力上提高了一大步,非常接近十年合成工作經(jīng)驗的化學家水平。我們的下一步就是把它的水平再次不斷提高,我們希望有一天能夠真正和最厲害的化學家達到同一個水平。
04 多方位部署,走向數(shù)字化自動化智能化ScienceAI: 在****物領域,小分子、大分子、基因治療****物等都很火熱。那么,貴公司的自動化合成路線規(guī)劃平臺主要側(cè)重哪個方面呢?
夏寧:其實我們主要側(cè)重的還是小分子的合成。因為大分子很多是用生物的方法在合成,相對來說,小分子的合成方法比較傳統(tǒng),就是用化學反應來合成。因為我們?nèi)祟惛脑煳⒂^世界的手段其實并不是特別多,化學就是其中最重要的一種,它其實也不單單是只覆蓋了****物小分子,我們說所有的包括新材料,化工或者一些科技領域,都會用到一些特殊的材料分子,功能分子,那么這些分子從原料進行一步步合成,用到的都是一些化學的方法,特別是在小分子的研發(fā)階段,化學反應是最主要的一個手段。
ScienceAI: 新****研發(fā)是一個長期且艱難的過程,那么貴公司除了目前公開的「AI 輔助合成路線設計平臺」外,還有其它產(chǎn)品/業(yè)務部署嗎?
夏寧:我們主要還是聚焦在化學合成這個領域,我們也做了很多的模塊,除了逆合成模塊,也有正向合成模塊以及合成性打分模塊,它們能夠在****物分子設計階段幫助更有效地去選擇那些比較容易得到的分子,從而提高整個****物研發(fā)的速度。同時,我們還做了化學工藝路線設計,它能夠幫助我們在****物分子或者其他的分子進入到生產(chǎn)階段時,找到最經(jīng)濟、綠色、環(huán)保的生產(chǎn)方法。這是我們主要集中的幾個點,但是它最底層的技術仍然是逆合成技術。當然,整個新****研發(fā)鏈條很長,一定有其它的一些領域是我們不擅長做的。我們愿意通過合作的方式,因為有很多企業(yè),他們其實都有自己的長項。在這個鏈條上沒有人能夠把所有的事情都做得很好,所以大家是一個合作共贏互補的工作方式。
05 打破瓶頸,機遇與挑戰(zhàn)并存
ScienceAI:與傳統(tǒng)方式相比,在研發(fā)周期及時間成本上,智化科技推出的 AI 自動化合成平臺怎樣提供更好的服務呢?
夏寧:化學是一個非常傳統(tǒng)的學科,幾乎在近 100 年內(nèi),它的效率提升都非常有限,原因就在于,一直是人作為工作的主體。換句話說,它不管是從路線設計,依靠人的經(jīng)驗,從做實驗的操作,依靠的人的手工業(yè)操作,所以它整體的效率很低。人們也在不斷地嘗試去優(yōu)化效率,但是總體的一個思路,都集中在一些先進的儀器和分析儀器等,我們是希望能夠從更本質(zhì)的角度去提高效率,就是把人的因素盡量減少。那么人在設計路線的過程中,他可能要做很多的查閱,很多的思考,這個過程能不能夠用算法來代替,或者他在實驗操作過程中做了很多重復性勞動,很多很費時費力,但其實又不那么需要高級科學家來做的事情,是不是我們也能用一些自動化設備來代替?當然我說的代替其實不是說把人完全去掉,而是一個輔助人的過程,也就是人提效的過程。大家很容易理解,就是我們要做的事情不是說把人完全替代掉,而是讓這一個人可能能夠效率提升 2 倍 3 倍甚至到 5 倍,這樣他的產(chǎn)出就更高,只有產(chǎn)出更高了,我們才不受人力資源瓶頸的限制,因為現(xiàn)在整個制****的一個很大的問題就是我們的人不夠,我們要合成這么多分子,但是一個化學家一個月可能只能做四五個分子。所以我認為只有通量能夠提高,才能夠真正打開新****研發(fā)的最大瓶頸,從而能夠讓更多的新****被做出,或者說很多疾病能夠被攻克,我覺得這是一個必經(jīng)之路,我們現(xiàn)在就在做探索。
ScienceAI: 去年 8 月智化科技完成近 1500 萬美元 A+ 輪融資。您認為智化科技最吸引投資者的點是?
夏寧:我認為我們代表了整個化學行業(yè)的一個發(fā)展方向,即數(shù)字化自動化和智能化。因為這個方向其實在其他很多行業(yè)都已經(jīng)做了,但是化學行業(yè)一直沒有發(fā)生太大的改變。這個可能有很多原因,一個是做化學的人可能會偏保守一點,可能做這件事會有一些難度,還可能我們在這種交叉行業(yè)中人才確實儲備不夠。存在這樣一些困難,但是我們公司其實是最早也是最全力的在向這個方向去努力的,所以說在從投資人的檢驗中,我們應該是成功率最高的,我認為這個是我們獲得投資的一個關鍵點。
ScienceAI: 現(xiàn)在傳統(tǒng)的大****企與 AI 公司合作火熱,這給我們帶來的機遇和挑戰(zhàn)都有哪些?
夏寧:就機遇而言,在當前大環(huán)境下,****企其實也都間接或直接的體會到了合成的一個瓶頸,遇到效率低的問題,那么這時候他們也會去尋找一些新的解決方案,特別是 AI 的浪潮,也會讓大****企更容易去接受一些新的方案。如果我們早 5 年 10 年去找他們,他們可能根本就不愿意去看這種新的東西,因為他們老的方案還 work,但最近幾年老的方案已經(jīng)越來越難的時候,他們真的是愿意去嘗試,這對我們是好的。說到挑戰(zhàn),就是這個行業(yè),它的驗證是需要一定時間的,或者說它的產(chǎn)品的成熟也是需要一個周期的,很多時候,可能大****企與一個 AI 公司合作,但他發(fā)現(xiàn)你的解決方案還不能完全明顯的解決他的問題。這時對 AI公司來講要求就非常高,你必須要不斷的去找到新的 milestone,然后把你的整個的工作向前推進的同時,還要不斷的證明給客戶看到你的進展。否則就像你只是講了一個故事而已,這樣你的合作到最后是得不到任何的認可的。所以,我覺得一個新的技術,雖然它的發(fā)展很漫長,中間有很多困難,但你必須要一個確定的速度和一個不斷能夠被驗證的結(jié)果去給到這些市場,給到這個客戶,我認為這個是最大的一個挑戰(zhàn)。
ScienceAI: 在與****企合作的過程中,有遇到什么困難嗎?怎么解決的?
夏寧:早期的時候,我們是一個初創(chuàng)公司,初創(chuàng)公司對于****企來講,****企是一個巨頭,可能是一個跨國企業(yè),而你只是一個才幾十個人的一個小公司。所以就這點而言,其實大企業(yè)肯定不是優(yōu)先和初創(chuàng)公司合作,那么我們的優(yōu)勢是,我們能夠展現(xiàn)出很快的應答能力,以及我們的這種技術能力水平確實超過了其他的一些比我們大很多倍的競爭對手。所以這個其實是我們克服的第一個困難,就是真正得到了這些大****企對我們一個初創(chuàng)公司的認可。同時,我們本身的技術也在不斷的迭代成長中,這個也是一個挑戰(zhàn),你要有一個非??斓乃俣仍诘?,不能說等待,所以說你必須很快的去想,很快的去研發(fā),把一些關鍵的點快速的解決掉,這都是一些挑戰(zhàn)。還有一點,就是大****企對于你的合規(guī)性,整個服務指南要求也非常高,有點像一個初創(chuàng)公司要被拔苗助長,沒有那么多時間給你去成長,你必須立刻達到它的標準。這些確實都是我們整個公司的同事都付出了很大的努力才達到。
06 化學成為一個純計算學科,未來要解決的事太多了
ScienceAI: 對于 AI「塑造化學未來」,您能暢想一下這是一個怎樣的未來嗎?
夏寧:其實在我上中學的時候就有這個想法,因為我是一個從小喜歡編程和數(shù)學,我一直覺得化學學科和物理、數(shù)學是相割裂的,數(shù)學和物理學科是可以通過計算來解決各種問題。但化學有點像一個不確定的東西,就是你做這個實驗的時候,你完全不知道結(jié)果或者是它缺少了一個確定性,這點讓我一個做編程的人就很不舒服。我認為化學的未來,一定是通過我們不斷積累大量的數(shù)據(jù),以及寫出更好的算法來向確定性去靠近,最后能夠讓化學變成一個能夠計算的學科,不需要太多的這種所謂的猜測,或者是一些人工主觀判斷。因為只有這樣,在我看來才是一個真正的科學以及它的終極形態(tài),也就是效率是最高的。同時結(jié)合自動化的設備,讓新分子的產(chǎn)生就像流水線生產(chǎn)杯子一樣,而化學家可能成為坐在電腦前的一個類似 IT 行業(yè)的高效工作模式。
ScienceAI: 暢想未來,你認為未來 5~10 年行業(yè)的發(fā)展趨勢是什么?公司的近幾年發(fā)展目標是怎樣的?
夏寧:我覺得未來的 5~10 年內(nèi),數(shù)字化、自動化和智能化會不斷的在整個化學合成領域進行滲透,它占的比重會越來越大,可能在 10 年左右,我覺得可能百分之七八十的工作已經(jīng)都是用機器來做的,人真正做的工作可能不到現(xiàn)在的 1/3,相對來說我比較確定這一點會發(fā)生。我們公司發(fā)展目標也是根據(jù)這個趨勢來的。我們一個短期的目標,就是我們要建立起我們的數(shù)字化實驗室,比如上海已錸生物科技就是我們的一個數(shù)字化實驗室,我們會完全按照一套新的流程工作方法,把之前人工操作為主的實驗室,向這種數(shù)字化和自動化的實驗室去轉(zhuǎn)變。我們的中期目標,是我們會讓這種實驗室的效率不斷的提升,從全方位角度進行提升,那么最終有一天它會突破人力的瓶頸,它經(jīng)過這些算法自動化的加持之后,它整體的效率會高于一個普通人或者一個正常的傳統(tǒng)的實驗室。最終來講,我們最大的一個目標,還是通過不斷積累更多的數(shù)據(jù),真正能夠把我們之前做不到的一些事情,比如說我們無法合成的一些困難的分子,或者說我們做實驗總是會有失敗的反應,我們是不是能夠把它規(guī)避掉?我覺得最終還是真正的通過數(shù)據(jù)來解決了很多的化學合成問題,以及讓我們的效率再次能夠達到一個非常大的提升。
ScienceAI: 在新****研發(fā)、材料、科技等領域,還有哪些極具潛力的技術值得去探索?
夏寧:這個是一個非常大的領域。就是說我們現(xiàn)在做的事情,它只是一個最基礎、底層的事,或者說是邁出了第一步,但是我們未來可以做的事情非常多,因為只要你邁了第一步,你會發(fā)現(xiàn)豁然開朗,每一個領域都有無數(shù)的這種問題,可以通過AI、數(shù)據(jù)、計算去解決。所以我覺得未來要解決的事太多了,我們會找到最重要或者說最關鍵的事情去深入去做。同時,我覺得比如說 10 年之后,化學+AI 領域會變得非常的龐大,它會不僅僅是在合成,它會在比如材料、生物和一些科技領域都會成為最底層的一個技術。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。