機(jī)器學(xué)習(xí)真能產(chǎn)生智能決策嗎?
出品 | AI科技大本營(yíng)(ID:rgznai100)
歷經(jīng)三年時(shí)間,我們?cè)?022年完成了圖靈獎(jiǎng)獲得者、加州大學(xué)洛杉磯分校計(jì)算機(jī)科學(xué)教授,美國(guó)國(guó)家科學(xué)院院士,被譽(yù)為“貝葉斯網(wǎng)絡(luò)之父”的朱迪亞·珀?duì)柎笞鳌兑蚬摚耗P?、推理和推斷》?/span>
這本書(shū)原版的第1版寫(xiě)于2000年,開(kāi)創(chuàng)了因果分析和推斷的新思想和新方法,一出版就得到廣泛的好評(píng),促進(jìn)了數(shù)據(jù)科學(xué)、人工智能、機(jī)器學(xué)習(xí)、因果分析等領(lǐng)域新的革命,在學(xué)術(shù)界產(chǎn)生了很大的影響。
后來(lái)又于2009年修訂出了第2版,內(nèi)容上結(jié)合當(dāng)時(shí)因果研究的新發(fā)展,做了較大的改動(dòng)。目前我們翻譯的這本書(shū)英文原版是在2009年出版的,到目前已經(jīng)有十多年了。
該書(shū)中文版的出版有利于廣大中國(guó)學(xué)者、學(xué)生和各領(lǐng)域的實(shí)踐人員了解和掌握因果模型、推理和推斷相關(guān)的內(nèi)容。特別是在當(dāng)前統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)流行的時(shí)代,如何實(shí)現(xiàn)從“數(shù)據(jù)擬合”到“數(shù)據(jù)理解”的轉(zhuǎn)變?如何在下一個(gè)十年里,從“所有知識(shí)都來(lái)自數(shù)據(jù)本身”這一目前占據(jù)主流的假設(shè)到一個(gè)全新的機(jī)器學(xué)習(xí)范式?是否會(huì)引發(fā)“第二次人工智能革命”?
正如圖靈獎(jiǎng)授予珀?duì)枙r(shí)評(píng)價(jià)他的工作為“人工智能領(lǐng)域的基礎(chǔ)性貢獻(xiàn),他提出概率和因果性推理演算法,徹底改變了人工智能最初基于規(guī)則和邏輯的方向。” 我們期待這種范式能夠?yàn)闄C(jī)器學(xué)習(xí)帶來(lái)新的技術(shù)方向和前進(jìn)動(dòng)力,并且最終能夠在實(shí)際應(yīng)用中發(fā)揮作用。
正如珀?duì)査f(shuō)“數(shù)據(jù)擬合目前牢牢地統(tǒng)治著當(dāng)前的統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域,是當(dāng)今大多數(shù)機(jī)器學(xué)習(xí)研究者的主要研究范式,尤其是那些從事連接主義、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的研究者?!?nbsp;這種以“數(shù)據(jù)擬合”為核心的范式在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別和自動(dòng)駕駛等應(yīng)用領(lǐng)域取得了令人矚目的成功。但是,許多數(shù)據(jù)科學(xué)領(lǐng)域的研究人員也已經(jīng)意識(shí)到,從當(dāng)前實(shí)踐效果來(lái)看,機(jī)器學(xué)習(xí)無(wú)法產(chǎn)生智能決策所需的那種理解能力。這些問(wèn)題包括:穩(wěn)健性、可遷移性、可解釋性等。下面我們來(lái)看看例子。
數(shù)據(jù)統(tǒng)計(jì)靠譜嗎?
近年來(lái)自媒體上的很多人都會(huì)覺(jué)得自己是統(tǒng)計(jì)學(xué)家。因?yàn)椤皵?shù)據(jù)擬合”“所有知識(shí)都來(lái)自數(shù)據(jù)本身”為許多重大決策提供了數(shù)據(jù)統(tǒng)計(jì)依據(jù)。但是,在進(jìn)行分析時(shí),我們需要謹(jǐn)慎分析。畢竟,事情可能并不總是乍看之下!一個(gè)與我們生活息息相關(guān)的案例。10年前,某城市市中心的房?jī)r(jià)是8000元/平米,共銷售了1000萬(wàn)平;高新區(qū)是4000元/平米,共銷售了100萬(wàn)平;整體來(lái)看,該市的平均房?jī)r(jià)為7636元/平米。現(xiàn)在,市中心10000元/平米,但由于市中心的土地供應(yīng)少了,只銷售了200萬(wàn)平;高新區(qū)是6000元/平米,但由于新開(kāi)發(fā)的土地變多了,銷售了2000萬(wàn)平;整體來(lái)看,現(xiàn)在該市的平均房?jī)r(jià)為6363元/平米。因此,分區(qū)來(lái)看房?jī)r(jià)分別都漲了,但從整體上看,會(huì)有產(chǎn)生疑惑:為什么現(xiàn)在的房?jī)r(jià)反而跌了呢?
圖1 房?jī)r(jià)趨勢(shì)按照不同區(qū)域劃分后與總體結(jié)論相悖
我們知道這種現(xiàn)象叫作辛普森悖論。這些案例清楚地表明當(dāng)我們沒(méi)有給予足夠的觀察變量時(shí),我們是如何從統(tǒng)計(jì)數(shù)據(jù)中得到了完全錯(cuò)誤的模型和結(jié)論。就這次新冠大流行而言,我們通常會(huì)獲得全國(guó)范圍的統(tǒng)計(jì)數(shù)據(jù)。如果我們按地區(qū)或市縣進(jìn)行分組,我們可能會(huì)得出截然不同的結(jié)論。在全國(guó)范圍內(nèi),我們可以觀察到新冠病例數(shù)量在下降,盡管某些地區(qū)的病例數(shù)量會(huì)有所增加(這可能預(yù)示著下一波浪潮的開(kāi)始)。如果存在差異很大的群體,例如人口差異很大的地區(qū),則也可能會(huì)發(fā)生這種情況。在國(guó)家數(shù)據(jù)中,人口密度較低地區(qū)的病例激增可能與人口稠密地區(qū)的病例下降相形見(jiàn)絀。
類似的基于“數(shù)據(jù)擬合”的統(tǒng)計(jì)問(wèn)題比比皆是。比如下面兩個(gè)有趣的例子。
如果我們每年收集尼古拉斯·凱奇每年出演的電影數(shù)量和美國(guó)溺死人數(shù)的數(shù)據(jù),我們會(huì)發(fā)現(xiàn)這兩個(gè)變量高度相關(guān),數(shù)據(jù)擬合程度奇高。
圖2 尼古拉斯·凱奇每年出演的電影數(shù)與美國(guó)溺死的人數(shù)
如果我們收集每個(gè)國(guó)家人均牛奶銷售量和獲得諾貝爾獎(jiǎng)人數(shù)的數(shù)據(jù),我們會(huì)發(fā)現(xiàn)這兩個(gè)變量高度相關(guān)。
圖3 人均牛奶消費(fèi)量與諾貝爾獎(jiǎng)人數(shù)
從我們?nèi)祟惖某WR(shí)認(rèn)知來(lái)說(shuō),這些都是偽相關(guān),甚至是悖論。但從數(shù)學(xué)和概率論的角度來(lái)看,表現(xiàn)出偽相關(guān)或者悖論的案例無(wú)論從數(shù)據(jù)上還是計(jì)算上都是沒(méi)有問(wèn)題的。如果有一些因果基礎(chǔ)的人都知道,發(fā)生這種情況是因?yàn)閿?shù)據(jù)中隱藏著所謂的潛伏變量,即未被觀察到的混雜因子。
圖4 獨(dú)立變量導(dǎo)致了兩個(gè)變量之間偽相關(guān)
珀?duì)栐凇兑蚬摗分薪o出了解決的范式,詳細(xì)分析和推導(dǎo)了以上問(wèn)題,強(qiáng)調(diào)了因果與統(tǒng)計(jì)之間有著本質(zhì)的區(qū)別,雖然因果分析與推斷仍然是建立在統(tǒng)計(jì)學(xué)的語(yǔ)境上。珀?duì)柼岢隽烁深A(yù)操作(算子)的基本計(jì)算模式,包括后門(mén)原則和具體的計(jì)算公式,這是當(dāng)前對(duì)于因果關(guān)系最為數(shù)學(xué)化的描述?!耙蚬约跋嚓P(guān)的概念(例如隨機(jī)化、混雜、干預(yù)等)不是統(tǒng)計(jì)概念”,這是貫穿珀?duì)栆蚬治鏊枷氲囊粭l基本原理,珀?duì)柗Q之為第一原理[2]。
那么,目前基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法,特別是那些嚴(yán)重依賴于統(tǒng)計(jì)學(xué)方法的算法,學(xué)習(xí)到的模型極大可能也會(huì)出現(xiàn)半真半假、誤導(dǎo)性或者反轉(zhuǎn)性的結(jié)果。這是因?yàn)檫@些模型往往是基于觀察數(shù)據(jù)的分布情況進(jìn)行學(xué)習(xí),而非數(shù)據(jù)生成的機(jī)制。
機(jī)器學(xué)習(xí)亟需解決的三個(gè)問(wèn)題
穩(wěn)健性:隨著深度學(xué)習(xí)方法的流行,計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和語(yǔ)音識(shí)別等研究大量利用了最先進(jìn)的深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。但仍然長(zhǎng)期存在這樣一個(gè)事實(shí)問(wèn)題,即在現(xiàn)實(shí)世界中,我們采集到數(shù)據(jù)的分布通常很少是完整的,與實(shí)際世界中的分布可能不一致。在計(jì)算機(jī)視覺(jué)應(yīng)用中,訓(xùn)練集與測(cè)試集數(shù)據(jù)分布可能受到來(lái)自諸如像素差、壓縮質(zhì)量,或來(lái)自于攝像機(jī)位移、旋轉(zhuǎn)或角度等的影響。這些變量其實(shí)就是因果概念中的“干預(yù)”問(wèn)題。由此,人們提出了簡(jiǎn)單的算法來(lái)模擬干預(yù),以專門(mén)測(cè)試分類和識(shí)別模型的泛化能力,如空間偏移、模糊、亮度或?qū)Ρ榷鹊淖兓?、背景控制和旋轉(zhuǎn),以及在多種環(huán)境中采集的圖像等。到目前為止,盡管我們利用數(shù)據(jù)增強(qiáng)、預(yù)訓(xùn)練、自監(jiān)督學(xué)習(xí)等方法在穩(wěn)健性上取得了一定的進(jìn)展,但對(duì)于如何解決這些問(wèn)題還沒(méi)有明確的共識(shí)。有人認(rèn)為這些修正可能是不夠的,在獨(dú)立同分布假設(shè)之外進(jìn)行泛化不僅需要學(xué)習(xí)變量之間的統(tǒng)計(jì)關(guān)聯(lián),還需要學(xué)習(xí)潛在的因果模型,以明確數(shù)據(jù)生成的機(jī)制,并允許通過(guò)干預(yù)概念模擬分布變化。
可遷移性:嬰兒對(duì)物體的理解基于跟蹤隨時(shí)間變化表現(xiàn)一致的物體,這樣的方法可以讓嬰兒快速學(xué)習(xí)新的任務(wù),因?yàn)樗麄儗?duì)物體的知識(shí)和直觀理解可以重復(fù)使用。類似地,能夠高效地解決現(xiàn)實(shí)世界中的任務(wù)需要在新的場(chǎng)景中重用學(xué)習(xí)到的知識(shí)技能。研究已經(jīng)證明,學(xué)習(xí)了環(huán)境知識(shí)的機(jī)器學(xué)習(xí)系統(tǒng)效率更高,通用性更好。如果我們將現(xiàn)實(shí)世界模型化,許多模塊在不同的任務(wù)和環(huán)境中表現(xiàn)出相似的行為。因此,面對(duì)新環(huán)境或新任務(wù),人類或者機(jī)器可能只需要調(diào)整其內(nèi)部表示中的幾個(gè)模塊。當(dāng)學(xué)習(xí)因果模型時(shí),由于大多數(shù)知識(shí)(即模塊)可以在無(wú)須進(jìn)一步訓(xùn)練的情況下重復(fù)使用,從而只需要較少的樣本以適應(yīng)新環(huán)境或新任務(wù)。
可解釋性:可解釋性是一個(gè)微妙的概念,不能僅僅使用布爾邏輯或統(tǒng)計(jì)概率的語(yǔ)言完全描述,它需要額外的干預(yù)概念,甚至是反事實(shí)的概念。因果關(guān)系中的可操縱性定義關(guān)注的是這樣一個(gè)事實(shí),即條件概率(“看到人們打開(kāi)雨傘表明正在下雨”)無(wú)法可靠地預(yù)測(cè)主動(dòng)干預(yù)的結(jié)果(“收起雨傘并不能阻止下雨”)。因果關(guān)系被視為推理鏈的組成部分,它可以為與觀察到的分布相去甚遠(yuǎn)的情況提供預(yù)測(cè),甚至可以為純粹假設(shè)的場(chǎng)景提供結(jié)論。從這個(gè)意義上說(shuō),發(fā)現(xiàn)因果關(guān)系意味著獲得可靠的知識(shí),這些知識(shí)不受觀察到的數(shù)據(jù)分布和訓(xùn)練任務(wù)的限制,從而為可解釋的學(xué)習(xí)提供明確的說(shuō)明。
因果學(xué)習(xí)建模的三個(gè)層次
具體地說(shuō),基于統(tǒng)計(jì)模型的機(jī)器學(xué)習(xí)模型只能對(duì)相關(guān)關(guān)系進(jìn)行建模,而相關(guān)關(guān)系往往會(huì)隨著數(shù)據(jù)分布的變化而變化;而因果模型基于因果關(guān)系建模,則抓住了數(shù)據(jù)生成的本質(zhì),反映了數(shù)據(jù)生成機(jī)制的關(guān)系,這樣的關(guān)系更加穩(wěn)健,具有分布外泛化的能力。比如,在決策理論中,因果關(guān)系和統(tǒng)計(jì)之間的區(qū)別更加清楚。決策理論中有兩類問(wèn)題,一類是已知當(dāng)前環(huán)境,擬采取干預(yù),預(yù)測(cè)結(jié)果。另一類是已知當(dāng)前環(huán)境和結(jié)果,反推原因。前者稱為求果問(wèn)題,后者稱為溯因問(wèn)題[3]。
在獨(dú)立同分布條件下的預(yù)測(cè)能力
統(tǒng)計(jì)模型只是對(duì)觀察到的現(xiàn)實(shí)世界的粗淺描述,因?yàn)樗鼈冎魂P(guān)注相關(guān)關(guān)系。對(duì)于樣本和標(biāo)簽,我們可以通過(guò)估計(jì)來(lái)回答這樣的問(wèn)題:“這張?zhí)囟ǖ恼掌杏幸恢还返母怕适嵌嗌伲俊薄耙阎恍┌Y狀,心力衰竭的概率是多少?”。這樣的問(wèn)題是可以通過(guò)觀察足夠多的由所生成的獨(dú)立同分布數(shù)據(jù)來(lái)回答的。盡管機(jī)器學(xué)習(xí)算法可以把這些事做得很好,但是準(zhǔn)確的預(yù)測(cè)結(jié)果對(duì)于我們的決策是不夠,而因果學(xué)習(xí)為其提供了一種有益的補(bǔ)充。就前面的例子來(lái)說(shuō),尼古拉斯·凱奇出演電影的頻率和美國(guó)溺亡率正相關(guān),我們的確可以訓(xùn)練一個(gè)統(tǒng)計(jì)學(xué)習(xí)模型通過(guò)尼古拉斯·凱奇出演電影的頻率來(lái)預(yù)測(cè)美國(guó)溺亡率,但顯然這兩者并沒(méi)有什么直接的因果關(guān)系。統(tǒng)計(jì)模型只有在獨(dú)立同分布的情況下才是準(zhǔn)確的,如果我們做任何的干預(yù)來(lái)改變數(shù)據(jù)分布,就會(huì)導(dǎo)致統(tǒng)計(jì)學(xué)習(xí)模型出錯(cuò)。
在分布偏移/干預(yù)下的預(yù)測(cè)能力
我們進(jìn)一步討論干預(yù)問(wèn)題,它更具挑戰(zhàn)性,因?yàn)楦深A(yù)(操作)會(huì)使我們跳出統(tǒng)計(jì)學(xué)習(xí)中獨(dú)立同分布的假設(shè)。繼續(xù)用尼古拉斯·凱奇的例子,“今年增加邀請(qǐng)尼古拉斯·凱奇出演電影的數(shù)量會(huì)增加美國(guó)的溺亡率嗎?”就是一個(gè)干預(yù)問(wèn)題。顯然,人為的干預(yù)會(huì)使得數(shù)據(jù)分布發(fā)生變化,統(tǒng)計(jì)學(xué)習(xí)賴以生存的條件就會(huì)被打破,所以它會(huì)失效。另一方面,如果我們可以在存在干預(yù)的情況下學(xué)習(xí)一個(gè)預(yù)測(cè)模型,那么這有可能讓我們得到一個(gè)在現(xiàn)實(shí)環(huán)境中對(duì)分布變化更加穩(wěn)健的模型。實(shí)際上,這里所謂的干預(yù)并不是什么新鮮事,很多事情本身就是隨時(shí)間變化的,例如人的興趣偏好,或者模型的訓(xùn)練集與測(cè)試集本身在分布上就存在不匹配的現(xiàn)象。我們前面已經(jīng)提到,神經(jīng)網(wǎng)絡(luò)的穩(wěn)健性已經(jīng)獲得了越來(lái)越多的關(guān)注,成為一個(gè)與因果推斷緊密連接的研究話題。在分布偏移的情況下預(yù)測(cè)不能只局限于在測(cè)試集上取得高準(zhǔn)確率,如果我們希望在實(shí)際應(yīng)用中使用機(jī)器學(xué)習(xí)算法,那么我們必須相信在環(huán)境條件改變的情況下,模型的預(yù)測(cè)結(jié)果也是準(zhǔn)確的。實(shí)際應(yīng)用中的分布偏移類別可能多種多樣,一個(gè)模型僅僅在某些測(cè)試集上取得好效果,不能代表我們可以在任何情況下都能夠信任這個(gè)模型,這些測(cè)試集可能只是恰好符合這些測(cè)試集樣本的分布。為了讓我們可以在盡可能多的情況下信任預(yù)測(cè)模型,就必須采用具有回答干預(yù)問(wèn)題能力的模型,至少僅僅使用統(tǒng)計(jì)學(xué)習(xí)模型是不行的。
回答反事實(shí)問(wèn)題的能力
反事實(shí)問(wèn)題涉及推理事情為什么會(huì)發(fā)生,想象實(shí)施不同行為所帶來(lái)的后果,并由此可以決定采取何種行為來(lái)達(dá)到期望的結(jié)果。回答反事實(shí)問(wèn)題比干預(yù)更加困難,但也是對(duì)于AI非常關(guān)鍵的挑戰(zhàn)。如果一個(gè)干預(yù)問(wèn)題是“如果我們現(xiàn)在讓一個(gè)病人有規(guī)律地進(jìn)行鍛煉,那么他心力衰竭的概率會(huì)如何變化?”,對(duì)應(yīng)的反事實(shí)問(wèn)題就是“如果這個(gè)已經(jīng)發(fā)生心力衰竭的病人一年前就開(kāi)始鍛煉,那他還會(huì)得心力衰竭嗎?”顯然回答這樣的反事實(shí)問(wèn)題對(duì)于強(qiáng)化學(xué)習(xí)是很重要的,它們可以通過(guò)反思自己的決策,制定反事實(shí)假說(shuō),再通過(guò)實(shí)踐驗(yàn)證,就像我們的科學(xué)研究一樣。
因果學(xué)習(xí)應(yīng)用
最后,我們來(lái)看看如何在各個(gè)領(lǐng)域上應(yīng)用因果學(xué)習(xí)。2021年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了約書(shū)亞·安格里斯特(Joshua D.Angrist)和吉多·因本斯(Guido W.Imbens),表彰“他們對(duì)因果關(guān)系分析的方法論”貢獻(xiàn)。他們研究了因果推斷在實(shí)證勞動(dòng)經(jīng)濟(jì)學(xué)中的應(yīng)用。諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)評(píng)選委員認(rèn)為“自然實(shí)驗(yàn)(隨機(jī)試驗(yàn)或者對(duì)照試驗(yàn))有助于回答重要問(wèn)題”,但如何“使用觀測(cè)數(shù)據(jù)回答因果關(guān)系”更具有挑戰(zhàn)性。經(jīng)濟(jì)學(xué)中的重要問(wèn)題是因果關(guān)系問(wèn)題。如移民如何影響當(dāng)?shù)厝说膭趧?dòng)力市場(chǎng)前景?讀研究生能夠影響收入增加嗎?最低工資對(duì)技術(shù)工人的就業(yè)前景有何影響?這些問(wèn)題很難回答,因?yàn)槲覀內(nèi)狈φ_的反事實(shí)解釋方法。
自從20世紀(jì)70年代以來(lái),統(tǒng)計(jì)學(xué)家就發(fā)明了一套計(jì)算“反事實(shí)”的框架,以揭示兩個(gè)變量之間的因果效應(yīng)。經(jīng)濟(jì)學(xué)家又在此基礎(chǔ)上進(jìn)一步發(fā)展了斷點(diǎn)回歸、雙重差分、傾向得分等方法,并且大量地應(yīng)用在各種經(jīng)濟(jì)政策問(wèn)題的因果性研究上。從6世紀(jì)的宗教文本到2021年的因果機(jī)器學(xué)習(xí),包括因果自然語(yǔ)言處理,我們可以使用機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)來(lái)模擬因果效應(yīng)。經(jīng)濟(jì)和其他社會(huì)科學(xué)的分析主要圍繞因果效應(yīng)的估計(jì),即一個(gè)特征變量對(duì)于結(jié)果變量的干預(yù)效應(yīng)。實(shí)際上,在大多數(shù)情況下,我們感興趣的事情是所謂的干預(yù)效應(yīng)。干預(yù)效應(yīng)是指干預(yù)或者治療對(duì)結(jié)果變量的因果影響。比如在經(jīng)濟(jì)學(xué)中,分析最多的干預(yù)效應(yīng)之一是對(duì)企業(yè)進(jìn)行補(bǔ)貼對(duì)企業(yè)收入的因果影響。為此,魯賓(Rubin)提出了潛在結(jié)果框架(potential outcome framework)。
盡管經(jīng)濟(jì)學(xué)家和其他社會(huì)科學(xué)家對(duì)因果效應(yīng)的精確估計(jì)能力強(qiáng)于預(yù)測(cè)能力,但他們對(duì)機(jī)器學(xué)習(xí)方法的預(yù)測(cè)優(yōu)勢(shì)也十分感興趣。例如,精確的樣本預(yù)測(cè)能力或處理大量特征的能力。但正如我們所見(jiàn)到的,經(jīng)典機(jī)器學(xué)習(xí)模型并非旨在估計(jì)因果效應(yīng),使用機(jī)器學(xué)習(xí)中現(xiàn)成的預(yù)測(cè)方法會(huì)導(dǎo)致對(duì)因果效應(yīng)的估計(jì)存在偏差。那么,我們必須改進(jìn)現(xiàn)有的機(jī)器學(xué)習(xí)技術(shù),以利用機(jī)器學(xué)習(xí)的優(yōu)勢(shì)來(lái)持續(xù)有效地估計(jì)因果效應(yīng),這就促使了因果機(jī)器學(xué)習(xí)的誕生!
目前,根據(jù)要估計(jì)的因果效應(yīng)類型,因果機(jī)器學(xué)習(xí)可以大致分為兩個(gè)研究方向。一個(gè)重要的方向是改進(jìn)機(jī)器學(xué)習(xí)方法以用于無(wú)偏且一致的平均干預(yù)效應(yīng)估計(jì)。該研究領(lǐng)域的模型試圖回答以下問(wèn)題:客戶對(duì)營(yíng)銷活動(dòng)的平均反應(yīng)是什么??jī)r(jià)格變化對(duì)銷售額的平均影響是多少?此外,因果機(jī)器學(xué)習(xí)研究的另一條發(fā)展路線是側(cè)重于改進(jìn)機(jī)器學(xué)習(xí)方法以揭示干預(yù)效應(yīng)的特異性,即識(shí)別具有大于或小于平均干預(yù)效應(yīng)的個(gè)體亞群。這類模型旨在回答以下問(wèn)題:哪些客戶對(duì)營(yíng)銷活動(dòng)的反應(yīng)最大??jī)r(jià)格變化對(duì)銷售額的影響如何隨著顧客年齡的變化而變化?
除了這些活生生的例子,我們還可以感覺(jué)到因果機(jī)器學(xué)習(xí)引起數(shù)據(jù)科學(xué)家興趣的一個(gè)更深刻的原因是模型的泛化能力。具備描述數(shù)據(jù)之間因果關(guān)系的機(jī)器學(xué)習(xí)模型可泛化到新的環(huán)境中,但這仍然是目前機(jī)器學(xué)習(xí)的最大挑戰(zhàn)之一。
珀?duì)柛顚哟蔚胤治鲞@些問(wèn)題,認(rèn)為如果機(jī)器不會(huì)因果推理,我們將永遠(yuǎn)無(wú)法獲得達(dá)到真正人類水平的人工智能,因?yàn)橐蚬P(guān)系是我們?nèi)祟愄幚砗屠斫庵車鷱?fù)雜世界的關(guān)鍵機(jī)制。珀?duì)栐凇兑蚬摗分形陌娴男蛑袑?xiě)到“在下一個(gè)十年里,這個(gè)框架將與現(xiàn)有的機(jī)器學(xué)習(xí)系統(tǒng)相結(jié)合,從而可能引發(fā)‘第二次因果革命’。我希望這本書(shū)也能使中國(guó)讀者積極參與到這一場(chǎng)即將到來(lái)的革命之中?!?/span>
參考文獻(xiàn):[1] 珀?duì)? 因果論:模型、推理和推斷(原書(shū)第2版)[M]. 劉禮,等譯. 北京:機(jī)械工業(yè)出版社,2022.[2] 劉禮,吳飛,李廉. 因果關(guān)系學(xué)習(xí)的思維取向和概念分析[J]. 中國(guó)大學(xué)教學(xué),2021(10):35-42.[3] WANG A G, LIU L, YANG J Y, LI L, Causality Fields in Nonlinear Causal Effect Analysis [J]. Frontiers of Information Technology & Electronic Engineering, 2022,23(8):1277-1286.
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。