推行算法審計(jì)大有可為
時(shí)間:2022-08-03
作者:沈艷
數(shù)字時(shí)代,開發(fā)利用數(shù)據(jù)正在成為社會(huì)治理的核心。關(guān)于人的重要決定,如衣食住行、生老病死、就業(yè)失業(yè)、言論傳播甚至司法審判,也越來越取決于不同場(chǎng)景中基于數(shù)據(jù)的運(yùn)算結(jié)果。
恰當(dāng)利用數(shù)據(jù),開發(fā)利用場(chǎng)景,至少可以發(fā)揮如下四點(diǎn)優(yōu)勢(shì):一是推動(dòng)市場(chǎng)環(huán)境更透明、信息更易于自由流動(dòng);二是降低搜尋成本;三是降低準(zhǔn)入門檻;四是推動(dòng)技術(shù)突破、效率提升,促進(jìn)產(chǎn)品和服務(wù)創(chuàng)新以及創(chuàng)新生態(tài)。
但是,如果不能規(guī)范數(shù)據(jù)開發(fā)利用中算法的應(yīng)用,也會(huì)帶來不少管理方面的挑戰(zhàn),其中算法歧視、算法黑箱、算法助力壟斷等問題尤為受到關(guān)注。
2020年起,中國(guó)展開對(duì)算法的立法和治理。例如,《法治社會(huì)建設(shè)實(shí)施綱要(2020-2025年)》提出規(guī)范算法推薦等新技術(shù)應(yīng)用的管理;2021年9月發(fā)布的《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》,強(qiáng)調(diào)要“建立健全算法安全治理機(jī)制”;2021年底發(fā)布的《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》指出,加快構(gòu)建算力、算法、數(shù)據(jù)、應(yīng)用資源協(xié)同的全國(guó)一體化大數(shù)據(jù)中心體系;2021年12月,國(guó)家網(wǎng)信辦等四部門聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,并于2022年3月1日起正式實(shí)施。至此,中國(guó)算法治理的立法體系初步建成。
但是,中國(guó)算法治理實(shí)踐仍然遇到不少挑戰(zhàn)。例如,對(duì)平臺(tái)的監(jiān)管模式主要是事后監(jiān)管,根據(jù)平臺(tái)的過錯(cuò)采取行政處罰措施,總體來看,缺乏事前的過程性監(jiān)管。
又如,目前對(duì)算法的監(jiān)管主要是從網(wǎng)絡(luò)安全、法律風(fēng)險(xiǎn)等角度作規(guī)范,技術(shù)性規(guī)范監(jiān)管較少。隨著大數(shù)據(jù)在社會(huì)治理中發(fā)揮越來越重要的作用,要求有關(guān)算法的監(jiān)管要盡可能避免“一刀切”、進(jìn)入常態(tài)化治理階段,實(shí)現(xiàn)“敏捷治理”,也就是使算法治理能夠跟上技術(shù)發(fā)展步伐。
要應(yīng)對(duì)算法治理帶來的新挑戰(zhàn),建議考慮推動(dòng)算法規(guī)則透明化,推動(dòng)輸入輸出和結(jié)果評(píng)估的算法審計(jì)。
算法審計(jì)指收集有關(guān)算法在特定應(yīng)用場(chǎng)景中使用時(shí)的表現(xiàn)數(shù)據(jù),然后使用這些數(shù)據(jù)來評(píng)估算法是否對(duì)人們的某些利益(或權(quán)利)產(chǎn)生了負(fù)面影響,從而評(píng)估算法本身好壞的過程。
美國(guó)在算法審計(jì)方面走在世界前列,當(dāng)然,該行業(yè)仍處在發(fā)展初期。2016年,美國(guó)政府關(guān)于算法系統(tǒng)和民權(quán)的報(bào)告鼓勵(lì)了算法審計(jì)業(yè)的發(fā)展。2021年,推特機(jī)器學(xué)習(xí)倫理、透明度與責(zé)任小組的主管拉曼·喬杜里(Rumman Chowdhury)指出,只有大約10到20家信譽(yù)良好的公司提供算法審查。不少公司也有自己的內(nèi)部審計(jì)團(tuán)隊(duì),在向公眾發(fā)布算法之前對(duì)其進(jìn)行審查。
算法審計(jì)可分為外部審計(jì)和內(nèi)部審計(jì)兩種。從外部審計(jì)角度看,監(jiān)管部門推動(dòng)算法審計(jì)至少可以有四方面作用:
一是評(píng)估某些算法是否合法合規(guī),如監(jiān)管部門審計(jì)銀行的放貸算法,以評(píng)估其是否確實(shí)能夠在不增加不良率的情況下做好風(fēng)控;
二是評(píng)估算法是否符合經(jīng)濟(jì)社會(huì)運(yùn)行規(guī)律,是否能避免“劣幣驅(qū)逐良幣”現(xiàn)象。
三是評(píng)估算法供應(yīng)商和買家的風(fēng)控能力,通過算法審計(jì)來評(píng)估相應(yīng)企業(yè)面臨的道德和聲譽(yù)風(fēng)險(xiǎn),以及在出現(xiàn)風(fēng)險(xiǎn)時(shí)的補(bǔ)救能力;
四是為平臺(tái)企業(yè)的利益相關(guān)方增加算法方面的信息透明度,幫助他們?cè)谕顿Y、與平臺(tái)打交道等方面做出知情選擇。
從內(nèi)部審計(jì)角度看,算法的評(píng)估和審計(jì)規(guī)劃應(yīng)作為企業(yè)或者組織發(fā)展規(guī)劃的一部分。具體來說,內(nèi)部審計(jì)部門需要評(píng)估組織內(nèi)的數(shù)據(jù)和算法現(xiàn)狀、由此產(chǎn)生的風(fēng)險(xiǎn)和挑戰(zhàn),以及重大的機(jī)遇和利益。算法內(nèi)部審計(jì)流程可以包括項(xiàng)目實(shí)施前或?qū)嵤┖髮彶?,以及容許算法內(nèi)部審計(jì)人員參與治理和指導(dǎo)相關(guān)算法的設(shè)計(jì)和執(zhí)行。算法內(nèi)部審計(jì)的重點(diǎn),可以包括數(shù)據(jù)是如何被運(yùn)用的、算法的執(zhí)行流程和技術(shù)控制等。
在算法審計(jì)路徑方面有兩種思路。一種重視算法代碼透明化,另一種重視對(duì)輸入輸出和結(jié)果的評(píng)估,本文建議重視對(duì)輸入輸出和結(jié)果的評(píng)估算法審計(jì)思路。
這兩種思路的差別是,算法代碼透明化的安排下,將要求企業(yè)給出核心算法程序,由獨(dú)立第三方企業(yè)或者公共機(jī)構(gòu)直接評(píng)估算法程序是否合理。這一安排的弊端在于,可能會(huì)涉及被審計(jì)企業(yè)的核心商業(yè)機(jī)密而被拒絕;而審查機(jī)構(gòu)也無(wú)從知曉平臺(tái)提供的算法與實(shí)際運(yùn)行的算法是否完全一致。而重視輸入輸出和結(jié)果的審計(jì)安排中,輸入審計(jì)是指要求平臺(tái)明確,在個(gè)性化服務(wù)的時(shí)候,依據(jù)的是哪些重點(diǎn)維度;輸出審計(jì)就是指要求平臺(tái)報(bào)告依據(jù)算法,最主要追求的是什么樣的目標(biāo),比如公平究竟是什么;同時(shí)要求平臺(tái)報(bào)告算法相關(guān)成效,并評(píng)估相關(guān)成效。
就算法審計(jì)的具體框架而言,內(nèi)部審計(jì)和外部審計(jì)均可考慮如下算法安排:
① 預(yù)測(cè)或優(yōu)化目標(biāo)。闡明算法設(shè)計(jì)時(shí)如何考量利益相關(guān)方核心利益(如滴滴司乘雙方的人身安全、外賣中消費(fèi)者按時(shí)獲得優(yōu)質(zhì)服務(wù)而商家獲得應(yīng)有收入),以及算法實(shí)施時(shí)預(yù)測(cè)或優(yōu)化的具體指標(biāo)。對(duì)實(shí)際的預(yù)測(cè)或優(yōu)化指標(biāo)與想要達(dá)到的預(yù)測(cè)或優(yōu)化指標(biāo)之間的差異進(jìn)行說明。
② 對(duì)算法訓(xùn)練和算法評(píng)估及選擇中用到的數(shù)據(jù)進(jìn)行說明。描述數(shù)據(jù)中各個(gè)指標(biāo)的含義,闡明數(shù)據(jù)是如何收集的,排除一些數(shù)據(jù)的原因是什么(例如,數(shù)據(jù)質(zhì)量),數(shù)據(jù)對(duì)整個(gè)利益相關(guān)方群體是否具有代表性等等。
?、?算法使用的技術(shù)。說明哪些技術(shù)(例如,回歸分析、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等)被嘗試過,采納最終算法的原因是什么。
?、?算法運(yùn)行效果。包括預(yù)測(cè)精度、與利益相關(guān)方核心利益相關(guān)指標(biāo)的結(jié)果,等等。
⑤ 有關(guān)個(gè)人信息保護(hù)和數(shù)據(jù)安全的具體安排。
就算法審計(jì)的具體評(píng)估尺度而言,可以借鑒國(guó)外一些審計(jì)框架,如歧視、有效性、透明度、直接影響、安全和可獲得性這五個(gè)方面。其中,歧視包含社會(huì)性歧視和統(tǒng)計(jì)歧視程度;有效性包括準(zhǔn)確性、穩(wěn)定性、可復(fù)制性以及數(shù)據(jù)使用效率程度等;透明度包含數(shù)據(jù)架構(gòu)的透明程度、可解釋性、平臺(tái)使用透明度、數(shù)據(jù)收集與使用透明度這四個(gè)方面;直接影響包含對(duì)誤用濫用可能性的評(píng)估和違法可能性的評(píng)估;安全性指算法和數(shù)據(jù)在使用中的可獲得性與安全性這兩個(gè)維度等。
當(dāng)然,算法審計(jì)在設(shè)計(jì)中也需要有所為有所不為。例如,2018年《哈佛商業(yè)評(píng)論》載文討論了ProPublica對(duì)用于決定犯罪嫌疑人再犯概率算法的調(diào)查。ProPublica記者發(fā)現(xiàn),與沒有再犯罪的白人相比,沒有再犯罪的黑人被算出再犯罪的概率更高。但這是不是種族歧視的證據(jù)呢?事實(shí)證明,運(yùn)用該算法,如果黑人和白人得到的是類似的高分,那么他們?cè)俜缸锏母怕逝c種族無(wú)關(guān),這實(shí)際上滿足了另一個(gè)重要的“公平”概念。隨后的學(xué)術(shù)研究表明,一般來說,不可能同時(shí)滿足兩種公平標(biāo)準(zhǔn)。究竟哪種公平更重要,不應(yīng)是算法審計(jì)的目標(biāo);算法審計(jì)以遵行當(dāng)下政府和公眾的主流價(jià)值觀為目標(biāo)。
總體來看,算法審計(jì)為算法治理提供了新思路,其核心是通過恰當(dāng)?shù)闹卫頇C(jī)制設(shè)計(jì)、通過發(fā)展技術(shù)解決新技術(shù)帶來的問題,盡量避免“一刀切”式監(jiān)管。通過為平臺(tái)企業(yè)算法在上述五大維度及其分項(xiàng)按照合規(guī)程度作高中低等分級(jí)打分,幫助利益相關(guān)方和社會(huì)公眾對(duì)平臺(tái)的算法合規(guī)程度有全面的了解,從而推動(dòng)企業(yè)有更高的積極性用合規(guī)算法來推動(dòng)自身發(fā)展、推動(dòng)數(shù)字經(jīng)濟(jì)的健康成長(zhǎng)。
作者沈艷系CF40特邀成員、北京大學(xué)國(guó)家發(fā)展研究院教授、北京大學(xué)數(shù)字金融研究中心副主任,文章僅代表作者個(gè)人觀點(diǎn),不代表CF40及作者所在機(jī)構(gòu)立場(chǎng)。