分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
去年我給《第一財(cái)經(jīng)日?qǐng)?bào)》撰寫(xiě)了《終極價(jià)值》(Ultimate Price)一書(shū)書(shū)評(píng),沒(méi)想到作者霍華德·弗里德曼(Howard Friedman)看到了這篇文章,并主動(dòng)通過(guò)朋友找到我,希望能進(jìn)行更為深入的討論。普羅大眾對(duì)統(tǒng)計(jì)學(xué)與數(shù)據(jù)科學(xué)有兩種不同的誤解,一是認(rèn)為數(shù)據(jù)科學(xué)這門(mén)發(fā)展速度極快的新興行業(yè),理應(yīng)做到科學(xué)意義上的準(zhǔn)確;另一種則認(rèn)為這是門(mén)騙人的學(xué)問(wèn),無(wú)非是從業(yè)者的意識(shí)形態(tài)的另一種表述而已。
霍華德·弗里德曼目前在哥倫比亞大學(xué)教授衛(wèi)生健康統(tǒng)計(jì)學(xué),此前他在銀行和非營(yíng)利機(jī)構(gòu)從事統(tǒng)計(jì)相關(guān)工作。他的新作《終極價(jià)值》從政府賠償金、保險(xiǎn)、醫(yī)療方案等各方面,深入討論人命的統(tǒng)計(jì)學(xué)價(jià)值這一問(wèn)題。我們的一條命到底值多少錢(qián)?它該如何計(jì)算?有錢(qián)人的命是否比窮人的命值錢(qián)?又有沒(méi)有真正意義上的統(tǒng)計(jì)學(xué)模型可以做到公平對(duì)待每一條命?作為統(tǒng)計(jì)學(xué)從業(yè)者,這些是弗里德曼關(guān)心的問(wèn)題,也是我們通過(guò)電郵交流的主要內(nèi)容。
《終極價(jià)格:我們賦予生命的價(jià)值》(Ultimate Price:The Value We Place on Life)
霍華德·斯蒂芬·弗里德曼(Howard Steven Friedman) 著
University of California Press 2020年5月版
統(tǒng)計(jì)科學(xué)的倫理
第一財(cái)經(jīng):是什么啟發(fā)你寫(xiě)《終極價(jià)值》這本書(shū)?你的研究是從哪個(gè)出發(fā)點(diǎn)開(kāi)始的?
弗里德曼:我是從得知“9·11”遇難者補(bǔ)償基金這一出發(fā)點(diǎn),開(kāi)始對(duì)生命價(jià)值這個(gè)問(wèn)題產(chǎn)生興趣的。像很多土生土長(zhǎng)的紐約人一樣,我有認(rèn)識(shí)的人在那天不幸喪生。很多年后,當(dāng)我開(kāi)始反省自己在健康經(jīng)濟(jì)學(xué)、成本效益分析方面的工作時(shí),不管是在政策制定還是在給公司進(jìn)行咨詢(xún)服務(wù)的情境下,或是在給法律事務(wù)所和人壽保險(xiǎn)公司做經(jīng)濟(jì)學(xué)模型的過(guò)程當(dāng)中,都從各方面涉及生命價(jià)值這一命題。這時(shí)候,我知道我有了寫(xiě)一本書(shū)的框架。下一步是閱讀這方面的文獻(xiàn),記錄各種看待這一問(wèn)題的方法,并開(kāi)始撰寫(xiě)這本書(shū)里的各個(gè)章節(jié)。
第一財(cái)經(jīng):你有為大型公司和政府設(shè)計(jì)統(tǒng)計(jì)學(xué)模型的經(jīng)驗(yàn)。你能不能談?wù)劷y(tǒng)計(jì)學(xué)家與公司領(lǐng)導(dǎo)和政策制定者之間的關(guān)系?統(tǒng)計(jì)學(xué)家為公司和非營(yíng)利機(jī)構(gòu)工作的時(shí)候角色有無(wú)區(qū)別?
弗里德曼:數(shù)據(jù)分析與模型制作的基本概念和思考方式,無(wú)論在哪個(gè)設(shè)定下都是相同的,但取決于不同的行業(yè)和設(shè)定,我們手上的數(shù)據(jù)資源、數(shù)據(jù)元素、目標(biāo)、溝通需求、模型限制和最終能輸出的用途都有所變化。打個(gè)比方,在公共事業(yè)當(dāng)中,目標(biāo)通常是花最少的錢(qián)救最多條命。為銀行或者私募基金做分析的時(shí)候,目標(biāo)往往是讓模型能最優(yōu)化地保證預(yù)測(cè)的準(zhǔn)確性以及盈利能力(當(dāng)然是在滿(mǎn)足輸入變量屬于合法范疇的情況下)。P值法和其他統(tǒng)計(jì)測(cè)試通常不那么重要。為以盈利為目的的私立醫(yī)療行業(yè)做分析的時(shí)候,通常有一些變量的限制以及溝通上的要求,導(dǎo)致模型設(shè)計(jì)者只能用某些今天比較常用的統(tǒng)計(jì)學(xué)方法,因?yàn)槟切└M(jìn)階復(fù)雜的模型方法不那么透明,而且很難完全向管理醫(yī)生的醫(yī)保行業(yè)人士及其它決策者解釋清楚。
第一財(cái)經(jīng):你認(rèn)為統(tǒng)計(jì)學(xué)家的模型與方法是否潛意識(shí)里由某種政策理念驅(qū)動(dòng)?統(tǒng)計(jì)本身是否有“意識(shí)形態(tài)”?
弗里德曼:我本人一直想要追求最完善的統(tǒng)計(jì)科學(xué),比如我會(huì)開(kāi)發(fā)一些不帶偏見(jiàn)的預(yù)測(cè),與決策者坦誠(chéng)溝通統(tǒng)計(jì)模型的限制,并想辦法盡量提高數(shù)據(jù)分析的質(zhì)量。這是我自己從事數(shù)據(jù)科學(xué)至今的職業(yè)目標(biāo),因?yàn)闊o(wú)論某個(gè)客戶(hù)有什么需求,我本人的聲譽(yù)是要伴隨我職業(yè)生涯的。當(dāng)然,非常偶然的情況下,我也遇見(jiàn)過(guò)某個(gè)雇主或客戶(hù)想要從我這里,通過(guò)某些手段,得到非常特定的他們想要的答案。這里就有職業(yè)倫理的問(wèn)題。我的答案一直是:“我作為科學(xué)家的聲譽(yù)比你要我做的事情重要得多。”短期內(nèi)你有這樣的立場(chǎng)可能會(huì)損失一些與這一客戶(hù)合作的機(jī)會(huì),但對(duì)職業(yè)發(fā)展來(lái)說(shuō),清晰的道德往往是最好的選擇。
當(dāng)然,無(wú)意識(shí)的偏見(jiàn)總會(huì)從各方面滲入統(tǒng)計(jì)學(xué)、數(shù)據(jù)分析和數(shù)據(jù)科學(xué),包括數(shù)據(jù)的獲取方式、定義方式、模型方法、模型匯報(bào)、模型評(píng)估和模型應(yīng)用。這方面的意識(shí)應(yīng)該被重視,并且有些好的辦法可以提高。
第一財(cái)經(jīng):你在書(shū)中反復(fù)提到的是“公平”這個(gè)概念。能否談一下“公平”對(duì)你來(lái)說(shuō)具體意味著什么?因?yàn)樵诂F(xiàn)實(shí)中,人對(duì)公平的理解各不相同,各個(gè)政治流派對(duì)此定義也不相同。各種理念對(duì)公平的不同理解,如何能從統(tǒng)計(jì)學(xué)方法中得到平衡?
弗里德曼:統(tǒng)計(jì)倫理學(xué)當(dāng)中已經(jīng)有一些概念處理這個(gè)問(wèn)題,包括AI倫理,這可能有效,但就我自己來(lái)說(shuō),我思考公平這個(gè)問(wèn)題的時(shí)候思路要簡(jiǎn)單一些。
第一,我會(huì)思考數(shù)據(jù)模型的“表面有效性”,我總會(huì)思考這種表面上的有效是否從社會(huì)意義上或邏輯上不成立的結(jié)論里來(lái)的。舉例而言,在書(shū)中我闡述了為何用基于收入的方法來(lái)評(píng)估人命的價(jià)值有很大的缺陷,因?yàn)橛眠@種方法得出的結(jié)論是:一條高級(jí)對(duì)沖基金經(jīng)理的命,要比社工、教師、警察、消防員、護(hù)士或其他在社會(huì)中扮演重要角色的人的命貴一千倍。另外,這種基于收入的評(píng)估方法會(huì)很直接地認(rèn)為:無(wú)收入者的人命毫無(wú)價(jià)值。這缺乏“表面有效性”,因?yàn)闆](méi)人會(huì)認(rèn)為這是公平或者人性化的判斷方法。
第二,我會(huì)思考一些人口意義上的指標(biāo)(性別、種族、年齡、地理位置、移民狀態(tài)等)是否與當(dāng)下問(wèn)題有關(guān)。我在書(shū)中寫(xiě)到,有些因素,諸如性別或種族,放在美國(guó)這一范疇中來(lái)討論,與收入是直接相關(guān)的,性別收入差異與種族收入差異真實(shí)存在。這些差異不僅影響收入水平,還有其他影響,比如生命價(jià)值及作為生命價(jià)值被輸入模型時(shí)的影響。
第三,我認(rèn)為透明度非常重要,而且我希望其他人也能如此對(duì)待透明度。我書(shū)中嘗試解釋一些數(shù)據(jù)分析與模型當(dāng)中比較復(fù)雜的概念,這樣,非這一行業(yè)的人士也能懂得生命價(jià)值算法之下的內(nèi)容。模型設(shè)計(jì)者必須能解釋自己關(guān)鍵的輸入、預(yù)設(shè)以及影響最終輸出結(jié)果的各個(gè)因素,這樣他人可以從結(jié)論當(dāng)中尋找偏見(jiàn)存在的可能性——舉例而言,我在自己的模型設(shè)計(jì)工作當(dāng)中專(zhuān)注于讓機(jī)器學(xué)習(xí)模型變得更容易理解也更容易闡釋?zhuān)@樣,一個(gè)普通人也能明白并對(duì)機(jī)器學(xué)習(xí)模型作出評(píng)論。如果科學(xué)家無(wú)法對(duì)普通人解釋自己的模型,那我會(huì)懷疑他們是否理解自己的概念。
第四,我會(huì)嘗試打開(kāi)反饋回路,看看模型是否精確,哪里不準(zhǔn)確,并更新數(shù)據(jù)輸入與模型。這聽(tīng)起來(lái)好像是個(gè)很不重要的概念,但通常預(yù)測(cè)性質(zhì)的模型在現(xiàn)實(shí)世界里會(huì)只關(guān)注特別狹窄的人群,忽略其他人,因?yàn)檫@些數(shù)據(jù)會(huì)進(jìn)入這樣的反饋回路。
第一財(cái)經(jīng):你在書(shū)中寫(xiě)道,政府沒(méi)有任何設(shè)立受害者賠償基金的理由,但對(duì)大災(zāi)大難來(lái)說(shuō),這仍然是很常見(jiàn)的一種方式。商業(yè)賠償比起政府設(shè)立的賠償方式更不注重公平。你認(rèn)為有什么更好的方法嗎?
弗里德曼:澄清一下,我書(shū)中特別討論的是美國(guó)(而非其他國(guó)家),我是說(shuō)美國(guó)政府不應(yīng)該這么做。因?yàn)槊绹?guó)有其他法律上的機(jī)制可以解決這個(gè)問(wèn)題,包括人壽保險(xiǎn),并且我們的民事法律系統(tǒng)允許受害者(在遇難的情況下,允許死者的家庭和伴侶等)進(jìn)行起訴。
另外,我對(duì)“9·11”遇難者補(bǔ)償基金建立的先例有著懷疑態(tài)度,因?yàn)楝F(xiàn)在一個(gè)受害者賠償基金是否應(yīng)該被設(shè)立已經(jīng)沒(méi)有了明確的標(biāo)準(zhǔn)。我在書(shū)里寫(xiě)道:“政府重新分配稅收來(lái)補(bǔ)償‘9·11’受害者帶來(lái)了新的問(wèn)題,那就是到底什么性質(zhì)的不幸遇難可以激活稅收補(bǔ)償。它也帶來(lái)了一個(gè)永久的法律問(wèn)題:如果稅收可以用來(lái)補(bǔ)償‘9·11’遇難者的家庭,那為什么其他遇難者得不到補(bǔ)償?”
第一財(cái)經(jīng):你在書(shū)中描述“9·11”遇難者補(bǔ)償基金的時(shí)候,最終得出的結(jié)論是最公平的賠償方法是把所有人的生命價(jià)值看作完全相同。實(shí)際上就像你剛才說(shuō)的,民事訴訟才是此類(lèi)賠償最常用的方法。受害者本人或者其家人對(duì)訴訟的執(zhí)著程度,或者法律方面的資源,以及民事法庭隨機(jī)選中的陪審團(tuán)對(duì)受害者的同情程度,這些都對(duì)最終獲賠的金額有直接影響。那些沒(méi)有能力或沒(méi)有資源長(zhǎng)期繼續(xù)訴訟的家庭,可能因此無(wú)法獲得高額賠償。這種訴訟的意愿及對(duì)自我價(jià)值的評(píng)估(它未見(jiàn)得與收入掛鉤,窮人的訴訟執(zhí)著程度與自我價(jià)值評(píng)估有可能與富人相當(dāng))也就成為了“統(tǒng)計(jì)生命價(jià)值”的一部分。這在你看來(lái)公平嗎?
弗里德曼:我個(gè)人認(rèn)為“統(tǒng)計(jì)生命價(jià)值”本身應(yīng)用上的優(yōu)點(diǎn),正是他們對(duì)所有人一概而論,而不像基于收入的價(jià)值評(píng)估標(biāo)準(zhǔn),在收入、財(cái)富以及不平等的社會(huì)差異(性別差異、種族差異)等方面都有非常大的跨度。我在書(shū)中寫(xiě)過(guò),我認(rèn)為公平的生命價(jià)值價(jià)碼是“不取決于貧富、膚色、年齡的價(jià)碼”。所以我不希望看到諸如“自我價(jià)值評(píng)估”進(jìn)入統(tǒng)計(jì)體系當(dāng)中,它會(huì)帶來(lái)更多的偏見(jiàn),得出更為不公平的結(jié)論。
數(shù)據(jù)不會(huì)那么“干凈”
第一財(cái)經(jīng):你是統(tǒng)計(jì)學(xué)家,但你也在書(shū)中批評(píng)了很多統(tǒng)計(jì)學(xué)的方法,特別是基于問(wèn)卷調(diào)查的統(tǒng)計(jì)學(xué)決策過(guò)程。我覺(jué)得這很有意思。在我自己的生活經(jīng)驗(yàn)里,問(wèn)卷調(diào)查在美國(guó)醫(yī)療行業(yè)非常普遍。就診人經(jīng)常被問(wèn)一些聽(tīng)起來(lái)荒唐的問(wèn)題,比如在0~10之間選擇自己的疼痛程度或者抑郁程度,等等。你認(rèn)為這些方法有哪些缺陷?為什么它們那么普遍地被應(yīng)用?
弗里德曼:我的工作在統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)、數(shù)據(jù)科學(xué)各方面都有,就我自己的工作來(lái)說(shuō),我認(rèn)為需要讓專(zhuān)家對(duì)解釋自己的工作負(fù)責(zé),包括數(shù)據(jù)輸入、關(guān)鍵預(yù)設(shè)、模型預(yù)測(cè)及模型限制等方面。
舉例而言,臨床試驗(yàn)已經(jīng)進(jìn)行了好幾十年了,參與臨床試驗(yàn)的人群通常是根據(jù)診斷小心翼翼選擇的(他們有什么病,沒(méi)有什么病),之前吃過(guò)什么藥,有什么并存病,屬于什么人口范疇,等等,這些數(shù)據(jù)都在臨床試驗(yàn)里受到控制,所以可能藥物的有用程度會(huì)比在現(xiàn)實(shí)世界里高出很多。凈結(jié)果是臨床試驗(yàn)當(dāng)中的人群通常并非藥物上市后會(huì)服用的人群,因此臨床試驗(yàn)的結(jié)論通常限制于某一分支的未來(lái)病人。我專(zhuān)注于用“現(xiàn)實(shí)世界的論據(jù)”并在現(xiàn)實(shí)世界當(dāng)中實(shí)施,這樣才能更好地理解其有效程度。數(shù)據(jù)不會(huì)那么“干凈”(為了解決數(shù)據(jù)質(zhì)量的問(wèn)題,建模的方法也通常比較高階),所以至少在我看來(lái),這樣的數(shù)據(jù)處理方法比純粹通過(guò)臨床試驗(yàn)得出結(jié)論,并認(rèn)為這些結(jié)論會(huì)在現(xiàn)實(shí)世界里被重復(fù),要有代表性得多。
你說(shuō)的用數(shù)值衡量疼痛的問(wèn)題,在現(xiàn)實(shí)當(dāng)中反而是有效的,可能它跟直覺(jué)相反,確實(shí)有一些價(jià)值(雖然可能這種價(jià)值有定向性質(zhì))。
第一財(cái)經(jīng):你在討論成本效益分析的時(shí)候,提到這些分析有時(shí)候會(huì)忽略一小群人的具體需求,甚至不但不推進(jìn)公平,反而推進(jìn)更多的不公。這是個(gè)很有趣的觀點(diǎn),也是很多社會(huì)活動(dòng)分子對(duì)數(shù)據(jù)為本的技術(shù)官僚的批評(píng),認(rèn)為現(xiàn)實(shí)中的人的感情沒(méi)有在數(shù)據(jù)分析的過(guò)程當(dāng)中被考慮進(jìn)去,你怎么看?
弗里德曼:我在書(shū)中反復(fù)強(qiáng)調(diào)的一點(diǎn)是,我認(rèn)為社會(huì)活動(dòng)分子應(yīng)該經(jīng)常與技術(shù)官僚、特定領(lǐng)域?qū)<摇⒄咧贫ㄕ咭约捌渌嚓P(guān)人士進(jìn)行交流。兩者之間不應(yīng)該存在沖突,兩邊人士都應(yīng)該為進(jìn)行對(duì)話(huà)付出努力。我非常享受別人用所謂“新鮮的眼睛”來(lái)看我的工作,我希望他們的建議能幫助我的工作變得更好,但我也認(rèn)識(shí)一些專(zhuān)家對(duì)自己的工作防范心很強(qiáng),不喜歡接受批評(píng)。統(tǒng)計(jì)學(xué)家喬治·博克斯(George Box)有句很有名的話(huà)——“所有的模型都是錯(cuò)的,但還是有點(diǎn)用”,我很歡迎這種態(tài)度。
第一財(cái)經(jīng):你的書(shū)中讓我最為驚訝的數(shù)據(jù),是美國(guó)環(huán)保局把每條美國(guó)人生命的價(jià)值定在900萬(wàn)美元。至少在我看來(lái),這比一般人腦子里的數(shù)額要大得多。這么算的話(huà),美國(guó)全國(guó)的生命加起來(lái)價(jià)值高達(dá)3000萬(wàn)億美元,比美國(guó)過(guò)去100年的GDP加起來(lái)還要多。900萬(wàn)美元也比你書(shū)中提及的“9·11”遇難者補(bǔ)償基金給出的最高金額高得多。你怎么看待這個(gè)數(shù)字?
弗里德曼:我在書(shū)中對(duì)各種“統(tǒng)計(jì)生命價(jià)值”的方法都持有批評(píng)態(tài)度,我覺(jué)得每種方法都有技術(shù)上和邏輯上的問(wèn)題。當(dāng)然,用收入來(lái)計(jì)算有更大的問(wèn)題。我在書(shū)里寫(xiě)了,“每種用價(jià)碼判斷生命價(jià)值的方法都是邏輯上不成立的……雖然這些價(jià)碼有缺陷且缺乏邏輯,它們依然被使用,有著現(xiàn)實(shí)世界里的意義。”
我覺(jué)得監(jiān)管機(jī)構(gòu)用高價(jià)當(dāng)作當(dāng)下的統(tǒng)計(jì)學(xué)生命價(jià)值來(lái)進(jìn)行成本效益計(jì)算,有其可取之處。它強(qiáng)迫各個(gè)行業(yè)投資更多的金額到消費(fèi)者保護(hù)當(dāng)中。沒(méi)有很強(qiáng)的監(jiān)管系統(tǒng)、高額生命價(jià)值和法律上的后果,很多大公司會(huì)把注意力放在短期盈利上,忽略長(zhǎng)期安全方面的顧慮。
那么這個(gè)數(shù)字是不是“太高”呢?可能你說(shuō)得對(duì),也許是有點(diǎn)太高了,但從他們計(jì)算的角度來(lái)看,大體維度上是正確的。
與“9·11”遇難者相比的話(huà),我們必須把差不多40%的通貨膨脹考慮進(jìn)去。另外,“9·11”遇難者補(bǔ)償金的計(jì)算方式是在一定法律限制之下的,所以這種比較不一定合理。
第一財(cái)經(jīng):《終極價(jià)值》一書(shū)最終的目的是給讀者思考“生命值多少錢(qián)”這個(gè)問(wèn)題提供多種方法,如果讀者想要在這一路徑上繼續(xù)閱讀下去的話(huà),你有什么推薦的書(shū)目或研究嗎?
弗里德曼:有很多的書(shū)籍可以閱讀,我在書(shū)后也附錄了一份書(shū)單。我特別推薦肯尼斯·芬博格(Kenneth Feinberg)的《生命值多少錢(qián)?》(What is Life Worth?)和邁克爾·桑德?tīng)枺∕ichael Sandel)的《金錢(qián)不能買(mǎi)什么》(What Money Can’t Buy)。
第一財(cái)經(jīng):你能談?wù)勥@本書(shū)后你新的研究嗎?
弗里德曼:我熱愛(ài)數(shù)據(jù)科學(xué),希望更多人能理解這個(gè)行業(yè),并參與到各個(gè)方面中。全球范圍內(nèi),數(shù)據(jù)科學(xué)是一個(gè)大家都能參與的領(lǐng)域,并且可以在日后創(chuàng)造更多的價(jià)值。我最近完成了一些手稿,主要是向美國(guó)六、七年級(jí)的初中生介紹數(shù)據(jù)科學(xué),用類(lèi)比的方式介紹一些基本概念,不是一本真正的教科書(shū)。對(duì)我來(lái)說(shuō),這是讓我非常有激情的一個(gè)工作項(xiàng)目。除此以外,我也想寫(xiě)一本為非常忙碌的職業(yè)人士介紹數(shù)據(jù)科學(xué)的書(shū),讓他們能了解專(zhuān)業(yè)數(shù)據(jù)科學(xué)的基本概念和術(shù)語(yǔ),幫助他們更好地與數(shù)據(jù)科學(xué)家合作。
第一財(cái)經(jīng):最后一個(gè)問(wèn)題是很難不問(wèn)的,讀者讀完了你的書(shū)肯定會(huì)想問(wèn)你,你認(rèn)為一條美國(guó)人命值多少錢(qián)?
弗里德曼:我要盡可能不回答這個(gè)問(wèn)題……我希望每個(gè)讀者都能得出他們自己的結(jié)論,并在自己的國(guó)家為自己相信的那個(gè)數(shù)字作出努力,無(wú)論在哪個(gè)行業(yè)。
伊比表示,不列顛哥倫比亞省已開(kāi)始對(duì)美國(guó)商品進(jìn)行報(bào)復(fù),他已指示省政府運(yùn)營(yíng)的酒類(lèi)分銷(xiāo)商停止購(gòu)買(mǎi)美國(guó)酒類(lèi)和政府采購(gòu)。
黃仁勛表示,將“非常有用的量子計(jì)算機(jī)”推向市場(chǎng)可能需要15到30年的時(shí)間。
不僅是商業(yè)房貸,住房公積金存量個(gè)人住房貸款,也從1月1日起執(zhí)行新的利率。此次利率調(diào)整均為自動(dòng)調(diào)整,無(wú)需借款人自行申請(qǐng)。
靈活就業(yè)越發(fā)普遍,外賣(mài)、快遞、網(wǎng)約車(chē)、主播等正在吸納越來(lái)越多就業(yè)。
我國(guó)醫(yī)療機(jī)構(gòu)有多種類(lèi)別,學(xué)習(xí)三明醫(yī)改經(jīng)驗(yàn)是學(xué)其改革創(chuàng)新的魄力、改革推動(dòng)醫(yī)改和大健康理念制度化的實(shí)質(zhì),而非簡(jiǎn)單照搬個(gè)別做法。