2024年12月5日上午,北京大學(xué)人工智能研究院人工智能安全與治理中心主任張平教授應(yīng)邀為我校學(xué)生開展以“AI訓(xùn)練數(shù)據(jù)版權(quán)合法性之困及解決路徑探討”為主題的講座。講座由中央財(cái)經(jīng)大學(xué)法學(xué)院副教授張金平老師主持,全校數(shù)十名學(xué)生參加。本次講座為法學(xué)院建院20周年系列講座第10期,同時(shí)也受到中央財(cái)經(jīng)大學(xué)“龍馬奮進(jìn)?75周年校慶”專題學(xué)術(shù)講座資助計(jì)劃支持。

張平教授先整體剖析了AI訓(xùn)練數(shù)據(jù)版權(quán)合法性問題產(chǎn)生的原因,并以此展開對(duì)AI訓(xùn)練數(shù)據(jù)版權(quán)之困的具體分析。張教授認(rèn)為AI訓(xùn)練數(shù)據(jù)版權(quán)之第一困是高質(zhì)量數(shù)據(jù)授權(quán)難。目前AI訓(xùn)練數(shù)據(jù)五大來源各有問題:利用“爬蟲技術(shù)”爬取的網(wǎng)絡(luò)信息受使用目的限制、從供應(yīng)方購買的數(shù)據(jù)要按約定承擔(dān)風(fēng)險(xiǎn)、公有領(lǐng)域內(nèi)容仍面臨著作人格權(quán)問題、開源社區(qū)資源受許可證約束及從著作權(quán)集體管理機(jī)構(gòu)獲得內(nèi)容可能面臨準(zhǔn)確授權(quán)難。其次,張教授介紹了全球范圍的AI訓(xùn)練數(shù)據(jù)侵權(quán)訴訟,包括Stability AI集體訴訟案、環(huán)球音樂集團(tuán)等訴Anthropic案、紐約時(shí)報(bào)訴Open AI案、谷歌數(shù)字圖書館案、德國攝影師Kneschke訴LAION案及廣州互聯(lián)網(wǎng)法院“奧特曼”案等國內(nèi)外著名判例,指出各國法院面臨AI數(shù)據(jù)訓(xùn)練是否侵權(quán)的抉擇。
隨后,張平教授提出了AI訓(xùn)練數(shù)據(jù)版權(quán)之第二困即突破現(xiàn)行法難。張教授認(rèn)為,我國在行政、司法方面作出調(diào)整的難度較大,但因人工智能屬于我國頭號(hào)發(fā)展產(chǎn)業(yè),按照現(xiàn)行法認(rèn)定AI訓(xùn)練未經(jīng)許可使用高質(zhì)量數(shù)據(jù)構(gòu)成著作權(quán)侵權(quán),將不可避免地影響我國人工智能的產(chǎn)業(yè)發(fā)展。然而,我國需對(duì)接CPTPP等高標(biāo)準(zhǔn)經(jīng)貿(mào)規(guī)則的要求,難以限縮著作權(quán)權(quán)利范圍;而著作權(quán)人可能因補(bǔ)償金和版稅制度等無法直接補(bǔ)償其權(quán)益,缺少推動(dòng)新制度建設(shè)的動(dòng)力。數(shù)字水印、區(qū)塊鏈、開放授權(quán)等解決方案,只能解決一部分問題,且面臨巨額成本問題。
有鑒于此,張教授倡導(dǎo)作品的自愿捐獻(xiàn),或者構(gòu)建有條件共享的高質(zhì)量訓(xùn)練數(shù)據(jù)池,多措并舉疏解人工智能數(shù)據(jù)訓(xùn)練合法之困。

總結(jié)發(fā)言環(huán)節(jié),張金平副教授認(rèn)為張平教授對(duì)于知識(shí)產(chǎn)權(quán)的本質(zhì)及中國的人工智能產(chǎn)業(yè)在全球競爭格局下發(fā)展前景的突破與平衡作出了全景式的展示,展現(xiàn)了張平教授對(duì)人工智能數(shù)據(jù)訓(xùn)練問題研究的深度和廣度,同時(shí)也為我們提供了很多值得深入思考的研究方向。

針對(duì)在座同學(xué)提出電商平臺(tái)通過未明示的算法規(guī)則對(duì)商家進(jìn)行處罰的透明度原則適用等問題,張平教授均進(jìn)行了詳細(xì)的解答。講座在熱烈的掌聲中圓滿結(jié)束。
文/圖 王怡然
審/ 陳 誠