ChatGPT背后的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)【剽竊還是創(chuàng)作】
自從去年11月由OpenAI公司推出的聊天機(jī)器人ChatGPT面世以來,在人們驚嘆于其信息搜索和文本生成能力的同時(shí),關(guān)于其背后知識(shí)產(chǎn)權(quán)的質(zhì)疑聲也隨之而來。
【資料圖】
國際知名語言學(xué)家喬姆斯基此前曾公開發(fā)聲表示,ChatGPT是一個(gè)高科技剽竊系統(tǒng),從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,并依照規(guī)則將數(shù)據(jù)串聯(lián)在一起,形成像人寫的文章和內(nèi)容。對(duì)于這說法,也有反對(duì)者提出,人類的學(xué)習(xí)也是從現(xiàn)有知識(shí)中進(jìn)行繼承、分析然后規(guī)律化的過程,其真正威脅是讓人類不去思考。
人工智能創(chuàng)作作品是否涉嫌剽竊?其生成內(nèi)容是否受到版權(quán)保護(hù)?是否存在法律風(fēng)險(xiǎn)?ChatGPT的火爆將這些問題推進(jìn)人們的視野。
AIGC是否存在侵權(quán)風(fēng)險(xiǎn)
作為一個(gè)自然語言處理系統(tǒng),ChatGPT通過大量文本語料庫進(jìn)行訓(xùn)練,然后根據(jù)它所學(xué)到的內(nèi)容來回答問題或生成文本,其學(xué)習(xí)的能力很大程度上依賴于海量數(shù)據(jù)。
OpenAI在2020年5月發(fā)表的名為《Language Models Are Few-Shot Learners》的論文顯示,該公司主要使用來自CommonCrawl、WebText、維基百科和書籍語料庫進(jìn)行訓(xùn)練。
使用這些數(shù)據(jù)是否存在侵權(quán)風(fēng)險(xiǎn)?中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏認(rèn)為,沒有約束地使用ChatGPT可能會(huì)引發(fā)知識(shí)產(chǎn)權(quán)的糾紛。“ChatGPT的開發(fā)者沒有公開生成合成的運(yùn)行機(jī)制以及訓(xùn)練數(shù)據(jù)的來源,在用戶引導(dǎo)問答的過程中,ChatGPT的回答缺失對(duì)于來源的引用,這樣有可能在用戶未注明來源對(duì)生成內(nèi)容進(jìn)行使用時(shí)造成剽竊?!?/p>
北京盈科(杭州)律師事務(wù)所律師方超強(qiáng)則表示,AI訓(xùn)練過程中不可避免地會(huì)涉及對(duì)他人享有著作權(quán)的作品進(jìn)行復(fù)制使用,存在一定著作權(quán)侵權(quán)的風(fēng)險(xiǎn)?!爱?dāng)然這一風(fēng)險(xiǎn)也可以進(jìn)行規(guī)避,例如使用不享有著作權(quán)的公開作品資源,或者經(jīng)過授權(quán)的文字作品?!?/p>
他還指出,如果AI生產(chǎn)的文字作品與已存在的文字作品構(gòu)成實(shí)質(zhì)性相似,那么其創(chuàng)作或者后續(xù)對(duì)AI文字作品的使用,都會(huì)有侵害已存在文字作品的風(fēng)險(xiǎn)。
公開報(bào)道顯示,目前已有國外新聞媒體指責(zé)OpenAI在不支付任何費(fèi)用的情況下使用他們的文章來訓(xùn)練ChatGPT。
此前,《華爾街日?qǐng)?bào)》記者Francesco Marconi在網(wǎng)上公開表示,他向ChatGPT索取了一份用來訓(xùn)練它的新聞來源清單,收到的回復(fù)列出了包括路透社、《紐約時(shí)報(bào)》、《衛(wèi)報(bào)》、BBC新聞等20家媒體,但并不清楚OpenAI是否與所列出版商都達(dá)成了協(xié)議。
全球最大的媒體集團(tuán)之一新聞集團(tuán)(News Corp。)旗下道瓊斯公司的法律總顧問Jason Conti日前也在提供給媒體的一份聲明中稱,任何想使用《華爾街日?qǐng)?bào)》記者的作品來訓(xùn)練人工智能的人,都應(yīng)該從道瓊斯獲得適當(dāng)?shù)氖跈?quán),但“道瓊斯沒有與OpenAI達(dá)成相關(guān)的協(xié)議”。他表示,道瓊斯公司正在對(duì)該情況進(jìn)行審查,并將嚴(yán)肅對(duì)待濫用記者作品的行為。
在北京大成律師事務(wù)所合伙人肖颯看來,這其實(shí)涉及“文本數(shù)據(jù)挖掘”是否需要相應(yīng)的知識(shí)產(chǎn)權(quán)授權(quán)的問題。ChatGPT需要對(duì)語料庫中的數(shù)據(jù)進(jìn)行挖掘和訓(xùn)練,將語料庫中的內(nèi)容復(fù)制到自己的數(shù)據(jù)庫中,相應(yīng)的行為通常在自然語言處理領(lǐng)域被稱為“文本數(shù)據(jù)挖掘”?!爱?dāng)相應(yīng)的文本數(shù)據(jù)可能構(gòu)成作品的前提下,文本數(shù)據(jù)挖掘行為是否侵犯‘復(fù)制權(quán)’當(dāng)前仍存在爭議。”肖颯說。
她指出,在比較法領(lǐng)域,日本和歐盟在其著作權(quán)立法中均對(duì)合理使用的范圍進(jìn)行了擴(kuò)大,將AI中的“文本數(shù)據(jù)挖掘”增列為一項(xiàng)新的合理使用的情形?!澳壳拔覈鳈?quán)法依舊保持了合理使用制度的封閉式規(guī)定,僅著作權(quán)法第二十四條規(guī)定的十三種情形可以被認(rèn)定為合理使用,也就是說,目前我國著作權(quán)法并未將AI中的‘文本數(shù)據(jù)挖掘’納入到合理適用的范圍內(nèi),文本數(shù)據(jù)挖掘在我國依然需要相應(yīng)的知識(shí)產(chǎn)權(quán)授權(quán)。”
AIGC可以受到版權(quán)保護(hù)嗎
公開報(bào)道顯示,ChatGPT可以編寫代碼、撰寫詩歌,甚至還能通過一定提示完成短篇小說的寫作,令人不禁提出疑問:AIGC是否屬于創(chuàng)作?人工智能能替代人類作者嗎?
人工智能研究專家田濤源對(duì)中青報(bào)·中青網(wǎng)記者表示,目前ChatGPT本質(zhì)上還是在做詞條的排列組合,會(huì)根據(jù)人類表達(dá)的需求給出最接近人類喜好的答案?!爱?dāng)它的力度到達(dá)‘詞’這個(gè)級(jí)別的時(shí)候會(huì)給人感覺好像是在創(chuàng)作,但實(shí)際上它無法跳出訓(xùn)練文本庫的歸納范圍,即無法創(chuàng)造人類不知道的新知識(shí)?!?/p>
方超強(qiáng)也指出,AI創(chuàng)作在本質(zhì)上,是人類創(chuàng)作的衍生;需要明確的是,是人類設(shè)計(jì)了程序,訓(xùn)練了程序,進(jìn)而達(dá)到AI軟件能夠相對(duì)智能地輸出一些符合人類要求的作品。歸根結(jié)底,本質(zhì)上還是人在主導(dǎo)。
事實(shí)上,當(dāng)被問及“你生成的內(nèi)容是作品嗎”,ChatGPT也承認(rèn),“我可以根據(jù)輸入的提示來生成文本,但是這些生成的文本并不算是作品,因?yàn)樗鼈儾]有蘊(yùn)含創(chuàng)造性、獨(dú)創(chuàng)性、藝術(shù)性等元素,僅僅是根據(jù)預(yù)先訓(xùn)練好的模型對(duì)輸入的提示進(jìn)行生成而已。因此,我生成的內(nèi)容更類似于工具或輔助工具,可以幫助人們自動(dòng)生成一些文本,但是它們不算是創(chuàng)意作品或原創(chuàng)作品?!?/p>
此前,已有多篇學(xué)術(shù)論文將ChatGPT列為作者。據(jù)《自然》網(wǎng)站報(bào)道,至少有4份已發(fā)表和預(yù)印本上的論文使用了ChatGPT作為論文的“合著者”。
針對(duì)這種情況,日前已有多家學(xué)術(shù)期刊發(fā)表聲明,完全禁止或嚴(yán)格限制使用ChatGPT等人工智能機(jī)器人撰寫學(xué)術(shù)論文?!犊茖W(xué)》雜志表示不接受使用ChatGPT生成的投稿論文,同時(shí)不允許ChatGPT作為論文合著者?!都?xì)胞》和《柳葉刀》則表示論文作者不能使用人工智能工具取代自己完成關(guān)鍵性任務(wù),作者還必須在論文中詳細(xì)解釋他們是如何使用這些人工智能工具的。
北京云嘉律師事務(wù)所副主任、中國政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心特約研究員趙占領(lǐng)在接受中青報(bào)·中青網(wǎng)記者采訪時(shí)表示,按照目前絕大部分國家的著作權(quán)法,使用人工智能軟件產(chǎn)生的內(nèi)容不屬于法律意義上的作品,人工智能軟件本身不能視為法律意義上的作者,使用者也并非著作權(quán)人。
“但從商業(yè)角度而言,AI智能公司花了大量金錢和技術(shù)資本打造了高度智能的AI程序,對(duì)該程序衍生的‘作品’完全不予保護(hù),也有違公平?!狈匠瑥?qiáng)指出,此前國內(nèi)司法實(shí)踐中,對(duì)于字庫軟件生成的具有獨(dú)創(chuàng)性和藝術(shù)美感的“字體”給予著作權(quán)保護(hù),也是對(duì)AI作品進(jìn)行保護(hù)的一種體現(xiàn)。他認(rèn)為,如何對(duì)現(xiàn)有知識(shí)產(chǎn)權(quán)理論和法律體系進(jìn)行調(diào)整,為AI文本或其他AI作品,包括AI美術(shù)作品、音樂作品等,提供合理且必要的權(quán)利保護(hù)體系,已經(jīng)是目前較為迫切的命題。
“個(gè)人認(rèn)為,對(duì)于具有獨(dú)創(chuàng)性兼具一定藝術(shù)高度的AIGC作品,應(yīng)當(dāng)受到知識(shí)產(chǎn)權(quán)的保護(hù),反之則不予保護(hù);相應(yīng)的知識(shí)產(chǎn)權(quán)權(quán)屬應(yīng)當(dāng)歸屬于AI公司;至于這一類的AIGC作品保護(hù)、使用規(guī)則,是否需要比對(duì)人類創(chuàng)作作品進(jìn)行縮減或限制,仍有待進(jìn)一步的探討?!狈匠瑥?qiáng)還建議,“應(yīng)對(duì)AIGC內(nèi)容進(jìn)行有限度的保護(hù),如果不加以限制,未來可能會(huì)出現(xiàn)AI公司手握‘創(chuàng)作霸權(quán)’的局面,影響甚至抑制人類創(chuàng)作者的創(chuàng)作熱情,長遠(yuǎn)來說,會(huì)影響人類的知識(shí)產(chǎn)權(quán)創(chuàng)作?!?/p>
但就目前ChatGPT的表現(xiàn)來看,它的“創(chuàng)作”所體現(xiàn)出來的觀點(diǎn)通常并不鮮明,更缺乏原創(chuàng)性,表達(dá)方式雖未必與其他人作品構(gòu)成實(shí)質(zhì)相似,但也經(jīng)常借鑒一個(gè)或多個(gè)主體的表達(dá)方式。目前也只能在部分領(lǐng)域、部分方面替代人類的工作。但也帶來一定的弊端,容易給某些群體帶來思維惰性,在一定程度上可能反而抑制了創(chuàng)新。
(應(yīng)受訪者要求,田濤源為化名)
中青報(bào)·中青網(wǎng)見習(xí)記者 李若一 記者 王林 見習(xí)記者 賈驥業(yè) 來源:中國青年報(bào)