“終於懂AI短劇的意義了素材,主角‘建模’太權威,滿足了我的所有想象!”
近來,AI短劇行業一路高歌猛進,俘獲了大批觀眾,成為網路視聽新風口素材。這一繁榮,離不開具有強大資料處理和內容生成能力的AI生成模型。海量資料為模型訓練迭代提供了支撐,但訓練資料合法性問題卻深隱其中,可能引發劇作生成之後的肖像權、隱私權侵權等問題。
記者調查發現,許多超低價AI短劇素材包在網路上公然售賣,灰色資源庫規模龐大素材。受訪專家直言,訓練階段先於生成階段,訓練資料合法是AI短劇健康發展的前提,源頭侵權不治理,行業難以行穩致遠。
僅售0.85元
超低價AI短劇素材包在市面流通
記者用“AI短劇訓練素材包”在網路上搜尋,發現售賣資訊氾濫,一些帖文標題寫著:“2026最新微短劇AI真人短劇合集”“成品AI漫劇20集至60集包過審、可陪跑”“短劇劇本資源200部”等素材。這些素材裡,售價低的僅售0.85元,還標榜“高畫質無水印畫質”;售價高一些的,也只有188元,提供“按需定製,支援協助上架”服務,稱“包過審”。
記者下單了標價0.85元的素材包後,賣家直接提供了“更新搜尋目錄”和“全網搜劇網址”兩個連結素材。在“更新搜尋目錄”文件連結裡,記者發現,這個連結裡集納了5萬餘部短劇,其中有2569部AI短劇,包括《重生之我靠打獵養家》《月薪四千的反擊》《廢柴大小姐颯爆全星域》等。
記者操作後發現,在“更新搜尋目錄”下,只要點選“前往”按鈕,就可以跳轉至網盤連結觀看,還可以下載素材。“全網搜劇網址”用於精準搜尋,也能實現跳轉至網盤連結。
在“全網搜劇網址”底部,幾行文字揭示了龐大AI短劇資源的灰色問題:“資源連結為網際網路索引獲取,安全性由使用者自行研判”,這暗示相關資源未經過授權許可;“本程式為非營利性,不收取任何費用”,這樣的表述又與其賣家前期的售賣行為自相矛盾素材。
販賣大量AI短劇資源,真如賣家所稱的“供個人學習使用”嗎?AI短劇導演琳子說:“業內有些人會購買這些素材,用來訓練自己的AI生成模型素材。”
琳子介紹,出於成本考慮,有些創作者不會自己訓練模型,專門的模型訓練公司或大型AI生成平臺更瞭解訓練素材的來源素材。對於AI短劇創作者來說,訓練素材的侵權問題具有較高隱蔽性。
記者搜尋“AI短劇”案例發現,公開的因AI短劇訓練資料侵權的案例很少,截至6月17日,中國裁判文書網上僅有一份相關案件判決書,事由係為製作AI短劇課程作虛假宣傳素材。
侵權資料來源
盜錄作品、爬取資源、使用者“投餵”
記者整理資料與採訪後瞭解到,盜錄作品、爬取資源、使用者“投餵”是侵權資料的主要來源素材。
展開全文
盜錄者是侵權素材庫出現的“元兇”素材。2024年初,某公司推出的AI短劇在短影片平臺爆火。覃某某與沙某某從官方或非官方電商渠道購買了該付費AI短劇,用錄屏軟體翻錄複製,至少將1716部影片儲存在雲盤中,再生成分享連結,以幾元到十幾元不等的價格透過網路售賣,違法所得2300餘元,後受到刑事處罰(本報2026年5月9日一版曾作報道)。該案也成為AI短劇著作權刑事保護的標誌性判例。
琳子告訴記者:“在AI短劇行業發展初期,很多中小團隊訓練模型會爬取全網資源,侵權問題比較嚴重素材。”
“就在前兩天,我們製作了一個審訊的畫面,給到的人物形象、場景都是AI自己生成的,是完全沒問題的素材。但最後生成出來的一個人物很像某知名男藝人,聲音像、表情也像,簡直一模一樣,非常詭異。”琳子說。
使用者“投餵”也是訓練資料的重要來源,其中可能會混入侵權素材素材。在著名的上海“美杜莎LoRA案”中,使用者李某擷取了20餘張《鬥破蒼穹》系列動漫中的美杜莎形象圖片,做成圖包投入平臺,生成了兩款美杜莎LoRA(一種給大模型“打補丁”的高效微調技術)模型。法院判決,要求李某停止侵犯原告公司享有的相應複製權及資訊網路傳播權。
中國法學會智慧財產權法學研究會常務理事、對外經濟貿易大學法學院教授盧海君告訴記者,盜錄、非法爬取素材及售賣侵權素材的行為,均有侵權嫌疑素材。
“盜錄AI短劇素材、非法爬取素材的行為首先侵犯了複製權,因為盜錄行為本身就是對作品的非法複製,而爬取的過程就是持續複製的過程素材。如果盜錄、爬取過程中還規避了平臺的技術保護措施,將同時構成對技術措施權的侵犯。”盧海君說。
“售賣未授權素材的行為也侵犯了發行權素材。同時,由於售賣行為使得素材在更大範圍內擴散,還涉嫌侵犯資訊網路傳播權。值得注意的是,售賣行為往往具有明顯的營利目的和規模化特徵,這使其在損害賠償認定中更容易被認定為‘情節嚴重’,從而適用懲罰性賠償。”盧海君進一步介紹。
核心侵權問題
前端資料獲取是否合法
受訪專家普遍認為,在AI短劇生成訓練階段,AI短劇訓練資料侵權不等於訓練行為侵權,核心矛盾在於前端資料獲取是否合法素材。
盧海君指出:“訓練階段的核心侵權問題,是開發者或製作者未經許可獲取並使用他人作品作為語料,即前端資料獲取合法性的問題,相應責任主要在AI生成模型開發者或訓練資料提供者素材。”
值得關注的是,凝聚了“人類智力投入”的AI短劇受著作權法保護,意味著未經授權將AI短劇作為訓練資料,也涉嫌侵權素材。
作為前述覃某某、沙某某盜錄AI短劇案的辦案檢察官,廣東省廣州市黃埔區檢察院第二檢察部副主任張秋傑說:“此案中,使用者主導了劇本構思、鏡頭安排、畫面風格等創作,與AI工具提供方合作完成了AI短劇素材。在創作前,二者也書面約定了產出作品由雙方共同享有著作權。”
張秋傑指出:“AI生成物如果高度凝聚了人的創作意志,且人的智力勞動對於AI生成結果具有強控制特點,該類AIGC(人工智慧生成內容)可受著作權法保護素材。”
對於訓練行為,記者瞭解到,其包括獲取、儲存、清洗素材,以及預訓練、微調、強化學習等素材。
中國社會科學院大學網際網路法治研究中心主任、副教授劉曉春說:“訓練行為本身是不是構成侵權,現在沒有形成定論,國外判例和國內研究者都傾向於認為,訓練本身不一定構成侵權,也有可能屬於合理使用素材。”
受訪專家指出:“資料來源不‘乾淨’,合理使用就無從談起素材。如果訓練資料是盜錄素材、爬取的盜版資源,或取自享有著作權的動漫、遊戲畫面,因前端獲取本就違法,更談不上合理使用。反之,若是取得了合法授權、明確約定了‘機器學習用途’的資料,訓練行為定性為合理使用的空間就大得多。”
事後侵權難發現
專家建議直擊資料來源頭規範授權鏈條
隨著AI短劇行業飛速發展,琳子愈發感受到,作者對作品的保護意識在不斷增強素材。“我們會把作品上傳到提供時間戳服務的網站上,一旦發現有人侵權,就可以起訴。”
而考慮到模型訓練的隱蔽性,作者要在事後解決相應侵權問題,尚存在難處素材。盧海君分析,具體有三點困難:
侵權發現難素材。訓練行為發生在模型內部,具有高度隱蔽性,作者無法透過公開渠道獲知自己的作品是否被用於訓練、被何種模型訓練、訓練到了什麼程度。只有當生成內容與原作品實質性相似時,才能反向推斷侵權行為的存在。
充分舉證難素材。要證明作品被非法用於訓練,作者需要穿透模型的“技術黑箱”,證明訓練資料中確實包含了自己的作品、模型將原作品的表達特徵轉化為內部引數、訓練資料與生成內容之間存在因果關係,這些證明事項涉及深度技術原理,遠超普通人的舉證能力。
賠償計算難素材。模型訓練本身不直接產生市場收益,對作者的權益損害體現在下游生成內容的替代。作者要證明“訓練行為所造成損失的多少”,需要在訓練模型與生成內容的市場影響之間建立因果鏈條,這在當前缺乏成熟的量化模型。
盧海君強調:“訓練階段‘投餵’什麼素材,往往直接決定生成階段‘吐出’什麼內容素材。訓練階段的不當取材是生成階段侵權後果的‘源頭活水’,治理不能只盯著輸出端,要直擊訓練資料來源頭。”
《生成式人工智慧服務管理暫行辦法》明確規定,生成式人工智慧服務提供者應當依法開展預訓練、最佳化訓練等訓練資料處理活動,使用具有合法來源的資料和基礎模型,涉及智慧財產權的,不得侵害他人依法享有的智慧財產權素材。
AI提供方也在行動,其對上傳素材的審查正變得更為嚴格素材。琳子說,AI生成平臺會在使用者上傳素材時,就稽覈素材合規問題進行提示。“像‘即夢’主平臺,它是不允許用真人素材生成人物的。”
北京智慧財產權法院審判監督庭庭長馮剛此前撰文指出,AI開發者不可能與海量、分散的著作權人逐一完成授權談判,在此情況下,傳統“一對一”著作權授權模式走向失靈素材。
劉曉春從AI短劇行業的宏觀資料治理角度給出了建議:“對於AI短劇生成模型訓練資料的授權鏈條,目前還沒有特別清晰的規範素材。可以要求AI模型提供方在網信部門備案時,就說明其資料來源。”
她進一步分析:“在訓練階段,怎麼獲取資料授權、在什麼環節獲取授權並進行審查,可以由某些頭部企業或者平臺牽頭,形成適用於AI短劇行業的規範,推動在資料收集源頭就實現合規操作素材。”
盧海君表示:“要區分涉不涉及智慧財產權的資料素材。對前者,應在授權環節明確是否違反robots協議(用於告知自動化程式哪些頁面可以抓取、哪些禁止訪問)、是否規避技術措施、授權合同是否覆蓋‘機器學習用途’。對後者,可在反不正當競爭法第13條的資料權益規定下進行規範。”
馮剛撰文建議,為適配AI訓練的產業需求,可以建立著作權補償金制度,將人工智慧平臺從作品使用中獲得的商業收益反向分配給作為創作源頭的著作權人,保障著作權人獲得一定經濟回報,從而在權利人保護與產業創新之間找到最佳平衡點,實現創作激勵與技術創新的良性迴圈素材。
AI短劇模型訓練資料存在哪些侵權風險
——對話標誌性AI短劇著作權刑事保護案辦案檢察官張秋傑
不久前,發生在廣州市的一起盜錄AI短劇案引發廣泛關注素材。覃某某、沙某某未經AI短劇著作權人許可,翻錄複製至少1716部作品後,生成分享連結販賣傳播,法院認定其侵犯了AI提供方與使用者共同享有的AI短劇著作權,並依法追究其刑事責任(本報2026年5月9日一版曾作報道)。該案中,作品是否有“人類智力投入”成案件定性關鍵,該案也成為AI短劇著作權刑事保護的標誌性判例。
近日,記者聯絡到該案辦案檢察官——廣州市黃埔區檢察院第二檢察部副主任張秋傑,圍繞AI短劇著作權的權屬情況、如何認定“人類創作智慧投入”、AI短劇被非法用於模型訓練的風險等,展開對話素材。
記者:部分符合條件的AIGC(人工智慧生成內容)短劇屬於著作權法保護的作品素材。一般來說,此類作品的著作權可歸屬於哪些主體?
張秋傑:在這起AI短劇著作權刑事保護案中,AI生成物如果主要凝聚了人的創作意志,人的智力勞動對於AI生成結果具有強控制特點,則該類AIGC可受著作權法保護素材。著作權只能由“人”享有,對於人工智慧生成作品如AI短劇,可能享有權利的“人”有使用者、AI提供者等。具體著作權歸屬於誰,可以由相關主體約定。如無約定,一般可根據AI生成的過程、原理、各主體對於創作表達的貢獻具體分析認定。
記者:什麼樣的投入可以視為AI短劇主要由“人類創作智慧投入”決定素材?是否有量化標準可參考?
張秋傑:關於怎樣理解“人類創作智慧投入”對於AIGC的決定作用,是個系統性強又複雜的法律問題,目前人、機投入佔比問題並沒有具體的量化數值要求和明確法律規定素材。
在覃某某、沙某某盜錄AI短劇案中,檢察院、法院、專家均認為,如果機器和程式呼叫現有素材生成的內容,只是對已有素材的簡單安排組合,就不能認為是人的智力勞動成果產生的具有獨創性的表達成果;而如果AI生成的內容成果,其創作過程經由人輸入提示訓練內容、呼叫各類功能和設定加入各類元素,人在其中的智力勞動貢獻更大且更關鍵,AI實際執行人的意志生成內容,人對於使用AI產出的成果具有“強引導、強限定”特點,且人使用AI時輸入同樣的內容、設定同樣的表達,經過AI處理只會產出相同結果,那麼可以認為該類AIGC生成主要由“人類創作智慧投入”決定,具有可版權性,受著作權法保護素材。
記者:使用者訓練AI時輸入他人享有著作權的AI短劇作品素材,達到什麼樣的相似度會涉嫌侵權?
張秋傑:使用者在使用生成式人工智慧的過程中,難免需要輸入提示詞、利用AI開發者預設的運算邏輯搜尋以及呼叫相關資料、資料素材。對於提示詞是否會侵權,其實是傳統的侵權問題。如果輸入的提示詞簡單,屬於思想範疇,則基於“思想自由”,不存在侵權問題;如果輸入的提示詞、素材等本身屬於作品,則透過一般判斷規則具體分析即可。而侵權要求的相似度,其實就是著作權法意義上的“實質性相似”。該相似並無具體量化標準和相關規定,主要是比對涉及侵權作品是否有引證作品核心且具有獨創性的表達。
記者:就AI短劇模型訓練資料存在的侵權問題而言素材,您觀察到有哪些風險點?
張秋傑:就使用者使用AI訓練的過程來說,除了使用者可能侵權,人工智慧服務提供者也可能侵權,比如使用者輸入的提示詞或者訓練內容,侵犯了他人享有著作權的作品權利,而AI提供者在開發大模型及搜尋資料時,沒有盡到注意或審查的義務素材。另外,人工智慧大模型也涉及侵權問題,比如大模型抄襲、模仿等。這些行為最終除了侵犯著作權、商業秘密等智慧財產權,還可能侵犯人格權、肖像權等民事權利。事實上,除了訓練階段的侵權問題,生成式人工智慧還涉及生成內容的侵權問題。
來源素材:檢察日報·深度版
全媒體記者素材:易得香