1、未來是AI云端的數(shù)據(jù)競爭時代
“兵無常勢,水無常形”,今年11月4日,我國《反不正當競爭法》歷時24年后首次修訂,專設“互聯(lián)網專條”用以規(guī)制互聯(lián)網行業(yè)競爭生態(tài),但此時,互聯(lián)網行業(yè)的競爭形態(tài)已由產品服務競爭、平臺生態(tài)競爭發(fā)展到數(shù)據(jù)競爭階段。
時間倒回2003年,在3712與百度搜霸案中,周鴻祎與李彥宏赤膊交鋒中文搜索市場。再到2013年開始的3Q、3百與3狗大戰(zhàn),以及優(yōu)酷系列廣告屏蔽案,不同的產品服務跨界進行平臺競爭,此時,這些爭議可以利用新反法專設的“互聯(lián)網專條”進行有效規(guī)制。然而,互聯(lián)網江湖風云乍起,AI新貴今日頭條未獲平臺授權批量抓取、同步新浪微博用戶數(shù)據(jù),硬件巨頭華為在Magic手機中利用微信用戶聊天記錄進行AI服務推薦,凡此種種,創(chuàng)新的產業(yè)與穩(wěn)定的法律反差強烈,“互聯(lián)網專條”稍顯力不從心。
進入“互聯(lián)網+”與“人工智能”時代,隨著算力與算法的突破,人工智能在多次往復突破后,終于迎來新機,我們看到,微軟小冰可以寫詩,騰訊的DreamWriter在奧運會期間寫了800篇新聞報道,今日頭條的AI算法實現(xiàn)了千人千面的推薦,AlphaGo、騰訊絕藝等實現(xiàn)了人工智能在單一領域的人類超越,人工智能已經能寫詩、作畫、創(chuàng)作小說、剪輯電影、制作創(chuàng)意海報。而這一切,都依賴于海量數(shù)據(jù)的喂養(yǎng)訓練,特別是,算力、算法的突破為互聯(lián)網上流動的海量數(shù)據(jù)提供了最完美的商業(yè)可能。
未來的競爭,將是在云端之上,依賴大數(shù)據(jù)的AI競爭。
2、數(shù)據(jù)競爭問題在全球引發(fā)爭議
在美國加州的Computer History Museum陳列著世界上第一臺采用了人工智能學的移動機器人Shakey,意為搖搖晃晃的機器人,其在1966年到1972年間由Stanford Research Institute研制,體積龐大,但運算速度緩慢,需要數(shù)小時的時間來分析環(huán)境并規(guī)劃行動路徑。但是,未來或許,機器人總動員中的Wall?E,《西部世界》中的“高科技成人樂園”會在不遠的將來出現(xiàn)。借用當今流行的一句話,“我們只知未來將至,卻不知未來已來”,以數(shù)據(jù)為生產資料的新經濟形態(tài)也被多國認可,并且寫進了《G20數(shù)字經濟發(fā)展與合作倡議》。
當前,BAT與華為、京東、今日頭條、搜狗等國內企業(yè)以及Alphabet、微軟、Facebook等全球科技巨頭均傾全力押注人工智能技術,甚至百度提出了“Allin AI”的戰(zhàn)略,數(shù)據(jù)作為AI時代的新石油,誰掌控了數(shù)據(jù),誰就掌控了競爭格局,其重要性不言而喻。自新世紀以來,在全球范圍內,有關數(shù)據(jù)的爭議與案件頻發(fā),遍及民事、行政與刑事各個領域,甚至從反不正當競爭領域到延伸到了反壟斷領域。
在國內,從2008年開始,大眾點評訴愛幫網系列案件最早涉及“數(shù)據(jù)競爭”的問題,大眾點評指責愛幫網大量復制其網站內容,主要是商戶介紹與用戶點評內容信息。大眾點評不惜先后在京滬兩地以著作權侵權、不正當競爭等為訴由起訴,其代理人于國富律師在其博客中寫到,“愛幫網如此長時間大范圍的惡性侵權如果不被判令承擔高限賠償,法律難容”,可見當時爭議的激烈程度。
繼大眾點評案之后,有關“數(shù)據(jù)競爭”的爭議不斷出現(xiàn)。諸如,2013年百度訴360違反robots協(xié)議案、2015年新浪訴脈脈非法抓取微博用戶數(shù)據(jù)案、2016年大眾點評訴百度地圖抓取用戶點評信息案、2017年運滿滿訴貨車幫盜取用戶信息案,以及淘寶屏蔽百度搜索,順豐與菜鳥有關物流數(shù)據(jù)接口的爭議,新浪與今日頭條有關微博內容爬取的爭議,華為在Magic手機中利用微信用戶聊天記錄進行AI服務推薦等,這些爭議無一例外,均與平臺的海量數(shù)據(jù)有關。
而在國外,有關數(shù)據(jù)競爭的爭議已經延伸至反壟斷領域。2017年6月,數(shù)據(jù)分析公司hiQ向加州北部法院提起訴訟,主張Linkedin擁有市場支配地位,推動法院于8月份發(fā)出臨時禁令,要求Linkedin在24小時內容移除引人妨礙hiQ獲取其公開數(shù)據(jù)的技術障礙,目前此案并未審結。在此之前,2016年在評估批準微軟公司收以260億美元收購LinkedIn的交易時,歐盟委員會重點關注領英的數(shù)據(jù)價值以及對手網站是否可以復制這些數(shù)據(jù)等問題。
3、保護與數(shù)據(jù)流動存在先天沖突
數(shù)據(jù)本身是一個復雜、模糊與開放的概念,此文無意對其進行清晰界定,其實,數(shù)據(jù)大體與作為知識產權客體的知識產品具有相似特性。物理上的無形性與可傳輸性,經濟學上的非競爭性與非排他性,這些特性使得數(shù)據(jù)同多數(shù)知識產品一樣,可以進行法律擬制的財產權保護與無損的數(shù)據(jù)流動。
事實上,基于商業(yè)競爭的考慮,具有數(shù)據(jù)優(yōu)勢的平臺傾向于將“數(shù)據(jù)”資源作為競爭優(yōu)勢在自有體系與合作伙伴之間流動,有學者認為這可能會產生數(shù)據(jù)拒絕交易和歧視對待的問題,但于競爭政策的視角去討論可能更加復雜。不管是因為,基于既有的若干判例,如新浪訴脈脈案與大眾點評訴百度案,法院明確承認,數(shù)據(jù)平臺對于平臺內的信息具有一定的控制權,即使在現(xiàn)階段是否賦予其“勞動成果權”還存有一些爭議。還是因為,互聯(lián)網與數(shù)據(jù)反壟斷問題本身就是一個在現(xiàn)階段很難明確,并需要謹慎對待與慎言的問題。
分析既有的爭議,我們發(fā)現(xiàn),數(shù)據(jù)競爭不僅僅是一個上游之治的問題,除了諸如華為magic讀取用戶微信聊天信息的爭議外,順豐與菜鳥關于物流數(shù)據(jù)API接口的爭議則發(fā)生在同階平臺之間,而新浪微博與脈脈、新浪微博與今日頭條的爭議則反映了后進入市場者對既有平臺海量數(shù)據(jù)的垂涎。“羅馬不是一日建成的”,數(shù)據(jù)平臺方的數(shù)據(jù)優(yōu)勢建立需要長期的成本投入,其他市場競爭者在未獲數(shù)據(jù)平臺方授權的情況下,非法抓取平臺數(shù)據(jù),直接觸及對方核心商業(yè)資源,顯然不妥。
北京知識產權法院張玲玲法官在新浪訴脈脈案提出了數(shù)據(jù)流動與使用的三重授權原則,也即平臺之間的數(shù)據(jù)流動(Open API模式)需通過“用戶同意+平臺同意+用戶同意”的模式,較為周延的平衡了用戶與平臺利益保護以及數(shù)據(jù)流動的關系。事實上,因為平臺數(shù)據(jù)多涉及用戶隱私、數(shù)據(jù)安全、消費者利益以及平臺利益等問題,數(shù)據(jù)平臺方可以通過平臺協(xié)議、robots協(xié)議、API限制以及技術保護措施等手段控制、限制數(shù)據(jù)合作與數(shù)據(jù)保護的范圍與方式。數(shù)據(jù)抓取方如未獲授權,則必然動輒得咎,除了行政與民事風險,甚至面臨刑事風險。
4、競爭關鍵在于公共領域的研究
當前數(shù)據(jù)爭議的核心在于,我們是否要為數(shù)據(jù)賦權?以及,我們需要什么樣的“數(shù)據(jù)權”?在此問題討論前,我們借用Jessica litman教授在在論述版權法制度的經典表述,私以為,“公共領域才真正是“數(shù)據(jù)權”法的前提和基礎,離開了公共領域,人類根本無法容忍“數(shù)據(jù)權”制度的存在。”那么,我們討論數(shù)據(jù)賦權以及“數(shù)據(jù)權”范疇設定的關鍵就變?yōu)椋皵?shù)據(jù)權”的公共領域是什么?我們反其道而行之,可以打開通往“數(shù)據(jù)權”制度的一扇“后窗”,借此窺探“數(shù)據(jù)權”的邊界,以有效平衡用戶、數(shù)據(jù)平臺、數(shù)據(jù)使用方以及其他參與方與社會利益的關系,并基于用戶權利、公共利益與競爭政策的協(xié)調為數(shù)據(jù)定章立規(guī)。
當前,歐美等國家與地區(qū)均在探索建立數(shù)據(jù)產權與流動規(guī)則。基于用戶權利考慮,隱私權利、用戶遺忘權、數(shù)據(jù)可攜權、數(shù)據(jù)安全等在國內外立法實踐中均有討論,并已分別在GDPR(General Data Protection Regulation,歐盟通用數(shù)據(jù)保護條例)、《網絡安全法》《民法總則》等國內外立法中有所體現(xiàn)。
基于公共利益考慮,我們認為政府公共數(shù)據(jù)、自然氣象數(shù)據(jù)、醫(yī)療數(shù)據(jù)等關系國計民生福利的數(shù)據(jù)在產權設定與流動使用應更多考慮社會福利與公民福祉。而基于競爭政策考慮,為了防范市場失靈,除了在反不正當競爭領域的司法探索外,我國應重點研究建立“數(shù)據(jù)權”的限制與例外制度,當然,我們首先要考慮數(shù)據(jù)是否可以成為市場力量的來源?不同數(shù)據(jù)類型、不同產業(yè)領域,以及不同競爭主體間的特定行為是否在競爭減損方面有所區(qū)別,以及此類競爭減損與效率促進之間如何平衡,以及如何救濟。至于在數(shù)據(jù)經濟驅動下的網絡效應評估、相關市場界定、市場支配力衡量,甚至于反壟斷理論更新等問題,研究工作任重而道遠。
此外,近期關注兩個問題,其實與“數(shù)據(jù)權”公共領域問題的研究關系密切。
其一,“數(shù)據(jù)權”設定的有效路徑是什么?我國《民法總則》征求意見稿的最初文本將“數(shù)據(jù)信息”一體納入“知識產權”進行保護,后遭多數(shù)專家反對,最終全國人大將數(shù)據(jù)信息與虛擬財產單列進行財產概括性保護,這是我國立法在“數(shù)據(jù)權”設定方面的謹慎嘗試,也反應了數(shù)據(jù)與知識產權的復雜關系。其實,知識產權在諸多學術著作中被表述為“信息產權”。
而從域外經驗來看,早在1992年,歐盟委員會通過《數(shù)據(jù)庫指令草案(Commission Proposal for a Council Directive on the Legal)》確立了數(shù)據(jù)庫權(database right)。數(shù)據(jù)庫權衍生于版權體系,以保護實質投資為目的,賦予數(shù)據(jù)庫控制者對抗它人對數(shù)據(jù)庫內容提取的排他權利,并存在著若干平衡性安排,如對合法利用人的非實質性部分的提取或再利用行為進行限制性排除,并規(guī)定了若干“法定許可”,雖存爭議,但仍可為借鑒之有益經驗。私以為,借鑒“數(shù)據(jù)庫權”模式可以解決多數(shù)的與“數(shù)據(jù)權”相關的財產性權益爭議。
其二,用戶同意與平臺協(xié)議的關系,也即在未經數(shù)據(jù)平臺方同意,甚至是平臺協(xié)議反對的情況下,第三方僅獲用戶授權,能否大批量、自動化抓取用戶已在數(shù)據(jù)平臺方發(fā)布的數(shù)據(jù)內容。
今年8月9日,今日頭條突然開始通過用戶授權直接把新浪微博的內容自動搬家到今日頭條。面對大量用戶與數(shù)據(jù)溢出的情況,新浪堅決切斷了與今日頭條的內容接口,并在海淀區(qū)法院立案起訴,此案尚未審結。私以為,即使搜索引擎與抓取技術中立,但從技術倫理與商業(yè)倫理角度,此類行為的規(guī)制應在技術創(chuàng)新與數(shù)據(jù)平臺方激勵之間尋求平衡。新浪在微博用戶數(shù)據(jù)的整個生命周期中持續(xù)投入,如新浪法律專家王磊所言,“數(shù)據(jù)的集體涌現(xiàn)性使得“大數(shù)據(jù)”出現(xiàn)了系統(tǒng)組成前單個要素所不具有的性質”,平臺為數(shù)據(jù)賦能,法律保護應有所傾斜。
此問題的討論并未結束,才是剛剛開始。
-
AI
+關注
關注
88文章
35041瀏覽量
279094 -
大數(shù)據(jù)
+關注
關注
64文章
8959瀏覽量
140100
原文標題:AI時代數(shù)據(jù)之爭,我們需要什么樣的“數(shù)據(jù)權”?
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
任正非說 AI已經確定是第四次工業(yè)革命 那么如何從容地加入進來呢?
華為加速AI時代數(shù)據(jù)存儲產業(yè)發(fā)展
適用于數(shù)據(jù)中心和AI時代的800G網絡
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
當我問DeepSeek AI爆發(fā)時代的FPGA是否重要?答案是......
大模型的數(shù)學能力或許一直都在關鍵在于如何喚醒它

評論