AI公司處理數據困難，引發版權及道德問題

本周，兩家知名媒體——《華爾街日報》和《紐約時報》對AI公司在獲取優質訓練數據時遇到的困境進行了深入關注。值得注意的是，報道中提到了關于AI版權法模糊不清的灰色地帶。

通過開發Whisper音頻轉錄模型，OpenAI取得了一項突破性進展，成功轉錄了超過100萬個小時的YouTube視頻用于訓練GPT-4大型語言模型。其實施的這一過程因涉及版權問題而存在嚴重法律風險，但OpenAI仍堅持為技術創新設定開拓者的姿態。

另一位受訪者——《泰晤士報》，通過揭露OpenAI總裁Greg Brockman積極參與YouTube視頻收集工作的事實，強調此類操作的合法性問題。然而，OpenAI宣布將嚴格遵守相關法規，謹慎對待每一次行動。為了持續發展，OpenAI正不斷嘗試從各種渠道獲取有益的數據。

據OpenAI發言人Lindsay Held發表的聲明顯示，每個模型都在經過精心設計后配備了獨特的數據集，目的在于讓它們更準確地理解這個世界，能始終保持強大的研發能力。Notably， the company is exploring the possibilities of generating synthetic data to support their continuing growth and development.

相比之下，谷歌對此事持有不同看法。谷歌不認同未經授權就抓取和下載YouTube內容的行為，同時指出，谷歌的robots.txt文件和服務條款堅決禁止此類行為發生。近段時間，YouTube CEO尼爾·莫漢在接受采訪時也警告潛在的侵入者，使用YouTube視頻訓練AI模型的行為違反了其服務條款。

面對日益激烈的競爭環境，Meta公司同樣面臨著數據可用性問題。公司AI部門為了提升自身競爭力，甚至開始考慮未經授權使用版權作品，尤其是在面臨無法獲得足夠訓練數據之際。維持可持續發展已經成為了當下AI科技行業的當務之急。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

語言模型

語言模型

+關注

關注
0

文章
558

瀏覽量
10610
GPT

GPT

+關注

關注
0

文章
368

瀏覽量
15876
OpenAI

OpenAI

+關注

關注
9

文章
1199

瀏覽量
8521

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

電子工程師必看！EMC設計難題一站式破解

eeDesigner
6小時前

158 閱讀

基于RK3576開發板的人臉識別算法

ljx2016
11小時前

241 閱讀

HJ4205步進電機驅動電路詳解

航晶微電子
11小時前

230 閱讀

關鍵尺寸掃描電子顯微鏡技術解讀

中科院半導體所
12小時前

198 閱讀

晶圓制備工藝與清洗工藝介紹

中科院半導體所
12小時前

264 閱讀

LDC1000傳感器的詳細電路示意圖概述

0.12 MB

免費

23下載

電源工程師教程：開關電源詳解（六）

o_dream
3.20 MB

免費

48下載

openharmony第三方組件適配移植的雪花飄落動畫效果

姚小熊27
1.37 MB

免費

1下載

actiontech zabbix mysql monitor MySQL監控插件

賈偉剛
0.06 MB

免費

2下載

Hijack Ruby進程劫持工具

胡秋陽
0.01 MB

2積分

1下載

抄板電磁流量計運放電路分析求解疑

jf_34190678
1天前

276 閱讀

【RA-Eco-RA4M2開發板評測】點亮WS2812點陣屏

gtbestom
1天前

200 閱讀

基于 FPGA 的任意波形發生器+低通濾波器系統設計

感謝相遇
1天前

218 閱讀

簡易開關電源電路原理圖 PCB資料

yuu_cool
1天前

159 閱讀

精選好文！噪聲系數測量的三種方法

遠風
1天前

434 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

AI公司處理數據困難，引發版權及道德問題

評論