我們已經進入了一個超視頻時代。
第 50 次《中國互聯網絡發展狀況統計報告》顯示,截至 2022 年 6 月,我國網民規模已達 10.51 億,互聯網普及率達 74.4%。我國短視頻用戶規模增長最為明顯,達 9.26 億,較 2021 年 12 月增長 2805 萬。國際數據調研機構 IDC 預計,2025 年全球數據空間中 80.3%將是以視頻、圖片、音頻為代表的非結構化數據。
如此龐大的人群規模和數據體量,從體驗的角度來看,勢必會從量變引起質變。在全行業視頻化的大趨勢下,用戶對視頻云的需求產生了什么樣的變化?企業又將如何擁抱視頻化浪潮?在這些問題上,為抖音、西瓜視頻提供技術支撐的火山引擎,可能是最有經驗的答題者。
2022 卡塔爾世界杯期間,火山引擎平穩支撐了抖音世界杯 64 場比賽直播,為用戶提供了延時低至 1s、大屏級畫質、穩定流暢的觀賽體驗,并延展出 “無障礙字幕” “邊看邊聊” 等無障礙功能和創新玩法,覆蓋累計 106 億人次。而在今年春晚,在火山引擎視頻云及邊緣云技術的支持下,抖音春晚直播為超過 1.3 億觀眾提供了超高清、低延遲的絲滑觀看體驗。C 端用戶可能直觀上不容易察覺火山引擎都做了什么,但實際上早在不知不覺間用上了火山引擎的云原生服務。
自 2021 年正式發布云產品以來,火山引擎作為國內云計算市場一股重要的新興力量,在云原生領域有著深度參與和長期實踐。基于其云原生產品矩陣和解決方案,火山引擎正在將字節跳動快速發展過程中積累的增長方法、技術能力和應用工具開放給外部企業,幫助企業在數字化升級中實現持續增長。
-
面向現代化應用,火山引擎的云原生究竟提供了哪些能力?
-
在音視頻應用場景,如何利用異構計算、音頻理解推理加速、六自由度視頻等技術進一步提高用戶體驗,實現持續增長?
-
以李星瀾 Lydia 數字人項目為例,字節跳動如何打造完善的虛擬數字人技術和應用體系?
在 3 月 20 日-23 日舉行的 NVIDIA GTC 大會上,來自字節跳動的五位專家將圍繞這些話題帶來獨家的干貨分享。
以下為議題簡介。
GTC23 字節跳動演講推薦

★
演講題目:
通過現代化的 PaaS,橋接計算能力和商業場景,實現更快速的創新
[S52448]
演講時間:
3 月 22 日 3:00 PM
演講人:
張鑫,火山引擎副總裁、字節跳動開源治理運營負責人
演講概要:
云技術和 GPU 的普及為持續的業務增長提供了強大的計算能力。與此同時,快速發展的業務場景也提出了新的需求,需要用更多不同的方式來使用這些基礎設施資源。這要求為特定的使用場景定制標準的技術和工具,從而給用戶帶來了巨大的挑戰,因為涉及到深入理解技術和業務邏輯,此外,還有可能因此產生重要的工程時間,影響創新速度。
本場演講將分享如何利用云原生套件、應用程序 PaaS(aPaaS)、工作流引擎和機器學習平臺協同工作,構建現代化的 PaaS,以實現快速創新,并減少定制開發工作。

★
演講題目:
極致挖掘 GPU 算力——GPU 在字節跳動點播業務中的應用解決方案
[S51147]
演講時間:
3 月 22 日 10:00 PM
演講人:
張清源,火山引擎點播多媒體平臺技術負責人
演講概要:
視頻市場正在快速增長。作為世界頂級的視頻平臺之一,字節跳動每天要消耗大量的計算資源來處理上億量級的視頻。此外,為了滿足用戶對視頻質量和播放體驗日益提高的要求,視頻處理算法的復雜度也在大幅度提高。傳統的基于 CPU 的處理方式已經無法從成本和計算能力上完全滿足業務需求。
包括 GPU 在內的、越來越多的異構資源被應用于視頻處理。本場演講將以點播視頻應用為例,分享一些可以從大規模應用 GPU 中受益的場景。

★
演講題目:
視頻場景中的音頻理解推理加速解決方案
[SE51166]
演講時間:
3 月 22 日 4:00 PM
演講人:
陳炳州,字節跳動音頻理解視頻方向引擎負責人
演講概要:
音頻理解是指通過語音識別、事件檢測、語種識別、聲紋識別等技術從音頻數據中解析出多維度信息。在視頻場景上,比較經典的落地技術,比如視頻字幕生成、視頻字幕打軸等等。這些技術應用極大地提高了人效,也帶來生活的便利。
伴隨短視頻和音頻類應用的興起,用戶請求量、音頻數據正呈幾何級別增長,這些都為大規模數據處理,以及高并發低延遲的推理帶來諸多挑戰。比如機器有限的情況下如何處理更多的音頻,多語種的場景中單卡處理單語種模型存在利用率較低的問題。
本場演講將基于 NVIDIA 提供的推理 GPU(T4, A10, A30),介紹音頻理解如何做推理加速,以及如何廣泛應用于抖音等大流量場景。

★
演講題目:
六自由度視頻及應用實踐
[S52449]
演講時間:
3 月 22 日即可在線觀看
演講人:
焦少慧,火山引擎三維視頻負責人
演講概要:
視頻技術作為多媒體內容的重要部分,更高清、更沉浸、更互動,是其發展目標。對于下一代視頻來說,六自由度視頻是重要的發展方向,六自由度視頻可以允許用戶改變觀測位置和旋轉參數,觀看視頻不同角度的內容,更符合人們認知事物的方式,同時,也可以讓用戶增強參與感、交互感,擺脫對傳統導播視角的依賴。
本場演講將詳細講述 VR 視頻、自由視角視頻、光場視頻以及體積視頻,分析六自由度視頻的痛點,以及介紹火山引擎的技術解決方案及應用實踐。同時,由于六自由度視頻的數據量大于傳統二維視頻,本次分享還會介紹視頻壓縮方案及 GPU 加速方案。

★
演講題目:
李星瀾:一個基于實時智能交互系統打造的 “真實” 數字生命
[SE51461]
演講時間:
3 月 22 日 1:30 PM
演講人:
四道,朝夕光年江南工作室 AI 技術負責人
演講概要:
智能 NPC 和數字人已經在娛樂行業和社交媒體平臺被廣泛應用,包括人工智能驅動的主持人、評論員和網紅等。但開發具有高視覺保真度的逼真智能AI通常需要大量時間,而且成本很高,很難擴大規模。
朝夕光年提出了一個 GPU 驅動的系統,包括文本到語音模塊、音頻到全身動畫模塊、視頻分析模塊、渲染模塊和聊天機器人模塊,基于這些模塊可以構建一個逼真的實時交互數字人。
本場演講將介紹如何利用 NVIDIA Omniverse 和 NVIDIA GPU,以及如何借助計算機圖形學和人工智能功能來構建 李星瀾 Lydia 數字人項目。
預約感興趣的演講內容
想要預約以上精彩內容?掃描下方圖片二維碼或 點擊“閱讀原文”,即可搜索相關會議代碼找到對應演講內容,通過點擊 “Add to Schedule”或 點擊 “星星”,將該演講內容添加至您的日程,大會開始后登錄即可在線觀看。

例如:搜索演講代碼[S52448],點擊 “Add to Schedule”,即可將該演講添加至您的日程。

例如:搜索演講代碼[S52449],發現沒有 “Add to Schedule” 按鈕,說明該演講為點播形式,從 3 月 22 日開始即可在線觀看。點擊右上方的星星,將該演講添加至您的日程。

如果尚未注冊,請點擊鏈接查看GTC23 注冊教程。
關于 GTC23
NVIDIA GTC是一個面向全球 AI 開發者的大會,將于2023 年 3 月 20 日-23 日在線上舉行,包括超過 650 場演講、專家座談會以及特別活動,涵蓋加速計算和開發工具、計算機視覺、對話式 AI/NLP、數據科學、深度學習、推薦系統/個性化、元宇宙等多個主題。目前已確認參與本屆 GTC 的重磅嘉賓包括:Open AI 的聯合創始人兼首席科學家 Ilya Stutskever、DeepMind 的創始人兼 CEO Demis Hassabis 等。NVIDIA 創始人兼首席執行官黃仁勛將在本次 GTC 主題演講中分享 NVIDIA 加速計算平臺如何推動 AI、元宇宙、云技術和可持續計算的下一波浪潮。
歡迎加入 GTC 23,與全球 AI 者同行!
掃描下方海報二維碼,即可免費注冊 GTC23,在 3 月 24 日 聽 OpenAI 聯合創始人與 NVIDIA 創始人的爐邊談話,將由 NVIDIA 專家主持,配中文講解和實時答疑,一起看 AI 的現狀和未來!
原文標題:GTC23 看點預告 | 超視頻時代業務增長的技術密碼,GTC 字節跳動專場一次講透
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3939瀏覽量
93530
原文標題:GTC23 看點預告 | 超視頻時代業務增長的技術密碼,GTC 字節跳動專場一次講透
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
立訊技術亮相英偉達GTC 2025大會

賽思×字節跳動 高精度同步時鐘助力火山引擎打造“云上新宇宙”

英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
NVIDIA GTC 2025精華一文讀完 黃仁勛在GTC上的主題演講

評論