OpenAI要為GPT-4解決數學問題了:獎勵模型指錯,解題水平達到新高度
對于具有挑戰性的 step-by-step 數學推理問題,是在每一步給予獎勵還是在最后給予單個獎勵更....
AI大模型「量子速讀」,一分鐘抵人類五小時
Claude 可以完成摘要總結、搜索、協助創作、問答、編碼等任務。根據用戶反饋,Claude 生成有....
OpenAI用GPT-4解釋了GPT-2三十萬個神經元:智慧原來是這個樣子
可解釋性研究的一種簡單方法是首先了解 AI 模型各個組件(神經元和注意力頭)在做什么。傳統的方法是需....
Segment Anything又能分辨類別了:Meta/UTAustin提出全新開放類分割模型
為了解決這個問題,研究者建議在一組被掩膜的圖像區域和它們對應的文本描述的收集的數據上對 CLIP 進....
正則化方法DropKey: 兩行代碼高效緩解視覺Transformer過擬合
美圖影像研究院(MT Lab)與中國科學院大學在 CVPR 2023 上發表了一篇文章,提出一種新穎....
有哪些省內存的大語言模型訓練/微調/推理方法?
首先,我們需要了解如何根據參數量估計模型大致所需的 RAM,這在實踐中有很重要的參考意義。我們需要通....
重新審視Prompt優化問題,預測偏差讓語言模型上下文學習更強
Prompt tuning 的關鍵思想是將任務特定的 embedding 注入隱藏層,然后使用基于梯....
高功率半導體激光器過渡熱沉封裝技術研究
摘要:近些年,在市場應用驅動下,半導體激光器的輸出功率越來越高,器件產生的熱量也在增加,同時封裝結構....
X射線視覺搭配RFID會擦除怎樣的火花?
根據相關研究人員表示,目前全球的供應鏈行業中,UHF RFID技術被各個國家廣泛使用,有研究表明,在....
GPT-3、Stable Diffusion一起助攻,讓模型聽懂甲方修圖需求
這里給模型的輸入描述是「一只坐下的狗」,但是按照人們的日常交流習慣,最自然的描述應該是「讓這只狗坐下....
Stable Diffusion采樣速度翻倍!僅需10到25步的擴散模型采樣算法
然而,擴散模型在使用上最大的問題就是其極慢的采樣速度。模型采樣需要從純噪聲圖片出發,一步一步不斷地去....
AI再卷數學界,DSP新方法將機器證明成功率提高一倍
我們以語言模型 Minerva為例。當在足夠多的數據訓練之后,我們發現它的數學能力非常強,可以在高中....
全新科學問答數據集ScienceQA讓深度學習模型推理有了思維鏈
在回答復雜的問題時,人類可以理解不同模態的信息,并形成一個完整的思維鏈(Chain of Thoug....
單激光器實現最快數據傳輸紀錄
有些時候,人們形容網絡的效率「不如卡車運硬盤」:亞馬遜 AWS 就有一種名為 snowmobile ....
淺析歸納偏置對模型縮放的影響
首次推導出不同歸納偏置和模型架構的標度律。研究者發現這個標度系數在不同的模型中有很大的不同,并指出這....
全球首款一站式處理因果學習完整流程的開源算法工具包
CausalModel. 確定感興趣的因果量之后,識別因果圖中的工具變量,操作因果圖,識別因果效應(....
一種適合于工業-4.0應用的解決方案
omlox是用于精確實時室內定位系統的開放標準。omlox的重點是為可互操作的定位系統定義開放接口。....
微軟亞洲研究院把Transformer深度提升到1000層
本周論文包括尤洋團隊FastFold上線,訓練時間從11天壓縮至67小時;微軟亞洲研究院直接把 Tr....
做時間序列預測是否有必要用深度學習
過去幾年,時間序列領域的經典參數方法(自回歸)已經在很大程度上被復雜的深度學習框架(如 DeepGI....
基于機器學習的效用和理論理解
機器學習領域近年的發展非常迅速,然而我們對機器學習理論的理解還很有限,有些模型的實驗效果甚至超出了我....
簡述北斗衛星導航系統建設與發展
第一部分:系統情況 目前在軌服務衛星共計45顆,包括北斗二號衛星15顆,北斗三號衛星30顆,健康狀態....
為什么十年間北斗/GNSS是全球提供時空信息服務的主角?
衛星導航,是個歷久彌新的系統,是個蓬勃發展的產業,是智能信息融合創新體系架構的核心與主線。北斗/GN....