Llama2的技術細節探討分析

寫在前面

大家好，我是劉聰NLP。

昨天MetaAI開源了Llama2模型，我只想說一句：“「MetaAI改名叫OpenAI吧！」”

Llama2不僅開源了預訓練模型，而且還開源了利用對話數據SFT后的Llama2-Chat模型，并對Llama2-Chat模型的微調進行了詳細的介紹。

開源模型目前有7B、13B、70B三種尺寸，預訓練階段使用了2萬億Token，SFT階段使用了超過10w數據，人類偏好數據超過100w。

非常自信的MetaAI。啥也不說，上來先show一副評估對比圖，我就問OpenAI你服不服，skr。

等等黨不用著急，雖然中文占比只有0.13%，但后續會有一大推中文擴充詞表預訓練&領域數據微調的模型被國人放出。

這不Github一搜，已經有很多人占坑了，這是“有卡者的勝利”。

下面簡要記錄Llama2的技術細節。

預訓練階段

模型結構為Transformer結構，與Llama相同的是采用RMSNorm歸一化、SwiGLU激活函數、RoPE位置嵌入、詞表的構建與大小，與Llama不同的是增加GQA（分組查詢注意力），擴增了模型輸入最大長度，語料庫增加了40%。

訓練超參數如下：AdamW優化器的β1、β2和eps分別為0.9、0.95和10e-5，采用cosin學習率，預熱2000步后進行學習率衰減，最終降至峰值的10%，權重衰減系數為0.1，梯度裁剪值為1.0。

但請注意：7b和13b模型并沒有增加GQA！！！

預訓練階段的損失如下圖所示，可以看出，模型其實還沒有完全收斂。

預訓練模型效果一句話總結：「開源第一，閉源一個沒打過。」

微調階段

上面預訓練模型沒打過你OpenAI沒關系，你先等我全流程走完。

SFT

「Data Quality Is All You Need。」 MetaAI進行實驗時發現，少量高質量數據集訓練模型的效果，要好于大量低質量數據集的訓練效果。因此以后SFT時候，不要一味地追求量，質更重要。

微調時初始學習率為2e?5，并采用余弦學習率下降，權重衰減為0.1，訓練批次大小為64，最大長度為4096。為了提高模型訓練效率，將多組數據進行拼接，盡量填滿4096，每條數據直接用停止符隔開，計算loss時僅計算每條樣本target內容的loss。

對于人類偏好數據的收集，重點關注模型回復的有用性和安全性，通過選擇對比兩個模型結果獲取；不過除了選擇一個更好的結果之外，還需要對選擇的答案標記偏好程度，例如：明顯更好，更好，稍微更好、可以忽略地更好或者不確定。在安全性上，對兩個結果會標記都符合安全性、只有一個復合安全性、都不符合安全性，以此收集安全性數據。

在模型迭代過程中，獎勵模型所需的偏好數據，需要迭代收集，具體如下。

獎勵模型是對提示生成的回復生成一個標量分值，評價模型生成質量，但發現有用性和安全性很難在同一個獎勵模型表現都很好，因此，獨立訓練了兩個獎勵模型，一個針對有用性（helpfulness）進行了優化，另一個針對安全性（safety）進行了優化。

獎勵模型的初始化來自于pretrained chat model檢查點，將下一個Token預測分類器替換成標量獎勵值回歸器。訓練時，采用帶有邊際約束的二元排序損失，如下：

邊際約束開源提高獎勵模型的準確性。并且為了獎勵模型可以用有更好的泛化，防止出現獎勵黑客現象（例如Llama2-Chat利用了獎勵模型的弱點，在表現不佳的情況下夸大獎勵分數），在獎勵模型訓練過程中，還加入了部分開源人類偏好數據。

訓練參數設置：70B模型的最大學習率為5e?6，其余模型的最大學習率為1e?5，采用余弦學習率下降，最低到最大學習率的10%，并采用總步數的3%進行預熱（最少5步），訓練批次大小為1024。

不同獎勵模型在不同數據上的效果如下表所示。

發現獎勵模型對明顯更好的數據效果更突出，對可以忽略地更好或者不確定的數據表現較差。

并且研究了獎勵模型在數據和模型大小方面的縮放趨勢，在數據逐步增大的同時，效果也在逐步提高。

Iterative Fine-Tuning

隨著收到更多批次的人類偏好數據，能夠訓練更好的獎勵模型并收集更多提示。因此，訓練了五個連續版本的RLHF模型（RLHF-v1到RLHF-v5）。

主要訓練策略包括：

最近策略優化（PPO）:標準強化學習算法

拒絕采樣微調：模型輸出時采樣K個結果，選擇獎勵值最高的一個，在強化學習階段進行梯度更新。

在RLHF-v4之前，只使用拒絕采樣微調，之后將兩者順序結合起來。但主要只有70B模型進行了拒絕采樣微調，而其他小模型的微調數據來自于大模型拒絕采樣數據，相當于用大模型蒸餾小模型。

在模型進行強化學習的獎勵值由有用性獎勵值和安全性獎勵值組合產生，具體計算如下：

訓練參數設置：對于所有模型，采樣AdamW優化器，其中β1、β2和eps分別為0.9、0.95和1e?5，權重衰減為0.1，梯度裁剪為1.0，學習率為恒定為1e?6。PPO訓練時大批次為512，小批次為64，PPO裁剪閾值為0.2。對于7B和13B模型，設置KL懲罰系數為0.01，對于34B和70B模型，設置KL懲罰系數為0.005。所有模型進行200到400次迭代訓練。

多輪對話一致性

最初的RLHF模型在幾輪對話后忘記最初的指令，下圖(左)所示。為了解決這些限制，提出Ghost Attention方法（Gatt，其實是一個訓練trick）來增強模型對指令的遵從。

假設多輪對話數據為 [u1,a1,...,un,an]，定義一條指令（inst），使得整個對話過程中都遵守該指令，然后將該指令綜合連接到對話的所有用戶消息，構造為 [inst+u1,a1,...,inst+un,an]。為了避免語句不匹配的問題，在訓練過程中，保留第一輪的提示，并將中間輪數的損失置為0。

總結

Llama2模型7b，13b，34b，70b都有，完全夠用，最期待的34b會暫緩放出。

國內開源底座模型還是在6b、7b、13b等層次，33-34b才是剛需呀。

隨著開源可商用的模型越來越多，大模型社區會越來越繁華，是中小廠的福音。開源都是真英雄。

我愿從此跟隨MetaAI走Open開源AI路線。

編輯：黃飛

閱讀全文

函數(61194) 函數(61194)
OpenAI(5838) OpenAI(5838)

ARM公司公開下一代ARM架構技術細節

ARM公司近日公開了新的ARMv8架構的技術細節，這是首款包含64位指令集的ARM架構。 ARMv8拓展了現有的32位ARMv7架構，引入了64位處理技術，并擴展了虛擬尋址。目前市場領先的內核如Corte

2011-11-03 09:40:44

1543

全面揭秘藍牙4.0技術細節

雖然藍牙（Bluetooth）3.0都還尚未完全普及，Bluetooth SIG（藍牙技術聯盟，Bluetooth Special InterestGroup，后文簡稱BluetoothSIG）卻又

2014-12-03 13:39:24

26052

分析師預言英特爾10納米技術細節

最近有位半導體產業分析師針對英特爾（Intel）將在下兩個制程世代使用的技術，提出了大膽且詳細的預測；如果他的預言成真，意味著芯片龍頭英特爾又將大幅超前其他半導體同業。

2015-04-24 11:33:51

906

高通QC3.0的技術細節詳解

快充技術自推出以來一直好評連連，在現在這個大屏幕的手機時代，電池容量也隨之增加，手機充電的速度不能如同往日了，所以廠商紛紛研發新的充電技術，來提高消費者的體驗水平。

2016-04-21 13:41:01

17414

一文解析UCIe技術細節

UCIe[4]是一種開放的行業標準互連，為異構芯片間提供了高帶寬、低延遲、高電源效率和高性價比的封裝內連接，以滿足整個計算系統的需求。

2022-10-10 09:33:49

2180

RISC-V 跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

2023-07-17 16:16:20

916

RISC-V 跑大模型（三）：LLaMA中文擴展

這是RISC-V跑大模型系列的第三篇文章，前面我們為大家介紹了如何在RISC-V下運行LLaMA，本篇我們將會介紹如何為LLaMA提供中文支持。

2023-07-17 17:15:47

495

基于Llama2和OpenVIN打造聊天機器人

Llama 2是 Meta 發布了其最新的大型語言模型，Llama2 是基于 Transformer 的人工神經網絡，以一系列單詞作為輸入，遞歸地預測下一個單詞來生成文本。

2023-08-06 11:06:30

522

llama.cpp代碼結構&調用流程分析

llama.cpp 的代碼結構比較直觀，如下所示，為整體代碼結構中的比較核心的部分的代碼結構

2023-11-07 09:23:27

753

大模型筆記之gem5運行模型框架LLama介紹

LLama.cpp 支持x86，arm，gpu的編譯。

2024-01-22 09:10:16

315

藍牙4.0技術細節揭秘

藍牙技術聯盟(SIG)宣布正式采用以低功耗技術為代表優勢的藍牙核心規格4.0版本。

2011-01-13 10:22:34

2277

24伏直流電變壓為120V頻率為1000Hz的電路圖

我需要一個電路圖，直流24伏變壓為120v, 頻率達到1000Hz,電壓可調，頻率可調，具體的技術細節私聊電路有效的話，高額獎勵

2020-06-26 18:11:06

探討和分析電容觸摸屏的電磁干擾問題

與大家探討和分析一下電容觸摸屏的電磁干擾問題

2021-05-11 07:14:37

探討工業以太網技術~（二）

。隨著技術的發展，工業以太網的關鍵技術正逐個被攻破，使工業以太網性能得到了較大的改善。在這我們從工業以太網的實時性和確定性，可靠性和穩定性，安全性問題的解決方案和主要的通信協議來探討工業以太網技術

2014-12-15 14:29:50

探討智能視頻分析技術的應用現狀與發展趨勢

智能視頻分析技術的應用現狀如何？“”未來智能視頻分析技術的發展趨勢怎樣？

2021-06-03 06:44:16

H3C EPON技術白皮書

關鍵詞： FTTH FTTB FTTx EPON 技術白皮書摘要：本文獻是關于EPON技術的介紹說明型文檔，目的在于說明EPON是一個什么技術、解決了什么問題。對EPON中的技術細節進行簡單描述，可以幫助你了解EPON這種接入技術的特點。

2013-07-13 23:08:50

I2C通訊協議的相關資料推薦

廢話I2C其實肝的我挺難受的，通訊協議這種規范往往可以摳出很多的細節，看了波叔的文章《萬變不離其宗之I2C總線要點總結》，很詳細。我打賭我還不會I2C，因為涉及到很多技術細節，在實際項目中...

2022-02-15 07:46:30

LED燈具對低壓驅動芯片的要求是什么

技術細節決定LED照明設計的內容包括：LED光源的技術日趨成熟LED光源工作特點 LED燈具對低壓驅動芯片的要求

2021-04-06 09:15:51

【算能RADXA微服務器試用體驗】Radxa Fogwise 1684X Mini 規格

ChatGLM2-6B、AIGC、Llama2、SAM、Whisper等超大參數模型還有一份詳細的英文的規格表：另外，算能RADXA微服務器服務器，還是大學生集成電路創新創業大賽之# 第八屆集創賽杯賽題目

2024-02-28 11:21:57

【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

和語法規則，將這些詞匯串聯起來，形成一個完整的回答關于LLaMA及LLaMA.cpp LLaMA全稱是Large Language Model Meta AI，是由Meta AI研究人員發布的一個

2023-12-22 10:18:11

低功耗藍牙的技術細節

，而從屬設備只能根據主設備的要求進行通信。相比傳統藍牙技術，低功耗藍牙技術所增加的一項新功能就是“廣播”功能。通過這項功能，從設備可以告知其需要向主設備發送數據。廣播消息還包括活動或測量值。技術細節

2018-12-22 10:58:05

使用nodemcu v2控制4個獨立LED燈條的方法

置于電路下方，以便于連接。如果需要，您可以使用 Nodemcu 旁邊的引腳。技術細節/組件1x Nodemcu V2 (cp2102) 4x IRLB8721 N 溝道 Mosfet5x 連接器2x 排針PCB

2022-09-13 07:26:17

如何在視頻工程中使用轉碼技術？

本文簡單介紹了視頻轉碼技術的定義、分類及實現手段，重點分析了如何在視頻工程中使用轉碼技術，包括轉碼技術的使用方式及其優勢所在。分析了在流方式和文件方式下如何使用轉碼技術。通過對移動非線性編輯系統遠程傳輸視頻數據和節目制作網絡素材集中上載兩個工程實例的分析，探討了轉碼系統工作的靈活性和通用性。

2021-06-02 07:06:20

嵌入式系統設計時需要注意的技術要點和實現細節有哪些？

為什么需要safe mode？嵌入式系統設計時需要注意的技術要點和實現細節有哪些？

2021-04-25 08:49:22

應用Bluetooth Smart技術的全套智能騎行設備的技術細節和應用場景，不看肯定后悔

應用Bluetooth Smart技術的全套智能騎行設備的技術細節和應用場景，不看肯定后悔

2021-05-21 06:47:43

怎么在Xilinx FPGA上獲得JTAG詳細文檔的最佳位置

我想知道是否有人能指出一份文件，該文件為Xilinx FPGA中的JTAG操作提供了深入的技術細節。我正在考慮將自己的TAP控制器構建到JTAG程序/更新FPGA。我還想了解Xilinx特定JTAG

2019-01-24 09:36:40

怎么實現精確電流測量？

要想實現精確的電流測量，需要了解電流檢測的原理及其技術細節。本文是電阻測試系列文章的第一部分，介紹了電流檢測的概念，并著重討論了電流檢測電阻的一般設置、選擇和實現。同時還特別分析了高精度電流檢測——四端子（開爾文）電流檢測的方法和四端子電流檢測電阻的選型。

2019-08-01 07:44:28

活性焊接工藝概述

如何建立一個超聲波烙鐵的技術細節。這種技術可以粘合難以焊接的金屬，如鈦以及玻璃和陶瓷。

2023-09-22 06:16:54

液晶顯示器鮮為人知的技術細節(全方面認識LCD)

液晶顯示器鮮為人知的技術細節(全方面認識LCD)液晶顯示器的專業技術知識彩色迷魂陣： 16.7/16.2百萬色的差異無可否認，目前LCD顯示器成為CRT的繼任者已經是大勢所趨，雖然目前CRT

2008-10-29 22:49:43

直流分析的簡單探討

直流分析的簡單探討1.目的.dc要求執行電路的直流仿真（Hspice允許所有參數化的掃描分析如蜂巢狀掃描）.tf在直流操作點（.op）分析的基礎上，在直流偏壓點將電路線性化，以計算出電路的直流小信號轉移函數值，并存放于執行輸出文件中.lis...

2021-11-17 07:05:30

簡單線性回歸代碼實現細節分析

機器學習100天-簡單線性回歸 [代碼實現細節分析]

2020-05-22 10:16:34

計算機維修與維護技術探討

故障。以下是學習啦小編為大家精心準備的：計算機維修與維護技術探討相關論文。內容僅供參考，歡迎閱讀!計算機維修與維護技術探討全文如下：摘要：隨著計算機應用的普及和網絡的發展，給人們的工作和生活帶來很多方...

2021-09-08 07:10:19

軟體機器人學習問題探討

以軟體機器人為背景和主題，深入講解：(1) 軟體機器人的關節設計方法；(2) 有限元分析技巧；(3) 力學模型的建立方法； (4) 基于MATLAB與視覺識別技術的軟體手柔性抓取控制與實驗等內容

2019-08-12 15:09:17

緊急停車系統組態探討

緊急停車系統ESD( Emergency Shutdown Device)是90 年代發展起來的一種專用的安全保護設備。結合茂名石化緊急停車系統的應用實際，著重介紹了緊急停車系統組態的主要內容、技術細節及

2009-08-14 11:54:00

緊急停車系統組態探討

緊急停車系統ESD( Emergency Shutdown Device)是90年代發展起來的一種專用的安全保護設備。結合茂名石化緊急停車系統的應用實際，著重介紹了緊急停車系統組態的主要內容、技術細節及

2010-07-21 10:10:04

硅整流裝置均流的分析與探討

本文從理論上通過分析晶閘管的物理機理，再通過采用脈沖工作方式進行試驗分析，對額定通態電流狀態下的均流系數進行冷、熱態的對比分析與探討。最后針對電力機車硅整流裝

2010-08-03 15:43:43

數字蜂窩移動通信系統安全技術的探討與分析

數字蜂窩移動通信系統安全技術的探討與分析由于空中接口的開放性，移動通信尤其是數字

2009-08-20 00:06:14

1086

熱分析探討

熱分析探討首先提一下熱分析的概念哈，我們可以用各種手段完成，包括仿真軟件，手算，實際測試等等，器件發熱會導致很多問題：1.半導體

2009-11-21 14:07:54

737

英特爾Sandy Bridge處理器技術細節

特爾(Intel)在稍早前的國際固態電路會議(ISSCC)中，透露了32納米Sandy Bridge處理器的技術細節，包括進一步說明其模塊化環互連、如何將快取的操作電壓降至最低，以及導入用于監控互連流量的除錯總線。

2011-03-01 09:56:12

1113

分布式嵌入系統的交互一致理論

非常概述地提及了控制方案，并未談及技術細節以及采用的協議。本文將根據交互一致性的理論，對實施這類應用中可能遇到的問題進行分析。

2011-03-22 17:30:31

837

網絡地址翻譯技術淺析

針對網絡地址翻譯（Net Address Translation，NAT）技術在操作中存在的細節問題，通過相應應用示例，闡述NAT 技術的使用方法以及在操作中需要注意的技術細節，主要包括：地址映射、加載

2011-05-12 16:35:18

英特爾揭露Ivy Bridge技術細節，將包含至少四個版本

英特爾稍早前公開展示了采用22nm三柵極（tri-gate）技術的首款處理器Ivy Bridge技術細節。依照英特爾的預估，新芯片至少有四種不同版本，其中最大的一款將在160mm2芯片尺寸中整合14億個

2012-02-23 09:38:19

858

關于5G移動通信的技術細節

信息和通信技術（ICT）產業已經進入第四個升級周期，而其中的每一輪技術升級都獲得了成功；2G 與 3G 的成功以及當下 4G 的前景正在促成人們對新的 5G 移動通信系統達成共識。這些移動通信

2017-09-24 11:10:35

58 趕集集團旗下擁有多個 App，且全部使用同一套賬號體系，通過 Passport 部門提供的接口進行通信。經過多年迭代，各個 App 中關于 Passport 的功能均出現了一些流程和接口上的差異。為了提高賬號安全，統一服務接口和流程，提高用戶體驗，由此決定開發了一個 Passport SDK，以集成 Passport 的相關功能，并提供給集團內各業務 App 使用。在項目開始之初，我們在公司內經過調研發現在使用 SDK 時，大家最關心的問題就是 SDK 使用起來是否簡單，即接口是否簡

2017-09-28 19:18:39

英特爾與GlobalFoundries分別介紹介電質材料不同的新一代制程技術細節

在2017年度IEEE國際電子組件會議(IEDM)上，Intel與GlobalFoundries分別介紹了讓人眼前一亮的新一代制程技術細節。

2018-01-04 10:43:52

4732

深度剖析比特幣背后的技術細節

搞明白，同時也為了讓比特幣背后的技術細節顯得直觀, 我們將從你會如何發明自的比特幣的過程中一步一步地闡明.

2018-02-03 10:47:40

7098

操作 iPhone 控制小轎車

技術細節介紹

2018-06-25 00:02:00

2946

MIT公布“盲動”機器人技術細節

7月7日美國麻省理工學院近日發布公報稱，該校研究人員最新公布了一種“盲動”機器人的技術細節。這種機器人不需要借助視覺系統，可在崎嶇地形中穿行跳躍，有望在危險工作環境中得到廣泛應用。

2018-07-11 15:49:12

2873

結束了！新CEO徐子陽赴美談判，中美和解細節曝光

中興新任首席執行官（CEO）徐子陽率領ZTE新任高級管理人員，7月9日與美國商務部工業與安全局官員在華盛頓舉行了會談，雙方討論了托管賬戶的技術細節。

2018-07-14 11:11:24

4184

意法半導體公布ST54J系統芯片（SoC）的技術細節

意法半導體日前公布了其集成NFC（近場通信）控制器、安全單元和eSIM的高集成度移動安全解決方案ST54J系統芯片（SoC）的技術細節。

2018-10-10 11:01:03

6180

伯克利可擴展軟件交換機的細節介紹

在這里，我們介紹了BESS的一些技術細節，然后演示了如何在30分鐘內實現自定義虛擬交換機。

2018-10-30 06:05:00

2923

ST發布寬帶機頂盒系統級芯片技術細節

的領先優勢，發布即將推出的為用戶帶來非凡家庭娛樂體驗的高性能寬帶機頂盒系統級芯片的技術細節。該芯片屬于意法半導體新一代家庭娛樂平臺，擁有市場領先的能效、極高的性能以及業界最好的安全功能，并支持各種開源操作系統環境。新產品的處理性能高于市場上現有的機頂盒芯

2019-01-01 16:26:02

219

要想電流測得準，一定不能忽視的技術細節（第二講）

要想電流測得準，一定不能忽視的技術細節（第二講）

2019-07-02 11:40:48

2480

小米手表e-SIM技術細節揭露，明天發布

11月4日消息，小米生態鏈總經理屈恒揭秘了小米手表e-SIM技術細節。

2019-11-04 15:31:47

4422

IBM新一代主機IBM z15更多技術細節公布 14nm工藝爐火純青

近日，IBM披露了其新一代主機IBM z15的諸多技術細節，再次彰顯了藍色巨人的雄厚實力，尤其是緩存容量和密度驚人。

2020-03-09 14:52:54

4456

CISA發布惡意軟件分析報告，包含19個惡意文件的詳細細節

當地時間9月15日，美國網絡安全和基礎設施安全局（CISA）發布了一份惡意軟件分析報告（MAR），該報告詳細介紹了19個惡意文件的細節，其中包含有關伊朗黑客使用的Web Shell的技術細節。

2020-09-18 16:00:41

1669

高通全新旗艦芯片驍龍888技術細節揭曉

高通正式揭曉全新芯片Snapdragon 888（S888）技術細節，預計替Android旗艦手機帶來哪些改變呢？外媒整理五大重點，不僅是性能、手游表現提升，就連拍照都能藉由S888有更好的效果。

2020-12-03 12:01:46

1688

臺積電5nm SRAM技術細節

此處描述的詳細電路設計技術使產品開發人員能夠從這項領先技術中獲得最大的優勢。這也體現了產品／電路設計人員與負責產品良率和可靠性的工藝開發人員之間進行設計工藝協同優化（DTCO）的重要性。

2020-12-24 15:56:33

415

光液技術細節之五—路在何方

Lightyear結構的汽車，卡車和高鐵、輪船可以利用光液跟柴油、重油的混合燃燒。如甲醇跟航母的重油燃燒。

2020-12-26 15:52:48

238

揭秘賽靈思計算平臺ACAP技術細節

? 在日前召開的FPGA領域的學術頂會--2019年“FPGA國際研討會”上，賽靈思發表了兩篇長論文，詳細介紹了賽靈思“自適應計算加速平臺”ACAP的系統架構和技術細節。本文將對ACAP的主要架構

2021-01-04 09:53:24

2928

上汽榮威ER6純電三電系統的技術細節

? 最近上汽榮威R汽車ER6不僅銷量不錯，而且憑借著新一代新能源三電系統拿獎拿到手軟。針對這套純電動三電系統的技術細節，隨著小星來了解一下吧。我們先來看看上汽榮威ER6的性能參數。搭載新一代

2021-01-07 15:22:18

5893

ETCD集群的工作原理和高可用技術細節介紹

【導讀】新年快樂！本文介紹了etcd集群的工作原理和高可用技術細節。 etcd 簡介 coreos 開發的分布式服務系統，內部采用 raft 協議作為一致性算法。作為服務發現系統，有以下的特點

2021-02-23 10:54:59

8704

NVIDIA公開顯存智取技術細節

AMD RX 6000系列顯卡發布之后，提出了一項名為“顯存智取”（Smart Access Memory）的技術，搭配銳龍5000系列處理器、400/500系列主板，可以讓處理器訪問顯卡的全部顯存，從而提升最多10％以上的游戲性能。

2021-02-26 09:42:52

3632

一文解析鴻蒙系統誕生背景、技術細節生態圈

從鴻蒙系統的產生背景、開源技術細節和產業鏈生態圈全面解析鴻蒙系統。華為6月2日正式發布的鴻蒙系統無疑占據了最近熱點話題的C位，雖然不全是贊美的聲音，但這種努力打破美國壟斷，挑戰谷歌、蘋果在移動

2021-06-11 16:14:43

5389

迅速了解目標檢測的基本方法并嘗試理解每個模型的技術細節

本文將討論目標檢測的基本方法（窮盡搜索、R-CNN、Fast R-CNN和Faster R-CNN），并嘗試理解每個模型的技術細節。為了讓經驗水平各不相同的讀者都能夠理解，文章不會使用任何公式來進行

2021-08-26 15:08:52

2798

DJI goggles技術細節詳解

模擬圖傳具有較好的低延遲性能，且技術成熟度高，購買成本相對較低；模擬制式的FPV接收眼鏡，也有多種較為廉價的眼罩式產品可選；在許多大型競速比賽中指定使用模擬圖傳。

2022-04-14 09:44:47

8906

蒸汽流量計選型時，這幾個技術細節值得關注

蒸汽流量計選型時不僅要關注蒸汽流量計的測量原理、測量精度等參數，在如下幾個技術細節上也值得特別關注。? （1）對于標準孔板蒸汽流量計在滿足測量精度的同時，盡可能降低蒸汽流量計處壓力損失。在設計時

2022-07-26 07:45:45

885

講一講ChatGPT的技術細節

通過人工標注等方式，使用監督學習的模式對GPT3模型（對這個是chatGPT模型的base）進行初步訓練（有監督微調，SFT），從而得到一個初步能夠理解語言的模型，尤其是prompt的模式。

2023-01-03 17:38:58

1909

深入了解目標檢測深度學習算法的技術細節

本文將討論目標檢測的基本方法(窮盡搜索、R-CNN、Fast R-CNN和Faster R-CNN)，并嘗試理解每個模型的技術細節。為了讓經驗水平各不相同的讀者都能夠理解，文章不會使用任何公式來進行講解。

2023-01-05 16:27:20

230

保時捷兩檔箱技術細節

在開發這款兩檔變速器的過程中，保時捷在前期考慮過不同的設計方案。下圖展示了其中的六種方案。包括行星齒輪組形式（例如方案③、④、⑥）、圓柱齒輪形式（例如方案①），以及兩者的混合形式（例如方案②、⑤）。

2023-02-11 10:41:53

1652

ChatGPT數據泄露，技術細節公布

事件發生后，OpenAI 臨時關閉了 ChatGPT 服務以調查問題，后續 Open AI 的首席執行官 Sam Altman 也親自發了推文，承認他們確實遭遇了重大問題，不過當時并沒有公布問題的細節，只表示是一個開源庫的錯誤導致的。

2023-03-28 11:29:02

1123

基于LLAMA的魔改部署

去訓練），并且和Vision結合的大模型也逐漸多了起來。所以怎么部署大模型是一個超級重要的工程問題，很多公司也在緊鑼密鼓的搞著。目前效果最好討論最多的開源實現就是LLAMA，所以我這里討論的也是基于 LLAMA的魔改部署。基于LLAMA的finetune模型

2023-05-23 15:08:47

4396

LLaMA生態中的各個模型梳理

既然已經有了成功ChatGPT這一成功的案例，大家都想基于LLaMA把這條路再走一遍，以期望做出自己的ChatGPT。

2023-07-04 15:07:25

3280

RISC-V跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

2023-07-10 10:10:38

706

Llama 2性能如何

在幾乎所有基準上，Llama 2 70B 的結果均與谷歌 PaLM (540B) 持平或表現更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

2023-07-23 13:00:13

1115

爆火Llama 2一周請求下載超15萬，有人開源了Rust實現版本

隨著 Llama 2 的逐漸走紅，大家對它的二次開發開始流行起來。前幾天，OpenAI 科學家 Karpathy 利用周末時間開發了一個明星項目 llama2.c，借助 GPT-4，該項目僅用

2023-08-02 16:25:28

470

深入理解Llama模型的源碼案例

目前大部分開源LLM模型都是基于transformers庫來做的，它們的結構大部分都和Llama大同小異。

2023-08-23 11:44:07

1456

關于Llama 2的一切資源，我們都幫你整理好了

Meta 發布的 Llama 2，是新的 SOTA 開源大型語言模型（LLM）。Llama 2 代表著 LLaMA 的下一代版本，可商用。Llama 2 有 3 種不同的大小 —— 7B、13B 和 70B 個可訓練參數。

2023-08-23 15:40:09

674

8G顯存一鍵訓練，解鎖Llama2隱藏能力！XTuner帶你玩轉大模型

針對 GPU 計算特點，在顯存允許的情況下，XTuner 支持將多條短數據拼接至模型最大輸入長度，以此最大化 GPU 計算核心的利用率，可以顯著提升訓練速度。例如，在使用 oasst1 數據集微調 Llama2-7B 時，數據拼接后的訓練時長僅為普通訓練的 50% 。

2023-09-04 16:12:26

1236

怎樣使用QLoRA對Llama 2進行微調呢？

使用QLoRA對Llama 2進行微調是我們常用的一個方法，但是在微調時會遇到各種各樣的問題

2023-09-22 14:27:21

939

在線研討會 | 基于 LLM 構建中文場景檢索式對話機器人：Llama2 + NeMo

4,096，并對算法細節進行了優化，加速了推理速度，讓 Llama2 的性能有了很大的提升，能夠和 ChatGPT 相媲美。 Llama2 大模型旨在處理廣泛的語言任務，包括文本生成、機器翻譯、問題回答、代碼生成等等。該模型經過大規模的訓練，能夠理解并生成文本，為各種應用提供強大的自然語言處理能力。它的多

2023-10-13 20:35:02

563