我吃西红柿,已完结小说排行榜,欢乐颂小说结局是什么

大模型現存的問題和挑戰

這篇文章介紹了關于大型語言模型（LLMs）研究中的十個主要方向和問題：

1. 減少和度量幻覺：幻覺指的是AI模型虛構信息的情況，可能是創意應用的一個特點，但在其他應用中可能是一個問題。這個方向涉及減少幻覺和開發衡量幻覺的度量標準。

2. 優化上下文長度和構造：針對大多數問題，上下文信息是必需的，文章介紹了在RAG（Retrieval Augmented Generation）架構中優化上下文長度和構造的重要性。

3. 整合其他數據形式：多模態是強大且被低估的領域，文章探討了多模態數據的重要性和潛在應用，如醫療預測、產品元數據分析等。

4. 使LLMs更快、更便宜：討論了如何使LLMs更高效、更節約資源，例如通過模型量化、模型壓縮等方法。

5. 設計新的模型架構：介紹了開發新的模型架構以取代Transformer的嘗試，以及挑戰和優勢。

6. 開發GPU替代方案：討論了針對深度學習的新硬件技術，如TPUs、IPUs、量子計算、光子芯片等。

7. 使代理人更易用：探討了訓練能夠執行動作的LLMs，即代理人，以及其在社會研究和其他領域的應用。

8. 提高從人類偏好中學習的效率：討論了從人類偏好中訓練LLMs的方法和挑戰。

9. 改進聊天界面的效率：討論了聊天界面在任務處理中的適用性和改進方法，包括多消息、多模態輸入、引入生成AI等。

10. 為非英語語言構建LLMs：介紹了將LLMs擴展到非英語語言的挑戰和必要性。

1. 減少和衡量幻覺

幻覺是一個廣受關注的話題，指的是當AI模型編造信息時發生的情況。在許多創造性的應用場景中，幻覺是一種特性。然而，在大多數其他用例中，幻覺是一個缺陷。一些大型企業近期在關于大型語言模型的面板上表示，影響企業采用LLMs的主要障礙是幻覺問題。

減輕幻覺問題并開發用于衡量幻覺的度量標準是一個蓬勃發展的研究課題。有許多初創公司專注于解決這個問題。還有一些降低幻覺的方法，例如在提示中添加更多的上下文、思維鏈、自我一致性，或要求模型在回答中保持簡潔。

要了解更多關于幻覺的信息，可以參考以下文獻：

Survey of Hallucination in Natural Language Generation (Ji et al., 2022)

How Language Model Hallucinations Can Snowball (Zhang et al., 2023)

A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on Reasoning, Hallucination, and Interactivity (Bang et al., 2023)

Contrastive Learning Reduces Hallucination in Conversations (Sun et al., 2022)

Self-Consistency Improves Chain of Thought Reasoning in Language Models (Wang et al., 2022)

SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models (Manakul et al., 2023)

NVIDIA’s NeMo-Guardrails中關于事實核查和幻覺的簡單示例

2. 優化上下文長度限制

大部分問題需要上下文信息。例如，如果我們詢問ChatGPT：“哪家越南餐廳最好？”，所需的上下文將是“在哪里”，因為越南在越南和美國的最佳越南餐廳不同。

在這篇論文中提到，許多信息尋求性的問題都有依賴于上下文的答案，例如Natural Questions NQ-Open數據集中約占16.5%。對于企業用例，這個比例可能會更高。例如，如果一家公司為客戶支持構建了一個聊天機器人，為了回答客戶關于任何產品的問題，所需的上下文可能是該客戶的歷史或該產品的信息。

由于模型“學習”來自提供給它的上下文，這個過程也被稱為上下文學習。

3. 合并其他數據模態

多模態是非常強大但常常被低估的概念。它具有許多優點：

首先，許多用例需要多模態數據，特別是在涉及多種數據模態的行業，如醫療保健、機器人、電子商務、零售、游戲、娛樂等。例如，醫學預測常常需要文本（如醫生的筆記、患者的問卷）和圖像（如CT、X射線、MRI掃描）。