在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是加速計算?加速計算的應(yīng)用場景和解決方案

OSC開源社區(qū) ? 來源:又拍云 ? 2023-12-28 10:07 ? 次閱讀

隨著科技的發(fā)展,處理大量數(shù)據(jù)和進行復(fù)雜計算的需求越來越高,人工智能、大數(shù)據(jù)和物聯(lián)網(wǎng)等領(lǐng)域更是如此,傳統(tǒng)的計算方式已經(jīng)無法滿足這些需求。因此,加速計算作為一種現(xiàn)代計算方式,成了必要的手段。加速計算具有前所未有的處理能力,在云基礎(chǔ)設(shè)施中發(fā)揮著核心作用,因為它有助于更高效、更有效地管理數(shù)據(jù)中心的海量信息。此外,加速計算還能提供必要的計算能力和內(nèi)存,以便更高效地訓(xùn)練和實施 GPT-4 等高級生成式人工智能模型。這種能力可加快訓(xùn)練時間、處理大型數(shù)據(jù)集和開發(fā)日益復(fù)雜的模型。

加速計算利用 GPUASIC、TPU 和 FPGA 等專用硬件來執(zhí)行比 CPU 更高效的計算,從而提高速度和性能。它尤其適用于可并行化的任務(wù),如高性能計算、深度學(xué)習(xí)機器學(xué)習(xí)和人工智能。

加速計算發(fā)展迅速,各種硬件和軟件解決方案如 GPU、ASIC、TPU、FPGA、CUDA、OpenCL 和網(wǎng)絡(luò)技術(shù)層出不窮。下面我們來深入了解一下加速計算,就能明白為何它會成為 AI 時代的計算力“新寵”。

什么是加速計算

加速計算是指使用專用硬件來執(zhí)行某些類型的計算,其效率要比僅使用通用中央處理器(CPU)高。利用圖形處理單元(GPU)、專用集成電路(ASIC)(包括張量處理單元(TPU))和現(xiàn)場可編程邏輯門陣列(FPGA)等設(shè)備的強大功能,以更高的速度執(zhí)行計算,從而加速計算過程,一般我們也將這些設(shè)備稱之為加速器。

這些加速器尤其適用于可被分解為較小并行任務(wù)的項目,如高性能計算 (HPC)、深度學(xué)習(xí)、機器學(xué)習(xí)、人工智能和大數(shù)據(jù)分析。通過將指定類型的工作分派到這些專用加速計算硬件上,大大提高了系統(tǒng)的性能和效率。

加速計算因其高效處理海量數(shù)據(jù)的能力,從而推動了機器學(xué)習(xí)、AI、實時分析和科學(xué)研究的進步。加速計算在圖形、游戲、邊緣計算和云計算領(lǐng)域的影響力與日俱增,是數(shù)據(jù)中心等數(shù)字基礎(chǔ)設(shè)施的骨干力量。隨著對更強大應(yīng)用和系統(tǒng)的需求日益增長,傳統(tǒng)的 CPU 方法難以與加速計算競爭,而加速計算可提供更快、更具成本效益的性能升級。

加速計算解決方案

加速計算解決方案涉及硬件、軟件和網(wǎng)絡(luò)的結(jié)合。這些解決方案專門用于提高復(fù)雜計算任務(wù)的速度和效率。

硬件

硬件加速器是加速計算的基礎(chǔ),這些加速器包括圖形處理器 (GPU)、專用集成電路 (ASIC) 和現(xiàn)場可編程門陣列 (FPGA)。

16de7d68-a4a9-11ee-8b88-92fbcf53809c.png

GPU

圖形處理器(GPU)廣泛用于各種計算密集型任務(wù),其優(yōu)勢在于可以同時執(zhí)行許多復(fù)雜的計算,因此非常適合高性能計算(HPC)和機器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練等任務(wù)。

英偉達公司數(shù)據(jù)中心和計算密集型任務(wù)(機器學(xué)習(xí)、人工智能)的 GPU 市場上處于領(lǐng)先地位。該公司用于數(shù)據(jù)中心的主要 GPU 架構(gòu)包括 Hopper (H100) 和 Ampere (A100)。值得一提的是,H100 GPU 非常適合加速涉及大型語言模型 (LLM)、深度推薦系統(tǒng)、基因?qū)W和復(fù)雜數(shù)字孿生的應(yīng)用。

應(yīng)用型專用集成電路 ASIC

應(yīng)用型專用集成電路(ASIC)是為執(zhí)行特定任務(wù)而設(shè)計的定制芯片,與 CPU 不同, CPU 可處理各種應(yīng)用。由于專用集成電路是為特定功能定制的,因此執(zhí)行任務(wù)的效率比 CPU 更高,在速度、功耗和整體性能方面都具有優(yōu)勢。

我們常常在科技文章中看到的神經(jīng)處理單元(NPU)和深度學(xué)習(xí)處理器(DLP)就是 ASIC 中的一員,還有谷歌的張量處理單元(TPU)也是 ASIC 下的一員猛將。TPU 專為加速機器學(xué)習(xí)工作荷載而設(shè)計,它們被廣泛應(yīng)用于語言翻譯、谷歌助手中的語音識別智能化廣告排名等項目中。

現(xiàn)場可編程邏輯門陣列 FPGA

現(xiàn)場可編程邏輯門陣列(FPGA)是一種半導(dǎo)體集成電路,與 CPU 相比,F(xiàn)PGA 可重新編程以便能更高效地執(zhí)行特定任務(wù)。與 ASIC、GPU 和 CPU 的固定架構(gòu)不同,F(xiàn)PGA 硬件包括可配置邏輯塊和可編程互連。這樣,即使在芯片出廠和部署后,也可以進行功能更新。

FPGA 憑借其靈活性和并行計算能力,在數(shù)據(jù)中心的高性能計算、AI、機器學(xué)習(xí)中越來越受歡迎。不過,與 GPU 和定制 ASIC 解決方案相比,F(xiàn)PGA 的開發(fā)速度較慢,其軟件生態(tài)系統(tǒng)目前也不夠健全,由于其編程復(fù)雜,專業(yè)工程師的數(shù)量也很有限。

軟件

加速計算利用應(yīng)用編程接口(API)和編程模型(如 CUDA 和 OpenCL)來連接軟件和硬件。這樣可以優(yōu)化數(shù)據(jù)流,從而提高性能、能效、成本效益和準(zhǔn)確性。開發(fā)人員通過 API 和編程模型,就能夠編寫在 GPU 上運行的代碼,并利用軟件程序庫實現(xiàn)高效算法

CUDA

CUDA(全稱為 Compute Unified Device Architecture,統(tǒng)一計算架構(gòu))是英偉達公司開發(fā)的專有并行計算平臺和 API 模型,通過這個技術(shù),開發(fā)者可利用英偉達的 GPU 進行圖像處理之外的運算,顯著加速計算任務(wù)。該平臺包括 cuDNN、TensorRT 和 DeepStream 等深度學(xué)習(xí)庫,可增強人工智能訓(xùn)練和推理任務(wù)。

自 2006 年推出以來,CUDA 已被下載 4000 萬次,在全球擁有 400 萬開發(fā)者用戶群,已形成了一個龐大的開發(fā)者社區(qū),因此英偉達公司在數(shù)據(jù)中心硬件和軟件市場上占據(jù)了顯著優(yōu)勢。

OpenCL

OpenCL(Open Computing Language,開放計算語言)是一個為異構(gòu)平臺編寫程序的框架。OpenCL 的一個特別顯著的特點是它在不同硬件類型之間的可移植性,平臺可由 CPU、GPU、FPGA 或其他類型的處理器與硬件加速器所組成。其廣泛的兼容性使開發(fā)人員能夠利用這些不同硬件的強大功能,來進行加速計算。

網(wǎng)絡(luò)

網(wǎng)絡(luò)在加速計算中發(fā)揮著至關(guān)重要的作用,因為它有助于成千上萬個處理單元和內(nèi)存以及存儲設(shè)備之間的通信。各種網(wǎng)絡(luò)技術(shù)被用來實現(xiàn)這些計算設(shè)備與系統(tǒng)其他設(shè)備之間的通信,并在網(wǎng)絡(luò)內(nèi)的多個設(shè)備之間共享數(shù)據(jù)。常見的技術(shù)有:

PCI Express(PCIe):PCIe 是計算機總線的一個重要分支,它沿用既有的 PCI 編程概念及信號標(biāo)準(zhǔn),并且構(gòu)建了更加高速的串行通信系統(tǒng)標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)提供了計算設(shè)備與 CPU、內(nèi)存之間的直接連接。在加速計算中,PCIe 通常用于將 GPU 或其他加速器連接到主機系統(tǒng)。

NVLink:英偉達公司專有的高帶寬、高能效互連技術(shù),可提供比 PCIe 高得多的帶寬。該技術(shù)旨在促進 GPU 之間以及 GPU 與 CPU 之間更高效的數(shù)據(jù)共享。

Infinity Fabric:AMD 公司專有的互連技術(shù),用于連接其芯片中的各種組件,包括 CPU、GPU 和內(nèi)存。

Compute Express Link (CXL):CXL 是一種開放式互連標(biāo)準(zhǔn),有助于減少 CPU 和加速器之間的延遲同時增加帶寬。它將多個接口合并為一個 PCIe 接口,連接到 CPU。

InfiniBand:一種高速、低延遲的互連技術(shù),通常用于高性能計算(HPC)設(shè)置。它實現(xiàn)了服務(wù)器集群和存儲設(shè)備之間的高速互連。

以太網(wǎng):應(yīng)用最廣泛最成熟的網(wǎng)絡(luò)技術(shù),主要用于在數(shù)據(jù)中心的服務(wù)器之間傳輸大量數(shù)據(jù)。但是,它無法提供與 NVLink 或 InfiniBand 相同的性能水平。

16f6e740-a4a9-11ee-8b88-92fbcf53809c.png

△ NVLink 和 PCIe 與 CPU 連接的 GPU 架構(gòu)

加速計算應(yīng)用場景

生成式AI

加速計算是開發(fā)和實施先進的生成式 AI 模型的關(guān)鍵因素。生成式 AI 涉及使用算法來統(tǒng)計特征上與訓(xùn)練集相似的數(shù)據(jù),在圖像、文本和語音領(lǐng)域都有廣泛應(yīng)用。

在生成式 AI 領(lǐng)域,會用到生成對抗網(wǎng)絡(luò)(GANs)、變異自動編碼器(VAEs)和變換器(Transformers)等模型,還有包括 OpenAI 的 ChatGPT 的大型語言模型(LLMs)。這些模型所涉及到的復(fù)雜數(shù)學(xué)運算,需要在大型數(shù)據(jù)集上進行訓(xùn)練,并需要大量的計算能力和內(nèi)存。更具體地說,模型大小、每層復(fù)雜度、序列長度和多樣化是計算需求日益增加的最主要因素。

加速計算在解決生成式 AI 的計算能力和內(nèi)存需求方面發(fā)揮著至關(guān)重要的作用,其主要作用在加快訓(xùn)練時間、處理大型數(shù)據(jù)集、支持復(fù)雜模型、促進實時生成并保障高效梯度計算。

加快訓(xùn)練時間

加速計算在生成式 AI 中最重要的作用是縮短 GAN、VAE 和 Transformer 模型的訓(xùn)練時間。在基于 CPU 的傳統(tǒng)架構(gòu)上,這些模型的訓(xùn)練通常需要數(shù)天、數(shù)周甚至數(shù)月的時間,但 GPU 和 TPU 等加速計算平臺是專為并行處理而設(shè)計的加速硬件,它們能夠同時并行處理多個計算,從而大大縮短了訓(xùn)練時間。

處理大型數(shù)據(jù)集

生成式 AI 模型通常在海量數(shù)據(jù)集上進行訓(xùn)練,與傳統(tǒng) CPU 相比,加速計算硬件可以更高效地處理這些大型數(shù)據(jù)集。此外,使用先進的內(nèi)存架構(gòu)(如某些 GPU 中的高帶寬內(nèi)存)可以在訓(xùn)練過程中高效處理這些大型數(shù)據(jù)集。

創(chuàng)建復(fù)雜模型

加速計算所帶來的計算能力的提升,可以創(chuàng)建更復(fù)雜、更大型的模型,從而獲得更好的結(jié)果。例如,像 GPT-4 這樣擁有 170 萬億個參數(shù)的生成型預(yù)訓(xùn)練變換模型,只有通過加速計算才能實現(xiàn)。

實時功能

在某些應(yīng)用中,人工智能模型需要實時(或接近實時)生成輸出。這對于交互式應(yīng)用(如視頻游戲中的人工智能和實時翻譯)尤為重要。加速計算可確保快速執(zhí)行這些操作,從而實現(xiàn)實時功能。

高效的計算梯度

深度學(xué)習(xí)模型通過使用基于梯度的優(yōu)化技術(shù)(如反向傳播)進行學(xué)習(xí)。這些計算方法以誤差或損失函數(shù)最小化的方向來迭代調(diào)整模型參數(shù)。由于計算是基于矩陣的,因此具有很高的并行性,非常適合選用加速計算方案來處理。

AI數(shù)據(jù)中心

加速計算平臺的目的是加速各類數(shù)據(jù)中心的計算密集型工作,包括人工智能、數(shù)據(jù)分析、圖形和科學(xué)計算。這些數(shù)據(jù)中心包括企業(yè)、主機托管、超大規(guī)模/云、邊緣和模塊化設(shè)施,其主要目標(biāo)是提高工作負(fù)載性能,同時降低功耗和每次查詢的成本。

生成式 AI 和大型語言模型(LLM)在消費者、互聯(lián)網(wǎng)公司、企業(yè)和初創(chuàng)公司中的興起,使人工智能的應(yīng)用進入了一個快速發(fā)展時刻,加速了數(shù)據(jù)中心和云平臺中的 AI 推理部署。目前,大多數(shù) AI 推理工作都部署在 CPU 和網(wǎng)絡(luò)接口卡(NIC)上運行。然而,由于性能、能效、成本效益和功耗限制的日益增加,業(yè)界正在轉(zhuǎn)向利用 GPU 和 ASIC 等專用硬件進行加速計算。

現(xiàn)代數(shù)據(jù)中心的發(fā)展方向之一,就是建立一個可持續(xù)運行的 " AI 工廠"。通過 LLM、推薦系統(tǒng)以及最終的推理模型等人工智能模型,配備推理機群,以便支持各種各樣的工作任務(wù),例如視頻處理、文本生成、圖像生成以及虛擬世界和虛擬 3D 圖形。

使用GPU進行加速計算

使用 GPU 進行加速計算方法主要有三大類:

使用商業(yè)套裝軟件

使用開源或官方函式庫

自行編程 CUDA

第一項種類繁多,其中又以有限元素分析領(lǐng)域最多,此領(lǐng)域相關(guān)計算包含流體力學(xué)分析、熱傳導(dǎo)分析、電磁場分析或應(yīng)力分析等等應(yīng)用。由于范圍涵蓋 IC 設(shè)計、建筑設(shè)計、甚至許多交通工具或化工廠也需要通過這類軟件進行模擬分析,所以開發(fā)這類軟件有很大的商業(yè)價值。

第二項則比較個性化,由開發(fā)者自行編寫程序,GPU 的計算組件則可以引用他人已經(jīng)準(zhǔn)備好的函數(shù)庫,或者參考英偉達官方提供的函數(shù)庫,也可以從 GitHub 上進行搜索。

第三項就必須通過編程語言進行 CUDA 編寫,不同的編程語言能夠操縱的自由度也各不相同,其中 C/C++ 或 Fortran屬于開發(fā)自由度最高的編程語言,可從底層控制 GPU 計算,甚至可以針對本機內(nèi)存與 GPU 內(nèi)存數(shù)據(jù)的傳輸進行優(yōu)化。其次則為 Python,Python 也是目前市面上最主流的 AI 應(yīng)用開發(fā)語言,實現(xiàn)的方式包括 PyCuda 或者使用Numba 函數(shù)庫。另外,Java、R、C# 等也都可以支持 CUDA。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19714

    瀏覽量

    232729
  • FPGA
    +關(guān)注

    關(guān)注

    1641

    文章

    21910

    瀏覽量

    611664
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33443

    瀏覽量

    274023
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5546

    瀏覽量

    122278
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    1099

    瀏覽量

    15337

原文標(biāo)題:加速計算,為何會成為AI時代的計算力“新寵”

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    加速云發(fā)布新品,異構(gòu)計算加速平臺有效滿足AI及高性能計算業(yè)務(wù)需求

    致力于提供異構(gòu)計算加速整體解決方案、業(yè)界領(lǐng)先的異構(gòu)加速和業(yè)務(wù)卸載方案廠商——杭州加速云信息技術(shù)有
    的頭像 發(fā)表于 04-17 16:52 ?6886次閱讀

    FPGA與MCU的應(yīng)用場景

    FPGA的應(yīng)用場景有這些: 快速原型設(shè)計 FPGA可以快速配置成多種定制數(shù)字電路,允許在不需要昂貴且耗時的制造過程的情況下進行快速部署和修改。 硬件加速 在需要高性能和低延遲的應(yīng)用中,F(xiàn)PGA的并行
    發(fā)表于 07-29 15:45

    計算十大應(yīng)用場景

    和創(chuàng)新制造等全行業(yè)延伸拓展。云計算將在IT產(chǎn)業(yè)各個方面都有其用武之地,以下是云計算十個比較典型的應(yīng)用場景!1. IDC云IDC云是在IDC原有數(shù)據(jù)中心的基礎(chǔ)上,加入更多云的基因,比如系統(tǒng)虛擬化技術(shù)、自動化
    發(fā)表于 03-20 15:07

    解決方案加速海嘯模擬

    挑戰(zhàn)海嘯模擬將物理過程模擬與大量深海數(shù)據(jù)相結(jié)合。這些計算通常在大規(guī)模并行超級計算機上完成,但具有硬件利用率低和性能差的缺陷。解決方案通過硬件浮點 FPGA 加速模擬內(nèi)循環(huán)可實現(xiàn)高達 3
    發(fā)表于 07-27 15:04

    加速度傳感器的7大不同應(yīng)用場景

    制動啟動檢測、地震檢測、工程測振、地質(zhì)勘探、振動測試與分析以及安全保衛(wèi)振動偵察等多種領(lǐng)域。下面就舉例幾種應(yīng)用場景,更好的認(rèn)識加速度傳感器。三軸加速度傳感器的應(yīng)用1、車身安全、控制及導(dǎo)航系統(tǒng)中
    發(fā)表于 09-18 11:48

    請問怎么通過MPU6050的x,,y,z軸加速度,計算出合加速

    如題,MPU6050采集出來的是三軸加速度,但是我現(xiàn)在想通過計算求出合加速度。要怎么計算呢?這是我自己寫的算法,合加速度a = a[0] /
    發(fā)表于 04-19 05:07

    機器學(xué)習(xí)實戰(zhàn):GNN加速器的FPGA解決方案

    場景。如上所述種種設(shè)計挑戰(zhàn)的存在,使得業(yè)界急需一種可以支持高度并發(fā)實時計算、巨大內(nèi)存容量和帶寬、以及在數(shù)據(jù)中心范圍可擴展的GNN加速解決方案。5. GNN
    發(fā)表于 10-20 09:48

    GNN(圖神經(jīng)網(wǎng)絡(luò))硬件加速的FPGA實戰(zhàn)解決方案

    。如上所述種種設(shè)計挑戰(zhàn)的存在,使得業(yè)界急需一種可以支持高度并發(fā)實時計算、巨大內(nèi)存容量和帶寬、以及在數(shù)據(jù)中心范圍可擴展的GNN加速解決方案。5.GNN加速器的FPGA設(shè)計
    發(fā)表于 07-07 08:00

    ARM MPcore系統(tǒng)中ACP(加速器一致性接口的 )應(yīng)用場景如何配置

    ARM MPcore系統(tǒng)中ACP(加速器一致性接口的 )作用,具體應(yīng)用場景?如何配置?
    發(fā)表于 09-08 11:24

    業(yè)內(nèi)最強的FPGA圖像加速解決方案

    近日,百度云與聯(lián)捷計算科技(CTAccel)共同推出基于FPGA的圖像加速解決方案(CIP,CTAccel Image Processor),實現(xiàn)對JPEG轉(zhuǎn)碼JPEG、JPEG轉(zhuǎn)碼WebP(M6)等進行FPGA
    發(fā)表于 06-18 14:35 ?1705次閱讀

    FPGA與GPU計算存儲加速對比

    為了提升計算基礎(chǔ)設(shè)施的性能,并緊跟數(shù)據(jù)分析與 AI 不斷攀升的需求,眾多企業(yè)將硬件加速視為主要的解決方案。在大多數(shù)情況下,先進的可編程硬件(主要是指 GPU 和 FPGA)是加速的主要
    的頭像 發(fā)表于 08-02 08:03 ?2386次閱讀
    FPGA與GPU<b class='flag-5'>計算</b>存儲<b class='flag-5'>加速</b>對比

    計算芯片發(fā)展加速.zip

    計算芯片發(fā)展加速
    發(fā)表于 01-13 09:07 ?3次下載

    加速場景智能化:華為行業(yè)感知出席2023計算產(chǎn)業(yè)生態(tài)大會

    產(chǎn)業(yè)健康可持續(xù)發(fā)展。 華為行業(yè)感知以“感知邊緣,加速邊緣場景智能化”為主題參與本次盛會, 并以“好望智能邊緣解決方案”榮獲“2023邊緣計算十大解決
    的頭像 發(fā)表于 12-15 16:05 ?1016次閱讀
    <b class='flag-5'>加速</b><b class='flag-5'>場景</b>智能化:華為行業(yè)感知出席2023<b class='flag-5'>計算</b>產(chǎn)業(yè)生態(tài)大會

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學(xué)計算、數(shù)據(jù)分析、機器學(xué)習(xí)等復(fù)雜
    的頭像 發(fā)表于 10-25 09:23 ?449次閱讀

    GPU加速計算平臺的優(yōu)勢

    傳統(tǒng)的CPU雖然在日常計算任務(wù)中表現(xiàn)出色,但在面對大規(guī)模并行計算需求時,其性能往往捉襟見肘。而GPU加速計算平臺憑借其獨特的優(yōu)勢,吸引了行業(yè)內(nèi)人士的廣泛關(guān)注和應(yīng)用。下面,AI部落小編為
    的頭像 發(fā)表于 02-23 16:16 ?260次閱讀
    主站蜘蛛池模板: 色婷婷网 | 国产精品毛片一区二区三区 | hdhdhd69日本xxx| 欧美性生活网址 | 一级视频在线播放 | 日韩精品视频免费在线观看 | 亚洲成人免费网站 | 国产成人精品本亚洲 | 日本在线看小视频网址 | 亚洲免费黄色网 | hd性欧美| 免费看吻胸亲嘴激烈网站 | 五月天婷婷伊人 | 四虎精品免费国产成人 | 欧美色人阁| 人人乳乳香蕉大免费 | 精品看片| 一级无毛片 | 在线天堂中文 | 久草色播| 97精品久久天干天天蜜 | 曰本福利写真片视频在线 | 久久福利青草精品资源 | 美日韩免费视频 | 九七婷婷狠狠成人免费视频 | 国产―笫一页―浮力影院xyz | 欧洲一级鲁丝片免费 | 欧美爱爱帝国综合社区 | 婷婷六月丁香午夜爱爱 | 看全色黄大色大片免费久久 | 天天插综合网 | 色播五月婷婷 | 九七婷婷狠狠成人免费视频 | 久久久国产精品免费 | 国模视频在线 | 亚洲国产网 | 人人插人人爽 | 日本人zzzwww | 人人爱人人澡 | 久久香蕉国产精品一区二区三 | 久久精品免看国产 |