在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

源代碼與二進(jìn)制文件SCA檢測(cè)原理

IT科技蘇辭 ? 來(lái)源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-10-14 09:12 ? 次閱讀

源代碼與二進(jìn)制文件SCA檢測(cè)原理

1、源代碼與二進(jìn)制的關(guān)系和特點(diǎn)

SCA(Software Composition Analysis)軟件成分分析,通俗的理解就是通過(guò)分析軟件包含的一些信息和特征來(lái)實(shí)現(xiàn)對(duì)該軟件的識(shí)別、管理、追蹤的技術(shù)。SCA具體的檢測(cè)原理又是如何實(shí)現(xiàn)的,源代碼和二進(jìn)制文件的SCA檢測(cè)又有哪些相同點(diǎn)和不同點(diǎn),下面內(nèi)容就來(lái)回答一下上述疑問(wèn)。

對(duì)應(yīng)編譯類(lèi)型的語(yǔ)言(C/C++/Go/Rust),都是遵循:源代碼—>編譯—>鏈接—>二進(jìn)制文件的過(guò)程。影響二進(jìn)制文件的因素包括不同的CPU架構(gòu)(ARM、X86、PPC、MIPS…),不同的操作系統(tǒng)(Wndows、LinuxiOSAndroid…),不同的編譯優(yōu)化選項(xiàng)(O0~O3),即使是同一套源代碼,最終編譯生成的二進(jìn)制文件之間也是差別非常大的。注:上述影響因素不涉及java語(yǔ)言

從上面可知源代碼和二進(jìn)制文件之間存在巨大的差別,源代碼是基于高階語(yǔ)言來(lái)編寫(xiě),是給人看的,人看了很方便理解其中語(yǔ)句的語(yǔ)義;而二進(jìn)制是由流(指令流或字節(jié)流)來(lái)構(gòu)成的,是給計(jì)算機(jī)“看”的,對(duì)人來(lái)說(shuō)是非常不友好,不好理解。

源代碼包含了變量符號(hào)類(lèi)型、函數(shù)名稱(chēng)、類(lèi)名稱(chēng)、代碼邏輯結(jié)構(gòu)等大量豐富的代碼信息,相反為保留二進(jìn)制文件的緊湊性,編譯生成的二進(jìn)制文件中會(huì)丟棄掉很多運(yùn)行時(shí)用不到的信息,只保留程序正確運(yùn)行必要的信息,比如被丟棄的信息有變量類(lèi)型、變量名稱(chēng)等符號(hào)信息,可能被保留的有類(lèi)名稱(chēng)、函數(shù)名稱(chēng)等信息,一定會(huì)保留的有常量字符串?dāng)?shù)據(jù)。另外為了保證程序的正確運(yùn)行,還會(huì)有保留一個(gè)相應(yīng)的配置信息,比如jar包中的manifest信息、POM信息、maven信息、資源文件等。基于這些特點(diǎn)源代碼SCA和二進(jìn)制SCA的檢測(cè)原理也存在很大的不同。

2、源代碼SCA檢測(cè)原理

由于源代碼中包含有豐富的程序信息,因此源代碼的SCA檢測(cè)既有大顆粒度的檢測(cè)方法,也有細(xì)顆粒度的檢測(cè)方法。

2.1 大顆粒度檢測(cè)方法:根據(jù)源代碼文件的相似度來(lái)判斷屬于什么組件和版本;文件相似度可以基于hash的嚴(yán)格匹配方法,也可以根據(jù)文本相似度匹配方法;這種匹配方法的優(yōu)點(diǎn)是效率高,匹配速度極快,確定是也很明顯,基于hash的容易漏報(bào),基于文本相似度的準(zhǔn)確率低;

2.2 細(xì)顆粒度檢測(cè)方法:經(jīng)過(guò)源代碼—>詞法分析—>Token提取—>語(yǔ)法分析—>AST抽象語(yǔ)法樹(shù)—>語(yǔ)義分析過(guò)程來(lái)提取相應(yīng)的數(shù)據(jù),再通過(guò)機(jī)器學(xué)習(xí)、NLP、CFG調(diào)用圖、DFG數(shù)據(jù)流圖等等匹配算法進(jìn)行代碼相似度的檢測(cè),這種基于語(yǔ)義的代碼相似度檢測(cè)與基于文本相似度檢測(cè)相比準(zhǔn)確率高;

2.3 具備包管理機(jī)制的語(yǔ)言,比如Java、Go,可以通過(guò)引用的開(kāi)源軟件包信息來(lái)實(shí)現(xiàn)開(kāi)源軟件的關(guān)聯(lián)分析,這種方法可以幾乎可以100%準(zhǔn)確的分析出引用的開(kāi)源軟件名稱(chēng)。

3、二進(jìn)制SCA檢測(cè)原理

3.1 雖然好多源代碼中具有的信息在二進(jìn)制文件中不存在,但是對(duì)于常量字符串、部分類(lèi)名稱(chēng)、函數(shù)名稱(chēng)、以及一些配置信息還是存在的,并且這些信息具備一定的不變性,即受cpu架構(gòu)、不同編譯優(yōu)化選項(xiàng)的影響很小,因此二進(jìn)制SCA主要從二進(jìn)制文件中提取這些方面的不同特征,再運(yùn)用匹配算法進(jìn)行相似度計(jì)算,并根據(jù)相似度門(mén)限來(lái)檢測(cè)出引用的開(kāi)源軟件名稱(chēng)和版本號(hào)。

3.2 結(jié)合分析二進(jìn)制代碼中的CFG調(diào)用圖、DFG數(shù)據(jù)流圖等信息進(jìn)行更加精準(zhǔn)的檢測(cè),但由于這些分析需要對(duì)二進(jìn)制文件進(jìn)行指令反匯編,導(dǎo)致分析時(shí)間非常的長(zhǎng),分析效率低下,因此這種SCA檢測(cè)方法不適合對(duì)大規(guī)模二進(jìn)制文件進(jìn)行掃描。

4、源代碼SCA和二進(jìn)制SCA功能對(duì)比

比較項(xiàng) 源代碼SCA 二進(jìn)制SCA 備注
檢測(cè)對(duì)象 源代碼 二進(jìn)制
檢測(cè)效率
檢測(cè)準(zhǔn)確率 稍高 檢測(cè)準(zhǔn)確率和目標(biāo)程序引用開(kāi)源軟件功能多少相關(guān)
嵌套組件檢測(cè)能力 強(qiáng) 二進(jìn)制中不會(huì)遺漏所有引入的開(kāi)源軟件功能特征信息
檢測(cè)語(yǔ)言種類(lèi) 二進(jìn)制SCA只支持能夠編譯出指令流或字節(jié)流二進(jìn)制文件的語(yǔ)言
文件格式 簡(jiǎn)單 復(fù)雜 源代碼都可看作文本格式,二進(jìn)制文件存在pe、elf、coff、jar、apk…
文件特點(diǎn) 一個(gè)開(kāi)源軟件包含N源碼文件 一個(gè)二進(jìn)制文件包含N個(gè)開(kāi)源軟件 一個(gè)開(kāi)源軟件由N>=1個(gè)源碼文件;一個(gè)二進(jìn)制文件包含N>=1個(gè)開(kāi)源軟件
檢測(cè)階段 開(kāi)發(fā)階段 測(cè)試階段
檢測(cè)繞過(guò) 存在 不存在 源碼在構(gòu)建環(huán)境中引入或鏈接靜態(tài)庫(kù)引入的開(kāi)源軟件存在繞過(guò)源代碼SCA檢測(cè)
樣本特征構(gòu)建難度 需要編譯構(gòu)建出二進(jìn)制
人工確認(rèn)分析難度 源代碼人工對(duì)比分析容易
審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 二進(jìn)制
    +關(guān)注

    關(guān)注

    2

    文章

    803

    瀏覽量

    42032
  • SCA
    SCA
    +關(guān)注

    關(guān)注

    1

    文章

    37

    瀏覽量

    12084
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2949

    瀏覽量

    67512
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    偏移二進(jìn)制二進(jìn)制補(bǔ)碼如何和實(shí)際數(shù)據(jù)對(duì)應(yīng),如何轉(zhuǎn)換?

    偏移二進(jìn)制二進(jìn)制補(bǔ)碼如何和實(shí)際數(shù)據(jù)對(duì)應(yīng),如何轉(zhuǎn)換,請(qǐng)哪位高手解惑
    發(fā)表于 01-16 06:01

    bcd編碼的應(yīng)用 bcd與二進(jìn)制的區(qū)別

    BCD(Binary-Coded Decimal)編碼是一種二進(jìn)制編碼形式,用于表示十進(jìn)制數(shù)字。它將每個(gè)十進(jìn)制數(shù)字(0-9)直接編碼為一個(gè)四位二進(jìn)制數(shù)。BCD編碼的主要優(yōu)點(diǎn)是易于閱讀和
    的頭像 發(fā)表于 12-20 17:11 ?2412次閱讀

    hex格式和二進(jìn)制的區(qū)別

    HEX格式和二進(jìn)制在多個(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩者的對(duì)比: 一、定義與表示方式 HEX格式 : HEX,全稱(chēng)為Intel HEX,是一種用于存儲(chǔ)和傳輸數(shù)據(jù)到嵌入式系統(tǒng)(如單片機(jī))的文件
    的頭像 發(fā)表于 11-18 15:24 ?1312次閱讀

    在線(xiàn)二進(jìn)制編碼器:數(shù)據(jù)轉(zhuǎn)換的快捷通道

    在數(shù)字時(shí)代,數(shù)據(jù)的快速轉(zhuǎn)換與處理至關(guān)重要。二進(jìn)制編碼,作為計(jì)算機(jī)內(nèi)部數(shù)據(jù)表示的基礎(chǔ),將信息轉(zhuǎn)化為0和1的序列,為數(shù)字世界構(gòu)建了溝通的橋梁。然而,對(duì)于非專(zhuān)業(yè)用戶(hù)來(lái)說(shuō),手動(dòng)進(jìn)行二進(jìn)制編碼既繁瑣又易出錯(cuò)
    的頭像 發(fā)表于 11-15 09:01 ?1446次閱讀

    base64字符串轉(zhuǎn)換為二進(jìn)制文件

    一些編程知識(shí)。以下是將Base64字符串轉(zhuǎn)換為二進(jìn)制文件的一般步驟,以及一個(gè)簡(jiǎn)單的Python示例代碼。 步驟: 獲取Base64字符串 :首先,你需要有一個(gè)Base64編碼的字符串。 解碼Base64字符串 :使用編程語(yǔ)言提供
    的頭像 發(fā)表于 11-10 10:55 ?2484次閱讀

    ASCII碼和二進(jìn)制的轉(zhuǎn)換關(guān)系

    。ASCII碼使用7位二進(jìn)制數(shù)來(lái)表示128個(gè)不同的字符,包括大小寫(xiě)英文字母、數(shù)字0-9以及一些控制字符和標(biāo)點(diǎn)符號(hào)。后來(lái),ASCII碼被擴(kuò)展到了8位,即ASCII-8BIT,可以表示256個(gè)不同的字符。 二進(jìn)制
    的頭像 發(fā)表于 11-10 09:50 ?3175次閱讀

    二進(jìn)制編碼器的精度與分辨率

    編碼器是一種將模擬信號(hào)(如電壓、溫度等)轉(zhuǎn)換為二進(jìn)制代碼的設(shè)備。它通常包含一個(gè)模數(shù)轉(zhuǎn)換器(ADC),該轉(zhuǎn)換器通過(guò)比較輸入信號(hào)與一系列參考電壓來(lái)確定輸入信號(hào)的值。編碼器的輸出是一個(gè)二進(jìn)制數(shù),表示輸入信號(hào)的數(shù)字等價(jià)。
    的頭像 發(fā)表于 11-06 09:56 ?917次閱讀

    二進(jìn)制編碼器在自動(dòng)化領(lǐng)域的作用

    二進(jìn)制編碼器是一種將二進(jìn)制信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的電子設(shè)備,廣泛應(yīng)用于自動(dòng)化領(lǐng)域。 一、二進(jìn)制編碼器的工作原理 二進(jìn)制編碼器是一種將二進(jìn)制信號(hào)轉(zhuǎn)
    的頭像 發(fā)表于 11-06 09:53 ?734次閱讀

    二進(jìn)制編碼器在機(jī)器人中的應(yīng)用

    二進(jìn)制信號(hào),為機(jī)器人提供精確的狀態(tài)信息。 二進(jìn)制編碼器的工作原理 二進(jìn)制編碼器是一種將物理量(如位置、速度等)轉(zhuǎn)換為二進(jìn)制代碼的設(shè)備。在機(jī)
    的頭像 發(fā)表于 11-06 09:48 ?806次閱讀

    二進(jìn)制編碼器的種類(lèi)及特點(diǎn)

    二進(jìn)制編碼器是一種電子電路,用于將二進(jìn)制信號(hào)轉(zhuǎn)換為其他格式,如十進(jìn)制、格雷碼等。以下是一些常見(jiàn)的二進(jìn)制編碼器種類(lèi)及其特點(diǎn): 優(yōu)先編碼器(Priority Encoder) : 特點(diǎn) :
    的頭像 發(fā)表于 11-06 09:47 ?1047次閱讀

    二進(jìn)制編碼器應(yīng)用場(chǎng)景 二進(jìn)制編碼器與模擬編碼器比較

    限性。 二進(jìn)制編碼器概述 二進(jìn)制編碼器是一種將輸入信號(hào)轉(zhuǎn)換為二進(jìn)制代碼的設(shè)備。它通常用于數(shù)字系統(tǒng)中,將模擬信號(hào)或非二進(jìn)制信號(hào)轉(zhuǎn)換為
    的頭像 發(fā)表于 11-06 09:45 ?943次閱讀

    二進(jìn)制編碼器工作原理 如何選擇二進(jìn)制編碼器

    二進(jìn)制編碼器是一種數(shù)字電路,它將輸入的二進(jìn)制代碼轉(zhuǎn)換為對(duì)應(yīng)的輸出信號(hào)。在數(shù)字系統(tǒng)中,編碼器用于將數(shù)據(jù)從一種形式轉(zhuǎn)換為另一種形式,以便于處理和傳輸。 二進(jìn)制編碼器工作原理 輸入與輸出關(guān)系
    的頭像 發(fā)表于 11-06 09:44 ?1841次閱讀

    二進(jìn)制補(bǔ)碼及與原碼的互相轉(zhuǎn)換方法

    大沙把一些基礎(chǔ)的知識(shí)說(shuō)清楚,本文介紹二進(jìn)制補(bǔ)碼及與原碼的轉(zhuǎn)換方法。 先說(shuō)原碼,原碼?是一種計(jì)算機(jī)中對(duì)數(shù)字的二進(jìn)制定點(diǎn)表示方法。在原碼表示法中,數(shù)值前面增加了一位符號(hào)位,最高位為符號(hào)位,0表示正數(shù),1
    的頭像 發(fā)表于 09-19 22:25 ?1053次閱讀

    二進(jìn)制處理中的一些技巧

    二進(jìn)制和十進(jìn)制的處理中,有時(shí)候一些小技巧是很有用的。 1、把十進(jìn)制數(shù)轉(zhuǎn)換成二進(jìn)制數(shù) (1)在MATLAB中有一個(gè)函數(shù)dec2bin,可以把正整數(shù)轉(zhuǎn)換為2
    的頭像 發(fā)表于 07-05 11:51 ?778次閱讀

    二進(jìn)制串行計(jì)數(shù)器工作原理是什么?

    在數(shù)字電路設(shè)計(jì)中,計(jì)數(shù)器是一種非常關(guān)鍵的組件,用于測(cè)量時(shí)間、計(jì)數(shù)事件或跟蹤狀態(tài)變化等。其中,二進(jìn)制串行計(jì)數(shù)器作為一種常用的計(jì)數(shù)器類(lèi)型,在多種應(yīng)用場(chǎng)景中都發(fā)揮著重要作用。本文將對(duì)二進(jìn)制串行計(jì)數(shù)器
    的頭像 發(fā)表于 05-28 15:52 ?1219次閱讀
    主站蜘蛛池模板: 99久久精品费精品国产 | 国产―笫一页―浮力影院xyz | 在线免费观看一级毛片 | 天天操天天舔天天干 | 久久的色偷偷 | 五月婷花 | 久草天堂 | 亚洲国产成人成上人色 | 国产一卡二卡≡卡四卡无人 | 日韩一级视频免费观看 | 一区二区三区影院 | 天天操天天射天天舔 | 免费精品99久久国产综合精品 | 欧美无遮挡一区二区三区 | 久久午夜神器 | 九九国产在线观看 | 性欧美xxxx | 国片一级 免费看 | 国产真实乱xxxav | 精品一区二区国语对白 | 九九热精品在线观看 | 国产免费色视频 | 免费观看在线视频 | 丁香亚洲综合五月天婷婷 | 午夜欧美福利视频 | 97久久综合区小说区图片专区 | 男男生子大肚play做到生 | 激情综合网五月激情 | 欧美一区二区三区视频在线观看 | 国产午夜精品久久久久免费视 | 久久精品99无色码中文字幕 | 久草视频在线免费看 | 亚洲 午夜在线一区 | 天天鲁天天爽精品视频 | 色综合天天综合网国产成人网 | 欧美性xxxxbbbb | h在线观看免费 | 色婷婷六月天 | 欧美三级黄视频 | 国产精品久久久精品视频 | 久久51|