在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

設計一個信息管理系統,你需要知道這些

UtFs_Zlgmcu7890 ? 來源:互聯網 ? 作者:佚名 ? 2017-09-29 06:23 ? 次閱讀

近日周立功教授公開了數年的心血之作《程序設計與數據結構》,電子版已無償性分享到電子工程師與高校群體下載,經周立功教授授權,特對本書內容進行連載。

>>>>1.1 哈希表

>>>1.1.1 問題

假設需要設計一個信息管理系統,用于管理大約一萬個學生的相關信息,可以通過學號查找到對應學生的信息,每條學生記錄包含學號、姓名、性別、身高、體重等信息。即:

typedef struct _student{

unsigned char id[6]; //學號(6字節)

char name[10]; //姓名

char sex; //性別

float height, weight; //身高、體重

}student_t;

作為信息管理系統,首先要能夠存儲學生記錄,這上萬條記錄如何存儲呢?簡單地,可以使用一段連續的內存存儲學生記錄,比如,使用一個大數組存儲,每個數組元素都可以存儲一條學生記錄:

student_t student_db[10000];

當使用數組存儲學生信息時,如何通過學號查找相應的信息呢?如果學號編排是一種非常理想的情況,10000個學生的學號按照 0 ~ 9999順序排列,則可以直接將學號作為數組的索引值查找相應的數組元素,其存儲和查找的效率都非常高。但實際上學號往往不是如此簡單編排的,一種常見的編排方法是“年級+專業代碼+班級+班級內序號”,比如,6字節學號為0x20, 0x16, 0x44, 0x70, 0x02, 0x39,即:201644700239,表示2016年入學,專業代碼為4470(即計算機專業),2班的39號同學。

此時,通過學號查找學生信息的方法也很簡單,直接從第一個學生記錄開始,順序遍歷各個學生記錄,將記錄中的學號與期望查找的學生學號相比較,學號相同即查找到了相應學生的信息,詳見程序清單3.61

程序清單3.61順序查找范例程序

1 student_t * student_search(unsigned char id[6])

2 {

3 for (int i = 0; i < 10000; i++) {

4 if (memcmp(student_db[i].id, id, 6) == 0) { //比較

5 return &student_db[i]; //找到該學生的信息

6 }

7 }

8 return NULL; //未找到該學生的信息

9 }

顯然,如果采用順序查找法,學生記錄越多,則查找時需要比較的次數越多,效率也就越低。當學生記錄的條數上萬時,則可能需要比較上萬次才能找到相應的學生信息。

如何以更高的效率實現查找呢?在理想情況下,若將學號作為數組索引存儲數據,則查找的效率非常高。既然如此,如果擴大數組容量至學號的最大值加1(以包含學號0),則可以直接以學號作為數組的索引值。由于學號是由6字節組成的,因此數組必須能夠容納248條記錄,需要占用多少存儲空間呢?就算一條記錄只占用一個字節,也需要262144 G存儲空間,何況電腦硬盤沒這么大!如果只使用其中的10000條記錄,則剩下的(248-10000)空間就會造成極大的浪費,顯然這種方式是不可取的。

在查找算法中,非常經典高效的算法是“二分法查找”,按10000條記錄算,最多也只需要比較14次(log210000)。但使用“二分法查找”的前提是信息必須有序排列,即要求學生記錄必須按照學號的順序存儲,這就導致在添加或刪除學生信息時,數據庫存儲的信息需要進行大量的移動操作。比如,數組中已經按照學號從小到大的順序存儲了9999條記錄,現在寫入第10000條記錄,若該記錄的學號最小,需要寫入到所有記錄的前面,這就需要將之前存儲的9999條記錄全部向后移動一次,以預留出首元素的空間,然后將新的學生記錄寫入首元素對應的空間中。由此可見,雖然使用這種方法可以提高查找效率,卻犧牲了添加信息時的效率。

為了在添加信息時不進行大量的數據移動,能否換一種存儲方式呢?比如,使用存儲空間不連續的“單向鏈表”結構,將各個學生記錄“鏈”起來,其示意圖詳見圖3.23

圖3.23 使用單向鏈表管理學生記錄

當使用鏈表管理學生記錄時,實現有序排列只需每次插入新結點時,找到正確的插入位置,無需進行大量數據的移動。由于存儲空間不連續,因此無法使用“二分法”查找學生信息,則實現有序排列也沒有解決查找效率低下的問題,無論是否有序,查找時都需要從頭開始順序查找。

由此可見,使用“二分法查找”必須犧牲記錄寫入的效率以實現所有記錄有序排列,使得寫入記錄的效率非常低。雖然基礎的“順序查找”對寫入記錄的效率完全不影響,但查找效率極為低下。因此,這兩種情況都太極端了,要么選擇極低的寫入效率,要么選擇極低的查找效率。何不將二者結合一下,以折中寫入的效率和查找的效率呢?比如,將記錄“二分”為兩部分,使用兩個數組來存儲:

student_t student_db0[5000];

student_t student_db1[5000];

假設規定,學號小于某值(即201044700239)時,記錄存儲在student_db0反之記錄存儲在student_db1中。如此一來,在寫入記錄時,只需要多一條判斷語句,對性能并沒太大影響。而在查找時,只要根據學號判斷記錄在哪一個數組中,即可按照順序查找的方式查找。此時,查找需要比較的次數就從最大的10000次降低到了5000次。由此可見,通過一個簡單的方法,將信息分別存儲在兩個數組中,就可以明顯地提高查找效率。為了繼續提高查找的效率,還可以繼續分組,比如,分成250組,每組的大小為40:

student_t student_db0[40];

student_t student_db1[40];

……

student_t student_db248[40];

student_t student_db249[40];

顯然,采用這種定義方式太繁瑣了,由于每個數組的大小是相同的,因此可以直接將存儲40個學生記錄的數組定義為一個類型:

typedef student_t student_group_t[40];

student_group_t student_db[250];

此時,每個分組的大小為40,從而使得查找記錄時,最多只需要比較40次。接下來,需要定義分組規則,以通過學號找到該記錄屬于哪個組。在定義規則時,應盡可能地使所有記錄平均地分布在各個組中,不應該出現一些組存儲的記錄非常多,而一些組存儲的記錄非常少的情況。但這并不是一件容易的事情,需要對學號的數據分布進行精確的分析。

如果分成250組,假定學號是均勻分布的,則可以將6字節學號數求和除以250(分組數目)所得的余數(取余法)作為分組的索引,由于寫入和查找時,都需要通過學號找到該記錄應該屬于哪個組,因此可以根據學號分組的依據,編寫一個通過學號找到對應分組索引的函數,詳見程序清單3.62

程序清單3.62通過學號分組范例程序

1 int db_id_to_idx(unsigned char id[6])

2 {

3 int i, sum = 0;

4

5 for (i = 0; i < 6; i++) {

6 sum += id[0];

7 }

8 return sum % 250;

9 }

即將分組數為250看作一個大小為250的表格,每個表項可以存儲40個學生記錄的數組,通過db_id_to_idx()函數找到關鍵字學號ID對應在該表中的位置。其中,大小為250的表格就是“哈希表”,詳見圖3.24。db_id_to_idx()函數就是“哈希函數”,哈希函數的結果(分組索引)稱之為“哈希值”。

圖3.24 哈希

哈希表的核心工作在于哈希函數的選擇,將查找的關鍵字送給哈希函數產生一個哈希值,哈希函數的選擇直接決定了記錄的分布,必須盡可能地確保所有記錄均勻地分布在各個組中。在上面的示例中,每個分組中都定義了大小相同的數組作為記錄存儲的空間。如果按照分組規則,能夠確保恰好均勻地分布在各個分組中,這是最佳的。

而實際上學生記錄是會變動的,可能增加或刪除,則很難保證按照現在定義的分組規則,保證100%的完全平均。如果每個分組都使用大小相同的數組作為記錄存儲的空間,則可能會導致部分數組未存滿,部分數組卻存不下的情況,就會導致部分學生記錄無處可存,造成嚴重的數據管理問題。

由于數組都是提前定義好大小的,動態性能差,而鏈表的動態性能更好,可以根據需要增加、刪除結點,改變鏈表長度,因此可以使用鏈表管理學生記錄,就算分布不均勻,也只存在鏈表長度的差異,不會出現數據存儲不了的問題,其示意圖詳見圖3.25

圖3.25 鏈式哈希表

當使用鏈表管理學生記錄時,哈希表每個表項的實際內容就是該組鏈表的表頭。鏈表頭結點的類型slist_head_t(slist.h)的定義如下:

typedef struct _slist_node{

struct _slist_node *p_next; //向下一個結點的指針

}slist_node_t;

typedef slist_node_t slist_head_t;

基于此,在哈希表的每個表項中存儲一個slist_head_t類型的鏈表頭結點即可,哈希表的定義如下:

typedef slist_head_t student_group_t;

student_group_t student_db[250];

根據對鏈式哈希表結構的分析編寫一個基于鏈式哈希表的信息管理系統作為示例僅提供增加、刪除、查找三種功能。當然,在使用這些功能前,還必須定義一個哈希表對象的類型,以便使用該類型定義具體的哈希表實例,進而使用各個功能接口對該實例進行操作。

>>>>1.1.2 哈希表的類型

哈希表類型struct _hash_db定義如下:

typedef struct _hash_db hash_db_t;

在結構體中,需要包含哪些哈希表的相關信息呢?鏈式哈希表的核心是一個slist_head_t類型的數組,其大小與分組數目相關。為了通用,分組數目應由用戶根據實際情況確定。slist_head_t類型的數組信息由一個指向數組首地址的slist_head_t*類型的指針和一個指定數組大小的size構成,哈希表結構體類型的定義如下:

struct _hash_db{

slist_head_t *p_head; //指向數組首地址

unsigned int size; //數組成員數

};

在實際的應用中,信息可以是任意數據類型(void *),其次還需要知道該void *指針指向的記錄的長度,比如,學生記錄的長度是sizeof(student_t),因此更新哈希表結構體類型的定義如下:

struct _hash_db{

slist_head_t *p_head; //指向數組首地址

unsigned int size; //數組成員數

unsigned int value_len; //一條記錄的長度

};

在存儲或查找記錄時,可以通過與關鍵字(比如,學號ID)比較找到哈希表中的索引值,然后在對應的表項中添加或查找記錄。在存儲記錄時,需要提供關鍵字和記錄;而在查找記錄時,僅需提供關鍵字。由此可見,關鍵字和記錄是兩個不同的概念,關鍵字具有特殊的作用,因此關鍵字和記錄應該分別對待。對于學生信息管理系統來說,其關鍵字為學號,長度是6字節,記錄包含姓名、性別、身高、體重等信息。因此,在學生記錄結構體的定義中,將關鍵字ID分離出來。學生記錄的定義如下:

typedef struct _student{

char name[10]; //姓名

char sex; //性別

float height, weight; //身高、體重

}student_t;

同理,關鍵字的長度也是由用戶決定的,在存儲一條記錄時,需要分配內存存儲關鍵字,以便查詢時讀取該關鍵字與查詢使用的關鍵字進行比較。因此在哈希表的結構體類型中,需要包含關鍵字長度信息,更新哈希表結構體類型的定義如下:

struct _hash_db {

slist_head_t *p_head; //指向數組首地址

unsigned int size; //數組成員數

unsigned int value_len; //一條記錄的長度

unsigned int key_len; //關鍵字的長度

};

特別地,在前面的分析中,哈希表最重要的一個概念就是“哈希函數”,哈希函數的作用是通過關鍵字(如學號ID)得到其對應記錄在哈希表中的索引值,哈希函數要盡可能確保記錄均分地分布在哈希表的各個表項中。對于不同的數據,用戶可能選擇不同的哈希函數,因此哈希函數應該由用戶指定。基于此,在哈希表結構體中新增一個函數指針,用于指向用戶自定義的哈希函數。完整的哈希表結構體類型定義如下(hash_db.h):

typedef unsigned int (*hash_func_t) (const void *key); //定義哈希函數類型

struct _hash_db {

slist_head_t *p_head; //指向數組首地址

unsigned int size; //數組大小

unsigned int value_len; //一條記錄的長度

unsigned int key_len; //關鍵字的長度

hash_func_t pfn_hash; //哈希函數

};

在使用哈希表的各個接口函數前首先需要使用該類型定義一個哈希表實例

hash_db_t hash;

如果系統中需要使用多張哈希表,則只需要使用該類型定義多個哈希表實例即可

hash_db_t hash1;

hash_db_t hash2;
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據結構
    +關注

    關注

    3

    文章

    573

    瀏覽量

    40232
  • 周立功
    +關注

    關注

    38

    文章

    130

    瀏覽量

    37749
  • 大數據
    +關注

    關注

    64

    文章

    8908

    瀏覽量

    137798

原文標題:周立功:哈希表=高效率的信息管理

文章出處:【微信號:Zlgmcu7890,微信公眾號:周立功單片機】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    信息管理信息系統專業計算機類課程體系設計

    ;;課程體系【DOI】:CNKI:SUN:JYJS.0.2010-06-007【正文快照】:信息管理信息系統專業是信息科學、
    發表于 04-24 09:45

    基于B_S的學生信息管理系統信息管理設計

    基于B_S的學生信息管理系統信息管理設計
    發表于 08-06 12:05

    java學生信息管理系統

    java學生信息管理系統
    發表于 10-03 14:47

    【轉】如果LED,需要知道

    需要知道的當談到決定購買哪類LED 時,事實證明有點困難。如果些時間在學習上,這是
    發表于 10-03 20:40

    labview簡單的信息管理系統

    labview簡單的信息管理系統
    發表于 06-08 21:50

    公交車信息管理系統的設計原理是什么?

    公交車作為目前國內客運量最大的公共交通工具,它的管理及服務上直存在些漏洞.鑒于此.種基于RFID技術的公交信息管理
    發表于 10-15 07:52

    這些LED知識一定要知道

    LED在生活中隨處可見,作為嵌入式工程師,這些LED知識一定要知道!——LED的圖形標號——LED的基本性質——1.最大工作電流——2.導通電壓——LED檢測方法——1.極性判斷——2.好壞檢測
    發表于 12-21 07:12

    醫院信息管理系統源代碼

    醫院信息管理系統源代
    發表于 07-19 11:10 ?14次下載

    基于面向對象數據模型的信息管理系統

    探討了面向對象數據模型信息管理系統的結構設計和信息管理系統實現技術。系統設計采用面向對象數據模型,數據庫結構采用對象-關系數據庫。結合
    發表于 02-21 11:35 ?14次下載

    繼電保護技術信息管理系統研究

    繼電保護技術信息管理系統研究 隨著網絡技術的飛速發展,通過Web方式實現繼電保護技術信息管理系統已經成為
    發表于 07-26 22:50 ?974次閱讀

    信息管理系統

    此為信息管理系統c語言源代碼 有需要的同學歡迎來交流
    發表于 05-25 10:26 ?2次下載

    電氣人需要知道的10常識

    電氣人需要知道的10常識
    的頭像 發表于 07-03 17:40 ?3549次閱讀

    探究車輛統籌信息管理系統

    探究車輛統籌信息管理系統
    發表于 10-30 12:01 ?2次下載

    對于汽車中的Bluetooth Smart,需要知道的內容

    對于汽車中的Bluetooth Smart,需要知道的內容
    發表于 11-04 09:50 ?1次下載
    對于汽車中的Bluetooth Smart,<b class='flag-5'>你</b><b class='flag-5'>需要知道</b>的內容

    關于步進電機需要知道

    關于步進電機需要知道
    發表于 03-07 16:58 ?2099次閱讀
    關于步進電機<b class='flag-5'>你</b><b class='flag-5'>需要知道</b>的<b class='flag-5'>一</b>切
    主站蜘蛛池模板: 天天综合天天综合 | 午夜精品久久久久久久四虎 | 色综合久久综精品 | 国产精品嫩草影院一二三区入口 | 一级黄免费 | 亚洲视频一二三 | 四虎永久在线观看免费网站网址 | 深爱激情站| 午夜逼逼| 99 久久99久久精品免观看 | 久久久综合视频 | 朋友夫妇和交换性bd高清 | 欧美zooz人禽交免费 | xxxxxx性| 青草青青产国视频在线 | 天天夜天天干 | 久久婷人人澡人人爽 | 亚洲乱码一二三四区 | 久久天天躁狠狠躁夜夜2020一 | 天天操天天射天天爽 | aa在线免费观看 | 久久网站免费 | 美女扒开尿口让男人捅 | 丁香婷婷开心激情深爱五月 | 亚洲综合久久久久久888 | 亚洲 欧洲 日韩 | 毛片你懂的 | 久久青草91线频免费观看 | 国产激烈无遮挡免费床戏视频 | 日本黄色免费在线观看 | 久久综合九色综合欧美播 | 美女视频黄色的免费 | 久久伊人草 | 劳拉淫欲护士bd字幕 | 精品久草 | 综合天天色 | 亚洲一区二区在线播放 | 色视频网| 失禁h啪肉尿出来高h男男 | 亚欧色| 成人性生活免费视频 |