揭密C語(yǔ)言中的指針和內(nèi)存泄漏
詢問(wèn)過(guò)很多使用 C 的開(kāi)發(fā)者,關(guān)于 C 中最困擾他們的是什么?他們中的許多人可能會(huì)回答指針和內(nèi)存泄漏。這些確實(shí)是開(kāi)發(fā)人員消耗大部分調(diào)試時(shí)間的項(xiàng)目。指針和內(nèi)存泄漏對(duì)某些程序員來(lái)說(shuō)似乎是一種威懾,但是,一旦你了解了指針和相關(guān)內(nèi)存操作的基礎(chǔ)知識(shí),它們將成為你在 C 中擁有的最強(qiáng)大的工具。
本文將與您分享開(kāi)發(fā)人員在開(kāi)始使用指針來(lái)編程前應(yīng)該知道的秘密。本文內(nèi)容包括:
1. 導(dǎo)致內(nèi)存破壞的指針操作類型
2. 在使用動(dòng)態(tài)內(nèi)存分配時(shí)必須考慮的檢查點(diǎn)
3. 導(dǎo)致內(nèi)存泄漏的場(chǎng)景
如果您預(yù)先知道什么地方可能出錯(cuò),那么您就能夠小心避免陷阱,并消除大多數(shù)與指針和內(nèi)存相關(guān)的問(wèn)題。
啥是內(nèi)存泄漏
內(nèi)存泄露的解釋如下:
在計(jì)算機(jī)科學(xué)中,內(nèi)存泄漏指由于疏忽或錯(cuò)誤造成程序未能釋放已經(jīng)不再使用的內(nèi)存。內(nèi)存泄漏并非指內(nèi)存在物理上的消失,而是應(yīng)用程序分配某段內(nèi)存后,由于設(shè)計(jì)錯(cuò)誤,導(dǎo)致在釋放該段內(nèi)存之前就失去了對(duì)該段內(nèi)存的控制,從而造成了內(nèi)存的浪費(fèi)。
在C++中出現(xiàn)內(nèi)存泄露的主要原因就是程序猿在申請(qǐng)了內(nèi)存后(malloc(), new),沒(méi)有及時(shí)釋放沒(méi)用的內(nèi)存空間,甚至消滅了指針導(dǎo)致該區(qū)域內(nèi)存空間根本無(wú)法釋放。
知道了出現(xiàn)內(nèi)存泄露的原因就能知道如何應(yīng)對(duì)內(nèi)存泄露,即:不用了的內(nèi)存空間記得釋放,不釋放留著過(guò)年哇!
? 內(nèi)存泄漏可能會(huì)導(dǎo)致嚴(yán)重的后果:
● 程序運(yùn)行后,隨著時(shí)間占用了更多的內(nèi)存,最后無(wú)內(nèi)存可用而崩潰;
● 程序消耗了大量的內(nèi)存,導(dǎo)致其他程序無(wú)法正常使用;
● 程序消耗了大量?jī)?nèi)存,導(dǎo)致消費(fèi)者選用了別人的程序而不是你的;
● 經(jīng)常做出內(nèi)存泄露bug的程序猿被公司開(kāi)出而貧困潦倒。
? 如何知道自己的程序存在內(nèi)存泄露?
根據(jù)內(nèi)存泄露的原因及其惡劣的后果,我們可以通過(guò)其主要表現(xiàn)來(lái)發(fā)現(xiàn)程序是否存在內(nèi)存泄漏:程序長(zhǎng)時(shí)間運(yùn)行后內(nèi)存占用率一直不斷的緩慢的上升,而實(shí)際上在你的邏輯中并沒(méi)有這么多的內(nèi)存需求。
? 如何定位到泄露點(diǎn)呢?
根據(jù)原理,我們可以先review自己的代碼,利用"查找"功能,查詢new與delete,看看內(nèi)存的申請(qǐng)與釋放是不是成對(duì)釋放的,這使你迅速發(fā)現(xiàn)一些邏輯較為簡(jiǎn)單的內(nèi)存泄露情況。
如果依舊發(fā)生內(nèi)存泄露,可以通過(guò)記錄申請(qǐng)與釋放的對(duì)象數(shù)目是否一致來(lái)判斷。在類中追加一個(gè)靜態(tài)變量 static int count;在構(gòu)造函數(shù)中執(zhí)行count++;在析構(gòu)函數(shù)中執(zhí)行count--;,通過(guò)在程序結(jié)束前將所有類析構(gòu),之后輸出靜態(tài)變量,看count的值是否為0,如果為0,則問(wèn)題并非出現(xiàn)在該處,如果不為0,則是該類型對(duì)象沒(méi)有完全釋放。
檢查類中申請(qǐng)的空間是否完全釋放,尤其是存在繼承父類的情況,看看子類中是否調(diào)用了父類的析構(gòu)函數(shù),有可能會(huì)因?yàn)樽宇愇鰳?gòu)時(shí)沒(méi)有是否父類中申請(qǐng)的內(nèi)存空間。
對(duì)于函數(shù)中申請(qǐng)的臨時(shí)空間,認(rèn)真檢查,是否存在提前跳出函數(shù)的地方?jīng)]有釋放內(nèi)存。
什么地方可能出錯(cuò)?
有幾種問(wèn)題場(chǎng)景可能會(huì)出現(xiàn),從而可能在完成生成后導(dǎo)致問(wèn)題。在處理指針時(shí),您可以使用本文中的信息來(lái)避免許多問(wèn)題。
未初始化的內(nèi)存
在本例中,p 已被分配了 10 個(gè)字節(jié)。這 10 個(gè)字節(jié)可能包含垃圾數(shù)據(jù),如圖所示。
char *p = malloc ( 10 );
垃圾數(shù)據(jù)
如果在對(duì)這個(gè) p 賦值前,某個(gè)代碼段嘗試訪問(wèn)它,則可能會(huì)獲得垃圾值,您的程序可能具有不可預(yù)測(cè)的行為。p 可能具有您的程序從未曾預(yù)料到的值。
良好的習(xí)慣是始終結(jié)合使用 memset 和 malloc分配內(nèi)存,或者使用 calloc。
char *p = malloc (10);
memset(p,’\0’,10);
現(xiàn)在,即使同一個(gè)代碼段嘗試在對(duì) p 賦值前訪問(wèn)它,該代碼段也能正確處理 Null 值(在理想情況下應(yīng)具有的值),然后將具有正確的行為。
內(nèi)存覆蓋
由于 p 已被分配了 10 個(gè)字節(jié),如果某個(gè)代碼片段嘗試向 p 寫(xiě)入一個(gè) 11 字節(jié)的值,則該操作將在不告訴您的情況下自動(dòng)從其他某個(gè)位置“吃掉”一個(gè)字節(jié)。讓我們假設(shè)指針 q 表示該內(nèi)存。
原始 q 內(nèi)容
覆蓋后的 q 內(nèi)容
結(jié)果,指針 q 將具有從未預(yù)料到的內(nèi)容。即使您的模塊編碼得足夠好,也可能由于某個(gè)共存模塊執(zhí)行某些內(nèi)存操作而具有不正確的行為。下面的示例代碼片段也可以說(shuō)明這種場(chǎng)景。
char *name = (char *) malloc(11);
// Assign some value to name
memcpy ( p,name,11); // Problem begins here
在本例中,memcpy 操作嘗試將 11 個(gè)字節(jié)寫(xiě)到 p,而后者僅被分配了 10 個(gè)字節(jié)。
作為良好的實(shí)踐,每當(dāng)向指針寫(xiě)入值時(shí),都要確保對(duì)可用字節(jié)數(shù)和所寫(xiě)入的字節(jié)數(shù)進(jìn)行交叉核對(duì)。一般情況下,memcpy 函數(shù)將是用于此目的的檢查點(diǎn)。
內(nèi)存讀取越界
內(nèi)存讀取越界 (overread) 是指所讀取的字節(jié)數(shù)多于它們應(yīng)有的字節(jié)數(shù)。這個(gè)問(wèn)題并不太嚴(yán)重,在此就不再詳述了。下面的代碼提供了一個(gè)示例。
char*ptr = (char*)malloc(10);charname[20] ;memcpy( name,ptr,20);// Problem begins here
在本例中,memcpy 操作嘗試從 ptr 讀取 20 個(gè)字節(jié),但是后者僅被分配了 10 個(gè)字節(jié)。這還會(huì)導(dǎo)致不希望的輸出。
內(nèi)存泄漏
內(nèi)存泄漏可能真正令人討厭。下面的列表描述了一些導(dǎo)致內(nèi)存泄漏的場(chǎng)景。
重新賦值
我將使用一個(gè)示例來(lái)說(shuō)明重新賦值問(wèn)題。
char *memoryArea = malloc(10);
char *newArea = malloc(10);
這向如下面的圖所示的內(nèi)存位置賦值。
內(nèi)存位置
memoryArea 和 newArea 分別被分配了 10 個(gè)字節(jié),它們各自的內(nèi)容如圖 4 所示。如果某人執(zhí)行如下所示的語(yǔ)句(指針重新賦值)……
memoryArea= newArea;
則它肯定會(huì)在該模塊開(kāi)發(fā)的后續(xù)階段給您帶來(lái)麻煩。
在上面的代碼語(yǔ)句中,開(kāi)發(fā)人員將 memoryArea 指針賦值給 newArea 指針。結(jié)果,memoryArea 以前所指向的內(nèi)存位置變成了孤立的;
如下面的圖所示。它無(wú)法釋放,因?yàn)闆](méi)有指向該位置的引用。這會(huì)導(dǎo)致 10 個(gè)字節(jié)的內(nèi)存泄漏。
內(nèi)存泄漏
在對(duì)指針賦值前,請(qǐng)確保內(nèi)存位置不會(huì)變?yōu)楣铝⒌摹?
首先釋放父塊
假設(shè)有一個(gè)指針 memoryArea,它指向一個(gè) 10 字節(jié)的內(nèi)存位置。該內(nèi)存位置的第三個(gè)字節(jié)又指向某個(gè)動(dòng)態(tài)分配的 10 字節(jié)的內(nèi)存位置,如圖 6 所示。
動(dòng)態(tài)分配的內(nèi)存
free(memoryArea)
如果通過(guò)調(diào)用 free 來(lái)釋放了 memoryArea,則 newArea 指針也會(huì)因此而變得無(wú)效。newArea 以前所指向的內(nèi)存位置無(wú)法釋放,因?yàn)橐呀?jīng)沒(méi)有指向該位置的指針。
換句話說(shuō),newArea 所指向的內(nèi)存位置變?yōu)榱斯铝⒌?,從而?dǎo)致了內(nèi)存泄漏。
每當(dāng)釋放結(jié)構(gòu)化的元素,而該元素又包含指向動(dòng)態(tài)分配的內(nèi)存位置的指針時(shí),應(yīng)首先遍歷子內(nèi)存位置(在此例中為 newArea),并從那里開(kāi)始釋放,然后再遍歷回父節(jié)點(diǎn)。
這里的正確實(shí)現(xiàn)應(yīng)該為:
free( memoryArea->newArea);
free(memoryArea);
返回值的不正確處理
有時(shí),某些函數(shù)會(huì)返回對(duì)動(dòng)態(tài)分配的內(nèi)存的引用。跟蹤該內(nèi)存位置并正確地處理它就成為了 calling 函數(shù)的職責(zé)。
char *func ( )
{
return malloc(20); // make sure to memset this location to ‘\0’…
}
void callingFunc ( )
{
func ( ); // Problem lies here
}
在上面的示例中,callingFunc() 函數(shù)中對(duì) func() 函數(shù)的調(diào)用未處理該內(nèi)存位置的返回地址。結(jié)果,func() 函數(shù)所分配的 20 個(gè)字節(jié)的塊就丟失了,并導(dǎo)致了內(nèi)存泄漏。
歸還您所獲得的
在開(kāi)發(fā)組件時(shí),可能存在大量的動(dòng)態(tài)內(nèi)存分配。您可能會(huì)忘了跟蹤所有指針(指向這些內(nèi)存位置),并且某些內(nèi)存段沒(méi)有釋放,還保持分配給該程序。
始終要跟蹤所有內(nèi)存分配,并在任何適當(dāng)?shù)臅r(shí)候釋放它們。事實(shí)上,可以開(kāi)發(fā)某種機(jī)制來(lái)跟蹤這些分配,比如在鏈表節(jié)點(diǎn)本身中保留一個(gè)計(jì)數(shù)器(但您還必須考慮該機(jī)制的額外開(kāi)銷)。
訪問(wèn)空指針
訪問(wèn)空指針是非常危險(xiǎn)的,因?yàn)樗赡苁鼓某绦虮罎?。始終要確保您不是 在訪問(wèn)空指針。
沒(méi)有躲過(guò)的坑--指針(內(nèi)存泄露)
C++被人罵娘最多的就是指針。
夜深人靜的時(shí)候,拿出幾個(gè)使用指針容易出現(xiàn)的坑兒。可能我的語(yǔ)言描述有些讓人費(fèi)勁,盡量用代碼說(shuō)話。
通過(guò)指向類的NULL指針調(diào)用類的成員函數(shù)
試圖用一個(gè)null指針調(diào)用類的成員函數(shù),導(dǎo)致崩潰:
#include
using namespace std;
class A{int value;public:void dumb() const {cout << "dumb()\n";}void set(int x) {cout << "set()\n"; value=x;}int get() const {cout << "get()\n"; return value;}};
int main(){A *pA1 = new A;A *pA2 = NULL;
pA1->dumb();pA1->set(10);pA1->get();pA2->dumb();pA2->set(20);//崩潰pA2->get();
return 0;}
為什么會(huì)這樣?
通過(guò)非法指針調(diào)用函數(shù),就相當(dāng)于給函數(shù)傳遞了一個(gè)指向函數(shù)的非法指針!
但是為什么pA2->dumb()會(huì)成功呢?
因?yàn)閷?dǎo)致崩潰的是訪問(wèn)了成員變量!!
使用已經(jīng)釋放的指針
struct X{int data;};
int foo(){
struct X *pX;
pX = (struct X *) malloc(sizeof (struct X));
pX->data = 10;
free(pX);
...return pX->data;
}
使用未初始化的指針
如果你這樣寫(xiě),編譯器會(huì)提示你使用了未初始化的變量p。
void foo A()
{
int *p;*p = 100;
}
那么如果我釋放一個(gè)初始化的指針呢?
void foo B()
{
int *p;
free(p);
}
結(jié)果是一樣的!!
釋放已經(jīng)釋放的指針
直接看看代碼:
void foo A()
{
char*p;
p = (char*)malloc(100);
cout<<"free(p)\n";
free(p);
cout<<"free(p)\n";
free(p);
}
這樣的問(wèn)題也許不會(huì)立即使你的程序崩潰,那樣后果更加嚴(yán)重!!
沒(méi)有調(diào)用子類的析構(gòu)函數(shù)
之前講過(guò),父類的析構(gòu)函數(shù)最好聲明為虛!!
ParentClass *pObj = new ChildClass;
...delete pObj;
上述代碼會(huì)造成崩潰,如果父類的析構(gòu)函數(shù)不聲明為虛,那么不會(huì)調(diào)用繼承類的析構(gòu)函數(shù),造成內(nèi)存泄露。
內(nèi)存溢出
當(dāng)我們拷貝字符串的時(shí)候,我們常常會(huì)用到 memcpy函數(shù)。這里特別需要注意的就是字符串結(jié)尾的null字符:
char *p = (char *)malloc(strlen(str));
strcpy(p, str);
為了躲過(guò)這個(gè)坑,只需要把 strlen(str) 改為 strlen(str)+1。
總結(jié)
本文討論了在使用動(dòng)態(tài)內(nèi)存分配時(shí)可以避免的幾個(gè)陷阱。為了避免與內(nèi)存相關(guān)的問(wèn)題,好的做法是:
始終memset與 malloc 一起使用,或始終使用calloc.
每當(dāng)向指針寫(xiě)入值時(shí),請(qǐng)確保交叉檢查可用字節(jié)數(shù)和正在寫(xiě)入的字節(jié)數(shù)。
在分配指針之前,確保沒(méi)有內(nèi)存位置成為孤立的。
每當(dāng)釋放結(jié)構(gòu)化元素(它又包含指向動(dòng)態(tài)分配的內(nèi)存位置的指針)時(shí),首先遍歷子內(nèi)存位置并從那里開(kāi)始釋放,再遍歷回父節(jié)點(diǎn)。
始終正確處理返回動(dòng)態(tài)分配內(nèi)存引用的函數(shù)的返回值。
每一個(gè)都有對(duì)應(yīng)的free malloc。
確保你沒(méi)有訪問(wèn)空指針。