你不可不知的 JavaScript 二三事#Day26:程式界的哈姆雷特 —— Pass by value, or Pass by reference?
(圖片素材來源: 網路圖片)
「To be or not to be, that is the question.」
這是莎士比亞經典《哈姆雷特》中,哈姆雷特王子的名句,是一個人生真諦的千古大哉問。
你知道程式世界裡也有一個萬年經典題嗎?
(圖片素材來源: 網路圖片)
「Pass by value, or pass by reference, that is the question.」
對程式開發者來說,一個程式語言的變數是 Pass by value 還是 Pass by reference,可是至關重要的問題。
變數內容的傳遞方式是 Pass by value (傳值) 或 Pass by reference (傳址),對於程式開發是一個很基本、但極為重要的觀念,直接影響著程式對變數的操作,相信大部分開發者也都不陌生。
那 JavaScript 是 Pass by value 還是 Pass by reference?為何有人說其實是 Pass by sharing?甚至有人說 JavaScript 只有 Pass by value?
今天就來探討這個萬年引戰題。
Pass by value vs. Pass by reference
在探討 JavaScript 是哪一者之前,照例先快速介紹一下問題本身:什麼是 Pass by value 和 Pass by reference?
Pass by value (傳值)
以下是一個典型的 Pass by value 的例子:
var x = 5;
var y = x;
console.log(x); // 5
console.log(y); // 5
x = 10;
console.log(x); // 10
console.log(y); // 5
- 變數
x
被賦予5
這個數值,然後透過y = x
的方式為變數y
賦值,因此x
和y
一開始的變數內容都是5
。 - 接著針對
x
賦予新的值10
,此時x
是10
,但y
仍是5
。
為什麼改變 x
的值,y
會不受影響?
下面是一個概念性的示意圖:
因為當變數內容傳遞方式是 Pass by value (傳值),也就是將舊變數的值內容複製一份,放進一塊新的記憶體,讓新變數指向過去。
以上面的例子來說,就是將變數 y
指向一塊新的記憶體,然後將變數 x
裡的值複製一份放進去,等於變數 x
和 y
裡存放的是兩份獨立的資料,其中一份改變,不會影響另一份。
Pass by reference (傳址)
換來看一個Pass by reference的例子:
var person1 = { money: 111 };
var person2 = person1;
console.log(person1); // {money: 111}
console.log(person2); // {money: 111}
person1.money = 222;
console.log(person1); // {money: 222}
console.log(person2); // {money: 222}
- 變數
person1
賦予一個物件,透過person2 = person1
的方式為person2
賦值,person1
和person2
兩個物件的money
屬性一樣都是111
。 - 針對
person1.money
更換值的內容,連person2
的屬性也一起變動到。
下面是概念性的示意圖:
因為當變數內容傳遞方式是 Pass by reference (傳址),新變數會直接指向舊變數的記憶體位址,等於新舊變數共用同一個位址的資料。
所以 person1
和 person2
其實指向同一個物件,就像同一個房間有兩個入口,從哪一個入口進去,看到的都是同一個房間內容。因此,對 person1
作任何變動,也等同對 person2
作變動。
JavaScript 什麼時候是 Pass by value?什麼時候是 Pass by reference?
基本上看變數的資料型別,決定傳遞行為是 Pass by value 或 Pass by reference。
當變數的值是原生型別 (Primitive) 時,行為是 Pass by value
在 JavaScript 中,原生型別 (Primitive) 包含:
- String
- Number
- Boolean
- Undefined
- Null (註)
註:
null
雖然用typeof
運算的結果是回傳object
,但null
在行為上歸屬原生型別。
以下是這五種型別的行為測試:
/* string */
var str1 = "111";
var str2 = str1;
console.log(str1); // "111"
console.log(str2); // "111"
str1 = "222";
console.log(str1); // "222"
console.log(str2); // "111"
/* number */
var n1 = 111;
var n2 = n1;
console.log(n1); // 111
console.log(n2); // 111
n1 = 222;
console.log(n1); // 222
console.log(n2); // 111
/* boolean */
var bool1 = true;
var bool2 = bool1;
console.log(bool1); // true
console.log(bool2); // true
bool1 = false;
console.log(bool1); // false
console.log(bool2); // true
/* null */
var nu1 = null;
var nu2 = nu1;
console.log(nu1); // null
console.log(nu2); // null
nu1 = "something";
console.log(nu1); // "something"
console.log(nu2); // null
/* undefined */
var ud1 = undefined;
var ud2 = ud1;
console.log(ud1); // undefined
console.log(ud2); // undefined
ud1 = "something";
console.log(ud1); // "something"
console.log(ud2); // undefined
當變數的值是物件型別 (Object) 時,行為是 Pass by reference
在 JavaScript 中的物件型別常見的例如:
- Array
- Object
以下是這兩種型別的行為測試:
/* array */
var ary1 = [1, 2, 3];
var ary2 = ary1;
console.log(ary1); // [1, 2, 3]
console.log(ary2); // [1, 2, 3]
ary1[0] = 99;
console.log(ary1); // [99, 2, 3]
console.log(ary2); // [99, 2, 3]
/* object */
var person1 = { money: 111 };
var person2 = person1;
console.log(person1); // {money: 111}
console.log(person2); // {money: 111}
person1.money = 222;
console.log(person1); // {money: 222}
console.log(person2); // {money: 222}
Pass by sharing 又是怎麼一回事?
以上到目前為止,一切看起來很單純美好,沒什麼問題:JavaScript 裡,原生型別 (Primitive) 是 Pass by value,物件型別 (Object) 是 Pass by reference。
為何會冒出一個 Pass by sharing 的說法?
問題出在以下情境:
1. 函數參數傳遞
function rename(obj){
obj = { name: "XXX" };
}
var person = { name: "OneJar" };
console.log(person);
rename(person);
console.log(person);
上面這個範例,將物件 person
傳遞給函數 rename()
作為參數,並在 rename()
裡面改變值。
根據前面的結論,物件型別 (Object) 是 Pass by reference,那麼執行結果應該是先印 {name: "OneJar"}
再印 {name: "XXX"}
囉?
執行結果:
{name: "OneJar"}
{name: "OneJar"}
(Source: 網路圖片)
怎麼好像和前面說好的不一樣?
上述例子可以再作抽離,縮小範圍,只看對 obj
變更值的部分。例子中是使用物件實字 (Object Literals) 的方式來變更值。
2. 使用陣列實字 (Array Literals) 和物件實字 (Object Literals) 重新賦值
/* array literals */
var ary1 = [1, 2, 3];
var ary2 = ary1;
console.log(ary1); // [1, 2, 3]
console.log(ary2); // [1, 2, 3]
ary1 = [99, 100];
console.log(ary1); // [99, 100]
console.log(ary2); // [1, 2, 3]
/* object literals */
var person1 = { money: 111 };
var person2 = person1;
console.log(person1); // {money: 111}
console.log(person2); // {money: 111}
person1 = { money: 222 };
console.log(person1); // {money: 222}
console.log(person2); // {money: 111}
可以發現到,雖然是物件型別 (Object) 的變數,如果用實字 (Literals) 對變數作重新賦值,並不會連另一個變數一起變更。
3. 使用第三方變數作重新賦值
即使不是直接用實字 (Literals),而是透過第三方變數去作重新賦值,同樣不會影響到第二個變數:
/* array re-assigned */
var ary1 = [1, 2, 3];
var ary2 = ary1;
console.log(ary1); // [1, 2, 3]
console.log(ary2); // [1, 2, 3]
var ary3 = [99, 100];
ary1 = ary3;
console.log(ary1); // [99, 100]
console.log(ary2); // [1, 2, 3]
console.log(ary3); // [99, 100]
/* object re-assigned */
var person1 = { money: 111 };
var person2 = person1;
console.log(person1); // {money: 111}
console.log(person2); // {money: 111}
var person3 = { money: 333 };
person1 = person3;
console.log(person1); // {money: 333}
console.log(person2); // {money: 111}
console.log(person3); // {money: 333}
Pass by reference 和 Pass by value 的融合版
從前面例子發現到,雖然是物件型別 (Object) 的變數,如果是對物件變數作重新賦值,只會變更自己的值,不會連另一個變數一起變更。
這和前面提到的 Pass by reference 行為似乎不太一樣,反而有點像 Pass by value。
如此一來,稱為 Pass by reference 也不對,稱為 Pass by value 也不對,於是就出現了 Pass by sharing 的說法。
(Source: 網路圖片)
不少人將 JavaScript 的變數內容傳遞方式,稱為 Pass by sharing:
- 碰到原生型別 (Primitive),表現行為是 Pass by value。
- 碰到物件型別 (Object),如果只是對物件內容作操作(例如陣列元素或物件屬性),表現行為是 Pass by reference。
- 碰到物件型別 (Object),如果對物件作重新賦值,表現行為是 Pass by value。
或者也有人視為:JavaScript 的 Primitive 是 Pass by Value,Object 是 Pass by sharing。
JavaScript 只有 Pass by value?
那為何有人說 JavaScript 只有 Pass by value?
這要稍微牽涉到變數的記憶體儲存方式。
我不是骨阿默,但我今天還是要來說一個電腦資料儲存原理的故事
電腦在執行程式的過程,是將資料暫存在記憶體裡,以供運算過程使用。
(Source: 網路圖片)
對電腦來說,記憶體每一個空間都有對應的位址,就像住址編號一樣。
想像一下,如果大家寫程式都得這樣:
0x002 = 10;
0x085 = 5;
0x108 = 0x002 + 0x085;
console.log(0x108);
.........
.........
應該會有 87% 的程式開發者想要逃坑。
(Source: 進擊的巨人)
還好,一個偉大的發明拯救了程式苦海中的眾生:變數。
宣告變數,就是跟記憶體要某一個位址的空間來存放資料。
在高階程式語言裡一定有支援變數,讓開發者能用更具可讀性的名稱來儲存資料。
對電腦來說,實際運作和辨認資料位置是以「位址」為準;變數名稱只是為了方便人類呼叫、類似別名的存在,由程式幫忙和實際的資料儲存位址作連結。
而我們透過變數儲存資料時,由於電腦對記憶體儲存資料有其機制,不同的資料型別會有不同儲存方式。
以 JavaScript 來說會有兩種:
- 資料是原生型別 (Primitive) 時,變數在記憶體內儲存的是「資料的內容」,也就是我們常稱的 Pass by value。
- 資料是物件型別 (Object) 時,變數在記憶體內儲存的是「資料的位址」,通過這個位址,可以找到實際儲存資料的地方,也就是我們常稱的 Pass by reference
筆者按:這裡的介紹比較偏向概念性,大幅簡化細節,實際上作業系統底層對記憶體的操控機制沒那麼簡單。但對於上層高階語言來說,這樣概念性的理解應該足夠應付一般開發所需。
為什麼有人認為 JavaScript 只有 Pass by value?
我們先看原生型別 (Primitive) 的狀況:
var x = 5;
var y = x;
console.log(x); // 5
console.log(y); // 5
x = 10;
console.log(x); // 10
console.log(y); // 5
再來看物件型別 (Object) 的狀況:
var x = { money: 111 };
var y = person1;
console.log(x); // {money: 111}
console.log(y); // {money: 111}
x.money = 222;
console.log(x); // {money: 222}
console.log(y); // {money: 222}
從底層實際運作的角度來看,不管是原生型別 (Primitive) 或物件型別 (Object),在作 x = y
這個動作時,都是把 x
內儲存的值複製一份到 y
裡 (不管這個值的內容是一個數值或一個位址)。
這就是為什麼有人認為 JavaScript 只有 Pass by value。
萬年引戰的癥結點:人人定義不同
Pass by value 或 Pass by reference 直接關係著程式的變數運作,而且是每個程式語言都會碰到,不是 JavaScript 獨有。
這種理當在程式語言開天闢地時代就遇到的基本議題,怎麼會到今日仍爭議不斷?
我覺得這篇文章 —— 深入探討 JavaScript 中的參數傳遞:call by value 還是 reference? —— 點出一個癥結點:
大家對 call by reference 以及 call by value 的「定義」其實都不盡相同,而且也沒有一個權威性的出處能夠保證這個定義是正確的。
例如所謂 Value,指的究竟是「資料的內容」,還是「存放在變數記憶體位址裡的值」?
以下面變數 n
和 obj
來說:
var n = 123;
var obj = { name: "OneJar" };
變數 | 資料的內容 | 存放在變數記憶體位址裡的值 |
---|---|---|
n | 123 |
123 |
obj | { name: "OneJar" } |
類似 0x0001 這樣的記憶體位址 |
- 如果 Value 指的是「資料的內容」:
- 物件 (Object) 間的
obj1 = obj2
傳值,就屬於 Reference 的複製,而非 Value 的複製。 - 因此有 Pass by value 和 Pass by reference 分別。
- 物件 (Object) 間的
- 如果 Value 指的是「存放在變數記憶體位址裡的值」:
- 所有的
x = y
傳值都屬於 Value 的複製。 - 因此只有 Pass by value。
- 所有的
這就是最初的定義不同、觀點不同,導致最後的結論不同。
所以下面哪一句是對的:
- JavaScript 只有 Pass by value。
- JavaScript 的 Primitive 是 Pass by Value,Object 是 Pass by sharing。
答案都是對的,視乎立足的定義和觀點。
傳統 Java 在教變數資料型態時,Pass by Value 和 Pass by Reference 一直是一大考題。但如果從「Value 指的是存放在變數記憶體位址裡的值」的角度來看,這些考題全都該丟垃圾桶,因為都只有 Pass by Value。
其實不只是 Pass by Value 和 Pass by Reference 有這種名詞定義上的困擾,各種 MV-Whatever 名詞定義也是爭吵不休。
會有這麼多技術名詞上的歧義,就像這篇文章所言:
程式開發的世界中,名詞的創造經常是隨意的。
這些名詞通常沒有明確的定義,一開始只是為了溝通方便,而隨著聽聞者各自的領會與轉述,加上時間與歷史的推移,它們的定義會發生岐義而各自發展,最後失去了溝通的意義。
所以…… JavaScript 到底 Pass by WTF
技術名詞紛爭多這篇文章最後總結得很好:
在《松本行弘的程式設計世界》的〈語彙與共通語言的重要性〉這篇文章中,作者談到,為某個概念決定適當的名詞,目的是在設計時能有共同的語彙,也能讓開發者意識到它們的存在,這才是名詞存在的真正意義。
技術名詞是為了方便溝通,不是為了吵架。
(Source: 網路圖片)
技術名詞的概念統一定義很重要,因為能讓大家在一個共通的語彙概念上溝通或學習。
這就是為什麼許多負責訂定標準或名詞定義的權威單位受人重視,他們所訂的名詞、定義等標準未必所有人都同意,但大部分的人願意接受和信服,因此大家一起遵循這樣的標準,使所有人能在同樣的理解共識下工作。
但如果為了在技術名詞上鑽牛角尖,反而把自己越弄越糊塗,變成為了捍衛技術名詞的存在而存在,我認為是本末倒置。
技術名詞是為了描述概念而存在,而不是概念為了技術名詞而存在。
最重要的是背後期望表達的概念,也就是體現出來的「行為」。