在這一章,我將只討論事件的概率以及它引起的問題。這些問題的產生同博奕
論和物理學的概率定律有關。我將什麼可稱之為假說的概率問題——例如一個經常
受到檢驗的假說是否比一個很少受到檢驗的假說更可幾等問題——留到第79至85節
在「驗證」題目下進行討論。
與概率論有關的觀念在現代物理學中起著決定性的作用。然而我們仍然缺乏一
個滿意的、前後一致的概率定義;也就是說,我們仍然缺乏一個滿意的概率計算的
公理系統。概率和經驗之間的關係也仍然需要澄清。在研究這個問題時,我們將發
現對我的方法論觀點幾乎不能克服的反對意見最初是什麼。因為雖然概率陳述在經
驗科學中起著如此重要的作用,可是結果它們卻在原則上不受嚴格證偽的影響。然
而,這塊絆腳石將成為檢驗我的理論,以便查明它有什麼價值的試金石。
因此我們面臨兩項任務。第一項任務是為概率計算提供新的基礎。我將試圖通
過把概率論發展為頻率理論做到這一點,沿著Richard von Mises所遵循的路線,但
不用他稱之為的「收斂公理」(或「極限公理」),而使用有點削弱了的「隨機公
理」。第二項任務是闡明概率和經驗之間的關係。這是指解決我所說的概率陳述的
可判定性問題。
我希望這些研究將有助於減輕目前的不滿意的情況,物理學家在這種情況下大
量使用概率,而未能前後一致地說明他們所說的「概率」是什麼。
47.概率陳述的解釋問題
我將從區別兩類概率陳述開始:相數字表示某一概率的陳述——我稱之為數值
概率陳述——以及不用數字表示的概率陳述。
例如,「用兩顆骰子擲11的概率為1/18」,這種陳述就是數值概率陳述一個例
子。非數值概率陳述可以有各種各樣。「把水和酒精混合獲得均勻的混合物是十分
可幾的」,這類陳述如得到適當闡明,就能轉變為數值概率陳述(例如,「獲得……
的概率很接近1」)。另一種很不同的數值概率陳述例如「發現一種與量子論相矛盾
的物理效應是高度不可幾的」;我認為這種陳述不可能轉變為數值概率陳述,或者
與某種數值概率陳述等價,而不歪曲它的意義。我將首先討論數值概率陳述;非數
值概率陳述,我認為不那麼重要,容後再考慮。
與每一個數值概率陳述有聯繫的是這樣一個問題:「我們應如何解釋這類陳述,
特別是這類陳述所作出的數值方面的斷言?」
48.主觀解釋和客觀解釋
古典的(Laplace的)概率理論把某一概率的數值定義為用同樣可能的情況數除
有利的情況數所得的商。我們可以不理會已經提出來的反對這個定義的邏輯上的異
議,如「同樣可能的」不過是「同樣可幾的」另一種說法。但是甚至在那時我們也
很難承認這個定義提供了一個可毫不含糊地應用的解釋。因為其中隱含著若干種不
同的解釋,我要把這些解釋分為主觀的和客觀的兩類。
概率論的主觀解釋常常使用的帶有心理學味道的說法,如「數學期望」,或者
比方說,「誤差的正態定律」等等,使人想起概率論的主觀解釋;其最初的形式是
心理學主義的。它把概率的大小看作為確定或不確定、相信或懷疑的感覺的量度,
這些感覺可由某些斷言或推測在我們心中引起。關於某些非數值陳述,「可幾的」
一詞可用這種方法頗為滿意地加以轉譯;但是我認為沿著這些路線對數值概率陳述
所作的闡釋是十分不能令人滿意的。
然而,主觀解釋的較新變種應該在這裡給予更認真的考慮。還不是在心理學上,
而是在邏輯上把概率陳述解釋為關於可稱之為陳述「邏輯近似」的斷言。正如我們
全都知道的那樣,陳述能互相處於各種邏輯關係中,如可推演性、不相容性或相互
依賴性;而邏輯-主觀理論(Keynes是它的主要闡述者)把概率關係看作是兩個陳
述之間的特種邏輯關係。這種概率關係的兩個極端情況是可推演性和矛盾:有人說,
如陳述p從陳述q推導出,則q把概率1「給予」p。如p和q相互矛盾,則q給p的概率為
0。在這兩個極端之間有其他概率關係,大概可以下列方法解釋:陳述聲(給定q)
的數值概率越大,則它的內容超出陳述q已包含的內容越少,p的概率依賴q(並且q
把某種概率「給予」p)。
從Keynes把概念定義為「理性信仰程度」這一事實可看出這個理論與心理學主
義理論之間的密切關係。他的「理性信仰程度」是指信賴量,可以根據我們從」給
予」陳述p概率的那個陳述q中得到的信息或知識賦予p以信任量。
第三種解釋,客觀解釋,把每一個數值概率陳述看作為一種相對頻率的陳述,
某一種類事件在一偶發事件序列內以這種頻率發生。
根據這種解釋,「用這顆骰子下一次擲五的概率等於1/6」這陳述實際上不是
一個關於下一次擲骰子的斷言;寧可說,它是一個關於整個一類擲骰子的斷言,下
一次擲骰子不過是其中一個元素。這個陳述所說的不過是在這類擲骰子中得5的相對
頻率等於1/6。
按照這個觀點,如果我們能夠對數值概率陳述作出瀕率闡述,這些陳述才是可
接受的。不能作出頻率解釋的那些概率陳述,尤其是非數值概率陳述,常常被頻率
理論家迴避。
下面我將嘗試重新把概率理論作為一種(經過修改的)頻率理論建立起來。因
此我宣佈我信仰客觀解釋;主要是因為我相信只有客觀理論才能解釋概率計算在經
驗科學中的應用。大家承認,主觀理論能夠給如何判定概率陳述的問題提供一個前
後一致的解決辦法;並且一般地說,它面臨的邏輯困難比客觀理論少。但是它的解
決辦法是:概率陳述是非常經驗的;它們是重言的。當我們想起物理學利用概率論
時,這種解決辦法就證明是完全不能接受的了。(我擯棄主觀理論的這種變種:認
為客觀頻率理論應從主觀假定中推導出來——也許利用Bernoulli定理作為「橋樑」;
由於邏輯上的理由我認為這種綱領是不能實現的。)
49.機遇理論的基本問題
概率理論的最重要應用是用於我們可稱之為「似相遇的」(chance-like)或
「隨機的」事件,或偶發事件。它們的特徵是一種特殊的不可計算性,這使得人們
經過許多次不成功的嘗試後傾向於相信,一切已知的理性預測方法用於這些事件必
定失敗。可以說,我們感覺到除了先知以外沒有一個科學家能夠預測它們。然而正
是這種不可計算性使我們得出這樣的結論:概率的計算能夠應用於這些事件。
如果我們接受主觀理論,那麼從不可計算性達到可計算性(即達到某種計算的
可應用性)這個有點悖論性質的結論,確實不再具有悖論性質了。但是這種避免悖
論的方法是極不令人滿意的。因為它包含著這樣的觀點:概率計算與經驗科學的所
有其他方法相反,不是一種計算預測的方法。按照主觀理論,它不過是一種使我們
已知的東西或者更確切地說,使我們未知的東西實行邏輯變換的方法;因為正是在
我們缺乏知識時我們實行這些變換。這種觀念確實使悖論消解,但它不能解釋被解
釋為頻率陳述的無知陳述如何能夠在經驗上受到檢驗和得到驗證。然而這正好是我
們的問題。我們如何能夠解釋這個事實:我們可從不可計算性——即從無知——中
作出能夠解釋為經驗頻率陳述的結論,並且爾後我們發現它們在實踐中得到光輝的
驗證呢?
甚至頻率理論直到現在還不能對這個問題——我將稱之為機遇理論的基本問題
——提供一個令人滿意的解答。在第67節將表明這個問題與「收斂公理」有聯繫,
後者是目前形式的這個理論的一個組成部分。但是在這個公理消除後,在頻率理論
框架內找到一個令人滿意的解決辦法是可能的。通過分析這樣一些假定就會找到這
種解答,這些假定使我們能夠從單個偶發事件不規則序列推論到它們頻率的規則性
或穩定性。
50.von Mises 的頻率理論
為概率計算的所有主要定理提供基礎的頻率理論首先由Richard von Mises提出
的。他的基本思想如下。
概率計算是似機遇的或隨機的事件或偶發事件序列,即例如連續擲骰子那種重
復性事件序列的理論。借助兩個公理條件把這些序列定義為「似機遇的」或「隨機
的」:收斂公理(或極限公理),和隨機公理。如果一個事件序列滿足這兩個條件,
von Mises就稱它為一個「集合」(collective)。
大體上說,一個集會就是一個事件或偶發事件的序列,它在原則上可以無限地
延續下去;例如擲骰子序列。假設骰子是破壞不了的。在這些事件中,每一個都有
一定的特性和性質;例如可以擲個5,因而具有性質5。如果我們選取直到序列某一
元素以前已出現的所有具有性質5的擲骰子次數,除以直到那個元素以前擲骰子的總
數(即序列中它的基數),那麼我們就獲得直到那個元素以前的5的相對頻率。如果
我們確定了直到這個序列每個元素以前5的相對頻率,我們就用這種方法獲得一個新
的序列——5的相對頻率序列。這種頻率序列不同於它與之相應的原先的事件序列,
後者可稱為「事件序列」或「性質序列」。
我選取我們稱之為「二擇一」(alternative)作為一個集合的簡單例子。我們
用這個詞指假定只有兩種性質的事件序列——例如擲一個錢幣猜正反面的序列。一
種性質(正面)用「1」表示,另一種性質(反面)用「0」來表示。於是事件序列
(或性質序列)可用下式表示:
(A) 0 1 1 0 0 0 1 1 1 0 1 0 1 0……與這種「二擇一」相應
——或更精確地說,與這種二擇一的性質「1」相關——的是下列「相對頻率序列」,
或「頻率序列」: (A』)0 ……
收斂公理(或「極限公理」)假定,隨著事件序列越來越長。頻率序列將趨向
一個確定的極限值。von Mises使用這個公理是因為我們必須弄清楚我們能夠借以工
作的某個固定的頻率值(即使實際的頻率值有一些波動)。在任何集合中至少有兩
種性質;如果我們得到與某個集合所有性質相應的頻率極限值,那麼我們就得到集
合的「分佈」。
隨機公理或有時稱之為「排除賭博系統原理」 (the principle of the excl
uded gambling system),是打算用來為序列的似機遇性質提供數學表現。顯然,
如果擲硬幣的序列有規律性,比方說在每三次擲正面後就出現反面相當有規律,那
麼一個賭徒就會用某種賭博系統來改善他的運氣。隨機公理就一切集合假定,不存
在能夠成功地應用於這種集合的賭博系統。它假定,不管我們可以選取何種賭博系
統以選擇認為有利的擲猜(tosses),我們將發現,如果賭博有足夠長的時間繼續
下去,認為有利的擲猜序列中的相對頻率接近的極限值與所有擲猜序列的極限值是
一樣的。因此存在著一種賭徒能借以改善他運氣的賭博系統的序列不是von Mises意
義上的集合。
對於von Mises來說,概率是「集合中相對頻率極限度」的另一個術語。所以概
率概念僅應用於事件序列;從Keynes等人的觀點看來,這樣的限定大概是完全不能
接受的。對於批評他的解釋太窄的人,von Mises的回答是強調科學的使用概率(例
如在物理學中)與一般的使用概率之間的不同。他指出要求定義恰當的科學術語非
要在一切方面去適應不確切的、前科學的用法是個錯誤。
按照von Mises的意見,概率計算的任務只不過在於此:從具有某些給定「初始
分佈」(initial distributions)的某些給定「初始集合」(initial collectiv
es)推論出具有「導出分佈」(derived distributions)的「導出集合」(deriv
ed collectives);簡言之,根據給定的概率計算出那些沒有給定的概率。
von Mises把他的理論的獨特特點概括為四點:集合概念先於概率概念;定義概
率概念為相對頻率的極限值;提出隨機公理;以及規定概率計算的任務。
51.新的概率理論計劃
von Mises提出的兩條公理或公設以定義集合概念曾遇到強烈的批評——我認為
這個批評不是沒有道理的。特別是反對把收政公理和隨機公理結合起來,理由是不
允許把極限或收斂的數學概念應用於按照定義(即由於隨機公理)必定不服從任何
數學規則或定律的序列。因為數學極限值不過是決定序列的數學規則或定律的特有
性質。數學極限值不過是這種數學規則或定律的一種性質,如果任意選定一個接近
於零的分數,序列中都有一個元素,使得在它之後的所有元素與某個一定的值的差
小於這個分數——於是這個值稱為它們的極限值。
為了對付這些反對意見,有人建議不要把收斂公理和隨機公理結合起來,僅假
定收斂,即被限值的存在。至於隨機公理,建議或者全然放棄它(Kamke),或者用
較弱的要求代替它(Reichenbach)。這些意見的前提是認為引起麻煩的是隨機公理。
與這些觀點相對照,我傾向於責怪收斂公理不亞於責怪隨機公理。因此我認為
有兩項任務要做:改進隨機公理——主要是一個數學問題;以及完全消除收斂公理
——認識論家特別關心的一個問題(參閱第66節)。
下面我首先討論數學問題,然後討論認識論問題。
這兩項任務中的第一項,即數學理論的重建,其主要目的是從一個修改了的隨
機公理推導出Bernoulli定理——第一個「大數定律」;修改為實現這個目的所需,
不要求更多。更確切地說,我的目的是推導出二項式公式(Binomial Formula,有
時稱為「Newton公式」),我稱為「第三式」。因為能用通常的方法從這個公式中
獲得Bernoulli定理和概率論的其他極限定理。
我的計劃是首先制定一個有窮類(finite class)的頻率理論,並且盡量在這
個框架內發展這個理論——即直至推導出(「第一」)二項式。這個有窮類頻率理
論原來是類理論(thetheory of classes)一個十分基本的部分。它之得到發展只
是為了獲得討論隨機公理的基礎。
接著我將通過引入收斂公理的老方法進而到無窮序列,即能夠無限延續的事件
序列,因為我們需要它來討論隨機公理。在推導出和考察Bernoulli定理之後,我將
考慮如何能消除收斂公理,以及哪一類公理系統我們應該作為結果保留下來。
在數學推導的過程中,我將使用三個不同的頻率符號:F」示有窮類的相對頻率;
F』示無窮頻率-序列相對頻率的極限值;最後F示客觀額率,即在「不規則」或「隨
機」或「似機遇」序列中的相對頻率。
52.有窮類內的相對頻率
讓我們考慮一類α的有窮數目的偶發事件,例如昨天用這粒特定的骰子擲猜這
類偶發事件。設這類α為非空類(non-empty),可以說它起著參考系的作用,將
稱之為(有窮的)參考類(reference-class)。屬於α的元素數目,即它的基數,
用「N(α)」表示,讀作「α數」。另一類β,可以是有窮的,也可以不是有窮的。
我們稱β為性質類(property-class)。例如它可以是所有擲5的類,或(如我們
將要說的)所有具有性質5的擲猜類。
屬於α又屬於β的那些元素類,例如昨天用這粒特定的骰子擲並有性質5的擲類
被稱為α和β的乘積類(product- class),用「α﹒β」表示,讀作「α和β」。
由於α﹒β是α的子類,它至多能含有有窮的元素數(它可以是空類)。α﹒β中
的元素數用「N(α﹒β)」表示。
當我們用N表示(有窮)的元素數時,用F」示相對頻率。例如,「在有窮參考
類α內性質β的相對頻率」寫作「αF」(β)」,可讀作「β的α頻率」。我們現
在能定義
(定義1) αF」(β)=N(α﹒β)/N(α)
根據我們的例子這意味著:「昨天用這骰子擲時出現5的相對頻率,按照定義等
於昨天用這骰子擲5的數被昨天用這骰子擲的總數來除所得的商。」
從這個頗為平凡的定義中,能夠十分容易地推導出有窮類中頻率計算的定理
(更具體地說,一般乘法定理;加法定理;以及除法定理,即Bayes規則)。在這種
頻率計算的定理中,以及在一般的概率計算中,其特徵是基數(N數)從不在其中出
現,出現的是相對頻率,即比值,或F數。N數僅發生在一些基本定理的證明中,這
些基本定理是直接從這個定義中演繹出來的;但N數並不發生在定理自身中。
在這裡用一個十分簡單的例子來說明對此應作如何理解。讓我們用「」(讀作
「β的補數」或簡單地讀作:「非β」)來表示不屬於β的一切元素類。於是我們
可寫出:αF」(β)+αF」( )=1雖然這個定理僅包含F數,它的證明要利用N
數。因為這定理認定義(1)中得出,借助於來自斷言N(α﹒β)十N(α﹒β)=
N(α)的類的計算的一個簡單定理。
53.選擇、獨立、無影響、無關
在能夠用有窮類相對頻率作的運算中,選擇(selection)的運算對以下所述有
特殊重要性。
設給定一個有窮參考類α,例如一只匣子中的鈕扣類,以及兩個性質類,β
(比方說,紅鈕扣)和γ(比方說,大鈕扣)。我們現在可把乘積類α﹒β看作一
個新的參考類,並提出α﹒βF」(γ)值的問題,即在新的參考類內γ的頻率的問
題。新的參考類α﹒β可稱為「從α中選擇β元素的結果」或「按照性質β從α中
選擇」;因為我們可以想到它是通過從α中選擇那些具有性質β(紅)的一切元素
(鈕扣)。
γ發生在新的參考類α﹒β中的頻率與發生在原先的參考類α中的頻率相同,
這恰恰是可能的;即
α﹒βF」(γ)=αF」(γ)是正確的。在這種情況下,我們(遵循Hausdo
rff)說性質β和γ「在參考類a內是相互獨立的」。獨立關係是三項關係,在性質
β和γ上是對稱的。如果兩種性質α和β在參考類α內是(相互)獨立的,我們也
可說性質γ在α內不受β元素的選擇的影響;也許可說參考類α,就性質γ而言,
不受按照性質β所作的選擇的影響。
β和γ在α內相互獨立或不受影響也可——按照主觀理論的觀點——解釋如下:
如果我們被告知類α的某一特定元素具有性質β,那麼這個信息是無關的,如果β
和γ在α內是相互獨立的話;也就是對於這個元素是否也有性質γ這個問題是無關
的。如果另一方面我們知道,γ更經常(或不那麼經常)發生在子類α﹒β(已根
據β從α中選擇出來)中,那麼某個元素有性質β的信息對於這個元素是否也有性
質γ的問題便是有關的了。
54.有窮序列、順序選擇和鄰域選擇
設有窮參考類α的元素是編了號的(例如盒子中的每一個鈕扣都寫上一個數目),
並且把它們按照序數排列成序列。在這種序列中我們可以區分出兩類具有特殊重要
性的選擇,即按照元素的序數進行選擇,或簡稱順序選擇,以及按照它的鄰域進行
選擇。
順序選擇是根據依賴於元素序數的性質β從序列α中進行選擇,元素的選擇必
鬚根據序數決定。例如β可以是性質偶數(even),因此我們從a中選擇的一切元素,
其序數是偶數。因此選擇出來的元素形成一個所選子序列(selected sub-sequenc
e)。如果性質γ獨立於根據β的順序選擇,那麼我們也可說,順序選擇對γ而言是
獨立的;或者我們也可說序列α就γ而言,不受β元素的選擇的影響。
鄰域選擇之有可能是由於這個事實:在把元素排列為編號序列時,某些鄰域關
系就形成了。這使我們例如有可能選擇那些其直接先行者具有性質γ的所有成員;
或者比方說,選擇那些其第一和第一個先行者,或其第一個後續者具有性質Y的所有
成員,如此等等。
因此如果我們有一個事件序列——比方說擲錢幣猜正反面——,我們就必須區
分兩類性質:如「正面」或「反面」那樣一些的主要性質,這些性質屬於與其在序
列中位置無關的每一個元素;以及如「偶數」或「反面的後續者」等那樣一些次要
性質,這些性質是一個元素由於它在序列中的地位而獲得的。
具有兩個主要性質的序列稱為「二擇一」。正如von Mises業已表明的(如果我
們小心仔細),有可能把概率論的基本點發展為二擇一理論,而不犧牲普遍性。用
「1」和「0」表示二擇一的兩種主要性質,每一種二擇一可表示為許多1和0的序列。
一種二擇一的結構可以是有規律的,或者它也可能是多少不規則的。下面我將
更周密地研究某些有窮二擇一的這種規律性或不規則性。
55.有窮序列的n-自由度
讓我們以有窮二擇一α為例,它由一個個1和0組成,有規律地排列如下:
(α) 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0……在這種二擇一中,我們有均等
的分佈,即1和0的相對頻率是均等的。如果我們用「F」(1)」示性質1的相對頻率,
用「F」(0)」示性質0的相對頻率,我們可寫:(1)αF」(1)=αF」(0)=
1/2現在我們從α中選擇(在α序列內)具有直接接在1後面的鄰域性質的所有項。
如果我們用「β」表示這種性質,我們可稱為所選子序列「α﹒β「。它有這樣的
結構:
(α﹒β) 1 0 1 0 1 0 1 0 1 0……
這個序列又是具有均等分佈的一種二擇一。而且,1和0的相對頻率都沒有變化;
即(2)α﹒βF」(1)=αF」(1);α﹒βF」(0)=αF」(0)用第53節采用
的術語,我們可以說二擇一α的主要性質不受根據性質β作的選擇的影響;簡言之,
α不受根據β作的選擇的影響。
由於α的每一個元素或具有性質β(即是1的後續者)或是0的後續者,我們可
用「」表示後一性質。如果我們現在選擇具有性質的元素,我們得到這樣的二擇一:
(α﹒) 0 1 0 1 0 1 0 1 0 1 0……這個序列離均等分佈稍有偏差,因為它的始
末都是0(因為均等分佈a本身以「0』0」結尾)。如果a有2000個元素,那麼α﹒將
有500個0,只有499個1。這些離均等分佈(或其他分佈)的偏差只是因第一個元素
或最後一個元素而引起的,可通過使序列足夠長而使這些離差變得如我們喜歡的那
麼小。由於這個理由在下面我們將置這些偏差於不顧;尤其是我們研究的是無窮序
列,在那裡這些離差就消失了。因此,我們說,二擇一α﹒β有均等的分佈,並且
二擇一α不受有性質的元素的選擇的影響。結果,α,或更確切地說,α的主要性
質的相對頻率都不受根據β和根據作的選擇的影響;所以我們可以說,α都不受根
據直接先行者的性質所作的每一種選擇的影響。
顯然,這種無影響是由於二擇一α結構的某些方面所致;這些方面可把α與其
他二擇一區分開來。例如,二擇一α.β和α.並非不受根據先行者的性質所作的
選擇的影響。
現在我們可以研究二擇一α,看看它是否也不受其他選擇,尤其是根據一對先
行者的性質所作的選擇的影響。例如,我們可從α中選擇那些是一對1,1的後續者
的所有元素。並且我們馬上看到α並非不受四種可能的對即1,1;1,0;01;0,0
中任何一對後續者的選擇的影響。在這些情況下,得到的子序列都沒有均等分佈;
反之,它們全都由不間斷的塊(blocks,或「反覆」iterations)組成,即只由1,
或只由0組成。
α不受根據單個先行者作的選擇的影響,但是並非不受根據成對先行者的選擇
的影響,這個事實可用主觀理論的觀點表述如下。關於α中任何元素一個先行者性
質的信息,對於這個元素的性質問題是無關的。另一方面,關於元素的成對先行者
的性質的信息則是高度有關的;因為給定α據以建立的定律,它使我們能夠預測所
討論的元素的性質:關於元素成對先行者性質的信息,可以說給我們提供演繹出預
測所需的初始條件。(a據以建立的定律要求一對性質作為初始條件;因此就這些性
質而言,它是「二維的」。詳細說明一種性質僅是在成為復合時作為初始條件不充
分時才是「無關的」。參閱第38節。)
我沒有忘記因果性——原因和結果——概念與預測的演繹的關係是多麼密切,
同時我要利用下列術語。以前作出的關於二擇一α的斷言:「α不受根據單個先行
者作的選擇的影響」,我現在用下列說法來表示:「α不受單個先行者任何後效的
約束」,或簡言之,「α的自由度為1(1-free)」。不像以前那麼說α「不受
(或受)根據成對先行者所作的選擇的影響」,我現在說:「a不受(或受)成對先
行者後效的約束」,或簡言之,「α的自由度是(不是)2」。
用自由度為1的二擇一作為我們的原型,我們現在能夠容易地建立也具有均等分
布的其他序列,這些序列不僅不受一個先行者的後效約束,即(像α一樣)自由度
為1,而且還不受一對先行者後效的約束,即自由度為2;此後,我們可以繼續達到
自由度為3等等的序列。這樣把我們引導到對下述是基本的一般概念。這就是不受直
至某個數n的一切先行者後效約束的自由度概念;或者如我們將要說的,n-自白度概
念。更精確地說,我們稱一個序列「自由度為n」,當且僅當它的主要性質的相對頻
率是「n重無影響」,即不受根據單個先行者和根據成對先行者和根據三個一組的先
行者……和根據n個一組先行者作的選擇的影響。
自由度為1的二擇一α可以用重複任何倍數的生成周期(generating period)。
(A) 1 1 0 0……來建立。同樣我們獲得具有均等分佈的自由度為2的二擇
一,如果我們把(B) 1 0 1 1 1 0 0 0……作為它的生成周期,自由度為
3的二擇一從生成周期(C) 1 0 1 1 0 0 0 0 1 1 1 1 0 1 0 0……中獲得,
而自由度為4的二擇一從生成周期(D) 0 1 1 0 0 0 1 1 1 0 1 0 1 0 0 1 0
0 0 0 0 1 0 1 1 1 1 1 0 0 1 1……中獲得。將會看到:面臨一個不規則序列的
直覺印象隨它n自由度的數n的增長而越強烈。
具有均等分佈的一個具n自由度的二擇一的生成周期必須包含至少2n+1個元素,
作為例子給定的周期,當然可以開始於不同的位置;(C)例如可從它的第四個元素
開始,於是我們獲得的不是(C),而是(C』) 1 0 0 0 0 1 1 1 1 0 1 0 0
1 0 1……
有使序列的n-自由度不變的其他變換。為每一個數目n建立n-自由度序列生成周
期的方法則在別處描述。
如果我們把下一生成周期的最初的n個元素加在一個自由度為n的二擇一上,於
是我們得到一個長度為2[n+1]+n的序列。除了其他性質外,這個序列還有以下的
性質:n+1個0和1的每一種排列,即每一個可能的n+1個組,至少在其中發生過一
次。
56.節段序列 二項式的第一形式
給定一個有窮的序列α,我們稱由n個連續元素組成的α的子系列為『』α的n
長度節段」;或更簡單地說,「α的n-節段」。如果除了序列α以外,還給定某個
定數n,那麼我們能夠把α的n-節段排列在一個序列中——α的n-節段序列。給定一
個序列α,我們就可以從α的最初的n個元素的節段開始這種方式,建立一個新的序
列,即α的n-節段序列。其次是α的2到n+1的元素的節段。一般地說,我們把α的
從x到x+n-1的諸元素組成的節段看作新序列的第x個元素。如此獲得的新序列可稱
為「α的交迭n-節段(overlapping n一segments)序列」。這個名稱表示,新序列
的任何兩個連續元素(即節段)以這種方式交迭;使它們共有原先序列α的n-1元
素。
現在我們通過選擇可以從一個交迭節段的序列中,獲得其他序列,尤其是毗鄰
n-節段(adjoining n-segments)的序列。
一個毗鄰n-節段序列只含這樣一些n-節段,它們在不交迭的α中,互相直接接
續。例如開始也許是原先序列α的編號為1至n的元素的n-節段,續在後面的是n+1
至2n,2n+1至3n如此等等的元素的n-節段。一般來說,一個毗鄰節段的序列將以α
的第k個元素開始,而它的節段將包含α的編號為直至n+k-1,n+k至2n+k-1,
2n+k至3n+k-1如此等等的元素。
下面將用「α(n)」示α的交迭n-節段的序列,用「αn」示毗鄰n-節段序列。
現在讓我們更詳細一點考慮交迭節段α(n)的諸序列。這樣一種節段的每一個
元素是α的一個n-節段。我們可以把例如組成節段的n個一組的有序的0和1看作是
α(n)一個元素的主要性質。或者我們可以更為簡單地把它的1的數目看作是這個
元素(不管1和0的次序)的主要性質。如果我們用「m」表示1的數目,則顯然mほn。
現在我們又從每一個序列α(n)得到一個二擇一。如果我們選擇一個特定的m
(mほn),並將性質「m」賦予序列α(n)的正好有m個1(所以有n-m個0)的每一
個元素,並且把性質「」(非m)賦予α(n)的所有其他元素的話。因此α(n)的
每一個元素必定有這兩個性質中的一個或另一個。
現在讓我們再次設想,給定一個具有主要性質「1」和「0」的一個有窮二擇一。
設1的頻率αF」(1)等於p,0的頻率αF」(0)等於q。(我們設分佈是不均等的,
即p≠q。)
現在讓這個二擇一α至少有n-1個自由度(n是任意挑選的自然數)。於是我們
可向下列的問題:性質m在序列α(n)中出現的頻率是多少?換言之,α(n)F」
(m)的值是多少?
除了α至少有n-1個自由度外,我們什麼也不假定,我們就能用初等算術解決
這個問題。答案包含在下列公式中:(1)α(n)F」(m)=
「二項」式(1)的右邊是由Newton在論述有關別的問題時提出的(有時稱為N
ewton公式)。我將稱它為「二項式的第一形式」。
由於推導出了這個公式我就不再在有窮參考類內考察頻率理論。這個公式將提
供給我們一個基礎來討論隨機公理。
57 無窮序列 頻率的假說性估計
把為n-自由度有窮序列獲得的結果推廣到用生成周期(參閱第55節)定義的n
-自由度無窮序列是十分容易的。起著參考類(我們的相對頻率與此有關)作用的
一個無窮的元素序列可稱為「參考序列」。它多少與von Mises意義上的「集合」相
對應。
n-自由度的概念以相對頻率的概念為前提;因為n-自由度的定義要求不受影
響——不受根據一定的先行者所作的選擇的影響——的是一種性質在其中發生的相
對頻率。在我們討論有窮序列的定理中,我將暫時使用(直到第64節)相對頻率極
限值(用F』表示)概念代替有窮類的相對頻率(F」)。只要我們把自己限於根據
某個數學規則建立的參考序列,這個概念的使用就不會發生問題。對於這些序列我
們總可以確定相應的相對頻率序列是否是收斂的。相對頻率極限值概念只是在沒有
數學規則只有經驗規則(與例如錢卜序列有關的)的序列的情況下才會引起麻煩;
因為在這些情況下,極限值概念是未定義的(參閱第51節)。建立序列的數學規則
的一個例子如下:「序列α的第n個元素應該是0,當且僅當n可被4除」。它定義的
無窮二擇一是 (α) 1 1 1 0 1 1 1 0……
其相對頻率的極限值αF』(1)=3/4; αF』(0)=1/4。借助數學規則用
這種方法定義的序列我簡稱為「數學序列」。
與之相對照,建立經驗序列的規則是例如「序列α的第n個元素將是0,當且僅
當硬幣c的第n次擲猜出現反面時」。但是經驗規則不一定總是定義隨機性質的序列。
例如,我應該把下列規則稱為經驗規則:「序列的第n個元素將是1,當且僅當第n秒
(從某個零時算起)時,發現擺p擺到這標記的左方時」。
這個例子表明有時——例如根據與擺有關的一些假說和測量——可用數學規則
代替經驗規則。用這種方法我們會找到一個數學序列,它以按我們的目的也許使我
們滿意,也許不能使我們滿意的精確度接近於我們的經驗序列。有可能(我們的例
子可用來建立這種可能)獲得一個其各種頻率接近於那些經驗序列的頻率,在我們
目前的情況下具有特殊的意義。我把序列分為數學序列和經驗序列時,我利用的是
「內包」上的差別,不是「外延」上的差別。因為如果用「外延」方法,即用一個
接一個地列舉其元素的方法使我們得一個序列──因此我們就只能知道它的一個有
窮的片段,一個有窮的節段,不管它有多長——,那麼就不可能根據這個節段的性
質確定其一部分的序列是學序列還是經驗序列。僅當給定一個建構規則——即「內
包」規則—一時,我們就能判定一個序列是否是數學的還是經驗數的。由於我們希
望借極限值(相對頻率)概念之助處理我們的無窮序列,我們必須把我們的研究限
於數學序列,實際上就是限於相應的相對頻率序列是收斂的那些數學序列。這種限
制等於引入收斂公理。(與這公理有關的問題到第63-66節再討論,因為與「大數
定律」一起討論它們比較方便。)因此我們將只談數學序列。然而我們將只談那些
數學序列:我們期望或推測它們就頻率而言接近於具有似機遇或隨機性質的經驗序
列,因為它們是我們的主要興趣所在。但是期望或推測一個數學序列,就頻率而言
它接近於經驗序列,不過是提出一個假說——一個關於經驗序列頻率的假說。我們
對經驗隨機序列的頻率的估計是假說這一事實,對我們用以計算這些頻率的方法沒
有任何影響。顯然,在有窮類方面,它對我們如何獲得我們的計算由此開始的頻率,
絲毫沒有關係。這些頻率可借實際計算獲得,或根據一條數學規則,或根據某種假
說獲得。或者我們簡直可以虛構一些頻率。在計算頻率時我們接受某些頻率作為給
定的,並從中推導出其他頻率。無窮序列中的概率估計同樣如此。因此關於我們頻
率估計的來源問題不是一個頻率計算問題;然而這並不是說把這個問題從我們關於
概率論問題的討論中排除出去。在無窮經驗序列的情況中,我們能區分出我們假說
性頻率估計的兩種主要「來源」——就是說兩種方法,我們用這兩種方法就可估計
出頻率。一是基於「均等-機遇假說」(equal chance hypothesis),(或等概率
假說equi-probability hypothesis)的估計,另一是基於統計結果的外推(extr
apolation of statisticalfndings)。我用「均籌-機遇假說」,是指這樣一種假
說,它斷言各種主要性質的概率是均等的:它是斷言均等分佈的假說。均等-機遇假
說常常基於對稱性的考慮。最典型的例子是擲骰子時均等頻率的推測,其根據是立
方體六面的對稱性和幾何等值。至於基於統計學外推的頻率假說,死亡率的估計提
供一個很好的例子。在這裡關於死亡率的統計資料是用經驗查明的,並且根據過去
的趨勢將繼續足十分接近穩定的,或者它們不會有很大變化——至少在最近時期內
——的假說從已知事例,即從已用經驗加以分類和計算的偶發事件外推到未知事例。
具有歸納主義傾向的人容易忽視這些估計的假說性質,他們會把假說性估計,即基
於統計外推的頻率預測同它們的經驗「來源」之——過去的偶發事件和偶發事件序
列的分類與實際計算混為一談。往往提出這樣的主張;我們從已加以分類和計算的
過去的偶發事件(如死亡統計)中「推導出」概率估計——即頻率預測。但是從邏
輯觀點看,這個主張並沒有得到證明。我們根本沒有作什麼邏輯推導。我們已經做
的是提出一個不可證實的假說,這個假說在邏輯上是永遠得不到證明的,這個假說
就是推測頻率仍將穩定不變,因此允許外推。甚至均等-機遇假說也被一些相信歸納
邏輯的人認為是「經驗上可推導的」,或「經驗上可說明的」,他們認為這些假說
基於統計經驗,即基於經驗上觀察到的頻率。然而就我來說,我相信,我們在作出
這種假說性估計時,往往單獨愛關於對稱意義的想法以及類似的考慮的引導。我看
不出有任何理由為什麼這些推測應該只是由於積累大量歸納觀察而產生的。然而,
我並不賦於我們估計的起源或「來源」這些問題以很大意義(參閱第2節)。我認為,
更重要的是對這個事實要十分清晰,即頻率的一切預測性估計,包括我們從統計外
推中得到的頻率——當然還有所有與無窮經驗序列有關的頻率——總是純粹的推測,
因為它總是超出我們有權根據觀察肯定的任何東西。
我對均等-機遇假說和統計外推的區分與「先驗」和「後驗」概率的經典區分
是完全符合的。但是由於這些術語是用於如此多的不同意義。而且由於這些術語因
哲學上的聯想而被嚴重玷污,最好還是避免用它們。
我在下面考察隨機公理時,將試圖尋找逼近隨機經驗序列的數學序列;這就是
說我將考察頻率假說。
58 隨機公理的考察
順序選擇(即按位置選擇)的概念和鄰域選擇的概念均已在第55節中引入和說
明。我現在將借助這些概念檢查vonMises的隨機公理——排除賭博系統原理——以
希望找到一個能代替這個公理的較弱的要求。在von Mises的理論中,這個公理是他
的集合概念的定義的一部分:他要求一個集合中頻率的極限一定要對任何種類的系
統選擇(systematic Selection)不敏感(他指出,賭博系統總是可被認為是一種
系統選擇。)。
對這個公理提出的大多數批評集中於它的表述的相對不重要的和表面的方面。
這與下列事實有關,即在各種可能的選擇中,會有這樣的選擇:比方說選擇那些接
近5的擲;顯然在這種選擇內,5的頻率會與在原先序列內5的頻率迥然不同。這就是
為什麼von Mises在他的隨機公理表述中談到他所說的「選擇」或「選取」是「獨立
於」擲的「結果」,因而不用所選元素的性質去定義。但是只要指出我們可以根本
不用成問題的措詞來表述von Mises的隨機公理,就可以完全答覆針對這種表述的許
多非難。因為例如我們可以表述如下:在一個集合中頻率的極限一定都不受順序選
擇和鄰域選擇的影響,而且也不受可用作賭博系統的這兩種選擇方法的所有組合的
影響。
上述困難隨這個表述而消失。然而其他困難仍保留。因此也許不可能證明,借
助如此強的隨機公理定義的一個集合概念,不是自相矛盾的;換言之,不可能證明
「集合」的類不是空的。(Kamke曾強調證明這一點的必要)至少,建構某個集合的
例子,並用這種方式說明集合的存在,這似乎是不可能的。這是因為滿足一定條件
的某一無窮序列的例子只可能由數學規則來提供。但是對於von Mises意義上的集合,
根據定義不可能有這種規則,因為能夠把任何規則都用作一種賭博系統或選擇系統。
如果所有可能的賭博系統都被排除,這種批評確實是無法駁斥的。
然而也可提出另外的異議來反對排除所有賭博系統的概念:它的要求實在太多
了。如果我們要使某個陳述系統公理化——在這個場合是概率計算定理,尤其是特
殊的乘法定理或Bernoulli定理——,那麼所選的公理不僅應該對系統定理的推導是
充分的,而且也是(如果我們能這樣推導出定理)必要的。然而可以表明排除所有
選擇系統對Bernoulli定理及其系統定理是不必要的。要求排除特殊類的鄰域選擇是
十分充分的:它是以要求序列應該不受根據任意選取的n個一組的先行者所作的選擇
的影響;也就是說,它應該有n個自由度,不受每個n的後效的約束,或簡言之,它
應該是「絕對自由的。」
所以我建議用不那麼嚴格的「絕對自由」的要求(對每一個n有n-自由度的意義
上)來代替von Mises的排除賭博系統原理,並且相應地把似機遇的數學序列定義為
滿足這個要求的序列。其主要優點是不排除所有賭博系統,因此有可能提供建構在
我們的意義上「絕對自由的」序列的數學規則,從而有可能建構實例。因此也就滿
足了上面討論的Kamke的異議。因為我們現在能夠證明似機遇數學序列的概念不是空
的,所以是前後一致。
也許有點奇怪:我們應該試圖借助必須符合最嚴格規則的數學序列來勾劃機遇
序列極不規則的特點。von Mises的隨機公理起初似乎使我們的直覺更為滿意。一個
機遇序列必定是完全不規則的,因此只要我們繼續努力試圖通過把這個序列延伸得
足夠長來證偽這個推測的話,任何推測的規則性一定會在序列的後面部分遇到失敗,
知道這一點是頗為令人滿意的。但是這個直覺的論證也有利於我的建議。因為如果
機遇序列是不規則的,那麼,不容置疑,它們就不會是某種特殊類型的規則序列。
而我們的「絕對自由」要求不過是排除一種特殊類型的規則序列,儘管是一種重要
的類型。
它是一種重要的類型這一點可以從這個事實中看出,即根據我們的要求不言而
喻地排除下述三種典型的賭博系統(參閱下一節)。首先我們排除「正態的」或
「純粹的」鄰域選擇,在其中我們根據鄰域的某種恆定的特徵進行選擇。其次,我
們排除「正態的」順序選擇,這種選擇選取的元素,它們的間距是恆定的,例如標
號為是k,n+k,2n+k……等等的元素;最後,我們排除這兩種類型選擇的許多組
合(例如一切第n個元素的選擇,假如它的鄰域具有某種具體的恆定特徵)。所有這
些選擇的獨特性質是,它們與序列的絕對的第一元素無關;如果原先的序列從另一
個(相應的)元素開始標號,它們就可產生同樣的所選的子序列。因此被我的要求
排除的賭博系統是那些無需知道序列的第一元素而可使用的賭博系統。被排除的系
統總涉及某些(線性)變換。它們是簡單的賭博系統。(參閱第43節)。我的要求
不予排除的只是涉及諸元素與絕對的(初始的)元素間有絕對距離的賭博系統。
對一切n有自由度n——「絕對自由」——的要求也與我們大多數自覺地或不自
覺地認為對機遇序列也適用的東西完全一致;例如一粒骰子下一次擲的結果不依賴
以前幾次擲的結果(擲以前搖搖骰子的做法就是想要保證這種「獨立性」)。
59.似機遇序列 客觀概率
鑒於我已說過的那些東西,我現在提出下列定義。
我們說一個事件序列或性質序列,尤其是一個二擇一,是「似機遇」或「隨機
的」,當且僅當它的主要性質的頻率極限是「絕對自由的」,即不受根據任何n個一
組的先行者的性質所作的一切選擇的影響。與隨機的序列相應的頻率極限被稱為在
有關序列內該性質的客觀概率;用F表示。這也可表述如下。設α為具有主要性質B
的似機遇或似隨機序列;這時下式成立:
αF(β)=αF』(β)
現在我們必須證明我們的定義足以推導出數學概率論的主要定理,尤其是Bern
oulli定理。隨後——在第64節——這裡給定的定義將予以修改使之獨立於頻率極限
的概念。
60.Bernoulli問題
在第56節提到的第一個二項式公式,即 (1)α(n)F」(m)=適用於交
迭節段的有限序列。它可根據這樣的假定推導出來,即有限序列α至少有n-1個自
由度。根據同樣的假定,我們直接獲得一個有限序列的正好相應的公式;那就是說,
如果α是有限的,並且至少有n-1個自由度,那麼(2)α(n)F』(m)=
由於似機遇序列是絕對自由的,即對於每一個n有n個自由度,公式(2),即第
二個二項式公式也必須適用於那些序列;並且確實它必須適用於它們,不管我們選
擇的n的值是多少。
下面我們將只涉及似機遇序列,或隨機序列(如在前節中定義的那樣)。我們
就要證明,對於似機遇序列,除了公式(2),第三個二項式公式(3)也必定適用;
這個公式是(3)αnF(m)=
公式(3)在兩個方面不同於公式(2):第一,它所斷言的涉及毗鄰節段αn的
序列,不是交迭節段α(n)的序列。第二,它不包含符號F』,而包含符號F。這意
味著,根據蘊涵它斷言鄰近節段序列也是似機遇或隨機的;因為從F,即客觀概率的
定義僅涉及似機遇序列。
(3)所回答的在鄰近節段序列中性質m的客觀概率問題——即αnF(m)的值的
問題——,我傚法von Mises,稱之為「Bernoulli問題。對於這個問題的解決,從
而對於第三個二項式公式(3)的推導,假定α是似機遇或隨機的也就夠了。(我們
的任務等於說明特殊的乘法定理適用於一個隨機序列α的毗鄰節段序列。)
公式(3)的證明可用兩步實現。首先,我們證明公式(2)不僅適用於交迭節
段α(n)的序列,而且也適用於毗鄰序列αn的序列。第二,我們證明後者是「絕
對自由的」。(這兩步的次序可以顛倒,因為交迭節段α的序列肯定不是「絕對自
由的」;事實上,這種序列提供了一個可稱之為「具有後效的序列」的典型例子。)
第一步。毗鄰節段αn的序列是α(n)的子序列,它們可通過正態順序選擇從
α(n)中獲得。因此如果我們能證明在交迭序列α(n)F』(m)中頻率的極限不
受正態順序選擇的影響,我們就是已經采取了第一步(以及甚至走得更遠一點);
因為我們將證明這個公式:(4) αnF』(m)=α(n)F』(m)我將首先以n
=2為例概述這個證明;即我將證明(4a) α2F』(m)=α(2)F』(m)
(mほ2)為真;因此很容易概括這個公式以適用於一切n。
從交迭節段α(2)的序列中,我們能夠選擇毗鄰節段的兩個以及僅僅兩個不同
的節段α(2);一個用(A)表示,包含α(2)的第一,第三,第五……節段,即
由數1,2;3,4;5,6;……組成的α的元素對另一個用(β)表示,包含α(2)
的第二,第四,第六,……,節段,即由數2,3;4,5;6,7;……等組成α的元
素對。現在假定公式(4a)不適用於兩個序列中的一個,(A)或(B),結果節段
(即對)0,0太經常出現在比方說序列(A)中;於是在序列(B)中必須出現一個
余離差(complementary deviation);即節段0, 0將不很經常出現(「太經常」,
或「不很經常」是與二項式公式相比較而言的)。但是這與所假定的α的「絕對自
由」是矛盾的。因為如果0,0對在(A)中出現比在(B)中更經常,那麼在α的足
夠長的節段中,0,0對在某些表示特徵的間距內出現比在其他間距內出現更經常。
如果0,0對屬於兩個α2序列中的一個,更為經常出現的間距就是那些占優勢的間距,
如果0,0對均屬於兩個α2-序列,不那麼經常出現的序列就是那些占優勢的序列。
但是這與所假定的α的「絕對自由度」是矛盾的;因為根據第二個二項式公式,α
的「絕對自由度」意味著,在任何α(n)序列中一個特定的長度為n的序列出現的
頻率只依賴在該序列中出現的1和0的數目,而不是依賴它們在序列中的排列。
這證明(4a);由於這個證明能容易推廣到任何n,(4)也就得到證明;這就
完成了證明的第一步。
第二步。αn序列是絕對自由的這一事實可用一個類似的論據來說明。我們仍可
以首先只考慮α2序列;而就這些序列而言,開始只會證明它們的自由度為1。設兩
個α2序列中的一個,即節段(A)並不是自由度為1。那麼在(A)中,在至少由兩
個元素(一個特定的α對)組成的一個節段之後,比方說在0,0節段之後,另一個
節段比方說1,1,必須比如果(A)是「絕對自由的」時更為經常地跟隨著;這就是
說,節段1,1出現在根據先行節段0,0從(A)中選擇的子序列中的頻率比二項式公
式使我們期望更大。
然而,這個假定與序列α的「絕對自由度」是矛盾的。因為如果節段1,1在
(A)中跟隨節段0,0過分經常,那麼通過補整(compensation),相反情況也必須
出現在(B)中;因為否則四個一組0,0,1,1在α的一個足夠長的節段中,會太經
常地出現在某些特徵性間距內——即在如果所說的兩對屬於同一α2序列就會占優勢
的那些間距內。此外,在其他特徵性間距內,四個一組會不那麼經常地出現——即
在那些如果它們均屬於兩個α2序列就會占優勢的間距內。因此我們面臨的正好是與
以前同樣的情況;而且我們能用類似的考慮證明,假定事件在一些特有的間距內優
先發生,是所假定的α的「絕對自由度」是不相容的。
這個證明又可加以推廣,結果我們可以說α序列不僅自由度為1,而且對每一個
n,自由度為n,因而它們是似機遇的,或隨機的。
這就完成了我們對這兩步的概述。因此我們現在有權在(4)中用F代替F』;這
就是說,我們可以同意這個主張:第三個二項式公式解決了Bernoulli問題。
順便說一句,我們已證明交迭節段的序列α(n)不受正態順序選擇的影響,只
要α是「絕對自由」時。
這同樣適用於毗鄰節段序列αn,因為從αn中作的任何一個正態順序選擇可被
認為是從α(n)中作正態順序選擇;所以它必須應用於序列α本身,因為α與α
(1)和α1都是等同的。
因此我們也還證明了,不受正態順序選擇的影響是從「絕對自由度」——它意
指不受某一特殊類型的鄰域選擇的影響——中得出的必然結論。容易看出,更進一
步的結論是不受任何「純」鄰域選擇(即根據它的鄰域的某個恆定的特徵——不隨
元素序數而變化的特徵——進行選擇)的影響。最後它的必然結論是「絕對自由度」
蘊含著不受這兩類選擇的所有組合的影響。
61.大數定律(Bernoulli定理)
在假定我們能使n趨向極限。即n→∞的條件下,Bernoulli定理,或(第一)
「大數定律」可以用純粹數學的推理從第三個二項式方式中推導出來。所以它能斷
言的只是無限的序列α;因為正是僅僅在這些序列中αn-序列的n-節段長度能無限
增加。並且它能斷言的只是這些「絕對自由」的序列,因為正是僅在假定對每一個
n自由度為n的條件下,我們能使n趨向極限,n→∞。
Bernoulli定理提供了十分類似我曾(傚法von Mises)稱為「Bernoulli問題」
的一個問題,即αnF(m)的值的問題的解。正如第56節所表明的,一個n-節段可說
具有性質「m」,當它正好含有m個1時;因此在這個(有窮)節段內1的相對頻率當
然是m/n。我們現在可定義:α的一個n-節段有性質「△p」當且僅當它的1的相對
頻率與αF(1)=p的值,即1在序列α中的概率的離散不超過δ;這裡δ是我們任
意選取的接近於0的任何小的分數(但不同於0)。我們能用下列說法表示這個條件:
一個n節段有性質「△p」,當且僅當[-p]<δ時;換言之,節段具有性質『△p』。
現在Bernoulli定理回答了頻率或概率值的問題,在αn序列內這種節段——具有性
質△p的節段的值的問題;因此它回答了αnF(△p)值的問題。
人們在直觀上可以猜測:如果值δ(δ>0)是固定的,如果n增加,那麼具有
性質△p的這些節段的值,因此αnF(△P)的值,也將增加(並且它的增加將是千
篇一律的)。Bernoulli的證明(在任何一本概率計算教科書中都可以找到這種證明)
接著下去便是借助二項式公式來評價這種增加。他發現如果n的增加沒有極限,αn
F(△P)值便逼近最大值1,不管&的固定值有多少。這可用下式來表示。
(1) F(△p)=1 (對任何△p值)
這個公式從改變毗鄰節段序列的第三個二項式公式而來。對於交迭節段的序列,
類似的第二個二項式公式用同樣的方法直接導附相應的公式。
(2) F』(△p)=1 這個公式對於交迭節段序列以及從它們之中作正態順
序選擇是正確的,因此對於具有後效的序列(Smoluchowski曾研究過這些序列)也
是正確的。公式(2)本身產生(1),假如所選的序列不交迭,所以自由度為n。
(2)可描述為Bernoulli定理的一種變式;而我在這裡將要就Bemoulli定理所說的
話經過必要的修正(mutatis mutandis)以適用於這種變式。
Bernoulli定理,即公式(1),可用下面的話表示。讓我們稱從一隨機序列α
中選擇的長度固定的一個長的有窮節段為一「中等樣本」(fair sample),當且僅
當在這個節段內1的概率,即在隨機序列內1的概率值與p的離差只有某一小的固定的
分數(我們可以自由挑選這個分數)。因此我們可以說,只要我們使這些節段有足
夠長,偶然碰到一個中等樣本的概率如我們所喜歡的那樣逼近於1。
在這個表述中,「概率」(或「概率值」)一詞出現兩次。在這裡如何解釋或
翻譯它?在我的頻率定義的意義上,這詞不得不翻譯如下(我將「概率」一詞譯為
頻率語言的兩種譯法用黑體表示):所有足夠長的有限節段中絕大多數有「中等樣
本」;即它們的相對頻率與該隨機序列頻率值p的離差為一任意固定的很小的量;或
簡言之:頻率p近似地實現在幾乎所有足夠長的節段中。(我們如何達到p值與我們
現在的討論是無關的;比方說它可以是一種假說性估計的結果。)
記住Bernoulli頻率αnF(△p)一成不變地隨節段的長度n的增加而增加,一成
不變地隨n的減少而減少,所以,相對頻率值在短的節段中實現是比較罕見的,我們
也可說:
Bernoulli定理說明,「絕對自由的」或似機遇的序列的短節段經常表現在與p
有比較大的離差,因此有比較大的漲落,而較長的節段,在大多數情況下,將表現
出隨長度的增加與P的離差越來越小。結果,在足夠長的節段中大多數離差將變得如
我們希望的那樣小;換言之,大的離差將變得如我們希望的那樣罕見。
因此,如果我們取隨機序列的一個十分長的節段,為了通過計算或也許利用其
他的經驗的和統計的方法,求在它的子序列內的頻率,那麼在大多數情況下我們將
得到如下結果。有一個特徵性平均頻率,使整個節段中以及幾乎所有的長的子序列
中,相對頻率與這個平均值的離差很小,如果我們挑選的子節段越短,較小的子節
段的相對頻率與這個平均值的離差就越大和越經常,這個事實,即有窮節段這種可
在統計學上得到確定的行為,系指它們的「擬收斂行為」;或系指這樣的事實:隨
機序列在統計學上是穩定的。
因此,Bernoulli定理斷言,似機遇序列的節段較小,經常表現為大的漲落,而
大節段總表現恆定或收斂;簡言之,我們在小節段中發現無序和隨機,在大節段中
發現有序和恆定。「大數定律」式所指的正是這種行為。
62.Bernoulli定理和概率陳述的解釋
我們剛剛看到,用言語表述的Bernoulli定理中「概率」一詞出現了兩次。
頻率理論家在兩種情況下根據它的定義翻譯這個詞沒有困難:他能對Bernoull
i定理和大數定律提供一個清楚的解釋。主觀理論的擁護者也能以它的邏輯形式做到
這一點嗎?
想把「概率」定義為「理性信仰程度」的主觀理論家,當他把「……的概率如
我們希望的那樣逼近1」這些話解釋為「……幾乎是確定無疑的」時,他前後完全一
致,並且有權這樣做。但是當他繼續說:「……相對頻率與它最可幾的值p 的離差
小於一定量……」,或用Keynes的話說,「事件出現的比例與最可幾的比例p的離散
小於一定量……」時,他只不過模糊了他的那些困難。這聽起來似乎蠻有道理,至
少乍一聽來是這樣。但是如果在這裡我們也把「可幾的」(有時省略)一詞,用主
觀理論的意義加以翻譯,那麼整個問題變成這樣:「相對頻率與理性信仰程度p值的
離差小於一定量幾乎是確定無疑的,」我認為這是十足的廢話。因為相對頻率只能
與相對頻率作比較,只能與相對頻率有離差或沒有離差。很清楚,在演繹Bernoull
i定理之後,把一個不同於演繹之前給予p的意義給予它是不允許的。因此我們看到
主觀理論不能用統計學的大數定律來解釋Bernoulli定理。統計定律的推導只有在頻
率理論的框架內才有可能。如果我們從嚴格的主觀理論出發,將永遠達不到統計陳
述——即使努力填補同Bernoulli定理之間的鴻溝也不能達到。 63.Bernoulli定理
和收斂問題
從認識論觀點看,我對上述大數定律的演繹是不滿意的;因為收斂公理在我們
的分析中所起的作用是很不清楚的。
實際上通過把我的研究限於具有頻率極限的數學序列已不言而喻地引入了這類
公理(參閱第57節)。結果甚至容易使人認為我們的結果——大數定律的推導——
是無關緊要的;因為「絕對自由」的序列在統計學上是穩定的這一事實可被認為是
它們的收斂所蘊含的,而它們的收斂如果不是不證自明也是不言自明地被假定的。
但是正如von Mises已清楚地表明的那樣,這個觀點是錯誤的。因為有些序列滿
足收斂公理,雖然Bernoulli定理對它們不適用,因為具有頻率接近1的任何長度的
節段,出現在與p有一定程度離散的頻率中。(極限p在這些情況下的存在是由於這
個事實:雖然離散可無限增加,但它們相互抵銷。)這些序列看起來彷彿它們在任
意大的節段中是發散的。即使相應的頻率序列事實上是收斂的。因此大數定律根本
不是收斂公理的無關緊要的推斷,而且,這個公理對於推導大數定律完全不充分。
這就是為什麼我對隨機公理的修改,「絕對自由」的要求是不可缺少的。
然而,我們的理論重建,提示了這樣一種可能性:大數定律也許是獨立於收斂
公理的。因為我們已經看到,Bernoulli定理是直接從二項式公式中得出的;此外,
我已證明,可為有窮序列推導出第一個二項式公式,因此當然無需任何收斂公理。
還必須假定的一切是參考序列α的自由度至少是n-1;這是一個從中得出特殊乘法
定理的可靠性以及第一個二項式公式的可靠性的假定。為了過渡到極限,為了獲得
Bernoulli定理,只需假定我們使n如我們希望的那樣大。因此就能看出,Bernoull
i定理大概是對的,即使對於有窮序列也是如此,如果對於一個足夠大的n它們的自
由度為n的話。
所以看來Bernoulli定理的演繹並不依賴於假定頻率極限存在的公理,而是僅依
賴於「絕對自由度」或隨機性。極限概念僅起次要的作用:它用來把相對頻率的概
念(在第一個例子中給它下定義只是為了有窮類,沒有它,n-自由度的概念就不能
提出)應用於能無限延伸的序列。
此外,不應忘記,Bernoulli本人是在經典理論的框架內演繹他的定理的,這個
理論不包含收斂公理;也不應忘記,作為頻率極限的概率定義只是經典形式體系的
一種解釋——而且不是惟一可能的一種解釋。
我將試圖用除n-自由度(應適當地加以定義)外無需假定任何東西就可推演出
這個定理來證明我的推測——Bernoulli定理獨立於收斂公理。並且我將試圖證明它
甚至適用於其主要性質並不具有頻率極限的那些數學序列。
只要能夠證明這一點,我就會認為我之推演出大數定律從認識論家的觀點來看
是令人滿意的。因為似機遇經驗序列證明,我已描述為「收斂」或「統計學上穩定
的」那種特殊行為,是一個「經驗事實」——或至少有時人們這樣告訴我們(參閱
第61節)。通過用統計方法記錄長節段的行為,人們能夠確定相對頻率越來越逼近
一個限定的值,相對頻率在其中漲落的間隔變得越來越小。對這種所謂的「經驗事
實」,已進行過如此多的討論和分析,確實往往認為它是大數定律的經驗驗證,對
這種「經驗事實」可以從不同角度來看。具有歸納主義傾向的思想家大多數認為它
是基本的自然律,不能還原為任何更簡單的陳述;認為它是必須完全加以接受的我
們世界的特性。他們認為以適當形式——例如以收斂公理的形式——表示的這個自
然律應該作為概率論的基礎,從而使概率論具有一門自然科學的性質。
我對這種所謂「經驗事實」的態度是不同的。我傾向於認為,它可還原為序列
的似定律性質;可從這些序列的自由度為n的事實中推導出來。我認為Bermoulli和
Poisson在概率論領域的成就正是在於他們發現了一種方法以表明這種所謂「經驗事
實」是重言式,表明從小規模的無序(假如它滿足表述得合適的n-自由度條件)合
乎邏輯地得出一種大規模的穩定性秩序。
如果我們能夠無需假定收斂公理而演繹出Bernoulli定理,那麼我們就可把大數
定律的認識論問題還原為一個公理獨立性問題,因而還原為一個純粹的邏輯問題。
這種演繹也說明為什麼收斂公理在各種實際應用(試圖計算經驗序列的近似行為)
中起了很好的作用。因為即使對收斂序列的限制結果弄清是不必要的,利用收斂數
學序列來計算經驗序列的近似行為(它根據邏輯上的理由在統計學上是穩定的)肯
定不是不合適的。
64.收斂公理的排除「機遇理論基本問題」的解決
迄今頻率極限除了具有提供一個可應用於無窮序列相對頻率的明確概念外,在
我們的概率論的重建中沒有其他功能,因此我們可以借助它來定義(不受後效約束
的)「絕對自由度」。因為正是相對頻率被要求不受根據先行者作出選擇的影響。
我們早就把我們的研究限制在具有頻率極限的二擇一,因此不言而喻地引入了
收斂公理。現在,為了使我們擺脫這個公理,我將擺脫這個限制,而不用任何其它
限制來代替它。這就是說我將不得不建構一個頻率概念,它能接管被排除的頻率極
限的功能,並可應用於所有的無窮參考序列。
滿足這些條件的一個頻率概念是相對頻率序列聚點的概念。(如果在任何給定
的元素之後有一些與α的離差小於一定量,即使這個量很小,就說α值是某一序列
的聚點。)這個概念可不加限制地應用於所有無窮序列,這一點可從這個事實中看
出,即對於每一個有窮的二擇一,與之相應的相對頻率序列中必有至少一個這樣的
聚點存在。由於相對頻率決不可能大於1,也不可能小於0,相對頻率序列必定由1和
0連結起來。而且作為一個無窮的連結起來的序列,它必須(根據著名的Bolzano和
Weierstrass)至少有一個聚點。
簡而言之,與一個二擇一α相應的相對頻率序列的第一個聚點被稱為「α的中
頻率(midddle frequency)」。因此,我們可以說:如果一個序列α有一個並且只
有一個中頻率,那麼同時這就是它的頻率極限;反之亦然:如果它沒有頻率極限,
那麼它就有不止一個中頻率。
將會發現中頻率概念十分適合於我們的目的。正如前面p 是序列α的頻率極限
這一點是我們的估計——也許是假說性估計——一樣,我們現在也可以使用p是α的
中頻率這一估計。而且假如我們采取必要的預防措施,我們能夠借助這些估計的中
頻率進行計算,類似我們用頻率極限計算一樣。此外,中頻率概念可應用於所有可
能的無窮參考序列,沒有任何限制。
如果我們現在試圖把我們的符號αF』(β)解釋為中頻率,而不是頻率極限,
並且我們因而改變客觀概率的定義(第59節),我們的公式大多數仍然是可推導的。
然而有一個困難:某一中頻率不是惟一的。如果我們估計或推測一個中頻率是αF』
(β)=p ,那麼這不排除αF』(β)有除了p以外的值。如果我們假定這並非如
此,那就不言而喻要引入收斂公理。如果在另一方面,我們定義客觀概率無需這種
具有惟一性的假定,那麼我們就獲得(至少在第一個例子中)一個模稜兩可的概率
概念;因為在某些條件下一個序列可同時擁有都是「絕對自由的」若干中頻率。但
是這是難以接受的,因為我們習慣於用不含糊的或惟一的概率;也就是假定在同一
參考序列內對於同一性質,可能有一個,並且只可能有一個概率p。
然而,無需極限公理定義惟一的概率概念的困難是容易克服的。我們可引入惟
一性要求(畢竟是最自然的程度)作為最後一步,在假定了序列將是「絕對自由的」
以後。這使我們對我們的似機遇序列定義以及客觀概率定義提出下列修改作為對問
題的一種解決辦法。
設α為一個二擇一(有一個或數個中頻率)。設α的1有一個或只有一個「絕對
自由的」中頻率p;於是我們說α是似機遇或隨機的,並且p是1在α內的客觀概率。
這有助於把這個定義分為兩個公理性要求。
(1)隨機性要求:對於似機遇的二擇一,至少必須有一個「絕對自由的」中頻
率,即它的客觀概率p。
(2)惟一性要求:對於同一似機遇的二擇一的同一性質,必定有一個且只有一
個概率p。
前面建構的實例保證了這個新公理系統的無矛盾性。有可能建構不具有頻率極
限的序列,雖然它們有一個且只有一個概率。這表明新的公理要來實際上比老的更
廣泛,更不確切。如果我們以下列形式陳述(如我們可以陳述的那樣)我們的老公
理,這個事實甚至會變得更加明顯:
(1)隨機性要求:如上。
(2)惟一性要求:如上。
(2』)收斂公理:對於同一似機遇二擇一的同一性質除了它的概率p外不存在
其他中頻率。
我們可從建議的要求系統中演繹出Bernoulli定理,以及同它一起的經典概率計
算定理。這就解決了我們的問題:現在有可能在頻率理論的框架內演繹出大數定律,
而無需利用收斂公理。此外,不僅第61節公式(1)和Bernoulli定理的文字表述仍
然不變,而且我們給予它的解釋也仍然不變:在一個沒有頻率極限的似機遇序列情
況下,幾乎所有足夠長的序列表明與p只有小的離差,這仍然是正確的。在這些序列
中(正如在有頻率極限的似機遇序列一樣)具有擬發散行為的任何長度的節段,也
就是與p的離差有任何量的節段,當然不時會出現。但是這些節段比較罕見,因為它
們必定被其中所有的(或幾乎所有的)節段具有擬收斂行為的序列極端長的部分所
補償。正如計算所表明的,這些延伸部分一定會比它們補償的具有發散行為的節段
長几個數量級。
這也就是解決「機遇理論基本問題」(在第49節就是這樣稱呼的)的地方。從
單個事件的不可預測性和不規則性到概率計算規則對這些事件的可應用性,這看起
來自相矛盾的推論實際上是可靠的。假如根據這樣一個假說性假定,即在根據先行
者所作的任何選擇中只出現一個循環的頻率——「中頻率」——因而沒有後效發生,
我們就能夠以相當的逼近度來表示不規則性。因為根據這些假定,有可能證明大數
定律是重言的。堅持這樣的結論,即在可以說任何事情在這時和那時都會發生的—
—雖然某些事情的發生只是罕見的——不規則序列中,某種規則性或穩定性將出現
在十分大的子序列中,這是可以允許的,並非自相矛盾的(有人有此主張)。這個
結論也不是不重要的,因為為了這個結論我們就需要特殊的數學工具(Bolzano和W
eierstrass定理,n-自由度概念,以及Bernoulli定理)。當我們知道,不規則性
的假定可以置於某種頻率假說(不受後效約束的假說)的形式中,並且知道,如果
我們要證明從不可預測性到可預測性,從無知到知識的推論的可靠性,它就必須置
於這種形式中,那麼這種推論外表的自相矛盾就消失了。
現在已變得很清楚,為什麼老的理論不可能適當處理我所說的「基本問題」。
大家承認,主觀理論能夠演繹出Bernoulli定理;但是在大數定理時興以後它決不能
用頻率前後一致地解釋它(參閱第62節)。因此它決不能說明概率預測統計學上的
成功,另一方面,老的頻率理論,根據它的收斂公理則明確要求有規則性。因此在
這個理論內不會有從小規模的不規則性推論到大規模的穩定性問題,因為它只涉及
從大規模的穩定性(收斂公理)同小規模的不規則性(隨機公理)結合在一起,推
論到大規模的特殊形式的和穩定性(Bernoulli定理,大數定律)。
收斂公理不是概率計算基礎的一個必要部分。我用這個結果來結束我的數學計
算分析。
現在我們回來考慮性質截然不同的方法論問題,尤其是如何判定概率陳述問題。
65.可判定性問題
無論我們可給概率概念下什麼定義,或我們選擇什麼樣的公理表述:只要二項
式公式在系統內是可推導出來的,概率陳述就是不可證偽的。概率假說並不排除任
何可觀察的東西;概率陳述不可能同一個基礎陳述發生矛盾,或被它反駁;它們也
不可能被任何有限數目的基礎陳述所反駁;因此也就不會被任何有限數目的觀察所
反駁。
讓我們假定我們已對某個二擇一α提出某個均等機遇假說;例如我們已估計到
用一塊硬幣作擲猜出現「1」和「0」的頻率是均等的,因此 αF(1)- αF(0)
=1/2;再讓我們假定我們在經驗上發現無例外地一次又一次出現「1」:於是我們
無疑會在實際上放棄我們的估計,認為它已被證偽。但在邏輯的意義上不可能有證
偽問題。因為我們可以肯定觀察的只是一個有限的擲猜序列。並且雖然根據二項式
公式,碰巧出現與1/2的離差很大的十分長的有限節段的頻率是極小的,然而它必定
總仍然是大於0。因此具有甚至最大離差的有限節段十分罕見的出現決不可能反駁這
個估計。實際上,我們必定會期望它出現:這是我們估計的一個推斷。任何這種節
段可計算的罕見性將是證偽概率估計的一種手段,這種希望證明是要落空的,因為
甚至一個長的、離差大的節段的頻率出現,也總可以說不過是一個更長、離差更大
的節段的一次出現。因此不存在在外延方面給定的事件序列,所以不存在能夠證偽
概率陳述的有限的幾個一組的基礎陳述。
只有一個無窮的事件序列——根據某項規則在內包上加以定義的——能反駁一
個概率估計。但是鑒於第38節闡述的考慮(參閱第43節),這就是說,概率假說是
不可證偽的,因為它們的維(dimension)是無限的。所以我們實際上應把它們描述
為經驗上沒有信息的、沒有經驗內容的。
然而面對物理學利用從概率假說性估計那裡得到的預測所取得的成功,任何這
種觀點顯然是不能接受的。(這裡所用的論據同早些時候用來反對主觀理論把概率
解釋為重言的論據是一樣的。)許多這些估計的科學意義不亞於其他任何物理學假
說(例如,不下於某一決定論性質的假說)。並且物理學家常常很能判定他是否可
暫時接受某種特定的概率假說為「經驗上得到確證的」,或他是否應該把它作為
「實踐上被證偽的」而加以擯棄,即對於預測設有用處。十分明顯,這種「實踐上
被證偽」只能通過方法論上的判定才能獲得,以把高度不可幾的事件認作被排除的
——被禁止的。但是根據什麼理由可認為它們如此呢?我們應從什麼地方獲得這種
思路?這種「高度不可幾性」從哪裡開始?
由於從純邏輯觀點看,概率陳述不可能被證偽這個事實是不可能有什麼疑問的,
我們在經驗上使用它們這個同樣不容置疑的事實似乎必定是對我關於方法(我的劃
界標準決定性地依賴於它)的基本思想的致命打擊。然而我將通過果敢地應用這些
思想來試圖回答我已提出的問題——什麼是可判定性問題。但是要做到這一點,我
將首先不得不分析概率陳述的邏輯形式,既考慮到它們之間邏輯上的相互關係,又
考慮到它們與基礎陳述所處的邏輯關係。
66.概率陳述的邏輯形式
概率估計不是可證偽的。當然,它們也不是可證實的。同樣理由這也適用於其
他假說,因為看到任何實驗結果,不管多麼多和多麼有利,最後總能確定「正」的
相對頻率是1/2,並且將總是1/2。
因此概率陳述和基礎陳述不可能相互矛盾,也不可能彼此蘊含。然而由此得出
結論說概率陳述和基礎陳述之間沒有任何邏輯關係,那就錯了。並且同樣不能認為
雖然在這兩類陳述之間有邏輯關係(因為觀察序列同頻率陳述顯然或多或少是接近
一致的),這些關係的分析迫使我們引入一種突破經典邏輯的特殊概率邏輯。與這
些觀點相反,我認為這些關係完全能夠用可推演性和矛盾的「經典」邏輯關係來分
析。
從概率陳述的非可證偽性和非可證實性可以推論出,它們沒有可證偽的推斷,
它們本身不可能是可證實陳述的推斷。但是相反的可能性並未排除。因為它可以是
(α)它們有單向可證實推斷〔純粹存在推斷,或有推斷(there-is-conse-qu
ences)〕或(b)它們本身是單向可證偽全稱陳述[所有- 陳述(all—statements)]
的推斷。
可能性(b)對於弄清概率陳述和基礎陳述之間的邏輯關係鮮有幫助:一個非可
證偽陳述,即一個說得很少的陳述能夠屬於可證偽的、因而說得更多的陳述的推斷
類,這是非常明顯的。
對我們意義更大的是可能性(α),它無論如何不是沒有意義的,並且事實上
結果證明對我們分析概率陳述和基礎陳述之間關係是基本的。因為我們發現能夠從
每一個概率陳述中演繹出無限類的存在陳述,但反之不然。(因此概率陳述斷言的
比任何這些存在陳述斷言的更多。)例如,設p是對某一二擇一假說性估計的概率
(並設0≠p≠1);那麼我們能從這個估計中演繹出例如1和0都將出現在這序列的存
在推斷。(當然也還有許多遠不是那麼簡單的例子——例如,會出現與p的離差僅為
一非常小的量的節段。)
但是我們從這個估計中能演繹出的多得多;例如「一遍又一遍地」出現一個具
有性質「1」的元素和具有性質「0』的另一個元素;那就是說,在任何元素x之後,
在序列中會出現一個具有性質「1」的元素y,並且也出現一個具有性質「0」的元素
x。這種形式的陳述(「對於每一個x有y具有可觀察的、或外延上可檢驗的性質B」)
既是不可證偽的——因為它沒有可證偽的推斷——又是不可證實的——由於使之成
為假說性的「所有」或「對於每一個」。雖然如此,它能夠得到更好地或不那麼好
地「確證」——指我們可以證實它的許多或很少存在推斷,或者不能證實它的存在
推斷;因此它與基礎陳述處於似是概率陳述特有的關係中。上述形式的陳述可稱為
「全稱化的存在陳述」或(全稱化的)「存在假說」。
我的主張是,概率估計對基礎陳述的關係,以及這些估計或多或少得到很好
「確證」的可能性,考慮到這一事實就能理解:存在假說在邏輯上可從所有概率估
計中演繹出來。這對概率陳述本身是否可有存在假說的問題是有啟發的。
一切(假說性的)概率估計蘊含著這樣的推測:所說的經驗序列幾乎是似機遇
和隨機的。這就是說,它蘊含著概率計算公理的(近似的)可應用性,以及真理性。
所以,我們的問題就是這些公理是否代表我所說的「存在假說」的問題。
如果我們檢查一下第64節中提出的兩個要求,那麼我們發現隨機性要求實際上
具有存在假說的形式。另一方面,惟一性要求則沒有這種形式;它不可能有這種形
式,因為這種形式的陳述「只有一個……(There is only one……)」必然具有全
稱陳述的形式。(可譯為「至多一個……」或「所有……是同一的」。)
在這裡我的論點是,正是概率估計的(可稱之為的)「存在成份」,因而正是
隨機性的要求,概率估計和基礎陳述之間才建立起一種邏輯關係。因此,惟一性的
要求,作為全稱陳述,沒有任何外延的推斷(extensional consequences)。具有
所要求性質的p的值存在這一點確定能夠在外延上得到「確證」——雖然只是暫時地;
但是只存在一個這樣的值這一點則不能。這後一個全稱的陳述可能在外延上有意義,
僅當基礎陳述能夠同它發生矛盾時;這就是說,僅當基礎陳述能夠肯定存在的值不
止這一個時。由於它們不能夠(因為我們記得不可證偽性與二項式有密切關係)做
到這一點,惟一性的要求必然在外延上是沒有意義的。
這就是為什麼如果我們從系統中消去惟一性要求,概率估計和基礎陳述以及前
者的分級「可確證性」之的分級之間所有的邏輯關係不受影響的緣故。在這樣做時,
我們能夠給予系統以純粹存在假說的形式。但是我們因此不得不放棄概率估計的惟
一性,並且因而(就惟一性而言)獲得某種不同於通常概率計算的東西。
所以惟一性的要求顯然不是多余的。那麼它的邏輯功能是什麼?
雖然隨機性要求有助於確立概率陳述和基礎陳述之間的某種關係,惟一性要求
調節著各種概率陳述本身之間的關係。沒有惟一性要求,作為存在假說的某些陳述,
可以從其他陳述中推導出來,但是它們決不可能彼此矛盾。只有惟一性的要求才保
證,概率陳述能彼此矛盾;因為根據這個要求它們獲得其成分為一個全稱陳述和一
個存在假說的合取形式;並且這種形式的陳述能夠彼此處於同樣基本的邏輯關係中
(同義、可推導性、相容性和不相容性),正如任何理論——例如一個可證偽的理
論——的「正常的」全稱陳述那樣。
如果我們現在考慮收斂公理,那麼我們發現,在它具有一種不可證偽的全稱陳
述的形式這一點上它類似惟一性要求。但是收斂公理要求的比惟一性要求的更多。
然而這種附加要求也不可能有任何外延上的意義;此外,它沒有邏輯或形式的意義,
而只有內包上的意義:它要求排除所有沒有頻率極限的用內包定義的(即數學的)
序列。但是從應用觀點看,這種排除證明甚至在內包上也沒有意義,因為在應用概
率論中我們當然不涉及數學序列本身,而只涉及經驗序列的假說性估計。所以排除
沒有頻率極限的序列,只能用來告誡我們不要把那些經驗序列著作為似機遇或隨機
的,對於那些經驗序列我們假定它們沒有頻率極限。但是對這種告誡,我們能夠采
取何種可能的行動?鑒於這種告誡,我們應該容許或避免哪類關於經驗序列可能收
斂或發散的考慮或推測,保證收斂標準同發散標準一樣可應用於這些序列?一旦擺
脫了收斂公理,所有這些尷尬的問題也就消失了。
因此我們的邏輯分析使系統各部分的要求的形式和功能都一目了然,並且表明
反對隨機性公理和支持惟一性要求的理由是什麼。同時可判定性問題似乎變得越來
越重要。並且雖然我們不一定稱我們的要求(或公理)「無意義」,看來我們被迫
把它們描述為非經驗的。但是概率陳述的這種描述——不管我們用什麼話來表達它
——是否同我們研究的主要思想相矛盾呢?
67.思辨形而上學的概率系統
概率陳述在物理學中最重要的用處是這樣:某些物理學規律性或可觀察的物理
效應被解釋為「宏觀定律」;也就是說,它們被解釋或說明為大數現象,或假說性
的、不能直接觀察的「微觀事件」的可觀察結果。宏觀定律用下列方法從概率估計
中演繹出來:我們證明,與所說的觀察到的規律性一致的觀察結果,應該期望其概
率十分接近於1,即其概率與1的離差為一個能達到按我們選取的那樣小的量。當我
們已證明這一點時,那麼我們就說,我們已經用我們的概率估計把所說的可觀察效
應「解釋」為一個宏觀效應。
但是如果我們以這種方法使用概率估計來「解釋」可觀察的規律性而不采取特
定的預防措施,那麼我們會馬上陷入某些思辨,根據一般的用法,完全可以把它們
描述為思辨形而上學的典型。
因為概率陳述是不可證偽的,以這種方法用概率估計「解釋」我們喜歡的任何
規律性必定總是可能的。以萬有引力定律為例。我們可以下列方法設想出一些假說
性的概率估計來「解釋」這個定律。我們選擇某類事件作為基本事件或原子事件;
例如某一小粒子的運動。我們也選擇某方面作為這些事件的主要性質;例如粒子運
動的方向和速度。於是我們假定這些事件顯現出似機遇的分佈。最後我們計算出所
有的粒子在某一有限的空間區域內,在某一有限的時期內——某一「宇宙期」——
將以規定的精確性(附帶地說,以萬有引力定律要求的方式)運動的概率。計算出
的概率當然將十分小;實際上小得微不足道,但是仍然不等於零。因此我們可以提
出這樣的問題:這個序列的某個n-節段得有多長,或換言之,整個過程必須假定有
多長,我們才可期望這種宇宙期出現的概率接近1(或與1的離差不超過某一任意小
的值E),在這宇宙期內,作為偶發事件積累的結果,我們的觀察將會完全與萬有引
力定律一致。對於任我們選取的接近於1的任何值,我們獲得一個確定的、雖然極端
大的有限數。於是我們可以說:如果我們假定序列的節段有這十分大的長度——或
換言之,「世界」延續得足夠長——那麼我們的隨機性假定使我們能夠期望出現一
個方有引力定律似乎也適用的宇宙期,雖然「實際上」除了隨機發散外什麼也沒有
出現。借助某種隨機性假定,這類「解釋」可應用於我們選取的任何規律性。事實
上,我們可用這個方式把我們整個世界,以及它的所有被觀察到的規律性,「解釋」
成隨機混沌中的一個階段——純粹偶然巧合的一種積累。
我認為很清楚,這類思辨是「形而上學的」,它們對科學沒有任何意義。並且
同樣清楚的是:這個事實同它們的不可證偽性——我們能在任何時候和任何條件容
許它們這個事實是有聯繫的。因此我的劃界標準似乎同「形而上學的」一詞的一般
用法是完全一致的。
所以涉及概率的理論,如果它們不加特定預防措施而加以應用,就不應被認為
是科學的。如果它們應在經驗科學的實踐中有用處,我們就必須排除它們的形而上
學用法。
68.物理學中的概率
可判定性困難的問題只是方法論的,不是物理學的。如果要求提出一個實踐上
可應用的概率概念,物理學家也許會提供某種物理學的概率定義,其思路如下:有
些實驗,即使在受控條件下進行也得出不同的結果。在某些這類實驗——「似機遇
的」實驗,例如用硬幣做擲猜——的情況下,經常重複導致具有相對頻率的結果,
進一步重複,這些相對頻率越來越逼近某個固定值,我們可稱之為所說事件的概率。
這個值是「……可用經驗通過一長系列實驗確定到任何逼近度」;順便說,這說明
為什麼證偽一個假說性的概率估計是可能的。
數學家和邏輯學家會對根據這些思路下的定義提出異議,尤其是下列異議:
(1)這個定義與概率計算並不一致,因為根據Bernoulli定理,只有幾乎所有
非常長的節段才是統計學上穩定的,即其行為彷彿是收斂的。由於這個理由,概率
不能用這穩定性,即用擬收斂行為來定義。因為「幾乎所有」一詞——它應該出現
在定義中——本身只是「十分可幾的」一個同義語。因此這定義是循環的;這個事
實容易通過去掉「幾乎」一詞隱避起來(但不能取消)。這就是物理學家的定義所
做的事;所以這是不能接受的。
(2)什麼時候應說一系列實驗是「長的」?不提供一個應稱之為「長的」標準,
我們不能知道我們何時,或是否已達到逼近這個概率。
(3)我們如何能知道所需要的逼近實際上已達到?
雖然我認為這些異議是合理的,然而我認為我們能夠保留物理學家的定義。我
將通過上節概述的論據來支持這種見解。這些論據表明當概率假說被允許無限應用
時,它們就失去所有信息內容。物理學家決不會以這種方式使用它們。我將遵循物
理學家的範例,不允許概率假說的無限應用:我建議我們作為方法論的決定決不把
物理效應,即可複製的規律性,解釋為偶發事件的累積。這個決定自然修改了概率
概念:它使這個概念變窄了。因此異議(1)並不影響我的觀點,因為我根本不主張
概率的物理概念和數學概念是同一的;反之,我否認這種同一性。但是代替(1),
出現了一個新的異議。
(1』)什麼時候我們能談到「累積的偶發事件」?大概在概率很小的情況下。
但是什麼時候一個概率「小」?我們可以承認的是,我剛提出的建議排除了使用通
過改變數學問題的提法,從小概率中制造任意大概率的方法(前節已討論)。但是
為了執行所建議的決定,我們得知道我們應把什麼看作是小的。
下面幾頁將表明所建議的方法論規則與物理學家的定義是一致的,問題(1』)、
(2)和(3)提出的異議能借助它得到解答。開始,我腦子裡只有一個典型的概率
計算應用例子:我腦子裡有一些可複製的宏觀效應例子,這些效應能夠借助精確的
(宏觀)定律——如氣體壓力——加以描述,並且我們把這些效應解釋或說明為由
於微觀過程,如分子碰撞大量積累所致。其他典型例子(如統計漲落或似機遇的個
別過程的統計)可沒有很多困難地還原為這個例子。
讓我以這種類型的宏觀效應為例,該效應由一個得到很好確認的定律來描述,
這個定律可還原為微觀事件的隨機序列。設這個定律斷言在某種條件下某物理量為
p值。我們假定效應是「精確的」,因此沒有可測量的漲落發生,即與p的離差不超
過間距±o(不精確性的間距;參閱第37節),在此間距內我們的測量由於現行測量
技術固有的不精確性,無論如何會有漲落。現在我們提出假說:p是微觀事件序列α
內的概率;其次,n個微觀事件促使產生效應。於是(參閱第61節)我們能夠對每一
個選取的δ值,計算出概率αnF(△P),即測定值將落在間距△P內的概率。補概
率可用「E「來表示。因此我們有αnF(△)=ε。根據Bernoulli定理,隨n增加至
無限,ε趨向零。
我們假定ε「小」到可以不計(在這個假定中有「小」是什麼意思的問題(1』),
馬上就要討論它)。顯然,△p應解釋為間距,測量在此間距內逼近p值。由此我們
看到三個量:ε,n,和△p與三個問題(1』),(2)和(3)相應。△p或ε可任
意選取,它限制了我們選取ε和n的任意性。由於我們的任務是演繹出確切的宏觀效
應p(±φ),我們不去假定δ大於φ。就可複製效應p而言,如果我們進行的演繹
滿足δほφ ,它就是令人滿意的。(這裡φ是給定的,由於它是由測量技術來確定
的。)現在讓我們選取δ使它(近似地)等於φ。於是我們就將問題(3)還原為兩
個其他問題(1』)和(2)。
通過選取δ(即△P)我們已在n和ε之間確立了一種關係,因為對於每一個n,
現在都有一個ε值惟一地與之相應。因此(2),即什麼時候n有足夠長這個問題已
還原為(1』),即什麼時候ε小這個問題(反之亦然)。
但是這意味著只要我們能夠判定ε的哪一個特定的值可被認為「小到微不足道」
而不計,所有三個問題都可得到回答。現在我們的方法論規則等於是決定忽略不計
小的ε值;但是我們不準備老是去討論某個確定的ε值。
如果我們把問題交給物理學家,即如果我們問他,他準備不計什麼樣的ε——
0.001或是0.000001,或是……?他大概會回答E根本不使他感到興趣;他選取的
不是ε而是n;他已這樣選取n,使n與△P之間的相關大大獨立於我們願意造成的ε
值的任何變化。
由於Bernoulli分佈的數學特點,物理學家的回答是有道理的:對每一個n,確
定ε和△p之間的函數關係是可能的。對這個函數作一檢查就可表明,對於一切(
「大的」)n都存在一個表示特徵的△p值,使得在這個值的鄰域,完全不受ε的變
化的影響。這種無影響性隨n的增加而增加。如果我們取我們在極端大數現象情況下
應該期望的一個數量級的n,那麼在它的特徵值的領域△p完全不受ε的變化的影響,
以致即使ε的數量級改變,△p也幾乎根本沒有變化。現在物理學家將把很小的值附
加於規定得更明確的△p界限上。並且在研究所限的典型的大數現象的情況下,我們
記得,能夠使△p與精確度為±φ(取決於我們的測量技術)的間距相對應;並且這
個間距沒有明確的界限,只有我在第37節所說的「縮聚界限」(condensation bou
nd)。所以當△p在它的特徵值(我們能夠確定這個值)的領域的無影響性至少有如
此之大,甚至ε數量級的改變引起的△p值僅在±φ的縮聚界限內漲落時,我們才稱
n是大的。(如果n→∞,則△P變得完全不受影響)。但是如果是如此,我們就無需
再操心ε的精確測定:即使我們沒有精確地說出必須把什麼看作是「小的」,決定
置小的ε於不顧也就夠了。這等於是決定利用上述不受ε的變化的影響的△p的特徵
值。
必須把極度不可幾性置於不顧的規則(只有根據上述才成為十分明確的一條規
則)與要求科學的客觀性是一致的。因為對我們的規則的明顯反對顯然是,最大的
不可幾性始終是一種概率,不管這種概率有多麼小,因此甚至最不可幾的過程——
即我們建議置之不顧的過程——終有一天會發生。但是這個反對意見可通過恢復可
複製的物理效應概念來予以解決,這個概念與客觀性概念有密切聯繫(參閱第8節)。
我不否認不可幾事件會發生的可能性。例如我並不斷言在小量氣體中的分子在一短
暫時間內不會自發地聚集成為這容量的一部分,或者在大量氣體中壓力的自發漲落
永遠不會發生。我斷言的是,這些偶發事件不是物理效應,因為根據它們的極度不
可幾性,它們不能隨意複製。即使一個物理學家碰巧觀察到這種過程,他也完全不
可能去複製它,因此永遠不能判定在這種情況下實際發生了什麼,他是否有可能犯
了一次觀察上的錯誤。然而,如果我們發現一些可複製的離差,這些離差不同於按
上述方式從概率估計中演繹出的宏觀效應,那麼我們必須假定概率估計已被證偽。
這些考慮可幫助我們理解Eddington的下述看法,他區別了兩類物理定律:「某
些事情永遠不會在物理世界中發生,因為它們是不可能的;另一些則因為它們也是
不可幾的。禁止前者的定律是一級定律;禁止後者的是二級定律」。雖然這種表述
也許並不能擺脫批評(我寧願不去對極度不可幾的事情是否發生作出不可檢驗的斷
言),但它與物理學家對概率論的應用完全一致。
可應用概率論的其他場合,如統計漲落,或似機遇個別事件的統計,可還原為
我們一直在討論的場合,即可精確測定的宏觀效應場合。我理解的統計漲落就是Br
own運動那樣的現象。在這裡測量精確度的間距(±o)小於對效應起促進作用的微
觀事件數n特有的間距△p;因而可期望不同於p的可測定離差是高度不可幾的。發生
這些離差這一事實是可檢驗的,因為漲落本身成為一種可複製效應;並且我以前的
論證可應用於這種效應:漲落超過某一大小(超過某個間距△p),根據我的方法論
要求,必定不是可複製的,朝同一方向漲落的長序列也是如此,如此等等。相應的
論證也會適用於似機遇個別事件的統計。
我現在總結我的關於可判定性問題的論證。
我們的問題:概率假說——我們已看到它們是不可證偽的——如何能在經驗科
學中起自然律的作用?我們的回答是:概率陳述,就它們是不可證偽的而言,是形
而上學的和沒有經驗意義的;就利用它們作為經驗陳述而言,利用它們作可證偽的
陳述。
但是這種回答提出了另一個問題:概率陳述——是不可證偽的——可用作可證
偽陳述,怎麼可能呢?(它們能如此使用這個事實是毋庸置疑的:物理學家知道得
十分清楚,什麼時候認為概率假定已被證偽。)我們發現這個問題有兩個方面。一
方面,我們必鬚根據其邏輯形式使利用概率陳述的可能性成為可理解的,另一方面,
我們必須分析支配它們用作可證偽陳述的原則。
根據第66節,公認的基礎陳述可以多少令人滿意地與某種所提出的概率估計一
致;它們可更好或稍差一些代表概率序列的一個典型節段。這為某種方法論規則的
應用提供了機會,例如要求基礎陳述和概率估計之間的一致應該符合某種最低限度
標準這一規則。因此規則可引出某種任意的思路,並且規定只有適當代表性的節段
(或適當「公平的樣本」)才得以「允許」,而不典型的或沒有代表性的節段是被
禁止的。
對這種意見作更仔細的分析向我們表明,什麼被允許和什麼被禁止之間的分界
線的劃定並不一定像起初想象的那樣任意。尤其是無需「寬容地」劃定這條分界線。
因為有可能用這種方式形成這條規則,使什麼被允許和什麼被禁止之間的分界線,
正如其他定律的情況一樣,由我們的測量能達到的精確度來決定。
我們根據劃界標準提出的方法論規則,不禁止不典型節段的出現;它也不禁止
離差(當然,對於概率序列是不典型的)的重複出現。這條規則禁止的是系統離差
的出現可預測和可複製,例如朝特定方向的離差,或肯定是不典型的節段的出現。
因此它要求的不單是粗略的一致,而是對於可複製和可檢驗的一切,簡言之,對於
所有的可複製效應可能是最佳的一致。
69.定律和機遇
人們有時聽說,行星的運動服從嚴格的定律,而一粒骰子的擲下是碰運氣,或
受機遇支配。我認為區別在於這個事實:迄今我們已能成功地預測行星的運動,但
還不能預測擲骰子的個別結果。
為了演繹出預見,人們需要定律和初始條件;如果沒有合適的定律或不能確定
初始條件,科學的預見方法就垮台。擲骰子時我們所缺乏的顯然是初始條件的充分
知識。有了初始條件的足夠精確的測定,也就有可能在這種情況下作出預見;但是
選定正確擲骰子的規則(搖搖骰子盒)是為了防止我們測量初始條件。游戲規則以
及確定某一隨機序列的各種事件必將發生的那些條件的其他規則,我稱之為「框架
條件」。它們由這樣一些要求組成,如骰子應該是「純的」(由同質物質組成),
應該把它們好好地搖搖等等。
有一些其他情況,預見是不成功的。也許迄今還不可能提出合適的定律;也許
發現一個定律的所有嘗試都已失敗,並且所有的預見也被證偽。在這些情況下我們
可能對究竟是否會找到一個滿意的定律已失望。(但是大概我們不會放棄嘗試,除
非問題已使我們不大感興趣——例如如果我們滿足於頻率預測,就是這種情況。)
然而,無論如何,我們不能定論地說,在某個特定的領域沒有定律。(這是證實不
可能性的一個結果。)這就是說,我的觀點使機遇概念成為主觀的。當我們的知識
不足以作出預見時我就說「機遇」;正如擲骰子時,我們說「機遇」,因為我們對
初始條件沒有知識。(可以設想,儀器設備精良的物理學家,能觀測其他人預測不
到的一次擲骰子的結果。)
與這種主觀觀點相反,人們有時支持一種客觀的觀點。就這種觀點利用事件本
身是指決定的還是不決定的這種形而上學觀念而言,我將不在這裡對這種觀點作進
一步的考察(參閱第71和78節)。如果我們的預見獲得成功,我們可以談到「定律」;
否則我們對定律或不規則性的存在或不存在不可能有任何知識。
也許比這個形而上學觀念更值得考慮的是下面的觀點。可以說,當我們的概率
估計得到驗證時,我們遇到客觀意義上的「機遇」;正如當我們遇到因果規律性時
一樣。
蘊涵在這觀點中的機遇定義可能不全是無用的,但是應該有力強調,如此定義
的概念並不與定律概念相對立:正是由於這個理由我稱概念序列是似機遇的。一般
地說,一個實驗結果的序列是似機遇的,如果定義序列的框架條件不同於初始條件
的話;當在同一框架條件下進行的個別實驗,在不同的初始條件下進行時,就會產
生不同的結果。其元素根本不可預測的似機遇序列是否存在,我不知道。我們甚至
不能從某個序列是似機遇的這個事實,推論出它的元素是不可預測的,還是或者推
論出它們「由於」在主觀的知識不足意義上的「機遇」所致;我們尤其不能從這個
事實推論出定律不存在的「客觀」事實。
不僅不可能從序列的似機遇性質中推論出任何與定律一致的東西,或者在另一
方面與個別事件一致的東西;甚至不可能從概率估計的驗證推論出序列本身是完全
不規則的。因為我們知道似機遇序列是存在的,這些序列是根據數學規則建構的。
一個序列具有Bernoulli分佈這個事實不是不存在定律的征候,與「根據定義」不存
在定律完全不是一回事。我們在概率預測成功中看到的不過是在序列結構中不存在
簡單定律的征候(參閱第43和48節)——與構成序列的事件相反。不受後效約束的
假定相當於這樣的假說:這種簡單的定律是不可發現的,這個假定得到驗證,但這
就是一切。
70.從微觀定律推演宏觀定律的可能性
有一種學說幾乎已成為偏見,雖然它在最近已受到嚴厲的批評——所有可觀察
的事件必須解釋為宏觀事件,即解釋為一些微觀事件的平均數或累計或總和的學說
(這個學說有點類似某些形式的唯物主義)。像其他這種學說一樣,這似是某一方
法論規則的形而上學具體化,而這條規則本身是完全無可非議的。我指的是這條規
則:我們應該看看我們是否能用上述類型的解釋性假說簡化、概括或統一我們的理
論。在評論這些嘗試的成功時,認為關於微觀事件的非統計假說及其相互作用定律
就能足以說明宏觀事件,這是個錯誤。除此以外,我們應該需要假說性的頻率估計,
因為從統計前提中只能推導出統計結論。這些頻率估計總是獨立的假說,當我們從
事研究與微觀事件有關的定律時,這些假說的確不時出現在我們腦中,但是它們決
不能從這些定律中推導出來。頻率估計形成一類特殊的假說:一般地說,它們是與
規律性有關的禁律。Von Mises對這一點說得十分清楚:「沒有統計學性質的補充假
定,在氣體動力理論中甚至最微不足道的定理也不是單從經典物理學中推導出來的」。
統計學估計或頻率陳述決不能從「決定論」性質的定律中推導出來,理由是為
了從這些定律中演繹出任何預見,需要初始條件。在初始條件那裡,關於初始條件
統計學分佈的假定——也就是說特定的統計學假定——進入了演繹過程,統計學定
律就是通過演繹從決定論性質或「精確」性質的微觀假定中獲得的。
理論物理學的頻率假定在一定程度上是等機遇假說,這是一個令人驚異的事實,
但這無論如何並不是意味著它們是「自明的」,或先驗地正確的。它們遠非如此,
這一點從經典統計學、Bose-Einstein統計學和Fermi-Dirac統計學之間的廣泛差
異中就可看到。這些表明特定的假定如何可與一個等機遇的假說結合起來,在每一
種情況下都導致參考序列的主要性質(假定其分佈是均等的)的不同定義。
下面的例子也許可證明這個事實:甚至當我們想擺脫頻率假定時,它們也是必
不可少的。
想象一個瀑布。我們可辨認某種奇特的規律性:組成瀑布的水流的大小是變化
的;不時地飛濺從主流中甩出來;然而在貫穿所有這些變化中,某種規律性明顯可
見,它強烈提示有一種統計學效應。儘管有一些尚未解訣的液體動力學問題(與渦
流的形成有關等等),我們在原則上能夠以任何所需程度的精確性,預測任何量水
——比方說一組分子——的路線,如果給定足夠精確的初始條件的話。因此我們可
以假定,有可能預言遠在瀑布之上的任何分子,在哪一點上它將越過邊緣,到達底
部等等。這樣原則上可計算出任何數量分子的路線;並且給定充分的初始條件,我
們就能在原則上演繹出瀑布的任何一種個別的統計學漲落。但是只能是這種或那種
個別的漲落的,而不是我們已描述過的反覆發生的統計學規律性,一般統計學分佈
就更不行了。為了說明這些,我們需要統計學估計——至少假定某些初始條件對於
許多不同組的粒子(等於一個全稱陳述)將一次又一次地反覆出現。我們獲得一個
統計結果,當且僅當我們作出這些特定的統計學假定——例如關於反覆出現的初始
條件頻率分佈的假定——時。
71.形式上單稱的概率陳述
我稱一個概率陳述為「形式上單稱的」,當它把某一概率賦予某個單一偶發事
件或某類偶發事件的單個元素時;例如,「用這個骰子擲下一次得5的概率是1/6」
或「(用這個骰子)擲任何一次得5的概率是1/6」。從頻率理論觀點看,一般認為
這些陳述是不十分正確的表述,因為不能把概率歸之於單個偶發事件,而只能歸之
於偶發事件或事件有限序列。然而借助客觀概率或相對頻率概念用適當定義的形式
上單稱的概率把這些陳述解釋為正確的陳述是容易的。我用「Pαk(β)」表示這
形式上單稱的概率:作為序列α的一個元素,某一偶發事件k有性質β——符號為k
εα——於是我定義形式上單稱的概率如下;
Pαk(β)=αF(β)(kεα)(定義)這可用文字表達如下:事件k具
有性質β——設k為序列α的一個元素——的形式上單稱的概率,根據定義等於性質
β在參考序列α內的概率。
這個簡單的幾乎一目了然的定義證明令人驚異地有用。它甚至可幫助我們澄清
現代量予理論的某些複雜問題(參閱第75-76節)。
正如定義所表明的,如果一個形式上單稱的概率陳述沒有明確說出一個參考類,
它就是不完全的。但是雖然α常常沒有明確提及,在這些情況下我們往往知道α是
什麼意思,因此上述第一個例子沒有具體規定任何參考序列α,但是十分清楚它與
擲真的骰子的所有序列有關。
在許多情況下,對一個事件K可以有若干不同的參考序列。在這些情況下非常明
顯,對同一事件可以作出不同的形式上單稱的概率陳述。因此一個個別的人K將在一
定時期內死亡這種概率可根據我們認為他是他的年齡組的一員,還是他的職業組的
一員等等來假定十分不同的值。對於應該從若干可能的參考類中選定哪一個,不可
能制定一個一般規則。(最窄的參考類往往最合適,假如它多到足以使概率陳述立
足於合理的統計外推,並且得到足夠量驗證證據的支持的話。)
一旦我們認識到同一偶發事件或事件可以有不同的概率,作為不同參考類的一
個元素,不少所謂概率悖論就消失了。例如,有時有人說,一個事件的概率αPk
(β)在它出現以前不同於同一事件在它出現以後的概率:在以前它等於1/6,而
在以後可能只等於1或0。當然這個觀點是完全錯誤的。αPk(β)在出現以前和以
後總是相同的。除了根據信息kεβ(或kε)——根據時偶發事件的觀察提供給我
們的信息——我們可選取一個新的參考類,即β(或),然後向βPk(β)值是什
麼以外,什麼也沒有變化。這個概率值當然是1;而Pk(β)=0。告訴給我們關於
單個偶發事件實際結局的陳述——不是關於某個頻率,而是關於「kεφ」形式的陳
述——不能改變這些偶發事件的概率;然而,它們可提示我們選取另一個參考類。
形式上單稱的概率陳述概念提供了一種通向主觀理論,從而也就通向域(rang
e)理論的橋樑,正如下節將表明的那樣。因為我們會同意把形式上全稱的概率解釋
為「理性信仰程度」(依照Keynes)——假如我們允許我們的「理性信仰」受某一
客觀的頻率陳述指導的話。因此這種陳述還是我們的信仰所依靠的信息。換言之,
也可能有這樣的事:我們除了知道某個事件屬於某一參考類,某個概率估計在其中
受到了成功的檢驗外,對它一無所知。這個信息並不能使我們預見這個事件的性質
將是什麼;但是它能使我們表達借助某種形式上單稱的概率陳述知道它的一切,這
種陳述看起來像關於所談論的特定事件的不確定預見。
因此,我不反對關於單個事件概率陳述的主觀解釋,即解釋為不確定的預見—
—可以說,承認我們對所談論的特定事件缺乏知識(的確,關於這個事件什麼結論
也不能從某個頻率陳述中得出)。那就是說,我不反對概率陳述的主觀解釋,只要
我們明確承認客觀頻率陳述是基本的,因為只有它們是可用經驗檢驗的。然而,我
反對把這些形式上單稱的概率陳述——這些不確定預見——解釋為關於客觀事態的
陳述,但不反對解釋為客觀統計事態的陳述。我腦子裡有這樣一種觀點:關於擲骰
子概率為1/6的一個陳述不僅是承認我們不知道任何確定的事情(主觀理論),而
且是關於擲下一次的斷言——斷言它的結果客觀上既是不確定的又是非決定的——
是關於某種仍懸而未決的事情的斷言。我認為所有作出這種客觀解釋(除了別人外,
Jeans作過充分的討論)的嘗試都是錯誤的。不管這些解釋可能造成一些什麼樣的非
決定論氣氛,它們全都包含這樣的形而上學思想:不僅我們能演繹出和檢驗預見,
並且除此之外自然界或多或少是「決定的」(或「非決定的」);因此預見的成敗
不應用它們由之演繹出來的定律來解釋,而是首先由這樣一個事實來解釋:自然界
實際上是(或不是)根據這些定律組成的。
72.域理論
我在第34節中說,一個可證偽程度比另一陳述更高的陳述可被描述為邏輯上更
不可幾的陳述;而不那麼可證協的陳述則是邏輯上更可幾的陳述。邏輯上不那麼可
幾的陳述衍推出邏輯上更可幾的陳述。在邏輯概率概念和客觀的或形式上單稱的數
值概率概念之間有密切關係。某些概率哲學家(Bolzano,von Kries,Waismann)
曾試圖把概率計算立足於邏輯域,因此立足於一個與邏輯概率一致的概念(參閱第
37節);並且他們在這樣做時,也試圖弄清邏輯概率與數值概率之間的密切關係。
Waismann曾建議用與不同陳述相應的相對頻率測定它們邏輯域之間的相互關係
程度(可以說它們的比值),從而把頻率看作為決定一個測定域的系統的東西。我
認為在此基礎上建立概率論是可行的。的確我們可以說,這個計劃就是使相對頻率
同某些「不確定的預見」相關起來——正如當我們定義形式上的單稱概率陳述時在
前一節已經做的一樣。
然而必須說,僅當一個頻率理論已經建構時,這種定義概率的方法才是可行的。
否則人們就得問在定義測定系統時使用的頻率本身又是如何定義的。然而,如果我
們手中已經有某個頻率理論,那麼引入域理論實際上就成為多余的。但是儘管有這
種異議,我認為Waismann建議的可行性是重要的。發現一個更全面的理論能夠填補
解決這個問題的各種嘗試之間,尤其是在主觀和客觀解釋之間的鴻溝——起初似乎
是不可填補的。然而Waismann的建議要求作一點修改。他的域比值概念(參閱第48
節注)不僅要求域能借助它們的子類關係(或它們的衍推關係)加以比較;而且它
更一般地要求使甚至只是部分交迭的域(不可比較的陳述的域)也能夠成為可以比
較的。然而這後一個假定有相當的困難,它是多余的。有可能表明,在有關的情況
下(為隨機情況)子類的比較和頻率的比較必定導致類似的結果。這證明為了測定
域而把頻率與域相關起來的方法是對的。我們在這樣做時,就使所談論的陳述(按
子類方法是不可比較的)成為可以比較的。我將粗略地表明所描述的方法如何可得
到證明。
如果在兩個性質類γ和β之間,子類關係γB成立,則:(K)〔Fsb(kεγ)
ぼFsb(kεβ)〕(參閱第33節)因此邏輯概率或陳述(kεγ)的域必須小於或等
於(kεβ)的域。它將是相等的,僅當有一個參考類α(它可以是全稱類)時,對
於這個參考類下列規則成立,這個規則可以說具有「自然律」的形式:
(x){[xε(α.β)→(xεγ)]} α.β如果這種「自然律」不成立,因
此我們可假定在這個方面有隨機性,那麼不等性就成立。但是在這個情況下我們就
得到下式,假如α是可數的,並可承認為一個參考序列:αF(γ)<αF(β)這
就是說,在隨意性情況下,域的比較必須導致同樣的不等性,正如相對頻率的比較
一樣。因此,如果我們有隨機性,我們就可把相對頻率同域相關起來,以使域成為
可測量的。但是這正是我們在第71節中當我們定義形式上單稱的概率陳述時所做的
(雖然是間接地)。的確,我們可以從這些假定中直接推論出αPk(γ)<αPk
(β)這樣我們就回到了我們的出發點,概率解釋問題。並且我們現在發現,客觀
和主觀理論之間的沖突,初看似乎是如此難辦,可用某種一目了然的形式上單稱的
概率的定義來完全消除。
------------------
素心學苑 收集整理
|