Histopathology image classification: Highlighting the gap between manual analysis and AI automation

輪盤(上)、掟銀仔(左下)同擲骰仔(右下)一般俾人認為係本質上隨機性嘅事件

概率粵拼koi3 leot2 | 英文probability),粵語有稱之為 probit(大致粵拼prot6 bit1),又叫機會率機率或然率,係指一件事件有幾可能係真(或者一個結果出現嘅可能程度):概率可以用百分比寫出嚟-介乎 0 同 1 之間,100% 代表件事實會發生,0% 代表件事絕對唔會發生,50% 就表示件事「有 50% 機會發生」;例如家陣掟一個銀仔,假設個銀仔冇出千嘅話,應該會有 50% 機會出公、50% 機會出字,而呢件事嘅結果(公定字)原則上係冇可能預測嘅,反映咗不確定[1][2]

基礎

睇埋:概率論

概率可以噉樣想像:家陣有若干件可能嘅事件,而分析者同每一個可能嘅事件都俾一個數值佢;每件事件掕住嗰個數值就係嗰件事件嘅概率 ,用日常用語講表示「件事件有幾大機會發生」,0 表示「實唔會發生」,1 表示「實會發生」[註 1]。响廿一世紀嘅概率論當中,啲人一般會用以下噉嘅數學符號嚟表示所講嘅嘢[3]

  • 啲人一般會用「」或者「」嚟代表「 發生嘅概率」,
  • 而一場實驗嘅結果()可以用噉嘅方式表達[4]
    嘅概率係 」、「 嘅概率係 」... 呀噉; 可以想像成(例如)「擲骰仔得到嘅數」。

概率可以用好似上圖噉嘅方式嚟表達;想像 X 軸,表示「擲一粒六面骰仔得到嘅數」,而 Y 軸表示各件呢啲事件嘅相應 值。假如粒骰仔冇出千,應該每個數出現嘅概率都係一樣嘅。

詮釋

喺概率論史上,「概率呢個數值要點樣理解」係一個有相當爭議性嘅問題:喺最基本上,古典嘅決定論主張,如果一個觀察者喺而家呢一刻完美知道嗮宇宙嘅狀態(例:知道每粒原子喺乜位置同以乜嘢速度郁緊等等),佢將會有能力靠物理定律-假設佢識嗮所需嘅物理知識-完美預測宇宙下一刻嘅狀態(可以睇吓拉普拉斯魔[5],所以概率呢個數值淨係反映人類知識唔夠,而主張呢個觀點嘅人會話「人之所以預測唔到掟銀仔嘅結果,係因為人知唔嗮風向等嘅資訊[6][7]。不過廿世紀量子力學研究指出,宇宙裏面有部份嘅事件似乎係本質上就冇可能完全準確噉預測嘅,人頂櫳都淨係有得估呢啲事件發生嘅概率[8]

謎題

可以睇睇生日悖論蒙地賀問題

歷史

内文:[[:概率嘅歷史]]
想知多啲:[[:統計學嘅歷史]]

概率嘅科學研究係數學嘅現代發展。賭博顯示出喺歷史上一直都有人想量化概率嘅概念,但係精確嘅數學描述就出現得好耐之後。概率數學發展緩慢係有原因嘅。雖然機會遊戲推動咗概率嘅數學研究,但係一啲基本問題仲係畀迷信蒙蔽住。[註 2][9]

根據Richard Jeffrey嘅講法,「喺十七世紀中期之前,『probable』(拉丁文probabilis)嘅意思係『可以接受嘅』,而且一致咁應用喺意見同行動上面。一個probable嘅行動或意見就係明智嘅人喺當時情況下會採取或者持有嘅嘢。」[10]不過,特別係喺法律嘅語境下,「probable」都可以用嚟形容有好證據支持嘅命題。[11]

傑羅拉莫·卡爾達諾(16世紀)
克里斯蒂安·惠更斯出版咗第一本關於概率嘅書之一(17世紀)。

十六世紀意大利嘅博學家傑羅拉莫·卡爾達諾證明咗將機率定義為有利結果對不利結果嘅比率係有效嘅(呢個意味住一個事件嘅概率係由有利結果對可能結果總數嘅比率畀出嘅[12])。 除咗卡爾達諾嘅基礎工作之外,概率學說可以追溯到皮埃爾·德·費馬布萊茲·帕斯卡嘅通信(1654年)。克里斯蒂安·惠更斯(1657年)做咗最早已知嘅科學處理。[13]雅各布·伯努利嘅《推測術》(死後出版,1713年)同亞伯拉罕·棣莫弗嘅《機會論》(1718年)將呢個課題當做數學嘅一個分支嚟處理。[14]Ian Hacking嘅《概率嘅出現》[15]James Franklin嘅《推測嘅科學》[16]可以了解數學概率呢個概念早期發展嘅歷史。

誤差理論可以追溯到羅傑·科茨嘅《雜項作品》(死後出版,1722年),但係托馬斯·辛普森喺1755年準備(1756年印刷)嘅一篇論文首次將呢個理論應用到觀察誤差嘅討論上。[17]呢篇論文嘅重印本(1757年)確立咗正誤差同負誤差係等可能嘅公理,同埋某啲可以指定嘅限制定義咗所有誤差嘅範圍。辛普森仲討論咗連續誤差,並且描述咗一條概率曲線。

最早提出嘅兩條誤差定律都係由皮埃爾-西蒙·拉普拉斯創立嘅。第一條定律喺1774年發表,指出誤差嘅頻率可以表示為誤差數值大小嘅指數函數——唔考慮正負號。第二條誤差定律喺1778年由拉普拉斯提出,指出誤差嘅頻率係誤差平方嘅指數函數。[18]第二條誤差定律叫做正態分布或者高斯定律。「喺歷史上好難將呢條定律歸功於高斯,佢雖然以早熟聞名,但可能喺兩歲之前都未有呢個發現。」[18]

丹尼爾·伯努利(1778年)引入咗同時發生誤差系統嘅概率最大乘積原理。

卡爾·弗里德里希·高斯

阿德里安-馬里·勒讓德(1805年)發展咗最小二乘法,並喺佢嘅《確定彗星軌道嘅新方法》中引入咗呢個方法。[19]唔知道勒讓德嘅貢獻嘅情況下,一個愛爾蘭裔美國作家,《分析家》嘅編輯羅伯特·阿德雷恩(1808年),首次推導咗誤差便利性定律,

喺呢度,係一個依賴於觀察精確度嘅常數,而係一個確保曲線下面積等於1嘅比例因子。佢畀咗兩個證明,第二個基本上同約翰·赫歇爾(1850年)嘅一樣。[未記出處或冇根據]高斯喺1809年畀咗第一個似乎喺歐洲已知嘅證明(喺阿德雷恩之後嘅第三個)。之後拉普拉斯(1810年,1812年)、高斯(1823年)、詹姆斯·艾佛里(1825年,1826年)、哈根(1837年)、弗里德里希·貝塞爾(1838年)、W.F.唐金(1844年,1856年)同摩根·克羅夫頓(1870年)都畀咗更多嘅證明。其他貢獻者包括埃利斯(1844年)、德·摩根(1864年)、格萊舍(1872年)同喬瓦尼·斯基亞帕雷利(1875年)。彼得斯(1856年)嘅公式[唔該解釋係乜東東]計算r,單一觀察嘅可能誤差,係好出名嘅。

喺十九世紀,寫過一般理論嘅作者包括拉普拉斯、西爾維斯特·拉克魯瓦(1816年)、利特羅(1833年)、阿道夫·凱特萊(1853年)、理查德·戴德金(1860年)、赫爾默特(1872年)、赫爾曼·洛朗(1873年)、利亞格雷、迪迪翁同卡爾·皮爾遜奧古斯特斯·德·摩根喬治·布爾改進咗理論嘅闡述。

1906年,安德烈·馬爾可夫引入咗[20]馬爾可夫鏈嘅概念,呢個概念喺隨機過程理論同佢嘅應用中扮演咗重要角色。基於測度論嘅現代概率理論係由安德烈·柯爾莫哥洛夫喺1931年發展嘅。[21]

喺幾何方面,《教育時報》嘅貢獻者包括米勒、克羅夫頓、麥科爾、沃爾斯滕霍姆、沃森同阿特馬斯·馬丁[22]更多資訊請參閱積分幾何

理論

内文:[[:概率理論]]

同其他理論一樣,概率嘅理論係以正式嘅方式表達佢嘅概念——即係,用可以同佢哋嘅意義分開考慮嘅方式。呢啲正式嘅術語由數學同邏輯嘅規則操縱,而任何結果都會被解釋或者翻譯返去問題領域。

至少有兩個成功嘅嘗試去形式化概率,即係柯爾莫哥洛夫嘅公理化同考克斯嘅公理化。喺柯爾莫哥洛夫嘅公理化中(請參閱概率空間),集合被解釋為事件,而概率被解釋為一個集合類上嘅測度。喺考克斯定理中,概率被當做一個基本概念(即係唔再進一步分析),重點係要建立一個一致嘅概率值分配到命題上。喺兩種情況下,概率定律都係一樣嘅,只係技術細節有啲唔同。

仲有其他量化不確定性嘅方法,好似鄧普斯特-謝弗理論或者可能性理論,但係呢啲本質上係唔同嘅,同通常理解嘅概率定律唔兼容。

應用

機率論喺日常生活中應用喺風險評估同建模。保險行業同市場精算學去決定定價,並作出交易決策。政府會用機率方法喺環境法規、權利分析同金融法規等方面。

一個機率論應用喺股票交易嘅例子係,中東有冇大規模衝突嘅機率點樣影響油價,從而影響整個經濟體系。當商品交易員評估戰爭可能性增加時,可能會令商品價格上升或下降,並且傳遞呢個意見畀其他交易員。所以,呢啲機率唔係獨立評估,亦唔一定係理性嘅。行為金融學理論就係用嚟解釋呢種集體思維對定價、政策,同埋和平與衝突嘅影響。[23]

除咗金融評估,機率仲可以用嚟分析生物學(例如:疾病傳播)同生態學嘅趨勢(例如:生物龐尼方格子)。[24]同金融一樣,風險評估可以作為統計工具計算不良事件發生嘅機率,幫助制定避免遇到呢啲情況嘅措施。機率亦會用嚟設計機會遊戲,讓賭場可以保證賺錢,但又要提供足夠頻繁嘅派彩畀玩家,吸引佢哋繼續玩。[25]

另一個機率論喺日常生活嘅重要應用就係可靠性。好多消費產品,例如汽車同消費電子產品,會喺設計過程中應用可靠性理論,減少故障嘅機率。故障機率亦會影響製造商對產品保用期嘅決策。[26]

快取語言模型同其他統計語言模型,喺自然語言處理中亦係機率論嘅應用例子。

睇埋

註釋

  1. 嚴格噉講,機率係 0 表示嗰件事件發生嘅機會非常之咁細,好似無窮小量噉,但唔係完全冇可能發生。機率係 1 可以用同樣道理想像。
  2. 喺呢本書嘅背景下,係講緊概率理論同佢背後嘅邏輯支配住呢啲現象,而唔係單靠運氣或者神話論據,好似求財神幫贏家嗰啲。

引述

  1. William Feller, An Introduction to Probability Theory and Its Applications, (Vol 1), 3rd Ed, (1968), Wiley.
  2. Kallenberg, O. (2006). Foundations of modern probability. Springer Science & Business Media.
  3. Bain, Lee J.; Engelhardt, Max (1992). Introduction to Probability and Mathematical Statistics (2nd ed.). Belmont, California: Brooks/Cole. p. 53.
  4. Murphy, K. P. (2012). Machine learning: a probabilistic perspective, p. 35. MIT press.
  5. Richard Langdon Franklin (1968). Freewill and determinism: a study of rival conceptions of man. Routledge & K. Paul.
  6. Laplace, Pierre Simon. A Philosophical Essay on Probabilities, translated into English from the original French 6th ed. by Truscott, F.W. and Emory, F.L., Dover Publications (New York, 1951).
  7. Moore, W.J. (1992). Schrödinger: Life and Thought. Cambridge University Press. p. 479.
  8. Stephen Hawking's Grand Design (2010), page 32: "the molecular basis of biology shows that biological processes are governed by the laws of physics and chemistry and therefore are as determined as the orbits of the planets...so it seems that we are no more than biological machines and that free will is just an illusion", and page 72: "Quantum physics might seem to undermine the idea that nature is governed by laws, but that is not the case. Instead it leads us to accept a new form of determinism: Given the state of a system at some time, the laws of nature determine the probabilities of various futures and pasts rather than determining the future and past with certainty." (discussing a Many worlds interpretation).
  9. Freund, John. (1973) 概率導論. Dickenson ISBN 978-0-8221-0078-2 (第1頁)
  10. Jeffrey, R.C., 判斷嘅概率同藝術, 劍橋大學出版社。(1992)。第54–55頁。ISBN 0-521-39459-7
  11. Franklin, J. (2001) 推測嘅科學:帕斯卡之前嘅證據同概率, 約翰霍普金斯大學出版社。(第22, 113, 127頁)
  12. 典概率中嘅一啲定律同問題,以及卡爾達諾係點預見到佢哋嘅 Gorrochum, P. Chance 雜誌 2012 (PDF)
  13. Abrams, William,率簡史,Second Moment,原著喺24 July 2017歸檔,喺2008-05-23搵到
  14. Ivancevic, Vladimir G.; Ivancevic, Tijana T. (2008)。子飛躍:從狄拉克同費曼,穿越宇宙,到人體同心靈。新加坡; 哈肯薩克, 新澤西州:World Scientific。頁 16。ISBN 978-981-281-927-7
  15. 引用錯誤 無效嘅<ref>標籤;無文字提供畀叫做Emergence嘅參照
  16. Franklin, James (2001)。測嘅科學:帕斯卡之前嘅證據同概率。約翰霍普金斯大學出版社。ISBN 978-0-8018-6569-5
  17. Shoesmith, Eddie (November 1985)。馬斯·辛普森同算術平均數學史 (英文)。12 (4): 352–355。doi:10.1016/0315-0860(85)90044-8
  18. 18.0 18.1 Wilson EB (1923) "第一同第二誤差定律"。美國統計學會雜誌, 18, 143
  19. Seneta, Eugene William。"阿德里安-馬里·勒讓德"9版StatProb: 由統計同概率學會贊助嘅百科全書原著喺3 2月 2016歸檔。喺27 1月 2016搵到
  20. Weber, Richard。爾可夫鏈 (PDF)計實驗室。劍橋大學。
  21. Vitanyi, Paul M.B. (1988)。德烈·尼古拉耶維奇·柯爾莫哥洛夫CWI季刊 (1): 3–18。喺27 January 2016搵到
  22. Wilcox, Rand R. (2016)。解同應用基本統計方法使用R。新澤西州霍博肯。ISBN 978-1-119-06140-3OCLC 949759319
  23. Singh, Laurie (2010) "Whither Efficient Markets? Efficient Market Theory and Behavioral Finance". The Finance Professionals' Post, 2010.
  24. Edwards, Anthony William Fairbank (September 2012). "Reginald Crundall Punnett: First Arthur Balfour Professor of Genetics, Cambridge, 1912". 透視. 傳學. Gonville and Caius College, Cambridge, UK: 美國遺傳學會. 192 (1): 3–13. doi:10.1534/genetics.112.143552. PMC 3430543. PMID 22964834. pp. 5–6: […] Punnett嘅方格似乎係1905年發展出嚟,太遲趕唔切擺喺佢《孟德爾遺傳學》第一版(1905年5月)入面,但喺《皇家學會進化委員會報告III》(Bateson等,1906年)已經見到好多例子。最早嘅提及係1905年10月1日Francis Galton寫畀Bateson嘅一封信(Edwards 2012)。Bateson(1909年,第57頁)曾經講過:「呢個方法嘅引入,簡化咗好多困難案例,我要多謝Punnett先生。」 […] 最早嘅圖表喺1906年發表。[…] 喺佢《孟德爾遺傳學》第二版(Punnett 1907年,第45頁),佢用咗一個有啲唔同嘅格式。[…] 喺第三版(Punnett 1911年,第34頁),佢又改返以前嘅排列,並且描述咗佢所講嘅『棋盤』方法(雖然實際上更似乘法表)。 […] (11 pages)
  25. Gao, J.Z.; Fong, D.; Liu, X. (2011年4月)。學分析賭場貴賓博彩回贈系統International Gambling Studies11 (1): 93–106。doi:10.1080/14459795.2011.552575S2CID 144540412
  26. Gorman, Michael F. (2010)。理見解理科學56: iv–vii。doi:10.1287/mnsc.1090.1132