11 May

再談大數據

Posted by No comments

這篇于 2020-04-05 在臉書發表

其實上一篇關於數據的東拉西扯沒有談到重點,不過反正不是學校考試,沒有人會給我零分。

數據預測的準確度最主要來自數據源,data source,的準確度與相關性。

但是你所看到的數據源並不一定就是最初的數據,通常的情況下它也是另一組數據中的平均值。

打個比方,電子溫度計測量體溫不像傳統水銀溫度計那樣能直接標出讀數。首先它必須選用對溫度非常敏感的金屬物質,而且必須是穩定的,這些物質統稱為熱敏電阻,thermistor。微小溫度的變化會改變物質的內阻,這種內阻變化能用電子儀器轉換成我們熟知的攝氏,Celsius,或華氏,Fahrenheit,溫度。

可是熱敏電阻跟溫度的對比並不是線性,linear,的,而是呈一個未知的曲線,直到今天科學家還是解不出這個內阻-溫度之間的方程式。不過在1968 年,兩位很厲害的科學家 John S. Steinhart and Stanley R. Hart (不知道他們的中文名),倒是導出了一組非常接近熱敏電阻曲線的複雜方程式組,程式中還有三組看起來就像亂碼的常數,constants。

重點來了,『非常接近』,而不是『絕對』。所以方程式內的三組常數,必須重複數千數萬甚至數十萬次的實驗來採取平均值。這樣所有所製造的電子溫度計測量的結果才不會有太大的誤差,errors。所以當我們說人體平均溫度為36.8 度時,我們不僅採用溫度計讀數的平均數,也採用溫度計內部所有電子零件的平均數、實驗本身的準確度、實驗設備的精確度,等等。在這種環環相扣的情況下,如果有一組的數據是錯的,整個後續數據都會變成垃圾。

好像又離題了。

Categories: 科學?魔法?
Tags:
11 May

大數據

Posted by No comments

這篇于 2020-04-23 在臉書發表

因為新冠病毒,所以有了這篇。

數據,data,準確嗎?這裡面最主要的關鍵詞是『機率』,probability,(或『幾率』,中國大陸用詞)。我比較偏向用『機率』,一方面是先入為主,另一方面這『機』字包含了『隨機』,random,這個含義,而『機率』就是建立在隨機數上。

數據不是『只是一組數字』而已。

先來談談隨機數。

骰子有六面,每一次扔骰子的結果都不能預測,除非是灌了鉛的。但是扔上數千次的時候,你會發現所有的數字出現的機率都近乎相等,就是六分之一,或 1.666… 。但是你不能因為有一個數字出現的機率少於 1.666..,就認為下一個開的機率就會比較大 。那麼容易的話大家發財了。

骰子無聊,用你感興趣的萬能大馬彩多多萬字。有人收集了過去幾十年的的號碼來分析下一期的號碼,結果。。那麼容易的話大家發財了。

所以,數據的準確性基本上是建立在很大的採樣量,sample size,上,越大的採樣量,數據就越準確,所以才有『大數據』這個概念。

人們很早就用數據解決問題,可是不知覺。就像草藥,都是大家吃啊吃的,慢慢就知道某些草藥能治這個那個,老人家說這是經驗,而科學是把它們記錄下來,變成數據。

2018 年 509 大選的時候,我曾經做過一個很無聊的統計,利用谷歌輸入“support BN”跟“support PR”,不去管搜索內容,只看兩者出現的搜索結果出現的數量,有趣的是結果為 49:51,跟選舉結果一樣,而且距離選舉日期越近,出現的數量越精確,由 61:39 的比例到 49:51的比例。你可以嗤之以鼻說這是過於簡單、毫無根據,但大數據往往只看結果,裡面固然有原因,可是複雜程度遠遠超越目前的計算能力。

同理,我們能預測氣候,climate,可是不能預測天氣,weather。我們能說十二月多雨,卻不能預測明天會不會下雨。因為氣候是大數據,天氣還不夠數。

更深一點,那個聽起來就是外星科學的量子論,它的基礎是建立在『波粒二象』,wave-particle duality,性質上。簡單來說就是我們認為的『粒子』,particle,有時不能用我們熟知的物質粒子的特性來解釋,也就是說不能把它看成像一粒鋼珠式的物質,只能用波動性質來解釋,像水波、聲波、電磁波。科學家做了無數次的實驗,數據上證明了這個特性,可是解釋不來,只有接受。而建立在這個奇怪理論上的科技有電腦、行動電話、衛星定位,核磁共振掃描,MRI,等等。如果數據不准確,這篇文章只能在阿公打字機上打出來。

還有那個歐洲核子研究組織,CERN,所建的、橫跨法國跟瑞士邊界,圓周總長27公里的大型強子對撞機,Large Hardon Collider,所做的實驗。。。這裡就不提這種昏昏欲睡的話題了。

大數據很多時候在不能解釋的前提下解決了很多目前利用計算解決不了的問題,這就是我們常說的『科學解釋不了』。但很多人把這句『科學解釋不了』亂用在宗教或偽科學上,往往一句『科學解釋不了』就把問題強掃入地壇地下。鬼魂為甚麽有衣穿?難道衣服也有靈魂?科學解釋不了!

『科學解釋不了』還是需要數據的支撐。

Categories: 科學?魔法?
Tags:
11 May

海盜灣

Posted by No comments

這篇于 2020-03-30 在臉書發表

最近有很多過去的影片被人翻出來搬上網,有一套甚至還成為海盜灣的十大下載影片之一,皆因影片裡面神準的預測了新冠病毒的發生。其中一個是韓國影片。

來探討一下這韓國影片神準預測背後令陰謀論者失望的原因。

首先,影片中提到了『冠狀病毒』,Coronovirus。這個名詞刺激到了很多人的敏感神經線,因為它目前帶來的影響頗大,所以這影片才會被注意。但是『冠狀病毒』不是『新冠病毒』的專有名詞,而是病毒分類學的其中一科。冠狀病毒科下包含了我們所知的普通感冒(Common flu)、嚴重綜合呼吸症(SARS)、中東呼吸綜合症(MERS)、以及這個新冠病毒(COVID-19)。之所以稱『冠狀』是因為它的觸角在顯微鏡下看來長得像皇冠,就這麼簡單。

SARS 發生在 2002 年,MERS 發生在 2012 年,影片自然是在這些疫情之後拍的。當一個編輯也要做功課,不能過於天馬行空,藉一些著名實際歷史事件可以讓影片更貼近觀眾,所以用冠狀病毒 Coronavirus 並非神準預測。

但影片中百分之九十的死亡率,90% mortality rate,就一點都不準,可是沒有人去理他(人總是有選擇性注意力)而把注意力放在二到十四天的發病期,但有誰去找一找看看發現到SARS 的發病期也是二到十四天,MERS 是二到七天。即使普通感冒一般也需要四到十天。

然後裡面七竅流血也是一點都不實際,但也被忽略過去,只把『新冠病毒也一樣很恐怖』這個感覺放大。

影片其它傳播媒介等等都是所有病毒的基本傳播方式,沒甚麽好說的。那麼危險的病毒是人造生化武器當然只是影片橋段,不要太過陰謀論。

不要向我要影片,因為我不推崇陰謀論跟偽科學。

Categories: 科學?魔法?
Tags:
28 Mar

淺談病毒

Posted by No comments

這篇于 2020-03-28 在臉書發表

抗生素對新冠病毒沒有效。我就從這個課題淺淺切入,紙上談兵一下病毒(virus)跟細菌(bacteria)的分別,因為太深奧的我也不懂。

讓生物生病的病原體基本上有兩種,細菌跟病毒,兩者都有你我熟悉的脫氧核糖核酸,DNA。細菌跟所有生物的結構都大同小異,是由細胞構成,它是單細胞生物。病毒呢,在生物學上甚至不能算是生命體,最大原因就是它沒有細胞,只被一層蛋白質包圍著。沒有細胞基本上表示不能自我繁殖,所以需要依附在某個宿主,利用宿主的細胞來繁殖。

這意味了甚麽呢?細菌像其他生物一樣尋找獵物進食,所以被侵蝕的對象可以很快變得嚴重死亡。病毒呢,由於需要依靠宿主繁殖,所以宿主的發病期通常都比較長,這讓病毒有機會繁殖,然後透過咳嗽噴嚏等途徑傳播到其他宿主身上。

目前所有的抗生素(antibiotic)都是針對破壞細菌的細胞而研製的,但既然病毒沒有細胞,又何來破壞?

人體對細菌跟病毒的反應其實是大同小異的,只是因人而異,以及不同層度的反應而已。發燒是自身免疫系統對入侵的外來體做出的反應,大部份的病毒細菌都會被這高一度的溫度殺死。鼻涕兼打噴嚏跟痰兼咳嗽這兩者的目的都是一樣的,就是將侵略者用黏膜包起來往外丟,越遠越好,所以當你很用力打噴嚏的時候,你會覺得很舒服。不要笑,這些都是生物幾億年來演化的本能。

不要太相信你看到的圖表說啊我沒有發燒咳嗽所以不是這個那個病,這些圖表列出的都是統計上的數字,不代表你自身的病情。看圖表就知道病情,我明天掛牌來當醫生好了。有病還是要看醫生,讓醫生告訴你你犯了甚麽大忌,或是招惹到哪路煞神。

當你傷風感冒去看醫生的時候,當然可以財大氣粗的要求檢驗是細菌還是病毒,但那花時間金錢,一般診所都不會去做。除非你死皮賴臉的要醫生幫你做,有經驗的醫生或許不會給你抗生素,因為不確定是細菌還是病毒,只叫你回家休息,讓自身免疫系統對抗侵略者,除非你看起來快要死了。懶惰的愛錢的或是被病人煩到半死的醫生會有殺錯沒放過的給你抗生素,反正即使錯了,抗生素也不會吃死人。

問題來了,當大量的抗生素殺死大量的細菌時,本來被壓抑著的、能稍稍抵抗抗生素的變種細菌由於少了競爭對手(是的,當然,物競天擇的條件下,細菌也在競爭)突然間爆發式的繁殖,變成超級細菌,把抗生素當食物吃。到那時候,所有人又要居家待業了。這就是為甚麽世界衛生組織都呼籲不要有事沒事就吃抗生素,如果非吃的話,必須確保把細菌根除,降低變種細菌演化的可能性。

Categories: 科學?魔法?
Tags:
22 Feb

漢子、鐵鍋、雜貨舖

Posted by No comments

雜貨舖、小鎮。
短髮、身材瘦小的老闆娘,六十開外
目光如炬
門外緩緩走進一人
看似潦倒、不修邊幅,一星期沒有剃的鬍鬚
雙目一瞄,老闆娘迎了上去
買什麼
鍋、炒菜的鍋

有鋁鍋有鋼鍋有中國貨有台灣貨
有沒有鐵鍋
老闆娘雙眉一揚,上下打量這名潦倒漢子
左手叉腰,右手放在鐵架子上,老闆娘問
買鐵鍋幹嘛
漢子似乎愣了一下
炒菜
做生意的嗎

那買鐵鍋幹嘛, 沒有
我們
有鋁鍋有鋼鍋有中國貨有台灣貨
漢子遲疑著
看來這樁生意吹了,老闆娘轉頭去招呼更有潛能的顧客
漢子隨手摸了摸架子上的器皿
咦?黑烏烏的鍋子
這不是鐵鍋嗎?
拿去,朝外頭的老闆娘走去
哎呀,這是鍍了漆的鍋
看看漢子似乎不放棄的樣子,老闆娘嘆了一口氣
來來來,從灰濛蒙的架子底層拉出一個滿是銹跡的鐵鍋
漢子了解
哪個鍋品質好?
有鋁鍋有鋼鍋有中國貨有台灣貨

原來還有所謂開鍋這回事

開吧開吧


Categories: 胡天胡地
Tags: