「讓AI自己去玩遊戲,當AI做出需要獎勵的行動,例如獲得分數,就給予點數以資獎勵,這就是強化學習技術讓AI學習的方法。... 它的目標設定者沒有別人,還是人類,... 它還沒有變成像人類這樣會基於好奇等因素而去學習的裝置,它不會督促自己去設定目的或目標。」

人與機器的差別,即在所謂目標設定主動性。

到目前AI能做到的,就是透過更強的計算機所賦予更巧妙演算法下的更強運算工具,來更有效取得預設狀況下的「最佳解」,更進步快速的輔助過程,如此而已。

對機器而言,最佳解是一個分數,目標也依此設定,那對人而言,最佳解又是什麼?

這得先問什麼才是我們行為背後的動機獎勵?這其實本就是個廣泛到難以定義的問題,從有形的物質、健康,到無形的成就、偏好,都可以是我們本能追求的利益目標。

表面上,這個答案是發散性的、近乎無限可能的,但實際上,那盡是繞著以「我」為中心出發 (苦樂之別,更準確地說),由主觀性才能導出的非主觀性之投射體現(好比沒有函數”塌縮“,無從得知粒子動能下的確定位置)。端看我們自己主觀上如何定義之。

之前有說過,這些利益目標有著物質「非決定性」特質,天堂與地獄的場景可以完全一致,它並不是純粹基於物理的、肉身的大腦皮質神經網絡本身所運算出來的東西,有些決定甚至要求凌駕自我慾望之上、乃至自我毀滅,其層級間系統邏輯運行仍能一體順暢。

這是因為它的邏輯運行不是反映在神經元集群機械式的自行發散性演算輸出,而是反應在過程不斷override自我修正的大腦演算之上層統合收斂源:「自我意識」的目標揀擇。

沒有自我意識,機器如何在「開放系統」浩瀚的選擇中,自己找到所要的、所投射的目的與定義?如何不面臨永無止境的黑天鵝謬誤?

日本人會寫這種書,挺有趣的。
 

 

AI世代生存哲學大思考

 

 

undefined

 

 

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Riki 的頭像
    Riki

    RIKI の わびさび

    Riki 發表在 痞客邦 留言(0) 人氣()