120, 還原
除語言、棋路等大數據學習,AI突現出一種人類難以琢磨的另類理解外,在X光片的判斷上、在辨識人臉上、在動植物品區分、蛋白質摺疊、可控磁流、天氣預報、電子遊戲、. . .,AI同樣展現出一種非常人的新直覺。
我們處理不來,只能說這是直覺,當一一剖析,那也是無數解構後的神經元共同作用的結果。它並不神秘,但很複雜,無法言說。言語本來就有邊界,無法描述所有一切。而偏偏人類是被語言規訓,沒有語言就不會思考了。
AI同樣可以作用於甲骨文的修復、古文物的還原,還能用來幫助破解2500年前用楔形文字寫成的文本。一樣是訓練,給它足夠的資料,它自己會去認識,補足缺失的部分,做出它的判斷,正確率相信也能超越專家。
AI從不同視野維度,用人類無法企及的方式切入,造就出完全不同的解題思路。還開始幫數學家證明定理了。
好吧!AI這麼牛,那來解馬賽克啊!
別說,還真有。
先說一個在2022年某人發起的USD千元挑戰,要求把以下圖片的英文字給還原回來。
這. . .可能嗎?某人認為一個被模糊化後的圖片,已經丟失很多了訊息,這些訊息基本是無法還原的。不然,信息論不就要被推翻了?
是嗎?有人接了這挑戰。思路是這樣,讓電腦自己生成很多文字圖片,馬賽克化,調整尺寸與該謎圖一致,於是便可以產生百千萬億類似圖片。再來,用機器學習,學習恢復馬賽克圖片,對比正確文字提高準度。經過一段時間學習,對謎圖來一次破譯。
你以為一串英文的馬賽克只是三像素的方塊的橫列,殊不知,方塊的相對位置,色塊的深淺,都是訊息。雖說初步效果不佳,但隨著不斷調整,機器學習越來越多,精準度提高,於是,輸出了以下
這肉眼多少能辨認一些英文字了。但還不夠。接下來,我們知道字詞肯定要有意義,是字典中存在的字,亂碼字不考慮進來;單詞之間也有關係,也不能不合文法;再有,就是字體本來就有很多款,有代表性的安排進來。
還有,這馬賽克是怎麼打的?實際上也有不同。把上圖已經識別出來的文字(第二行VULNERABILITY是有意義字彙),讓機器自行找打碼的規律,再與原謎圖對比,找最大相似性。於是,馬賽克的打碼規則,也就清楚了。
以上,重新來一次再學習,使用準打馬賽克方式、意義字詞限定、文法限制、字體指定等等,最後經過19天的機器學習。挑戰者成功復原了原話。
這還是兩年前的帖子,現在呢?所以,打〝薄碼〞的證件訊息,還是有可能被破解的。
好的,我知道大家要問的不是文字的去碼,是視頻去擬碼的。這可是大家少年時的夢想,萬惡的視頻誤導小朋友還以為那地方長得像霧像方塊狀。
一段模糊動態視頻的像素能提供的資訊可就太多了,一禎一禎是各單獨畫面,一禎禎前後關係也可以運用,還可以加上特定畫面的限制,平滑化 (總不能是直角銳角的,特性化(把不可能存在於該場景的通通排除)。
管你是蛤蠣、木耳、蘑菇、松茸,通通用大數據把各式各樣的形狀學習個遍,取相似性套用。啥?跟原版的不像?不像有關係嗎?不像或許更好,粉紅色蛤蠣、漂白黑木耳、小蘑菇秒變青筋暴走大松茸。疊加改青龍變白虎的畫面效果,相得益彰。
這部分的研究,請自行找資源。Depix. . .
我還聽過,有奇人通過街邊監控的遠處模糊視頻,還原出嫌疑人的相貌,與實際的樣子有七八分像。原來也有人腦可以做到類似的效果,少年啊只會腦補島國動畫片的特殊部位。