(本文轉載自PTT Marvel版,經由作者授權同意轉載,如需另轉請務必詢問原作者本人,請勿自行轉載)
作者chikura (千藏)
看板marvel
標題[翻譯] 日本怪談:臉孔辨識
時間Fri Dec 12 21:13:02 2014
關鍵詞:毛骨悚然、科技的恐怖
出處 http://fumibako.com/kowai/story/6/5809.html
顔認識:特選怖い話-最恐怖い話まとめ
這個故事不是可怕得要命那種,大概只會讓人背後一僵,但卻是我遇過最恐怖的事。
剛才在電視上看到相關話題我才想起來。
好幾年前,我是一間公司某研究團隊的成員,
不過不是穿著白袍擺弄藥品的那種研究工作。
我們做的是「攝影機臉孔辨識系統與應用」的研究。
把應用軟體放進一台主電腦裡,然後再輸入各地防盜攝影機的畫面,
辨識臉孔後就能自動生成「ID:00001從X→Y→Z移動」這樣的資料。
但這在當時就已經很普遍了,所以會在這個臉孔辨識軟體的基礎上一步步加上其他功能。
不過我們是亂槍打鳥啦。
一開始致力研究的是「年齡推斷」功能,大家應該聽過吧?
原理就跟氣象預報一樣,事先把幾千組臉孔跟年齡的組合輸入電腦,
辨識完臉孔後再對照這份「正確解答」就能計算出估計值。
方法很單純但精確度很高,在實驗階段就有四成上下完全正確,
誤差值在正負八歲左右,實在是很有意思。
但我們還要繼續類似年齡推測的種種挑戰,努力創造更獨特的功能。
所幸我們手邊有大量的臉孔照片和個人資訊,可以做各種嘗試,
像是姓名、學歷、出身地……等等等等。
預測姓名實在沒辦法,那麼離散的東西電腦無法理解。
但「學歷推測」(分國中畢業、高中畢業、大學畢業、一流大學畢業四組)
非常令人驚訝,有高達六成的正確率。
出身地也是,將北海道到沖繩的連續數據輸入電腦(都道府縣等級)
就有將近10%的正解率。
不要想說「才十趴啊」,這樣就夠驚人的了。
推測年齡人類大致也辦得到,但推測出身地大概就沒人能十次猜中一次了。
重點是要有足夠的樣本數電腦的推測就能更準確。
到這裡都是前言,正文現在開始。
某天團隊裡一個相當瘋狂的科學家(就叫他A)提出「我們來做「餘命推測吧」。
應該是受到當時紅極一時的死亡筆記本的影響吧,
但個人資料樣本裡當然不會有「餘命」這一欄。
「就用知道拍攝年分和死亡年分的歷史人物照片啊,
雖然是黑白的但對辨認精確度沒什麼影響吧?」
當然跟彩色照片相比解析度較低,但在臉孔辨認上幾乎不成問題。
不過這樣一來樣本數不足。
「只要知道臉孔、拍攝日期和死亡日期就好了,
所以天災和意外死亡的被害者也用進去吧。」
等等,這樣因外界因素死亡的樣本不就混進去了?
「沒關係啦!(.∀.)」A笑著說。
看來這傢伙不是打算「從相貌推測人的健康狀態」,
而是要讓電腦做馬路旁算命師的工作吧。
要使用死者的樣本心裡多少有點抗拒,但我們都是好奇心旺盛的傢伙,
還是立刻著手進行。
每天一點一滴的輸入照片和「死亡日期-攝影日期=餘命」,
幾週後樣本數就到達了兩千。
然後就是實際測試,只是不知道「正確答案」所以沒辦法計算誤差值。
第一隻白老鼠是我,啟動系統後我站在相機前。
很快就鎖定臉孔,停格數秒後輸出的答案是……「60」。
嗯,以男性的平均壽命八十歲來說,這條線說不定可行?
忘了說,我們都是二十歲出頭,只有組長三十幾歲。
其他成員一個接一個測試,但樣本數果然不足,答案參差不齊。
23、112、75、42……答案非常混亂。
其中最震撼的是A,他被電腦判斷「餘命0年」。
果然要讓電腦模仿算命師是不可能的。
但都手動輸入兩千筆資料了,不可能就這樣封存。
當晚我們用自動生成模式讓電腦讀取存在公司伺服器裡各地的攝影機畫面。
第二天,電腦吐出了幾千筆辨識結果。
統計處理後,得到一個很有意思的結果。
攝影場所不同,估計值也有大幅度的差距。
例如在讀取的影像中,
在小學的攝影機畫面餘命推測平均值是「106」(大概的數值,以下同)。
與總平均值「46」相比有極大的差距。
反過來說,第一個出現比總平均值低的是在休息站拍到的畫面,那裡的平均值是「38」。
是說開車的人比較短命嗎?
接下來平均值逐漸減少。
平均餘命倒數第二的是縣內的一間老人院,平均值「15」。
倒數第一呢?你應該猜到了,是醫院,平均值竟然是「4」!
不過等等,就算是醫院,平均餘命四年還是不對吧?
也有很多未來還很長的小孩,在社團活動受傷被送到醫院啊。
大概有哪裡出包了吧?我們去參考原始數據,結果一片嘩然。
「ID:1234 VALUE:34(←這個是推測餘命)……」這行字出現在螢幕上,
但也有好幾個不該存在的數字混在「34」、「50」等普通數字中。
就是負數。
保險起見,我們也確認過其他地方的數據,每處都有兩、三個負數,但沒有醫院那麼多。
從字面上解釋的話,「餘命負3年」就是「過世3年」的意思。
因為餘命負數的人極端地多,所以餘命平均值被大幅拉低了。
……雖然努力想保持冷靜,但全身還是汗如雨下。
後來我們團隊討論過,卻只得到討厭的結論。
不是「因為餘命推測的誤差過大所以不可信」,
就是……「我們周圍有餘命負數的傢伙若無其事的走來走去」。
當然最後採用的是前者,適當地寫份「利用臉孔辨識調查健康狀態」的報告書交給上級
(這是從以前就預定好的),這份企劃就葬送在黑暗中了。
我每天都會和幾百個人擦身而過,視線交會。
該怎麼肯定裡面沒有「餘命負數的臉」呢?
該怎麼肯定裡面沒有「餘命負數的臉」呢?
哦,忘了說一件重要的事……
A在被電腦判斷「餘命0年」後不到一年,真的死了。
在通勤人潮中從月台一躍而下。
為什麼電腦能預測這件事?
完全不曉得。
電腦能得知的情報而只「樣本」和「對象的臉孔」而已。
但事實就是A如電腦判斷地死了。
有個詞叫「死相」。
有些「能力者」就是能知道人快死了。
我不想相信不科學的事情,但這次的事件之後,
我覺得為防盜攝影機和人群恐怖得不得了。
如果不是有生命危險或絕對必要的話,我也不會靠近醫院。
(完)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.73.55.100
※ 文章網址: http://www.ptt.cc/bbs/marvel/M.1418389987.A.9D1.html
作者chikura (千藏)
看板marvel
標題[翻譯] 日本怪談:臉孔辨識
時間Fri Dec 12 21:13:02 2014
關鍵詞:毛骨悚然、科技的恐怖
出處 http://fumibako.com/kowai/story/6/5809.html
顔認識:特選怖い話-最恐怖い話まとめ
這個故事不是可怕得要命那種,大概只會讓人背後一僵,但卻是我遇過最恐怖的事。
剛才在電視上看到相關話題我才想起來。
好幾年前,我是一間公司某研究團隊的成員,
不過不是穿著白袍擺弄藥品的那種研究工作。
我們做的是「攝影機臉孔辨識系統與應用」的研究。
把應用軟體放進一台主電腦裡,然後再輸入各地防盜攝影機的畫面,
辨識臉孔後就能自動生成「ID:00001從X→Y→Z移動」這樣的資料。
但這在當時就已經很普遍了,所以會在這個臉孔辨識軟體的基礎上一步步加上其他功能。
不過我們是亂槍打鳥啦。
一開始致力研究的是「年齡推斷」功能,大家應該聽過吧?
原理就跟氣象預報一樣,事先把幾千組臉孔跟年齡的組合輸入電腦,
辨識完臉孔後再對照這份「正確解答」就能計算出估計值。
方法很單純但精確度很高,在實驗階段就有四成上下完全正確,
誤差值在正負八歲左右,實在是很有意思。
但我們還要繼續類似年齡推測的種種挑戰,努力創造更獨特的功能。
所幸我們手邊有大量的臉孔照片和個人資訊,可以做各種嘗試,
像是姓名、學歷、出身地……等等等等。
預測姓名實在沒辦法,那麼離散的東西電腦無法理解。
但「學歷推測」(分國中畢業、高中畢業、大學畢業、一流大學畢業四組)
非常令人驚訝,有高達六成的正確率。
出身地也是,將北海道到沖繩的連續數據輸入電腦(都道府縣等級)
就有將近10%的正解率。
不要想說「才十趴啊」,這樣就夠驚人的了。
推測年齡人類大致也辦得到,但推測出身地大概就沒人能十次猜中一次了。
重點是要有足夠的樣本數電腦的推測就能更準確。
到這裡都是前言,正文現在開始。
某天團隊裡一個相當瘋狂的科學家(就叫他A)提出「我們來做「餘命推測吧」。
應該是受到當時紅極一時的死亡筆記本的影響吧,
但個人資料樣本裡當然不會有「餘命」這一欄。
「就用知道拍攝年分和死亡年分的歷史人物照片啊,
雖然是黑白的但對辨認精確度沒什麼影響吧?」
當然跟彩色照片相比解析度較低,但在臉孔辨認上幾乎不成問題。
不過這樣一來樣本數不足。
「只要知道臉孔、拍攝日期和死亡日期就好了,
所以天災和意外死亡的被害者也用進去吧。」
等等,這樣因外界因素死亡的樣本不就混進去了?
「沒關係啦!(.∀.)」A笑著說。
看來這傢伙不是打算「從相貌推測人的健康狀態」,
而是要讓電腦做馬路旁算命師的工作吧。
要使用死者的樣本心裡多少有點抗拒,但我們都是好奇心旺盛的傢伙,
還是立刻著手進行。
每天一點一滴的輸入照片和「死亡日期-攝影日期=餘命」,
幾週後樣本數就到達了兩千。
然後就是實際測試,只是不知道「正確答案」所以沒辦法計算誤差值。
第一隻白老鼠是我,啟動系統後我站在相機前。
很快就鎖定臉孔,停格數秒後輸出的答案是……「60」。
嗯,以男性的平均壽命八十歲來說,這條線說不定可行?
忘了說,我們都是二十歲出頭,只有組長三十幾歲。
其他成員一個接一個測試,但樣本數果然不足,答案參差不齊。
23、112、75、42……答案非常混亂。
其中最震撼的是A,他被電腦判斷「餘命0年」。
果然要讓電腦模仿算命師是不可能的。
但都手動輸入兩千筆資料了,不可能就這樣封存。
當晚我們用自動生成模式讓電腦讀取存在公司伺服器裡各地的攝影機畫面。
第二天,電腦吐出了幾千筆辨識結果。
統計處理後,得到一個很有意思的結果。
攝影場所不同,估計值也有大幅度的差距。
例如在讀取的影像中,
在小學的攝影機畫面餘命推測平均值是「106」(大概的數值,以下同)。
與總平均值「46」相比有極大的差距。
反過來說,第一個出現比總平均值低的是在休息站拍到的畫面,那裡的平均值是「38」。
是說開車的人比較短命嗎?
接下來平均值逐漸減少。
平均餘命倒數第二的是縣內的一間老人院,平均值「15」。
倒數第一呢?你應該猜到了,是醫院,平均值竟然是「4」!
不過等等,就算是醫院,平均餘命四年還是不對吧?
也有很多未來還很長的小孩,在社團活動受傷被送到醫院啊。
大概有哪裡出包了吧?我們去參考原始數據,結果一片嘩然。
「ID:1234 VALUE:34(←這個是推測餘命)……」這行字出現在螢幕上,
但也有好幾個不該存在的數字混在「34」、「50」等普通數字中。
就是負數。
保險起見,我們也確認過其他地方的數據,每處都有兩、三個負數,但沒有醫院那麼多。
從字面上解釋的話,「餘命負3年」就是「過世3年」的意思。
因為餘命負數的人極端地多,所以餘命平均值被大幅拉低了。
……雖然努力想保持冷靜,但全身還是汗如雨下。
後來我們團隊討論過,卻只得到討厭的結論。
不是「因為餘命推測的誤差過大所以不可信」,
就是……「我們周圍有餘命負數的傢伙若無其事的走來走去」。
當然最後採用的是前者,適當地寫份「利用臉孔辨識調查健康狀態」的報告書交給上級
(這是從以前就預定好的),這份企劃就葬送在黑暗中了。
我每天都會和幾百個人擦身而過,視線交會。
該怎麼肯定裡面沒有「餘命負數的臉」呢?
該怎麼肯定裡面沒有「餘命負數的臉」呢?
哦,忘了說一件重要的事……
A在被電腦判斷「餘命0年」後不到一年,真的死了。
在通勤人潮中從月台一躍而下。
為什麼電腦能預測這件事?
完全不曉得。
電腦能得知的情報而只「樣本」和「對象的臉孔」而已。
但事實就是A如電腦判斷地死了。
有個詞叫「死相」。
有些「能力者」就是能知道人快死了。
我不想相信不科學的事情,但這次的事件之後,
我覺得為防盜攝影機和人群恐怖得不得了。
如果不是有生命危險或絕對必要的話,我也不會靠近醫院。
(完)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.73.55.100
※ 文章網址: http://www.ptt.cc/bbs/marvel/M.1418389987.A.9D1.html
沒有留言:
張貼留言
歡迎大家留言討論