以動畫取代照片 日AIST提高AI學習效果

物聯網DIGITIMES(連結)
范仁志
2019-01-30

AIST看上動畫內藏龐大學習資料量,發展AI動畫學習技術。圖為一堆人跑步照片,若此照片換成影片,一小段影片就可得到大量學習資料。法新社

深度學習開啟人工智慧(AI)發展的第3波,讓IT業界再度投注大量精力於研發人工智慧應用,而學習需要大量資料的問題,帶動各種新研究,現在日本產業技術綜合研究所(AIST)進行新的學習技術研發,利用影片等動態畫面的動畫學習方式,以利加速動態相關應用的學習。

所謂動態相關應用,比方體育訓練方面,讓人工智慧學習如何判斷怎樣的姿勢跑步速度可以加快,但怎樣的姿勢可能會跌倒,現在以靜畫為主的學習技術,需要準備大量與跑步姿勢有關的圖片,並輸入若干速度等資料,但動畫的話,只要準備1小段不同速度以及不小心跌倒的影片,就有同樣效果。

這個技術首先能應用的領域,就是機器人與自動駕駛車,學習何種狀況可能摔倒或翻車,以及何種狀況可能打傷在身旁的人、或撞上附近汽車,應用動畫讓人工智慧自行分析相對速度及角速度,無疑更加直覺。

雖然動畫內藏資訊量遠高於靜畫,但因學習主體隨時在動作,因此人工智慧對需學習的影像主體辨識率,低於靜畫的辨識率,比方播放網球比賽影片,讓人工智慧學習網球規則與比賽技巧時,人工智慧有時會把運動衣視為主體,無視選手,這種辨識錯誤成為主要問題。

動畫內藏資訊量高於靜畫,倒過來說,就是將動畫學習資料變成資料庫時,資料量與資料種類也都遠高於靜畫,如何有效進行資料歸納,是避免辨識錯誤的重點。

現在產業技術綜合研究所負責研究動畫辨識學習的部門,智慧系統研究部門的副研究部門長佐藤雄隆表示,他們用產業技術綜合研究所的人工智慧用超級電腦AAIC,以30萬組動畫資料進行152層學習2個月,目前對動畫內容意義的辨識正確率,已達74%。

但是正確辨識只是學習的第一步,比方學習打網球,目的是發展網球機器人,如何把學到的網球規則,或者是物流人員與工廠員工的動作,變成機器人的控制程式,才能發展適當的產業應用,這是下一個挑戰。