】 【打 印】 
【 第1頁 第2頁 第3頁 】 
OpenAI放大招,港股相關概念大漲
http://www.crntt.hk   2024-02-17 14:34:05
 
  在這則60秒的視頻中,主人物一直在行走,背景街道中的景色及人物不斷變化,但是主人物保持高度連貫性。在Sora模型發布之前,Runway、Pika等AI視頻創業公司僅能做到幾秒左右的視頻連貫性。半年前,Runway將視頻長度從4秒提升至18秒,且將效果提升至4K超高清水平,已被業界視為“天花板”。然而,Sora模型將長度從18秒拉長至60秒的水平,且效果逼真、細節生動,將行業的水位提高到了難以企及的高度。

  二是可實現單視頻多角度鏡頭自然切換。在上述的“女子行走在東京街頭”視頻樣片中,後半段鏡頭由大全景切換至近景及人物臉部特寫,轉換十分絲滑。在另外一個視頻樣片中,一只狼對著月亮嚎叫,鏡頭也是從大全景自如地切換至中近景。同一個視頻中採用多個不同景別和角度的分鏡,且銜接自然毫無違和感,這是Sora模型令許多人感到驚艶的重要原因。

  三是超高清和超逼真。在時長大幅提升的同時,Sora模型生成的視頻保持高清的畫質和逼真的效果。人物臉部的皮膚特點、動物毛發的特徵都栩栩如生,細節處理上十分出色。

  不過,Sora模型並非盡善盡美。在OpenAI放出的視頻樣片中,就有不少Sora模型“擺烏龍”和“翻車”的例子。例如,在其中一個樣片中,提示詞為“一個人跑步的場景,35毫米電影膠片”,Sora生成的視頻搞反了人物在跑步機上跑步的方向;在另外一個樣片中,提示詞為“考古學家在沙漠中發現了一把普通的塑料椅子,正小心翼翼地挖掘和除塵”,Sora生成的視頻出現了椅子變形及自動行走等詭異的場景。

  OpenAI表示,目前Sora模型還有一些顯著的弱點,比如難以準確模擬複雜場景的物理特性、無法理解因果關係,還可能混淆提示詞的空間細節。一些業內人士也對Sora模型的實際效果提出了質疑,美國伊利諾伊大學厄巴納-香檳分校的教授Ted Underwood在接受媒體採訪時表示,OpenAI可能有選擇性地挑選了表現最好的視頻向公眾展示。

  目前,Sora模型尚未面向公眾開放。OpenAI的CEO山姆·奧特曼在社交平台表示,目前Sora正在開展紅隊測試(一種安全評估方法),僅面向少數人開放。據介紹,OpenAI正與相關領域專家合作,對Sora模型可能存在的錯誤信息、仇恨與偏見內容進行研究與測試,確保產品安全及符合人類倫理。 


 【 第1頁 第2頁 第3頁 】 


          
】 【打 印】 

 相關新聞: