記者19日從字節(jié)跳動(dòng)獲悉,豆包App視頻生成能力升級(jí),支持Seedance1.5 Pro模型,可一鍵生成聲音和畫面相匹配的有聲視頻。
記者發(fā)現(xiàn),打開豆包App對(duì)話框,選擇“照片動(dòng)起來”,上傳圖片并輸入提示詞,選擇“1.5 Pro”模型,已經(jīng)可以體驗(yàn)到該功能。
據(jù)字節(jié)跳動(dòng)Seed官網(wǎng)介紹,Seedance 1.5 Pro是其新一代音視頻創(chuàng)作模型,依托原生音視頻聯(lián)合架構(gòu)與精細(xì)化后訓(xùn)練,Seedance 1.5 pro 較好地實(shí)現(xiàn)了對(duì)多模態(tài)指令的遵循。
據(jù)悉,該模型可實(shí)現(xiàn)精準(zhǔn)音畫同步,實(shí)現(xiàn)較高的視聽一致性,且支持多種語言和地方方言口音,能夠捕捉其獨(dú)有的語音韻律與情感張力。
豆包Seedance1.5 Pro具有電影級(jí)運(yùn)鏡控制與動(dòng)態(tài)張力,具備自發(fā)的鏡頭調(diào)度能力,也能實(shí)現(xiàn)電影級(jí)的畫面銜接與專業(yè)影調(diào),大幅提升了視頻的動(dòng)態(tài)張力。
此外,語義理解與敘事協(xié)調(diào)性增強(qiáng),實(shí)現(xiàn)了對(duì)敘事語境的精準(zhǔn)解析。它顯著提升了音視頻段落的整體敘事協(xié)調(diào)性,為專業(yè)級(jí)內(nèi)容創(chuàng)作提供有力支撐。
Seedance 1.5 Pro 模型對(duì)視聽協(xié)同、動(dòng)態(tài)調(diào)度和文化語境的精準(zhǔn)掌握,使其在影視創(chuàng)作、短劇生成、廣告生產(chǎn)及戲曲演繹等場(chǎng)景中,均展現(xiàn)出較好的敘事表現(xiàn)力與視聽融合度。
2025年6月,視頻生成模型Seedance1.0 Pro正式發(fā)布,支持文字與圖片輸入,可生成多鏡頭無縫切換的高品質(zhì)視頻,主體運(yùn)動(dòng)穩(wěn)定性與畫面自然度較高。
同時(shí),即夢(mèng)AI也上新Seedance 1.5 pro,支持聲音、畫面同步生成。
具體來看,即夢(mèng)AI網(wǎng)頁版官宣全面升級(jí),打造一站式“AI片場(chǎng)”。本次更新涵蓋了核心模型能力、交互方式及創(chuàng)作流程等,旨在為用戶提供從靈感到成品的全流程創(chuàng)作支持,讓創(chuàng)意海報(bào)、專業(yè)視頻乃至AI漫劇、AI短片的制作變得更加高效便捷。
此次升級(jí)的核心亮點(diǎn)之一,是即夢(mèng)AI最新視頻生成能力“視頻 3.5 Pro”。該模型基于字節(jié)自研模型Seedance 1.5 pro,在即夢(mèng)AI全球首發(fā)上線。視頻 3.5 Pro 支持視頻與音頻同時(shí)生成,人物口型、樂器演奏、環(huán)境音效等元素?zé)o需再后期配音,大幅提升了視頻的真實(shí)感與沉浸感。該模型在遵循復(fù)雜指令方面表現(xiàn)優(yōu)異,能精準(zhǔn)響應(yīng)運(yùn)鏡調(diào)度、動(dòng)作幅度及光影氛圍等要求,并對(duì)中文發(fā)音口型、面部微表情乃至多種方言生成提供了更強(qiáng)支持。
除了模型能力的提升,即夢(mèng)AI網(wǎng)頁版還將迎來全新UI,升級(jí)畫布、agent等功能的交互方式。
字節(jié)跳動(dòng)方面表示,本次全面升級(jí)標(biāo)志著即夢(mèng)AI網(wǎng)頁版正致力于將復(fù)雜的AI創(chuàng)作工具整合為直觀、高效的一站式“AI片場(chǎng)”,通過打包從靈感、畫面、視頻到長(zhǎng)鏡頭的全流程能力,助力創(chuàng)作者將每一個(gè)天馬行空的創(chuàng)意轉(zhuǎn)化為異彩紛呈的作品。