萬字長文:AIGC 技術與應用全解析(下)

AIGC 的應用場景
有哪些?

AIGC 在傳媒行業應用

如上圖爲 AI 在媒體行業應用架構,包括生成、審覈、分發運營、創新應用以及媒資管理。以上架構總體上分爲兩部分:AI 內容生成(AIGC)與 AI 內容分析。AIGC 在媒體行業能做什麼?

採集環節

藉助語音識別技術將語音實時轉換爲文本,壓縮稿件生產過程中的重複性工作,提高內容生產效率。採用智能寫作機器人,提升新聞資訊寫作的時效性。

編輯環節

採用 AIGC 技術對視頻畫質修復與增強,提升視頻質量。此外,可利用 AIGC 技術對視頻場景識別,實現智能視頻剪輯。如人民日報社利用 “智能雲剪輯師” 並能夠實現自動匹配字幕、人物實時追蹤與畫面抖動修復等功能。2022 冬奧會期間,央視視頻通過 AI 智能內容剪輯系統,高效生產與發佈冰雪項目視頻集錦內容。

播報環節

AI 合成主播開創了新聞領域實時語音及人物動畫合成的先河,只需要輸入所需要播發的文本內容,計算機就會生成相應的 AI 合成主播播報的新聞視頻, 並確保視頻中人物音頻和表情、脣動保持自然一致,展現與真人主播無異的信息傳達效果。

AI 合成主播

AIGC 在影視行業應用

在前期創作階段,AIGC 可通過對海量劇本進行學習,並按照預定風格生成劇本,創作者可進行二次篩選與加工,激發創作靈感,縮短創作週期。

在中期拍攝階段,可通過人工智能合成虛擬場景,將無法實拍或成本過高的場景生成出來,提升視聽體驗。比如,在拍攝前,進行大量場景素材收集與建模製作虛擬場景,演員在綠棚中進行拍攝,根據實時人員識別與摳圖技術,將人物嵌入至虛擬場景中進行融合,生成最終視頻。

在後期製作階段,可結合 AIGC 技術對視頻畫質進行增強,若視頻中出現 “劣跡藝人” 等敏感人員可通過 “人臉替換”、“人聲替換” 對視頻進行編輯。此外,製作者可利用 AI 技術自動對視頻片段進行剪輯,縮短視頻預告片、片段集錦的製作時間。

AIGC 在電商行業應用

在商品展示環節:AIGC 生成 3D 模型用於商品展示和虛擬適用,提升線上購物體驗;

在主播打造環節:打造虛擬主播,賦能直播帶貨;

在交易場景環節:虛擬商城構建,智能聊天機器人,賦能線上和線下秀場加速演變,爲消費者提供全新的購物場景。

AIGC 在娛樂行業應用

全民娛樂:在圖像內容生成應用(人臉美妝、融合;黑白圖像上色、圖像風格轉換、人像屬性變換)

社交互動:虛擬主播、虛擬網紅、聊天機器人、聊天互動遊戲。

AIGC 在其他行業應用

在教育行業:AIGC 爲教育工作者提供了豐富的教學工作與內容素材。比如,在通過數字人生成技術,可對歷史人物進行生成並與之對話,提升課堂互動。再比如,通過 ChatGPT 生成創意性教學方案,提供更加廣泛的授課思路。

在工業行業:將 AIGC 技術融合工業設計軟件 CAD,Solidworks 中,通過文本輸入提示語生成,特定樣式的機構模型供設計者參考。比如 “設計一款衛星太陽能電池板可伸縮折翼機構” 通過 AIGC 模型生成 3D 設計機構。

AIGC 在內容生成行業的突破,將提升內容創作者,設計師,工程師,教育工作者等各行業人員工作效率與質量。同時,將加速企業數字化與智能化進程。

AIGC 的產品形態
有哪些?

AIGC 產業生態體系

基礎層(模型服務)

基礎層爲採用預訓練大模型搭建的基礎設施。由於開發預訓練大模型技術門檻高、投入成本高,因此,該層主要由少數頭部企業或研發機構主導。如谷歌、微軟、Meta、OpenAI、DeepMind、Stability.ai 等。基礎層的產品形態主要包括兩種:一種爲通過受控的 api 接口收取調用費;另一種爲基於基礎設施開發專業的軟件平臺收取費用

中間層(2B)

該層與基礎層的最主要區別在於,中間層不具備開發大模型的能力,但是可基於開源大模型等開源技術進行改進、抽取或模型二次開發。該層爲在大模型的基礎上開發的場景化、垂直化、定製化的應用模型或工具。在 AIGC 的應用場景中基於大模型抽取出個性化、定製化的應用模型或工具滿足行業需求。如基於開源的 Stable Diffusion 大模型所開發的二次元風格圖像生成器,滿足特定行業場景需求。中間層的產品形態、商業模式與基礎層保持一致,分別爲接口調用費與平臺軟件費

應用層(2C)

應用層主要基於基礎層與中間層開發,面向 C 端的場景化工具或軟件產品。應用層更加關注用戶的需求,將 AIGC 技術切實融入用戶需求,實現不同形態、不同功能的產品落地。可以通過 網頁、小程序、羣聊、app 等不同的載體呈現。

總結:基礎模型與預訓練大模型的發展,促使 AIGC 迎來質變期與大規模應用期,未來隨着核心技術演進、產品形態豐富、場景應用多元化、生態建設的日益完善,AIGC 將充分釋放應用價值與商業潛力。

參考文獻:

  1. 人工智能內容生成(AIGC)白皮書(中國信息通訊研究院 & 京東探索研究院)

  2. AIGC 發展趨勢報告 2023(騰訊研究院)

  3. Denoising Diffusion-based Generative Modeling: Foundations and Applications(Google Brain& NV)

  4. 從 CHAT-GPT 到生成式 AI(Generative AI):人工智能新範式,重新定義生產力(中信建投證券)

  5. https://jalammar.github.io/illu

原文出處:

https://zhuanlan.zhihu.com/p/607822576

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/UxwC8bozcQZ6UOBys5lWAw