4 個令人驚豔的 ChatGPT 項目,開源了!AIGC 也太猛了
大家下午好啊~
自從 ChatGPT、Stable Diffusion 發佈以來,各種相關開源項目百花齊放,着實讓人應接不暇。
今天,我將着重挑選幾個優質的開源項目,對我們的日常工作、學習生活,都會有很大的幫助。
今天整理分享給大家,希望對你有所幫助。
一、Visual ChatGPT
這個是微軟開源的項目,一週多的時間,就斬獲了 23.6k+ star。
簡單概括它,那就是一個多模態的問答系統。
支持 AI 繪畫、語言問答、看圖問答,將 AI 屆近期的 3 大熱點集於一身。
效果展示:
系統實現框架如下:
這是一個 “大力出奇跡” 的開源項目,集多方研究成果於一身:BLIP、CLIP、ChatGPT、pix2pix、inpainting、vqa 等。
說白了,就是教你怎樣使用這些項目,搭建一個多模態的問答系統,這個系統架構很有參考價值。
項目地址:
https://github.com/microsoft/visual-chatgpt
二、SadTalker
這是一篇 2023 年的 CVPR 論文對應的開源項目。
剛剛開源,新鮮熱乎~
功能就是:根據一張圖片、一段音頻,合成面部說這段語音的視頻。
結合 ChatGPT、AIGC、音頻文字轉換,虛擬二次元 or 三次元形象,就能 “活” 過來了。
此外,還項目還做成了 stable diffusion webui 的插件,也就是直接能在 stable diffusion 裏使用。
生成的圖片,直接配合一段音頻,就能生成合成的視頻。
項目地址:
https://github.com/winfredy/sadtalker
三、FateZero
文本能編輯生成圖片?那視頻能編輯嗎?
FateZero:我可以!
左圖是原圖,右圖是生成效果,輸入的文本是:
增加 Pokémon 動漫風格
增加水墨畫風格:
除了視頻的風格遷移,也支持修改裏面的內容。
比如:松鼠是胡蘿蔔,變成,兔子喫茄子。
這個項目也是基於 sd 做的,離一鍵生成視頻,又進了一步。
項目地址:
https://github.com/chenyangqiqi/fatezero
四、ChatPaper
arXiv 想必大家都知道,當下最流行的論文託管網站,上面有來自世界各地的科學家、研究學者。
爲了提高 arXiv 用戶閱讀論文的效率,有人開源了一款利用 ChatGPT 總結 arXiv 論文的開源工具 ChatPaper。
開發者的動機,他是這樣講述的:
簡而言之,該項目可根據用戶關鍵詞下載 arXiv 上的最新論文,利用 ChatGPT3.5 API 強大的歸納能力,將其濃縮成固定格式,文字少且易讀。
同時,項目支持個人自己部署,或者直接去 Hugge Face 體驗。
項目地址:
https://github.com/kaixindelele/ChatPaper
https://huggingface.co/spaces/wangrongsheng/ChatPaper
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/GzpedT2vvOJ0Mb0QhrPScw