騰訊混元圖像3.0圖生圖模型上線(xiàn) 支持多樣化圖片編輯

2026-01-26 15:40:01    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻
很多朋友不知道【騰訊混元圖像3.0圖生圖模型上線(xiàn) 支持多樣化圖片編輯】,今天小綠就為大家解答一下。

騰訊混元圖像3.0圖生圖模型上線(xiàn) 支持多樣化圖片編輯

  混元圖像3.0圖生圖總參數量達80億,激活參數約13億,采用混合專(zhuān)家(MoE)架構,基于原生多模態(tài)架構基礎模型,引入圖生圖多任務(wù)數據,經(jīng)指令微調和后訓練,具備對用戶(hù)輸入圖像和編輯指令的深度理解與處理能力。該模型指令遵循效果穩定,生成的圖片一致性高、真實(shí)感強、情緒表現力佳,且生成速度明顯提升。

  數據層面,混元團隊構建了千萬(wàn)量級的圖生圖數據,覆蓋80多個(gè)任務(wù),并在持續訓練階段注入數據,讓模型掌握基礎編輯功能。同時(shí)構造思維鏈,提升編輯效果。后訓練階段采用自研MixGRPO算法,高效對齊用戶(hù)偏好。

版權所有,未經(jīng)許可不得轉載

  作為一款能理解輸入圖像、會(huì )思考的圖像編輯模型,混元圖像3.0圖生圖在收到用戶(hù)輸入的圖片和提示詞后,會(huì )先理解圖像內容,再基于提示詞推理出具體編輯區域、步驟和需保留區域,形成詳細編輯指令,實(shí)現良好輸出效果。

  它支持多樣化的圖片編輯與多圖融合能力,涵蓋增、刪、改、風(fēng)格變換、老照片修復、人物與文字修改等圖片編輯,以及多張照片元素提取合成合照與新圖片等。在“元寶”上,用戶(hù)可直接用它制作表情包、虛擬人物合拍、社交分享、電商海報設計、游戲角色定制、創(chuàng )意圖片制作等。

  【CNMO科技消息】1月26日,騰訊混元正式發(fā)布混元圖像3.0圖生圖(HunyuanImage 3.0-Instruct)模型,并在“元寶”全端及騰訊混元官網(wǎng)同步上線(xiàn)。


以上問(wèn)題已經(jīng)回答了。如果你想了解更多,請關(guān)新經(jīng)網(wǎng)網(wǎng)站 (http://wap.hkkqyy120.com/)
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。