使用语言
Python
Jupyter Notebook
领域
图像
OmniGen2 是一个强大且高效的统一多模态模型。与 OmniGen v1 不同,OmniGen2 为文本和图像模态提供了两种不同的解码路径,使用未共享的参数和独立的图像分词器。OmniGen2 在四个主要能力方面表现出具有竞争力的性能:
  • 视觉理解:继承了其 Qwen-VL-2.5 基础所具有的强大解读和分析图像内容的能力。
  • 文生图生成:根据文本提示创建高保真且具有美感的图像。
  • 指令引导图像编辑:执行高精度的基于指令的复杂图像修改,在开源模型中达到最先进的性能。
  • 情境生成:一种多功能能力,能够处理并灵活组合多样化的输入——包括人类、参考对象和场景——以产生新颖且连贯的视觉输出。
 
 
Loading...