- 如何评价OpenAI最新发布的DALLE3? - 知乎
此外无论是风格还是人物肖像,Dalle3都做了更加严格的限定:他们不仅剔除了所有在世艺术家的图像,还可以保证把你用dalle生成的图像从模型中去掉。 这是在打所有现在AI绘画模型的脸啊,但是如此没有原罪的模型的风格的表现上可能会大大的受限。
- 如何评价openai的新工作DALL·E? - 知乎
DALLE生成的是256×256的图片。 具体的做法是把图片分成32×32个patch,每个patch通过discrete VAE映射到8192大小的词表里。 从而图片构成了1024个token。 和256的句子拼接一下,最后是1280的token序列。 这个discrete VAE是参考VQVAE做的,不明觉厉。
- 如何评价 OpenAI 推出与 ChatGPT 集成的 DALL·E 3? - 知乎
此外无论是风格还是人物肖像,Dalle3都做了更加严格的限定:他们不仅剔除了所有在世艺术家的图像,还可以保证把你用dalle生成的图像从模型中去掉。 这是在打所有现在AI绘画模型的脸啊,但是如此没有原罪的模型的风格的表现上可能会大大的受限。
- 如何评价DALL-E模型的实现? - 知乎
DALLE包括三个独立训练得到的模型:dVAE,Transformer和CLIP,其中dVAE的训练与VAE基本相同,Transformer采用类似GPT-3的生成式预训练方法。 下面对DALL-E采用的dVAE模型和Transformer模型做简单介绍,对CLIP感兴趣的朋友可以参考 [2]。 dVAE
- OpenAI 发布文字生成图像工具 DALL·E 2,它的画作水平如何?从技术角度如何评价它的能力? - 知乎
这件事对我的打击真的是太大了,认识我的人知道我其实最近一年都在做text-to-image的任务,去年我做cogview1的时候就跟dalle撞了,然后不得不再继续优化了一个月搞到效果效果比dalle稍微好一点再发布。
- ai绘画反提示词中常用的nsfw这个提示词是什么意思? - 知乎
前视角 from front, 后视角 from behind, 侧视角 from side, 仰视视角 from above, 俯视视角 from below, 动态视角 dynamic Angle, 居中 centered, 全身像 full body, 半身像 half body, 七分身镜头 cowboy shot, 人物面朝远方 (背对) facing away, 特写 close up, 多视图 multiple views, 电影镜头cinematic angle, 这些提示词用来 表现画面和构图角度是很好用的!
- SDXL、FLUX、Pony 三个模型有什么区别,哪个适合用来做设计? - 知乎
SDXL、FLUX和Pony三个模型在技术架构、应用场景和性能特点上各有不同,以下是它们的对比分析: 技术架构 SDXL:基于Stable Diffusion架构,属于通用图像生成模型,支持多种风格和高质量图像生成。 FLUX:由Black Forest Labs开发,基于Diffusion Transformer架构,包含三个版本: FLUX 1 Pro:闭源模型,提供最佳性能,适合商业应用。 FLUX 1 Dev:开源模型,不可商用,性能接近Pro版本。 FLUX 1
|