图像生成的相关内容 - 漫话开发者

2025-06-27 talkingdev

通义千问VLo：从“理解”世界到“描绘”世界

多模态大模型的演进不断突破我们对技术能力的认知边界。从最初的QwenVL到最新的Qwen2.5 VL，研究团队在提升模型理解图像内容的能力方面取得了显著进展。如今，团队正式推出全新模型Qwen VLo，这是一个统一的多模态理...

2025-06-25 talkingdev

近日，一项名为ContinualFlow的创新技术为生成模型领域带来突破性进展。该技术通过流向能量重加权目标的匹配方法，直接从模型分布中剔除不需要的区域，从而避免了传统方法所需的完整模型重新训练过程。这一技术的核...

2025-06-17 talkingdev

Together AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型：DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化，显...

2025-06-13 talkingdev

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破，该模型采用100%经过授权的合规数据进行训练，为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

2025-06-13 talkingdev

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频（text-to-video）和图像生成视频（image-to-video）两项核心任务中均位列榜首，其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

2025-06-09 talkingdev

近日，一项名为PTSD（Progressive Tempering Sampler with Diffusion）的新型采样技术在预印本平台arXiv上发布，该技术通过序列化温度调节训练扩散模型，显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...

2025-05-29 talkingdev

PixelFlow是近期在GitHub上开源的一个创新图像生成模型，其最大特点是直接在像素空间生成图像，无需依赖变分自编码器（VAE）。这一技术突破带来了显著的图像质量提升和更精细的语义控制能力，同时在生成效率和基准测...

2025-05-29 talkingdev

Goodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限，允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术，将Stable Diffusion XL-Turbo的内部特征解码为可...