Ideogram 4 是一款最新的开源权重文本到图像生成模型,完全从零训练而非基于现有模型微调,代表了图像生成领域的一次重要技术迭代。该模型最引人注目的创新在于引入了一种结构化的JSON提示接口,彻底改变了传统自然...
Read More近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...
Read MoreOpenAI近日正式推出了其图像生成模型的重大升级版本——ChatGPT Images 2.0。该版本标志着多模态人工智能技术迈入了新的阶段,其核心在于集成了一个先进的图像生成模型,该模型在多个关键技术指标上实现了显著突破。首...
Read MoreMeta公司近日正式推出了名为Muse Spark的新型多模态推理模型,标志着其在追求个人超级智能(Personal Superintelligence)的道路上迈出了关键一步。该模型集成了三大前沿技术能力:工具使用、视觉思维链以及多智能体...
Read More开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用,它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型(...
Read More产品发布流程正迎来AI驱动的深刻变革。Atlassian近日通过一场线上研讨会,展示了其新产品Rovo AI如何彻底改变传统产品发布模式。传统上,产品经理和营销人员往往从一张空白文档和紧迫的截止日期开始,而Rovo AI通过...
Read More字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...
Read MoreMeta Reality Labs最新推出的WorldGen技术,通过生成式人工智能实现了从文本描述直接创建高质量沉浸式3D环境的突破。该系统结合了神经辐射场(NeRF)、扩散模型和程序化生成技术,能够根据自然语言输入(如'被苔藓覆...
Read More