漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-03 talkingdev

Mora:挑战Sora的新一代视频生成模型开源

Mora是一款创新的视频生成模型,它利用多个视觉AI代理,旨在挑战OpenAI的领先模型Sora。Mora的独特之处在于其多代理系统,这使得它在视频内容生成的多样性和质量上表现出色。通过集成高级视觉处理技术和机器学习算法...

Read More
2024-06-03 talkingdev

FABRIC:无训练提升图像生成质量的开源方案

近日,一个名为FABRIC的新方法在GitHub上引起了广泛关注。FABRIC是一种在推理阶段无需训练即可提升图像生成质量的方法。它通过使用评分函数或图像示例来指导输出质量,从而显著改善生成图像的视觉效果。该方法的最大...

Read More
2024-05-27 talkingdev

LoRA-Ensemble:提升自注意力网络的预测精度

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配(LoRA)的应用,通过隐式集成实现了在不增加传统集成方法高计算成本的情况下,仍能做出准确且校准良好的预测。这种方法不仅在精...

Read More
2024-05-24 talkingdev

Llama cpp支持多机器的分布式推理部署

Llama cpp现已支持跨多台机器的分布式推理。这一功能目前仅限于FP16(半精度浮点数),但对于开源部署来说,这无疑是一个巨大的进步。通过分布式推理,开发者可以更高效地利用集群资源,提升模型推理的速度和效率。...

Read More
2024-05-23 talkingdev

Mistral 发布最新 7B 模型,性能显著提升

Mistral 公司近日在 Hugging Face Hub 上发布了其 7B 模型的最新版本——Mistral 7B Instruct V3。该版本在上下文长度和性能方面都有显著提升。新的模型不仅能够处理更长的上下文,还在多个基准测试中表现出色,显示出...

Read More
2024-05-22 talkingdev

DeepSeek-VL:面向现实世界的开源视觉语言模型

DeepSeek-VL 是一个专注于现实世界应用的全新开源视觉语言模型。该模型特别针对多样化的数据进行了优化,包括来自网页截图、图表以及 OCR(光学字符识别)数据的处理。DeepSeek-VL 的设计目标是提高在复杂和多样化数...

Read More
2024-05-22 talkingdev

xAI致力于实现Grok多模态功能

Elon Musk的人工智能公司xAI正在提升其Grok聊天机器人的能力,使其能够支持多模态输入。此举将允许用户上传照片,并获得基于文本的回答。这一功能的加入不仅会拓宽Grok的应用场景,还将提高其在用户交互中的智能化水...

Read More
2024-05-15 talkingdev

OpenAI的重大突破:GPT-4o的多模态能力

OpenAI的最新研究成果GPT-4o的多模态能力,整合了视觉和语音技术,预示着人工智能与世界互动方式的重大进步。这为人工智能在日常生活中的普遍存在铺平了道路。GPT-4o的多模态能力,不仅能够理解文本信息,还能够理解...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page