漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-14 talkingdev

DeepMind与USC合作开发SELF-DISCOVER框架,LLM推理能力显著提升

DeepMind和南加州大学的研究人员开发出SELF-DISCOVER框架,该框架显著提高了LLM的推理能力,在类似GPT-4的模型任务中比传统方法提升了32%。这个两阶段的框架使得LLMs能够自主地形成和利用推理结构。这个进步代表了AI...

Read More
2024-02-12 talkingdev

CogCoM开源新视觉语言模型,增强视觉推理能力

CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。

Read More
2024-02-09 talkingdev

Google自主发现技术的实现开源

Google提出了一种新颖的提示技术,允许语言模型使用一组推理基元来发现更大的问题特定推理框架。这意味着模型可以选择不同的模块并将它们组合起来以更好地解决复杂问题。这个代码库是这些想法的一个非官方实现。

Read More
2024-02-09 talkingdev

MobileVLM,为移动设备量身打造的先进视觉语言模型

MobileVLM V2是一系列为移动设备量身打造的先进视觉语言模型,通过创新的架构展示了显著的性能提升。新的MobileVLM V2拥有更快的推理速度,更高的准确性和更广泛的应用场景。MobileVLM V2不仅支持图像和文本之间的交...

Read More
2024-02-08 talkingdev

开源数学推理AI模型DeepSeekMath

GitHub仓库发布了一个名为DeepSeekMath 7B的语言模型,专门设计用于解决复杂的数学问题。该模型训练了大量以数学为重点的内容,它可以理解数学问题的语法和语义,并根据其推理出答案。DeepSeekMath 7B是一个重要的AI...

Read More
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-02-02 talkingdev

Llava 1.6发布,OCR、推理和世界知识得到改进

Llava是一种视觉语言模型,最新版本为1.6,经过改进后,其OCR、推理和世界知识等方面有了很大提升,甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型,以便更多人能够使用。

Read More
2024-02-01 talkingdev

WhisperKit:将OpenAI的语音识别模型集成到Apple的CoreML框架中

WhisperKit是一个用Swift编写的开源库,它将OpenAI的Whisper语音识别模型与Apple的CoreML框架集成,以在Apple设备上进行高效的本地推理。它可以通过Swift Package Manager集成到Swift项目中。WhisperKit会自动下载推...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page