漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-31 talkingdev

Qwen2.5-VL Cookbooks发布:助力多任务视觉语言模型应用

近日,Qwen2.5-VL这一全新的视觉语言模型推出了配套的Cookbooks,详细展示了如何利用该模型完成多种不同的任务。Qwen2.5-VL作为一款先进的视觉语言模型,具备强大的多模态处理能力,能够同时理解图像和文本信息。此...

Read More
2025-01-31 talkingdev

VIRUS方法突破LLM安全防护,开源项目引发关注

近日,一种名为VIRUS的方法在GitHub上开源,该方法旨在生成对抗性数据,以绕过大型语言模型(LLM)的审核系统,并破坏其安全对齐机制。VIRUS通过精心设计的输入数据,能够有效规避现有的内容过滤和防护措施,从而对L...

Read More
2025-01-28 talkingdev

Qwen团队推出1M上下文模型,性能强劲且本地化

Qwen团队近日发布了其最新的1M上下文模型,展示了在训练过程中逐步扩展上下文能力的技术进展。该模型不仅性能强劲,还支持本地化运行,显著提升了处理长文本任务的效率。此外,Qwen团队还发布了基于vLLM的推理框架,...

Read More
2025-01-27 talkingdev

开发者推出ErisForge:专为LLM消融设计的Python库

近日,一款名为ErisForge的Python库在技术社区中引起了广泛关注。该库由一位开发者独立创建,旨在为大型语言模型(LLM)的消融研究提供支持。ErisForge通过简化消融实验的流程,帮助研究人员更高效地分析和理解LLM的...

Read More
2025-01-25 talkingdev

论文DeepSeek-R1-通过强化学习提升LLM的推理能力

近日,DeepSeek团队发布了其最新研究成果DeepSeek-R1,旨在通过强化学习(RL)技术提升大型语言模型(LLM)的推理能力。DeepSeek-R1的核心目标是通过激励机制优化模型的推理过程,使其在处理复杂问题时表现出更高的...

Read More
2025-01-24 talkingdev

论文:FREEFORM框架利用LLM优化基因型数据特征选择与工程

近日,一项名为FREEFORM的创新框架引起了科学界的广泛关注。该框架通过利用大型语言模型(LLM)来优化基因型数据的特征选择与工程,从而更准确地预测遗传表型。FREEFORM的核心优势在于其能够自动识别和提取与特定表...

Read More
2025-01-24 talkingdev

LOKI:多模态检测模型的合成基准测试

LOKI 是一个用于评估视觉语言模型(VLMs)在检测新颖和具有挑战性项目方面表现的合成基准测试工具。该基准测试通过生成复杂的多模态数据,帮助研究人员更好地理解模型在处理未知或复杂场景时的能力。LOKI 的设计旨在...

Read More
2025-01-23 talkingdev

MTU-Bench:全新基准测试评估LLM工具使用能力

近日,MTU-Bench作为一种全新的基准测试工具正式发布,旨在评估大型语言模型(LLMs)在不同场景下的工具使用能力。该基准测试通过多样化的任务设计,全面衡量LLMs在实际应用中的表现,特别是在复杂任务中调用外部工...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page