优化的相关内容 - 漫话开发者

2025-02-28 talkingdev

DeepSeek开源DualPipe：创新并行策略提升模型计算与通信效率

近日，DeepSeek在GitHub上发布了名为DualPipe的开源项目，展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略，旨在优化模型的计算与通信重叠，从而显著提升整体性能。这一策略通过高效的...

2025-02-28 talkingdev

Meta近日发布了其新一代混合现实眼镜Aria gen 2，这款设备以其强大的视觉能力引起了广泛关注。Aria gen 2不仅在虚拟现实和增强现实领域表现出色，还在机器人技术等多个领域展现了广泛的应用潜力。其先进的视觉系统能...

2025-02-27 talkingdev

Charta Health近日宣布完成810万美元的融资，本轮融资由Bain Capital Ventures领投。资金将主要用于增强其AI驱动的预账单审核技术，旨在减少医疗账单错误并挽回因错误导致的收入损失。Charta Health的技术通过智能化...

2025-02-27 talkingdev

Google近日发布了其最新的AI视频模型Veo 2，该模型的生成成本高达每秒0.5美元，相当于每分钟30美元。这一高昂的成本引发了业界的广泛关注。Veo 2作为Google在AI视频生成领域的最新成果，其技术复杂度和计算资源需求...

2025-02-27 talkingdev

微软近日发布了两款全新的开源语言模型Phi-4-mini和Phi-4-multimodal，这两款模型在硬件效率和多模态处理方面表现出色。其中，Phi-4-mini拥有38亿参数，专注于文本任务；而Phi-4-multimodal则具备56亿参数，能够处理...

2025-02-27 talkingdev

近日，SubPOP发布了一个大规模数据集，专门用于微调LLM（大语言模型），以预测调查响应分布。该数据集通过减少预测差距，显著提升了模型在未见过的调查数据上的泛化能力。这一技术突破为公众意见预测提供了更精准的...

2025-02-27 talkingdev

Allen AI近日宣布，其通过持续微调Qwen VL模型，成功训练出一款强大的PDF文本提取工具——OlmOCR。该模型基于超过20万份PDF文档进行训练，能够高效、精准地提取PDF中的文本内容。OlmOCR的推出标志着PDF文本提取技术的...

2025-02-27 talkingdev

Hazy Research的最新研究表明，通过Ollama使用本地模型，并结合长上下文云端模型作为协调器，可以在仅花费17%成本的情况下，实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...