漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-18 talkingdev

[论文推荐]3D CoCa:融合视觉语言对比学习与场景描述的统一3D场景理解框架

谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架,这一突破性技术通过整合视觉语言对比学习(Contrastive Learning)与场景描述(Captioning)两大前沿方向,实现了对三维场景的多模态联合理解。该框...

Read More
2025-04-17 talkingdev

[论文推荐]M1:基于Mamba推理模型的可扩展测试时间计算研究

M1是一种基于Mamba架构的推理模型,通过扩展测试时间计算进行训练。虽然尚未完全达到最先进模型的水平,但M1在长上下文处理和高吞吐量任务中表现出色。这一突破为大规模语言模型的推理效率提供了新的研究方向,特别...

Read More
2025-04-17 talkingdev

OpenAI发布o3和o4-mini模型:集成多模态能力,推理速度与工具使用全面升级

OpenAI正式推出新一代o3和o4-mini模型,标志着大语言模型在功能整合与推理效率上的重大突破。该系列模型通过深度融合网络搜索、文件解析及图像生成三大核心能力,显著提升了ChatGPT的复杂任务处理水平。技术层面,o4...

Read More
2025-04-16 talkingdev

OpenAI开发类似X的社交媒体平台

OpenAI目前处于开发自家类似X社交媒体网络的初级阶段,该公司已有包含专注于ChatGPT图像生成的社交信息流的内部原型。尚不清楚OpenAI计划推出该社交网络作为独立应用程序,还是计划将其整合进ChatGPT应用中。拥有社...

Read More
2025-04-16 talkingdev

[开源]Auto Deploy (GitHub Repo):NVIDIA推出PyTorch和Hugging Face模型高效部署新方案

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具,该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器,模型推理速度可提升数倍,特别适...

Read More
2025-04-16 talkingdev

[论文推荐]Pinterest提出深度分层集成网络框架,显著提升广告系统转化率预测准确率

Pinterest研究团队在arXiv最新发表的论文中,提出了一种革命性的多任务学习框架——深度分层集成网络(Deep Hierarchical Ensemble Networks),该技术通过特征组合与辅助学习的协同机制,在广告系统转化率(CVR)预测...

Read More
2025-04-16 talkingdev

谷歌发布TxGemma开源模型,加速医疗科学中的治疗发现

谷歌近日基于其Gemma模型系列推出了专为医疗科学领域优化的TxGemma开源模型。该模型在治疗方案的发现方面展现出卓越性能,不仅超越了大多数专用模型,还在所有开源通用模型中表现最佳。TxGemma的发布标志着人工智能...

Read More
2025-04-16 talkingdev

图灵公司发布白皮书:如何最大化提升大型语言模型(LLM)的投资回报率

图灵公司最新发布的《最大化您的LLM投资回报率》白皮书揭示了影响大型语言模型(LLM)实际应用效果的关键因素。研究表明,模型性能不足往往并非源于算力限制,而是由训练目标偏差、评估体系缺陷和优化策略缺失等隐形...

Read More
  1. Prev Page
  2. 114
  3. 115
  4. 116
  5. Next Page