NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具,该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器,模型推理速度可提升数倍,特别适...
Read MoreOpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...
Read MoreOpenAI近日在其API中推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编码和指令遵循方面表现优异,全面超越了之前的GPT-4o和GPT-4o mini。新模型不仅具备更大的上下文窗口,支持高达100万toke...
Read MoreOpenAI正在准备发布GPT-4.1及其o3推理模型的完整版本。GPT-4.1是对GPT-4o的重新设计版本,并计划推出更小尺寸的mini和nano版本。尽管OpenAI目前尚未实现盈利,但其当前估值已达到3000亿美元。上个月,ChatGPT成为应...
Read MoreOpenAI宣布对ChatGPT进行升级,增强其聊天机器人的记忆功能,并使其成为默认设置。升级后的ChatGPT将能够参考先前的对话历史,以提供更加相关和有用的回答。这一改进将适用于平台上的所有交流方式。长期记忆对AI而言...
Read More谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段,开发者现可通过Google AI Studio的Gemini API进行体验,而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本,2.5 Pro在跨模态理解、长...
Read More近期AI生成的吉卜力风格视觉作品引发热潮,导致OpenAI服务器负载激增,同时引发了关于AI时代创造力本质的深刻讨论。虽然人工智能能够快速生成具有艺术性的图像,但它缺乏人类体验和综合复杂思想与情感的能力。专家指...
Read More本文梳理了2024年以来最具影响力的AI模型,深入解析其技术特性与应用场景。OpenAI推出的GPT-4.5 Orion凭借其强大的世界知识建模能力成为通用AI领域的标杆;Google的Gemini 2.5 Pro则专注于代码生成与理解,为开发者...
Read More