漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-06 talkingdev

Jure Leskovec提出STaRK、AvaTaR和CollabLLM框架,推动AI代理实现推理与协作

在The Web Conference的主题演讲中,斯坦福大学教授Jure Leskovec介绍了三种创新框架——STaRK、AvaTaR和CollabLLM,这些框架旨在提升AI代理的推理能力、协作效率和假设检验功能。STaRK通过知识图谱增强AI的知识检索与...

Read More
2025-05-02 talkingdev

[开源] BLAST:斯坦福大学发布高性能浏览器-LLM自动扩展服务引擎

斯坦福大学MAST实验室推出的BLAST项目,是一款专为浏览器增强型大语言模型(LLM)设计的高性能服务引擎。该技术旨在简化网页浏览AI代理的部署流程,显著提升响应速度并优化成本管理。其核心创新包括:1)自动并行化...

Read More
2025-04-30 talkingdev

微软2025年度工作趋势报告:AI驱动的“前沿企业”崛起

微软最新发布的《2025年度工作趋势指数》报告揭示了企业向AI驱动的“前沿企业”(Frontier Firms)转型的重大趋势。报告重点强调了三大核心变革:1)智能随需(intelligence on tap)将成为企业标配,AI能力将像水电一...

Read More
2025-04-25 talkingdev

Trae AI推出@Agent功能:打造专属AI开发团队

人工智能集成开发环境Trae AI近日推出创新功能@Agent,允许用户通过@提及方式调用专业化AI代理,模拟真实团队协作场景。该功能突破性地实现了自定义AI代理的创建与规则定义,并采用先进的上下文保持技术确保对话连续...

Read More
2025-04-23 talkingdev

Cua:开源Docker容器技术,让AI智能体安全驱动完整操作系统

Francesco和Alessandro推出的c/ua项目(https://www.trycua.com)是一款革命性的Docker风格容器运行时,允许AI代理在轻量级、隔离的虚拟机中驱动完整操作系统。该项目已完全开源(https://github.com/trycua/cua),...

Read More
2025-04-21 talkingdev

[开源]ZeroSumEval Benchmark:多智能体对抗框架重塑大语言模型评估标准

Meta旗下Facebook Research团队推出的ZeroSumEval Benchmark在GitHub开源,这一动态评估框架通过竞争性多智能体模拟,为大语言模型(LLM)在推理、知识储备和规划任务等核心能力维度建立了全新测试范式。该框架创新...

Read More
2025-04-18 talkingdev

构建高效AI代理的实战指南

AI代理是一种可以在用户授权下独立执行工作流程的人工智能系统。本指南旨在为产品和工程团队提供构建AI代理的相关知识,包括如何识别有前景的用例、设计代理逻辑和编排的清晰模式,以及确保代理安全、可预测且高效运...

Read More
2025-04-17 talkingdev

OpenAI发布o3和o4-mini模型:集成多模态能力,推理速度与工具使用全面升级

OpenAI正式推出新一代o3和o4-mini模型,标志着大语言模型在功能整合与推理效率上的重大突破。该系列模型通过深度融合网络搜索、文件解析及图像生成三大核心能力,显著提升了ChatGPT的复杂任务处理水平。技术层面,o4...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page