人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”,这是一个专门为保护AI浏览器智能体(AI Browser Agents)而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中,AI智能体在执行网页...
Read More随着AI编程系统的广泛应用,其生成的代码可能潜藏严重缺陷与安全漏洞,因此对AI产出的代码进行有效验证变得至关重要。OpenAI近期提出了一种规模化代码验证的实用方法,并优化了其代理式代码审查员。该方案旨在以较低...
Read More人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型,该系列包含两大技术路线:一是三款不同规模的密集模型(参数规模分别为140亿、80亿和30亿),二是备受瞩目的Mistral Large 3稀疏混...
Read More亚马逊云科技(AWS)在自研AI芯片领域持续发力,近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼,标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...
Read More近期,一项由AI智能体主导的安全审计在区块链智能合约中发现了价值高达460万美元的潜在安全漏洞。这一事件凸显了人工智能技术在提升区块链安全领域的巨大潜力。传统的智能合约审计通常依赖于人工专家,过程耗时且可...
Read More随着AI智能体技术的快速发展,其在自动化任务处理、复杂决策支持等方面展现出前所未有的能力。然而,将AI智能体应用推向生产环境时,若缺乏严谨的评估体系,极易导致性能不稳定、成本失控及用户体验下降等风险。Weig...
Read More近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...
Read More近日,秘密运营的AI音乐初创公司Klay成为行业焦点。该公司开发的应用程序允许用户通过人工智能技术对现有歌曲进行重新创作,这一功能突破了传统音乐制作的边界。更值得关注的是,Klay已完成约1000万美元的融资,并成...
Read More