漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-16 talkingdev

OpenAI定义AI达到人类智能的五个阶段

OpenAI最近分享了一个用于追踪其人工智能进展的五级系统。这些级别从目前AI所能达到的水平,到能够执行与一个组织同等工作量的AI都有涵盖。这些级别可能会根据员工、投资者以及公司董事会的反馈进行调整。OpenAI的高...

Read More
2024-05-23 talkingdev

Neosync:面向开发者的数据匿名与合成数据生成工具

Neosync是一个面向开发者,专注于PII(个人身份信息)匿名化、合成数据生成及环境同步的创新工具。它能够为测试、调试和开发提供更安全、高效的体验。开发者可以利用Neosync安全地在生产数据上测试代码,本地重现错...

Read More
2024-04-30 talkingdev

星际编程2 15B模型:人类与合成数据的混合训练成果

星际编程2 15B模型是一款在合成数据和人类数据上进行训练的人工智能模型。该模型在humaneval测试中获得了72.6的高分,表现出色。开发者在训练过程中不仅展示了他们的数据管道复制能力,还提供了将合成数据应用于其他...

Read More
2024-04-11 talkingdev

Anthropic的Beta工具在伯克利函数调用基准测试中击败GPT-4 Turbo

Anthropic公司开发的Beta工具使用API,在伯克利函数调用基准测试中,有50%的案例表现优于GPT-4 Turbo。这一测试主要评估AI工具在调用函数和解决问题方面的能力。Anthropic的Beta工具展现出了更高效的问题解决能力和...

Read More
2024-04-05 talkingdev

OpenAI推出定制化模型训练服务 助力企业打造专属生成式AI模型

OpenAI最近宣布扩大其定制模型计划,通过辅助微调和定制训练模型,帮助企业客户开发适合特定使用场景的生成式AI模型。这一服务的推出,意味着企业可以根据自己的特定需求,获得更加个性化和高效的AI解决方案。生成式...

Read More
2024-04-04 talkingdev

UPD开源-AI能否识别无解问题

近日,GitHub上出现了一个名为Unsolvable Problem Detection (UPD)的项目,旨在探索视觉语言模型中的一个新测试,即人工智能是否能识别出某些问题是无解的。这项技术的核心在于训练AI模型,使其能够区分可解和不可解...

Read More
2024-04-03 talkingdev

微软正在开发Xbox AI聊天机器人

微软正在测试一款全新的AI驱动的Xbox聊天机器人,旨在自动化支持任务。该公司正在扩大测试范围,并将聊天机器人与Xbox的支持文档集成,以回答查询和处理游戏退款。这一举措有望提高客户服务效率,并为玩家提供更加便...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page