漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

论文:视觉语言模型遇到难题:新基准测试与改进方向

视觉语言模型(VLMs)在处理输入图像时,有时会遇到无法回答的问题。即便是最先进的VLMs,如GPT-4V,也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试,并探讨了一些可能的改进方向。研究者们通过...

Read More
2024-04-01 talkingdev

Airtable AI产品发布,将人工智能融入工作流程

Airtable公司近日推出了一款名为Airtable AI的新产品,旨在将人工智能技术直接整合到用户的日常工作流程中。这款产品通过简化AI集成过程,使得用户无需深入了解复杂的人工智能算法和编程语言,也能轻松地利用AI技术...

Read More
2024-04-01 talkingdev

微软Copilot AI即将在本地PC上运行

微软宣布其Copilot AI将很快在本地PC上运行。这意味着未来的AI PC将需要内置神经处理单元,这些单元能够提供超过40 TOPS的处理能力。这一举措将显著提高AI应用在个人电脑中的运行效率和响应速度,同时也为开发更加复...

Read More
2024-04-01 talkingdev

人工智能是否需要“身体”才能变得真正智能?

体现假说认为真正的智能需要物理交互,这促使人工智能通过模拟和现实世界的测试得到发展,尽管存在如“仿真到现实的差距”等挑战,导致AI机器人在工业中的谨慎部署。这一理论推动了对AI机器人的进一步研究,以探索它们...

Read More
2024-04-01 talkingdev

Qwen MoE性能匹敌7B大模型,激活参数仅三分之一

近期,一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时,成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本,还为大规模机器学习模型的可访问...

Read More
2024-04-01 talkingdev

自动驾驶赛车如何推动无人驾驶汽车技术的进步

自动驾驶赛车通过在高压条件下应用人工智能和机器学习技术,正推动无人驾驶汽车技术的发展。例如,Indy Autonomous Challenge等竞赛正在加速车辆安全性方面的创新。研究者和学生利用F1tenth等平台开发算法,在实际赛...

Read More
2024-04-01 talkingdev

Chatbot Arena榜单更新:Anthropic的Claude 3首次超越OpenAI的GPT-4

在由大型模型系统组织运营的排行榜Chatbot Arena上,Anthropic公司的聊天机器人Claude 3 Opus首次超越了OpenAI的GPT-4。Chatbot Arena是一个开放模型的排行榜,它允许访问者对不同模型的输出进行评分,从而计算出综...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
  1. Prev Page
  2. 102
  3. 103
  4. 104
  5. Next Page