漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-07 talkingdev

阿里云发布旗舰语言模型Qwen 2,效果超闭环模型

阿里云最新发布的旗舰语言模型Qwen 2在基准性能测试中略超越了Llama 3 70B,成为新一代语言模型的标杆。Qwen 2不仅在英语性能方面表现卓越,同时也是一个更优秀的多语言模型。这一突破性进展标志着阿里云在人工智能...

Read More
2024-06-04 talkingdev

黎曼假设取得突破性进展

据最新消息,数学界近日取得了一项重大突破,有望解决黎曼假设这个被数学界关注已久的难题。黎曼假设是关于素数分布的重要问题,被誉为数学领域的巨无霸之一。虽然这个问题已经存在了150多年,但迄今为止仍未得到证...

Read More
2024-05-24 talkingdev

论文:GLSCL提升文本视频检索效率

研究人员开发了一种新的方法——全局-局部语义一致学习(Global-Local Semantic Consistent Learning,简称GLSCL),以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性,还显著降低了计算成本。GLSCL通过...

Read More
2024-05-24 talkingdev

AI初创公司H完成2.2亿美元种子轮融资

由DeepMind科学家创办的AI初创公司H宣布完成2.2亿美元的种子轮融资,成为近年来最具规模的种子融资之一。这一轮融资的成功标志着法国AI人才的又一重大胜利。H公司致力于构建动作模型,这项技术有望在多个领域取得突...

Read More
2024-04-15 talkingdev

论文-DGMamba框架:采用状态空间模型应对领域泛化挑战

DGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...

Read More
2024-04-12 talkingdev

3D物体异常检测革新技术解析

SplatPose提出了一种新颖的3D高斯喷溅方法,有效解决了不同姿态下3D物体异常检测的难题。该技术通过模拟光线在物体表面的散射过程,实现了对物体表面细节的精确捕捉。即使在物体姿态多变的情况下,也能够准确地识别...

Read More
2024-04-10 talkingdev

SqueezeAttention技术助力LLM优化,内存使用降低30%至70%

近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...

Read More
2024-04-04 talkingdev

科学家打造能相互交流并传递技能的AI模型

研究人员开发了一个AI网络,使得一个AI可以通过自然语言处理教另一个AI执行任务,这是之前未曾展示过的能力。该系统使用了一个名为S-Bert的模型,允许AI根据指令执行任务,并把这种知识传递给另一个AI。这项技术的突...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page