漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-12 talkingdev

大型科技公司工程师告诉你:为何开发速度提不上去

开发速度缓慢的问题在很大程度上取决于公司的规模、文化、产品特性以及团队构成。本文深入探讨了大型科技公司的工程师们认为导致开发速度减缓的原因。许多工程师表示,构建、编译和部署时间是主要的瓶颈。除此之外,...

Read More
2024-04-11 talkingdev

谷歌AI基础设施引领企业转型浪潮

谷歌凭借其在人工智能领域的深度投资,不仅帮助客户训练和部署前沿的语言模型,更使得公司站在了AI平台变革的前沿。本文深入探讨了谷歌的基础设施如何助力企业转型,以及这对谷歌竞争力的意义。尽管谷歌可能需要转变...

Read More
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-08 talkingdev

ReFT:一种高效节省参数的微调语言模型方法

近期在GitHub上发布的ReFT(Representation Fine-Tuning)项目,为微调语言模型带来了一种新的参数高效方法。与传统的PeFT相比,ReFT在保持强大性能的同时,大大降低了成本。该方法通过精细化调整模型参数,使得在进...

Read More
2024-04-05 talkingdev

TypeSpec:微软开发新型API定义语言提升OpenAPI编写效率

微软开发的TypeSpec是一种新型API定义语言,它借鉴了TypeScript的语法,提供了一种比JSON或YAML更简洁、易读的方式来编写OpenAPI。TypeSpec通过允许将API模式定义为可复用组件,解决了OpenAPI的冗长和缺乏可复用组件...

Read More
2024-04-05 talkingdev

Gretel开源2300万文本至SQL数据集,助力自然语言处理技术发展

HuggingFace平台上新发布了一个由Gretel收集的大规模文本至SQL数据集,包含2300万条数据。该数据集旨在通过自然语言处理技术生成SQL查询语句,对RAG应用程序和合成数据生成领域具有重要意义。文本至SQL的任务一直是...

Read More
2024-04-05 talkingdev

Meta未来蓝图:继收购Oculus十年后,VR和AR技术的新征程

自Facebook收购Oculus以来已过去十年,虚拟现实技术虽未大规模普及,但已多次成为主流。本文将探讨Meta接下来的发展方向,包括即将推出的Quest 3、人工智能、智能眼镜以及增强现实眼镜。Meta计划在本月晚些时候为Ray...

Read More
2024-04-04 talkingdev

论文:新型DiJiang技术助力Transformer模型高效瘦身

科研团队近期推出了一项名为DiJiang的创新技术,旨在将现有的Transformer模型转化为更精简、更快速的版本,同时避免了重新训练模型所需的巨大成本。DiJiang技术通过优化模型结构,大幅减少了计算资源的消耗,使得Tra...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page