技术的相关内容 - 漫话开发者

2024-02-22 talkingdev

谷歌推出Gemma—免费的开源AI聊天机器人家族

谷歌推出了一系列新的AI语言模型Gemma，这些模型是基于类似Gemini的技术构建的免费开源模型。Gemma模型可在桌面或笔记本电脑上本地运行，有两个模型，一个有20亿个参数，另一个有70亿个参数。每个模型都有经过预训练...

2024-02-21 talkingdev

近日，一种新的Temporal Dilated Video Transformer (TDViT)技术被发布，旨在提高稠密视频任务的分析能力，如逐帧视频对象检测。该技术采用多头自注意力机制，可进行多层次、多尺度的特征提取，同时利用空间和时间的...

2024-02-21 talkingdev

AdamW通常用于解耦学习率和权重衰减。然而，Pytorch中的常见实现并没有明确地做到这一点。本文讨论了如何调整这些参数。 AdamW是一种优化算法，它在Adam的基础上加入了权重衰减。AdamW的优点之一是可以解决权重衰减...

2024-02-21 talkingdev

控制向量(ControlVectors)是一种廉价的语义生成输出控制方法。它们的训练比LoRA更便宜，但仍然可以非常有效。这个控制向量库使得使用这种技术更加简单。控制向量库是由一群开发人员推出的，作为一项开源项目，它的代...

2024-02-21 talkingdev

智能机器人的应用已经越来越广泛，但是如何让机器人更好地理解和与环境互动仍然是一个挑战。最近，一项名为3D Diffuser Actor的技术被开发出来，它结合了扩散策略和3D场景表示，可以提高机器人的操作效率。这一技术...

2024-02-21 talkingdev

近日，一项名为ZeroSwot的新方法被提出，通过独特的技术，成功突破了语音和文本之间的差异以及数据缺乏等难题，实现了提高语音翻译准确度的目标。具体来说，ZeroSwot通过使用语音识别数据训练语音编码器，然后将其与...

2024-02-21 talkingdev

KV缓存的量化是Transformer架构的一个技术细节，它使其在推理时使用更少的内存。量化是在最小损失质量的情况下缩小浮点精度。

2024-02-21 talkingdev

Magic正在构建一款AI软件工程师，并获得更多资金来支持这一过程。该公司最近获得1.17亿美元的资金，以帮助开发人员自动生成代码。Magic的平台使用AI技术，可以自动完成大量编码工作，从而节省时间和减少人为错误。该...