漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-08 talkingdev

谷歌似乎正在开发付费高级版Bard AI

据报道,谷歌正在开发“Bard Advanced”,这是其Bard AI工具的增强版本,将通过付费的Google One订阅提供。这个升级版由谷歌的顶级大型语言模型Gemini Ultra提供支持,相比于目前运行在Gemini Pro上的Bard,它提供了先...

Read More
2024-01-03 talkingdev

揭示Gemini的潜力:多模态常识推理研究

本项目介绍了对Google的Gemini进行深入分析的研究,Gemini是一种多模态大型语言模型,评估其在各种任务中的常识推理性能。该研究与其他模型进行了比较,揭示了其在跨模态知识整合方面的竞争能力。

Read More
2023-12-22 talkingdev

谷歌公布850+人联合论文,阐述Gemini语言模型的研究成果

Google的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-20 talkingdev

Google Vision开源权重分片,提升多节点系统训练效率

Google的Big Vision项目是一个研究和生产最先进的视觉系统的重要工具库。最近,他们添加了权重分片,使得在多节点系统上的训练更加容易。这个新功能可以将模型分成多个子模型,分别在不同的节点上进行训练,最后再将...

Read More
2023-12-15 talkingdev

Google推出Imagen2,提供文本和标志生成功能

Google推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

Read More
2023-12-12 talkingdev

AI正在颠覆的行业并不是那么有利可图

谷歌的Gemini AI模型尽管有令人印象深刻的演示视频,但仅导致谷歌股票的微小增长,反映了对其实时功能的怀疑,因为演示使用的是预先录制的镜头和编辑过的回答。这种怀疑反映了AI行业的更广泛担忧,即公司创造了高期...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page