技术的相关内容 - 漫话开发者

2024-05-10 talkingdev

Gemma 10M语境探讨：语言模型的延伸途径

近期，关于如何扩展语言模型的语境的讨论引起了业界的关注。这次讨论并未提供太多的评估方法，但却对语言模型领域的探索方向提供了深度剖析。语言模型的语境是机器学习和自然语言处理中的关键组成部分，对于提高模型...

2024-05-10 talkingdev

DiffMatch是一种新颖的半监督变化检测方法，它利用视觉语言模型为未标记的数据合成伪标签，从而提供额外的监督信号。通过这种方式，DiffMatch能够更精确地检测图像中的变化，提高了图像处理和分析的效率和准确性。此...

2024-05-10 talkingdev

YOCO架构是一种具有全局注意力能力的解码器-解码器模型，能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器，使得关键-值对的缓存和复用更加高效。与传统的Transformer相比，YOCO在推理内存、延迟和吞吐...

2024-05-10 talkingdev

OpenAI最近发布了一份文件，详细阐述了公司希望其模型在各种场景下的行为表现。这份文件的公布，标志着OpenAI对于模型行为的透明度和可预测性的重视。通过明确模型的行为预期，OpenAI希望能进一步优化其模型在实际应...

2024-05-10 talkingdev

近日，一种新型的标签方法被研究者利用在了图片和文字的配对上，这种方法运用了两次的VLMs（视觉语言模型）扫描，产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细，能够帮助训练...

2024-05-10 talkingdev

根据最新消息，微软正在开发一种名为MAI-1的新型人工智能模型。据悉，这款新型AI模型拥有大约5000亿的参数，目标是超越谷歌和OpenAI的主要人工智能模型。微软一直在AI领域持续进行研发和创新，这次的内部模型MAI-1的...

2024-05-09 talkingdev

近期在LMSYS舞台上出现的gpt-2-chatbot已被确认为OpenAI的新型模型。该确认源于一次429速率限制错误，此错误揭示了来自OpenAI API的相关细节。GPT-2-Chatbot的出现，预示着OpenAI在人工智能领域的新进展和发展。此次...

2024-05-09 talkingdev

ChemFlow是一个新的框架，旨在通过使用深度生成模型高效地导航化学空间，从而提高分子科学的效率。这种新型框架的出现，使化学研究人员能够在化学空间中更加精准地进行探索和导航，从而为分子科学领域的研究和发展开...