漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-08 talkingdev

Consistency LLM:将LLMs转换为并行解码器可将推理加速3.5倍

Consistency LLM是一种新的自然语言处理模型,可以将其转换为并行解码器,从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型,但推理速度较慢。该研究团队将LLM转换为并行解码器,使用了一种名为一致性训...

Read More
2024-05-03 talkingdev

开源实现扩展LLM大模型到128K上下文长度

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

Read More
2024-05-02 talkingdev

亚马逊推出面向企业和开发者的生成式AI助手——Amazon Q

AWS近日推出了Amazon Q,这是一款生成式AI助手,目标是通过利用公司的内部数据来改善软件开发和决策制定过程。Amazon Q不仅为开发者提供了编码、测试和应用开发的便利,同时还通过自然语言交互为商业用户提供了数据...

Read More
2024-05-02 talkingdev

Anthropic发布Claude AI聊天机器人iOS应用

Anthropic近日推出了其Claude 3 AI语言模型的iOS移动应用,并且引入了一个为团队协作设计的新的订阅级别。Claude 3 AI是Anthropic的最新产物,它可以理解和生成自然语言,提供了一个强大的工具,使得用户可以以更人...

Read More
2024-04-29 talkingdev

LMSYS正在测试GPT-4.5或GPT-5?

据报道,LMSYS正在进行GPT-4.5或GPT-5的测试。这是一项令人兴奋的技术进步,将进一步提高自然语言处理的质量和准确性,同时也将为人工智能领域带来更多的发展机会。 尽管这些新技术的细节尚未公开,但LMSYS的测试表...

Read More
2024-04-20 talkingdev

LLMs在金融市场的应用

近年来,随着人工智能技术的飞速发展,越来越多的金融机构开始将自然语言处理技术应用于金融市场分析中。在这方面,LLMs(大规模语言模型)无疑是最受关注的技术之一。LLMs是一种基于深度学习的自然语言处理技术,它...

Read More
2024-04-15 talkingdev

Gemma和Siglip推出VLLM,利用LAION和LLaVA数据集进行训练

Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...

Read More
2024-04-15 talkingdev

BabyLM挑战赛:探索用婴儿级数据训练顶级文本与视觉模型

近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page