漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-25 talkingdev

[开源] Baichuan Omni 1.5:开源全模态基础模型支持多模态输入输出

Baichuan Omni 1.5 是一款支持文本、图像、视频和音频输入以及文本和音频输出的开源全模态基础模型。该模型采用任意到任意(any-to-any)的设计风格,属于原生多模态模型的一种典型代表。其核心技术在于使用了交错的...

Read More
2025-03-18 talkingdev

小红书接入DeepSeek大模型,AI搜索产品“点点”推出“深度思考”功能

近日,钛媒体AGI独家获悉,小红书即将接入DeepSeek-R1开源模型,其AI搜索产品“点点”App将推出“深度思考”功能,目前该功能正处于内测体验阶段。这一举措标志着小红书在AI技术应用领域的进一步深化。截至2024年6月,小...

Read More
2025-02-21 talkingdev

Flex 1图像生成模型在Hugging Face Hub发布,性能与速度兼具

近日,社区推出了一款名为Flex 1的图像生成模型,该模型基于Flux Schnell进行微调,并采用Apache许可证。Flex 1的设计参数为8B,能够在保持高性能的同时实现快速运行。这一模型的推出为图像生成领域提供了新的工具,...

Read More
2024-08-01 talkingdev

Flux:开源文本到图像模型,参数达到120亿

由 FAL 团队开发的 Flux 是一个新的文本到图像模型,它是一个参数量达到 120 亿的深度神经网络。这个模型能够从文本描述中生成高质量、多样性的图像,它会对输入的文本进行语义分析,并且能够根据文本描述生成精细的...

Read More
2024-07-15 talkingdev

ViTime:利用视觉智能进行时间序列预测的开源模型

ViTime是一种用于时间序列预测的基础模型,它利用的是视觉智能而非传统的数值数据拟合。与传统的时间序列预测模型不同,ViTime通过视觉智能来捕捉数据的模式和趋势,从而提供更准确的预测。这种新颖的方法为时间序列...

Read More
2024-06-25 talkingdev

Anthropic CEO: 创业中的AI安全与经济不平等问题

Anthropic是一家专注于研究尖端AI系统并开发新安全方法的初创公司,与OpenAI形成竞争,提供强大的工具供公众和企业使用。最近,Anthropic发布了其Claude聊天机器人的最新版本——Claude 3.5 Sonnet,该版本在推理、编...

Read More
2024-06-21 talkingdev

苹果为提升文字与图像AI性能,开源了20个机器学习模型

苹果公司最近向Hugging Face开源AI仓库贡献了20个Core Machine Learning模型,以此来提升公有模型在图像分类和深度分割方面的性能。此举紧随苹果发布Ferret大型语言模型和四个OpenELMs到Hugging Face的步伐。这一举...

Read More
2024-06-19 talkingdev

FireFunction-v2:匹配GPT4-o功能调用基准的开源模型

FireFunction-v2是一个开放模型,它在功能调用基准上与GPT4-o相匹配,这个模型是在Llama 3 70B的基础上训练出来的。这一模型的开发将为AI领域带来新的突破。FireFunction-v2的性能表现优秀,证明了它在处理大规模数...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page