模型的相关内容 - 漫话开发者

2025-02-21 talkingdev

AI推动SaaS定价模式变革：你准备好了吗？

随着AI技术的快速发展，SaaS行业的定价模式正在经历一场深刻的变革。传统的基于席位的定价模式正逐渐被基于使用量的定价（UBP）所取代。Kyle Poyar，SaaS定价领域的专家，将于2月26日参加Metronome的新定价网络研讨...

2025-02-21 talkingdev

DeepEval是一个开源框架，专注于评估和测试大型语言模型系统。它整合了最新的研究成果，通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...

2025-02-21 talkingdev

Figure公司近日展示了一款新型Vision-Language-Action（VLA）模型，专为人形机器人设计。VLA模型通过结合视觉和语言命令处理信息，使得机器人能够通过视频和大型语言模型的组合进行训练。Figure的Helix模型特别引人...

2025-02-21 talkingdev

据匿名消息源透露，人工智能技术公司OpenAI可能正在准备下周发布GPT-4.5，而下一代模型GPT-5也预计于5月问世。微软对GPT-5的期待尤为迫切，因为其年度开发者大会将于5月22日举行。尽管GPT-5可能在能力和效率上有所提...

2025-02-20 talkingdev

近日，BadSeek项目揭示了如何在大型语言模型（LLM）中植入后门的技术细节。该项目通过深入研究LLM的embedding机制，展示了如何在不影响模型整体性能的情况下，植入特定的触发机制，从而在特定条件下激活后门功能。这...

2025-02-19 talkingdev

近日，DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术，旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制，实现了高达11倍的计算速度提升，同时保持了整体...

2025-02-18 talkingdev

Mistral Saba是一款基于中东和南亚地区精心策划数据集训练的24B参数模型。尽管其规模仅为同类模型的五分之一，但Mistral Saba在提供更准确和相关响应方面表现出色，同时显著降低了计算成本和响应时间。这一突破性技...

2025-02-18 talkingdev

xAI公司近日发布了其最新旗舰人工智能模型Grok 3，并展示了针对iOS和网页应用的新功能。Grok 3的训练使用了位于孟菲斯的庞大数据中心，该中心配备了约20万个GPU。Grok 3系列模型包括：Grok 3 mini，它以牺牲部分准确...