漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-20 talkingdev

[论文推荐]LLM安全评估系统的鲁棒性研究揭示重大漏洞

最新发表在arXiv的研究论文指出,基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明,这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...

Read More
2025-05-20 talkingdev

[开源]基于AWS低成本微调Qwen2.5B模型实现推理能力突破

GitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案,该方案采用SFT(监督微调)结合GRPO(梯度反向传播优化)的混合训练框架,其技术路线受到DeepSeek R1架构启发,并针对AWS云平台进行了专项优化...

Read More
2025-05-19 talkingdev

ParScale开源LLM扩展范式-训练与推理并行计算

人工智能领域迎来重大技术突破,开源项目ParScale通过创新性地在大型语言模型(LLM)的训练和推理阶段同时应用并行计算技术,成功建立了第三种LLM扩展范式。这一技术突破解决了传统序列计算模式在超大规模模型应用中...

Read More
2025-05-19 talkingdev

[论文推荐]WavReward:基于音频语言模型的对话系统评估新方法

来自arXiv的最新研究论文提出了一种名为WavReward的创新评估系统,该系统基于音频语言模型,专门用于评估语音对话系统在认知和情感指标上的表现。WavReward通过在ChatReward-30K数据集上进行训练,该数据集包含了大...

Read More
2025-05-19 talkingdev

[论文推荐]大型语言模型说服力超越人类:Claude 3.5 Sonnet在辩论实验中表现优异

最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...

Read More
2025-05-18 talkingdev

[开源] 使用SBERT建模《伏尼契手稿》结构:NLP技术探索中世纪未解之谜

一位开发者利用自然语言处理(NLP)技术对神秘的《伏尼契手稿》进行了结构性分析。该手稿是15世纪以未知文字书写的古籍,至今未被破译,其真实性也饱受争议。项目采用SBERT(Sentence-BERT)模型生成词根嵌入,结合K...

Read More
2025-05-16 talkingdev

OpenAI发布Codex研究预览:AI编程助手的新里程碑

OpenAI近日发布了其AI编程助手Codex的研究预览版,这一突破性技术基于GPT-3模型,专门针对代码生成和编程任务进行了优化。Codex能够理解自然语言指令并将其转化为功能性代码,支持包括Python、JavaScript、Go等在内...

Read More
2025-05-16 talkingdev

KVSplit开源-苹果上运行更长上下文的LLM,内存减少59%

近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page