漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-27 talkingdev

OpenAI Cookbook发布:利用强化微调模型提升医疗任务性能

OpenAI最新发布的Cookbook教程详细介绍了如何通过强化微调技术(RFT)提升o4-mini模型在医疗任务中的表现。该教程不仅涵盖了技术实现步骤,还重点探讨了如何应对奖励机制滥用(reward hacking)和模型评分不准确等关...

Read More
2025-05-12 talkingdev

OpenAI推出HealthBench:AI系统与人类健康的评估新标准

OpenAI近日发布了名为HealthBench的创新评估框架,旨在为人工智能系统在人类健康领域的应用设定新的基准。这一工具不仅关注AI的技术性能,更着重评估其对人类健康产生的实际影响,标志着AI伦理和实用性评估的重要进...

Read More
2025-05-02 talkingdev

谷歌医疗AI突破:AMIE新增医学影像分析能力,实现类医生精准诊疗

谷歌研究团队近日宣布其医疗对话AI系统AMIE(Articulate Medical Intelligence Explorer)取得重大升级,新增医学影像分析功能。这一突破性进展使AMIE在基于聊天的诊断过程中能够同步解读X光片、CT扫描等医学影像,...

Read More
2025-04-28 talkingdev

DeepMind伦敦员工拟成立工会 抗议军事合作与伦理争议

约300名DeepMind伦敦员工正推动成立工会组织,主要动因是对公司军事合作项目及伦理承诺的担忧。作为Alphabet旗下最具影响力的人工智能实验室,DeepMind长期参与国防相关AI技术研发,包括与以色列政府的合作项目。此...

Read More
2025-04-03 talkingdev

[开源]大规模医学推理数据集MedReason发布,推动可解释医疗AI研究

加州大学圣克鲁兹分校视觉、语言与行为实验室(VLAA)在GitHub开源了MedReason项目,这是一个专为提升大语言模型(LLM)医疗推理能力构建的大规模数据集。该数据集通过结构化临床案例、医学知识图谱和多模态数据,旨...

Read More
2025-01-23 talkingdev

MedSSS:基于自进化管道的慢思考小型医疗语言模型

近日,GitHub上发布了一个名为MedSSS的医疗推理项目,该项目是一个基于自进化管道的慢思考小型医疗语言模型。MedSSS的设计旨在通过模拟人类医生的慢思考过程,提供更精准的医疗推理能力。该模型通过自进化管道不断优...

Read More
2024-05-23 talkingdev

MedLFQA:提升医疗AI准确性的全新数据集

MedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...

Read More
2024-03-22 talkingdev

医疗异常检测新突破:CLIP模型的创新应用

近期,一项新项目在GitHub上发布,该框架通过结合多级残差适配器和视觉-语言对齐损失函数,将CLIP模型重新应用于医疗异常检测。CLIP模型原本是由OpenAI开发的一种多模态预训练模型,能够理解图像和文本之间的关系。...

Read More
  1. Next Page