漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-27 talkingdev

ConvSearch-R1开源:无监督对话搜索查询重构技术

GitHub开源项目ConvSearch-R1提出了一种创新的自监督对话搜索技术,通过强化学习和基于检索的奖励机制,实现了无需外部监督的对话查询重构。该技术利用强化学习框架,将用户对话中的模糊查询自动转化为精准的搜索语...

Read More
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
2025-05-18 talkingdev

[开源] 使用SBERT建模《伏尼契手稿》结构:NLP技术探索中世纪未解之谜

一位开发者利用自然语言处理(NLP)技术对神秘的《伏尼契手稿》进行了结构性分析。该手稿是15世纪以未知文字书写的古籍,至今未被破译,其真实性也饱受争议。项目采用SBERT(Sentence-BERT)模型生成词根嵌入,结合K...

Read More
2025-05-14 talkingdev

语义计算器新尝试:词向量加减法探索(king-man+woman=?)

近日,一款基于词向量嵌入技术的语义计算器引发开发者社区关注。该工具突破传统词向量演示案例(如经典的king-man+woman=queen),通过距离计算和余弦相似度排序,全面展示词汇加减运算的语义结果。开发者透露,当前...

Read More
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-02 talkingdev

谷歌医疗AI突破:AMIE新增医学影像分析能力,实现类医生精准诊疗

谷歌研究团队近日宣布其医疗对话AI系统AMIE(Articulate Medical Intelligence Explorer)取得重大升级,新增医学影像分析功能。这一突破性进展使AMIE在基于聊天的诊断过程中能够同步解读X光片、CT扫描等医学影像,...

Read More
2025-04-30 talkingdev

NotebookLM音频播客现已支持超过50种语言

谷歌实验室最新宣布,其AI笔记工具NotebookLM的音频概述功能已扩展至50多种语言,标志着该技术在多语言支持方面取得重大突破。这一更新使得全球更多用户能够通过语音交互快速获取文档摘要,显著提升了知识管理效率。...

Read More
2025-04-18 talkingdev

Meta发布多项AI新成果:图像编码器、视觉语言模型及3D物体定位系统

Meta公司近日重磅推出四项人工智能领域的重要技术成果:1)高性能图像编码器,可优化视觉数据的特征提取效率;2)视觉语言模型(VLM),实现跨模态理解与生成;3)基于联合嵌入预测架构(JEPA)的3D物体定位模型,突...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page