漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-15 talkingdev

Tinker全面开放并集成视觉输入能力,推理模型Kimi K2 Thinking正式上线

人工智能平台Tinker今日宣布结束等待名单,正式向所有用户开放,并同步推出多项重要技术更新。本次更新的核心亮点包括:引入全新的推理模型Kimi K2 Thinking,该模型拥有万亿级参数,专为处理长链条复杂推理和工具调...

Read More
2025-12-12 talkingdev

企业AI应用增长停滞:OpenAI份额下滑,Anthropic与谷歌逆势增长

根据最新市场监测数据,2025年11月企业级人工智能(AI)的采用率稳定在45%,增长势头出现明显停滞。这一现象在金融和科技这两个传统上对新技术最为敏感的行业尤为突出,其采用率甚至出现了轻微下滑。值得关注的是,...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-12-03 talkingdev

Mistral AI发布Mistral 3系列开源模型:含稀疏MoE巨兽与多款密集模型

人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型,该系列包含两大技术路线:一是三款不同规模的密集模型(参数规模分别为140亿、80亿和30亿),二是备受瞩目的Mistral Large 3稀疏混...

Read More
2025-12-02 talkingdev

开源|ViBT:20B参数视觉桥接Transformer,高效图像与视频编辑新突破

近日,GitHub上开源了一个名为ViBT(Vision Bridge Transformer)的项目,该项目将布朗桥模型(Brownian Bridge Models)扩展至高达200亿参数规模,专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

Read More
2025-11-30 talkingdev

专访诺奖得主John Jumper:AlphaFold的创造性“超范围应用”与LLM融合前瞻

在《麻省理工科技评论》的深度访谈中,谷歌DeepMind诺奖得主John Jumper揭示了AlphaFold超越传统蛋白质结构预测的突破性应用。这位2017年刚获得理论化学博士学位的科学家,如今正引领团队探索AlphaFold在药物设计、...

Read More
2025-11-30 talkingdev

NanoPDF:用Gemini Nano Banana模型通过自然语言编辑PDF演示文稿

开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型(代号Nano Banana)推出开源CLI工具Nano PDF,实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像,结合用户文本提示调用多模态AI...

Read More
2025-11-23 talkingdev

Fourty.News:用AI重现40年前新闻,在历史中寻找当下焦虑的解药

近日上线的Fourty.News项目通过技术创新实现了独特的新闻阅读体验——将40年前的历史新闻经过AI处理重新编排成每日资讯。该项目采用多步骤大语言模型流水线技术:首先通过OCR将旧报纸扫描件转为文本,随后运用包含戏剧...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page