漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-02 talkingdev

OpenMed突破:仅165美元训练覆盖25个物种的mRNA语言模型,CodnRoBERTa性能显著领先

近日,OpenMed团队在Hugging Face平台发布了一项重要成果,展示了其构建的端到端蛋白质AI全流程。该流程涵盖了蛋白质结构预测、序列设计以及关键的密码子优化环节。研究团队对多种Transformer架构进行了深入的密码子...

Read More
2026-03-27 talkingdev

企业AI治理面临挑战:Cato AI Security推出解决方案,助力应对“影子AI”与数据泄露风险

随着人工智能技术在各类工具、应用和智能体中的快速普及,其部署速度已远超企业现有的治理与安全管控能力。当前,安全团队面临的核心挑战已从传统边界防护,转向管理AI交互过程中的动态风险:包括输入数据的敏感性、...

Read More
2026-03-27 talkingdev

开发者将AI智能体部署于7美元/月VPS,IRC协议竟成通信层新选择

近日,一位开发者展示了一项颇具创意的低成本AI部署方案。该项目将两个AI智能体分别部署在独立的服务器上,构建了一个分层、高效的交互系统。公开智能体“nullclaw”是一个仅678KB的Zig语言二进制程序,运行内存约1MB...

Read More
2026-03-18 talkingdev

开源|MoDA:硬件感知的高效混合深度注意力机制实现

近日,GitHub上开源了一个名为MoDA的项目,它实现了一种创新的注意力机制——混合深度注意力。该机制的核心突破在于,允许注意力头同时访问当前层以及更早层的键值对。这一设计旨在解决随着模型深度增加,信息在传递过...

Read More
2026-03-16 talkingdev

突破性研究:Transformer能否成为通用计算机?Percepta展示在模型内部执行C程序

人工智能研究机构Percepta近期发布了一项前沿研究成果,探讨了大型语言模型(LLMs)作为通用计算设备的可能性。该研究成功在Transformer架构内部构建了一个“计算机”,能够高效执行任意的C语言程序,并运行数百万个计...

Read More
2026-02-25 talkingdev

通义千问Qwen3.5-35B-A3B模型发布:支持26万超长上下文,集成多模态与强化学习突破

近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

Read More
2026-02-23 talkingdev

开源|突破显存限制:开发者实现单张RTX 3090运行Llama 3.1 70B,NVMe直连GPU绕过CPU

近日,在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目,其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信,绕过CPU和系统内存的传统数据路径,从而在消费级显卡RTX 3090上成功运行了参数量...

Read More
2026-02-20 talkingdev

开源|Micasa:一款由AI编程的终端家居管理工具,数据全在单个SQLite文件中

近日,一款名为Micasa的开源工具在开发者社区引发关注。它是一款运行在终端(Terminal)的文本用户界面(TUI)应用,旨在帮助用户高效管理家庭事务,从记录洗碗机滤网清洁周期、后院改造报价,到追踪墙面霉菌处理等...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page