模型的相关内容 - 漫话开发者

2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试，超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频（text-to-video）和图像生成视频（image-to-video）两项核心任务中均位列榜首，其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

2025-06-12 talkingdev

v0平台最新推出的设计模式（Design Mode）彻底改变了用户与生成式AI的交互方式。该功能允许用户在不消耗积分的情况下，实时调整生成内容并预览修改效果，显著提升了设计流程的效率。这一创新技术通过优化大语言模型...

2025-06-12 talkingdev

OpenAI首席执行官Sam Altman近期发表题为《温和奇点》的专题文章，系统阐述了人类即将构建数字超级智能（Digital Superintelligence）的技术前景与社会影响。该文通过逐段解构发现，Altman试图传递一种审慎乐观的技...

2025-06-12 talkingdev

近日，GitHub上开源了一项名为Weak-to-Strong Decoding（WSD）的创新技术，该方法通过让小型的对齐模型（aligned model）生成回答的开头部分，再由大型基础模型（base model）继续完成后续内容，从而在保持模型性能...

2025-06-12 talkingdev

Meta近日正式推出V-JEPA 2视觉世界模型，该技术突破性实现了AI代理对物理环境的动态推理能力。作为Yann LeCun团队世界模型研究的最新成果，V-JEPA 2通过自监督学习架构，使AI系统能够基于视频输入预测物理交互结果。...

2025-06-11 talkingdev

JavelinGuard是一套专为检测大语言模型(LLM)交互中恶意意图而设计的低成本高性能模型架构。该研究提出了多种具有不同速度、可解释性和资源需求权衡的架构方案，并特别针对生产环境部署进行了优化。论文详细探讨了这...

2025-06-11 talkingdev

强化学习预训练（Reinforcement Pre-Training, RPT）作为大语言模型（LLM）与强化学习（RL）协同进化的前沿技术，提出了一种革命性的规模化训练范式。该技术通过创新性地利用海量文本数据进行通用强化学习预训练，在...

2025-06-11 talkingdev

上海科研团队最新发布的DiTorch和DiComm技术框架，突破了AI训练对同构硬件的依赖。该创新通过统一编程接口整合NVIDIA、AMD等异构芯片架构，在1,024块规格差异显著的芯片集群上训练千亿参数模型时实现116%的超线性效...