近日,开源社区迎来一款名为GLM-Image的工业级离散自回归图像生成模型,其采用了一种创新的混合架构,将自回归模块与扩散解码器相结合,标志着生成式AI在图像合成领域的技术路线探索进入新阶段。该模型的核心优势在...
Read More在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...
Read More近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导,其核心目标是简化从复杂网页中提取结构化信息的流程,并将...
Read MoreMeta旗下PyTorch团队正式开源ExecuTorch项目,这是一个专为在移动设备、嵌入式系统和边缘计算节点上高效部署人工智能模型而设计的端到端解决方案。ExecuTorch旨在解决AI模型在资源受限环境中的部署难题,其核心价值...
Read More近日,GitHub上开源了一个名为Stirrup的新型轻量级框架,专为构建高级智能体(Agent)而设计。该框架的核心创新在于其“模型自主决策”理念:不同于传统框架严格规定执行流程,Stirrup允许AI模型根据任务情境,自行选...
Read More近日,智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型,GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本,此次更新在多个维度实现了显...
Read More一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read More