边缘计算的相关内容 - 漫话开发者

2025-07-04 talkingdev

本地运行与微调Gemma 3N指南：基于llama.cpp与Unsloth的实践方案

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行，技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点：1）利用llama.cpp的量化推理优化实现低资...

2025-06-30 talkingdev

PyTorch与vLLM近日宣布深化技术整合，新增支持量化、注意力机制定制及异构硬件加速等关键功能。这一合作标志着两大开源框架在优化大语言模型（LLM）推理性能方面取得重要突破：量化技术可降低模型计算资源消耗达4-8...

2025-06-30 talkingdev

FedEDS是一种针对边缘设备联邦学习的新型方案，其创新性地通过客户端间加密数据共享机制，有效解决了数据异构性和物理分布带来的性能瓶颈。该技术突破由arXiv最新研究论文披露，通过同态加密和分布式密钥管理，在保...

2025-06-27 talkingdev

Meta旗下FAIR研究团队在arXiv最新论文中提出重大架构革新，通过名为Dynamic Tanh（DyT）的逐元素操作替代传统归一化层，使Transformer模型在保持性能的同时摆脱了对归一化层的依赖。这种S型曲线模拟技术能够自然复现...

2025-06-27 talkingdev

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n，该模型采用多模态设计，专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入，展现了强大的跨模态处理能力。为推广该模型，谷歌与AMD、Axolotl、Docker...

2025-06-24 talkingdev

谷歌DeepMind近日发布了Gemini Robotics On-Device，这是一种高效的本地机器人模型，具备通用灵巧性和快速任务适应能力。该技术突破意味着机器人设备可以在不依赖云端的情况下，实现更复杂的操作和更快的响应速度。...

2025-06-20 talkingdev

Cloudflare技术团队近期推出的use-mcp库为React开发者提供了革命性的远程连接解决方案。该开源库通过封装传输协议、认证机制和会话管理等复杂逻辑，使开发者仅需三行代码即可实现React应用与MCP服务器的稳定连接。作...

2025-06-18 talkingdev

开发者psviderski近日开源了Unregistry工具，解决了Docker镜像部署中繁琐的'推送到仓库/从仓库拉取'流程。该工具创新性地利用Docker宿主机自带的containerd镜像存储，通过标准Registry API暴露接口，新增`docker pus...