计算机的相关内容 - 漫话开发者

2023-11-17 talkingdev

论文：智能眼镜上的物体检测技术

该团队创建了一个新的面向视觉的RISC-V硬件，并训练了一个超小的YOLO计算机视觉模型，实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。

2023-11-15 talkingdev

OpenAI正在开发GPT-5，并寻求微软公司的额外资金支持。OpenAI是由伊隆·马斯克和其他硅谷执行人员创立的非营利组织，旨在推动开放式AI研究。该组织计划在未来几年内推出更多的AI技术，包括在自然语言处理、计算机视觉...

2023-11-14 talkingdev

AI 小镇是一个令人惊叹的实验，在这里，数百个代理在语言模型的提示状态下过着日常生活。 RWKV 模型是一种线性语言模型，需要比标准 Transformer 更少的资源。此存储库使用这个更便宜的模型在您的本地计算机上运行 A...

2023-11-10 talkingdev

Roboflow是一个计算机视觉工具包，通过可组合的代码片段使应用程序开发更加容易。现在，随着GPT-4 Vision进入OpenAI API，Roboflow团队已经制作了一些演示，展示如何与segment anything和DINO一起使用它。

2023-11-09 talkingdev

受 Actor 框架的启发，这个轻量级的 Python 库使得创建基于 LLM 动力的代理变得非常容易。Langroid 多智能体编程框架（Langroid multi-agent programming framework）最近发布了他们的 GitHub Repo，使得该项目的开...

2023-11-09 talkingdev

CogVLM-17B是一个开放式的视觉语言模型，具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色，并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型，将为计算机视觉和自然语言处理领域的发...

2023-11-09 talkingdev

Nvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲，介绍了一款名为ChipNeMo的大型语言模型，旨在提高芯片设计师的生产力。尽管尚未完全证明，但ChipNeMo有助于为设计工具编写脚本，总结错误报告，并为设计师提...

2023-11-08 talkingdev

我们已经在不愿意投资只是包装GPT的公司方面看到了这一点，现在更加清晰了。随着能够查询上传的PDF的能力，一大批初创公司被抹去了。