智能化的相关内容 - 漫话开发者

2024-05-23 talkingdev

MiniCMP-V开源新版本，可在手机上处理视觉任务

近日，MiniCMP-V发布了一个基于Llama 3训练的新版本。这款8B模型在多个任务上表现出色，甚至超越了许多闭源的专有模型。新版本的MiniCMP-V不仅支持30种不同的语言，还在光学字符识别（OCR）和视觉问答（visual quest...

2024-05-22 talkingdev

Elon Musk的人工智能公司xAI正在提升其Grok聊天机器人的能力，使其能够支持多模态输入。此举将允许用户上传照片，并获得基于文本的回答。这一功能的加入不仅会拓宽Grok的应用场景，还将提高其在用户交互中的智能化水...

2024-05-15 talkingdev

OpenAI的最新研究成果GPT-4o的多模态能力，整合了视觉和语音技术，预示着人工智能与世界互动方式的重大进步。这为人工智能在日常生活中的普遍存在铺平了道路。GPT-4o的多模态能力，不仅能够理解文本信息，还能够理解...

2024-05-15 talkingdev

在2024年的Google I/O开发者大会上，Google发布了众多新功能，包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言，这些改进数量惊人，包括扩大到2m的令牌上下文长度，大幅降低的模型价格...

2024-05-14 talkingdev

苹果公司正在与OpenAI接近达成一项协议，计划将ChatGPT技术整合到iPhone中，可能会在即将推出的iOS 18版本中作为其AI增强功能的一部分。ChatGPT是一款深度学习模型，可以生成人类的语言，此举将极大地提升iPhone的AI...

2024-05-03 talkingdev

据预期，苹果首席执行官Tim Cook将在下周的“Let Loose”活动中预示新的人工智能特性，并在六月的全球开发者大会(WWDC)上公布更多细节。新的iPad Pro模型可能会配备M4芯片，这意味着苹果即将推出的产品可能具有先进的...

2024-05-01 talkingdev

苹果公司即将推出的Safari 18浏览器将会引入一些用户界面的增强功能，包括一种由AI驱动的智能搜索功能以进行内容概述，以及一种名为'网页橡皮擦'的高级内容拦截功能。这些新的功能将极大地提升用户的浏览体验，使其...

2024-04-30 talkingdev

近日，GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息，通过我们的记忆模块推断用户知识，只检索与结果相关的信息。Memary的核心是其强大的知识图谱，这是一种可以存储和组织大量...