漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-12 talkingdev

论文:PaliGemma技术报告-基于SigLIP 和 Gemma 2B的强大视觉语言模型

PaliGemma是一款基于SigLIP和Gemma 2B的强大视觉语言模型。这份技术报告详细阐述了在构建PaliGemma过程中的架构选择和数据收集方面所做的决策。SigLIP和Gemma 2B的结合使得PaliGemma在视觉语言建模方面展现出卓越性...

Read More
2024-05-29 talkingdev

谷歌搜索API文档泄露 揭示搜索引擎内部数据收集细节

近期,一份来自谷歌搜索的API文档遭到泄露,这份长达2500页的文档共有14,014个属性,似乎来源于谷歌内部的内容API仓库。虽然文档没有展示搜索排名算法中特定元素的权重或证明哪些元素被用于排名系统,但它揭示了谷歌...

Read More
2024-05-24 talkingdev

构建交互式嵌入可视化的经验分享

一位热衷于交互式嵌入可视化的人士分享了他们在创建这种可视化过程中的精炼工作流程。这种可视化能够传达高维空间中实体之间的复杂关系。整个过程包括数据收集、构建共现矩阵、稀疏化矩阵、使用PyMDE进行嵌入,以及...

Read More
2024-04-01 talkingdev

论文:新技术助力研究人员深入理解户外环境

研究人员最近提出了一种全新的方法来认识户外环境,该方法克服了以往因条件变化和数据缺乏而限制发展的障碍。通过综合考虑户外环境的多样性和复杂性,研究者们开发了一套先进的算法和技术,能够更加准确地捕捉和分析...

Read More
2024-03-27 talkingdev

Facebook秘密项目揭秘:监听Snapchat用户流量以研究用户行为

根据泄露的文件显示,Facebook曾经开展了一项秘密项目,该项目旨在拦截并解密Snapchat的网络流量,目的是为了深入了解用户行为,并借此帮助Facebook在与Snapchat的竞争中取得优势。这种做法引发了用户隐私保护的严重...

Read More
2024-03-12 talkingdev

Covariant推出ChatGPT,为机器人构建LLM

Covariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...

Read More
2024-03-11 talkingdev

01.AI发布Yi开放基础模型

01.AI团队发布了一篇论文,详细介绍了Yi模型的数据收集和训练过程。Yi模型一直是最强大的开放语言模型之一。

Read More
2024-03-01 talkingdev

Distilabel-框架用于对齐数据收集

Distilabel是为AI工程师设计的框架,使用人类反馈的强化学习方法(例如奖励模型和DPO)对大型语言模型进行对齐。 它主要专注于LLM微调和适应性。 Distilabel可协助数据收集,清洗和训练。

Read More
  1. Next Page