基础模型的相关内容 - 漫话开发者

2024-05-03 talkingdev

使用对抗调优技术进行图像分割：Meta AI推出ASAM模型

Meta AI最新推出的Segment Anything Model（简称SAM）是计算机视觉领域的一个重要的基础模型，该模型在图像分割方面表现出色，但在某些特定领域中却显得力不从心。为了解决这个问题，Meta AI推出了一项新的项目，即A...

2024-05-02 talkingdev

Reka是一家专业训练大型基础模型的公司，尽管资金规模只是顶级玩家的一小部分，但其发展速度却迅速赶超了一些业界最佳参与者。近日，Reka发布了其内部评估套件Vibe-Eval的一个子集，该套件被用于确定其模型的强度。...

2024-05-01 talkingdev

Mamba模型是一种先进的方法，擅长处理长序列，而不会带来传统Transformers的计算缺点。在计算机视觉领域，Mamba模型已经取得了显著的成果，并在多个应用中展现出其优越性。相比于传统的Transformers模型，Mamba模型...

2024-04-16 talkingdev

Eleuther团队近期对T5模型进行了重新训练，采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马，此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整，Pile-T5在多项基...

2024-04-12 talkingdev

Mistral公司近日发布了一款新型的8x22B模型，并通过磁力链接供用户下载体验。根据社区首批基准测试结果显示，该模型作为基础模型表现突出，其77 MMLU（与推理能力密切相关的指标）得分令人瞩目。这一新模型的出现，...

2024-04-12 talkingdev

Cohere公司近日发布了其最新的基础模型——Rerank 3，专为提升企业搜索和检索增强生成（RAG）系统而设计。该模型兼容任何数据库或搜索索引，并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码，R...

2024-04-09 talkingdev

最近的一份全面研究调查了医疗保健基础模型（Healthcare Foundation Models，简称HFMs）在改变医疗服务方面的潜力。这些模型预先在多样化的数据上进行训练，非常适合适应各种医疗保健任务，从而有可能在众多场景中提...

2024-04-03 talkingdev

YC支持的25家创业公司通过培训或微调自有的基础模型，打破了构建AI模型需要巨额资源的传统观念。这些公司在短时间内取得了显著成就，如创造专业音乐和设计新型蛋白质。这些公司利用YC的资金和技术支持，跨越不同领域...