漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

Llama指南:如何开始使用

本指南提供信息和资源,帮助您设置Llama,包括如何访问模型、托管以及如何和集成指南。Llama是一个开源的自然语言处理模型,可以用于文本分类、情感分析和实体识别等任务。使用Llama能够提高文本处理的效率和准确性...

Read More
2023-11-02 talkingdev

开源的LangChain模板仓库

这些模板是一组参考架构,适用于各种流行的LLM用例,是构建生产就绪的LLM应用程序最简单和最快速的方法。

Read More
2023-11-01 talkingdev

TESTA开源,快速理解长视频方案

TESTA,一种旨在通过组合相似帧和补丁来加速理解长视频的方法。使用TESTA,研究人员成功地降低了计算负荷,并提高了匹配段落到视频以及回答关于长视频的问题的性能。

Read More
2023-11-01 talkingdev

自我监督去噪新方法PUCA开源

近日,一项名为PUCA的自我监督去噪新方法在GitHub上发布。该研究对于有效去噪保持J不变性是一个至关重要的方面。研究人员表示,PUCA的特点在于其利用了无噪声图像的自我监督来训练,从而可以在保持图像质量的同时去...

Read More
2023-11-01 talkingdev

COMM开源,改进多模态LLMs性能

近期,研究人员深入探究了多模态大型语言模型(MLLMs)中使用的视觉编码器,并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM,一种结合了两种模型优点的策略。COMM能够显著提高LLMs...

Read More
2023-10-31 talkingdev

AI Logger开源,为Azure OpenAI增加可观测性

Azure OpenAI Logger (GitHub Repo) 项目发布,为Azure OpenAI增加可观测性。该项目旨在创建一种简单易部署的解决方案,以向您的Azure OpenAI实例添加可观测性。该方法将API管理实例作为现有的Azure OpenAI服务的代...

Read More
2023-10-31 talkingdev

ICTC-个性化图像聚类库开源

这篇论文介绍了一种名为IC⁠TC的基于文本条件的图像聚类方法,该方法利用视觉语言模型根据用户提供的文本描述对图像进行排序。IC⁠TC方法使用了预训练的视觉语言模型来生成图像和文本之间的嵌入,然后使用这些嵌入来聚...

Read More
2023-10-31 talkingdev

开源Whisper Large v2音频转录速度破纪录

OpenAI的Whisper Large v2音频转录模型发布了。这个模型采用了非常先进的技术,可以在不到10分钟的时间内转录出300分钟的音频。这一速度远远超过了之前的音频转录模型,对于信息的获取和处理提供了极大的便利。这个...

Read More
  1. Prev Page
  2. 69
  3. 70
  4. 71
  5. Next Page