Git的相关内容 - 漫话开发者

2023-11-16 talkingdev

一个开源的GPT-V生成UI的Demo

最近，一位GitHub用户发布了一款基于GPT-V生成UI的Demo。该Demo使用了一款简单易用的手绘界面，可用于创建HTML网站。用户只需在手绘界面中简单勾画出所需的UI元素，GPT-V模型即可自动将其转化成相应的HTML代码。该De...

2023-11-16 talkingdev

近日，有学者在GitHub上发布了一项新的研究项目，名为“知识偏好对齐（KnowPAT）”，该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术，可以更加精准地针对特定领域提出问题，从而得到更加准确...

2023-11-15 talkingdev

经过增强的LLaMA模型现已包含16,000个泰米尔语令牌，利用了LoRA方法进行高效训练。这个更新，连同Alpaca和OpenOrca数据集的新的泰米尔语版本，显著改进了泰米尔语文本处理，为印度语言人工智能的未来发展铺平了道路...

2023-11-14 talkingdev

AI 小镇是一个令人惊叹的实验，在这里，数百个代理在语言模型的提示状态下过着日常生活。 RWKV 模型是一种线性语言模型，需要比标准 Transformer 更少的资源。此存储库使用这个更便宜的模型在您的本地计算机上运行 A...

2023-11-14 talkingdev

随着强大的新视觉模型的出现，许多团队正在尝试构建使用视觉与Web元素交互的代理程序。Tarsier工具包介绍了一套标准工具（例如元素标记），您可以使用任何视觉系统来理解网页并执行操作。它还包括用于非视觉语言模型...

2023-11-14 talkingdev

音频超分辨率是提高任何音频的质量和保真度的过程，无论是真实的还是合成的。大多数超分辨率系统都是针对特定任务而设计的，单个模型仅针对单个音频数据类型进行训练（如语音与音乐）。这项新工作是一个惊人的进步，...

2023-11-14 talkingdev

近日，研究人员开源了一个名为Dual-Guided Spatial-Channel-Temporal（DG-SCT）的新型注意力机制，可用于增强预先训练的音频-视频模型，以用于多模态任务。该机制具有两个分支，一个是空间通道分支，另一个是时间分...

2023-11-14 talkingdev

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs，提示，超过100个工具，向量数据库，检索算法和聊天历史数据库。该项目使用LangChain，LangServe和LangSmith。OpenGPTs的...