漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-11 talkingdev

Mixtral of Experts论文发布

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的,但是在专家路由评估的讨论中有一个有趣的新见解。

Read More
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2024-01-03 talkingdev

论文:微软研究使用LLM改进文本嵌入技术

微软的研究人员使用合成数据来训练基于Mistral的解码器,以改进嵌入技术。该技术是同类产品中最佳的。有趣的是,他们使用GPT-4的两步提示策略来生成合成检索训练数据

Read More
2023-12-06 talkingdev

DMP开源,可提升AI图像预测精度

Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优...

Read More
2023-11-30 talkingdev

论文:通过扩散模型实现先进的视频超分辨率技术

StableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...

Read More
2023-11-16 talkingdev

AI安全开发的10个最佳实践

随着人工智能技术的迅猛发展,安全开发的重要性再次凸显。本文总结了10个最佳实践,帮助您安全地采用AI技术,并提供保护措施,防范AI生成代码的风险,如提示注入和数据访问。这些最佳实践包括:1.识别和评估潜在的安...

Read More
2023-11-13 talkingdev

OpenAI启动数据伙伴计划,与合作伙伴共同构建AI训练数据

据外媒报道,OpenAI近日宣布启动数据伙伴计划,旨在与合作伙伴共同构建开放和私有的AI训练数据集。这个计划的启动也许意味着OpenAI即将用尽其下一轮模型训练的代币。OpenAI表示,他们需要大量的数据来训练AI模型,但...

Read More
2023-11-13 talkingdev

论文:优化数据清洗方案,提高LLMs的训练效果

近日,一项研究提出了一种更好的数据清洗方法,以确保LLMs的公正测试,并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平,因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page