训练数据的相关内容 - 漫话开发者

2024-01-11 talkingdev

Mixtral of Experts论文发布

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的，但是在专家路由评估的讨论中有一个有趣的新见解。

2024-01-10 talkingdev

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5（即使它可能是3倍大小）。有关模型训练，令牌计数，模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器，它使用自...

2024-01-03 talkingdev

微软的研究人员使用合成数据来训练基于Mistral的解码器，以改进嵌入技术。该技术是同类产品中最佳的。有趣的是，他们使用GPT-4的两步提示策略来生成合成检索训练数据。

2023-12-06 talkingdev

Diffusion Models as Prior (DMP)是一种新的方法，它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务，例如3D属性估计和语义分割，在有限的训练数据下表现优...

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...

2023-11-16 talkingdev

随着人工智能技术的迅猛发展，安全开发的重要性再次凸显。本文总结了10个最佳实践，帮助您安全地采用AI技术，并提供保护措施，防范AI生成代码的风险，如提示注入和数据访问。这些最佳实践包括：1.识别和评估潜在的安...

2023-11-13 talkingdev

据外媒报道，OpenAI近日宣布启动数据伙伴计划，旨在与合作伙伴共同构建开放和私有的AI训练数据集。这个计划的启动也许意味着OpenAI即将用尽其下一轮模型训练的代币。OpenAI表示，他们需要大量的数据来训练AI模型，但...

2023-11-13 talkingdev

近日，一项研究提出了一种更好的数据清洗方法，以确保LLMs的公正测试，并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平，因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...