优化的相关内容 - 漫话开发者

2023-08-18 talkingdev

WizardLM，利用强化进化指令教大型语言模型进行推理

近期，WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升，成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

2023-08-18 talkingdev

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具，可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程，通过使用 DeepEval，开发者可以在不连接网络的情况下，对其进行评估和优化...

2023-08-17 talkingdev

人工智能（AI）被大肆炒作，然而在许多领域，它仍然需要大量的改进和优化。尽管AI在许多领域都已经展示出了其潜力，如自动驾驶、医疗诊断、股市预测等，但是，我们也必须清楚，目前的AI技术还存在许多不足之处。例如...

2023-08-17 talkingdev

在软件开发中，提交信息起着至关重要的作用，但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法，利用过去的提交历史，而非简单地生成提交信息。这篇论文提出了一个新的数据集，名为CommitChronicl...

2023-08-17 talkingdev

在一张图片中，计算机有时会将同一对象识别为多个。现在，一个新的项目开发出一种方法，帮助计算机识别并聚焦于对象的单一完整版本。这种方法的出现，将对计算机视觉和图像理解能力的提升起到关键作用，不仅可以优化...

2023-08-16 talkingdev

本文概述了十个关键的AI开发者工具设计原则，这些原则来自于GitHub在设计、发布和扩展Copilot的经验。这些原则包括利用自然语言、解决开发者的痛点、收集有意义的反馈、承认偏见，并优先考虑定制化、可访问性、性能...

2023-08-16 talkingdev

DoctorGPT，这款领先的语言模型（LLM），已经能够通过美国医疗执照考试。它的特点是可以离线工作，跨平台运行，且能保护用户的健康数据私密性。这款开源的AI医生，将为医疗行业带来革命性的改变，使得医疗服务更具普...

2023-08-16 talkingdev

LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢？答案在于，当你一次只处理一个批次，一个标记的时候，内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...