机器学习的相关内容 - 漫话开发者

2023-08-24 talkingdev

Llama.cpp，新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而，它目前受到底层GGML格式的限制。为了解决这个问题，我们提出了一个新的格式，并开始进行集成。新的GGML格式将更加灵活，可以支持更多的模型，这将有助于推动机器...

2023-08-24 talkingdev

半监督和自我监督学习是机器学习模型生成训练信号的地方。这与标准的监督、无监督和强化学习有所不同。目标函数通常是特定于数据的（例如，掩盖单词或旋转图像）。本研究深入探讨了在这个领域使用的常见技术和存在的...

2023-08-24 talkingdev

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署，无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

2023-08-23 talkingdev

您现在可以在自定义数据上微调gpt-3.5-turbo模型了。微调后的模型完全属于您，且不会利用您的数据训练其他模型。这种方法可以大大降低成本、提升控制性，并改善整体性能。此外，GPT-4的微调功能也将在今年秋季推出。

2023-08-22 talkingdev

HuggingFace最近发布了一款新颖的小型Rust ML框架，该框架运行速度极快，能支持许多强大的模型。Rust作为一种系统编程语言，以其出色的性能和安全性赢得了广大开发者的喜爱。这款由HuggingFace发布的ML框架，能让开...

2023-08-22 talkingdev

我们当前的时代正处于一个全新的人工智能阶段，这个阶段的特点是LLMs、变压器和扩散模型的广泛应用。这与以往的人工智能发展阶段有着明显的区别。LLMs是一种复杂的深度学习模型，可以处理大量的数据并预测结果。变压...

2023-08-21 talkingdev

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具，可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程，通过使用 DeepEval，开发者可以在不连接网络的情况下，对其进行评估和优化...