性能的相关内容 - 漫话开发者

2024-04-29 talkingdev

TrackGPT：基于指令技术的物体追踪进化

TrackGPT集成了大规模视觉-语言模型的能力，以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令，从而使过程更加流畅，提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...

2024-04-28 talkingdev

2024年3月的最后一周，开源大型语言模型（LLMs）迎来了一次重要的时刻。包括Databricks的DBRX，A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...

2024-04-28 talkingdev

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM)，完全使用Python/Jax编写，目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开，充分展示了其强大的功能和优秀的性能。MaxTex...

2024-04-28 talkingdev

Sakana AI近日发布了EvoSDXL-JP，这是一款为日语指令优化的高速图像生成模型，采用了一种革新的模型融合方法。与现有模型相比，EvoSDXL-JP的推断速度提高了十倍，并且性能卓越。这款模型非常适合在日本的教育领域使...

2024-04-28 talkingdev

Llama3是一种革命性的新技术，它通过使用Unsloth进行微调，可以在保持相同的计算效率的同时，显著降低VRAM的使用量。最近的研究表明，使用Unsloth微调Llama3可以使上下文长度增长六倍，这比HF的flash attention技术...

2024-04-28 talkingdev

在神经架构搜索（NAS）的创新工作中，引入了一种图神经网络（GNN）预测器，这种预测器可以提高识别特定任务的最优神经网络配置的效率。GNN预测器通过理解神经网络的图结构，从而可以更有效地预测神经网络的性能，这...

2024-04-28 talkingdev

MIM4D 是一种全新的方法，通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息，大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布，对于自...

2024-04-28 talkingdev

多模态模型Bunny系列是一套强大的开放模型，尤其在MMMU基准测试中，其性能表现优秀。这是该团队基于Llama3 8B发布的首款开放模型。这个系列的模型采用了SigLIP与Llama3的技术，充分展示了其强大的性能和应用广泛性。...