漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-29 talkingdev

TrackGPT:基于指令技术的物体追踪进化

TrackGPT集成了大规模视觉-语言模型的能力,以变革物体追踪的方式。TrackGPT能够理解用于追踪的隐含指令,从而使过程更加流畅,提升性能。这一点在新的InsTrack基准和其他具有挑战性的数据集上表现出了令人印象深刻...

Read More
2024-04-28 talkingdev

AI历史上最大的开源周:多款大型语言模型亮相

2024年3月的最后一周,开源大型语言模型(LLMs)迎来了一次重要的时刻。包括Databricks的DBRX,A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...

Read More
2024-04-28 talkingdev

MaxText:谷歌开源高性能机器学习模型

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...

Read More
2024-04-28 talkingdev

Sakana发布高速日语图像生成模型

Sakana AI近日发布了EvoSDXL-JP,这是一款为日语指令优化的高速图像生成模型,采用了一种革新的模型融合方法。与现有模型相比,EvoSDXL-JP的推断速度提高了十倍,并且性能卓越。这款模型非常适合在日本的教育领域使...

Read More
2024-04-28 talkingdev

使用Unsloth微调Llama3:显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...

Read More
2024-04-28 talkingdev

论文:利用图神经网络预测器优化神经架构搜索

在神经架构搜索(NAS)的创新工作中,引入了一种图神经网络(GNN)预测器,这种预测器可以提高识别特定任务的最优神经网络配置的效率。GNN预测器通过理解神经网络的图结构,从而可以更有效地预测神经网络的性能,这...

Read More
2024-04-28 talkingdev

MIM4D:提升自动驾驶的全新视觉表现方法开源

MIM4D 是一种全新的方法,通过使用双重遮罩图像建模在自动驾驶中提升视觉表现学习。这种方法从多视角视频中捕获空间和时间的详细信息,大大提升了自动驾驶的性能和效率。MIM4D 的开源代码已经在GitHub上发布,对于自...

Read More
2024-04-28 talkingdev

Llama3与SigLIP打造的多模态模型Bunny发布

多模态模型Bunny系列是一套强大的开放模型,尤其在MMMU基准测试中,其性能表现优秀。这是该团队基于Llama3 8B发布的首款开放模型。这个系列的模型采用了SigLIP与Llama3的技术,充分展示了其强大的性能和应用广泛性。...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page