漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-26 talkingdev

TensorDict:让你在PyTorch中更好地使用字典和张量

TensorDict是一个非常实用的小工具,它可以让你在PyTorch中使用字典和张量。使用TensorDict可以提高代码的可读性和可用性,同时保持良好的性能。 TensorDict提供了一种简单的方法来将张量转换为字典,并且可以像字...

Read More
2024-01-25 talkingdev

开源RPG框架,改进文本到图像生成质量

最近,由阿里达摩院、南京邮电大学、南京大学等机构合作开发的RPG框架在GitHub上开源。该框架采用“Recaption、Plan和Generate”的方法来改进文本到图像生成,将复杂的图像创建任务分解为更简单的任务,从而在处理多个...

Read More
2024-01-23 talkingdev

论文:RSHazeNet,更清晰的遥感图像

日前,RSHazeNet发布,该框架旨在从遥感图像中去除雾霾。该工具使用创新模块更好地理解和保留图像中的重要细节,使其更清晰、更有用于分析。RSHazeNet框架具有较高的普适性,适用于各种遥感图像去雾任务。该工具的发...

Read More
2024-01-15 talkingdev

论文:自我监督学习提高歌声合成相似度和泛化性能

研究人员开发了一种新的框架来更好地理解和分析歌声。通过在孤立的人声轨道上进行自我监督学习,并专注于域外泛化,他们在歌声相似性和合成等任务上取得了进展,从而改进了现有技术。这种新方法可以通过对歌声的不同...

Read More
2024-01-15 talkingdev

remoteStorage:跨浏览器和设备持久化存储数据

remoteStorage是一种将localStorage API与远程服务器相结合的技术,可以在浏览器和设备之间持久化存储数据,方便应用程序在浏览器和设备之间读写数据,保持状态的一致性。remoteStorage具有简单易用的API,可与所有J...

Read More
2024-01-11 talkingdev

ChatGPT一周年:AI是否已成为新的技术平台?

本文介绍了“解剖框架”——一种用于评估任何创新潜力的工具,包括人工智能。它从五个层面探讨了创新:基础设施、核心平台、应用、工具和生态系统。本文还讨论了初创企业和现有创新者的角色以及创新介质(硬件 vs. 软件...

Read More
2024-01-11 talkingdev

医学领域的LLM技术专家Agent开源

研究人员开发了一种新的多学科协作框架,以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理,扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。

Read More
2024-01-11 talkingdev

STL-开源自我涌现令牌标记的视觉转换器,提高稳定性

对于视觉转换器(ViTs)的显著进展,研究人员使用一种新的自我涌现令牌标记(STL)框架,提高了完全注意力网络(FAN)模型的鲁棒性。这种方法涉及训练FAN令牌标记器来创建有意义的补丁令牌标记,然后训练FAN学生模型。

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page