漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-26 talkingdev

论文:无人机与地面摄像机联手实现人群识别技术突破

研究人员开发了一种名为View-Decoupled Transformer(VDT)的新型算法,用以应对通过不同摄像机视角识别个体的挑战,例如从无人机到地面摄像机的切换。VDT能够跨越视角差异,准确地识别和跟踪个体,这对于公共安全、...

Read More
2024-03-26 talkingdev

论文:图像合成中的写实阴影生成技术取得新突破

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法,解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集,显著提高了图像中阴影生成的质量。该技术的...

Read More
2024-03-26 talkingdev

Character Voice:让每个角色都有声音

Character Voice是一套功能,使用户能够在一对一聊天中听到角色对他们说话,将Character.AI体验提升到一个新的层次。这是公司构建多模态界面计划的第一步,该界面将促进更无缝、直观和引人入胜的互动体验。多模态界...

Read More
2024-03-26 talkingdev

谷歌、英特尔和ARM联手挑战英伟达AI芯片霸主地位

由英特尔、谷歌、ARM、高通、三星等科技公司组成的统一加速(UXL)基金会,正在开发开源软件,旨在避免AI开发者受限于英伟达的专有技术。这一举措意味着,未来AI开发将有更多的选择,不必完全依赖英伟达的生态系统。...

Read More
2024-03-26 talkingdev

喷墨技术:不仅仅是打印

喷墨技术已经突破了传统的打印界限,拓展到多个领域。目前,喷墨技术被用于制造基因组学的DNA微阵列、打印电路板的电导路径,以及构建3D打印结构。未来,该技术还有望在个性化医疗和先进电池开发中发挥作用。本文回...

Read More
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-03-25 talkingdev

科学家借助AI从零开始设计抗体,开创治疗抗体市场新纪元

科学家们利用生成性人工智能技术成功设计出全新的抗体,这一突破性进展可能会彻底改变治疗抗体市场。通过AI的深度学习和生成能力,研究团队能够从无到有地创造出具有治疗潜力的抗体结构。这不仅能够加速新药的开发进...

Read More
2024-03-25 talkingdev

AI系统“内心独白”能力,推理能力大幅提升

研究人员开发了一种名为“Quiet-STaR”的新技术,通过赋予AI系统“内心独白”,显著提升了其在推理测试中的性能。该技术已经被应用于Mistral 7B语言模型,并且取得了令人瞩目的效果。这一项技术的进步意味着AI系统能够更...

Read More
  1. Prev Page
  2. 288
  3. 289
  4. 290
  5. Next Page