漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-28 talkingdev

Looking Glass发布32英寸“全息”空间显示屏和16英寸OLED版本

美国公司Looking Glass近日推出了两款新型显示屏,包括一款32英寸的“全息”空间显示屏和一款16英寸的OLED版本。这些显示屏专为无需佩戴头戴式设备即可实现团队3D可视化而设计。新设备能够实时辅助开发和展示交互式3D...

Read More
2024-05-24 talkingdev

论文:GLSCL提升文本视频检索效率

研究人员开发了一种新的方法——全局-局部语义一致学习(Global-Local Semantic Consistent Learning,简称GLSCL),以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性,还显著降低了计算成本。GLSCL通过...

Read More
2024-05-22 talkingdev

SpaceX星链技术成功实现手机视频通话演示

SpaceX的星链系统虽然仍处于测试阶段,但其技术已经足够成熟,能够支持手机视频通话。SpaceX最近发布了一段视频,展示了通过星链直连手机卫星实现的视频通话,且使用的是未经修改的移动电话。该公司已将星链的通信卫...

Read More
2024-05-22 talkingdev

CSTA项目开源,提升视频摘要效果

本项目引入了一种新的基于CNN的时空注意力(CSTA)方法,用于改进视频摘要。与传统的注意力机制不同,CSTA通过使用2D CNN来捕捉帧的视觉重要性,从而更好地理解视频中的关系和关键属性。这种方法不仅能够有效提取视...

Read More
2024-05-17 talkingdev

TikTok开始测试长达60分钟的视频上传功能,将继续与YouTube竞争

TikTok的一小部分用户在选择的市场上可以上传长达60分钟的视频到平台上。这一功能标志着TikTok原始格式的转变。尽管该公司因其短视频格式而广受欢迎,但它已经开始慢慢接受长格式内容以与YouTube竞争。该平台还在测...

Read More
2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...

Read More
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-15 talkingdev

Google I/O 2024新品发布:Gemini Flash、Veo视频生成、Imagen 3及最新助手Project Astra亮相

在2024年的Google I/O开发者大会上,Google发布了众多新功能,包括Gemini Flash、Veo视频生成、Imagen 3及其最新助手Project Astra。整体而言,这些改进数量惊人,包括扩大到2m的令牌上下文长度,大幅降低的模型价格...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page