漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-22 talkingdev

[开源]Defuddle:替代Readability的HTML转Markdown工具,助力稍后阅读应用开发

开发者kepano近日开源了Defuddle,这是一个用于从网页中解析和提取主要内容及元数据的JavaScript库,并能将内容转换为Markdown格式。Defuddle的诞生源于kepano在开发Obsidian Web Clipper时的需求,由于Mozilla的Rea...

Read More
2025-05-21 talkingdev

ClipJS:一款可在PC和手机上编辑视频的轻量级工具

ClipJS是一款新兴的视频编辑工具,支持用户在PC或手机上快速编辑视频内容。该工具通过简洁的用户界面和高效的性能,为用户提供了便捷的视频剪辑体验。ClipJS的轻量级设计使其在移动设备上表现尤为出色,满足了用户随...

Read More
2025-05-06 talkingdev

[开源]Clippy:为本地大语言模型注入90年代经典UI风格

开发者Felix Rieseberg近日推出开源项目Clippy,将90年代经典的Office助手交互界面与现代本地化大语言模型(LLM)技术相结合。该项目在Hacker News引发热议,获得783个点赞和199条评论,反映出开发者社区对创新人机...

Read More
2025-04-04 talkingdev

[论文推荐]CLIP模型存在后门攻击漏洞:仅需少量数据即可实现近100%攻击成功率

最新研究发现,当前广泛应用的CLIP(Contrastive Language-Image Pretraining)多模态模型存在严重的安全隐患。根据arXiv最新论文披露,攻击者通过数据投毒(poisoning)方式植入后门,仅需污染0.5%的训练数据即可实...

Read More
2025-03-31 talkingdev

[开源]Awesome Vision-to-Music Generation:视觉转音乐生成技术全景图

GitHub热门项目Awesome Vision-to-Music Generation系统性地整理了视觉到音乐(V2M)生成领域的前沿进展,涵盖学术研究突破与工业级应用方案。该项目持续更新的资源库整合了三大核心要素:1)基于深度学习的跨模态生...

Read More
2025-02-24 talkingdev

谷歌发布SigLIP2:图像与文本编码模型的重大升级

SigLIP2作为SigLIP的升级版本,在多个方面实现了显著改进。SigLIP原本是一款广受欢迎的联合图像与文本编码模型,而SigLIP2在零样本分类性能上取得了重大突破,这一性能曾是CLIP模型的标志性成果。此次升级不仅提升了...

Read More
2024-10-14 talkingdev

Clipscreen开源:可在视频会议中轻松共享屏幕区域

近日,一款基于X11的全新工具引起了广泛关注,该工具允许用户在任意视频会议中共享特定的屏幕区域。这一创新的解决方案旨在提高远程协作的效率,用户只需简单的操作即可选择需要共享的屏幕部分,而不是整个桌面。这...

Read More
2024-07-16 talkingdev

LAPT自动化异常值检测:提高视觉语言模型的表现

近日,研究人员提出了一种新的方法——标签驱动的自动提示调整(LAPT),用于视觉语言模型如CLIP的异常值检测。这种新方法可以自动识别出数据集中的异常值,提高模型在处理各种情况时的灵活性和准确性。通过LAPT,可以更...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page