计算机的相关内容 - 漫话开发者

2024-03-26 talkingdev

论文：图像合成中的写实阴影生成技术取得新突破

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法，解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集，显著提高了图像中阴影生成的质量。该技术的...

2024-03-22 talkingdev

当前，高校对计算机科学教育的处理方式存在问题，过于强调其实用技能培训的一面，而忽略了其作为一门综合性学科的本质。计算机科学不仅仅是为了培养特定类型的专业人士，而应该被看作是与艺术或工程学相似的更广泛的...

2024-03-20 talkingdev

本文由前OpenAI科学家撰写，深入探讨了SORA技术及其生成视频的潜在成本。SORA是一种先进的视频生成技术，通过复杂的算法和大量的数据处理，能够创建出高质量的视频内容。文章详细介绍了SORA的工作原理，包括其如何处...

2024-03-18 talkingdev

通过分析GitHub上的星标数，我们可以发现目前最流行的AI模型的一些有趣趋势。大多数开源AI工具集中在基础设施和应用层面。这些工具的开发和使用反映了AI技术在实际应用中的不断进步，以及开发者社区对于高效、便捷AI...

2024-03-15 talkingdev

NVIDIA联合创始人Curtis Priem将自己的股份捐赠给了Rensselaer Polytechnic Institute (RPI)，价值2.75亿美元。这笔捐款将有助于RPI推进其技术发展，并使其能够拥有IBM Quantum System One计算机。Priem在IPO后捐赠...

2024-03-15 talkingdev

近日，一项名为ViT-CoMer的神经网络模型问世，增强了Vision Transformers（ViT）在密集预测任务中的表现，而无需预训练。这项研究由卡内基梅隆大学的学者领导，他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

2024-03-15 talkingdev

近日，Skyvern项目在GitHub上发布，该项目利用LLMs和计算机视觉技术自动化浏览器流程。Skyvern提供了一个简单的API端点，可以完全自动化手动工作流程，替代脆弱或不可靠的自动化解决方案。其实现原理是利用LLMs提供...

2024-03-14 talkingdev

MoAI是一种新型的大型语言和视觉模型，它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布，旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法，可以...