漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-12-15 talkingdev

放弃Spark转投DuckDB或Polars?比较分析

随着数据科学的迅猛发展,数据处理框架的选择成为技术决策者的一大挑战。最近,DuckDB和Polars作为新兴的数据框架,引起了业界的关注。DuckDB是一个自诩为'SQLite for Analytics'的嵌入式分析数据库,它以轻量级和高...

Read More
2024-05-16 talkingdev

Quary:为工程师定制的开源商业智能工具

Quary是一款开源商业智能工具,可以帮助工程师连接数据库,编写SQL查询以转换、组织和记录数据库中的表,创建图表、仪表板和报告,通过版本控制进行测试、协作和迭代重构,以及将组织良好、记录完整的模型部署回数据...

Read More
2024-03-29 talkingdev

Spice:跨数据源的SQL查询利器

Spice是一个运行时工具,能够简化和加速通过SQL对一个或多个数据源的查询操作。它为开发者提供了一个统一的SQL查询接口,能够本地化实体化、加速和查询来自任何数据库、数据仓库或数据湖的数据表。Spice的出现使得构...

Read More
2024-03-20 talkingdev

PostgreSQL:正逐渐改变数据库世界的格局

PostgreSQL作为一种数据管理框架,正展现出吞并整个数据库领域的潜力。将PostgreSQL应用于各种场景已成为主流的最佳实践。ParadeDB和DuckDB通过提升性能,将PostgreSQL的分析能力推向OLAP的顶级水平。Pigsty作为一款...

Read More
2023-06-02 talkingdev

Lance:现代机器学习数据格式

Lance是一种现代的机器学习数据格式。它提供了更快的随机访问、向量索引、数据版本控制等功能。Lance支持pandas、duckdb、polars和pyarrow等工具,可用于构建搜索引擎和特征库、大规模机器学习训练,以及存储、查询...

Read More