Daft 是一款面向 DATA + AI 多模态数据处理与分析场景的计算引擎,支持单机和分布式两种运行模式,内核采用 Rust 语言编写,并提供 SQL 和 Python DataFrame 两种交互方式。
在文章《Processing 300K Images Without OOM: A Streaming Solution》中,作者介绍了基于 Daft 能够轻松实现对大规模图片数据集进行流式处理。那么,Daft 在幕后是如何执行用户输入的 SQL 或 DataFrame 的呢?在本文中,我们将继续以图片处理场景为切入点,通过一个典型的图片分类任务 DataFrame 示例,引领你深入探寻 Daft 单机执行引擎的运行机制。