6. sharding-jdbc源码之group by结果合并(1)

最新推荐文章于 2026-01-27 10:36:42 发布

原创

最新推荐文章于 2026-01-27 10:36:42 发布 · 1.6k 阅读

标签

#sharding-jdbc #分库分表

本文详细解析了sharding-jdbc中GroupByStreamResultSetMerger的实现原理，包括如何选择合适的ResultSetMerger，以及在执行group by操作时的数据处理流程。通过实例和代码分析了AggregationUnit的三种实现：AccumulationAggregationUnit、ComparableAggregationUnit和AverageAggregationUnit，展示了如何进行聚合计算。

阿飞Javaer，转载请注明原创出处，谢谢！

在5. sharding-jdbc源码之结果合并中已经分析了OrderByStreamResultSetMerger、LimitDecoratorResultSetMerger、IteratorStreamResultSetMerger，查看源码目录下ResultSetMerger的实现类，只剩下GroupByMemoryResultSetMerger和GroupByStreamResultSetMerger两个实现类的分析，接下来根据源码对两者的实现进行剖析；
ResultSetMerge关系图.png

如何选择

GroupBy有两个ResultSetMerge的实现：GroupByMemoryResultSetMerger和GroupByStreamResultSetMerger，那么如何选择呢？在MergeEngine中有一段这样的代码：

private ResultSetMerger build() throws SQLException {
    // 如果有group by或者聚合类型（例如sum, avg等）的SQL条件，就会选择一个GroupBy***ResultSetMerger
    if (!selectStatement.getGroupByItems().isEmpty() || !selectStatement.getAggregationSelectItems().isEmpty()) {
        // isSameGroupByAndOrderByItems()源码紧随其后
        if (selectStatement.isSameGroupByAndOrderByItems()) {
            return new GroupByStreamResultSetMerger(columnLabelIndexMap, resultSets, selectStatement);
        } else {
            return new GroupByMemoryResultSetMerger(columnLabelIndexMap, resultSets, selectStatement);
        }
    }
    if (!selectStatement.getOrderByItems().isEmpty()) {
        return new OrderByStreamResultSetMerger(resultSets, selectStatement.getOrderByItems());
    }
    return new IteratorStreamResultSetMerger(resultSets);
}

// 如果只有group by条件，没有order by，那么isSameGroupByAndOrderByItems()为true，例如：`SELECT o.* FROM t_order o where o.user_id=? group by o.order_id`（因为这种sql会被改写为SELECT o.* , o.order_id AS GROUP_BY_DERIVED_0 FROM t_order_0 o where o.user_id=?  group by o.order_id  ORDER BY GROUP_BY_DERIVED_0 ASC，即group by和order by完全相同）
public boolean isSameGroupByAndOrderByItems() {
    return !getGroupByItems().isEmpty() && getGroupByItems().equals(getOrderByItems());
}