SpringBoot3集成Calcite多數(shù)據(jù)源查詢的實戰(zhàn)示例小結(jié)

更新時間：2026年02月09日 10:22:02 作者：暴躁代碼

本文介紹了Spring Boot 3集成Apache Calcite實現(xiàn)多數(shù)據(jù)源查詢的實戰(zhàn)指南,本文通過實例代碼給大家講解的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友參考下吧

前言：跨庫查詢的痛，誰懂？

凌晨兩點被告警電話叫醒，訂單查詢接口超時，客服群炸開了鍋。排查了一圈才發(fā)現(xiàn)問題的根源：訂單數(shù)據(jù)在 MySQL，用戶信息在 PostgreSQL，行為畫像在 MongoDB，訪問日志存在 Hive。四套 DAO 層相互牽制，改動任何一個字段就像推倒多米諾骨牌一樣引發(fā)連鎖反應(yīng)。

企業(yè)項目一旦數(shù)據(jù)源增多，"多數(shù)據(jù)源管理"很快就演變成維護黑洞。每新增一個數(shù)據(jù)源，就要新建一套 DAO 配置、數(shù)據(jù)源連接池、事務(wù)管理。復(fù)用率低不說，還把業(yè)務(wù)邏輯和數(shù)據(jù)訪問層死死綁在一起。最要命的是，不同數(shù)據(jù)源的字段命名規(guī)范不統(tǒng)一，user_level、customer_level、user_grade 混著用，改一個字段名，訂單系統(tǒng)、用戶系統(tǒng)、風(fēng)控系統(tǒng)、報表系統(tǒng)全線報錯，誰改誰背鍋。

傳統(tǒng)方案要么做全量數(shù)據(jù)同步到數(shù)倉，要么寫一堆分布式事務(wù)代碼，要么在內(nèi)存里手動 JOIN。結(jié)果就是：延遲不可避免，查詢結(jié)果拿到的往往是舊數(shù)據(jù)快照；性能是硬傷，MySQL 擅長點查和小范圍索引掃描，MongoDB 天生文檔檢索，Hive 批量掃描效率高，Kafka 流式處理，一刀切的內(nèi)存聚合方式很快就把 JVM 打爆了，查詢延遲像篩子一樣抖個不停。

一、重新認識 Apache Calcite：不只是數(shù)據(jù)庫，更是查詢大腦

很多人第一次聽到 “Apache Calcite”，直覺反應(yīng)是"又一個數(shù)據(jù)庫"。這個理解完全錯了。

Calcite 本質(zhì)上是一個動態(tài)數(shù)據(jù)管理框架，專注于提供 SQL 解析、查詢優(yōu)化和跨數(shù)據(jù)源連接的基礎(chǔ)能力，但不涉及數(shù)據(jù)的存儲和處理。這種設(shè)計哲學(xué)讓它具備了極其靈活的適配能力。

它主要做四件事：

1. SQL 解析與驗證

將用戶提交的 SQL 語句解析為抽象語法樹（AST），并進行語義分析，驗證表名、列名是否存在，數(shù)據(jù)類型是否匹配等。就像把一句自然語言翻譯成結(jié)構(gòu)化的指令樹。

2. 查詢優(yōu)化

這是 Calcite 的核心殺手锏。它提供基于規(guī)則優(yōu)化（RBO）和基于代價優(yōu)化（CBO）兩種策略：

規(guī)則優(yōu)化：通過預(yù)設(shè)規(guī)則重寫查詢，比如謂詞下推、投影裁剪、JOIN 重排
代價優(yōu)化：根據(jù)統(tǒng)計信息估算不同執(zhí)行計劃的成本，選擇最優(yōu)方案

3. 數(shù)據(jù)源適配

Calcite 通過適配器（Adapter）機制連接各種數(shù)據(jù)源，包括：

關(guān)系型數(shù)據(jù)庫：MySQL、PostgreSQL、Oracle、SQL Server
NoSQL 數(shù)據(jù)庫：MongoDB、Cassandra、Redis
文件系統(tǒng)：CSV、JSON、Parquet、Excel
大數(shù)據(jù)引擎：Hive、Spark、Kafka

甚至還可以自定義適配器，讓任何數(shù)據(jù)源都能接入。

4. 跨數(shù)據(jù)源查詢

能夠連接不同類型的數(shù)據(jù)源，通過適配器統(tǒng)一抽象不同數(shù)據(jù)源的操作，將查詢分解為各數(shù)據(jù)源可處理的子查詢，然后合并結(jié)果。

一句話總結(jié)：Calcite 把"數(shù)據(jù)在哪"和"怎么查"徹底拆開了。你寫一句標(biāo)準(zhǔn) SQL，它負責(zé)解析、優(yōu)化、拆分，最終把查詢路由到各個數(shù)據(jù)源執(zhí)行。

很多熟悉的系統(tǒng)都在用 Calcite：Flink SQL 用它做解析與優(yōu)化，Hive 的 CBO 用它打底，Drill、Kylin、Druid 都接入了它的能力。

二、Spring Boot 3 集成 Calcite 實戰(zhàn)指南

2.1 核心依賴引入

第一步是添加 Maven 依賴。在 pom.xml 中引入 Calcite 核心包、對應(yīng)數(shù)據(jù)源的適配器，以及 MyBatis Plus 的核心依賴。

<!-- Calcite 核心依賴 -->
<dependency>
    <groupId>org.apache.calcite</groupId>
    <artifactId>calcite-core</artifactId>
    <version>1.36.0</version>
</dependency>
<!-- MySQL 適配器 -->
<dependency>
    <groupId>org.apache.calcite</groupId>
    <artifactId>calcite-mysql</artifactId>
    <version>1.36.0</version>
</dependency>
<!-- MongoDB 適配器 -->
<dependency>
    <groupId>org.apache.calcite</groupId>
    <artifactId>calcite-mongodb</artifactId>
    <version>1.36.0</version>
</dependency>
<!-- MyBatis Plus 核心依賴（需要適配 Spring Boot 3） -->
<dependency>
    <groupId>com.baomidou</groupId>
    <artifactId>mybatis-plus-boot-starter</artifactId>
    <version>3.5.5</version>
</dependency>
<!-- 數(shù)據(jù)源連接池 -->
<dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>druid-spring-boot-starter</artifactId>
    <version>1.2.20</version>
</dependency>

三個避坑點必須強調(diào)：

Calcite 所有組件版本必須統(tǒng)一。核心包和適配器版本要一致，否則容易出現(xiàn)類加載異常。
MyBatis Plus 要選適配 Spring Boot 3 的版本。必須是 3.5.3 及以上版本，舊版本不支持。
一定要加連接池依賴。MyBatis Plus 需要連接池支持才能正常管理 Calcite 數(shù)據(jù)源。

2.2 編寫 Calcite 模型文件

模型文件是 Calcite 識別數(shù)據(jù)源的關(guān)鍵，通常使用 JSON 格式，放在 resources 目錄下，命名為 calcite-model.json。

下面是一個適配 MySQL 和 MongoDB 雙數(shù)據(jù)源的示例：

{
  "version": "1.0",
  "defaultSchema": "ecommerce",
  "schemas": [
    {
      "name": "ecommerce",
      "type": "custom",
      "factory": "org.apache.calcite.adapter.jdbc.JdbcSchema$Factory",
      "operand": {
        "jdbcUrl": "jdbc:mysql://localhost:3306/ecommerce_order?useSSL=false&serverTimezone=UTC",
        "username": "root",
        "password": "123456",
        "driver": "com.mysql.cj.jdbc.Driver"
      }
    },
    {
      "name": "user_mongo",
      "type": "custom",
      "factory": "org.apache.calcite.adapter.mongodb.MongoSchema$Factory",
      "operand": {
        "host": "localhost",
        "port": 27017,
        "database": "user_db",
        "collection": "user_info"
      }
    }
  ]
}

關(guān)鍵配置說明：

defaultSchema：默認查詢的 schema，可省略。如果省略，查詢時需要指定 schema 名稱（如 ecommerce.order、user_mongo.user_info）。
factory：對應(yīng)數(shù)據(jù)源的適配器工廠類。Calcite 已為主流數(shù)據(jù)源提供現(xiàn)成工廠，自定義數(shù)據(jù)源需要實現(xiàn)自己的工廠類。
operand：數(shù)據(jù)源連接參數(shù)，根據(jù)數(shù)據(jù)源類型不同配置不同參數(shù)（如 MySQL 的 jdbcUrl、MongoDB 的 host/port）。

2.3 Spring Boot 集成 Calcite + MyBatis Plus 核心配置

這一步是集成的核心，主要分兩步走：

配置好 Calcite 數(shù)據(jù)源
讓 MyBatis Plus 使用這個數(shù)據(jù)源，并配置 Mapper 掃描、分頁插件等基礎(chǔ)參數(shù)

import com.baomidou.mybatisplus.annotation.DbType;
import com.baomidou.mybatisplus.extension.plugins.MybatisPlusInterceptor;
import com.baomidou.mybatisplus.extension.plugins.inner.PaginationInnerInterceptor;
import org.apache.calcite.jdbc.CalciteConnection;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.mybatis.spring.annotation.MapperScan;
import org.springframework.core.io.support.PathMatchingResourcePatternResolver;
import javax.sql.DataSource;
import java.sql.Connection;
import java.sql.DriverManager;
import java.util.Properties;
@Configuration
@MapperScan(basePackages = "com.example.calcite.mapper")
public class CalciteMybatisPlusConfig {
    // 1. 配置 Calcite 數(shù)據(jù)源
    @Bean
    public DataSource calciteDataSource() throws Exception {
        Properties props = new Properties();
        props.setProperty("model", "classpath:calcite-model.json");
        Connection connection = DriverManager.getConnection("jdbc:calcite:", props);
        CalciteConnection calciteConnection = connection.unwrap(CalciteConnection.class);
        return calciteConnection.getDataSource();
    }
    // 2. 配置 MyBatis Plus 的 SqlSessionFactory，指定使用 Calcite 數(shù)據(jù)源
    @Bean
    public SqlSessionFactory sqlSessionFactory(DataSource calciteDataSource) throws Exception {
        MybatisSqlSessionFactoryBean sessionFactory = new MybatisSqlSessionFactoryBean();
        // 注入 Calcite 數(shù)據(jù)源
        sessionFactory.setDataSource(calciteDataSource);
        // 配置 Mapper.xml 文件路徑
        sessionFactory.setMapperLocations(
            new PathMatchingResourcePatternResolver().getResources("classpath:mapper/*.xml")
        );
        // 配置 MyBatis Plus 全局參數(shù)
        org.apache.ibatis.session.Configuration configuration = 
            new org.apache.ibatis.session.Configuration();
        configuration.setMapUnderscoreToCamelCase(true); // 下劃線轉(zhuǎn)駝峰
        sessionFactory.setConfiguration(configuration);
        // 注入 MyBatis Plus 插件
        sessionFactory.setPlugins(mybatisPlusInterceptor());
        return sessionFactory.getObject();
    }
    // 3. MyBatis Plus 分頁插件
    @Bean
    public MybatisPlusInterceptor mybatisPlusInterceptor() {
        MybatisPlusInterceptor interceptor = new MybatisPlusInterceptor();
        interceptor.addInnerInterceptor(
            new PaginationInnerInterceptor(DbType.MYSQL) // 適配 Calcite 兼容的 MySQL 語法
        );
        return interceptor;
    }
    // 4. 配置事務(wù)管理器
    @Bean
    public PlatformTransactionManager transactionManager(DataSource calciteDataSource) {
        return new DataSourceTransactionManager(calciteDataSource);
    }
}

核心邏輯梳理：

先通過 Calcite 創(chuàng)建統(tǒng)一的數(shù)據(jù)源，再把它注入到 MyBatis Plus 的 SqlSessionFactory 里。這樣一來，后續(xù)寫代碼完全是 MyBatis Plus 的熟悉風(fēng)格，無論是 Mapper 接口還是 XML 映射文件，都能直接用，跨數(shù)據(jù)源查詢的復(fù)雜邏輯全交給 Calcite 處理。

2.4 核心查詢實現(xiàn)

定義實體類

使用 Lombok 注解定義 VO 類，包含訂單和用戶信息：

import lombok.Data;
@Data
public class UserOrderVO {
    // 訂單信息
    private String orderId;
    private String orderTime;
    private Double amount;
    // 用戶信息
    private String userName;
    private String phone;
    private String userId;
}

定義 Mapper 接口

繼承 BaseMapper 獲得 MyBatis Plus 基礎(chǔ) CRUD 能力，使用 @Select 注解編寫跨數(shù)據(jù)源關(guān)聯(lián) SQL：

import org.apache.ibatis.annotations.Mapper;
import org.apache.ibatis.annotations.Select;
import java.util.List;
@Mapper
public interface UserOrderMapper extends BaseMapper<UserOrderVO> {
    // 注解方式編寫跨數(shù)據(jù)源關(guān)聯(lián) SQL
    @Select("SELECT " +
            "  o.order_id AS orderId, " +
            "  o.order_time AS orderTime, " +
            "  o.amount, " +
            "  u.user_name AS userName, " +
            "  u.phone " +
            "FROM ecommerce.orders o " +
            "JOIN user_mongo.user_info u ON o.user_id = u.user_id " +
            "WHERE o.user_id = #{userId}")
    List<UserOrderVO> queryUserOrderByUserId(String userId);
}

如果使用 XML 方式：

在 resources/mapper/UserOrderMapper.xml 中編寫：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" 
    "http://mybatis.org/dtd/mybatis-3-mapper.dtd">
<mapper namespace="com.example.calcite.mapper.UserOrderMapper">
    <select id="queryUserOrderByUserIdWithXml" resultType="com.example.calcite.entity.UserOrderVO">
        SELECT
            o.order_id AS orderId,
            o.order_time AS orderTime,
            o.amount,
            u.user_name AS userName,
            u.phone
        FROM ecommerce.orders o
        JOIN user_mongo.user_info u ON o.user_id = u.user_id
        WHERE o.user_id = #{userId}
    </select>
</mapper>

編寫 Service 層

繼承 ServiceImpl 實現(xiàn)業(yè)務(wù)邏輯：

import com.baomidou.mybatisplus.extension.service.impl.ServiceImpl;
import org.springframework.stereotype.Service;
import java.util.List;
@Service
public class UserOrderService extends ServiceImpl<UserOrderMapper, UserOrderVO> {
    public List<UserOrderVO> getUserOrderByUserId(String userId) {
        // 直接調(diào)用 Mapper 接口方法
        return this.baseMapper.queryUserOrderByUserId(userId);
    }
    // 如果使用 XML 方式：
    public List<UserOrderVO> getUserOrderByUserIdWithXml(String userId) {
        return this.baseMapper.queryUserOrderByUserIdWithXml(userId);
    }
}

編寫 Controller 層

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RestController;
import java.util.List;
@RestController
public class CrossDataSourceQueryController {
    @Autowired
    private UserOrderService userOrderService;
    @GetMapping("/user/order/{userId}")
    public List<UserOrderVO> queryUserOrder(@PathVariable String userId) {
        // 調(diào)用 Service 方法，返回跨數(shù)據(jù)源查詢結(jié)果
        return userOrderService.getUserOrderByUserId(userId);
    }
}

三個關(guān)鍵點：

實體類字段要和查詢結(jié)果列名對應(yīng)。使用別名適配下劃線轉(zhuǎn)駝峰更省心（如 o.order_id AS orderId）。
Mapper 接口繼承 BaseMapper 后，MyBatis Plus 的分頁、條件構(gòu)造器這些功能都能正常使用。
SQL 查詢要帶 schema 前綴。比如 ecommerce.orders、user_mongo.user_info，明確指定數(shù)據(jù)源。

三、經(jīng)典使用場景深度解析

3.1 多系統(tǒng)數(shù)據(jù)融合查詢

場景痛點：

大型企業(yè)里數(shù)據(jù)分散在不同系統(tǒng)，訂單系統(tǒng)用 MySQL，用戶系統(tǒng)用 MongoDB 存行為數(shù)據(jù)，庫存系統(tǒng)用 PostgreSQL。傳統(tǒng)做法需要分別調(diào)用三個系統(tǒng)接口，在內(nèi)存中手動整合數(shù)據(jù)，效率低且容易出錯。一旦某個系統(tǒng)字段變更，所有調(diào)用方都要改。

Calcite 解決方案：

用 Calcite 分別適配三個數(shù)據(jù)源后，只要寫一套標(biāo)準(zhǔn) SQL 就能實現(xiàn)跨數(shù)據(jù)源關(guān)聯(lián)查詢。業(yè)務(wù)層完全不用管數(shù)據(jù)存在哪，專注核心業(yè)務(wù)邏輯。

價值收益：

開發(fā)效率提升 50% 以上。不用寫重復(fù)的接口調(diào)用和數(shù)據(jù)整合代碼。
Calcite 的查詢優(yōu)化器會自動優(yōu)化關(guān)聯(lián)邏輯。先把時間過濾推給 MySQL 做索引掃描，再把用戶 ID 集合下推給 MongoDB 做 IN 查詢，最后在本地完成 JOIN 和聚合。
查詢效率也能跟上。謂詞下推、投影裁剪、JOIN 重排這些優(yōu)化都是自動的，不用手動摳。

3.2 實時數(shù)據(jù)與離線數(shù)據(jù)聯(lián)動查詢

場景需求：

運營需要實時查看今日訂單加近 30 天歷史訂單的匯總數(shù)據(jù)。實時訂單數(shù)據(jù)存在 Kafka 里，歷史訂單數(shù)據(jù)存在 Hive 里。

傳統(tǒng)方案：

需要開發(fā)兩套查詢邏輯，分別從 Kafka 和 Hive 拉數(shù)據(jù)，再在內(nèi)存中合并。開發(fā)成本高，而且數(shù)據(jù)同步有延遲，合并后的結(jié)果未必是實時的。

Calcite 解決方案：

用 Calcite 的 Kafka 適配器和 Hive 適配器，把實時流數(shù)據(jù)和離線數(shù)據(jù)放到同一個查詢體系里。寫一條 SQL 就能實現(xiàn)實時加離線數(shù)據(jù)的聯(lián)合查詢：

SELECT 
  product_id,
  SUM(amount) AS total_amount
FROM (
  -- 實時數(shù)據(jù)（Kafka）
  SELECT product_id, amount FROM realtime.orders WHERE dt = CURRENT_DATE
  UNION ALL
  -- 離線數(shù)據(jù)（Hive）
  SELECT product_id, amount FROM hive.orders WHERE dt >= CURRENT_DATE - INTERVAL '30' DAY
) combined
GROUP BY product_id

價值收益：

省去了數(shù)據(jù)同步成本。不用把 Kafka 數(shù)據(jù)實時同步到 Hive，也不用把 Hive 數(shù)據(jù)預(yù)聚合出來。
兼顧實時性和準(zhǔn)確性。Kafka 的實時數(shù)據(jù) + Hive 的歷史數(shù)據(jù)，聯(lián)合查詢結(jié)果既有實時性又有完整性。

3.3 自定義數(shù)據(jù)源適配

場景需求：

企業(yè)里有很多 CSV、Excel、Parquet 格式的文件數(shù)據(jù)，需要集成到業(yè)務(wù)系統(tǒng)中查詢。

傳統(tǒng)方案：

先把這些文件導(dǎo)入數(shù)據(jù)庫（如 MySQL），然后再提供查詢接口。數(shù)據(jù)遷移成本高，而且數(shù)據(jù)更新后需要重新導(dǎo)入。

Calcite 解決方案：

Calcite 內(nèi)置了文件適配器，支持直接查詢這些文件數(shù)據(jù)，根本不用導(dǎo)入數(shù)據(jù)庫。結(jié)合 Spring Boot 3 的文件上傳功能，還能實現(xiàn)文件上傳后直接用 SQL 查詢的需求。

模型配置示例：

{
  "name": "files",
  "type": "custom",
  "factory": "org.apache.calcite.adapter.csv.CsvSchemaFactory",
  "operand": {
    "directory": "/data/files",
    "flavor": "mysql"
  }
}

查詢示例：

-- 直接查詢 CSV 文件
SELECT * FROM files.sales_data WHERE region = 'East'
-- 與其他數(shù)據(jù)源關(guān)聯(lián)
SELECT 
  f.product_id,
  p.product_name,
  f.sales_amount
FROM files.sales_data f
JOIN ecommerce.products p ON f.product_id = p.id

四、避坑指南：集成注意事項

4.1 版本一致性

問題：

Calcite 核心依賴和各數(shù)據(jù)源適配器的版本必須一致，不然很容易出現(xiàn)類加載異常。

避坑技巧：

推薦使用 Calcite 1.36.0 版本。這個版本穩(wěn)定性好，適配器齊全。
不要混用不同版本。比如 calcite-core 1.36.0 + calcite-mysql 1.35.0，這種組合極易出問題。
用 mvn dependency:tree 檢查依賴沖突。

4.2 模型文件配置規(guī)范

問題：

Schema 名稱、表名要清晰，別重復(fù)。數(shù)據(jù)源的地址、端口、賬號密碼這些連接參數(shù)一定要準(zhǔn)確。

避坑技巧：

按業(yè)務(wù)域劃分 Schema。比如 retail.orders、crm.users，一眼能看懂歸屬。
表名使用有意義的名稱。避免用 table1、table2 這種模糊命名。
連接參數(shù)做好環(huán)境隔離。開發(fā)、測試、生產(chǎn)環(huán)境用不同的配置文件。

4.3 數(shù)據(jù)源性能考慮

問題：

跨數(shù)據(jù)源查詢的性能取決于最慢的那個數(shù)據(jù)源。如果 MySQL 查詢很快，但 MongoDB 慢，整體查詢還是會被拖慢。

避坑技巧：

確保每個數(shù)據(jù)源自身性能沒問題。定期檢查慢查詢，優(yōu)化索引。
合理使用謂詞下推。Calcite 會自動把過濾條件推到數(shù)據(jù)源執(zhí)行，但要檢查執(zhí)行計劃，確保推下去了。
對小表考慮廣播到內(nèi)存，避免大表大表硬碰硬。

4.4 SQL 方言差異

問題：

不同數(shù)據(jù)源支持的 SQL 語法有差異。比如 grouping sets、窗口函數(shù)、子查詢某些源不完全支持。

避坑技巧：

查詢前先測試。開發(fā)階段用 Calcite 的 EXPLAIN 功能看執(zhí)行計劃。
不支持的語法要降級實現(xiàn)。比如某個源不支持窗口函數(shù)，就改用子查詢。
定期查看 Calcite 和各數(shù)據(jù)源的官方文檔，了解語法支持情況。

五、優(yōu)化小技巧：讓查詢更快更穩(wěn)

5.1 啟用 Calcite 緩存

元數(shù)據(jù)緩存：

避免每次查詢都重新加載 Schema 結(jié)構(gòu)，減少重復(fù)解析和元數(shù)據(jù)查詢的時間。

props.setProperty("calcite.metadataCacheSize", "1000");

查詢計劃緩存：

對相同 SQL 查詢，緩存執(zhí)行計劃，提升重復(fù)查詢效率。

props.setProperty("calcite.parser.factory", 
    "org.apache.calcite.sql.parser.impl.SqlParserImpl#FACTORY");

5.2 優(yōu)化 SQL 寫法

能下推就下推：

盡量避免復(fù)雜的多表關(guān)聯(lián)在 Calcite 層執(zhí)行，把過濾條件下推到數(shù)據(jù)源。

示例：

-- 不好的寫法：先全量掃描再過濾
SELECT * FROM ecommerce.orders o JOIN user_mongo.users u 
  ON o.user_id = u.user_id 
  WHERE o.create_time >= '2025-01-01'
-- 好的寫法：時間過濾下推到 MySQL
SELECT * FROM (
  SELECT * FROM ecommerce.orders WHERE create_time >= '2025-01-01'
) o 
JOIN user_mongo.users u ON o.user_id = u.user_id

選擇必要字段：

避免 SELECT *，只查詢需要的字段，減少數(shù)據(jù)傳輸量。

5.3 自定義優(yōu)化規(guī)則

如果是特別復(fù)雜的業(yè)務(wù)場景，可以自己實現(xiàn) RelOptRule 接口，寫自定義的查詢優(yōu)化規(guī)則。

示例場景：

強制某些過濾條件先執(zhí)行，或者把某個維表標(biāo)成可廣播。

代碼示例：

import org.apache.calcite.rel.RelNode;
import org.apache.calcite.rel.rules.RelOptRule;
public class CustomRule extends RelOptRule {
    public CustomRule() {
        super(operand(FilterRel.class, any()));
    }
    @Override
    public boolean matches(RelOptRuleCall call) {
        // 自定義匹配邏輯
        return true;
    }
    @Override
    public void onMatch(RelOptRuleCall call) {
        // 自定義優(yōu)化邏輯
        FilterRel filter = call.rel(0);
        // ... 重寫查詢計劃
    }
}

5.4 開啟 EXPLAIN 分析

定期分析慢查詢的執(zhí)行計劃，找出性能瓶頸：

EXPLAIN PLAN FOR 
SELECT * FROM ecommerce.orders o 
JOIN user_mongo.user_info u ON o.user_id = u.user_id 
WHERE o.user_id = '123456'

重點關(guān)注：

拉回來的行數(shù)
下推的過濾條件
JOIN 順序
是否使用了索引

六、邊界與選型：什么時候不該用 Calcite

6.1 不適合的場景

強事務(wù) OLTP 場景：

Calcite 不適合替代 OLTP 數(shù)據(jù)庫的核心業(yè)務(wù)場景。對于強事務(wù)需求，如轉(zhuǎn)賬扣減、庫存凍結(jié)，仍需使用傳統(tǒng)數(shù)據(jù)庫，跨庫分布式事務(wù)別硬湊。

大規(guī)模分布式計算：

如果要的是超大規(guī)模分布式計算，直接開 Trino、Presto 集群。Calcite 更像"查詢大腦"，把解析和優(yōu)化做好，執(zhí)行靠接出來的源，或者你自己寫執(zhí)行器。

高頻點查場景：

對于高頻單表點查，直接用數(shù)據(jù)源自身的驅(qū)動可能更高效，沒必要經(jīng)過 Calcite 這一層。

6.2 適合的場景

數(shù)據(jù)中臺：作為統(tǒng)一查詢層
多系統(tǒng)整合：跨部門、跨系統(tǒng)的數(shù)據(jù)融合
實時分析：流批一體化分析
數(shù)據(jù)虛擬化：免 ETL，直接查詢原始數(shù)據(jù)源

6.3 與其他方案的對比

方案	優(yōu)點	缺點	適用場景
Calcite	嵌入式、自定義規(guī)則強、輕量級	分布式能力弱	Spring Boot 應(yīng)用內(nèi)集成、規(guī)則定制化需求強
Trino/Presto	分布式、大規(guī)模計算	學(xué)習(xí)曲線陡、集群運維成本高	數(shù)據(jù)倉庫、大規(guī)模分析
ETL	穩(wěn)定、數(shù)據(jù)一致性好	實時性差、開發(fā)量大	離線數(shù)倉、數(shù)據(jù)同步為主
BI 平臺	易用、可視化強	依賴工具、定制化受限	業(yè)務(wù)分析、報表展示

七、團隊協(xié)作與治理

7.1 統(tǒng)一 SQL 編碼規(guī)范

強制使用 Schema.table 格式訪問表，避免歧義。
禁用 SELECT *，只查詢必要字段。
統(tǒng)一字段命名規(guī)范，下劃線和駝峰明確約定。

7.2 建立查詢評審機制

復(fù)雜查詢需經(jīng)過架構(gòu)評審。
評審重點關(guān)注：查詢邏輯、執(zhí)行計劃、數(shù)據(jù)量預(yù)估。
評審?fù)ㄟ^才能上線。

7.3 監(jiān)控與告警

查詢性能監(jiān)控：對慢查詢（超過 1 秒）進行告警。
跨源查詢數(shù)據(jù)量監(jiān)控：記錄每次查詢涉及的行數(shù)，及時發(fā)現(xiàn)異常。
連接池監(jiān)控：監(jiān)控各數(shù)據(jù)源連接池使用情況，避免連接耗盡。

7.4 定期清理與維護

跨域配置按季度清理：沒用的數(shù)據(jù)源配置就摘掉，避免"歷史債務(wù)"不斷疊加。
元數(shù)據(jù)定期更新：數(shù)據(jù)源表結(jié)構(gòu)變更后，及時更新模型文件。
規(guī)則庫維護：自定義優(yōu)化規(guī)則要定期review，避免規(guī)則過時。

八、總結(jié)

Spring Boot 3 集成 Apache Calcite，最大的變化是：

業(yè)務(wù)寫 SQL，不用管數(shù)據(jù)在哪
適配器管"去哪兒查"，自動路由到對應(yīng)數(shù)據(jù)源
優(yōu)化器管"怎么查得更省"，自動下推、自動優(yōu)化
工程師把精力放回業(yè)務(wù)規(guī)則，而不是堆 DAO、摳連接

它不是萬能鑰匙，但在多源并存的公司里，它確實把"跨庫地獄"挪走了一大半。

用對地方，別把它硬拽去當(dāng)分布式 OLTP，剩下的，交給監(jiān)控、規(guī)范、演練和一點點耐心。

技術(shù)選型的本質(zhì)，不是找最先進的工具，而是找最合適的工具。

參考資料：

Apache Calcite 官方文檔：https://calcite.apache.org/
Spring Boot 3 官方文檔
MyBatis Plus 官方文檔
Apache Flink、Hive 等大數(shù)據(jù)系統(tǒng)的 Calcite 集成案例

到此這篇關(guān)于SpringBoot3集成Calcite多數(shù)據(jù)源查詢實戰(zhàn)筆記-7407466045的文章就介紹到這了,更多相關(guān)SpringBoot3 Calcite多數(shù)據(jù)源查詢內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线 免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

SpringBoot3集成Calcite多數(shù)據(jù)源查詢的實戰(zhàn)示例小結(jié)

目錄

前言：跨庫查詢的痛，誰懂？

一、重新認識 Apache Calcite：不只是數(shù)據(jù)庫，更是查詢大腦

1. SQL 解析與驗證

2. 查詢優(yōu)化

3. 數(shù)據(jù)源適配

4. 跨數(shù)據(jù)源查詢

二、Spring Boot 3 集成 Calcite 實戰(zhàn)指南

2.1 核心依賴引入

2.2 編寫 Calcite 模型文件

2.3 Spring Boot 集成 Calcite + MyBatis Plus 核心配置

2.4 核心查詢實現(xiàn)

定義實體類

定義 Mapper 接口

編寫 Service 層

編寫 Controller 層

三、經(jīng)典使用場景深度解析

3.1 多系統(tǒng)數(shù)據(jù)融合查詢

3.2 實時數(shù)據(jù)與離線數(shù)據(jù)聯(lián)動查詢

3.3 自定義數(shù)據(jù)源適配

四、避坑指南：集成注意事項

4.1 版本一致性

4.2 模型文件配置規(guī)范

4.3 數(shù)據(jù)源性能考慮

4.4 SQL 方言差異

五、優(yōu)化小技巧：讓查詢更快更穩(wěn)

5.1 啟用 Calcite 緩存

5.2 優(yōu)化 SQL 寫法

5.3 自定義優(yōu)化規(guī)則

5.4 開啟 EXPLAIN 分析

六、邊界與選型：什么時候不該用 Calcite

6.1 不適合的場景

6.2 適合的場景

6.3 與其他方案的對比

七、團隊協(xié)作與治理

7.1 統(tǒng)一 SQL 編碼規(guī)范

7.2 建立查詢評審機制

7.3 監(jiān)控與告警

7.4 定期清理與維護

八、總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

前言：跨庫查詢的痛，誰懂？

三、經(jīng)典使用場景深度解析

四、避坑指南：集成注意事項

六、邊界與選型：什么時候不該用 Calcite

七、團隊協(xié)作與治理

八、總結(jié)