使用Docker快速搭建Airflow+MySQL詳細(xì)步驟
為了使用 Docker 安裝 Apache Airflow 2.9.3 并配置 MySQL 數(shù)據(jù)庫(kù)并確保數(shù)據(jù)持久化,我們可以使用 Docker Compose。以下是詳細(xì)步驟:
步驟 1:創(chuàng)建項(xiàng)目目錄
在你的工作目錄中創(chuàng)建一個(gè)新目錄來(lái)存放所有相關(guān)的配置文件和腳本。
mkdir airflow-mysql cd airflow-mysql
步驟 2:創(chuàng)建 docker-compose.yml 文件
在項(xiàng)目目錄中創(chuàng)建一個(gè)名為 docker-compose.yml 的文件,內(nèi)容如下:
version: '3.7'
services:
mysql:
image: mysql:8.0.27
environment:
MYSQL_ROOT_PASSWORD: rootpassword
MYSQL_DATABASE: airflow
MYSQL_USER: airflow
MYSQL_PASSWORD: airflowpassword
MYSQL_CHARSET: utf8mb4
MYSQL_COLLATION: utf8mb4_general_ci
ports:
- "3306:3306"
volumes:
- mysql_data:/var/lib/mysql
airflow-webserver:
image: apache/airflow:2.9.3
environment:
AIRFLOW__CORE__EXECUTOR: LocalExecutor
AIRFLOW__CORE__SQL_ALCHEMY_CONN: mysql+mysqldb://airflow:airflowpassword@mysql:3306/airflow
AIRFLOW__CORE__FERNET_KEY: 'YOUR_FERNET_KEY'
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
AIRFLOW__WEBSERVER__RBAC: 'true'
depends_on:
- mysql
ports:
- "8080:8080"
volumes:
- ./dags:/opt/airflow/dags
- ./logs:/opt/airflow/logs
- ./plugins:/opt/airflow/plugins
command: ["bash", "-c", "airflow db init && airflow users create -r Admin -u admin -p admin -e admin@example.com -f Admin -l User && airflow webserver"]
airflow-scheduler:
image: apache/airflow:2.9.3
environment:
AIRFLOW__CORE__EXECUTOR: LocalExecutor
AIRFLOW__CORE__SQL_ALCHEMY_CONN: mysql+mysqldb://airflow:airflowpassword@mysql:3306/airflow
AIRFLOW__CORE__FERNET_KEY: 'YOUR_FERNET_KEY'
AIRFLOW__CORE__LOAD_EXAMPLES: 'false'
AIRFLOW__WEBSERVER__RBAC: 'true'
depends_on:
- mysql
volumes:
- ./dags:/opt/airflow/dags
- ./logs:/opt/airflow/logs
- ./plugins:/opt/airflow/plugins
command: ["bash", "-c", "airflow scheduler"]
volumes:
mysql_data:請(qǐng)注意,YOUR_FERNET_KEY 需要替換為一個(gè)實(shí)際的 Fernet 密鑰,可以通過(guò)以下命令生成:
python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"
步驟 3:創(chuàng)建目錄結(jié)構(gòu)
為 Airflow 的 DAGs、日志和插件創(chuàng)建目錄:
mkdir -p dags logs plugins chmod -R 777 dags logs plugins
步驟 4:?jiǎn)?dòng) Docker Compose
在項(xiàng)目目錄中運(yùn)行以下命令來(lái)啟動(dòng)所有服務(wù):
docker-compose up -d
步驟 5:檢查服務(wù)狀態(tài)
你可以使用以下命令查看正在運(yùn)行的容器:
docker-compose ps
步驟 6:訪問(wèn) Airflow Web UI
打開(kāi)瀏覽器并訪問(wèn) http://localhost:8080,你應(yīng)該能夠看到 Airflow 的登錄頁(yè)面。使用以下默認(rèn)憑據(jù)登錄:
- 用戶(hù)名:
admin - 密碼:
admin
解釋
服務(wù)定義
- mysql: 使用 MySQL 8.0.27 鏡像,設(shè)置數(shù)據(jù)庫(kù)名稱(chēng)、用戶(hù)和密碼,并將數(shù)據(jù)持久化到
mysql_data卷中。 - airflow-webserver: 使用 Airflow 2.9.3 鏡像,配置連接 MySQL 的連接字符串,初始化數(shù)據(jù)庫(kù)并創(chuàng)建管理員用戶(hù),然后啟動(dòng) Airflow Webserver。
- airflow-scheduler: 使用 Airflow 2.9.3 鏡像,配置連接 MySQL 的連接字符串,并啟動(dòng) Airflow Scheduler。
數(shù)據(jù)持久化
- MySQL 數(shù)據(jù)通過(guò) Docker 卷
mysql_data持久化。 - Airflow 的 DAGs、日志和插件通過(guò)綁定掛載到主機(jī)的目錄
./dags、./logs和./plugins。
其他配置
環(huán)境變量說(shuō)明
AIRFLOW__CORE__EXECUTOR:LocalExecutor表示使用本地執(zhí)行器。AIRFLOW__CORE__SQL_ALCHEMY_CONN: 設(shè)置 Airflow 連接 MySQL 的連接字符串。格式為mysql+mysqldb://<username>:<password>@<host>:<port>/<database>。AIRFLOW__CORE__FERNET_KEY: 用于加密連接密碼的密鑰??梢酝ㄟ^(guò)python -c "from cryptography.fernet import Fernet; print(Fernet.generate_key().decode())"生成這個(gè)密鑰。AIRFLOW__CORE__LOAD_EXAMPLES: 設(shè)置為false表示不加載示例 DAGs,以保持環(huán)境干凈。AIRFLOW__WEBSERVER__RBAC: 啟用基于角色的訪問(wèn)控制。
Docker Compose 配置說(shuō)明
- depends_on: 確保 MySQL 服務(wù)在 Airflow 服務(wù)之前啟動(dòng)。
- volumes: 用于持久化數(shù)據(jù)和共享文件。MySQL 數(shù)據(jù)存儲(chǔ)在
mysql_data卷中;Airflow 的 DAGs、日志和插件分別綁定掛載到主機(jī)的./dags、./logs和./plugins目錄。 - command: 定義容器啟動(dòng)時(shí)要運(yùn)行的命令。對(duì)于
airflow-webserver服務(wù),首先初始化數(shù)據(jù)庫(kù)并創(chuàng)建管理員用戶(hù),然后啟動(dòng) Airflow Webserver。對(duì)于airflow-scheduler服務(wù),啟動(dòng) Airflow Scheduler。
確保持久化
持久化數(shù)據(jù)是確保服務(wù)重啟后數(shù)據(jù)不會(huì)丟失的關(guān)鍵。我們使用 Docker 卷來(lái)持久化 MySQL 數(shù)據(jù),并使用綁定掛載來(lái)持久化 Airflow 的 DAGs、日志和插件。
啟動(dòng)和管理容器
啟動(dòng)容器:
docker-compose up -d
查看容器狀態(tài):
docker-compose ps
查看日志:
docker-compose logs -f
停止和刪除容器:
docker-compose down
進(jìn)一步配置和優(yōu)化
安全性
更改默認(rèn)密碼:
默認(rèn)的管理員密碼為 admin,建議在第一次登錄后立即更改密碼。
使用環(huán)境變量保護(hù)敏感信息:
避免將敏感信息直接寫(xiě)入 docker-compose.yml 文件,可以使用 Docker Secrets 或環(huán)境變量來(lái)保護(hù)敏感信息。
資源限制
根據(jù)你的硬件資源,可以在 docker-compose.yml 中為容器設(shè)置資源限制:
airflow-webserver:
...
deploy:
resources:
limits:
cpus: '0.50'
memory: '512M'
...日志管理
確保日志文件不會(huì)無(wú)限制地增長(zhǎng),可以在 docker-compose.yml 中配置日志選項(xiàng):
airflow-webserver:
...
logging:
driver: "json-file"
options:
max-size: "10m"
max-file: "3"
...備份和恢復(fù)
定期備份 MySQL 數(shù)據(jù)庫(kù)和 Airflow 配置,以防止數(shù)據(jù)丟失。你可以使用 cron jobs 或其他備份工具來(lái)實(shí)現(xiàn)這一點(diǎn)。
擴(kuò)展性
如果需要擴(kuò)展到多個(gè)節(jié)點(diǎn),可以考慮使用 CeleryExecutor 或 KubernetesExecutor。CeleryExecutor 需要額外的配置和 Redis/RabbitMQ 作為消息隊(duì)列。
示例 DAG 創(chuàng)建
在 dags 目錄中創(chuàng)建一個(gè)簡(jiǎn)單的示例 DAG 文件,例如 example_dag.py:
from airflow import DAG
from airflow.operators.bash import BashOperator
from datetime import datetime, timedelta
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=5),
}
with DAG(
'example_dag',
default_args=default_args,
description='A simple example DAG',
schedule_interval=timedelta(days=1),
start_date=datetime(2023, 1, 1),
catchup=False,
) as dag:
t1 = BashOperator(
task_id='print_date',
bash_command='date',
)
t2 = BashOperator(
task_id='sleep',
bash_command='sleep 5',
)
t1 >> t2這將創(chuàng)建一個(gè)簡(jiǎn)單的 DAG,包含兩個(gè)任務(wù):打印當(dāng)前日期和等待 5 秒。
監(jiān)控和日志
Airflow 提供了豐富的監(jiān)控和日志功能,可以幫助你跟蹤任務(wù)的執(zhí)行狀態(tài)和性能。
Airflow Web UI:
通過(guò) Web UI 查看 DAG 和任務(wù)的狀態(tài)、日志和圖形化表示。
日志文件:
查看容器內(nèi)的日志文件,了解更多詳細(xì)信息。
docker-compose logs airflow-webserver docker-compose logs airflow-scheduler
更新和升級(jí)
定期更新 Airflow 和相關(guān)依賴(lài)項(xiàng),以確保獲得最新的功能和安全補(bǔ)丁。
更新 Docker 鏡像:
docker pull apache/airflow:2.9.3 docker-compose up -d
更新 MySQL 鏡像:
docker pull mysql:8.0.27 docker-compose up -d
結(jié)論
通過(guò)這些步驟,你可以成功地使用 Docker 和 MySQL 部署和配置 Apache Airflow 2.9.3
驗(yàn)證 Docker 容器是否成功啟動(dòng),可以使用一系列命令來(lái)檢查容器的狀態(tài)和日志。以下是一些常用的命令和步驟:
1. 檢查容器狀態(tài)
使用 docker ps 命令查看正在運(yùn)行的容器:
docker ps
這個(gè)命令會(huì)列出所有正在運(yùn)行的容器,包括它們的容器 ID、名稱(chēng)、狀態(tài)等。
如果要查看所有容器(包括停止的),可以使用 -a 選項(xiàng):
docker ps -a
2. 查看容器日志
查看特定容器的日志可以幫助你了解容器是否正常啟動(dòng),并排除潛在的錯(cuò)誤。使用 docker logs 命令:
docker logs <container_id_or_name>
你還可以使用 -f 選項(xiàng)來(lái)實(shí)時(shí)跟蹤日志輸出:
docker logs -f <container_id_or_name>
3. 使用 Docker Compose 驗(yàn)證
如果你使用的是 Docker Compose,可以使用以下命令查看所有服務(wù)的狀態(tài):
docker logs -f <container_id_or_name>
查看所有服務(wù)的日志:
docker-compose logs
實(shí)時(shí)查看日志:
docker-compose logs -f
4. 具體示例
假設(shè)你有一個(gè)名為 airflow-webserver 的容器,以下是如何驗(yàn)證它是否成功啟動(dòng)的步驟:
檢查容器狀態(tài):
docker ps
你應(yīng)該看到類(lèi)似以下的輸出:
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
abc123def456 apache/airflow:2.9.3 "/entrypoint.sh airf…" 2 minutes ago Up 2 minutes 0.0.0.0:8080->8080/tcp airflow-webserver
如果容器狀態(tài)是 Up,表明容器正在運(yùn)行。
查看容器日志:
docker logs airflow-webserver
你應(yīng)該看到 Airflow Webserver 的啟動(dòng)日志,確認(rèn)沒(méi)有錯(cuò)誤信息。
實(shí)時(shí)跟蹤日志:
docker logs -f airflow-webserver
實(shí)時(shí)查看容器的輸出,確保沒(méi)有任何問(wèn)題。
使用 Docker Compose 驗(yàn)證:
docker-compose ps
你應(yīng)該看到類(lèi)似以下的輸出:
Name Command State Ports
-----------------------------------------------------------------------------------------------------------
airflow-mysql_mysql_1 docker-entrypoint.sh mysqld Up 3306/tcp
airflow-mysql_webserver_1 /entrypoint.sh airflow w ... Up (healthy) 0.0.0.0:8080->8080/tcp
airflow-mysql_scheduler_1 /entrypoint.sh airflow s ... Up
查看所有服務(wù)的日志:
docker-compose logs
實(shí)時(shí)查看所有服務(wù)的日志:
docker-compose logs -f
5. 健康檢查
一些 Docker 鏡像提供了健康檢查功能,可以通過(guò) docker ps 命令中的 STATUS 列查看健康狀態(tài)。如果鏡像支持健康檢查,你會(huì)看到類(lèi)似 Up (healthy) 的狀態(tài)。
6. 訪問(wèn) Web UI
最終,你可以通過(guò)瀏覽器訪問(wèn)相應(yīng)的服務(wù) URL 以驗(yàn)證服務(wù)是否正常運(yùn)行。例如,對(duì)于 Airflow Webserver,你可以訪問(wèn) http://localhost:8080,如果能夠看到 Airflow 的登錄頁(yè)面,說(shuō)明 Webserver 已經(jīng)成功啟動(dòng)。
總結(jié)
通過(guò)這些命令和步驟,可以有效地驗(yàn)證 Docker 容器是否成功啟動(dòng),并通過(guò)查看日志和狀態(tài)排除潛在的錯(cuò)誤。
到此這篇關(guān)于使用Docker快速搭建Airflow+MySQL詳細(xì)步驟的文章就介紹到這了,更多相關(guān)Docker 搭建Airflow MySQL內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
docker-compose部署Java應(yīng)用和相關(guān)依賴(lài)方式
介紹如何使用docker-compose一鍵部署Java應(yīng)用及依賴(lài),并實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的自動(dòng)初始化2024-10-10
在?OpenKylin?上安裝?Docker的詳細(xì)過(guò)程
在?OpenKylin?上安裝?Docker可能會(huì)遇到與?Ubuntu?略有不同的包管理問(wèn)題,這篇文章主要介紹了在?OpenKylin上安裝?Docker的過(guò)程,需要的朋友可以參考下2024-05-05
docker-compose管理容器network與ip問(wèn)題
這篇文章主要介紹了docker-compose管理容器network與ip問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01
Docker 容器生命周期 架構(gòu) 以及和VM之間的差異詳解
這篇文章主要介紹了Docker 容器生命周期 架構(gòu) 以及和VM之間的差異詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-11-11
Docker搭建Redis主從復(fù)制的實(shí)現(xiàn)步驟
本文主要介紹了Docker搭建Redis主從復(fù)制的實(shí)現(xiàn)步驟,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-11-11

