.NET 開發(fā)中如何通過 C# 提取 PDF 中的圖片

更新時間：2026年02月03日 08:44:33 作者：LAYONTHEGROUND

本文介紹了如何使用FreeSpire.PDFfor.NET免費庫從PDF文檔中提取圖片,提供了兩種典型場景的代碼示例,并強(qiáng)調(diào)了該方案的優(yōu)勢,包括靈活可控、高效批量處理和輕量無依賴,感興趣的朋友跟隨小編一起看看吧

在.NET 開發(fā)中，從 PDF 里提取圖片是個高頻需求 —— 不管是數(shù)據(jù)遷移時需要剝離文檔中的圖表，還是內(nèi)容分析時要提取關(guān)鍵插圖，都繞不開這個場景。但傳統(tǒng)方案總有些麻煩：付費 PDF 庫成本高，還可能依賴 Adobe Acrobat 這類重型工具，對中小型項目不夠友好。
本文將介紹如何使用免費庫 Free Spire.PDF for .NET 精準(zhǔn)實現(xiàn)“整文檔批量提取”或“指定頁面精準(zhǔn)提取”，代碼簡單、操作高效。

一、前期準(zhǔn)備：快速引入工具庫

使用 Free Spire.PDF 前，需先完成庫引用，推薦通過 NuGet 安裝（步驟極簡，3步即可完成）：

打開Visual Studio，右鍵項目選擇“管理NuGet程序包”；
在“瀏覽”欄搜索“Free Spire.PDF”，找到官方包后點擊“安裝”；
等待安裝完成，項目會自動添加引用，無需手動配置路徑。

?? 注意：免費版對單文檔頁數(shù)有一定限制。

二、核心邏輯與場景實現(xiàn)

Free Spire.PDF 提取圖片的核心邏輯很清晰：通過 PdfImageHelper 類的 GetImagesInfo() 方法獲取頁面圖片信息，再調(diào)用 PdfImageInfo.Image.Save() 保存圖片。以下針對兩種典型場景，提供可直接復(fù)用的代碼。

場景1：提取 PDF 文檔中所有圖片

適用于需要批量獲取文檔中所有圖片的場景（例如歸檔文檔內(nèi)所有插圖等）。實現(xiàn)邏輯為“加載文檔→遍歷所有頁面→提取并按序保存圖片”。

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;
namespace ExtractAllImages
{
    class Program
    {
        static void Main(string[] args)
        {
            // 1. 加載目標(biāo)PDF文檔
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("Input.pdf"); // 替換為你的PDF路徑
            // 2. 初始化圖片處理工具
            PdfImageHelper imageHelper = new PdfImageHelper();
            // 3. 遍歷所有頁面，提取圖片
            int imageCount = 0; // 用于給圖片命名，避免重復(fù)
            for (int pageIndex = 0; pageIndex < pdf.Pages.Count; pageIndex++)
            {
                // 獲取當(dāng)前頁對象
                PdfPageBase currentPage = pdf.Pages[pageIndex];
                // 獲取當(dāng)前頁所有圖片信息
                PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(currentPage);
                // 保存當(dāng)前頁的圖片
                foreach (var imageInfo in imageInfos)
                {
                    Image image = imageInfo.Image;
                    // 保存路徑可自定義
                    image.Save($"Output\\image_{imageCount}.png"); 
                    imageCount++;
                }
            }
            // 4. 釋放資源
            pdf.Dispose();
        }
    }
}

場景2：提取 PDF 指定頁面的圖片

適用于僅需某幾頁圖片的場景（例如從多頁報告中提取封面圖、從論文中提取某頁的圖表等）。核心是“定位目標(biāo)頁面→單獨提取該頁圖片”。

?? 關(guān)鍵提醒：Free Spire.PDF 的頁面索引從0開始（第1頁對應(yīng)索引0，第2頁對應(yīng)索引1，以此類推）。

using Spire.Pdf;
using Spire.Pdf.Utilities;
using System.Drawing;
namespace ExtractImagesFromSpecificPage
{
    class Program
    {
        static void Main(string[] args)
        {
            // 1. 加載目標(biāo)PDF文檔
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("Input.pdf"); // 替換為你的PDF路徑
            // 2. 定位指定頁面（此處以第1頁為例，索引為0）
            int targetPageIndex = 0; // 如需提取第3頁，改為2即可
            PdfPageBase targetPage = pdf.Pages[targetPageIndex];
            // 3. 初始化圖片處理工具并獲取圖片信息
            PdfImageHelper imageHelper = new PdfImageHelper();
            PdfImageInfo[] imageInfos = imageHelper.GetImagesInfo(targetPage);
            // 4. 保存指定頁的圖片
            for (int i = 0; i < imageInfos.Length; i++)
            {
                Image image = imageInfos[i].Image;
                // 保存路徑可自定義
                image.Save($"Output\\page_{targetPageIndex + 1}_image_{i}.png"); 
            }
            // 5. 釋放資源
            pdf.Dispose();
        }
    }
}