三分鐘教會你用Python+OpenCV批量裁剪xml格式標注的圖片

更新時間：2022年01月20日 12:48:42 作者：18歲小白想成大牛

最近學習網絡在線課程的過程中,為了方便課后復習,使用手機截取了大量的圖片,下面這篇文章主要給大家介紹了如何通過三分鐘教會你用Python+OpenCV批量裁剪xml格式標注圖片的相關資料,需要的朋友可以參考下

前言

在目標檢測中，數據集常常使用labelimg標注，會生成xml文件。本文旨在根據xml標注文件來裁剪目標，以達到去除背景信息的目的。

xml文件格式

以下是一個標注好的圖片生成的xml文件。具體含義見代碼注釋。

<annotation>                             <!--xml所屬文件夾-->
	<folder>JPEGImages</folder>          <!--對應圖片所屬文件夾-->
	<filename>408.bmp</filename>
	<path>E:\JPEGImages\408.bmp</path>
	<source>
		<database>Unknown</database>
	</source>
	<size>           				<!--整張圖片寬，高，3通道彩色-->
		<width>413</width>
		<height>342</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>							<!--標注的目標，一共5個框-->
		<name>bad_part</name>			<!--名稱，也就是類別-->
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>                  <!--坐標，左上，左下，右上，右下-->
			<xmin>339</xmin>
			<ymin>103</ymin>
			<xmax>398</xmax>
			<ymax>173</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>265</xmin>
			<ymin>15</ymin>
			<xmax>364</xmax>
			<ymax>74</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>118</xmin>
			<ymin>33</ymin>
			<xmax>195</xmax>
			<ymax>52</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>113</xmin>
			<ymin>103</ymin>
			<xmax>177</xmax>
			<ymax>147</ymax>
		</bndbox>
	</object>
	<object>
		<name>bad_part</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>224</xmin>
			<ymin>298</ymin>
			<xmax>287</xmax>
			<ymax>326</ymax>
		</bndbox>
	</object>
</annotation>

代碼思想

獲取到標簽文件路徑和圖片文件路徑；
遍歷圖片文件夾獲取到圖片，并分割文件名；
根據圖片的文件名加后綴xml得到具體的標簽文件；
通過xml.etree.ElementTree讀取xml文件；
遍歷所有的目標框，獲取到[]；
通過cv2裁剪目標(先高后寬參考文章:http://www.dhdzp.com/article/211183.htm中的第二中裁剪方法)；
將裁剪好的圖片保存到指定文件目錄。

完整代碼

'''
根據xml標簽裁剪目標
1.文件夾中可以有除了圖片格式或標簽格式的文件，有判斷可以忽略其他文件
2.圖片未標注沒有對應的xml文件自動忽略不會報錯
3.同一個圖片有多個真實框，會按名稱_0,名稱_1 …… 排列
4.圖片本身的命名無規(guī)律會按3中的命名規(guī)則加上名稱后綴重新命名。
'''

import cv2
import xml.etree.ElementTree as ET
import os 

img_path = r'E:/JPEGImages' #圖片路徑
xml_path = r'E:/Annotations' #標簽路徑
obj_img_path = r'E:/cut'   #目標裁剪圖片存放路徑

for img_file in os.listdir(img_path):    #遍歷圖片文件夾
    if img_file[-4:] in ['.bmp', '.jpg','.png']:    #判斷文件是否為圖片格式
        img_filename = os.path.join(img_path, img_file)  #將圖片路徑與圖片名進行拼接
        img_cv = cv2.imread(img_filename)  #讀取圖片
        
        img_name = (os.path.splitext(img_file)[0])  #分割出圖片名，如“000.png” 圖片名為“000”
        xml_name = xml_path + '\\' + '%s.xml'%img_name  #利用標簽路徑、圖片名、xml后綴拼接出完整的標簽路徑名
        
        if os.path.exists(xml_name):  #判斷與圖片同名的標簽是否存在，因為圖片不一定每張都打標
            root = ET.parse(xml_name).getroot() #利用ET讀取xml文件
            count = 0 #目標框個數統(tǒng)計，防止目標文件覆蓋
            for obj in root.iter('object'):  #遍歷所有目標框
                name = obj.find('name').text   #獲取目標框名稱，即label名
            
                xmlbox = obj.find('bndbox')   #找到框目標
                x0 = xmlbox.find('xmin').text  #將框目標的四個頂點坐標取出
                y0 = xmlbox.find('ymin').text
                x1 = xmlbox.find('xmax').text
                y1 = xmlbox.find('ymax').text
                
                obj_img = img_cv[int(y0):int(y1), int(x0):int(x1)]  #cv2裁剪出目標框中的圖片
                
                cv2.imwrite(obj_img_path + '\\' + '%s_%s'%(img_name, count) + '.jpg', obj_img)  #保存裁剪圖片
                count += 1 #目標框統(tǒng)計值自增1
                
print("裁剪完成！")

效果展示

總結

ET解析樹基本上是xml標注文件必備的解析庫。
labelimg→ \rightarrow→xml→ \rightarrow→VOC數據集
labelme→ \rightarrow→json→ \rightarrow→COCO數據集
json是字典形式，內存??；xml是DTD文檔，格式統(tǒng)一跨平臺
去除背景信息是很重要的一環(huán)，可以避免模型監(jiān)督學習時學習到相似的錯誤信息。

到此這篇關于用Python+OpenCV批量裁剪xml格式標注圖片的文章就介紹到這了,更多相關Python+OpenCV批量裁剪xml格式圖片內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python生成指定尺寸縮略圖的示例
這篇文章主要介紹了python生成指定尺寸縮略圖的示例,需要的朋友可以參考下
2014-05-05
使用python對excle和json互相轉換的示例
今天小編就為大家分享一篇使用python對excle和json互相轉換的示例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
Python實現求取表格文件某個區(qū)域內單元格的最大值
這篇文章主要介紹基于Python語言,基于Excel表格文件內某一列的數據,計算這一列數據在每一個指定數量的行的范圍內（例如每一個4行的范圍內）的區(qū)間最大值的方法,需要的朋友可以參考下
2023-08-08
Python上下文管理器類和上下文管理器裝飾器contextmanager用法實例分析
這篇文章主要介紹了Python上下文管理器類和上下文管理器裝飾器contextmanager用法,結合實例形式分析了上下文管理器類定義、使用、sqlalchemy實現數據庫的自動提交和回滾相關操作技巧,需要的朋友可以參考下
2019-11-11
Python解析器Cpython的GIL解釋器鎖工作機制
這篇文章主要為大家介紹了Cpython的GIL解釋器鎖工作機制掌握示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2022-07-07
簡單介紹Python中的decode()方法的使用
這篇文章主要介紹了簡單介紹Python中的decode()方法的使用,是Python入門學習當中必須掌握的基礎知識,需要的朋友可以參考下
2015-05-05
Python函數命名空間和作用域(Local與Global)
這篇文章主要介紹了Python函數命名空間和作用域分別介紹Local與Global模式，內容詳細，具有一定的參考價值，需要的小伙伴可以參考一下
2022-03-03
PyQt使用QPropertyAnimation開發(fā)簡單動畫
這篇文章主要介紹了PyQt使用QPropertyAnimation開發(fā)簡單動畫,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-04-04
Python動態(tài)強類型解釋型語言原理解析
這篇文章主要介紹了Python動態(tài)強類型解釋型語言原理解析,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-03-03
Keras函數式(functional)API的使用方式
這篇文章主要介紹了Keras函數式(functional)API的使用方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-02-02