將數(shù)據(jù)集制作成VOC數(shù)據(jù)集格式的實(shí)例
在做目標(biāo)檢測(cè)任務(wù)時(shí),若使用Github已復(fù)現(xiàn)的論文時(shí),需首先將自己的數(shù)據(jù)集轉(zhuǎn)化為VOC數(shù)據(jù)集的格式,因?yàn)檎撐淖髡呤褂玫氖枪_數(shù)據(jù)集VOC 2007、VOC2012、COCO等類型數(shù)據(jù)集做方法驗(yàn)證與比對(duì)。
一、VOC數(shù)據(jù)集格式
--VOCdevkit2007
--VOC2007
--Annotations (xml格式的文件)
--000001.xml
--ImageSets
--Layout
--Main
--train.txt
--test.txt
--val.txt
--trainval.txt
--Segmentation
--JPEGImages (訓(xùn)練集和測(cè)試集圖片)
--000001.jpg
--results
二、轉(zhuǎn)換過程步驟
1. 使用標(biāo)注工具標(biāo)注圖片目標(biāo)檢測(cè)框,生成JSON格式的標(biāo)注文件(本人使用此生成類型的標(biāo)注工具,也可使用(LabelImg等標(biāo)注工具);
2. 批量修改圖片和標(biāo)注文件名稱,從000001.jpg、000001.json標(biāo)號(hào)開始;
#coding='utf-8'
import os
import numpy as np
def imgs_rename(imgs_path):
imgs_labels_name = np.array(os.listdir(imgs_path)).reshape(-1,2)
# 從 000001開始
i = 1
for img_label_name in imgs_labels_name:
if img_label_name[0].endswith('.jpg'):
# 修改圖片名稱
img_old_name = os.path.join(os.path.abspath(imgs_path), img_label_name[0])
# 類別+圖片編號(hào) format(str(i),'0>3s') 填充對(duì)齊
img_new_name = os.path.join(os.path.abspath(imgs_path), '00' + format(str(i),'0>4s') + '.jpg')
os.rename(img_old_name, img_new_name)
# 修改json文件名稱
label_old_name = os.path.join(os.path.abspath(imgs_path), img_label_name[1])
label_new_name = os.path.join(os.path.abspath(imgs_path), '00' + format(str(i), '0>4s') + '.json')
os.rename(label_old_name, label_new_name)
i = i + 1
if __name__=='__main__':
# 讀取json文件的路徑
root = "read_file_path"
imgs_rename(root)
3. 提取圖片和標(biāo)注文件到不同文件夾下,并將讀取的標(biāo)注框轉(zhuǎn)化為txt文件格式(本人的圖片和JSON文件在同一目錄下生成);
import json
import os
import numpy as np
import cv2
#讀取json格式文件,返回坐標(biāo)
def read_json(file_name):
file = open(file_name,'r',encoding='utf-8')
set = json.load(file)
# print("讀取完整信息:",set)
coord = set['objects'][0]['seg'] # 只讀取第一個(gè)標(biāo)注的車牌
return coord
def save_imgs(imgs_jsons_files, imgs_path):
# 提取圖片文件夾中的jpg文件名稱
for idx in range(len(imgs_jsons_list)):
if imgs_jsons_list[idx][-3:]=='jpg':
img_name = imgs_jsons_list[idx]
read_img_path = os.path.join(imgs_jsons_files, img_name)
img = cv2.imread(read_img_path)
save_img_path = os.path.join(imgs_path, img_name)
cv2.imwrite(save_img_path, img)
def save_labels(imgs_jsons_files, labels_path):
# 提取圖片文件夾中的json文件名稱
for idx in range(len(imgs_jsons_list)):
if imgs_jsons_list[idx][-4:] == 'json':
json_name = imgs_jsons_list[idx]
# 操作每一個(gè)json文件,讀取并保存坐標(biāo)
json_path = os.path.join(imgs_jsons_files, json_name)
json_coord = read_json(json_path)
if len(json_coord) > 8:
print("標(biāo)注坐標(biāo)多于四個(gè)點(diǎn)的文件名稱:", json_name)
# 提取左上和右下坐標(biāo)
roi_coord = []
for idx in range(len(json_coord)):
if idx == 0 or idx == 1 or idx == 4 or idx == 5:
roi_coord.extend([json_coord[idx]])
# 保存roi坐標(biāo)到txt文件中
label_path = labels_path + json_name[:6] + '.txt'
np.savetxt(label_path, roi_coord)
if __name__=='__main__':
print("loading......")
# 讀取jpg json文件的路徑
imgs_jsons_files = "Jpg_json_file_path"
# 保存讀取的真實(shí)標(biāo)簽路徑
labels_path = "save_labels_path"
if not os.path.exists(labels_path):
os.mkdir(labels_path)
# 保存讀取的圖片
imgs_path = "sabe_imgs_path"
if not os.path.exists(imgs_path):
os.mkdir(imgs_path)
imgs_jsons_list = os.listdir(imgs_jsons_files)
save_imgs(imgs_jsons_files, imgs_path)
save_labels(imgs_jsons_files, labels_path)
print("done!!!")
4. 轉(zhuǎn)化標(biāo)注框txt格式為xml格式;
# encoding = utf-8
import os
import numpy as np
import codecs
import cv2
def read_txt(label_path):
file = open(label_path,'r',encoding='utf-8')
label_lines = file.readlines()
label = []
for line in label_lines:
one_line = float(line.strip().split('\n')[0])
label.extend([one_line])
return np.array(label,dtype=np.float64)
def covert_xml(label,xml_path, img_name, img_path):
# 獲得圖片信息
img = cv2.imread(img_path)
height, width, depth = img.shape
x_min,y_min,x_max,y_max = label
xml = codecs.open(xml_path, 'w', encoding='utf-8')
xml.write('<annotation>\n')
xml.write('\t<folder>' + 'VOC2007' + '</folder>\n')
xml.write('\t<filename>' + img_name + '</filename>\n')
xml.write('\t<source>\n')
xml.write('\t\t<database>The VOC 2007 Database</database>\n')
xml.write('\t\t<annotation>Pascal VOC2007</annotation>\n')
xml.write('\t\t<image>flickr</image>\n')
xml.write('\t\t<flickrid>NULL</flickrid>\n')
xml.write('\t</source>\n')
xml.write('\t<owner>\n')
xml.write('\t\t<flickrid>NULL</flickrid>\n')
xml.write('\t\t<name>faster</name>\n')
xml.write('\t</owner>\n')
xml.write('\t<size>\n')
xml.write('\t\t<width>' + str(width) + '</width>\n')
xml.write('\t\t<height>' + str(height) + '</height>\n')
xml.write('\t\t<depth>' + str(depth) + '</depth>\n')
xml.write('\t</size>\n')
xml.write('\t\t<segmented>0</segmented>\n')
xml.write('\t<object>\n')
xml.write('\t\t<name>plate</name>\n')
xml.write('\t\t<pose>Unspecified</pose>\n')
xml.write('\t\t<truncated>0</truncated>\n')
xml.write('\t\t<difficult>0</difficult>\n')
xml.write('\t\t<bndbox>\n')
xml.write('\t\t\t<xmin>' + str(x_min) + '</xmin>\n')
xml.write('\t\t\t<ymin>' + str(y_min) + '</ymin>\n')
xml.write('\t\t\t<xmax>' + str(x_max) + '</xmax>\n')
xml.write('\t\t\t<ymax>' + str(y_max) + '</ymax>\n')
xml.write('\t\t</bndbox>\n')
xml.write('\t</object>\n')
xml.write('</annotation>')
if __name__=='__main__':
labels_file_path = "D:/Code_py/VOC2007/labels/"
imgs_file_path = "D:/Code_Py/VOC2007/imgs/"
xmls_file_path = "D:/Code_py/VOC2007/xmls/"
if not os.path.exists(xmls_file_path):
os.mkdir(xmls_file_path)
labels_name = os.listdir(labels_file_path)
for label_name in labels_name:
label_path = os.path.join(labels_file_path, label_name)
label = read_txt(label_path)
xml_name = label_name[:6]+'.xml'
xml_path = os.path.join(xmls_file_path, xml_name)
img_name = label_name[:6]+'.jpg'
img_path = os.path.join(imgs_file_path, img_name)
covert_xml(label, xml_path, img_name, img_path)
5. 切分?jǐn)?shù)據(jù)集為訓(xùn)練集、驗(yàn)證集和測(cè)試集,僅保存圖片的名稱到txt問價(jià)下即可;
import os
import numpy as np
if __name__=='__main__':
root = "save_path"
train = open(root+"train.txt", 'w', encoding='utf-8')
train_val = open(root+"trainval.txt", 'w', encoding='utf-8')
test = open(root+"test.txt", 'w', encoding='utf-8')
val = open(root+"val.txt", 'w', encoding='utf-8')
imgs_path = os.path.join(root, "imgs")
imgs_name = os.listdir(imgs_path)
# 首先切分訓(xùn)練驗(yàn)證集和測(cè)試集
train_val_img_info = []
for img_name in imgs_name:
x = np.random.uniform(0,1)
img_info = str(img_name).strip().split('.')[0]
# 隨機(jī)選取1/2比例的數(shù)據(jù)為測(cè)試集
if x>0.5:
train_val_img_info.append(img_info)
train_val.writelines(img_info)
else:
test.writelines(img_info+'\n')
# 然后切分訓(xùn)練驗(yàn)證集為訓(xùn)練集和驗(yàn)證集
for img_name in train_val_img_info:
x = np.random.uniform(0,1)
if x>0.5:
train.writelines(img_name+'\n')
else:
val.writelines(img_name+'\n')
以上這篇將數(shù)據(jù)集制作成VOC數(shù)據(jù)集格式的實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
關(guān)于windos10環(huán)境下編譯python3版pjsua庫(kù)的問題
pjsua默認(rèn)綁定的python版本是python 2.4,使用起來(lái)有諸多限制,希望可以使用python3調(diào)用pjsua的庫(kù)實(shí)現(xiàn)軟電話的基礎(chǔ)功能。這篇文章主要介紹了windos10環(huán)境下編譯python3版pjsua庫(kù),需要的朋友可以參考下2021-10-10
基于Python編寫一個(gè)有趣的年會(huì)抽獎(jiǎng)系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了如何使用Python編寫一個(gè)簡(jiǎn)易的抽獎(jiǎng)系統(tǒng),順便幫助大家鞏固一下對(duì)Python語(yǔ)法和框架的理解,感興趣的小伙伴可以了解下2023-12-12
python?matplotlib繪畫十一種常見數(shù)據(jù)分析圖
這篇文章主要介紹了python?matplotlib繪畫十一種常見數(shù)據(jù)分析圖,文章主要繪制折線圖、散點(diǎn)圖、直方圖、餅圖等需要的小伙伴可以參考一下文章具體內(nèi)容2022-06-06
django 做 migrate 時(shí) 表已存在的處理方法
今天小編就為大家分享一篇django 做 migrate 時(shí) 表已存在的處理方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2019-08-08
詳解numpy.ndarray.reshape()函數(shù)的參數(shù)問題
這篇文章主要介紹了詳解numpy.ndarray.reshape()函數(shù)的參數(shù)問題,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-10-10
python?pandas數(shù)據(jù)處理之刪除特定行與列
Pandas是數(shù)據(jù)科學(xué)中的利器,你可能想到的數(shù)據(jù)處理騷操作,貌似用Pandas都能夠?qū)崿F(xiàn),下面這篇文章主要給大家介紹了關(guān)于python?pandas數(shù)據(jù)處理之刪除特定行與列的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-08-08
python遍歷一個(gè)目錄,輸出所有的文件名的實(shí)例
下面小編就為大家分享一篇python遍歷一個(gè)目錄,輸出所有的文件名的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2018-04-04

