引言:在数据集构建中,我们经常需要挑选一些特殊类型的图片(如:零件中有特殊脏污背景的图片,写论文的时候想单独对这类情况进行热力图验证)。我们把挑选出来的图片放到一个文件夹下,这时候我想快速得到挑出图片对应的标签,如果一个一个在原来的大文件夹中寻找同名标签非常麻烦,这时候就可以使用以下脚本:
代码实现
import os
import shutil
def copy_matching_labels(img_dir, label_dir, target_dir):
"""
复制与图片文件同名的标签文件到目标路径
参数:
img_dir: 图片文件夹路径
label_dir: 原始标签文件夹路径
target_dir: 目标文件夹路径
"""
# 支持的图片扩展名
image_extensions = ['.jpg', '.jpeg', '.png', '.bmp', '.tiff', '.webp']
# 确保目标目录存在
os.makedirs(target_dir, exist_ok=True)
# 获取图片文件列表(不含扩展名)
image_files = []
for file in os.listdir(img_dir):
file_base, ext = os.path.splitext(file)
if ext.lower() in image_extensions:
image_files.append(file_base)
# 复制匹配的标签文件
copied_count = 0
for label_file in os.listdir(label_dir):
if label_file.endswith('.txt'):
label_base = os.path.splitext(label_file)[0]
if label_base in image_files:
src_path = os.path.join(label_dir, label_file)
dst_path = os.path.join(target_dir, label_file)
shutil.copy2(src_path, dst_path)
copied_count += 1
print(f"已复制: {label_file}")
print(f"\n操作完成! 共复制 {copied_count} 个标签文件")
print(f"图片文件数量: {len(image_files)}")
print(f"目标目录: {os.path.abspath(target_dir)}")
if __name__ == "__main__":
img = "C:/Users/admin/Desktop/新建文件夹" # 选出来的图片文件夹
labels = "E:/数据集/labels/val" # 原数据集的标签文件夹
target = "C:/Users/admin/Desktop/新建文件夹 (2)" # 新的标签文件夹
copy_matching_labels(
img_dir=img,
label_dir=labels,
target_dir=target
)