【Python开源】深度解析:一款高效音频封面批量删除工具的设计与实现

news2025/7/13 4:24:05

🎵 【Python开源】深度解析:一款高效音频封面批量删除工具的设计与实现

请添加图片描述

🌈 个人主页:创客白泽 - CSDN博客
🔥 系列专栏:🐍《Python开源项目实战》
💡 热爱不止于代码,热情源自每一个灵感闪现的夜晚。愿以开源之火,点亮前行之路。
👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更多人哦

请添加图片描述在这里插入图片描述

📖 概述

在数字音乐管理过程中,音频文件内嵌的封面图片往往会占用额外存储空间,特别是当我们需要批量处理大量音频文件时。本文介绍一款基于Python和PyQt5开发的跨平台音频封面删除工具,它支持多种音频格式(MP3、FLAC、M4A、OGG、WMA),提供三种不同的处理方式,并具备友好的图形用户界面。

本工具不仅能有效移除音频文件中的封面数据,还能保持音频质量无损,是音乐收藏家和数字资产管理者的实用工具。下面我们将从功能、实现原理、代码解析等多个维度进行详细介绍。

🛠️ 功能特点

  1. 多格式支持

    • MP3 (ID3标签)
    • FLAC (Vorbis注释)
    • M4A/MP4 (iTunes元数据)
    • OGG (Vorbis/Opus)
    • WMA (ASF容器)
  2. 三种处理方式

    • Mutagen库(推荐):Python专用音频元数据处理库
    • FFmpeg:专业音视频处理工具
    • 二进制处理:最后手段的直接文件操作
  3. 智能文件管理

    • 拖放文件夹支持
    • 自动扫描子目录
    • 可选输出目录设置
    • 文件类型过滤
  4. 可视化操作

    • 进度条显示
    • 处理结果统计
    • 错误处理机制

🖼️ 界面展示

在这里插入图片描述

图1:软件主界面,包含目录设置、文件列表和操作按钮
在这里插入图片描述
在这里插入图片描述

图2、图3:文件处理进度显示

🧰 使用说明

1. 准备工作

  • 安装Python 3.7+
  • 安装依赖库:
    pip install PyQt5 mutagen
    
    • (可选) 如需使用FFmpeg方式,需提前安装FFmpeg并加入系统PATH

2. 操作步骤

  1. 选择输入目录:点击"浏览"按钮或直接拖放文件夹到输入框
  2. 设置输出目录(可选):默认为输入目录下的"cleaned_audio"文件夹
  3. 选择处理方式
    • Mutagen:推荐方式,处理速度快且稳定
    • FFmpeg:适合复杂音频文件
    • 二进制:最后手段,兼容性较差
  4. 扫描文件:点击"扫描文件"按钮获取目录下所有支持的音频文件
  5. 选择处理范围
    • “处理选中”:仅处理列表中选中的文件
    • “处理全部”:批量处理所有扫描到的文件
  6. 查看结果:处理完成后会显示成功/失败统计,处理后的文件保存在输出目录

3. 注意事项

  • 处理前建议备份原始文件
  • 某些音频播放器可能需要重新扫描文件才能显示更改
  • FLAC文件的封面删除会同时移除所有内嵌图片

💻 代码深度解析

1. 核心技术栈

  • PyQt5:构建现代化GUI界面
  • Mutagen:音频元数据处理核心库
  • FFmpeg(可选):专业音视频处理
  • 标准库:os, sys, shutil等处理文件操作

2. 关键类说明

DraggableLineEdit (自定义拖放文本框)
class DraggableLineEdit(QLineEdit):
    def dragEnterEvent(self, event):
        if event.mimeData().hasUrls():
            event.acceptProposedAction()
    
    def dropEvent(self, event):
        for url in event.mimeData().urls():
            path = url.toLocalFile()
            if os.path.isdir(path):
                self.setText(path)
                break

实现文件夹拖放功能的核心代码,增强了用户体验

AudioCoverRemover (主窗口类)
def process_with_mutagen(self, input_path, output_path, ext):
    # 先复制文件
    if input_path != output_path:
        shutil.copy2(input_path, output_path)
    
    # 根据格式使用不同的处理方法
    if ext == "mp3":
        audio = MP3(output_path, ID3=ID3)
        if audio.tags:
            audio.tags.delall("APIC")
            audio.save()
    elif ext == "flac":
        audio = FLAC(output_path)
        if audio.pictures:
            audio.clear_pictures()
            audio.save()
    ...

不同音频格式的封面删除逻辑,展示了Mutagen库的强大灵活性

3. 设计亮点

  1. 多方法兼容处理
    • 提供三种不同实现方式,确保最大兼容性
    • 自动选择最适合当前文件的方法
  2. 现代化UI设计
    • 自定义样式表美化界面
    • 响应式布局适应不同分辨率
    • 进度反馈增强用户体验
  3. 健壮的错误处理
    • 捕获并记录各种处理异常
    • 不影响整体批处理流程
  4. 跨平台支持
    • 兼容Windows/macOS/Linux
    • 自动处理路径分隔符差异

📥 源码下载

import os
import sys
import subprocess
import shutil
from mutagen.mp3 import MP3
from mutagen.id3 import ID3, APIC
from mutagen.flac import FLAC
from mutagen.mp4 import MP4
from mutagen.oggopus import OggOpus
from mutagen.oggvorbis import OggVorbis
from mutagen.asf import ASF
from PyQt5.QtWidgets import (QApplication, QMainWindow, QVBoxLayout, QHBoxLayout,
                            QPushButton, QLabel, QLineEdit, QFileDialog,
                            QListWidget, QWidget, QProgressBar, QMessageBox,
                            QCheckBox, QGroupBox, QComboBox)
from PyQt5.QtCore import Qt, QMimeData
from PyQt5.QtGui import QColor, QPalette, QIcon

class DraggableLineEdit(QLineEdit):
    def __init__(self, parent=None):
        super().__init__(parent)
        self.setAcceptDrops(True)
    
    def dragEnterEvent(self, event):
        if event.mimeData().hasUrls():
            event.acceptProposedAction()
    
    def dropEvent(self, event):
        for url in event.mimeData().urls():
            path = url.toLocalFile()
            if os.path.isdir(path):
                self.setText(path)
                break

class AudioCoverRemover(QMainWindow):
    def __init__(self):
        super().__init__()
        self.setWindowTitle("🎵 音频封面删除工具")
        self.setGeometry(100, 100, 547, 608)
        
        # 支持的音频格式
        self.supported_formats = {
            'mp3': 'MP3音频',
            'flac': 'FLAC无损音频',
            'm4a': 'MP4/AAC音频',
            'ogg': 'OGG音频',
            'wma': 'WMA音频'
        }
        
        # 初始化变量
        self.audio_files = []
        self.current_method = "mutagen"
        
        # 设置UI样式
        self.setup_ui_style()
        
        # 初始化UI
        self.init_ui()
        
        # 设置窗口图标
        self.setWindowIcon(QIcon(self.get_icon_path()))
    
    def get_icon_path(self):
        """获取图标路径(适配不同平台)"""
        if getattr(sys, 'frozen', False):
            # 打包后的路径
            base_path = sys._MEIPASS
        else:
            # 开发时的路径
            base_path = os.path.dirname(os.path.abspath(__file__))
        return os.path.join(base_path, 'icon.png')
    
    def setup_ui_style(self):
        """设置现代化UI样式"""
        palette = self.palette()
        palette.setColor(QPalette.Window, QColor(245, 245, 245))
        palette.setColor(QPalette.WindowText, QColor(60, 60, 60))
        palette.setColor(QPalette.Base, QColor(255, 255, 255))
        palette.setColor(QPalette.AlternateBase, QColor(240, 240, 240))
        palette.setColor(QPalette.ToolTipBase, QColor(255, 255, 220))
        palette.setColor(QPalette.ToolTipText, Qt.black)
        palette.setColor(QPalette.Text, Qt.black)
        palette.setColor(QPalette.Button, QColor(70, 160, 230))
        palette.setColor(QPalette.ButtonText, Qt.white)
        palette.setColor(QPalette.BrightText, Qt.red)
        palette.setColor(QPalette.Highlight, QColor(70, 160, 230))
        palette.setColor(QPalette.HighlightedText, Qt.white)
        self.setPalette(palette)
        
        self.setStyleSheet("""
            QGroupBox {
                border: 1px solid #dcdcdc;
                border-radius: 6px;
                margin-top: 12px;
                padding-top: 18px;
                font-weight: bold;
                color: #505050;
            }
            QGroupBox::title {
                subcontrol-origin: margin;
                left: 12px;
                padding: 0 5px;
            }
            QPushButton {
                background-color: #46a0f0;
                color: white;
                border: none;
                padding: 7px 14px;
                border-radius: 5px;
                min-width: 90px;
                font-size: 13px;
            }
            QPushButton:hover {
                background-color: #3a8cd0;
            }
            QPushButton:pressed {
                background-color: #2e78b0;
            }
            QPushButton:disabled {
                background-color: #cccccc;
                color: #888888;
            }
            QListWidget {
                border: 1px solid #dcdcdc;
                border-radius: 5px;
                background: white;
                font-size: 13px;
            }
            QProgressBar {
                border: 1px solid #dcdcdc;
                border-radius: 5px;
                text-align: center;
                height: 20px;
                font-size: 12px;
            }
            QProgressBar::chunk {
                background-color: #46a0f0;
                border-radius: 4px;
            }
            QComboBox {
                border: 1px solid #dcdcdc;
                border-radius: 4px;
                padding: 3px;
                min-width: 120px;
            }
            QLineEdit {
                border: 1px solid #dcdcdc;
                border-radius: 4px;
                padding: 5px;
            }
        """)
    
    def init_ui(self):
        main_widget = QWidget()
        self.setCentralWidget(main_widget)
        layout = QVBoxLayout()
        layout.setContentsMargins(12, 12, 12, 12)
        layout.setSpacing(10)
        
        # 顶部控制区域
        top_layout = QHBoxLayout()
        
        # 方法选择
        method_layout = QHBoxLayout()
        method_layout.addWidget(QLabel("处理方法:"))
        self.method_combo = QComboBox()
        self.method_combo.addItems(["Mutagen (推荐)", "FFmpeg", "二进制处理"])
        method_layout.addWidget(self.method_combo)
        
        # 格式过滤
        format_layout = QHBoxLayout()
        format_layout.addWidget(QLabel("文件类型:"))
        self.format_combo = QComboBox()
        self.format_combo.addItems(["所有支持格式"] + list(self.supported_formats.values()))
        format_layout.addWidget(self.format_combo)
        
        top_layout.addLayout(method_layout)
        top_layout.addStretch()
        top_layout.addLayout(format_layout)
        
        # 目录设置
        dir_group = QGroupBox("目录设置")
        dir_layout = QVBoxLayout()
        dir_layout.setSpacing(10)
        
        # 输入目录(使用自定义的可拖放QLineEdit)
        input_layout = QHBoxLayout()
        input_layout.addWidget(QLabel("输入目录:"))
        self.input_path = DraggableLineEdit()
        self.input_path.setPlaceholderText("拖放文件夹到这里或点击浏览...")
        self.browse_input_btn = QPushButton("浏览")
        self.browse_input_btn.clicked.connect(self.browse_input)
        input_layout.addWidget(self.input_path, stretch=1)
        input_layout.addWidget(self.browse_input_btn)
        
        # 输出目录
        output_layout = QHBoxLayout()
        output_layout.addWidget(QLabel("输出目录:"))
        self.output_path = DraggableLineEdit()
        self.output_path.setPlaceholderText("默认: 输入目录下的'cleaned_audio'文件夹")
        self.browse_output_btn = QPushButton("浏览")
        self.browse_output_btn.clicked.connect(self.browse_output)
        output_layout.addWidget(self.output_path, stretch=1)
        output_layout.addWidget(self.browse_output_btn)
        
        dir_layout.addLayout(input_layout)
        dir_layout.addLayout(output_layout)
        dir_group.setLayout(dir_layout)
        
        # 文件列表
        self.file_list = QListWidget()
        self.file_list.setSelectionMode(QListWidget.MultiSelection)
        self.file_list.setMinimumHeight(250)
        
        # 进度条
        self.progress = QProgressBar()
        self.progress.setVisible(False)
        
        # 操作按钮
        btn_layout = QHBoxLayout()
        self.scan_btn = QPushButton("🔍 扫描文件")
        self.scan_btn.clicked.connect(self.scan_files)
        self.process_btn = QPushButton("⚡ 处理选中")
        self.process_btn.clicked.connect(self.process_selected)
        self.process_btn.setEnabled(False)
        self.process_all_btn = QPushButton("🚀 处理全部")
        self.process_all_btn.clicked.connect(self.process_all)
        self.process_all_btn.setEnabled(False)
        btn_layout.addWidget(self.scan_btn)
        btn_layout.addWidget(self.process_btn)
        btn_layout.addWidget(self.process_all_btn)
        
        # 添加到主布局
        layout.addLayout(top_layout)
        layout.addWidget(dir_group)
        layout.addWidget(self.file_list)
        layout.addWidget(self.progress)
        layout.addLayout(btn_layout)
        main_widget.setLayout(layout)
        
        self.update_buttons()
    
    def browse_input(self):
        path = QFileDialog.getExistingDirectory(self, "选择输入目录")
        if path:
            self.input_path.setText(path)
    
    def browse_output(self):
        path = QFileDialog.getExistingDirectory(self, "选择输出目录")
        if path:
            self.output_path.setText(path)
    
    def scan_files(self):
        input_dir = self.input_path.text()
        if not os.path.isdir(input_dir):
            QMessageBox.warning(self, "错误", "请输入有效的输入目录")
            return
        
        self.audio_files = []
        self.file_list.clear()
        
        # 显示扫描进度
        self.progress.setVisible(True)
        self.progress.setRange(0, 0)  # 不确定进度模式
        QApplication.processEvents()
        
        # 获取选择的格式
        selected_format = self.format_combo.currentText()
        if selected_format == "所有支持格式":
            extensions = list(self.supported_formats.keys())
        else:
            extensions = [k for k, v in self.supported_formats.items() if v == selected_format]
        
        for root, _, files in os.walk(input_dir):
            for file in files:
                ext = os.path.splitext(file)[1][1:].lower()
                if ext in extensions:
                    self.audio_files.append(os.path.join(root, file))
        
        self.file_list.addItems([os.path.basename(f) for f in self.audio_files])
        self.progress.setVisible(False)
        self.update_buttons()
        
        QMessageBox.information(self, "完成", f"找到 {len(self.audio_files)} 个音频文件")
    
    def process_selected(self):
        selected = self.file_list.selectedItems()
        if not selected:
            QMessageBox.warning(self, "警告", "请先选择要处理的文件")
            return
        
        indices = [self.file_list.row(item) for item in selected]
        self.process_files(indices)
    
    def process_all(self):
        if not self.audio_files:
            QMessageBox.warning(self, "警告", "没有可处理的文件")
            return
        
        reply = QMessageBox.question(
            self, "确认", 
            f"确定要处理所有 {len(self.audio_files)} 个文件吗?",
            QMessageBox.Yes | QMessageBox.No
        )
        
        if reply == QMessageBox.Yes:
            self.process_files(range(len(self.audio_files)))
    
    def process_files(self, indices):
        method = self.method_combo.currentText().split()[0].lower()
        input_dir = self.input_path.text()
        output_dir = self.output_path.text() or os.path.join(input_dir, "cleaned_audio")
        
        total = len(indices)
        success = 0
        failed = 0
        
        self.progress.setVisible(True)
        self.progress.setMaximum(total)
        self.progress.setValue(0)
        
        os.makedirs(output_dir, exist_ok=True)
        
        for i, idx in enumerate(indices, 1):
            input_path = self.audio_files[idx]
            filename = os.path.basename(input_path)
            output_path = os.path.join(output_dir, filename)
            
            try:
                ext = os.path.splitext(input_path)[1][1:].lower()
                
                if method == "ffmpeg":
                    result = self.process_with_ffmpeg(input_path, output_path)
                elif method == "mutagen":
                    result = self.process_with_mutagen(input_path, output_path, ext)
                else:  # 二进制处理
                    result = self.process_binary(input_path, output_path, ext)
                
                if result:
                    success += 1
                else:
                    failed += 1
            except Exception as e:
                print(f"处理失败 {input_path}: {str(e)}")
                failed += 1
            
            self.progress.setValue(i)
            QApplication.processEvents()
        
        self.progress.setVisible(False)
        QMessageBox.information(
            self, "完成",
            f"处理完成!\n成功: {success}\n失败: {failed}\n输出目录: {output_dir}"
        )
    
    def process_with_ffmpeg(self, input_path, output_path):
        """使用FFmpeg处理"""
        try:
            cmd = [
                "ffmpeg",
                "-i", input_path,
                "-map", "0:a",
                "-c:a", "copy",
                "-map_metadata", "-1",
                output_path,
                "-y"  # 覆盖输出文件
            ]
            subprocess.run(cmd, check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
            return True
        except Exception as e:
            print(f"FFmpeg处理失败: {str(e)}")
            return False
    
    def process_with_mutagen(self, input_path, output_path, ext):
        """使用Mutagen处理不同格式的音频文件"""
        try:
            # 先复制文件
            if input_path != output_path:
                shutil.copy2(input_path, output_path)
            
            # 根据格式使用不同的处理方法
            if ext == "mp3":
                audio = MP3(output_path, ID3=ID3)
                if audio.tags:
                    audio.tags.delall("APIC")
                    audio.save()
            elif ext == "flac":
                audio = FLAC(output_path)
                if audio.pictures:
                    audio.clear_pictures()
                    audio.save()
            elif ext == "m4a":
                audio = MP4(output_path)
                if 'covr' in audio:
                    del audio['covr']
                    audio.save()
            elif ext == "ogg":
                try:
                    audio = OggOpus(output_path)
                except:
                    audio = OggVorbis(output_path)
                if 'metadata_block_picture' in audio:
                    del audio['metadata_block_picture']
                    audio.save()
            elif ext == "wma":
                audio = ASF(output_path)
                if hasattr(audio, 'tags') and 'WM/Picture' in audio.tags:
                    del audio.tags['WM/Picture']
                    audio.save()
            
            return True
        except Exception as e:
            print(f"Mutagen处理失败: {str(e)}")
            return False
    
    def process_binary(self, input_path, output_path, ext):
        """二进制方式处理(最后手段)"""
        try:
            if ext == "mp3":
                # MP3文件的简单二进制处理
                with open(input_path, "rb") as f:
                    data = f.read()
                
                apic_pos = data.find(b"APIC")
                if apic_pos == -1:
                    if input_path != output_path:
                        shutil.copy2(input_path, output_path)
                    return True
                
                new_data = data[:apic_pos] + data[apic_pos+4:]
                
                with open(output_path, "wb") as f:
                    f.write(new_data)
                return True
            else:
                # 其他格式直接复制(无法二进制处理)
                if input_path != output_path:
                    shutil.copy2(input_path, output_path)
                return False
        except Exception as e:
            print(f"二进制处理失败: {str(e)}")
            return False
    
    def update_buttons(self):
        has_files = bool(self.audio_files)
        self.process_btn.setEnabled(has_files)
        self.process_all_btn.setEnabled(has_files)

def main():
    app = QApplication(sys.argv)
    
    # 设置应用程序样式
    app.setStyle('Fusion')
    
    window = AudioCoverRemover()
    window.show()
    sys.exit(app.exec_())

if __name__ == "__main__":
    main()

🎯 性能优化建议

  1. 多线程处理
   # 可使用QThreadPool实现多线程处理
   from PyQt5.QtCore import QThreadPool, QRunnable
   
   class Worker(QRunnable):
       def __init__(self, task_func):
           super().__init__()
           self.task_func = task_func
       
       def run(self):
           self.task_func()
  1. 缓存机制

    • 缓存已扫描文件列表
    • 实现增量处理功能
  2. 元数据分析

    • 添加封面大小统计功能
    • 支持预览被删除的封面

📝 总结

本文详细介绍了一款功能完善的音频封面删除工具的开发过程。通过结合PyQt5的GUI能力和Mutagen的音频处理能力,我们实现了一个用户友好且功能强大的应用程序。关键收获包括:

  1. 音频处理知识:深入理解了不同音频格式的元数据存储方式
  2. GUI开发技巧:掌握了现代化Qt界面设计方法
  3. 健壮性设计:学习了多种处理方法的兼容实现

该工具不仅具有实用价值,其开发过程也展示了Python在多媒体处理领域的强大能力。读者可以根据实际需求进一步扩展功能,如添加音频格式转换、元数据编辑等特性。

扩展思考:如何将此工具集成到自动化音乐管理流水线中?能否结合机器学习自动识别并分类音乐封面?


附录:完整代码

文中的完整Python代码已在前文展示,也可从GitHub仓库获取最新版本。建议在Python 3.7+环境中运行,并安装所有依赖库。

希望本文对您的音频处理项目有所启发!如有任何问题,欢迎在评论区讨论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2372013.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenStack Yoga版安装笔记(26)实例元数据笔记

一、实例元数据概述 1.1 元数据 (官方文档:Metadata — nova 25.2.2.dev5 documentation) Nova 通过一种叫做元数据(metadata)的机制向其启动的实例提供配置信息。这些机制通常通过诸如 cloud-init 这样的初始化软件…

【Linux】swap交换分区管理

目录 一、Swap 交换分区的功能 二、swap 交换分区的典型大小的设置 2.1 查看交换分区的大小 2.1.1 free 2.1.2 cat /proc/swaps 或 swapon -s 2.1.3 top 三、使用交换分区的整体流程 3.1 案例一 3.2 案例二 一、Swap 交换分区的功能 计算机运行一个程序首先会将外存&am…

VirtualBox 创建虚拟机并安装 Ubuntu 系统详细指南

VirtualBox 创建虚拟机并安装 Ubuntu 系统详细指南 一、准备工作1. 下载 Ubuntu 镜像2. 安装 VirtualBox二、创建虚拟机1. 新建虚拟机2. 分配内存3. 创建虚拟硬盘三、配置虚拟机1. 加载 Ubuntu 镜像2. 调整处理器核心数(可选)3. 启用 3D 加速(图形优化)四、安装 Ubuntu 系统…

触想CX-3588工控主板应用于移动AI数字人,赋能新型智能交互

一、行业发展背景 随着AI智能、自主导航和透明屏显示等技术的不断进步,以及用户对“拟人化”、“沉浸式”交互体验的期待,一种新型交互终端——“移动AI数字人”正在加速实现规模化商用。 各大展厅展馆、零售导购、教学政务甚至家庭场景中,移…

【深入浅出MySQL】之数据类型介绍

【深入浅出MySQL】之数据类型介绍 MySQL中常见的数据类型一览为什么需要如此多的数据类型数值类型BIT(M)类型INT类型TINYINT类型BIGINT类型浮点数类型float类型DECIMAL(M,D)类型区别总结 字符串类型CHAR类型VARCHAR(M)类型 日期和时间类型enum和set类型 …

Vue3响应式:effect作用域

# Vue3响应式: effect作用域 什么是Vue3响应式? 是一款流行的JavaScript框架,它提供了响应式和组件化的视图组织方式。在Vue3中,响应式是一种让数据变化自动反映在视图上的机制。当数据发生变化时,与之相关的视图会自动更新。 作用…

25.5.4数据结构|哈夫曼树 学习笔记

知识点前言 一、搞清楚概念 ●权:___________ ●带权路径长度:__________ WPL所有的叶子结点的权值*路径长度之和 ●前缀编码:____________ 二、构造哈夫曼树 n个带权值的结点,构造哈夫曼树算法: 1、转化成n棵树组成的…

RabbitMQ 深度解析:从核心组件到复杂应用场景

一.RabbitMQ简单介绍 消息队列作为分布式系统中不可或缺的组件,承担着解耦系统组件、保障数据可靠传输、提高系统吞吐量等重要职责。在众多消息队列产品中,RabbitMQ 凭借其可靠性和丰富的特性,在企业级应用中获得了广泛应用。 二.RabbitMQ …

【Linux笔记】系统的延迟任务、定时任务极其相关命令(at、crontab极其黑白名单等)

一、延时任务 1、概念 延时任务(Delayed Jobs)通常指在指定时间或特定条件满足后执行的任务。常见的实现方式包括 at 和 batch 命令,以及结合 cron 的调度功能。 2、命令 延时任务的命令最常用的是at命令,第二大节会详细介绍。…

使用阿里AI的API接口实现图片内容提取功能

参考链接地址:如何使用Qwen-VL模型_大模型服务平台百炼(Model Studio)-阿里云帮助中心 在windows下,使用python语言测试,版本:Python 3.8.9 一. 使用QVQ模型解决图片数学难题 import os import base64 import requests# base 64 …

从零开始搭建你的个人博客:使用 GitHub Pages 免费部署静态网站

🌐 从零开始搭建你的个人博客:使用 GitHub Pages 免费部署静态网站 在互联网时代,拥有一个属于自己的网站不仅是一种展示方式,更是一种技术能力的体现。今天我们将一步步学习如何通过 GitHub Pages 搭建一个免费的个人博客或简历…

C#串口通信

在C#中使用串口通信比较方便,.Net 提供了现成的类, SerialPort类。 本文不对原理啥的进行介绍,只介绍SerialPort类的使用。 SerialProt类内部是调用了CreateFile,WriteFile等WinAPI函数来实现串口通信。 在后期的Windows编程系…

服务器配置llama-factory问题解决

在配置运行llama-factory,环境问题后显示环境问题。这边给大家附上连接,我们的是liunx环境但是还是一样的。大家也记得先配置虚拟环境。 LLaMA-Factory部署以及微调大模型_llamafactory微调大模型-CSDN博客 之后大家看看遇到的问题是不是我这样。 AI搜索…

Spring Boot + Vue 实现在线视频教育平台

一、项目技术选型 前端技术: HTML CSS JavaScript Vue.js 前端框架 后端技术: Spring Boot 轻量级后端框架 MyBatis 持久层框架 数据库: MySQL 5.x / 8.0 开发环境: IDE:Eclipse / IntelliJ IDEA JDK&…

使用Jmeter进行核心API压力测试

最近公司有发布会,需要对全链路比较核心的API的进行压测,今天正好分享下压测软件Jmeter的使用。 一、什么是Jmeter? JMeter 是 Apache 旗下的基于 Java 的开源性能测试工具。最初被设计用于 Web 应用测试,现已扩展到可测试多种不同的应用程…

JavaScript中数组和对象不同遍历方法的顺序规则

在JavaScript中,不同遍历方法的顺序规则和适用场景存在显著差异。以下是主要方法的遍历顺序总结: 一、数组遍历方法 for循环 • 严格按数组索引顺序遍历(0 → length-1) • 支持break和continue中断循环 • 性能最优,…

redis----通用命令

文章目录 前言一、运行redis二、help [command]三、通用命令 前言 提示:这里可以添加本文要记录的大概内容: 学习一些通用命令 以下操作在windows中演示 提示:以下是本篇文章正文内容,下面案例可供参考 一、运行redis 我们先c…

IntelliJ IDEA 保姆级使用教程

文章目录 一、创建项目二、创建模块三、创建包四、创建类五、编写代码六、运行代码注意 七、IDEA 常见设置1、主题2、字体3、背景色 八、IDEA 常用快捷键九、IDEA 常见操作9.1、类操作9.1.1、删除类文件9.1.2、修改类名称注意 9.2、模块操作9.2.1、修改模块名快速查看 9.2.2、导…

Comfyui 与 SDwebui

ComfyUI和SD WebUI是基于Stable Diffusion模型的两种不同用户界面工具,它们在功能、用户体验和适用场景上各有优劣。 1. 功能与灵活性 ComfyUI:ComfyUI以其节点式工作流设计为核心,强调用户自定义和灵活性。用户可以通过连接不同的模块&…

WiseAD:基于视觉-语言模型的知识增强型端到端自动驾驶——论文阅读

《WiseAD: Knowledge Augmented End-to-End Autonomous Driving with Vision-Language Model》2024年12月发表,来自新加坡国立和浙大的论文。 在快速发展的视觉语言模型(VLM)中,一般人类知识和令人印象深刻的逻辑推理能力的出现&a…