EEG情感分析入门:如何用DEAP数据集里的脑电波区分‘开心’和‘平静’?
EEG情感分析实战从DEAP数据集解码快乐与平静的脑电密码当你听到最喜欢的歌曲时大脑会产生怎样的电信号变化神经科学研究表明不同的情绪状态会在大脑活动中留下独特的指纹。本文将带你探索如何利用DEAP数据集中的EEG数据区分快乐和平静这两种基本情绪状态。1. 理解EEG情感分析的基础脑电图(EEG)记录了大脑皮层神经元群的电活动这些微弱的电信号通过头皮上的电极捕捉并放大后形成了我们看到的脑电波形。在情绪研究中特定频段的脑电波与不同情绪状态存在显著关联脑电波类型频率范围(Hz)主要关联情绪状态Delta波0.5-4深度睡眠、无意识状态Theta波4-8创造性思维、深度冥想Alpha波8-13放松、平静状态Beta波13-30警觉、兴奋状态Gamma波30高级认知处理DEAP数据集记录了32名参与者在观看40段音乐视频时的EEG信号和生理反应每段视频都标注了愉悦度(Valence)和唤醒度(Arousal)评分。我们的目标是利用这些数据建立能够区分高愉悦度(快乐)和低唤醒度(平静)状态的分类模型。提示在实际研究中情绪通常用二维的效价-唤醒模型描述其中愉悦度表示情绪的积极/消极程度唤醒度表示情绪的强烈程度。2. DEAP数据集预处理实战2.1 数据加载与初步探索DEAP提供了预处理后的Python格式数据我们可以使用以下代码加载单个参与者的数据import pickle import numpy as np with open(s01.dat, rb) as f: data pickle.load(f, encodinglatin1) # 提取EEG数据和标签 eeg_data data[data][:, :32, :] # 前32个通道是EEG labels data[labels][:, :2] # 取愉悦度和唤醒度 print(f数据维度: {eeg_data.shape}) # 40 trials × 32 channels × 8064 points print(f标签维度: {labels.shape}) # 40 trials × 2 (valence, arousal)2.2 关键预处理步骤原始EEG数据需要经过一系列处理才能用于分析带通滤波保留4-45Hz的有用信号去除低频漂移和高频噪声降采样从512Hz降至128Hz减少计算量伪迹去除使用独立成分分析(ICA)消除眼动和肌电干扰分段将连续数据划分为与视频对应的60秒片段基线校正去除每段开始前3秒的基线活动以下是一个实现带通滤波的示例代码from scipy.signal import butter, filtfilt def bandpass_filter(data, lowcut4.0, highcut45.0, fs128.0, order5): nyq 0.5 * fs low lowcut / nyq high highcut / nyq b, a butter(order, [low, high], btypeband) return filtfilt(b, a, data) # 对单个通道应用滤波 filtered_channel bandpass_filter(eeg_data[0, 0, :])3. 特征提取从原始EEG到情绪指标3.1 频域特征提取情绪状态最相关的特征是特定频段的功率变化。我们可以通过快速傅里叶变换(FFT)计算各频段的相对功率def compute_band_power(data, fs128, bands[(8,13), (13,30)], window_sec4): window_size window_sec * fs n_windows data.shape[-1] // window_size power_features [] for i in range(n_windows): segment data[..., i*window_size:(i1)*window_size] psd np.abs(np.fft.fft(segment))**2 freqs np.fft.fftfreq(window_size, 1.0/fs) band_powers [] for low, high in bands: mask (freqs low) (freqs high) band_powers.append(np.mean(psd[..., mask], axis-1)) power_features.append(band_powers) return np.array(power_features) # 计算Alpha和Beta波段的功率 power_features compute_band_power(eeg_data[:1, :1, :]) # 示例第一个试验的第一个通道3.2 空间特征选择不同脑区对情绪处理的贡献不同。DEAP数据集使用10-20系统布置电极以下是与情绪相关的重要通道前额叶(Fp1, Fp2)情绪调节和决策颞叶(T7, T8)听觉处理和音乐情绪反应顶叶(P3, P4, Pz)注意力和情绪体验枕叶(O1, O2)视觉处理我们可以计算这些区域的平均功率作为特征frontal_channels [0, 1, 16, 17, 18, 19, 20, 28] # Fp1, AF3, Fp2, AF4, Fz, F4, F8, AF4 temporal_channels [2, 3, 6, 7, 25, 26] # F7, F3, FC5, T7, T8, FT8 frontal_alpha power_features[:, 0, frontal_channels].mean(axis-1) # Alpha波段前额叶功率 temporal_beta power_features[:, 1, temporal_channels].mean(axis-1) # Beta波段颞叶功率4. 构建情绪分类模型4.1 数据准备与标注我们需要将EEG特征与情绪标签关联起来。根据研究我们可以定义快乐状态愉悦度5且唤醒度5平静状态愉悦度5且唤醒度5def create_emotion_labels(valence, arousal, threshold5): happy (valence threshold) (arousal threshold) calm (valence threshold) (arousal threshold) return happy.astype(int) calm.astype(int) * 2 # 0:其他, 1:快乐, 2:平静 emotion_labels create_emotion_labels(labels[:,0], labels[:,1])4.2 机器学习模型构建我们可以使用scikit-learn构建一个简单的分类器from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 假设我们已经提取了所有试验的特征矩阵X和标签y X np.concatenate([frontal_alpha, temporal_beta], axis1) y emotion_labels # 只保留快乐和平静的样本 mask (y 1) | (y 2) X_filtered X[mask] y_filtered y[mask] # 划分训练测试集 X_train, X_test, y_train, y_test train_test_split( X_filtered, y_filtered, test_size0.2, random_state42) # 训练随机森林分类器 clf RandomForestClassifier(n_estimators100, random_state42) clf.fit(X_train, y_train) # 评估模型 y_pred clf.predict(X_test) print(f分类准确率: {accuracy_score(y_test, y_pred):.2f})4.3 模型优化方向要提高分类性能可以考虑以下改进增加特征维度加入更多频段(Theta, Gamma)的特征添加通道间的功能连接特征包含时域特征(如Hjorth参数)尝试深度学习模型使用CNN处理原始EEG信号采用LSTM捕捉时序动态结合注意力机制突出重要时段数据增强应用滑动窗口增加样本量添加噪声增强鲁棒性使用生成对抗网络(GAN)生成合成数据5. 结果可视化与解释理解模型如何做出决策同样重要。我们可以使用特征重要性分析和脑地形图来可视化关键特征import matplotlib.pyplot as plt # 绘制特征重要性 feature_names [Frontal Alpha, Temporal Beta] importances clf.feature_importances_ plt.bar(feature_names, importances) plt.title(特征重要性分析) plt.ylabel(重要性得分) plt.show() # 绘制Alpha功率地形图 def plot_topomap(data, channels, title): from mne.viz import plot_topomap pos np.array([...]) # 各电极的3D位置 plot_topomap(data, pos, showTrue) plt.title(title) avg_alpha power_features[:,0,:].mean(axis0) # 所有试验的平均Alpha功率 plot_topomap(avg_alpha, channels, 平均Alpha功率分布)典型的结果可能显示快乐状态前额叶Beta活动增强颞叶Gamma活动增加平静状态枕叶Alpha活动占主导整体同步性增强在实际应用中我发现前额叶区域的Alpha不对称性(右侧强于左侧)往往与积极情绪相关而过度训练的模型容易过拟合个体差异因此建议使用跨被试验证评估真实性能。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2627445.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!