将\t\n、\n、多个\n\n\n...转换为\n\n。
import pandas as pd
import re
# 创建一个示例DataFrame
data = {'msgText': ['这是示例文本1,包含\t\n换行符',
'这是示例文本2,包含\n\n多个\n换行符',
'这是示例文本3,没有换行符']}
df = pd.DataFrame(data)
# 定义一个函数来进行转换
def transform_text(text):
# 使用正则表达式将\t\n转换为\n\n,\n转换为\n\n
transformed_text = re.sub(r'\t\n', r'\n\n', text)
# 使用正则表达式查找单个换行符,并在其后添加一个额外的换行符
cleaned_text = re.sub(r'(\n+)', r'\n\n', transformed_text)
return cleaned_text
# 在'msgText'列上应用函数来进行转换
df['msgText'] = df['msgText'].apply(transform_text)
# 打印处理后的DataFrame
print(df)





![Ubuntu20.04 开机卡在[OK] Started ****,无法正常开机](https://img-blog.csdnimg.cn/b2c4c2c915614f23a9e0b6b2b0539bae.png)











![[NLP] LLM---训练一个中文LLama2的步骤](https://img-blog.csdnimg.cn/img_convert/c2c4ae4d1afeaeaeeae3e0d16ea19b30.webp?x-oss-process=image/format,png)


