Python作业4 文本词云统计，生成词云

Python作业4 文本词云统计，生成词云

news2026/4/8 17:17:48

编写程序，统计两会政府工作报告热词频率，并生成词云。

2025两会政府工作报告

import jieba
import wordcloud
from collections import Counter
import re

# 读取文件
with open("gov.txt", "r", encoding="gbk") as f:
    t = f.read()

# 分词处理
ls = jieba.lcut(t)

# 定义过滤函数
def is_valid_word(word):
    # 过滤条件：
    # 1. 长度至少为2个字符（过滤单字）
    # 2. 只包含中文（\u4e00-\u9fff）
    # 3. 不是停用词（可选）
    return (len(word) >= 2 and
            all('\u4e00' <= char <= '\u9fff' for char in word))

# 严格过滤
filtered_words = [word for word in ls if is_valid_word(word)]

# 统计词频
word_counts = Counter(filtered_words)

# 打印前20个高频词
print("=== 纯中文热词统计 ===")
for word, count in word_counts.most_common(20):
    print(f"{word}: {count}次")

# 生成词云
txt = " ".join(filtered_words)
w = wordcloud.WordCloud(
    font_path="msyh.ttc",
    width=1000,
    height=700,
    background_color="white",
    max_words=200  # 限制词云显示的最大词数
)
w.generate(txt)
w.to_file("wordcloud.png")

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2337982.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Jenkins 2.492.2 LTS 重置管理员密码

Jenkins 2.492.2 LTS 重置管理员密码

文章目录 1. Jenkins 关闭用户认证2. jenkins 修改密码如果忘记了 Jenkins 的管理员密码的话，也不用担心，只要你有权限访问 Jenkins 的根目录，就可以轻松地重置密码。 1. Jenkins 关闭用户认证 // 查看 jenkins 家目录（使用 doc…

阅读更多...

【裁判文书网DES3数据解密】逆向分析

【裁判文书网DES3数据解密】逆向分析

点击翻页，出现请求，可以看到请求参数有个ciphertext密文，响应数据也是密文打上断点，点击翻页，断住可以看到postData里面的ciphertext已经生成往前跟栈，可以发现是var ciphertext cipher(); funct…

阅读更多...

花园灌溉问题

花园灌溉问题

#include <bits/stdc.h> using namespace std;// 设置最大行列数（题目限制 n, m ≤ 100） const int N 104;// 标记某个格子是否已经被水浇灌 bool used[N][N];// 队列，用于 BFS，存储当前水源的位置 queue<pair<int,i…

阅读更多...

《AI大模型应知应会100篇》第22篇：系统提示词(System Prompt)设计与优化

《AI大模型应知应会100篇》第22篇：系统提示词(System Prompt)设计与优化

第22篇：系统提示词(System Prompt)设计与优化摘要在大语言模型（LLM）应用中，系统提示词（System Prompt）是控制模型行为的核心工具之一。它不仅定义了模型的身份、角色和行为规范，还直接影响输…

阅读更多...

Jsp技术入门指南【六】jsp脚本原理及隐式对象

Jsp技术入门指南【六】jsp脚本原理及隐式对象

Jsp技术入门指南【六】jsp脚本原理及隐式对象前言一、JSP 脚本元素1.1 声明1.2 表达式1.3 脚本标签二、JSP 的隐式对象是什么三、隐式对象详解outrequestsessionapplicationconfigexception 前言在之前的博客中，我们已经介绍了JSP的环境搭建、编译文件查找以及生…

阅读更多...

Jsp技术入门指南【五】详细讲解jsp结构页面

Jsp技术入门指南【五】详细讲解jsp结构页面

Jsp技术入门指南【五】详细讲解jsp结构页面前言一、JSP页面的结构二、JSP页面的部件1. 指令（核心控制部件）2. 动作（页面交互部件，了解即可）3. 脚本（Java逻辑嵌入部件） 三、JSP指令详解1.1 JSP指…

阅读更多...

Beyond Compare 30天评估到期解决方法

Beyond Compare 30天评估到期解决方法

Beyond Compare 30天评估到期解决方法一、问题二、解决办法2.1 第一步：打开注册表2.2 第二步：删除cacheID 三、效果一、问题 Beyond Compare提示评估到期，重装也无效，只需简单两步，轻轻松松出困境。二、解决办法…

阅读更多...

Arduino无线体感机器手——问题汇总

Arduino无线体感机器手——问题汇总

文章不介绍具体参数，有需求可去网上搜索。特别声明：不论年龄，不看学历。既然你对这个领域的东西感兴趣，就应该不断培养自己提出问题、思考问题、探索答案的能力。提出问题：提出问题时，应说明是哪款产品&a…

阅读更多...

学习设计模式《一》——简单工厂

一、基础概念 1.1、接口简单的说：接口是【用来实现类的行为定义、约束类的行为】（即：定义可以做什么）；接口可以包含【实例方法】、【属性】、【事件】、【索引器】或这四种成员类型的任意组合。接口的优点&#xff1…

阅读更多...

010数论——算法备赛

010数论——算法备赛

数论模运算一般求余都是对正整数的操作，如果对负数，不同编程语言结果可能不同。 C/javapythona>m,0<a%m<m-1 a<m,a%ma~5%32~-5%3 -21(-5)%(-3) -2~5%(-3)2-1正数：（ab）%m((a%m)(b%m))%m~正数&#xff…

阅读更多...

NAT、代理服务、内网穿透

NAT、代理服务、内网穿透

NAT、代理服务、内网穿透 1、NAT1.1、NAT过程1.2、NAPT2、内网穿透3、内网打洞3、代理服务器3.1、正向代理3.2、反向代理1、NAT 1.1、NAT过程之前我们讨论了IPv4协议中IP地址数量不充足的问题。NAT技术是当前解决IP地址不够用的主要手段，是路由器的一个重要功能。 NAT能够将…

阅读更多...

【unity实战】Unity动画层级（Animation Layer）的Sync同步和Timing定时参数使用介绍，同步动画层制作角色的受伤状态

【unity实战】Unity动画层级（Animation Layer）的Sync同步和Timing定时参数使用介绍，同步动画层制作角色的受伤状态

文章目录前言方案一：复制粘贴原有层级的状态机1、实现2、问题方法二：勾选Sync同步动画层1、简单实现同步2、同步blend tree的问题3、动画状态的播放时长4、下层状态覆盖了上层状态专栏推荐完结前言如何制作角色的受伤状态？ 玩家角色在…

阅读更多...

Uniapp调用native.js使用经典蓝牙串口通讯方法及问题解决

本人尝试在uniapp环境下开发一款安卓应用，需要与使用经典蓝牙协议的设备进行串口通讯，而uniapp官方给出的蓝牙操作接口目前只支持BLE（低功耗蓝牙），用该接口无法正常获取到我想要连接的设备。通过大量搜索&#xff0c…

阅读更多...

C++23 新特性：行拼接前去除空白符 (P2223R2)

C++23 新特性：行拼接前去除空白符 (P2223R2)

文章目录 1\. 什么是行拼接前去除空白符2\. 为什么需要这一特性3\. 示例代码输出结果 4\. 编译器支持5\. 优势与应用场景5.1 提高代码可读性5.2 减少潜在错误5.3 适用于多行字符串 6\. 其他相关特性7\. 总结 C 语言一直在不断进化，以满足现代软件开发的需求。C23 标…

阅读更多...

【通过Zadig给鼠标适配器安装驱动后,鼠标动不了,无法恢复的解决办法】

【通过Zadig给鼠标适配器安装驱动后,鼠标动不了,无法恢复的解决办法】

【通过Zadig给鼠标适配器安装驱动后,鼠标动不了,无法恢复的解决办法问题产生缘由感谢这位大佬提供的解决办法解决办法问题产生缘由通过Zadig给鼠标适配器安装USB GAMING MOUSE这个驱动后,鼠标动不了,无法恢复(重启电脑,卸载鼠标驱动再重装也不可以), 不过还好,我用的是笔记…

阅读更多...

GoogleCodeUtil.java

GoogleCodeUtil.java

Google动态验证码实现 GoogleCodeUtil.java package zwf;import java.io.UnsupportedEncodingException; import java.net.URLEncoder; import java.nio.charset.StandardCharsets; import java.security.SecureRandom;/** https://mvnrepository.com/artifact/commons-codec/…

阅读更多...

Maven 简介（图文）

Maven 简介（图文）

Maven 简介 Maven 是一个Java 项目管理和构建的工具。可以定义项目结构、项目依赖，并使用统一的方式进行自动化构建，是Java 项目不可缺少的工具。 Maven 的作用提供标准化的项目结构：以前不同的开发工具创建的项目结构是不一样的&#xf…

阅读更多...

2025Github介绍与注册（有图片讲解，保姆级）

2025Github介绍与注册（有图片讲解，保姆级）

为什么要注册Github账号利于团队协作，特别是打比赛的队友版本控制强大，代码安全开源项目多，方便个人模仿或抄袭方便托管，形成自动化工具链教育福利，教育参与者暂时免费讲解完了优势，下面讲注册 Gith…

阅读更多...

RUI电视桌面中文版：下载安装教程及桌面固件包获取全攻略

RUI电视桌面中文版：下载安装教程及桌面固件包获取全攻略

在智能电视的使用过程中，一款出色的桌面系统能极大提升用户体验，RUI电视桌面中文版就是这样一个不错的选择。下面为大家详细介绍RUI电视桌面中文版的下载安装教程以及桌面固件包的获取方法。一、桌面固件包获取首先是获取桌面固件包。可以通过RUI官方…

阅读更多...

OpenAI 34页最佳构建Agent实践

OpenAI 34页最佳构建Agent实践

penAI发布O4，也发布34页最佳构建Agent实践，值得阅读。什么是Agent？ 传统软件使用户能够简化和自动化工作流程，而代理能够以高度独立的方式代表用户执行相同的工作流程。代理是能够独立地代表您完成任务的系统。工作流程是必…

阅读更多...

推荐文章

最新文章