Python如何使用HanNLP工具

news2025/7/9 5:46:57

Python如何使用HanNLP工具

  • 目录
    • 系统安装配置 JDK 1.8
    • 系统安装 Visual C++ 2015
    • 下载 HanNLP 包
    • 测试HanNLP工具

目录

目标:使用pycharm调用HanNLP工具完成对文本的分词、自动摘要、关键词提取等任务。

系统安装配置 JDK 1.8

1、windows环境下载 JDK 1.8
2、安装 JDK 1.8
在这里插入图片描述

3、配置环境变量

在这里插入图片描述
变量名:JAVA_HOME

变量值:C:\Program Files\Java\jdk1.8.0_101

在这里插入图片描述

双击Path,编辑Path环境变量,

点击新建,添加“%JAVA_HOME%\bin”

再次点击新建,添加“%JAVA_HOME%\jre\bin”

在这里插入图片描述

新建环境变量CLASSPATH

变量名:CLASSPATH

变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar

需要注意变量值前面的“.;”

在这里插入图片描述

4、测试 JDK是否安装成功

win+r运行cmd
在这里插入图片描述

执行有结果表示配置成功
命令:java
在这里插入图片描述

命令: javac
在这里插入图片描述

系统安装 Visual C++ 2015

安装详看 : https://jingyan.baidu.com/article/e73e26c088e45424acb6a759.html

下载 HanNLP 包

1、下载hanlp.jar包解压 : https://github.com/hankcs/HanLP
在这里插入图片描述

2、下载data.zip: https://github.com/hankcs/HanLP/releases中 http://hanlp.linrunsoft.com/release/data-for-1.7.0.zip 后解压数据包

在这里插入图片描述

最终将data与hannlp解压的jar包统一放在一个目录下【之前不在一个目录报错】

在这里插入图片描述

测试HanNLP工具

from jpype import *

startJVM(getDefaultJVMPath(), "-Djava.class.path=hanlp-1.8.3.jar")

# 加载java中模型
HanLP = JClass('com.hankcs.hanlp.HanLP')
NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')

# 目标据句
document = "徐先生还具体帮助他确定了把画雄鹰、松鼠和麻雀作为主攻目标。"
# 分词与词性标注
seg_list = HanLP.segment("你好,欢迎在Python中调用HanLP的API")
print(seg_list)

# 关键词提取
print(HanLP.extractKeyword(document, 20))

# 自动摘要
print(HanLP.extractSummary(document, int(len(document)/3)))

# 依存句法分析
print(HanLP.parseDependency(document))

# 命名实体识别与词性标注
print(NLPTokenizer.segment(document))


shutdownJVM()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/9121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Oracle PrimaveraUnifier空间管理器(Space Manager)

目录 前言 介绍 前言 在Oracle Primavera Unifier设施和资产管理基础产品中除了业务流程及配置管理器之外,其预配置设计还包含本文要介绍的空间管理器,即Space Manager 在Unifier中,空间管理器是用户可以执行设施管理任务的地方。空间管…

xv6---Lab1: Xv6 and Unix utilities

目录 参考资料: 1.1进程和内存 1.2 I/O 和文件描述符 1.3管道 源码: 调试环境搭建 sleep PingPong primes find xargs 参考资料: Lab: Xv6 and Unix utilities xv6-book翻译(自用)第一章 - 知乎 1.1进程和内存 一个xv…

html中css的基础学习

小李胖了吗 I 都说秋天适合思念,其实更适合见面【小李胖了吗 I 都说秋天适合思念,其实更适合见面】 https://www.bilibili.com/video/BV19g411B7uL/?share_sourcecopy_web&vd_source385ba0043075be7c24c4aeb4aaa73352 通过本博文的学习&#xff0c…

常见的软件测试面试题,千万别答错了

软件测试的童鞋们,在面试测试工作时,一定遇到面试官问过这个问题: 软件测试的目的意义是什么?大家是怎么回答的呢?如果这个问题回答好了,说明你对软件测试工作的价值与意义了如指掌。 有经验的测试人员可…

[数据结构]栈和队列面试题解析

作者: 华丞臧. 专栏:【数据结构】 各位读者老爷如果觉得博主写的不错,请诸位多多支持(点赞收藏关注)。如果有错误的地方,欢迎在评论区指出。 推荐一款刷题网站 👉 LeetCode刷题网站 文章目录一、有效括号题目描述解题思…

freemarker+yml介绍 以及freemarker与JSP的区别

目录 1. freemarker介绍 2. freemarker使用步骤 2.1 在pom.xml引入freeMarker的依赖包 2.2 在springboot中添加freemarker配置 2.3 编写模板文件*.ftl(当做jsp使用即可) ​编辑 2.4 访问控制器后进行页面跳转 3. freemarker常用语法 3.1 取值 3.2 条件 3.3 循环 3…

超赞:不愧是“阿里内部Redis学习笔记”从头到尾,全是精华

近几年,随着移动互联网的飞速发展,我们享受着整个社会的技术进步带来的便利,但同时也给从业者带来了如何保证项目的高并发、低延时的技术挑战,相应的互联网技术也随之发生了重大变革,NoSQL技术得到了蓬勃的发展。 Red…

【JavaSE】抽象类与接口

文章目录抽象类的概念抽象类的语法抽象类的特性接口的概念接口的语法接口的特性多接口的实现接口的继承抽象类的概念 什么是抽象类呢?我们先来看一个例子:一个父类是动物类,两个子类一个狗狗类,一个猫猫类。 Animal中有一个dark…

有趣的statement stack

引子 在使用events_statements_current的过程中发现,同一线程在同一时刻,可能有多条记录,与直观感觉不太一样,于是跟踪了一下内部实现,有了本文。 STATEMENT STACK的定义 STATEMENT STACK 是events_statements_curr…

Linux基础内容(11)—— 进程理解

目录 1.进程状态 1.只针对操作系统的宏观概念 2.Linux的进程状态 1.运行状态(R) 2.休眠状态(S) 3.暂停状态/浅度睡眠状态(T) 4.深度睡眠状态(D) 5.当前进程正在被追踪(t) 6.死亡状态(X) 7.僵尸状态(Z) 8.孤儿进程 2.进程的优先级 1.优先级定义 2.Linux的优先级表现…

matlab 小数据法求liyapunov指数

1、内容简介 略 625-可以交流、咨询、答疑 2、内容说明 摘 要:从 Lyapunov 指数的定义出发:在常用计算最大 Lyapunov 指数的基础上,将自相关法和 G-P 法应用于小数 据量法中,得到了一种计算最大 Lyapunov 指数的改进小数据量法…

推特的算法规则你知道多少?

如果玩Twitter却不明白Twitter算法是如何运作的,就如同贸然出征却忘了带上武器。 社交媒体的算法正在成为你在平台中所见内容的核心,当知晓了该平台的推荐算法,自然也就知道发布什么样的内容有助于被更多用户看到。因此,了解了算…

Spring之依赖注入

文章目录前言一、set注入1.1 UserDao类:1.2 UserService类:1.3 spring.xml配置文件:1.4 测试类:1.5 执行结果:二、构造方法注入2.1 UserDao2.2 UserService类:1.3 spring.xml配置文件:2.4 测试类…

微服务改造过程中那些必须重视的问题

“微服务”近几年尤其火热,各大厂都在进行微服务化改造和微服务建设,想享受微服务化带来的好处以便对自己的系统进行改造。分布式实验室特约记者李鹏采访了广州轻阅科技系统架构师陈珙,就微服务与SOA的区别与联系、企业引入微服务会带来的问题…

Vue2:官方路由 Vue-Router 3.x

前端路由 前端路由:根据不同的url地址,页面上展示不同的内容(根据url地址的不同分发到不同的组件。) SPA 介绍 spa 是 single page application 简写,意思是单页面应用程序。Vue 适合开发 spa 类型的项目。 优点&…

Django 所带的用户auth_user的坑点,authenticate()校验一直为None,校验与创建所遇到的问题整理与解决

整理一下django中用户模块自定义model后登录的一些问题: 网上的报错解决不是万能方案,主要还是要自主分析原因,有的是有用但是导包之类的也要看清楚因为自己修改了所以有所变得,不自定义的话又不太好用。 在项目初期决定使用auth…

鸡卵白蛋白偶联脂多糖(OVA-LPS),麻黄多糖修饰卵白蛋白(PB-OVA)

产品名称:鸡卵白蛋白偶联脂多糖 英文名称:OVA-LPS 用途:科研 状态:固体/粉末/溶液 产品规格:1g/5g/10g 保存:冷藏 储藏条件:-20℃ 储存时间:1年 脂多糖(Lipopolysacchar…

第四站:数组

目录 一、一维数组的创建和初始化 1.数组的创建 (1)基本定义,创建方式 (2)经典的错误标准的零分 2.数组的初始化 3.一维数组的使用 4.一维数组在内存中的存储 二、二维数组的创建和初始化 1.二维数组的创建 2…

SpringBoot SpringBoot 开发实用篇 2 配置高级 2.2 松散绑定

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 开发实用篇 文章目录SpringBootSpringBoot 开发实用篇2 配置高级2.2 松散绑定2.2.1 问题引入2.2.2 松散绑定2.2.3 小结2 配…

MySQL学习笔记:模型2

序言 《MySQL45讲》 为什么表数据删除一半,表文件大小不变? 表数据既可以存在共享表空间里,也可以是单独的文件。这个行为是由参数 innodb_file_per_table 控制的: 这个参数设置为 OFF 表示的是,表的数据放在系统共…