intent:book_flight
intent:book_flight【免费下载链接】Rasa_NLU_ChiTurn Chinese natural language into structured data 中文自然语言理解项目地址: https://gitcode.com/gh_mirrors/ra/Rasa_NLU_Chi我想订一张去北京的机票帮我预订到上海的航班intent:greet你好早上好synonym:北京首都京城## 实体标注与同义词处理 ### 实体标注技巧 在标注实体时需要注意以下几点 - 使用 start 和 end 索引精确定位实体位置 - value 字段可以不同于文本中的实际内容用于同义词处理 - 实体可以跨越多个词语 ### 同义词配置方法 Rasa NLU Chi 支持两种同义词配置方式 1. **直接标注法**在实体标注时指定标准化值 2. **同义词表法**在 entity_synonyms 中集中定义 同义词配置示例[rasa_nlu/extractors/entity_synonyms.py](https://link.gitcode.com/i/3bb6b02ee12fae3dbe79f70fa926b03a) ## 配置文件与训练管道设置 ⚙️ ### 中文专用配置 Rasa NLU Chi 针对中文提供了专门的配置方案。查看所有示例配置[sample_configs/](https://link.gitcode.com/i/409f86f338e3dab31dac645714ed441d) #### MITIE Jieba sklearn 推荐配置 这是最推荐的中文处理管道配置 yaml language: zh pipeline: - name: nlp_mitie model: data/total_word_feature_extractor_zh.dat - name: tokenizer_jieba - name: ner_mitie - name: ner_synonyms - name: intent_entity_featurizer_regex - name: intent_featurizer_mitie - name: intent_classifier_sklearnJieba 分词器自定义词典你可以使用自定义词典来优化分词效果- name: tokenizer_jieba default_dict: ./default_dict.big user_dicts: ./jieba_userdict预定义词典位置jieba_userdict/完整训练流程指南 第一步准备训练数据创建符合格式要求的训练数据文件。建议将数据拆分为多个文件以提高可维护性data/ ├── intents/ │ ├── book_flight.md │ ├── greet.md │ └── search_hotel.md └── entities/ ├── cities.md └── dates.md第二步配置训练管道选择合适的配置文件。对于中文场景推荐使用sample_configs/config_jieba_mitie_sklearn.ymlsample_configs/config_jieba_mitie_sklearn_plus_dict_path.yml第三步执行训练命令使用以下命令开始训练python -m rasa_nlu.train \ -c sample_configs/config_jieba_mitie_sklearn.yml \ --data data/examples/rasa/demo-rasa_zh.json \ --path models训练核心代码rasa_nlu/train.py第四步验证与测试训练完成后模型将保存在models/目录下。你可以使用以下方式测试模型from rasa_nlu.model import Interpreter interpreter Interpreter.load(models/default) result interpreter.parse(我想订去北京的机票) print(result)【免费下载链接】Rasa_NLU_ChiTurn Chinese natural language into structured data 中文自然语言理解项目地址: https://gitcode.com/gh_mirrors/ra/Rasa_NLU_Chi创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2434752.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!