随着ChatGPT-4模型的诞生,标志着人类已经进入了超级人工智能时代。类似于ChatGPT-4、文心一言、ChatGLM、Moss这些生成式大语言模型中应用了大量的自然语言处理技术。掌握智能信息处理方法的文本数据挖掘技术有助于搭建专业领域的知识库,以及完成文本分析等任务,例如摘要生成、文本数据可视化、文本纠错、文本分类、文本翻译、关键词抽取等。
主办单位:北京市计算中心有限公司
协办单位:
举 办 地:北京市海淀区丰贤中路7号北科产业3号楼
课程安排:2024年12月12-13日(周四-周五) 上9:30-11:30 下13:30-17:00
时间 |
主题 |
内容 |
备注 |
第一天
上午 |
Python入门
与热点介绍 |
1. Python基础
2. 自然语言处理应用介绍 |
理论
+实战 |
文本数据处理 |
3. Python字符串处理
4. 正则表达式基本语法
5. 正则常用符号
6. 常用函数介绍
7. 文本标注工具介绍 |
理论
+实战 |
|
第一天
下午 |
文本资料读取与分析 |
8. 语料库的获取与词频分析
9. 原始文本资料的读取与处理
10. NLTK工具包简介
11. 停用词过滤
12. 词性标注
13. 数据清洗实例
14. Spacy工具包
15. 命名实体匹配
16. 恐怖袭击分析
17. 结巴分词器
18. 词云可视化展示
19. NLP文本特征方法对比 |
理论
+实战 |
第二天
上午 |
神经网络基础 |
20. 卷积神经网络CNN
21. 循环神经网络RNN
22. 长短期记忆神经网络LSTM
23. Transformer算法
24. Bert模型 |
理论
+实战 |
第二天
下午 |
NLP项目实战 |
25. 基于word2vec的分类任务
26. NLP相似度模型
27. LSTM情感分析
28. 机器人写唐诗
29. 对话机器人 |
理论
+实战 |
注:内容以实际发生为准;若调,会提前通知。
注册费:2800元/人(含当期听课费、资料费、证书费、考试费(如有))。
提供当期视频回放以供复习使用(羽林学院平台)。
开具增值税发票,提供盖章通知、结业证书等相关材料。
1、3人以上团体报名每人可减少300元;
2、4+1团报,可免费赠送一个名额;
3、上面优惠政策不能同时享受,只能享受其中一种;
老学员参加及推荐学员参加均可额外优惠200元。
【报名回执】
QQ号:2814500767
邮箱:bcc-sxpx@bcc.ac.cn
徐老师 010-59341786,15801436028(微信同号)
员老师 010-59341773,18701529461(微信同号)
【注】开课前一周会发送邮件通知;若未接到邮件通知,请电话咨询。