随着人工智能技术的飞速发展,生成式大模型已经成为当前科技领域的热点和前沿方向。生成式大模型,如GPT、DeepSeek等,凭借其强大的语言生成能力和广泛的应用前景,正在深刻改变自然语言处理、内容创作、智能交互等多个领域。这些模型通过海量数据的预训练和复杂的神经网络架构,能够生成高质量的文本、图像、视频等内容,并在多种实际场景中展现出巨大的应用价值。
DeepSeek作为当前领先的生成式大模型之一,其独特的技术架构和优化策略使其在性能和效率上具有显著优势。DeepSeek采用了深度优化的Transformer架构,结合稀疏注意力机制、动态路由网络和混合专家系统(MoE)等先进技术,能够在处理大规模数据时保持高效和精准的输出。同时,DeepSeek在对齐阶段引入了人类反馈强化学习(RLHF),使其能够更好地理解和生成符合人类价值观的内容。此外,DeepSeek还支持领域微调,能够根据不同领域的专业数据进行优化,从而在特定应用场景中发挥更大的作用。
然而,尽管生成式大模型的潜力巨大,但其复杂的技术架构和训练过程对专业技术人员提出了较高的要求。技术人员需要深入了解模型的原理、训练方法、调优技巧以及应用开发的实践,才能充分发挥这些模型的优势。为了帮助专业技术人员更好地掌握生成式大模型技术,特别是DeepSeek的应用开发,我们特别设计了本次为期3天的培训课程。
本次培训课程旨在为人工智能领域的技术骨干、研究人员、高校教师以及对生成式大模型有浓厚兴趣的开发者提供一个系统的学习平台。通过深入讲解人工智能技术基础、生成式大模型的核心原理、DeepSeek的技术架构与训练方法,以及实际应用开发的实践操作,学员将能够全面掌握生成式大模型的开发与应用技能,为未来的职业发展和技术创新打下坚实的基础。
培训目标
1.深入理解人工智能与生成式大模型的核心技术。
2.了解大模型在生活和工作的各个领域的应用技巧。
3.掌握DeepSeek的技术架构与训练方法。
4.学会开发基于生成式大模型的应用。
培训对象
1.人工智能领域的技术骨干。
2.研究人员与高校教师。
3.对生成式大模型有浓厚兴趣的开发者
主办单位:北京市计算中心有限公司
协办单位:
北京市基因测序与功能分析工程技术研究中心
云计算关键技术与应用北京市重点实验室
工业和信息化人才培养工程培训基地
北京市大数据教学实践基地
课程安排:2025年4月21-23日 北京站+线上直播
内容:
第一天
人工智能技术概述
1、人工智能技术发展历程
2、人工智能技术应用场景
3、深度学习与NLP
4、语言模型技术发展历程
生成式大语言模型概述
1、生成式大语言模型概念
2、生成式大语言模型发展历程
3、生成式大语言模型的能力
4、生成式大语言模型的特点
5、大语言模型和搜索引擎的区别
6、GPT在生活与工作中的应用
7、ChatGPT的优势与创新点
8、国产大模型DeepSeek的进化历程
生成式大语言模型在线工具应用实践
1、国产大模型在线演示(智谱清言、通义千问、星火认知、Kimi、文心一言、DeepSeek)
2、大模型的语言处理功能(文本生成、文本补全、文本分类、文本校正、诗歌生成、内容创建、问答、翻译、摘要、改写、情感分析、聊天机器人等)
3、大模型智慧医疗
4、大模型智慧文案(文案创作功能方案设计、项目咨询、文学创作、撰写演讲提纲、撰写分析报告、金融分析、工业自动化、教育、供应链管理、销售和营销、法律应用、科学研究)
5、大模型知识抽取(实体识别、关系抽取、三元组抽取、多元组抽取)
6、大模型作为生活助理(搜索引擎功能、规划旅游行程、扮演私人健身教练、扮演私人医生、教做菜、指导孩子学习、生成童话故事、英语学习工具、实现苏格拉底式教学、生成表格数据)
7、大模型作为工作秘书(整理文章数据、辅助数据处理、实现用户评论分类、优化工作总结、改进产品或服务、分析不同产品差异、给出商业和营销意见、生成特定知识的测试题、写合同、写简历、模拟面试、根据特定数据生成图表)
8、大模型辅助教学(教学案例设计、教学案例名称设计、根据多文档实现内容综述、根据课件设计考核题目、解读上传图片的知识点、大模型对音视频转写并总结、搭建AI助教、围绕知识点生成不同难度题目、生成个性化学习计划)
9、大模型辅助投稿(论文搜索平台、相关论文拓展、提出论文中的问题、生成文献综述、讲解论文中的技术方法、写论文综述并标注来源、查找文献中某个观点或内容相关的论文、相关论文查找、解读系统框图工作原理、解读数学公式含义、解读图表中数据的意义及结论、完成学术论文的选题设计与优化、生成论文摘要、完成段落结构及句子逻辑润色、论文撰写提示词应用、参考文献格式的自动转换、实现论文语法校正、提出审稿意见、提出论文修改意见)
10、大模型辅助课题申报(辅助撰写、润色课题申报书、总结指定论文的局限性与不足,给出论文潜在的改进思路与建议、细化改进思路,凝练论文的选题与创新点、设计完整的实验方案与数据分析流程)
11、大模型辅助编程(实现特定功能的程序、实现代码注释、实现代码纠错及修改、回答代码疑问、优化代码、生成机器学习代码)
12、大模型辅助办公(自动创建PPT、快速产出短视频、制作流程图、思维导图、图片文字识别、绘制图片、设计海报、设计名片、编写新闻稿)
第二天
人工智能方法构建环境
1、Python编程环境配置
2、基于Python的深度学习框架
3、Pytorch模块讲解
4、高性能计算理论基础
5、GPU加速技术
6、基于高性能计算的模型训练
7、人工智能平台设计与模型的云端部署
大模型应用开发技术
1、大模型算法原理(Transformer、GPT1—GPT3—instructGPT的变化)
2、词嵌入预训练模型(text2vec、bge、word2vec)
3、对话模型的训练
4、Tokens概念介绍
5、提示学习
6、微调工具介绍与实践
7、大模型微调技术流程
8、模型微调过程的参数调节与优化
9、大模型效果评价
10、DeepSeek技术架构剖析(深度优化Transformer架构、稀疏注意力机制与动态路由网络、混合专家系统及其工作原理)
11、DeepSeek的模型训练与调优(使用开源数据集微调模型、实践提示工程并优化模型输出、Deepseek 的本地化部署与使用)
12、基于DeepSeek的应用开发介绍(构建基于DeepSeek的文本生成应用、集成DeepSeek到现有系统)
第三天
大模型实用方面涉及技术
1、大语言模型Prompt提示词工程(角色扮演、使用不同的语气、给出具体任务、利用上下文管关联的特点、零样本思维链提示-提高模型逻辑推理能力、多样本思维链提示-提升模型模仿能力、自洽性-提升模型数学能力、生成知识提示-提升模型知识水平、Deepseek与传统大语言模型的提示词的异同、常用的Deepseek提示词模板、Deepseek提示词优化技巧Deepseek提示词逆向工程)
2、大模型思维链
3、大模型处理长文本
4、模型量化技术与加速推理
5、针对生成内容的质量评估与控制
6、增强检索技术(RAG)
7、大模型Agent技术
多模态大语言模型工具与应用效果演示
1、AIGC生成图像原理、AIGC图像生成工具介绍
2、CLIP模型和扩散模型介绍
3、文生图技术应用实践、图生图技术应用实践
4、语音合成引擎
5、语音转换模型
6、语音图像生成技术
7、视频生成技术
总结
1、ChatGPT与DeepSeek引领的新AI范式
2、大模型面临的挑战
【报名费用】
注册费:4500元/人(含当期听课费、资料费、证书费)。
提供当期视频回放以供复习使用(羽林学院平台)。
开具增值税发票,提供盖章通知、结业证书等相关材料。
【报名优惠政策】
1、3人以上团体报名每人可减少300元;
2、4+1团报,可免费赠送一个名额;
3、上面优惠政策不能同时享受,只能享受其中一种;
老学员参加及推荐学员参加均可额外优惠200元。
【付费方式】
手机银行或电子银行转账、银行汇款等
单位全称:北京市计算中心有限公司
账号:77010122001379612
开户银行:宁波银行北京分行营业部
(汇款信息备注:“智能计算——您的姓名”,个人汇款请备注单位名称)
注:款项支出后,请提供付款回执给工作人员,方便核实到账、开具发票。
【报名回执】
【咨询请联系】
徐老师 010-59341786,15801436028(微信同号)
员老师 18701529461(微信同号)
【注】开课前一周会发送邮件通知;若未接到邮件通知,请电话咨询。