2026 冬令营课程大纲
课程导览:开启生成式AI探索之旅
本次四天线上课程面向高中生,系统介绍生成式AI的核心原理与前沿应用。
自然语言处理与大语言模型解析
课程前半部分深入解析自然语言处理与大语言模型,涵盖从概率基础、词向量到Transformer架构的关键概念。通过实践活动揭示ChatGPT等工具的工作机制。
生成式AI × 生物医药前沿应用
课程后半部分聚焦生成式AI在生物医药领域的突破性应用,重点讲解其如何驱动蛋白质设计与药物发现。
培养跨学科AI工程思维
课程融合了直观的数学解释与动手演示,帮助学生建立跨学科的AI工程思维。旨在培养学生的科学素养与创新视野。
项目关键信息
- 项目形式:线上直播授课 + 线上作业 + 课后答疑
- 项目时间:2026.02.12 — 2026.02.15
- 申请状态:已截止
- 授课语言:英文为主
课程日程(4 天)
每日安排:上午授课(含答疑),下午授课与练习
| 日期 | 上午课程 | 下午课程 |
|---|---|---|
| Day 1 | · 开营仪式 (ORIENTATION):项目介绍 · 机器如何学习语言:第1课:单词计数与下一个词预测 · 机器如何学习语言:第2课:从单词计数到衡量相似性 | · 大模型数学基础:第3课:概率论 · 编程练习:练习 1:构建基于统计的 N-gram 语言模型 |
| Day 2 | · 机器如何学习语言:第4课:上下文、注意力机制与 Transformer · 机器如何学习语言:第5课:训练、目标与对齐 | · 大模型数学基础:第6课:线性代数 · 编程练习:练习 2:探索词向量:从概率到语义空间 |
| Day 3 | · 蛋白质语言模型导论:第7课:什么是蛋白质语言模型 · 蛋白质语言模型导论:第8课:为什么蛋白质语言模型如此重要 | · 大模型数学基础:第9课:优化算法 · 编程练习:练习 3:理解注意力机制的数学原理 |
| Day 4 | · 蛋白质语言模型导论:第10课:如何训练和使用蛋白质语言模型 (I) · 蛋白质语言模型导论:第11课:如何训练和使用蛋白质语言模型 (II) | · 大模型数学基础:第12课:实用的学习建议 · 编程练习:练习 4:动手使用 GPT 模型 |
Day 1
上午课程
- · 开营仪式 (ORIENTATION):项目介绍
- · 机器如何学习语言:第1课:单词计数与下一个词预测
- · 机器如何学习语言:第2课:从单词计数到衡量相似性
下午课程
- · 大模型数学基础:第3课:概率论
- · 编程练习:练习 1:构建基于统计的 N-gram 语言模型
Day 2
上午课程
- · 机器如何学习语言:第4课:上下文、注意力机制与 Transformer
- · 机器如何学习语言:第5课:训练、目标与对齐
下午课程
- · 大模型数学基础:第6课:线性代数
- · 编程练习:练习 2:探索词向量:从概率到语义空间
Day 3
上午课程
- · 蛋白质语言模型导论:第7课:什么是蛋白质语言模型
- · 蛋白质语言模型导论:第8课:为什么蛋白质语言模型如此重要
下午课程
- · 大模型数学基础:第9课:优化算法
- · 编程练习:练习 3:理解注意力机制的数学原理
Day 4
上午课程
- · 蛋白质语言模型导论:第10课:如何训练和使用蛋白质语言模型 (I)
- · 蛋白质语言模型导论:第11课:如何训练和使用蛋白质语言模型 (II)
下午课程
- · 大模型数学基础:第12课:实用的学习建议
- · 编程练习:练习 4:动手使用 GPT 模型
作息与平台
- 授课安排: 每日上午 08:00 - 10:30(含线上授课与即时答疑)。
- 实践环节: 每日下午 14:00 - 16:00(专项练习与作业实操,共 2 小时)。
- 统一学习环境: 官方提供在线云端编程平台及专属登录账号,实现零环境配置学习 。
- 讲义与素材管理:
- 预发布机制: 教学讲义及相关配套素材将提前一天上传至官网“课程资料”区块,供学员预习。
- 动态反馈: 下午练习时段安排助教团队集中答疑,并根据高频问题实时更新问答库。
- 助教支持: 为学员进行平均分组并分配专属助教(TA),提供贯穿全周期的学习督导与技术支持 。
提交与评估
- 每日实践作业: 学员需按要求,每日提交一次作业/实践结果。
- 多元评估体系: 最终评估将综合以下维度:
- 出勤与互动: 直播课程的参与度与课堂互动表现 。
- 作业完成度: 每日实践任务的达成质量 。
- Tips: 表现优异者将获得:
- 优先录取权: 在后续开展的进阶线上课程中享有优先录取资格 。
- 夏令营直通车: 获得后续线下夏令营活动的优先申请与选拔权 。
- 校友推荐: 获得向相关校友社群或学术项目进行推荐的机会
