2026 冬令营课程大纲
课程导览:开启生成式AI探索之旅
本次四天线上课程面向高中生,系统介绍生成式AI的核心原理与前沿应用。
自然语言处理与大语言模型解析
课程前半部分深入解析自然语言处理与大语言模型,涵盖从概率基础、词向量到Transformer架构的关键概念。通过实践活动揭示ChatGPT等工具的工作机制。
生成式AI × 生物医药前沿应用
课程后半部分聚焦生成式AI在生物医药领域的突破性应用,重点讲解其如何驱动蛋白质设计与药物发现。
培养跨学科AI工程思维
课程融合了直观的数学解释与动手演示,帮助学生建立跨学科的AI工程思维。旨在培养学生的科学素养与创新视野。
项目关键信息
- 项目形式:线上直播授课 + 线上作业 + 课后答疑
- 项目时间:2026.02.12 — 2026.02.15
- 截止报名:2026.02.01
- 授课语言:英文为主
课程日程(4 天)
每日安排:早上 8:00 - 10:30 授课含答疑,下午 2:00 - 4:00 练习(2 小时)
| 日期 | 课程内容(50分钟/节课) | 练习(2 小时) |
|---|---|---|
| Day 1|语言、概率与词向量的世界 | 课程 1:语言与概率入门 课程 2:词嵌入与线性代数 | · 构建“小型预测文本模型” · 计算词向量相似度 · 答疑与讨论 |
| Day 2|Transformer and AI 流水线 | 课程 3:Transformer 与梯度下降 课程 4:完整 AI 流水线与 ChatGPT 原理 | · 手算一次梯度下降 · 构建迷你聊天机器人 · 注意力可视化实验 |
| Day 3|生成式AI入门与蛋白语言模型基础 | 课程 5:生成式AI快速认知 课程 6:生成式AI的数学知识 课程 7:蛋白质语言模型简介 | · 运行 ESMFold 结构预测 · RFdiffusion 生成演示 · 概率/条件分布小测验 |
| Day 4|蛋白质语言模型进阶 | 课程 8:蛋白质语言模型的价值与应用 课程 9:蛋白质语言模型的训练 课程 10:蛋白质语言模型与药物知识图谱 | · 构建小型知识图谱 · GNN 小实验 · Final Q&A + Challenge |
Day 1|语言、概率与词向量的世界
课程内容(50分钟/节课)
- 课程 1:语言与概率入门
- 课程 2:词嵌入与线性代数
练习(2 小时)
- · 构建“小型预测文本模型”
- · 计算词向量相似度
- · 答疑与讨论
Day 2|Transformer and AI 流水线
课程内容(50分钟/节课)
- 课程 3:Transformer 与梯度下降
- 课程 4:完整 AI 流水线与 ChatGPT 原理
练习(2 小时)
- · 手算一次梯度下降
- · 构建迷你聊天机器人
- · 注意力可视化实验
Day 3|生成式AI入门与蛋白语言模型基础
课程内容(50分钟/节课)
- 课程 5:生成式AI快速认知
- 课程 6:生成式AI的数学知识
- 课程 7:蛋白质语言模型简介
练习(2 小时)
- · 运行 ESMFold 结构预测
- · RFdiffusion 生成演示
- · 概率/条件分布小测验
Day 4|蛋白质语言模型进阶
课程内容(50分钟/节课)
- 课程 8:蛋白质语言模型的价值与应用
- 课程 9:蛋白质语言模型的训练
- 课程 10:蛋白质语言模型与药物知识图谱
练习(2 小时)
- · 构建小型知识图谱
- · GNN 小实验
- · Final Q&A + Challenge
作息与平台
- 授课安排: 每日上午 08:00 - 10:30(含线上授课与即时答疑)。
- 实践环节: 每日下午 14:00 - 16:00(专项练习与作业实操,共 2 小时)。
- 统一学习环境: 官方提供在线云端编程平台及专属登录账号,实现零环境配置学习 。
- 讲义与素材管理:
- 预发布机制: 教学讲义及相关配套素材将提前一天上传至官网“课程资料”区块,供学员预习。
- 动态反馈: 下午练习时段安排助教团队集中答疑,并根据高频问题实时更新问答库。
- 助教支持: 为学员进行平均分组并分配专属助教(TA),提供贯穿全周期的学习督导与技术支持 。
提交与评估
- 每日实践作业: 学员需按要求,每日提交一次作业/实践结果。
- 多元评估体系: 最终评估将综合以下维度:
- 出勤与互动: 直播课程的参与度与课堂互动表现 。
- 作业完成度: 每日实践任务的达成质量 。
- Tips: 表现优异者将获得:
- 优先录取权: 在后续开展的进阶线上课程中享有优先录取资格 。
- 夏令营直通车: 获得后续线下夏令营活动的优先报名与选拔权 。
- 校友推荐: 获得向相关校友社群或学术项目进行推荐的机会

