证券从业资格证考试辅助项目
证券从业资格证考试辅助项目,是我为自己备考搭建的一套 AI 辅助学习工具。它把网页题库、问卷星押题、Markdown 真题、PDF 讲义和个人复习过程整理成 可检索、可练习、可统计、可溯源、可复盘 的本地学习系统。
4024 题本地题库结构化题目总量
2 个科目金融基础 2162 题,法律法规 1862 题
54 个来源章节练习、真题、押题等来源入口
讲义溯源两科各 600 题与 PDF 讲义考点建立匹配
项目定位
这个项目是一个小型学习数据产品,目标是把刷题、讲义、错题和考点复盘组织起来。
我在备考证券从业考试时,发现真正的问题是资料过于分散:PDF 讲义、历年真题、押题卷、问卷星网页、Markdown 题目、答案解析和临考复习材料都散在不同地方。资料越多,越难判断应该先复习哪里、错题如何复刷、题目能不能回到讲义原文。
因此我把问题重新定义为:如何把非结构化备考资料,转成一套可以支持学习决策的数据系统。
项目背景
临考前的学习痛点主要有几类:
- 题目来源复杂,格式不统一。
- 押题、真题、章节练习混在一起,复习路径不清楚。
- 答案解析有,但很难回到 PDF 讲义里的原始考点。
- 错题和不会题容易遗失,无法形成持续复刷机制。
- 章节题量和高频考点不清楚,复习优先级只能靠感觉。
- 电脑端和手机端学习难以衔接。
这和我做数据产品时遇到的问题很像:数据源分散、字段不统一、口径不清晰、结果难以复盘。于是我用数据产品的方法处理备考。
项目目标
- 将讲义、真题、押题和网页题库整理成结构化题库。
- 建立题目、章节、题型、来源、答案、解析、讲义页码之间的关系。
- 搭建本地 HTML 练习工具,支持刷题、背题、错题和掌握状态记录。
- 用章节题量、高频考点和题型分布辅助复习优先级判断。
- 临考前生成压缩版模拟卷和冲刺卷,提高最后阶段复习效率。
我做了什么
| 工作方向 | 具体工作 |
|---|---|
| 题库结构化 | 将题干、选项、答案、解析、科目、章节、题型、来源等字段拆出来 |
| 来源整合 | 整合网页题库、问卷星押题、Markdown 真题和 PDF 讲义 |
| 本地练习页 | 构建可在本地打开的 HTML 练习页、背题页和手机端页面 |
| 错题与掌握状态 | 支持错题记录、会 / 模糊 / 不会标记和本地缓存 |
| 讲义溯源 | 将题目与讲义章节、页码、考点和原文片段建立匹配 |
| 临考压缩 | 基于高频章节和题型比例生成 100 题模拟卷、60 题冲刺卷 |
| 复盘输出 | 输出项目介绍、面试讲述版、复盘文章和社交媒体短帖版 |
数据结构
题目被抽象成可分析的数据对象,具备章节、题型、选项、答案和解析等字段。
| 字段 | 用途 |
|---|---|
| 科目 | 区分金融基础、法律法规 |
| 章节 | 支持按知识结构复习 |
| 题型 | 区分单选、多选、判断、案例 |
| 题干 / 选项 | 形成标准答题对象 |
| 答案 / 解析 | 支持即时反馈 |
| 来源 | 追踪题目来自章节练习、押题或真题 |
| 掌握状态 | 记录会、模糊、不会 |
| 错题状态 | 支持错题本和复刷 |
| 讲义页码 / 考点 | 回到 PDF 原始知识点 |
本地题库当前包含 4024 道题,其中金融基础 2162 题,法律法规 1862 题。
核心功能
| 功能 | 说明 | 价值 |
|---|---|---|
| 章节筛选 | 按科目和章节筛选题目 | 回到知识结构复习 |
| 题型筛选 | 按单选、多选、判断、案例题筛选 | 针对薄弱题型练习 |
| 自动解析 | 答题后展示答案和解析 | 降低查答案成本 |
| 错题本 | 自动记录错题,支持集中复刷 | 建立反馈闭环 |
| 掌握状态 | 标记会、模糊、不会 | 支持临考优先级排序 |
| 讲义出处 | 展示讲义页码、章节和考点 | 提升答案可信度 |
| 打印汇总 | 生成 A4 紧凑版和超紧凑版 | 支持离线复习 |
| 手机端页面 | 导出移动端本地 HTML | 让碎片时间也能复习 |
讲义与题库匹配
我将题目与 PDF 讲义做了匹配,让每道题尽量回到原始知识源。
| 科目 | 讲义切分考点数 | 匹配题目数 | 命中讲义考点数 |
|---|---|---|---|
| 金融基础 | 175 | 600 | 154 |
| 法律法规 | 271 | 600 | 212 |
这个能力很关键。做错题时,用户不只看到答案,还可以看到题目对应的讲义考点和页码,从而回到知识源头复习。
临考冲刺
临考前,我基于章节覆盖、高频考点和题型比例生成压缩题集,避免继续盲目刷所有题。
以法律法规为例,系统生成了:
- 100 题模拟卷:按章节覆盖和题型比例组卷,适合计时做题。
- 60 题保命卷:偏向高频、多选和易混考点,适合最后背题。
- 独立缓存版:100 题和 60 题各自记录会 / 模糊 / 不会,不影响原题库缓存。
这体现的是数据从“记录”走向“决策”:题库不仅告诉我过去做了什么,也帮助我决定最后阶段应该复习什么。
数据如何驱动
text
原始资料
-> 题目结构化
-> 章节 / 题型 / 来源打标
-> 讲义页码匹配
-> 做题行为记录
-> 错题与掌握状态
-> 高频题集生成
-> 临考复习决策这个项目中的数据驱动,体现在四个层面:
- 用章节题量判断复习重点。
- 用题型分布安排刷题策略。
- 用错题和掌握状态形成反馈闭环。
- 用讲义出处提升答案可信度。
成果与价值
- 将分散备考资料整理为本地结构化题库。
- 搭建本地练习、背题、手机端、打印版等多种学习入口。
- 建立题目与讲义之间的溯源关系,提高复习可信度。
- 生成临考模拟卷和冲刺卷,帮助有限时间内压缩复习范围。
- 完整实践了从资料采集、数据建模、指标设计、产品迭代到决策支持的流程。
个人能力沉淀
这个项目虽然是个人备考场景,但它很完整地体现了我的数据产品思维:把混乱信息整理成结构,把隐性学习过程变成可观察数据,再用工具帮助自己做出更清楚的行动选择。