实时转录
UniFlow 的实时转录功能使用 Deepgram Nova-2 语音识别引擎实时捕获音频并转换为文字。无论你在教室、Zoom 会议还是学习小组中,每一句话都会被转录、加上时间戳,并自动索引到 UniMind 的知识图谱中——让每节课的内容都可搜索、可引用。
计划要求:实时转录适用于 Starter、Pro 和 Max 计划。免费用户可购买转录时间包按需使用。
开始使用
- 点击侧边栏中的实时转录(或标题栏中的麦克风图标)
- 选择本次录制所属的课程(可选,但建议选择以获得更好的 AI 上下文)
- 点击开始录制
- 系统提示时授予麦克风权限
- 开始说话或播放音频——文字将实时出现
工作原理
音频处理流程
- 麦克风采集 — UniFlow 使用 Web Audio API 和 AudioWorklet 处理器以 24 kHz 采样率进行低延迟、高保真音频采集
- 噪声处理 — 可配置输入增益、噪声抑制、回声消除和自动增益控制
- 流式传输到 Deepgram — 原始 PCM 音频通过 WebSocket 实时传输到 Deepgram Nova-2 模型
- 实时结果 — 临时(部分)结果即时显示;每句话结束时确认最终结果
- 语段检测 — Deepgram 的 UtteranceEnd 事件检测说话者或话题之间的自然停顿
转录显示
转录笔记本以简洁的可滚动界面展示文字:
- 临时文字以较浅样式实时显示和更新
- 最终文字在 Deepgram 确认后锁定
- 自动分段将句子按段落分组(默认每 5 句为一段)
- 每个片段都记录时间戳
核心功能
双语支持
UniFlow 支持多语言转录:
- 英语(默认)— 针对学术讲座优化
- 中文 — 完整的普通话支持
- 根据你的设置自动检测语言
麦克风灵敏度配置
选择适合你环境的配置:
| 配置 | 最佳场景 | 设置 |
|---|---|---|
| 标准 | 安静教室、办公室 | 中等增益,噪声抑制开启 |
| 灵敏 | 大型阶梯教室、远距离说话者 | 较高增益,关闭噪声抑制以提高清晰度 |
| 嘈杂 | 咖啡馆、户外、小组讨论 | 均衡增益,全面噪声抑制和回声消除 |
在设置 > 通用 > 麦克风灵敏度中配置。
录制控制
- 暂停 / 继续 — 暂时暂停而不结束会话
- 停止 — 结束录制并完成转录
- 自动恢复 — 如果麦克风流中断(例如设备断开),UniFlow 会自动尝试重新连接
会话管理
每次转录保存为一个会话,包含:
- 会话标题(可编辑)
- 关联课程
- 创建日期和时长
- 带时间戳的完整转录
- 录制状态(录制中、暂停、已完成)
你可以在转录库中浏览所有会话,按课程筛选,并跨转录搜索。
课堂问答模式
UniFlow 最强大的功能之一是课堂问答模式,在实时转录会话期间通过 Mini Chat 面板使用。
功能介绍
启用后,AI 会实时读取你的转录内容并帮助你:
- 识别教授最近提出的问题
- 生成即用的双语回答(英语 + 中文)
- 准备课堂发言——语气自信但不过于正式
使用方式
- 开始一个转录会话
- 点击聊天图标打开 Mini Chat 抽屉
- 开启课堂问答模式
- 使用快捷操作:
- "帮我回答" — 找到最新问题并生成回答
- "课堂参与" — 准备讨论发言
- "补充观点" — 在当前讨论基础上补充
- "总结讨论" — 总结关键点并表明你的立场
- "提个问题" — 准备一个有深度的问题
- "回应同学" — 针对另一位同学的观点撰写回应
回答格式
所有课堂问答回复采用严格的双语格式:
**English:**
I think the main factor here is... because...
**中文:**
我认为这里的主要因素是……因为……
语气调校为像一个准备充分的学生在课堂上发言——清晰、有条理、自然。
普通模式
关闭课堂问答模式时,Mini Chat 作为通用 AI 助手工作,可以访问实时转录内容。你可以问:
- "现在讨论什么内容?"
- "有布置什么任务吗?"
- "解释一下刚才那部分"
- "总结这节课"
- "标出重点"
- "生成学习笔记"
云端同步
转录会话自动同步到云端:
- 在任何设备上访问你的转录
- 转录内容被索引到 UniMind 的知识图谱中
- 每节课的每句话都可通过 UniMind 搜索和引用
转录时间与计费
| 计划 | 包含时长 | 额外时长 |
|---|---|---|
| 免费版 | 无(购买时间包) | 通过时间包获取 |
| Starter | 每月包含配额 | 购买时间包获取更多 |
| Pro | 更多每月配额 | 购买时间包获取更多 |
| Max | 充裕的每月配额 | 购买时间包获取更多 |
转录时间包
时间包为一次性购买,为你的账户增加额外高精度转录时长:
- 适用于任何计划(包括免费版)
- 购买后 180 天内有效
- 可与订阅包含的时长叠加
- 在定价页面购买
使用技巧
- 将会话关联到课程 — 这样 UniMind 在回答该课程问题时可以使用讲座内容
- 在大教室使用灵敏配置 — 通过减少噪声抑制来更好地捕获远距离音频
- 保持应用在前台 — 某些情况下后台音频处理可能被限制;保持 UniFlow 在前台可确保最佳采集质量
- 课后回顾和编辑 — 转录内容在被索引前可以编辑以提高准确性
常见问题
麦克风未检测到
- 检查麦克风是否已连接且未静音
- 确保 UniFlow 在系统设置中拥有麦克风权限
- 尝试在系统偏好设置中选择不同的音频输入设备
- 重启应用
转录质量不佳
- 对远距离说话者切换到灵敏麦克风配置
- 确保你处于相对安静的环境中
- 检查网络连接 — Deepgram 需要稳定的 WebSocket 连接
- 尝试靠近音频源
录制过程中连接中断
UniFlow 包含自动重连逻辑。如果 Deepgram WebSocket 断开:
- 音频块在本地缓冲(最多 100 个块)
- 客户端自动尝试重连
- 连接恢复后重放缓冲的音频
如果重连失败,会显示错误指示器。尝试停止并重新开始会话。
下一步
- UniMind 引擎 — 使用讲座转录作为上下文向 AI 提问
- Canvas 同步 — 将转录会话关联到特定课程
- 文档编辑器 — 将转录或讲座笔记导出为文档
- 快捷键 — 快速访问转录控制