实时转录

使用高精度语音识别实时捕获课堂内容,支持双语翻译和 AI 驱动的课堂问答

实时转录

UniFlow 的实时转录功能使用 Deepgram Nova-2 语音识别引擎实时捕获音频并转换为文字。无论你在教室、Zoom 会议还是学习小组中,每一句话都会被转录、加上时间戳,并自动索引到 UniMind 的知识图谱中——让每节课的内容都可搜索、可引用。

计划要求:实时转录适用于 Starter、Pro 和 Max 计划。免费用户可购买转录时间包按需使用。

开始使用

  1. 点击侧边栏中的实时转录(或标题栏中的麦克风图标)
  2. 选择本次录制所属的课程(可选,但建议选择以获得更好的 AI 上下文)
  3. 点击开始录制
  4. 系统提示时授予麦克风权限
  5. 开始说话或播放音频——文字将实时出现

工作原理

音频处理流程

  1. 麦克风采集 — UniFlow 使用 Web Audio API 和 AudioWorklet 处理器以 24 kHz 采样率进行低延迟、高保真音频采集
  2. 噪声处理 — 可配置输入增益、噪声抑制、回声消除和自动增益控制
  3. 流式传输到 Deepgram — 原始 PCM 音频通过 WebSocket 实时传输到 Deepgram Nova-2 模型
  4. 实时结果 — 临时(部分)结果即时显示;每句话结束时确认最终结果
  5. 语段检测 — Deepgram 的 UtteranceEnd 事件检测说话者或话题之间的自然停顿

转录显示

转录笔记本以简洁的可滚动界面展示文字:

  • 临时文字以较浅样式实时显示和更新
  • 最终文字在 Deepgram 确认后锁定
  • 自动分段将句子按段落分组(默认每 5 句为一段)
  • 每个片段都记录时间戳

核心功能

双语支持

UniFlow 支持多语言转录:

  • 英语(默认)— 针对学术讲座优化
  • 中文 — 完整的普通话支持
  • 根据你的设置自动检测语言

麦克风灵敏度配置

选择适合你环境的配置:

配置 最佳场景 设置
标准 安静教室、办公室 中等增益,噪声抑制开启
灵敏 大型阶梯教室、远距离说话者 较高增益,关闭噪声抑制以提高清晰度
嘈杂 咖啡馆、户外、小组讨论 均衡增益,全面噪声抑制和回声消除

设置 > 通用 > 麦克风灵敏度中配置。

录制控制

  • 暂停 / 继续 — 暂时暂停而不结束会话
  • 停止 — 结束录制并完成转录
  • 自动恢复 — 如果麦克风流中断(例如设备断开),UniFlow 会自动尝试重新连接

会话管理

每次转录保存为一个会话,包含:

  • 会话标题(可编辑)
  • 关联课程
  • 创建日期和时长
  • 带时间戳的完整转录
  • 录制状态(录制中、暂停、已完成)

你可以在转录库中浏览所有会话,按课程筛选,并跨转录搜索。

课堂问答模式

UniFlow 最强大的功能之一是课堂问答模式,在实时转录会话期间通过 Mini Chat 面板使用。

功能介绍

启用后,AI 会实时读取你的转录内容并帮助你:

  • 识别教授最近提出的问题
  • 生成即用的双语回答(英语 + 中文)
  • 准备课堂发言——语气自信但不过于正式

使用方式

  1. 开始一个转录会话
  2. 点击聊天图标打开 Mini Chat 抽屉
  3. 开启课堂问答模式
  4. 使用快捷操作:
    • "帮我回答" — 找到最新问题并生成回答
    • "课堂参与" — 准备讨论发言
    • "补充观点" — 在当前讨论基础上补充
    • "总结讨论" — 总结关键点并表明你的立场
    • "提个问题" — 准备一个有深度的问题
    • "回应同学" — 针对另一位同学的观点撰写回应

回答格式

所有课堂问答回复采用严格的双语格式:

**English:**
I think the main factor here is... because...

**中文:**
我认为这里的主要因素是……因为……

语气调校为像一个准备充分的学生在课堂上发言——清晰、有条理、自然。

普通模式

关闭课堂问答模式时,Mini Chat 作为通用 AI 助手工作,可以访问实时转录内容。你可以问:

  • "现在讨论什么内容?"
  • "有布置什么任务吗?"
  • "解释一下刚才那部分"
  • "总结这节课"
  • "标出重点"
  • "生成学习笔记"

云端同步

转录会话自动同步到云端:

  • 在任何设备上访问你的转录
  • 转录内容被索引到 UniMind 的知识图谱中
  • 每节课的每句话都可通过 UniMind 搜索和引用

转录时间与计费

计划 包含时长 额外时长
免费版 无(购买时间包) 通过时间包获取
Starter 每月包含配额 购买时间包获取更多
Pro 更多每月配额 购买时间包获取更多
Max 充裕的每月配额 购买时间包获取更多

转录时间包

时间包为一次性购买,为你的账户增加额外高精度转录时长:

  • 适用于任何计划(包括免费版)
  • 购买后 180 天内有效
  • 可与订阅包含的时长叠加
  • 定价页面购买

使用技巧

  • 将会话关联到课程 — 这样 UniMind 在回答该课程问题时可以使用讲座内容
  • 在大教室使用灵敏配置 — 通过减少噪声抑制来更好地捕获远距离音频
  • 保持应用在前台 — 某些情况下后台音频处理可能被限制;保持 UniFlow 在前台可确保最佳采集质量
  • 课后回顾和编辑 — 转录内容在被索引前可以编辑以提高准确性

常见问题

麦克风未检测到

  1. 检查麦克风是否已连接且未静音
  2. 确保 UniFlow 在系统设置中拥有麦克风权限
  3. 尝试在系统偏好设置中选择不同的音频输入设备
  4. 重启应用

转录质量不佳

  • 对远距离说话者切换到灵敏麦克风配置
  • 确保你处于相对安静的环境中
  • 检查网络连接 — Deepgram 需要稳定的 WebSocket 连接
  • 尝试靠近音频源

录制过程中连接中断

UniFlow 包含自动重连逻辑。如果 Deepgram WebSocket 断开:

  1. 音频块在本地缓冲(最多 100 个块)
  2. 客户端自动尝试重连
  3. 连接恢复后重放缓冲的音频

如果重连失败,会显示错误指示器。尝试停止并重新开始会话。

下一步