EN
中文
开源基准测试
Gemini 转录:惊人的准确率,
失控的时间戳
我们从 4 个维度系统测试了 Gemini 的转录能力。文本质量优秀——但时间戳需要修复。
30-300%
原始 DER
→
9-16%
+LattifAI DER
测试素材:
OpenAI GPT-4o 发布会(约 26 分钟)— 4 位说话人(含 ChatGPT)、频繁打断、语音重叠、观众掌声。每个实验至少运行 2 次以验证稳定性。
指标说明
L1: 温度参数
L2: URL vs 本地
L3: 思考模式
L4: 多来源对比
正在加载基准测试数据...