近日,小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR,在多种场景下表现优异,适用于普通话、中文方言及英语等多种语言环境。
-
模型结构:包含FireRedASR-LLM(结合文本预训练LLM,适用于高准确率需求)和FireRedASR-AED(基于Attention-based Encoder-Decoder架构,平衡准确率和推理效率)两种核心结构。
-
模型测试:在业界常用的中文普通话公开测试集上,FireRedASR-LLM(8.3B 参数量)取得了最优 CER 3.05%