搜狗听写是搜狗近期发布的听写和转写神器,适合记着、作家等文字工作者。下面,我们来看看搜狗听写APP怎么用。
搜狗推出语音转写文字工具“搜狗听写”,基于搜狗知音引【yǐn】擎【qíng】的长【zhǎng】时语音听写技术,可实现小时【shí】级文字转写功【gōng】能,文本语音同时保存。
现已上线Android、iOS移动端和Web版本,提供“听写”和“转写”两种模式,服务免费,主要面【miàn】向记者【zhě】、编辑、作【zuò】家等文字工【gōng】作【zuò】者。
活动现场【chǎng】,搜狗方面表示,后【hòu】期将重点推进人工【gōng】智能技术的落地,并透露将在可穿戴、车载、客厅等场景领域自主研发硬件。搜狗方面透【tòu】露,搜狗将于【yú】近期推出一款面向家庭和儿童的【de】机器人【rén】产品。
据介绍,搜狗语音输入法错误率已经下降到3.8%,语音【yīn】识别服务每日请求PV为2.6亿次,每天产生【shēng】语【yǔ】料22万小时。基于规模性的用户语音数据,听写产品将搜狗的语音识别、自【zì】然语【yǔ】言理解等【děng】技术进一步延展落地。
传统语音转录产品主要包括两大类,录音类、语音输入法+备忘录。前者只能录音【yīn】不能实现文字转写,不能标【biāo】注重点;后者无法长时语音输入,可能被打断,无法保存原始【shǐ】录音。
搜狗认为语音转录产品具备刚性需求。基于上述【shù】痛点,搜狗听写提供【gòng】听写【xiě】和【hé】转写模式,听写【xiě】模式可边收音边展现识别结果,转写模型支持离线上传文件给出识别结果。
在功能设计上,搜狗听写提供语音和文字无缝对齐,方便重点内容定位;支持重点标注,对应的文本和语音可同时标注。产品可在手机端边听边写,实现手机端和网页端内容同步。
此外,搜狗听写还提供外接【jiē】蓝牙键【jiàn】,与手机配对,方便用户录音过程中实时标注。搜狗听写还可根据语义自动添加标点,标点正确率高达96%,标点类型在满足逗号、句号、问号、叹号【hào】的基础上,还【hái】率先扩充了书名号。
在应用场景上,搜狗听写针对用户的使用场景,如开会,写小说等场景进行优化。识别效果较通用效果提升15%以上;还针对不便于大声说话而【ér】又有使用语音的场景,提供了耳【ěr】语识别技术,在人【rén】的说话【huà】音量低至30分贝以下【xià】的情况下【xià】,依然可以准确识别。
相较于此【cǐ】前的输入法语音【yīn】识别,搜狗【gǒu】听写的使用场景更加复杂,在算法模型层面,搜狗进行了优化。
据介绍,听写模式采用业内领先的端到端深度神经网络技术Deep LC-CLDNN+CTC技术,转写【xiě】模式使用了Deep CNN+CTC的【de】方式,语【yǔ】言模型【xíng】基于T级海量输【shū】入法文【wén】本数据使用神经网络进行建模,语音识【shí】别准确率高达97%。
在语音文字转写工具领域,科大讯飞已经推出录音宝、讯飞听见等产品【pǐn】。当谈到搜狗听写【xiě】的差异性【xìng】,搜【sōu】狗语音交互技术中心总经【jīng】理王砚峰认为,搜狗听写的【de】优势在【zài】于可支持长时录音,转写服务免【miǎn】费。在功能设计【jì】上,搜狗更看重垂直场景的体验提升,比如加入蓝牙键,提供改写、标注、发摘【zhāi】要【yào】等在线编辑功能。
2024-9-20 / 75.5M
2024-9-20 / 19.5M
2024-9-20 / 39.0M
2024-9-20 / 44.5M
2024-9-20 / 12.7M
2024-9-20 / 34.2M