短视频文案提取解析api接口|多角色字幕级ASR语音识别API

发布时间:2026/7/6 6:21:59
短视频文案提取解析api接口|多角色字幕级ASR语音识别API 短视频文案提取解析api接口多角色字幕级ASR语音识别API一、产品概述酷虎云短视频文案提取解析API一站式整合语音识别、音视频文案解析、多说话人区分、毫秒级时间戳、自动SRT字幕生成全能力标准STT语音转文本接口适配短视频剪辑、自媒体批量扒文案、直播录音转写、影视字幕制作、智能内容审核等全场景支持外链短视频、本地音视频文件极速解析长音频稳定处理多语种精准识别开箱即用标准化JSON返回开发者快速集成落地。二、核心超强功能1. 全格式音视频短视频链接一键解析支持mp3、mp4、wav、webm、aac、flac、m4a、mov、mkv、ogg、opus、amr、avi、flv、mpeg、wma、wmr等十余种音视频格式全网任意短视频分享链接直接传入URL即可解析单文件最大2GB最长支持12小时超长音频/视频批量转写无需本地下载文件降低服务器存储压力。2. 多角色说话人区分精准区分多人物对话内置说话人识别能力返回数据自带speaker说话人标识多人对话、访谈、影视剧、直播连麦自动分离不同角色台词完美适配访谈视频、剧情短视频、多人播客字幕制作无需人工手动区分人声。3. 字幕级毫秒粒度时间戳两种字幕方案1. 一键输出完整SRT字幕字符串直接保存导入剪映、PR、AE等剪辑软件开箱即用2. 细粒度sentences结构化数据包含分句时间戳、单字毫秒级时间戳开发者可自定义生成双语字幕、滚动字幕、高亮字幕满足精细化字幕开发需求。4. 多语种通用识别自动适配无需手动指定默认自动检测音频语种覆盖主流商用语种中文zh、英文en、日语ja、粤语yue、韩语ko、德语de、法语fr、俄语ru跨境短视频、海外素材文案提取无压力。5. 稳定长音频异步任务机制采用taskId异步任务架构提交解析任务后通过任务ID查询处理状态包含PENDING提交排队、RUNNING处理中、SUCCEEDED识别成功、FAILED识别失败、UNKNOWN任务过期5种状态长视频分段稳定解析避免大文件超时崩溃。6. 标准化HTTP接口极低接入成本兼容GET/POST双请求方式统一JSON返回格式配套调试工具、完整错误码文档、请求示例Header、传参规范统一PHP/Python/Java/JS等全语言快速对接附带执行耗时、客户端IP、采样率、音频时长等完整元数据方便业务日志统计。三、计费与使用规则1. 使用门槛接口正常可用使用前需完成实名认证合规商用2. 免费额度新用户赠送10分钟免费调用额度测试零成本3. 计费模式按量计费单价低至0.008元/分钟仅按有效音频时长扣费4. 请求限制每日无调用次数上限企业批量解析、批量扒短视频文案无并发封锁。四、接口基础信息接口地址https://api.kuhuyun.com/api/stt/speechrecognition请求方式HTTP GET / POST返回格式application/json请求HeaderContent-Type: application/x-www-form-urlencoded;charsetutf-8核心必填参数- key接口密钥控制台密钥管理获取身份鉴权凭证- url音视频文件/短视频外链地址支持超大时长媒体资源- taskId自定义任务唯一ID用于轮询查询识别结果可选参数language指定识别语种留空自动识别适配多语言素材批量处理五、返回数据核心字段1. text完整纯文本识别文案短视频一键提取解说台词2. subtitle成品SRT字幕文本直接导出剪辑软件3. sentences结构化多角色数据speaker说话人分句单字时间戳4. 基础元数据taskId、媒体格式、音频时长、采样率、提交/完成时间5. 状态标识task_status区分任务进度便于业务做排队、失败重试逻辑6. 调试字段exec_time执行耗时、客户端user_ip方便排错运维。六、适用行业场景1. 自媒体剪辑工具短视频链接一键提取文案批量二次创作2. 视频剪辑SAAS平台自动生成字幕省去人工打轴3. 播客/访谈工具多人对话区分角色台词自动整理访谈文稿4. 内容审核系统音视频语音转文字智能关键词筛查5. 跨境短视频工具多语种海外视频文案提取翻译6. 企业会议录音转写超长会议录音归档、生成会议纪要7. 影视短剧制作批量剧集字幕自动生成降低后期人力成本。七、产品优势1. 低成本0.008元/分钟低价按量计费新用户免费额度测试2. 大容量12小时超长视频、2GB大文件全兼容短视频外链直解析3. 高精度字粒度毫秒时间戳多说话人精准分离多语种识别稳定4. 易集成标准HTTP接口完整文档调试工具全语言快速对接5. 高并发无每日请求上限支持企业级批量解析业务6. 一站式集文案提取、语音转文字、多角色识别、字幕生成于单一接口无需对接多个第三方服务。八、接入流程1. 平台完成实名认证控制台获取专属key密钥2. 拼接接口地址传入key、音视频url、自定义taskId发起请求3. 通过taskId轮询查询任务状态等待task_status为SUCCEEDED4. 读取返回text纯文案、subtitle成品字幕、sentences多角色时间戳数据完成业务开发。来源酷虎云api开放平台