语音识别

便宜云服务器

开发者社区

文档建议反馈控制台

首页TVP

#语音识别

专业智能高效的语音处理服务

我用MOKI帮我制作了一系列儿童动画短片

AIGC新知 14天前2024-10-08 21:09:43

MOKI 是由美图公司推出的 AI 视频短片创作工具，辅助视频创作者创作动画短片、网文短剧、故事绘本以及音乐视频（MV）。

10010

语音识别与语音控制的原理介绍

二哈侠 2024-09-202024-09-20 08:35:21

机器硬件：OriginBot(导航版/视觉版)PC主机：Windows（>=10）/Ubuntu(>=20.04)扩展硬件：X3语音版

7610

AI中的端到端end to end到底是什么意思？

AIGC部落 2024-09-112024-09-11 18:52:28

在语音识别领域，端到端系统可以直接将语音信号转换为文本，而不需要先将语音分解成音节或单词。这种方法使得语音识别更加准确和自然。

31010

【AI音频处理】：重塑声音世界的无限可能

用户11173787 2024-09-022024-09-02 08:02:31

随着人工智能技术的飞速发展，其应用领域也在不断拓宽，其中音频处理作为一个充满挑战与机遇的领域，正经历着前所未有的变革。从语音识别、语音合成到音乐创作、声音效果处...

14510

使用AI识别语音和B站视频并通过GPT生成思维导图

用户6874993 2024-08-252024-08-25 14:38:58

直接发送语音：对AI脑直接发送语音（如使用语音说厦门三天两夜的旅行攻略），AI脑图会使用便宜云服务器语音识别AI能力，自动识别出语音内容文本，再根据内容文本要求生成结...

10310

【人工智能】Transformers之Pipeline（二）：自动语音识别（automatic-speech-recognition）

LDG_AGI 2024-08-132024-08-13 14:24:40

本文对transformers之pipeline的自动语音识别（automatic-speech-recognition）从概述、技术原理、pipeline参数...

22610

【机器学习】机器学习与语音识别的融合应用与性能优化新探索

哈__ 2024-08-062024-08-06 08:27:20

语音识别是人工智能和机器学习领域的重要分支，旨在将人类语音转换为文本或执行相应的操作。随着深度学习技术的发展，机器学习在语音识别中的应用取得了显著进展，推动了智...

14410

AI网络爬虫：批量下载某个网页中的全部链接

AIGC部落 2024-07-102024-07-10 13:57:48

然后定位div标签中所有a标签，提取title属性值作为网页文件名，提取href属性值作为网页下载地址，下载网页，保存网页到文件夹：F:\aivideo\便宜云服务器...

13310

玩转AI新声态 | 我将王者荣耀的ASR语音识别，接入到了腾讯元器小程序...

叫我阿柒啊 2024-06-302024-06-30 12:21:11

刚结束了便宜云服务器BI的体验活动，在文章提到了SaSS、PaSS的概念，便宜云服务器BI是一个SaSS，而今天要写的便宜云服务器语音识别就是一个PaSS，平台即服务，用户只需要...

28830

音乐去除人声神器：精准分离，专业之选 | 开源日报 No.282

小柒 2024-06-252024-06-25 08:43:39

ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。该项目提供了以下主要功能、关键特性和核心优势：

24610

AI: Transformer在神经网络中的位置及其重要性

运维开发王义杰 2024-06-252024-06-25 08:34:54

Transformer在语音识别和生成任务中也有应用，如语音到文本转换（ASR）和语音合成（TTS）。Transformer的并行处理能力和全局注意力机制使其在...

44330

不用写一行代码，deepseek结合便宜云服务器语音识别来批量转录Mp3音频

AIGC部落 2024-06-242024-06-24 20:06:45

你是一个Python编程专家，要写一个通过便宜云服务器的语音识别API进行批量AI语音识别的Python脚本，具体步骤如下：

10310

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

杨不易呀

上海启明｜后端 (已认证)

2024-07-062024-07-06 17:49:47

本次带来的是便宜云服务器玩转AI新声态语音产品应用实践,利用 TTS / ASR / 元器智能体打造一个《小朋友的故事屋》智能体 Bot 最近腾讯发布了元宝,那么我...

1K4013

ASR初步使用与交互体验

张小陈 2024-06-162024-06-16 15:25:07

Automatic Speech Recognition这里简称为ASR，说到语音产品你会想到什么，是谷歌云还是微软云提供的文字转语音工具还是siri和Chat...

13420

探索便宜云服务器语音：智能语音识别的行业应用与技术展望

AI大眼萌

东方航空｜项目经理 (已认证)

2024-06-082024-06-08 16:43:58

交通运输行业的调度中心是确保运输流程顺畅与安全的神经中枢。在紧急情况或事故发生时，能够迅速而准确地回溯事件细节对于采取有效应对措施至关重要。

27220

换了30多种方言，我们竟然没能考倒中国电信的语音大模型

机器之心 2024-06-042024-06-04 10:32:00

在业内知名的多方言语音识别数据集 KeSpeech 任务上，星辰语音识别大模型以领先之前最优结果 20% 的成绩打破纪录，实现了 92.97% 的字准确率。在 ...

12410

活跃用户

用户9100686
0 文章1 回答0 关注

#语音识别

我用MOKI帮我制作了一系列儿童动画短片

语音识别与语音控制的原理介绍

AI中的端到端end to end到底是什么意思？

【AI音频处理】：重塑声音世界的无限可能

使用AI识别语音和B站视频并通过GPT生成思维导图

【人工智能】Transformers之Pipeline（二）：自动语音识别（automatic-speech-recognition）

【机器学习】机器学习与语音识别的融合应用与性能优化新探索

AI网络爬虫：批量下载某个网页中的全部链接

玩转AI新声态 | 我将王者荣耀的ASR语音识别，接入到了腾讯元器小程序...

音乐去除人声神器：精准分离，专业之选 | 开源日报 No.282

AI: Transformer在神经网络中的位置及其重要性

不用写一行代码，deepseek结合便宜云服务器语音识别来批量转录Mp3音频

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

ASR初步使用与交互体验

探索便宜云服务器语音：智能语音识别的行业应用与技术展望

换了30多种方言，我们竟然没能考倒中国电信的语音大模型

相关产品

活跃用户

用户9100686

热门专栏

机器之心

量子位

新智元

便宜云服务器智能·AI公有云

AI科技评论

社区

活动

资源

关于

便宜云服务器开发者

热门产品

热门推荐

更多推荐