语音识别技术所有文章-最新语音识别技术相关文章汇总-第15页-HelloWorld开发者社区

•

3年前

身份证识别技术就是利用OCR识别核心，对身份证进行扫描识别提取文字信息，免去人们手动输入的过程，身份证识别技术识别精准度高、速度快，大大提高了用户体验。在通信行业，客户在进行开户登记以及业务变更时，需要提供身份证件；银行开户、网吧上网、考试报名等，都需要对身份证件进行登记、核查。除上述以外，不管你做什么需要采集身份信息的事情，都可以应用OCR身份证识别技术。

Easter79

•

4年前

tensorflow 之卷积神经网络

应用场景1.图像识别与检索2.人脸识别3.性别/年龄/情绪识别4.物体检测5.视频处理6.语音分析概述一般一个卷积神经网络由多个卷积层构成，在卷基层内部通常会有如下几个操作：1.图像通过多个卷积核滤波，添加偏置，提取局部特征每个卷积核会映射出一个新的2D图像。2.卷积核的滤波结果输出

Stella981

•

4年前

Android 快速集成手部关键点识别能力超简单

前言之前在《用华为HMSMLkit人体骨骼识别技术，Android快速实现人体姿势动作抓拍》文章中，我们给大家介绍了HMSMLKit人体骨骼识别技术，可以定位头顶、脖子、肩、肘、手腕、髋、膝盖、脚踝等多个人体关键点。那么除了识别人体关键点以外，HMSMLKit还为开发者提供了手部关键点识别技术，可以定位包括手指指尖、关节点，以及手腕点等

Stella981

•

4年前

Serverless Framework + OCR 快速搭建通用文字识别应用

在日常的工作生活中，文字识别与我们息息相关，比如身份证识别、随手拍扫描、纸质文档电子化等，无不显示着文字识别技术的重要性。为此，腾讯云通用文字识别产品GeneralOCR应运而生，基于行业前沿的深度学习技术，支持将图片上的文字内容智能识别为可编辑的文本，大幅提升信息处理效率。而ServerlessFramework与OCR的结合，则为用户提供

Wesley13

•

4年前

ubuntu 十分钟后提醒我

ubuntu十分钟后提醒我背景非常受用windowsphone上cortana的语音指令：十分钟分钟后叫我起床。一小时后提醒我做XXX。思路ubuntu下语音识别很难搞，只好搞了个命令行的东西来做几分钟后提醒我这样的事情。几分钟后干什么，用程序实现起来很容易。golang的time.after\_func就可以。然

Stella981

•

4年前

Sensory发布新的语音自拍APP

在自拍的时候我们经常会碰到如何处理手指不要遮挡摄像头，同时又要能够方便的按钮或触控屏幕来触发快门。Sensory新的Android平台语音自拍APP最近发布了新的，支持自定义语音命令(customphrases）。新的软件同样是基于SensoryTrulyHandsFree技术开发。新版本在支持预先设定语音命令(preset

不是海碗

•

2年前

看懂二维码识别OCR：从算法到API 接入代码

引言二维码识别OCR（OpticalCharacterRecognition）是结合了图像处理和OCR技术，以识别和提取二维码中的信息的技术，二维码识别OCR可以实现对图像中的二维码进行自动检测和解码，并将其内容提取为可编辑的文本，这种技术在许多领域中被广

数据堂

•

4个月前

版权数据集上新 | 覆盖大模型、多模态大模型、语音识别、语音合成及计算机视觉等多领域

近日，数据堂发布全新数据产品，覆盖多语种大模型预训练、多模态大模型、语音识别及计算机视觉等多个前沿方向。所有数据集经严格标注与质量控制，提供商业级使用授权且已获得科研使用许可，知识产权归属清晰可溯，可为企业及研发团队提供大规模、多样化、合规可靠的数据资源，有效助力大模型与AI技术迭代升级，赋能全球应用场景创新。

数据堂

•

1个月前

童声数据：解锁下一代AI儿童交互的关键基石

当孩子们用稚嫩的声音唤醒智能助手，AI正通过语音悄然重塑童年。2025年，儿童智能设备迎来高速发展阶段——智能音箱儿童用户占比超38%，手表语音日活渗透率达61%，但童声高基频、发音未定型等特征使通用ASR识别错误率明显增高。让AI真正“听懂”吐字模糊、语法跳跃的童声，成为行业突破儿童智能交互瓶颈的核心任务。