Easter79 Easter79
4年前
tensorflow 之 卷积神经网络
应用场景1.图像识别与检索2.人脸识别3.性别/年龄/情绪识别4.物体检测5.视频处理6.语音分析概述一般一个卷积神经网络由多个卷积层构成,在卷基层内部通常会有如下几个操作:1.图像通过多个卷积核滤波,添加偏置,提取局部特征每个卷积核会映射出一个新的2D图像。2.卷积核的滤波结果输出
Stella981 Stella981
4年前
Android 快速集成手部关键点识别能力 超简单
前言之前在《用华为HMSMLkit人体骨骼识别技术,Android快速实现人体姿势动作抓拍》文章中,我们给大家介绍了HMSMLKit人体骨骼识别技术,可以定位头顶、脖子、肩、肘、手腕、髋、膝盖、脚踝等多个人体关键点。那么除了识别人体关键点以外,HMSMLKit还为开发者提供了手部关键点识别技术,可以定位包括手指指尖、关节点,以及手腕点等
Stella981 Stella981
4年前
Serverless Framework + OCR 快速搭建通用文字识别应用
在日常的工作生活中,文字识别与我们息息相关,比如身份证识别、随手拍扫描、纸质文档电子化等,无不显示着文字识别技术的重要性。为此,腾讯云通用文字识别产品GeneralOCR应运而生,基于行业前沿的深度学习技术,支持将图片上的文字内容智能识别为可编辑的文本,大幅提升信息处理效率。而ServerlessFramework与OCR的结合,则为用户提供
Wesley13 Wesley13
4年前
ubuntu 十分钟后提醒我
ubuntu十分钟后提醒我背景非常受用windowsphone上cortana的语音指令:十分钟分钟后叫我起床。一小时后提醒我做XXX。思路ubuntu下语音识别很难搞,只好搞了个命令行的东西来做几分钟后提醒我这样的事情。几分钟后干什么,用程序实现起来很容易。golang的time.after\_func就可以。然
Stella981 Stella981
4年前
Sensory发布新的语音自拍APP
在自拍的时候我们经常会碰到如何处理手指不要遮挡摄像头,同时又要能够方便的按钮或触控屏幕来触发快门。Sensory新的Android平台语音自拍APP最近发布了新的,支持自定义语音命令(customphrases)。新的软件同样是基于SensoryTrulyHandsFree技术开发。新版本在支持预先设定语音命令(preset
不是海碗 不是海碗
2年前
看懂二维码识别OCR:从算法到API 接入代码
引言二维码识别OCR(OpticalCharacterRecognition)是结合了图像处理和OCR技术,以识别和提取二维码中的信息的技术,二维码识别OCR可以实现对图像中的二维码进行自动检测和解码,并将其内容提取为可编辑的文本,这种技术在许多领域中被广
数据堂 数据堂
2年前
人脸识别技术在智能交通管理中的应用
人脸识别技术在智能交通管理中也有着广泛的应用。在智能交通监控方面,人脸识别技术可以帮助交通管理部门实时监测交通情况、发现交通问题等。在智能交通执法方面,人脸识别技术可以帮助交通管理部门更加精准地发现交通违法行为、提高交通执法效率等。在智能交通管理中应用人脸
幂简集成 幂简集成
6个月前
2025年最佳可免费试用的AI语音生成API:一个报表10个维度29项指标对比
AI语音生成API是一种基于人工智能技术的工具,能够自动生成自然流畅的语音输出,广泛应用于客户服务、内容创作和智能设备等领域。其重要性在于提升用户体验和提高交互效率。在选择AI语音生成API时,我们提供一份深度比较报告,从产品优势、产品特性、扩展性与高级功
数据堂 数据堂
1个月前
版权数据集上新 | 覆盖大模型、多模态大模型、语音识别、语音合成及计算机视觉等多领域
近日,数据堂发布全新数据产品,覆盖多语种大模型预训练、多模态大模型、语音识别及计算机视觉等多个前沿方向。所有数据集经严格标注与质量控制,提供商业级使用授权且已获得科研使用许可,知识产权归属清晰可溯,可为企业及研发团队提供大规模、多样化、合规可靠的数据资源,有效助力大模型与AI技术迭代升级,赋能全球应用场景创新。