计算机在识别图像时“看到”了什么?

多态棱镜
• 阅读 4252

图像识别技术近来进步飞速。去年,微软和谷歌展示了能比人类更准确地识别图像的系统。

这些进步得益于一个叫做深度学习的技术,它涉及将数据通过模拟神经元的网络,以培养该网络在未来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可以使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的原因。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至可以彻底改变医学(更多信息)。

计算机在识别图像时“看到”了什么?

图像识别技术的能力和灵活性来自于, 当人工神经网络收到很多图像和图像类别的信息时,它可以自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不同的层,数据一层一层根据顺序通过。在训练过程中,在神经网络中的不同的层成为专门识别不同类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。

“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,因为它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经需要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出很多有用的产品。

当蔡勒还是一个研究生的时候, 他在纽约大学与罗博·宏泰合作开发了一种可视化神经网络运作的方法。在这个链接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,打败了人类的图像识别神经网络。该网络识别了 1000 个截然不同的物件,包括蚊帐和蚊子,而幻灯片上显示了每个图像中最强烈的激活神经元网络的一个网络层的视觉特征。

原文链接:https://www.technologyreview.com/s/60111...

点赞
收藏
评论区
推荐文章
Stella981 Stella981
3年前
Kaggle新上比赛:Google AI发起地域包容性图像识别竞赛
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)昨天Kaggle新上了一个关于图像识别的比赛,GoogleAI发起了地域包容性图像识别竞赛(InclusiveImagesCompetition),旨在探索图像识别在数据采集地域分布不一致的情况下模型的包容性(Inclusive)。众所周知,正是由于类似ImageNet这样的大规模
使用深度学习进行图像分类
解决任何真实问题的重要一步是获取数据。Kaggle提供了大量不同数据科学问题的竞赛。我们将挑选一个2014年提出的问题,然后使用这个问题测试本章的深度学习算法,并在第5章中进行改进,我们将基于卷积神经网络(CNN)和一些可以使用的高级技术来改善图像识别模型的性能。大家可以从https://www.kaggle.com/c/dogsvscats/data下载数
使用深度学习进行图像分类
使用深度学习进行图像分类解决任何真实问题的重要一步是获取数据。Kaggle提供了大量不同数据科学问题的竞赛。我们将挑选一个2014年提出的问题,然后使用这个问题测试本章的深度学习算法,并在第5章中进行改进,我们将基于卷积神经网络(CNN)和一些可以使用的高级技术来改善图像识别模型的性能。大家可以从https://www.kaggle.com/c/dogsvs
深度学习与图神经网络学习分享:CNN经典网络之-ResNet
深度学习与图神经网络学习分享:CNN经典网络之ResNetresnet又叫深度残差网络图像识别准确率很高,主要作者是国人哦深度网络的退化问题深度网络难以训练,梯度消失,梯度爆炸,老生常谈,不多说!深度网络的退化问题(htt
深度学习|会开发AI的AI:超网络有望让深度学习大众化
会开发AI的AI:超网络有望让深度学习大众化超网络(hypernetwork)可以加快训练AI的过程。编者按:在执行特定类型任务,如图像识别、语音识别等方面,AI已经可以与人类相媲美了,甚至有时候已经超越了人类。但这些AI事先必须经过训练,而训练
数据堂 数据堂
1年前
语音识别技术的优化与发展趋势
一、引言语音识别技术是一种将人类语音转化为计算机可理解数据的技术。随着人工智能和深度学习的发展,语音识别技术取得了显著的进步。本文将探讨语音识别技术的优化与发展趋势。二、语音识别技术的优化1.模型优化:针对模型结构的优化是提高语音识别技术的重要途径之一。研
数据堂 数据堂
1年前
情感语音识别的现状与未来趋势
一、引言情感语音识别是一种涉及多个学科领域的前沿技术,包括心理学、语言学、计算机科学等。它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别的现状与未来趋势。二、情感语音识别的现状技术发展:随着深度学习技术的不断进步,情
崇恩圣帝 崇恩圣帝
1年前
识别汉字验证码的方法与实现
识别汉字验证码是一项具有挑战性的任务,因为汉字的复杂性和多样性使得传统的图像识别技术往往难以准确识别。本文将介绍一种基于深度学习的方法来识别汉字验证码,并提供完整的代码示例,让读者能够轻松地运行和测试。1.数据收集与预处理首先,我们需要收集大量的汉字验证码
多态棱镜
多态棱镜
Lv1
走向大海,才知道珍惜港湾的宁静。
文章
3
粉丝
0
获赞
0