ModelScope 垂类检测系列模型介绍

银装素裹
• 阅读 268

ModelScope介绍

ModelScope 是阿里达摩院推出的 中文版模型即服务(MaaS, Model as a Service)共享平台。该平台在2022年的云栖大会上发布,之前也有大量的PR文章进行介绍和推广(如:官方介绍CSDN文章 等),这里就不再赘述。

作为其中的一个贡献者,刚开始接触ModelScope,给我的第一感觉就是,这不就是一个中文版的Hugging Face 嘛,还有必要再搞一个这个东西吗?我从心理是抗拒的。但是后(gong)来(zuo)想(suo)想(po),之前的淘宝,QQ,百度等,也是效仿而来,虽然不像ChatGPT, AlphaGo这样的开创性工作一样令人震撼,但至少也是针对国内使用者做了一些改良。当然,我从心底里佩服能够做出ChatGPT, AlphaGo这样工作的人,也希望国内能有一些这样重量级的工作出现。

话说回来,仔细想想,ModelScope相比Hugging Face做了哪些适合“国情”的改良呢?我能够想到的有下面几点:

  • 首先是中文,虽然说对于专业的开发者,查找和阅读英文文档是一个必备的技能,但是有一个中文的平台作为参考和对比,当然也没什么坏处,另外,在AI这个领域,还有还有大量的初级入门者和非专业的开发者,这样的中文平台对他们而言更加友好;
  • 其次是模型种类,Hugging Face本身是从NLP的Transformer“发家”,一些做CV的朋友甚至都不知道它的存在。而ModelScope除了在NLP,在CV, Audio, Multimodal等领域也有不少的模型,没有对NLP明显的侧重;
  • 再者是机器资源,目前处在推广阶段,每位开发者都可以使用阿里云上免费的CPU/GPU机器进行开发,可以从每个模型主页右上角的Notebook选项中进入,是薅羊毛的不二之选;
  • 最后是网络流畅度,相比Hugging Face,ModelScope在网页浏览、模型下载、数据集下载等方面,显然是更加顺畅的。

ModelScope也存在一些明显的不足:

  • 贡献者欠缺,作为一个社区,当然需要更多开发者的贡献,虽然目前也有一些生态伙伴在上面进行模型贡献,但是大部分的模型还是达摩院自研/搬运的模型,如何能够使开源者在github开源的同时也上线到ModelScope,是一个值得考虑的问题;
  • 模型影响力欠缺,作为一个中文的模型即服务平台,ModelScope上还欠缺有影响力的模型,很多国内的优秀工作也没有上线到这里;
  • 代码一致性保障困难,ModelScope是一个“all in one”的仓库,内部和外部的人均能贡献,同一领域的代码风格统一以及模型结构复用等都是很有挑战的。

垂类模型介绍

我们在ModelScope上贡献的垂类模型(垂直领域的热门检测模型)包括:人体部位(人体、人手、人头)和垂类物体(口罩、安全帽、香烟、手机、交通标识等)检测模型,从某种程度上来说,也算是和Hugging Face的一个差异点(Hugging Face 物体检测相关的模型更多是通用的物体检测模型,没有垂类模型)。垂类模型的入口如下图所示: ModelScope 垂类检测系列模型介绍 目前,ModelScope上已经有的垂类模型如下表所示,我们也还在逐渐丰富模型中。

序号 模型名称 序号 模型名称
1 实时人体检测模型 6 实时香烟检测模型
2 实时人头检测模型 7 实时手机检测模型
3 实时手部检测模型 8 实时交通标识检测模型
4 实时口罩检测模型 9 Coming soon
5 实时安全帽检测模型

调用方式

1 Demo Service

在每个模型主页的右侧,有demo service的区域,可以上传本地的图片,对模型进行测试,如下图所示:

ModelScope 垂类检测系列模型介绍

2 Notebook

使用免费的线上机器资源,开启薅羊毛模式,如下图所示。启动对应的实例之后,可以在机器实例中,进行范例代码的运行,也可以搭建自己的服务。 ModelScope 垂类检测系列模型介绍

3 本地使用

如果有本地的机器资源的话,也可以直接pip安装modelscope库,就能够在本地进行使用了。具体可以参考安装教程

* 二次开发

如果需要对现有的模型进行微调(finetune),可以参考每个模型的<微调代码范例>部分,准备好用于微调的数据之后即可对模型进行微调。

总结

垂类检测系列模型是我们在ModelScope上一个初步的尝试,也是针对与Hugging Face差异化做出的一点探索,欢迎大家适用并提出一些建议。我们会继续丰富和完善上面的模型。

点赞
收藏
评论区
推荐文章
GoCoding GoCoding
3年前
TorchVision Faster R-CNN 微调,实战 Kaggle 小麦检测
本文将利用TorchVisionFasterRCNN预训练模型,于Kaggle:全球小麦检测(https://www.kaggle.com/c/globalwheatdetection)🌾上实践迁移学习中的一种常用技术:微调(finetuning)。本文相关的KaggleNotebooks可见:TorchVis
Stella981 Stella981
2年前
PaddlePaddle预训练模型大合集,还有官方使用说明书
PaddlePaddle在不断增加官方支持的模型的同时,也在关注预训练模型的丰富度。在过去的版本中,我们已经发布了目标检测FasterRCNN、MobileNetSSD、PyramidBox和场景文字识别CRNNCTC、OCRAttention共计5个预训练模型。近期,在图像分类领域我们一口气发布了四个系列共十个预训练模型,丰富扩充了预训练模
Stella981 Stella981
2年前
OpenCV检测轮廓极点(Python C++)
    今天分享一个OpenCV检测轮廓极点实例,原图如下,我们需要检测出地图中最大轮廓的上下左右四个极点,并进行标注显示。!(https://oscimg.oschina.net/oscnet/ae374a72c5404b00b0e976e499eedf36.png)    第一步:阈值处理分割出地图轮廓!(ht
Stella981 Stella981
2年前
NanoDet:这是个小于4M超轻量目标检测模型
摘要:NanoDet是一个速度超快和轻量级的移动端Anchorfree目标检测模型。前言YOLO、SSD、FastRCNN等模型在目标检测方面速度较快和精度较高,但是这些模型比较大,不太适合移植到移动端或嵌入式设备;轻量级模型NanoDetm,对单阶段检测模型三大模块(Head、Neck、Backbone)进行轻量化
Stella981 Stella981
2年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
2年前
TP3快速入门
一、查询  D方法实例化模型类的时候通常是实例化某个具体的模型类,如果你仅仅是对数据表进行基本的CURD操作的话,使用M方法实例化的话,由于不需要加载具体的模型类,所以性能会更高。$maparray();$map'u.store_id'array('eq',0);$map'u.reg_time'a
Wesley13 Wesley13
2年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Wesley13 Wesley13
2年前
Unity中EventTrigger使用
在Unity中,点击场景中的模型我们往往需要检测是否点击在了UI上,这时我们需要进行一系列的判断,往往效果还不好,因此我在场景中模型的点击也使用了EventTrigger,EventTrigger我们在UI上的使用比较常见,但是它也可以用于场景点击,并且能屏蔽点击到UI又响应了模型的点击事件,以下是点击事件的组件脚本usi
提高IT运维效率,深度解读京东云AIOps落地实践(异常检测篇(二))
时间序列异常检测识别故障对系统的正常运行颇为重要,准确率高的异常检测对系统的稳定性具有重要意义。时间序列的异常检测已经研究了几十年,业界提出了各种有效检测方法。我们提出了一种基于深度学习的时间序列异常检测模型。
笑面虎 笑面虎
5个月前
首个基于Transformer的分割检测+视觉大模型视频课程(23年新课+源码+课件)
首个基于Transformer的分割检测视觉大模型视频课程(23年新课源码课件)分享一套视觉大模型课程——首个基于Transformer的分割检测视觉大模型视频课程,2023年新课,附源码课件。视觉分割旨在将图像、视频帧或点云分割为多个片段或组。
银装素裹
银装素裹
Lv1
年年春日异乡悲,杜曲黄莺可得知。
文章
1
粉丝
0
获赞
0
热门文章

暂无数据