当前位置:网站首页>OpenMMLab简介
OpenMMLab简介
2022-08-02 13:39:00 【fengbingchun】
OpenMMLab是一个适用于学术研究和工业应用的开源算法体系,涵盖了计算机视觉的许多研究课题,于2018年10月启动。主要包括2部分:开源项目和开放数据集。以下内容主要摘自于:https://openmmlab.com/
开源项目:https://github.com/open-mmlab ,包含很多项目,由于每个项目起始开发时间不同,因此各个项目发布版本并不统一,有些项目版本更新较快。而且对于Python、PyTorch、CUDA的版本要求也并不统一,大部分项目需要Python 3.6以上版本,需要PyTorch 1.5以上版本,CUDA可以使用10.2(因为PyTorch各个版本对CUDA 10.2都有支持)。有些项目需CUDA的支持,否则功能会不完善,如MMDetection。支持Windows、Linux和Mac平台。License为Apache-2.0。有些项目之间有依赖关系。从各个项目的名字大体可以看出此项目的主要内容。
1.MMCV:是一个面向计算机视觉的基础库,它支持很多开源项目,如MMDetection、MMOCR等。最新发布版本为v1.6.1。
2.MMDetection:是一个基于PyTorch的目标检测开源工具箱。最新发布版本为v2.25.1。
3.MMDetection3D:是一个基于PyTorch的目标检测开源工具箱,下一代面向3D检测的平台。最新发布版本为v1.0.0rc3。
4.MMEditing:是一个基于PyTorch的图像&视频编辑开源工具箱,支持超分辨率、修复、抠图、视频插值等。最新发布版本为v0.15.1。
5.MMAction2:是一个基于PyTorch的视频理解开源工具箱。最新发布版本为v0.24.1。
6.MMSegmentation:是一个基于PyTorch的语义分割开源工具箱。最新发布版本为v0.27.0。
7.MMClassification:是一个基于PyTorch的开源图像分类工具箱。最新发布版本为v0.23.2。
8.MMPose:是一个基于PyTorch的姿态分析的开源工具箱。最新发布版本为v0.28.1。
9.MMTracking:是一个基于PyTorch的视频目标感知开源工具箱。最新发布版本为v0.13.0。
10.MMOCR:是一个基于PyTorch和MMDetection的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。最新发布版本为v0.6.0。
11.MMGeneration:是一个基于PyTorch和MMCV的强有力的生成模型工具箱,尤其专注于GAN模型。最新发布版本为v0.7.1。
12.MMRotate:是一个基于PyTorch的旋转框检测的开源工具箱。最新发布版本为v0.3.2。
13.MMDeploy:是OpenMMLab模型部署工具箱,为各算法库提供统一的部署体验。最新发布版本为v0.6.0。
14.MMRazor:是一个可用于模型瘦身和AutoML的模型压缩工具箱。最新发布版本为v0.3.1。
15.MMHuman3D:是一个基于PyTorch的人体参数化模型的开源工具箱。最新发布版本为v0.9.0。
16.MMSelfSup:是一个基于PyTorch实现的开源自监督表征学习工具箱。最新发布版本为v0.9.2。
17.MMFlow:是一个基于PyTorch的光流工具箱。最新发布版本为v0.5.1。
18.MMFewShot:是一个基于PyTorch的少样本学习代码库。最新发布版本为v0.1.0。
开放数据集:不支持匿名下载
1.DeeperForensics-1.0 Dataset:是用于现实世界中人脸伪造检测的新数据集。
2.FineGym:一个基于体操运动视频建立的新数据集。
3.MovieNet:是用于全面理解电影的数据集。
4.MessyTable:包含大量从多个摄像机视图中捕获的混乱的桌子的场景。
5.Placepedia:包含24万个地点,其中包含来自世界各地的3500万张图片。
6.TAPOS:是一个基于体育视频构建的,带有子动作人工标注的新数据集。
7.CULane:是一个大规模的极具挑战性的车道线检测学术数据集。
8.DeepFashion Dataset:是一个大型服装数据库。
9.FashionGAN Dataset:是基于DeepFashion数据集的子集上新标注(语言和分段映射)的数据集。
10.kinetics-skeleton:是一个基于骨骼的人体理解的数据集。
11.OST dataset:室外场景数据集。
12.Web Image Dataset for Event Recognition(WIDER):是用于从静态图像识别复杂事件的数据集。
13.Wider 2019:数据集围绕人脸和身体的精确定位以及身份的精确识别这一问题。
14.WIDER ATTRIBUTE Dataset:是人类属性识别基准数据集,其图像是从可公开获得的WIDER数据集中选择的。
15.WIDER FACE Dataset:是一个面部检测基准数据集,其图像是从可公开获得的WIDER数据集中选择的。
16.WildLife Documentary(WLD) Dataset:包含从YouTube下载的15部纪录片,其时长从9分钟到长达50分钟不等,并且总帧数超过747000。
17.CUHK Face Sketch FERET Database(CUFSF):用于人脸素描合成和人脸素描识别的研究。
18.CUHK Image Cropping Dataset:该数据集提出了一种自动图像裁剪的方法。
19.CUHK-PEDES:一个大型的人形描述数据集,其中包含来自各种来源的人形图像详细信息的语言标注。
20.Expression in-the-Wild(ExpW) Dataset:包含91793个手动标记了表达式的面部。
21.General 100 Dataset:包含100个bmp格式的图像(无压缩)。
22.LPW:收集于三个不同的拥挤场景中。
23.MIT Trajectory Dataset(Single Camera):用于研究以对象轨迹为特征的单个摄像机视图中的活动分析。
24.Multi-Task Facial Landmark(MTFL) Dataset:用于训练人脸界标检测的多任务深度模型。
25.Pedestrian Color Naming Dataset:包含14213 张图像,每张图像均用每个像素的颜色标签进行了手工标记。
26.Social Relation Dataset:根据凯斯勒(Kiesler)提出的人际关系圈来定义社会关系特征,其中人际关系被分为16个部分。
27.The Comprehensive Cars(CompCars) dataset:包含来自两种方案的数据,包括来自网络和监控的图像。
28.Visual Discriminative Question Generation(VDQG) Dataset:包含从Visual Genome收集的11202个模糊图像对。
29.WWW Crowd Dataset:是具有人群属性标注的最大人群数据集。
30.OmniSource:是一个以Kinetics-400类名称作为查询的多元化Web数据集。
31.ForgeryNet Dataset:是一个大型面部伪造数据集,它在四个任务中对图像和视频级数据进行统一的标注。
另外在知乎https://www.zhihu.com/people/openmmlab 上也有很多技术文章。
边栏推荐
- Get out of the machine learning world forever!
- 百日刷题计划 ———— DAY1
- 图论之Floyd,多源图最短路如何暴力美学?
- How to create short images and short videos from the media?How to make the click volume reach 10W?
- 软件测试和硬件测试的区别及概念
- tinymce-plugins
- 【C语言】剖析函数递归(3)
- leetcode 504. Base 7 七进制数 (简单)
- Do you know Dijkstra of graph theory?
- js array recursively use
猜你喜欢
随机推荐
Get out of the machine learning world forever!
永远退出机器学习界!
为什么四个字节的float表示的范围比八个字节的long要广
Enterprise Network Planning Based on Huawei eNSP
Selenium本地打开远程浏览器
Singleton pattern of seven kinds of writing, you know?
[b01lers2020]Welcome to Earth-1
Do you know Dijkstra of graph theory?
86.(cesium之家)cesium叠加面接收阴影效果(gltf模型)
[b01lers2020]Welcome to Earth-1
els 长条方块变形条件、边界碰撞判定
How to do short video food from the media?5 steps to teach you to get started quickly
鲲鹏devkit & boostkit
RestTemplate 使用:设置请求头、请求体
短视频美食自媒体怎么做?5步教你快速上手
k8s之KubeSphere部署有状态数据库中间件服务 mysql、redis、mongo
Oracle数据库的闪回技术
uniapp/小程序 onload方法每次打开页面都执行解读
Word | 关于删除分节符(下一页)前面的版式就乱了解决方案
【C语言】夏日一题 —— 求最大公约数和最小公倍数