OpenMMLab学习笔记(一)
day01 计算机视觉与OpenMMLab开源算法体系
1. 基本知识
计算机视觉的基础任务:分类、分类和定位、物体检测、分割(语义分割、实例分割),其中实例分割统一种类索引不同

注意语义分割和实例分割的区别

计算机视觉的应用:
-
无人驾驶中的感知
-
动漫特效
-
航拍
-
虚拟主播(小冰等)
-
视频理解与视频剪辑(找出跳水运动员的精彩瞬间)
计算机视觉的发展
- 早期萌芽(物体检测算法、三维视觉理论)
- 统计机器学习与模式识别(人脸识别,利用小波特征结合级联分类器)
- 传统的视觉特征:局部二值模式(Local Binary Pattern)、尺度不变特征转换(Scale Invariant Feature Transform)
、梯度方向直方图(Histogram of Oriented Gradients)
- 深度学习时代
- 李飞飞创立的ImageNet数据库具有重要意义
- 涌现出AlexNet、Fast R-CNN和深度对抗网络等模型
- 现有流行方向
- 文字生成图片
- 神经渲染三维重建CityNeRF
2. OpenMMLab总体框架概览
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0FkBcIGy-1675347245650)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215229660.png)]](https://img-blog.csdnimg.cn/4ff2a5e186a1496ea8526cb378596501.png)
OpenMMLab包含目标检测、实例分割和全景分割等模块,拥有众多的模型库:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xXbc7rtd-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215341258.png)]](https://img-blog.csdnimg.cn/18d95b50b77e4344b9cdbe1621a38422.png)
3. OpenMMLab2.0
2.0在之前的基础上增加了很多算法框架和优化了相应的基础库:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v8s60ccp-1675347245652)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215519367.png)]](https://img-blog.csdnimg.cn/452e331b735a432f9c578231b6b48fe9.png)
4. 机器学习基础
机器学习主要包括:监督学习、无监督学习和强化学习
机器学习中的分类问题:垃圾分类
机器学习的基本流程:

神经网络:


![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wkEbqhMv-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215915291.png)]](https://img-blog.csdnimg.cn/4a8491691a0443c2bc6c2b2dd46ad622.png)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D22oJfJD-1675347245655)(/home/liuhao/.config/Typora/typora-user-images/image-20230202215930471.png)]](https://img-blog.csdnimg.cn/4c69ca24de6c42108353dce23bd0df1a.png)
训练结果的评价指标:

过拟合的解决方案:早停

5. 卷积神经网络

卷积的过程:


激活层和激活函数


池化层和全连接层:


输出层:

6. pytorch相关
自动求导demo:

torch重要的函数都在nn.functional中:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CNoCRvFg-1675347245661)(/home/liuhao/.config/Typora/typora-user-images/image-20230202220704278.png)]](https://img-blog.csdnimg.cn/1f3a1b2197e24834956d5e04a993a0d8.png)
7. 小结
第一课算是通识课程,对各方面都做了概述,从计算机视觉的定义等基本概念到OpenMMLab再到Pytorch相关内容都认真的进行了讲解。这一课,我们对计算机视觉有了初步的认识,然后对OpenMMLab框架进行了讲解,OpenMMLab包含的众多算法框架和易于使用的接口能够极大缩短开发时间。对于OpenMMLab2.0,算法框架又进一步获得了完善和框架的整体性能也大幅提升,最后我们学习了机器学习和卷积神经网络的基本知识,了解了卷积、池化和全连接等基本概念,最后结合pytorch讲述了算法的训练和推理过程中的相关知识。



















