File size: 10,450 Bytes
d04a18c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168

<div align=center>
<img src="https://raw.githubusercontent.com/datawhalechina/dive-into-cv-pytorch/master/markdown_imgs/whale_pytorch.jpg" width="250">
</div>

# Dive-into-CV-PyTorch

本项目《动手学CV-Pytorch版》是Datawhale:whale:CV小组的一个重点项目,我们旨在构建一个以Pytorch为框架,强调动手实战的计算机视觉教程项目,帮助大家更好的学习。

项目大体上会按照计算机视觉的不同领域和应用场景进行章节划分,循序渐进,带领大家走进CV的世界,以动手实战的方式,从入门到进阶。

目前已经完成的内容包括:`预备知识``图像分类入门``目标检测入门``生成式对抗网络入门``CV中的Transformer`四个章节,后续的章节敬请期待。相信随着项目的推进,你我将互相见证彼此的进步。

## 食用方法

:whale: 推荐使用 [**动手学CV-PyTorch 在线阅读**](https://datawhalechina.github.io/dive-into-cv-pytorch) 进行学习

有配套代码的章节,可以在项目`code`目录的相应章节目录下面找到。

以下是目录与代码更新进度

## 动手学CV-Pytorch 目录

* 第一章: 预备知识
    - [x] [1.1 深度学习环境配置](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter01_preliminary_knowledge/1.1_environment_install/README.md)
    - [x] [1.2 Pytorch基础使用介绍](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter01_preliminary_knowledge/1.2_pytorch_basic_usage_introduction/README.md)
    - [x] [1.3 自动求梯度](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter01_preliminary_knowledge/1.3_automatic_gradient/README.md)
    - [x] [1.4 线性回归-小试身手](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter01_preliminary_knowledge/1.4_linear_regression_pytorch/README.md)
    - [x] [1.5 初识图像分类:MNIST分类实战](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter01_preliminary_knowledge/1.5_mnist_classification/README.md)

* 第二章: 图像分类入门
    - [x] [2.1 数据读取与数据扩增](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter02_image_classification_introduction/2.1_dataloader_and_augmentation/README.md)
    - [x] [2.2 图像分类介绍](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter02_image_classification_introduction/2.2_introduction_of_image_classification/README.md)
    - [x] [2.3 模型训练与验证](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter02_image_classification_introduction/2.3_model_training_and_verification/README.md)
    - [x] 2.4 天池CV入门赛实战
        - [x] [街景字符识别baseline讲解](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter02_image_classification_introduction/2.4_classification_action_SVHN/baseline.md)
        - [x] [比赛方案与优化技巧总结](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter02_image_classification_introduction/2.4_classification_action_SVHN/ideas_and_tricks_summary.md)
    - [x] [附录A torchvision.transforms速查表](chapter02_image_classification_introduction/appendix/appendixA_data_augment.md)

* 第三章: 目标检测入门
    - [x] [3.1 目标检测基本概念](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_1.md)
    - [x] [3.2 目标检测数据集VOC](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_2.md)
    - [x] [3.3 锚框](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_3.md)
    - [x] [3.4 模型结构](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_4.md)
    - [x] [3.5 损失函数](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_5.md)
    - [x] [3.6 训练与测试](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter03_object_detection_introduction/3_6.md)

* 第四章: 图像分割入门
    - 推进中...

* 第五章: 生成式对抗网络入门
    - [x] [5.1 初识生成对抗网络](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter05_gan/5_1.md)
    - [x] [5.2 GAN实战: 手写数字生成](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter05_gan/5_2.md)
    - [x] [5.3 ConditionGAN实战: 再战手写数字生成](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter05_gan/5_3.md)
    - [x] [5.4 DCGAN实战](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter05_gan/5_4.md)

* 第六章: CV中的Transformer
    - [X] [6.1 你好,Transformer](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter06_transformer/6_1_hello_transformer.md)
    - [X] [6.2 Transformer实战:OCR字符识别](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter06_transformer/6_2_ocr_by_transformer.md)


## 常见问题

- **在线教程页面无法打开**: 

    测试中存在部分人打不开在线教程的情况。

    部分小伙伴反馈尝试切换浏览器后可以正常打开了,如果仍然不行,最有效的解决办法是科学上网。

- **无法加载图片的解决办法**: 

    根本解决办法还是科学上网,也可以尝试修改host文件看下是否能解决。

    [windows解决方案:修改host文件](https://blog.csdn.net/u011583927/article/details/104384169)

- **公式无法正常显示解决办法**    github中的markdown不支持LATEX公式,如果你喜欢在本项目中直接浏览教程,可以安装chrome的`MathJax Plugin for Github`插件让大部分公式正常显示。但是包含公式的章节强力建议使用 [动手学CV-PyTorch 在线阅读](https://datawhalechina.github.io/dive-into-cv-pytorch) 进行学习


## 致谢

感谢以下Datawhale成员对项目推进作出的贡献(排名不分先后):

<table align="center" style="width:80%;">
  <caption><b>贡献者名单</b></caption>
<thead>
  <tr>
    <th>成员</th>
    <th>个人简介及贡献</th>
    <th>个人主页</th>
  </tr>
</thead>
<tbody>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">安晟</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">图像算法工程师,项目负责人 </td>
    <td><a href="https://blog.csdn.net/u011583927">CSDN</a>,   <a href="https://github.com/monkeyDemon">Github</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">闫永强</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">图像算法工程师,3.4、3.5、3.6、6.1节作者</td>
    <td> </td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">宋志龙</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">图像算法工程师,3.1、3.2、3.3节作者</td>
    <td> </td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">沈豪</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">复旦大学网安博士在读,第五章作者</td>
    <td><a href="https://www.zhihu.com/people/shenhao-63">知乎</a>,   <a href="https://github.com/shenhao-stu">Github</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">袁明坤</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">西安电子科技大学硕士,2.1、6.2节作者</td>
    <td><a href="https://blog.csdn.net/my_kun?spm=1011.2124.3001.5113">CSDN</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">王程伟</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">南昌航空大学研究生,1.5、2.1节作者</td>
    <td><a href="https://blog.csdn.net/weixin_40647819">CSDN</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">张强</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">宁波大学计算机硕士,2.2节作者</td>
    <td><a href="https://github.com/QiangZiBro">Github</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">游璐颖</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">福州大学计算机硕士,1.2节作者</td>
    <td><a href="yluy.gitee.io">个人主页</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">李一飞</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">参与1.3、1.4节优化</td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">樊亮</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">1.3节作者</span></td>
    <td><a href="https://blog.csdn.net/OuDiShenmiss">CSDN</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">杨皓博</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">1.4节作者</span></td>
    <td><a href="https://github.com/Dulpyanghaobo">Github</a></td>
  </tr>
  <tr>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">伊雪</span></td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">中电科网安研究院开发工程师,2.3节作者</span></td>
    <td> </td>
  </tr>
  <tr>
    <td>阿水</td>
    <td><span style="font-weight:normal;font-style:normal;text-decoration:none">Datawhale成员,公众号:Coggle数据科学, 为第二章提供部分素材 </td>
    <td><a href="https://www.zhihu.com/people/finlayliu">知乎</a></td>
  </tr>
</tbody>
</table> 


## 关注我们

> "Datawhale是一个专注AI领域的开源组织,以“for the learner,和学习者一起成长”为愿景,构建对学习者最有价值的开源学习社区。关注我们,一起学习成长。"

<img src="https://raw.githubusercontent.com/datawhalechina/dive-into-cv-pytorch/master/markdown_imgs/datawhale_qrcode.jpeg" width="175" height= "200">