预训练模型 十大预训练模型助你学习深度学习

介绍
对于那些想要学习算法或尝试现有框架的人来说,使用预训练模型可以提供很好的帮助。由于时间和计算的诸多限制,不可能随时从头开始训练模型,这就是预训练模型存在的原因。您可以使用预训练作为基准来改进现有模型,或者对照它测试您自己的模型。因此,预训练模式的潜力是巨大的。
汽车分类
https://github.com/michalgdak/car-recognition

预训练模型 十大预训练模型助你学习深度学习


文章图片

众所周知,对一辆车进行分类的方法有很多,比如车身设计风格、车门数量、是否是敞篷车、座椅数量等等。要解决这个问题,需要对车辆图片进行分类,比如考虑品牌的分类、设计图案、年份等等。2012年,特斯拉Model S利用斯坦福大学的车辆数据集开发了这款车型。
特斯拉Model S使用预先训练好的VGG16、VGG19和InceptionV3车型进行训练。因为只有3*3卷积层用于增加深度,所以VGG的简单特征是已知的。这里,16和19分别代表两个VGG网络的层。
因为数据量小,最简单的型号——vgg 16最准确。该神经网络的训练使交叉验证集的准确率达到66.11%。然而,由于偏差方差的问题,更复杂的模型,如InceptionV3的精度较低。
人脸识别与重建
人脸识别在深度学习社区中非常流行。越来越多的技术和模型正以惊人的速度发展,并被应用到人脸识别技术中。它的应用范围也很广,包括但不限于手机解锁、人群检测、基于人脸的情感分析等等。
另一方面,人脸重建是指从人脸特写图像到人脸三维建模图像的生成过程。从二维信息创建三维结构化对象是工业界非常关注的另一个问题。人脸重建广泛应用于电影和游戏行业。许多CGI模型已经能够实现自动化,从而在人脸生成过程中节省了大量的金钱和时间。
本文的这一部分将讨论这两个领域中使用的预训练模型。
VGG-面子模型
https://gist . github . com/EncodeTS/6bb E8 CB 8 bebad 7a 672 f 0d 872561782d 9

预训练模型 十大预训练模型助你学习深度学习


文章图片

从头开始创建人脸识别模型实际上是一项艰巨的任务。为了最终建立一个令人满意的模型,你需要搜索、收集和标记大量的图像。因此,在这一领域使用预训练模型是非常合理的。
VGG人脸是一个拥有200多万张人脸图像和2622个独立身份的数据集。预训练模型通过以下方法构建:
Vgg-face-keras:直接将Vgg-face模型转换为keras模型
Vgg-face-keras-fc:首先将vgg-face Caffe模型转化为mxnet模型,再转化为keras模型
基于单幅图像的三维人脸重建
https://github.com/dezmoanded/vrn-torch-to-keras

预训练模型 十大预训练模型助你学习深度学习


文章图片

这是一个非常酷的深度学习的成果。从上面的图像可以推断出如何将面部特征重建成3D 空模型。这种预训练模型最初是由Torch实现的,后来被转化为keras模型。
图象分割法
语义图像分割–deep labv 3+
https://github.com/bonlime/keras-deeplab-v3-plus

预训练模型 十大预训练模型助你学习深度学习


文章图片

语义图像分割是指为图像的每个像素分配语义标签的任务。这些语义标签可以是“day 空”、“car”、“road”、“长颈鹿”等等。这项技术需要做的是找到物体的边界,因此需要对精度要求进行约束。
Deeplabv3是谷歌最新的语义图像分割模型。它最初由TensorFlow实现,并已由keras实现。这个GitHub库包含了如何获取标签的代码,如何使用自定义类别号的预训练模型,当然还有如何跟踪自己的模型。

推荐阅读