预训练模型 十大预训练模型助你学习深度学习( 二 )


机器手术分割
https://github.com/ternaus/robot-surgery-segmentation

预训练模型 十大预训练模型助你学习深度学习


文章图片

该模型试图解决机器人辅助手术中的医疗设备图像分割问题。问题分为两部分,如下:
二进制分割:图像中的每个像素都将被标记为仪器或背景。
多类分割:将不同的乐器和同一乐器的不同部分从背景中区分出来。
预训练模型基于U-Net网络架构,通过使用LinkNet、TernausNet等先进的神经网络来提高其性能。该模型在8 × 225帧高分辨率立体摄像机图像上进行训练。
其他图像描述

预训练模型 十大预训练模型助你学习深度学习


文章图片

还记得那些给你照片让你描述的游戏吗?这基本上是形象描述。它利用自然语言处理和计算机视觉的结合来生成描述结果。长期以来,这项任务一直是一项具有挑战性的任务,因为它需要具有不带偏见的图像和场景的大数据集。鉴于这些限制,该算法对于任何给定的图像都必须是可行的。
【预训练模型 十大预训练模型助你学习深度学习】现在很多企业都在用这个技术,但是怎么用呢?解决方案在于将给定的输入图像转换成简短且有意义的描述。编码器-解码器框架被广泛用于此任务。图像编码器是一种卷积神经网络。
这是基于MS COCO数据集上的VGG 16预训练模型,其中解码器是用于预测给定图像的描述的长期和短期记忆网络。对于的详细描述和介绍,我们建议您跟进我们关于自动图像描述的文章。
结尾提示
深度学习是一个很难突破的领域,这也是为什么研究者发表了这么多预训练模型的原因。亲自使用它们来理解和扩展我关于对象检测任务的知识。我强烈建议从上面选择一个领域,使用一个给定的模型开始你自己的旅程。
在下一篇文章中,我们将深入研究自然语言处理。如果你对这篇文章和整个系列有任何反馈或建议,请在下面的评论区告诉我们。
原始链接:
https://www . analyticsvidhya . com/blog/2018/07/top-10-预训练-模型-入门-深度学习-第1部分-计算机视觉/
教你使用深度学习,通过简单地连接一个计算机摄像头来进行实时物体检测
教你构建一个很酷的iOS应用,可以实现Prisma风格的迁移
教你在真实图像数据上应用线性滤波器

推荐阅读