吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”

29岁的吉恒杉坐在电脑前,手指轻轻点击鼠标,将屏幕上成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。作为优酷的一名人工智能标注员,他正在训练机器识别何为“接吻”镜头,因此也被戏称为“吻戏鉴定师”。

吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”


文章图片
打开视频网站,不少片花、集锦以及进度条里的剧情提要,都离不开“吻戏鉴定师”的功劳。爱情是影视剧永恒的主题,吻戏往往出现在剧情的高潮。机器对海量视频素材进行扫描,将吻戏等片段快速抓取出来,供小编们加工创作。
人工智能和视频黑科技的应用,不仅提升了用户观看体验,更催生出众多炫酷的新就业岗位:吻戏鉴定师、明星标注师、射门投篮视频分析员……既对娱乐、体育感兴趣又精通技术的“程序猿”,成为视频网站最紧缺的人才,也折射出新经济、数字经济崛起带来的就业新变化。
“刚开始我和女朋友说,我的工作是训练计算机识别出吻戏镜头,她听完觉得特别不可思议,谁能给钱让你干这个呢?”

吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”


文章图片
吉恒杉2016年毕业于北京航空航天大学,硕士学的是计算机视觉,通俗地讲,这个专业的目的是“教电脑看懂世界”。毕业后,他先在一家互联网公司做程序员,去年9月加入阿里巴巴技术团队,成为优酷的一名高级算法工程师,主要工作是教计算机识别接吻等场景,也被称为“吻戏鉴定师”。
“这个岗位正好和我的专业吻合,给大家传递快乐和幸福,又能以工作的名义看网剧,我特别喜欢。”谈起自己的工作,吉恒杉一脸笑容。他平时爱看网剧,最喜欢《军师联盟》,是吴秀波的铁粉。

吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”


文章图片
十年来,我国网络视频内容消费用户达到近6亿。“身边越来越多的人用手机和电脑看网剧、电影和体育比赛,每次上下班坐地铁,都能看到有人拿着手机、带着耳塞看视频。”吉恒杉发现,大家的需求不再是简单地看剧,还想看更精彩有趣的片段、集锦,更主动地找到自己最想看的明星或者场景。
要想实现搜索和智能编辑,就得训练机器从海量的素材中找出相应的场景,并打上标签,就像从茫茫海洋中挑出螃蟹和海龟。男女主角的“吻戏”传递出美好和幸福,一般是剧情发展的高潮,因此成为剧集中最常见的标签,如何教机器识别接吻成了吉恒杉和同事们首要的难题。
这项看上去高冷的人工智能黑科技,在最初的环节真的需要不少“人工”。吉恒杉从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面。这个过程叫做“数据标注”。
“一天要标注几百张接吻的图像,最多时标注上千张,盯着电脑屏幕看一天,最后都有点麻木了。”吉恒杉说,通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。

吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”


文章图片
【吻戏鉴定师 吻戏鉴定师:高冷IT男标注上千幅图片 训练机器识别“接吻”】机器毕竟不是人,对有些复杂情况也无法识别。比如,为了拍出唯美画面,“接吻”这个姿态也千差万别,有的深情对视,而有的若即若离,团队里的“吻戏鉴定师”们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。

推荐阅读