你的双11,买买买。而阿里海报设计师的双11,在一个名为「资源位小组」的小黑屋连续通宵加班。 做海报、改文字、换商品、调设计、换banner,每个设计师对接几个运营人员,富士康流水线一样的重复性工作。一年双11下来,完成上亿张海报。 然而,这一切正在成为过去。AI 改变了围棋,现在也在改变海报设计。 这是一个名为「鲁班」的AI 设计师,没错,它将担纲今年双11的banner海报设计,数量高达4亿张。 但考虑到鲁班平均1秒钟就能完成8000张海报设计,一天可以制作4000万张,4亿只能算一个小小小小目标。 本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处。 鲁班 这个海报设计AI「鲁班」,诞生也与双11有关。 每年双11,都是阿里设计师的大考:海量的设计需求,需要保证所有人都统一规范;遇到紧急设计需求,还要快速出稿,对每一个设计师都是脑力、体力双重考验。
△ 千人千面需求的banner设计 于是,2015年双11后,阿里内部开始萌生想法,当年阿里正式在商品推荐上实现「千人千面」,所以希望强营销导向的广告资源位的设计也能实现「千人千面」。 因此「鲁班」项目正式成立,并不断发展至现今的「阿里智能设计实验室」。 当时正值AlphaGo 摧枯拉朽,将深度学习和AI 传播开来,阿里内部也决定进一步把鲁班打造成一个AlphaGo一样的AI设计师。 进而开始搭建神经网络,让鲁班学习人类设计师的成果和经验,不断进化,直到今年双11,鲁班的水平已经达到了阿里内部P6水准。 鲁班的学习进化,主要有三大技术原理。
三大核心模块 鲁班从0到P6,自学设计能力主要看三大模块:风格学习(规划+元素)、行动器,以及评估网络。 1. 风格学习模块
△ 鲁班风格学习 鲁班先将大量设计素材的设计数据进行结构化标注,最后经过一系列的神经网络学习,输出空间+视觉的设计框架。 框架设计中,首先通过人工标注的方式,让机器理解该幅设计有哪些元素组成,比如它的商品主体,花的背景,蒙版。 往上一层,还需要通过设计的经验知识,定义一些设计的手法和风格。手法指的是这些元素为什么可以这么构成。 最上面这一层是风格,当这些元素构成之后,它从美学或者视觉角度看是一个什么感受,让机器知道它是用什么组成。 下一步是准备设计的原始文件,比如一系列花朵和设计方法,输入到深度学习网络中。该网络具备一定记忆功能,可以记住设计步骤中复杂的过程。 经过这层神经网络学习之后,会得到一个设计框架。从技术上理解,它是一堆空间特征和视觉特征构成的模型。从设计师的视角来看,它相当于设计师脑里在做一组设计之前那个大概的框架印象。
在设计框架的同时,元素中心也在批量输入元素(如底图、主产品图、修饰元素等),由元素分类器进行学习,按照视觉特征和类型分类。 具体来说,鲁班团队会提前收集一些版权图库,以及自己造设计元素的方式,输入到元素分类器中。这个分类器会把这些元素分布到各个类型里,比如背景、主体、修饰,也会完成图片库的提取。 2. 行动器
△ 鲁班行动器元素分类 行动器的主要作用,是根据需求从风格学习模块中选择设计原型,并从元素中心中选取元素,规划出多个最优生成路径,完成图片设计。 这与设计师实际工作过程非常相似,如设计师要设计一朵花,也会在软件里会不断去调每个位置、每个像素、每个角度。同时,整个过程也是一个强化学习的过程,行动器会在不断试错中更聪明、更智能。 此过程完成后,将输出多个设计图,并最终交给「评估网络」对输出产品进行评分。 3. 评估网络
△ 鲁班评估网络 评估网络的工作原理是输入大量的设计图片和评分数据,经过训练后,让机器学会判断设计的好坏。 (责任编辑:admin) |