2020年,面对新冠肺炎疫情巨大冲击和复杂严峻的国内外环境,人工智能的赋能效应充分发挥。伴随人工智能迈入工业化大生产阶段,夯实人工智能底层创新能力更显迫切。
日前,上海市经信委发布了“2020年度上海人工智能发展十件大事”,在这份极具风向标意义的榜单上,商汤科技启动建设的新一代人工智能计算与赋能平台重点项目名列其中。
占地面积约5.8万平方米,总投资约56亿元,仅用168天就顺利完成结顶。商汤搭建的AI计算平台究竟与传统互联网数据中心(IDC)有何差别?会给商汤自身业务,以及整个人工智能软硬件产业链的国产化带来哪些支撑?针对这些问题商汤科技联合创始人杨帆接受了第一财经专访,阐述了商汤斥巨资搭建新一代AI计算平台背后的底层逻辑和长远思考。
超前预判构筑AI时代的新型数据中心
商汤智能计算中心坐落于上海临港新片区,这座宛若芯片的建筑预计于2021年底投入试运营。项目全部建成后AI计算峰值速度将达到3740 Petaflops(1 petaflop等于每秒1千万亿次浮点运算),成为国际一流的AI计算平台。
在如此短的时间内建设如此大规模的AI计算中心,在国内甚至全世界范围内尚属先例,背后的艰辛也不言而喻。
商汤科技人工智能计算中心效果图
“168天完成开工到封顶,项目建设确实充满挑战,但更大的挑战源自对前沿技术和行业变革认知的提升。伴随着国家2020年初提出新基建战略,以及近期国外相关技术的进展,几乎是最近几个月才有越来越多的人关注超大规模人工智能算力,提出人工智能计算中心的观点。”杨帆告诉第一财经。
事实上早在2018年4月,商汤就开始布局人工智能计算原型机研制项目。在没有任何可供参照的案例经验和实验场地条件下,商汤甚至在总部办公大楼内,牺牲办公空间搭建原型机的核心机房,总投资近7亿元,进行项目预研。
今天商汤在临港建设的人工智能计算中心,正是基于原型机项目建设的研制成果和技术积累。
商汤科技人工智能计算原型机研制项目
“最初进行人工智能计算与赋能平台项目申报时,不少资历丰富的评审专家都表示没有经历过这么大的科研项目。”杨帆表示,早于行业预判并敢于快速布局本身就不容易,还要让周围的人去理解、去相信、去接受也很难,幸运的是商汤做到了。
外界常常将商汤智能计算中心简单理解为IDC,但商汤认为两者有本质区别,并将其首次定义为AI时代的新型数据中心,即人工智能计算中心(Artificial Intelligence Data Center),简称为AIDC。
杨帆表示,IDC更像是一个“数字地产”,本身带来的产业附加值是极低的。而AIDC则从AI的赋能属性出发,帮助更多传统行业提升效率。从国务院印发的《新一代人工智能发展规划》中的战略目标来看,人工智能自身的行业产值和它所带动的其他行业的附加值,大约是一个1:10的杠杆。也就是说人工智能每产生一万元的产能,它实际上对它所服务的行业会带来10万元的经济效益,这是人工智能最大的价值。
“我们希望通过这个平台提升产业效率并带动行业自身需求,触发存量环境下的一个新增长。这其实是中国经济动能转换,迈向高质量发展的一个核心基础。”杨帆表示。
对于商汤而言,AIDC不仅是未来业务破局发展和高速增长的基石,也是商汤支撑芯片国产化、攻关超大模型、以及打造开源算法生态的着力点与破局点。
加速芯片国产化进程
在复杂的国际局势驱动下,加速芯片国产化,实现安全可控,成为中国半导体产业发展的一大目标。反观当下,我国AI产业发展是建立在以英伟达为主的国外企业构建的软硬件生态基础之上,这种依赖性使得我国AI产业的未来发展受制于人,也给供应链安全带来巨大风险。
杨帆认为英伟达芯片之所以能在AI领域处于相对垄断地位,一方面源自国外在集成电路硬件相关技术上领先国内,在芯片制程及制作工艺上存在一定的代差。另一重要原因在于英伟达多年培育积累的强大配套基础计算平台(即CUDA)生态。
在庞大的开发者生态基础上,有为数众多的AI开发者基于CUDA提供的基础计算功能开发出针对不同场景的各类高阶功能封装。开发者大部分是面向具体问题,从价值闭环的角度解决场景需求。所以开发者生态既降低了芯片应用的门槛,又因为在具体行业场景中的价值体现进一步拉动了芯片的需求。
“一个真正好的产品一定不是在实验室里做出来的,他必须要经过市场的打磨,才能变得更好。”杨帆说道。商汤智能计算中心可以给专注于半导体技术本身的国产芯片厂商提供从场景需求牵引,到软件价值生态全链条的配套支持。
这如同提供了一整套高质量的考卷,上面所包含的考题足够多,难度足够大,案例足够复杂,区分度足够明显,只有答好并通过这套综合试卷的检验,国产化芯片厂商才能从众多竞争者中脱颖而出。
“国外芯片头部企业背后都有一个强大的生态体系进行支撑。而国内的现状是专注应用场景的算法厂商较少涉足芯片领域,而芯片厂商反过来又很难接触到行业一线的反馈,没有形成一个迭代的良性闭环,但这恰恰是AI生态建立的必由之路。”杨帆表示,商汤希望通过自己的经验积累与快速迭代,为二者建立一座连接的桥梁,推动国内AI生态的建立。
据了解,到2024年所有服务器全部到位的时候,商汤智能计算中心国产化的硬件比例将超过50%。
商汤AIDC对算力的海量需求可以为各类国产芯片提供大规模应用的环境,真实从需求端拉动国产芯片的大规模发展,助力国产化芯片市场化打磨,从而对国产化芯片的研制形成体系性支撑。
攻关AI超大模型训练
超大规模预训练模型是当前AI领域研究热点。2020年7月,国际知名科研机构OpenAI发布的具有1750亿参数量的GPT-3模型具备着通用性以及零样本泛化的能力,构建起了其在自然语言处理领域的超大模型研究技术垄断。2021年1月,Google发布了自然语言模型Switch Transformer,参数量更是达到万亿规模。
从技术研究视角而言,超大模型是下一个促进技术突破的关键点,也是构建起算力壁垒和性能壁垒的核心。“解决特定行业中的多场景长尾算法需求,需要用足够多的数据、足够大的算法,去训练一个足够大的通用模型,然后在通用模型下再去做小的场景模型,成本就会降低。”杨帆告诉第一财经。
但不容忽视的是,支撑超大模型训练所需要付出的算力成本也是惊人的。2019年,微软与人工智能研究实验室OpenAI共同规划构建的Azure人工智能算力平台为例,投资规模就达到10亿美元。此外,仅仅是完整训练一遍GPT-3这样的超大模型就需要花费1200万美元。
对此杨帆认为,“这并不意味着国内企业做数字化转型升级都需要去做这样大的一个投入。在这个过程中,需要将算力变成公共基础设施,集约化的去做产业升级。”而以上海为龙头的长三角区域,乃至整个国家的数字化转型,正是需要这样的“新基建”投入,让开发者、数据科学家和商业客户都可以低门槛应用AI,加速新产业应用场景的出现和技术落地。
值得关注的是,商汤已经在超大模型技术研究方面取得一定成绩。例如在计算机视觉的卷积神经网络(CNN)领域,通常模型参数都在1亿以下,商汤的AI框架SenseParrots支持50亿参数超大视觉模型的训练。
商汤将在现有积累上,持续推进计算机视觉超大模型无人区技术探索输出超大规模神经网络设计研发体系,构建高精度模型壁垒,推动整个视觉领域的性能边界突破。以CNN领域为例,商汤AIDC完全投入使用后,计划支持的超大视觉模型训练参数可达更高的数量级。
开源算法生态助力“新基建”
不同于互联网时代开源软件框架,AI时代开源的核心是算法。以往的互联网企业做数字化,主要是给企业提供一个信息化的基础设施,剩下的信息化工作由企业自己完成。
但AI时代真正能给寻求AI产业升级的客户带来闭环价值的,是整个应用闭环的场景落地能力。因此单纯开放一个训练框架,没有生态的牵引与配合,难以给整个产业升级带来很大的价值。
“算法、算力、数据之外,应用才是所有东西更有价值的部分,而应用的解决离不开超大算力支撑、海量算法的生态建设以及数据的安全保护。”杨帆告诉第一财经。
例如在智慧城市场景下,伴随城市数字化进程加深,城市治理开始从以人为主,拓展至对城市物体、事件的关注。如共享单车违停、泥头车违规抛洒、高空抛物等一直困扰着城市居民和管理者的城市治理问题,都需要AI提供新的解决思路。
在这个背景下,算法的工业级生产能力变成AI深入长尾场景,完善客户价值闭环的关键。
商汤很早就意识到这一问题,在开源算法领域进行了多年探索,并打造了OpenMMLab人工智能算法开源体系,涉及了超过10个研究方向,开源了超过130种算法、1000种预训练模型。从2018年10月启动至今,OpenMMLab已经在GitHub累计收获30000个关注,遥遥领先于其他单个垂直领域的算法和框架。
基于SenseParrots和OpenMMlab积累的平台优势,商汤智能计算中心向下可以接入更多的硬件厂商,把硬件算力转化为产业价值;向上可以支持更多的企业落地AI服务,支撑AI向产业赋能,形成发散式的产业链结构。
“通过这个平台商汤希望完成坚持原创和赋能百业的初心,另一方面通过搭建公共服务平台,去推动整个AI产业更蓬勃健康的发展。”杨帆说道。
谈及将智能计算中心落地上海的原因,杨帆认为上海乃至长三角区域是传统重型工业和制造业最集中、发达的区域,这些产业都面临转型升级,如果能够激活它们进行数字化转型,会对整个经济产生很强的杠杆促进作用,也会给商汤带来更多的产业客户,一起创造双赢。此外上海的政策支持和营商环境也给予商汤更强的落地信心。
上海市经信委人工智能发展处副处长孙跃告诉第一财经,智能计算中心是支撑人工智能产业发展和城市数字化转型很重要的基础设施,通过超大规模、集约化的算力部署,可以降低AI技术和成本门槛,让AI真正赋能百业,起到降本、增效和提质的作用。
另一方面,智能计算中心也是贯通产业链上下游很重要的载体和平台,它可以有效带动上游国产芯片的发展,为国产智能芯片提供一个真实的应用场景,也可以带动下游智能软件和应用的发展。
“通过这一平台可以将AI整个软硬件产业链打通,构建人工智能大生态,有效推动整个产业链上下游的发展,同时也能将AI能力更好地应用于经济社会发展和城市治理,这将进一步推动上海以人工智能为载体打造‘国内大循环的中心节点、国内国际双循环的战略链接’。”孙跃表示。