阿里第一颗芯片
阿里巴巴第一颗自研芯片正式问世。在9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片——含光800。在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”
含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。
含光800性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
据了解,目前含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。
过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。
相关新闻
9月25日,阿里CTO张建锋在杭州云栖大会上展示了阿里巴巴的第一颗AI芯片“含光800”。去年的同一场大会上,阿里的芯片公司平头哥成立,之前已经交出了嵌入式CPU“玄铁”和系统芯片平台“无剑”。
根据张建锋的介绍,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
含光800硬件层面采用自研芯片架构,软件层面集成达摩院算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
张建锋表示,含光800已开始被应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,但使用含光800后可缩减至5分钟。
在阿里之外的公共场景中,含光也已经被投入实践。张建锋演示,杭州城市大脑处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms。但使用含光800仅需4颗,延时降至150ms。1颗含光800的算力相当于10颗GPU。
阿里官方表示,成立仅一年的芯片公司平头哥仅用7个月时间完成了前端设计,之后用3个月成功流片。“和绝大多数芯片商不同的是,平头哥的目的并非卖芯片,含光800将通过阿里云对外输出AI算力,未来企业可以通过阿里云获取含光800的算力。”
另外,平头哥还将成立芯片开放社区,为芯片产业提供开放协作平台。
现场还公布了平头哥在端侧的成绩:CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核授权客户超100家,累计销售超十亿颗,广泛应用于机器视觉、工业控制、车载终端、移动通信和信息安全等领域;除此之外,基于RISC-V架构的玄铁处理器以及无剑SoC平台也已服务各行业企业,例如人工智能企业云天励飞、老牌芯片商炬芯科技等。
阿里方面表示,未来,平头哥的产品形态会进一步完善,例如云上AI训练芯片和端上的AI推理芯片,目前平头哥还在研发用于阿里云神龙服务器的SoC专用芯片,以满足更多场景的算力需求。
芯片跟云搭着卖的方式是阿里“云+AI”销售策略的新一步。“阿里在芯片上的定位是:端上做芯片基础设施,云端为企业提供普惠算力。”
以上就是关于阿里第一颗芯片的介绍,如果您还有疑问,请继续阅读扩展内容。
阿里第一颗芯片问世,为何第一个AI芯片就登顶全球?
含光一出,不服来干!
阿里将芯片命名为平头哥,一种生活在非洲的蜜罐,号称全球胆子最肥的动物。其性格“不服就干”也成了阿里芯片的代名词。
含光是我国传说中上古三大神剑之一,该剑含而不露,光而不耀,光听名字就能想象到此剑强劲的威力。而含光就是平头哥旗下的小弟,将来还会有更多芯片产品。含光800的出现,真正体现了平头哥的特色:短、平、快。再加上上古神剑,天下无敌,听这名字就相当的霸气。
随着5G时代的到来,图片、视频等占用空间较大的信息文件会越来越多,与日俱增的海量数据需要更加强大的芯片处理才能完成。阿里对芯片的渴求比谁都更积极,所以必须研制出最牛最强的芯片才能给阿里目前的情况带来改变,这是战略性芯片。我们来看看含光800的专业数据:
含光800的12纳米技术,超过170万晶体管,超强的推理性能可以达到78563 IPS,比当今世界最厉害的AI芯片性能高4倍;芯片能效比500 IPS/W,是第二名的3.3倍,芯片用于云端影像图片处理,每秒可处理7.8万张图片。想象一下天猫淘宝的图片数据量,那可是天量而且每天都在增加。1颗含光800的算力相当于10颗GPU,未来5G时代智能物联网发展,就需要如此强劲的动力芯片。
含光800的面世,将会带来我国芯片发展的新的历史阶段。
一、区别于传统通用芯片,目标更明确专一
阿里的芯片和传统通用处理器(如X86、CPU和GPU)的算法还是有些不同,属于特定场景下的特定算法,我们可以理解为:定制化芯片。含光800目标专一、把硬件和软件发挥最大价值,就像平头哥一样,瞄准目标不服就干,干到你害怕为止。
二、依靠强大的基础,芯片研发速度更快
阿里五大支持机构—ABCDE,即Algorithm 算法机构、Big Data 大数据机构、Computing 安稳的计算力机构、Domain knowledge 专业领域知识机构、以及Ecosystem 大生态机构。拥有ABCDE的阿里,研发速度更快。
如果使用传统GPU,实时处理一个城市交通视频所需GPU数量大约需要40颗,出现的延时为300ms;如果使用阿里的含光800,只用4颗就能搞定,而且延时会下降到150ms。
阿里电商系统商品库每天的图片增加量达到10亿张,传统的GPU技术,识别效率低,需要1个小时。含光800,只用5分钟,效率可以提升12倍。
未来的5G物联网时代,含光800超强的计算能力还可应用于智慧医疗、汽车自动驾驶技术、智慧城市等行业。
三、为企业输出普惠算力,好东西让更多企业使用。
阿里产品铁三角:AI+芯片+云计算,从技术和硬件都没有问题,阿里是服务企业起家的,未来这些应用的目标还是广大企业用户。依靠阿里巴巴“让天下没有难做生意”的愿景,将会打造全新的商业模式——平头哥模式,为企业提供性价比更高的普惠算力,让更多企业都能享受科技带来的价值。