泰安求职:2020最强终端AI加快芯片Top10排行榜:英伟达、英特尔领跑

新2备用网址/2020-05-02/ 分类:科技/阅读:

  【新智元导读】跟着行业勉力追求最佳要领来加快人工智能机能以顺应尖端神经收集的要求,天下各地涌现了很多新兴公司,通过跟踪美国、欧洲和亚洲的约莫60家AI芯片初创公司,为怎样最好地实现这一方针提出了新思绪。「新智元急聘编缉、高级主任编辑,添加HR微信(Dr-wly)或扫描文末二维码相识详情。」

  尽量人工智能和呆板进修应用的加快照样一个相对较新的规模,但各类处理赏罚器如雨后春笋般涌现,险些可以加快任何神经收集事变负载。

  EETimes,从垂直市场、应用规模、功率预算及价值多个方面临今朝市场上的应用处理赏罚器举办了盘货。

  Intel Movidius Myriad X

  Myriad X由爱尔兰初创公司Movidius开拓,该公司于2016年被英特尔收购。

  Myriad X是该公司的第三代视觉处理赏罚单位,也是首款搭载专用神经收集计较引擎的产物,可提供每秒1兆次的专用深度神经收集(DNN)计较,可提供1兆次的运算手段。

  神经计较引擎直接与高通量智能内存架构对接,中止了数据传输时的内存瓶颈。它支撑FP16和INT8计较。Myriad X还拥有16个专有的SHAVE内核集群和进级扩展的视觉加快器。

  Myriad X回收了英特尔的Neural Compute Stick 2,现实上就是一个U盘情势的评估平台。它可以插在任何事变站上,让AI和计较机视觉应用很快就能在Movidius的专用硬件上启动并运行。

  恩智浦半导体i.MX 8M Plus

  i.MX 8M Plus是一款异构应用处理赏罚器,回收了芯原公司的专用神经收集加快器IP(Vivante VIP8000)。


泰安求职:2020最强终端AI加速芯片Top10排行榜:英伟达、英特尔领跑

  它为消费类和工业物联网中的终端装备提供了2.3 TOPS的加快手段,足以实现多方针辨认、4万字的语音辨认,乃至是医疗成像(MobileNet v1版以每秒500张图像的速率)。

  除了神经收集处理赏罚器外,i.MX 8M Plus还搭载了运行在2GHz的四核Arm Cortex-A53子体系,外加Cortex-M7及时子体系。

  视觉应用方面,有两个图像信号处理赏罚器,支撑两个高清摄像头,可实现立体视觉,也可支撑单个1200万像素(MP)摄像头。

  在语音方面,该装备包罗一个800MHz的HiFi4音频数字信号处理赏罚器(DSP),用于语音数据的前、后处理赏罚。

  XMOS的xcore.ai

  xcore.ai旨在实现人工智能物联网(AIoT)应用中的语音节制。这款装备是一个交错处理赏罚器(具有应用处理赏罚器的机能和微节制器的低功耗、及时操纵),专门用于对语音信号举办呆板进修推理。


泰安求职:2020最强终端AI加速芯片Top10排行榜:英伟达、英特尔领跑

  它基于XMOS专有的Xcore架构,自己就成立在称为逻辑核的构建块上,可以用于I/O、DSP、节制成果或AI加快。每个xcore.ai芯片上有16个如许的内核,计划者可以选择分派给每个成果的数目。

  将差异的成果映射到固件中的逻辑内核,可以建设一个完全由软件编写的 "假造SoC"。XMOS为Xcore增进了向量管道成果,用于呆板进修事变负载。

  xcore.ai支撑32位、16位、8位和1位(二值化)收集,可提供3200 MIPS、51.2 GMACC和1600 MFLOPS。它拥有1 Mbyte的嵌入式SRAM和低功耗DDR接口,可用于扩展。

  德州仪器公司 TDA4VM

  作为Jacinto 7系列汽车高级驾驶帮助体系(ADAS)的一部门,TDA4VM是TI首款具有专用深度进修加快器的片上体系(SoC)。


泰安求职:2020最强终端AI加速芯片Top10排行榜:英伟达、英特尔领跑

  该芯片块基于C7x DSP加上内部开拓的矩阵乘法加快器(MMA),可实现8个TOPS。

  该SoC可以处理赏罚来自前置摄像头的视频流,最高可达8MP,可能是4到6个3MP摄像头加上雷达、LiDAR和超声波传感器的组合。

  譬喻,在主动泊车体系中,MMA也许用于对这些输入举办传感器融合。

  TDA4VM是为5到20W之间的ADAS计划而计划的。

  Nvidia的Jetson Nano

  Nvidia闻名的Jetson Nano是一款小巧但成果强盛的图形处理赏罚单位(GPU)模块,用于终端装备中的AI应用。


泰安求职:2020最强终端AI加速芯片Top10排行榜:英伟达、英特尔领跑

  该公司暗示,Nano模块上的GPU基于与Jetson家属中较大的成员(AGX Xavier和TX2)沟通的Maxwell架构,拥有128个内核,可以或许到达0.5TFLOPS,足以在高判别率图像传感器的多个数据流上运行多个神经收集。

  行使时,它的功耗低至5W。该模块还回收了四核Arm Cortex-A57 CPU。

  与Nvidia的其他部件一样,Jetson Nano也行使了Nvidia的神经收集加快库CUDA X。价值不贵的Jetson Nano开拓套件已被普及行使。

  Kneron Inc. KL520

  中国台湾初创公司Kneron的首款产物是KL520神经收集处理赏罚器,是专为智能家居、安防体系和移动装备等应用中的图像处理赏罚和面部辨认而计划的。它可以运行卷积神经收集(CNNs),是今朝图像处理赏罚中常用的范例。

  KL520可运行0.3 TOPS,功耗为0.5 W(相等于0.6 TOPS/W),该公司暗示,鉴于该芯片的MAC遵从很高(高出90%),这足以实现准确的面部辨认。

  该芯片的架构是可从头设置的,可以按照差异的CNN模子举办定制。该公司的帮助编译器还回收了压缩技能,以便在芯片资本内运行更大的模子,以节减功耗和本钱。今朝KL520已经上市,也可以在厂商AAEON的加快器卡上找到(M2AI-2280-520)。

  Gyrfalcon Lightspeeur 5801

  Gyrfalcon的Lightspeeur 5801专为消费类电子市场计划,在224mW的功耗下提供2.8 TOPS(相等于12.6 TOPS/W),耽误为4ms。Gyrfalcon行使了一种处理赏罚器内存储器技能,与其他架构对比,该技能出格省电。

  功耗现实上可以通过改变50到200MHz之间的时钟速率来抵消功耗。Lightspeeur 5801包括10MB的内存,因此整个型号可以装在芯片上。

  该部门是该公司的第四款量产芯片,已经呈此刻LG的Q70中端智妙手机上,它处理赏罚相机结果的推理。此刻已经推出了一款USB优盘开拓套件,即5801 Plai Plug,今朝已经上市。

  Eta Compute的ECM3532

  Eta Compute的首款量产产物ECM3532是专为IoT的电池供电或能量网络计划中的AI加快而计划的。在图像处理赏罚和传感器融合方面的始终开机应用,只需低至100微瓦的功率预算就能实现。

  该芯片有两个内核--一个Arm Cortex-M3微节制器内核和一个NXP CoolFlux DSP。该公司行使了一种专有的电压和频率缩放技能,在每一个时钟周期内举办调解,以压迫两个内核的每一滴电能。

  呆板进修事变负载可由两个内核中的任何一个内核处理赏罚(譬喻,某些语音事变负载更得当DSP)。ECM3532的样品现已上市,估量第二季度最先量产。

  Syntiant公司NDP100

广告 330*360
广告 330*360

热门文章

HOT NEWS
  • 周榜
  • 月榜
阳光在线企业邮局
微信二维码扫一扫
关注微信公众号
新闻自媒体 Copyright © 2002-2019 阳光在线企业邮局 版权所有
二维码
意见反馈 二维码