侵权投诉

                  千核RISC-V处理器,通往AI之路的完全体

                  E4Life ? 2021-07-20 09:53 ? 次阅读
                  谈到如何设计AI加速器,许多工程师都会给出不同的答案,但归根结底仍是在一颗先进制程的芯片上排列组合数十亿个晶体管。然而当前超大规模的AI推理依然面临着不少挑战,比如成本和复杂度高居不下,传统架构下的性能、功耗和可编程性无法满足超大规模的要求等。初创公司Esperanto作为去年才开始冒头的初创企业,却打算用RISC-V来解决这一问题。

                  Esperanto创立于2014年,其董事长Dave Ditzel曾在英特尔负责下一代微处理器架构的设计。Esperanto的工作方向是基于RISC-V这一开放架构,开发高性能、高效率的计算方案。为此,他们打造了ET-SoC-1,一个千核的RISC-V处理器,也是他们开发的首个AI加速器。

                  ET-SoC-1 / Esperanto
                  ET-SoC-1的名字寓意并不是传统的SoC,而是面向超大规模数据中心的“片上超级电脑”。它包含了近乎1100个RISC-V核心,近240亿晶体管。需要指出的是,ET-SoC-1是一个AI推理加速器,并不是训练加速器。

                  据CEO Art Swift介绍,该芯片采用了台积电7nm制程,在特定的工作任务上,能耗效率提高可至100倍。ET-SoC-1在其他关键工作任务上,性能提升要远高于传统的CPUGPU方案。比如在模拟测试中,用于推荐网络时,其性能提升高达50倍,在图像分类上,性能提升高达30倍。虽然这些暂时只是纸面测试参数,但这样的性能和功耗无疑可以给AI客户带来很大的吸引力。

                  据了解,这一芯片直至2021年第二季度才正式流片,预计2022年早期才会开始量产。这是因为Esperanto花了很多时间在验证上,作为一家初创公司,Esperanto采用了架构、硬件和软件联合设计的方式,这样一来虽然节省了时间,却也让规格一直在持续变动。因此Esperanto在验证团队上投入了许多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求减少查错和除错时间。

                  ET-SoC-1芯片架构 / Esperanto

                  ET-SoC-1用到了两种Esperanto自研的RISC-V核心,分别是4个ET-Maxion(超标量乱序核)和1089个ET-Minion(顺序多线程核心)。ET-Maxion是一颗可以运行Linux的大核心,核心频率超过2GHz,作为ET-SoC-1的控制CPU,而ET-Minion则用于矩阵乘法等重度机器学习数据处理。

                  ET-Maxion作为核心频率超过2GHz的10级流水线RISC-V核心,其实原本是伯克利大学Boom V2开源核心的的分支,但Esperanto对此进行了大刀阔斧的改进。在SPEC2006测试下,其性能已经超过了Cortex-A57,不过还是次于Cortex-A72以及SiFive最近公布的P550。

                  虽然是一个小核,但ET-Minion也是一个64位RISC-V核心。ET-SoC-1内,32个ET-Minion和4MB的L2 SRAM组成了“Minion Shire”,一共34个Shire采用Mesh的方式连接在一起,多出来的一个ET-Minion则用作服务处理器。Esperanto用这一千多个ET-Minion做到了强大的浮点性能,某些传统加速器仅支持INT8运算,而ET-SoC-1在FP16或FP32上都能展现出不俗的优势。


                  搭载6个ET-SoC-1的Glacier Point v2 / Esperanto

                  Art Swift提到,Facebook推出的开源AI板卡Glacier Point v2可以搭载6个ET-SoC-1芯片,这样以来就可以直接接入已有的开源计算项目(OCP)设备中。这一张卡上就包含了6558个RISC-V核心和192GB的LPDDR4X DRAM,带宽可达822GB/s的同时还拥有较低的功耗。据估计,这一设计的板卡峰值性能可达800 TOPS(INT8)以上。

                  在软件层面上,Esperanto也为C++++、Pytorch和TensorFlow常见的机器学习框架提供了支持。只需采用Facebook的开源编译器,就可以在多个ET-SoC-1芯片上运行机器学习模型。

                  结语

                  RISC-V虽然在传统的CPU与GPU市场还未彻底崛起,但在AI加速上,已经以其独到的优势迅速攻城略地。这种千核式的设计其实已经应用于Arm等架构,不少数据中心、超算却依然在尝试用RISC-V作为加速器。

                  RISC-V凭借其开放性、扩展性和自主性,并没有像Arm那样由低至高地发展市场,而是低端和高端两头抓,一旦消费市场也开始普及RISC-V生态,那时的RISC-V就有与Arm全市场争霸的希望了。
                  收藏 人收藏
                  分享:

                  评论

                  相关推荐

                  新品发布 | 高算力“小魔盒”— AI边缘计算终端FCU3001来了

                  //高算力“小魔盒”如果您正从事人工智能边缘计算的项目开发,那么NVIDIA推出的JetsonXav....
                  的头像 栾新科 发表于 11-29 17:26 ? 8次 阅读
                  新品发布 | 高算力“小魔盒”— AI边缘计算终端FCU3001来了

                  科华数据驱动金融数据中心巡检进入「无人之境」

                  科华数据参编《数据中心巡检机器人应用技术白皮书》发布。 25日,由中数智慧信息技术研究院及行业设计院....
                  发表于 11-29 16:54 ? 4次 阅读
                  科华数据驱动金融数据中心巡检进入「无人之境」

                  活动预告 | 类脑技术如何开启下一代人工智能?

                  类脑智能,被视为人工智能的终极目标,随着第三次人工智能浪潮席卷而来,下一代人工智能即将开启。世界主要....
                  发表于 11-29 14:57 ? 31次 阅读
                  活动预告 | 类脑技术如何开启下一代人工智能?

                  【RTT大赛作品连载】CH32V RTT微秒延时的实现

                  CH32V103是沁恒出的一款基于RiscV核心的单片机,在官网有该芯片的资料、库函数和例程,另外沁....
                  的头像 煲仔卤煮的炼钢 发表于 11-29 08:30 ? 514次 阅读
                  【RTT大赛作品连载】CH32V RTT微秒延时的实现

                  【博流 BL-HWC-G1 开发板试用】让博流 BL602 连接互联网 —— 使用 BL IoT SDK 通过 Wi-Fi 联网发出 HTTP GET 请求获取数据

                  [quote]本文最初发表在,这里的版本是复制来的,格式可能有些不太完美。[/quote]0. 引言 是一份教程,展示了如何上手刚拿到的 ...
                  发表于 11-26 21:02 ? 202次 阅读

                  RISC-V ISA 命名规范

                  RISC-V ISA 命名规范RISC-V ISA 采用模块化的方式进行组织,每一个模块使用一个英文....
                  发表于 11-26 16:36 ? 14次 阅读
                  RISC-V ISA 命名规范

                  RISC-V MCU开发 (二):工程创建与管理

                  RISC-V MCU开发 (二):工程创建与管理MounRiver? Studio(MRS)内置了G....
                  发表于 11-26 15:36 ? 10次 阅读
                  RISC-V MCU开发 (二):工程创建与管理

                  智算时代AI性能需求6年增长30万倍存储怎么办

                  /作者:浪潮信息首席架构师 叶毓睿 智算时代的序幕已经拉开,互联的万物,一切皆计算。智慧计算融入到千....
                  的头像 浪潮存储 发表于 11-26 14:52 ? 750次 阅读

                  边缘AI“金矿”:PC的智能和感知,Lattice sensAI有了新方案

                  电子发烧友网报道(文/黄晶晶)ABI研究数据表明,预计到2024年设备端的AI推理功能将覆盖近60%....
                  的头像 芯链 发表于 11-26 10:14 ? 519次 阅读
                  边缘AI“金矿”:PC的智能和感知,Lattice sensAI有了新方案

                  RISC-V 架构及MRS 开发环境介绍

                  一.设计背景RISC-V,第五代开源 RISC 指令集架构,作为近年来开源芯片技术的突出代表,受到国....
                  发表于 11-25 20:51 ? 28次 阅读
                  RISC-V 架构及MRS 开发环境介绍

                  MRS 配套ARM内核单片机烧录工具使用说明(RISCV/ARM IDE)

                  MRS 配套ARM内核单片机烧录工具使用说明V1.0一、 概述WCH-Link Utility是一款....
                  发表于 11-25 19:51 ? 8次 阅读
                  MRS 配套ARM内核单片机烧录工具使用说明(RISCV/ARM IDE)

                  RISC-V MCU开发 (八):工程集管理

                  RISC-V MCU开发 (八):工程集管理相比较于KEIL、Visual Studio等集成开发环....
                  发表于 11-25 19:06 ? 5次 阅读
                  RISC-V MCU开发 (八):工程集管理

                  Codasip采用Imperas技术来强化其RISC-V处理器验证优势

                  RISC-V是一种模块化架构,它可提供由许多不同基本指令、标准可选扩展项和自定义指令构成的组合,这引....
                  发表于 11-25 14:24 ? 723次 阅读
                  Codasip采用Imperas技术来强化其RISC-V处理器验证优势

                  CSM32RV20开发板介绍_RISCV核低功耗MCU单片机

                  CSM32RV20开发板是基于我司CSM32RV20MCU芯片打造的一款轻便易携、可覆盖我司全部射频....
                  发表于 11-25 11:09 ? 6次 阅读

                  CSM32RV20原理图_QFN_3V5V_v1.1

                  CSM32RV20(QFN32)开发板/RISCV核低功耗单片机MCU_原理图
                  发表于 11-25 11:09 ? 4次 阅读

                  CSM32RV20 芯片数据手册

                  CSM32RV20芯片数据手册
                  发表于 11-25 11:09 ? 2次 阅读

                  CSM_Studio_IDE_Manual-6.11.03

                  IDE:CSMStudio,是南京中科微针对嵌入式项目RISC-V系列MCU开发的跨平台支持的C/C....
                  发表于 11-25 11:08 ? 3次 阅读

                  风口上的低代码的这些变化与趋势 低代码还需要解决哪些问题?

                  在企业服务领域,今年低代码的概念非常火爆,最直观的感受是,从前这类分享都是几十人讨论的小沙龙。今年各....
                  的头像 脑极体 发表于 11-25 08:46 ? 678次 阅读

                  【RTT大赛作品连载】AB32VG1的开发环境搭建

                  RT-Thread有两种:无IDE和有IDE. 我这里用的是有IDE,这个使用比较简单方便。准备(上节有提相关下载路径): ? rt...
                  发表于 11-25 08:00 ? 101次 阅读

                  创略科技获7100万元B轮融资,饿了么、沃尔玛均是客户

                  11月16日创络(上海)数据科技有限公司(简称“创略科技”)正式宣布已完成7100万元B轮融资,本轮....
                  发表于 11-24 15:02 ? 18次 阅读
                  创略科技获7100万元B轮融资,饿了么、沃尔玛均是客户

                  Microchip发布新款用于边缘嵌入式视觉设计的新一代开发工具

                  平台扩展了客户在从神经网络诊断到工业物联网 (IIoT) 和工厂自动化等应用中设计安全可靠系统的选择....
                  发表于 11-24 14:58 ? 1756次 阅读
                  Microchip发布新款用于边缘嵌入式视觉设计的新一代开发工具

                  全新版本莱迪思sensAI解决方案集合加速下一代客户端

                  与使用CPU来驱动AI应用的设备相比,采用sensAI开发,并在莱迪思FPGA上运行的AI计算设备的....
                  发表于 11-24 14:18 ? 453次 阅读

                  上海先楫半导体发布微控制器HPM6000系列,采用晶心AndesCore? 双D45内核

                  目前全球性能最强的实时RISC-V微控制器HPM6000系列,主频高达 800MHz,创下超过900....
                  发表于 11-24 10:49 ? 1891次 阅读
                  上海先楫半导体发布微控制器HPM6000系列,采用晶心AndesCore? 双D45内核

                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:添加标准数学库引用

                       在嵌入式开发中,我们经常需要调用一些数学函数,例如pow、acos、asin、sqrt等。这时候我们就需要添加...
                  发表于 11-24 10:19 ? 303次 阅读
                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:添加标准数学库引用

                  一知智能助力开发区数字强“治能” 争当排头兵

                  一知智能作为本土数字化改革实践地的先进高新技术企业,以业内领军的人机交互实力见长,充分发挥以首席科学....
                  的头像 话说科技 发表于 11-24 10:17 ? 714次 阅读

                  美光携手联发科率先完成 LPDDR5X 验证

                  美光科技今日宣布,MediaTek Inc. ( 联发科技 ) 已在其全新的 5G 旗舰智能手机芯片....
                  发表于 11-24 10:12 ? 1163次 阅读
                  美光携手联发科率先完成 LPDDR5X 验证

                  绕开CPU和内存,你浏览的内容或来自SSD的推荐

                  绕开CPU 和内存,你浏览的内容或来自SSD 的推荐 ? 相信不少人都还记得今年AI芯片公司Espe....
                  的头像 E4Life 发表于 11-24 09:26 ? 1040次 阅读
                  绕开CPU和内存,你浏览的内容或来自SSD的推荐

                  华为 告别大陆军时代

                  2010年,解放军提出建设强大的现代化新型陆军。其核心是摆脱长期“独立作战、包打天下”形成的意识,放....
                  的头像 脑极体 发表于 11-24 08:45 ? 1588次 阅读

                  【RTT大赛作品连载】中科蓝讯AB32VG1开发板开箱篇

                  收到开发板先上靓照中科蓝讯AB32VG1开发板开箱AB32VG1开发板一块TypeCo数据线一条 开发板介绍 AB32VG1开发板是以...
                  发表于 11-24 08:00 ? 101次 阅读

                  雷军 1994 年写的诗一样的代码,我把它运行起来了!

                  点击上方“五分钟学算法”,选择“星标”公众号重磅干货,第一时间送达这是一段古董代码了,因为在1994....
                  发表于 11-23 18:06 ? 2次 阅读
                  雷军 1994 年写的诗一样的代码,我把它运行起来了!

                  雷军1994年写的诗一样的代码,我把它运行起来了!

                  Python实战社群Java实战社群长按识别下方二维码,按需求添加扫码关注添加客服进Python社群....
                  发表于 11-23 18:06 ? 12次 阅读
                  雷军1994年写的诗一样的代码,我把它运行起来了!

                  研华发布AIR-020超紧凑型AI智能推理系统搭载NVIDIA Jetson系列核心模块

                  研华科技宣布推出 AIR-020 系列人工智能推理系统,这是一款搭载NVIDIA Jetson 系列....
                  发表于 11-23 11:30 ? 1117次 阅读
                  研华发布AIR-020超紧凑型AI智能推理系统搭载NVIDIA Jetson系列核心模块

                  安捷数科与Graphcore携手,使用IPU进行气象预测、精准灌溉和防灾减灾

                  安捷数科与Graphcore的初期合作是基于IPU上ET0模型的科学计算项目,双方的技术团队使用了气....
                  的头像 西西 发表于 11-23 10:46 ? 983次 阅读
                  安捷数科与Graphcore携手,使用IPU进行气象预测、精准灌溉和防灾减灾

                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:设置工程编码字符集

                         字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合...
                  发表于 11-23 10:20 ? 101次 阅读
                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:设置工程编码字符集

                  三星宣布芯和半导体成为其SAFE EDA合作伙伴

                  据芯和官网报道, 在2021年5月,芯和半导体片上无源电磁场(EM)仿真套件已成功通过三星晶圆厂的8....
                  发表于 11-23 09:25 ? 504次 阅读
                  三星宣布芯和半导体成为其SAFE EDA合作伙伴

                  AI技术在气候问题面前是否能够大展身手

                  2021年是极端天气频繁的一年,美加的长时间高温、多国遭遇洪水,龙卷风登陆了中国内陆,让人不得不重视....
                  的头像 脑极体 发表于 11-22 21:47 ? 546次 阅读
                  AI技术在气候问题面前是否能够大展身手

                  大华物联数智平台服务千行百业数智化升级

                  大华企业平台3.0,以业务为导向打造具备行业Know-How的数智中台,面向企业私有云和公有云全覆盖....
                  的头像 大华股份 发表于 11-22 15:05 ? 1026次 阅读

                  AI助力,商汤科技联手上海电信打造云端医疗服务规模化发展新增长极

                  根据合作协议,商汤科技SenseCare?智慧诊疗平台将通过上海电信云网融合和5G专网为广大医疗机构....
                  发表于 11-22 14:17 ? 545次 阅读
                  AI助力,商汤科技联手上海电信打造云端医疗服务规模化发展新增长极

                  RISC-V MCU IDE MRS(MounRiver Studio)开发之: 设置调试前不自动编译

                  在嵌入式开发过程中,我们有时会遇到这种情形:在一次调试前,我们已经编译过目标代码,此时,如果我们直接点击调试按钮,则ID...
                  发表于 11-22 10:38 ? 203次 阅读
                  RISC-V MCU IDE MRS(MounRiver Studio)开发之: 设置调试前不自动编译

                  进入 32 位时代,谁能成为下一个8051?

                  RISC-V架构在极短的时间内便引起了业界的高度关注,从众多反应快速的小公司到实力雄厚的巨头公司(如....
                  发表于 11-22 09:51 ? 15次 阅读
                  进入 32 位时代,谁能成为下一个8051?

                  NVIDIA赢得四项最新行业指标

                  在五项新的行业指标中,NVIDIA 赢得了其中的四项。这些指标聚焦于AI在高性能计算中的应用,是一种....
                  的头像 NVIDIA英伟达 发表于 11-21 10:57 ? 466次 阅读

                  华为芯片基础平台HUAWEI HiAI Foundation助力开发者高效灵活开发

                  自2017年麒麟970发布至今,端侧AI经历了开创先河到产业快速发展的巨变。一方面,麒麟芯片的AI性....
                  的头像 华为麒麟 发表于 11-20 15:33 ? 1264次 阅读

                  曙光提供计算能力支撑驱动医疗AI从实验走向应用

                  据悉,一项基于机器学习的大型死亡率研究,根据超声心动图结合电子病历数据预测患者生存率的准确性可达到9....
                  的头像 中科曙光 发表于 11-20 15:20 ? 2021次 阅读

                  清华大学发布元宇宙计划

                  近日,清华大学正式启动了“元宇宙特别计划”,计划将以AI定制和控制结合在一起,依托艺科元宇宙的资源优....
                  的头像 lhl545545 发表于 11-20 10:07 ? 710次 阅读

                  首创主动式智能场景 艾拉物联开创未来空间智能

                  传统的智能家居是一个个设备的组合,却接口壁垒重重,无法实现生态共享、协议互通,这是目前存在大量智能产....
                  的头像 鹰眼 发表于 11-19 14:46 ? 224次 阅读

                  盘点RISC-V?MCU厂商,爱普特为何能在市场占有率拔得头筹?

                  近期“开源”式RISC-V不断升温,出现了蓬勃发展的态势。今年6月,谷歌的新品发布会确认将RISC-....
                  发表于 11-19 13:54 ? 38次 阅读

                  摩尔线程与一流科技携手共同加速人工智能创新和应用

                  摩尔线程与北京一流科技有限公司(简称:一流科技)将展开深度技术合作,基于摩尔线程国产全功能GPU强大....
                  的头像 互联网科技 发表于 11-19 11:02 ? 219次 阅读

                  低代码+AI 新享科技帮企业解决信息化痛点

                  深秋的上海,气候宜人,由上海合见工业软件集团公司主办的产品发布会在黄浦江畔世博园区新办公区隆重召开,....
                  发表于 11-19 11:01 ? 39次 阅读
                  低代码+AI 新享科技帮企业解决信息化痛点

                  教你实现用Python自动玩王者荣耀

                  「王者荣耀」想必大家就算没有玩过,也都听过。 腾讯 AI Lab 开发的策略协作型“绝悟”,最强 A....
                  的头像 Linux爱好者 发表于 11-19 10:49 ? 306次 阅读
                  教你实现用Python自动玩王者荣耀

                  迎接医药物流数智化浪潮,用AI乘风破浪

                  随着两票制及带量采购等政策的深入,医药流通企业的成本压力不断上升;智慧物流已成为国家点名的促内循环抓....
                  的头像 旷视MEGVII 发表于 11-19 09:46 ? 298次 阅读

                  旷视助力廊坊构建疫情防控有力屏障

                  2021 年秋冬以来,国内疫情多有反复,甚至出现散点的规模性传播,不断变异的毒株能力与严峻的国际防疫....
                  的头像 旷视MEGVII 发表于 11-19 09:40 ? 403次 阅读

                  RT-Thread 中科蓝讯AB32VG1 RISC-V开发板上手

                  前几天偶然发现睿赛德淘宝店上新了一款开发板,名曰AB32,想来这板子也该算是跟STM32、GD32、....
                  发表于 11-18 19:06 ? 28次 阅读
                  RT-Thread 中科蓝讯AB32VG1 RISC-V开发板上手

                  人工智能新力量,意法半导体Deep Edge AI 应运而生

                   借助内置的低功耗传感器设计、高级AI事件检测、唤醒逻辑和实时边缘计算功能,传感器中的MLC极大地减....
                  发表于 11-18 11:22 ? 2335次 阅读
                  人工智能新力量,意法半导体Deep Edge AI 应运而生

                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:设置Tab键以指定空格数缩进

                         在嵌入式开发中,我们常常需要在其他工程师创建的工程上进行二次开发,而每个人IDE中设置的Tab键...
                  发表于 11-18 10:09 ? 404次 阅读
                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:设置Tab键以指定空格数缩进

                  NVIDIA高性能AI计算和高级算法助力解决停车难题

                  高性能 AI 计算和高级算法助力解决停车难题。 无论是侧方、垂直还是倾斜停车,都可能是结束驾驶时的一....
                  的头像 NVIDIA英伟达企业解决方案 发表于 11-18 09:59 ? 321次 阅读

                  多所大学采用NVIDIA系统和网络拓展研究工作

                  美国南方卫理公会大学使用 NVIDIA DGX SuperPOD 推动德克萨斯州北部地区进入 AI ....
                  的头像 NVIDIA英伟达企业解决方案 发表于 11-18 09:45 ? 301次 阅读

                  NVIDIA高性能AI计算和高级算法助力解决停车难题

                  高性能 AI 计算和高级算法助力解决停车难题。 无论是侧方、垂直还是倾斜停车,都可能是结束驾驶时的一....
                  的头像 NVIDIA英伟达 发表于 11-18 09:28 ? 222次 阅读

                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:绑定各后缀名文件打开方式

                  在嵌入式开发过程中,我们常常会遇到需要在IDE内编辑各种后缀名文件的情况,而可能部分后缀的文件并不是以我们想要的编辑器打...
                  发表于 11-17 10:54 ? 505次 阅读
                  RISC-V MCU IDE MRS(MounRiver Studio)开发之:绑定各后缀名文件打开方式

                  浅谈RISC-V GCC之:链接脚本学习笔记(二)

                  上一篇介绍了部分链接脚本知识,这次我们用MRS(MounRiver Studio)中内置的CH57x系列模板工程来具体实践一下: 1 入口...
                  发表于 11-12 11:19 ? 707次 阅读
                  浅谈RISC-V GCC之:链接脚本学习笔记(二)

                  8位RISC核MCU,全新上市,请各位大佬关注

                  8位risc架构、带12-bit ADC的高性能单片机。该款芯片内带64 Byte SRAM、外围配置简单,可在节约电路成本前提下满足多功能...
                  发表于 11-12 10:52 ? 404次 阅读
                  欧美美女的白虎