"优化多核平台的AI推理性能:技术分析与策略" - 闲芯交易网
"优化多核平台的AI推理性能:技术分析与策略"

不久前,边缘人工智能(AI)推理作为一种新奇的功能,可以轻松地由单个神经处理单元(NPU)IP加速器支持。然而,人们对此的期望已迅速提高。现在,我们希望嵌入式AI推理能够处理多个摄像头,复杂的场景分割,带有智能噪声抑制的语音识别,多个传感器之间的融合,以及现在非常大和复杂的生成式AI模型。

只有在多核AI处理器上运行,这些应用程序才能为边缘产品提供满意的吞吐量。NPU IP加速器已经可以满足这个需求,扩展到8个或更多的并行核心,并能够并行处理多个推理任务。但是,你应该如何对预期的AI推理工作负载进行分区,以最大限度地利用所有这些计算能力呢?

我们首先从AI推理目标的资源集开始,这些资源包括一些可用的加速器,具有本地L1缓存,共享L2缓存和DDR接口,每个缓存的缓冲区大小都已定义。接下来的任务是将应用程序要求的网络图映射到这种结构,优化总吞吐量和资源利用。

有一种明显的策略是处理需要分割成多个瓦片的大输入图像—通过输入地图划分,其中每个引擎被分配一个瓦片。在这里,多个引擎并行搜索输入地图,寻找相同的特性。相反,你可以通过输出地图划分—将同一瓦片并行输入多个引擎,并使用相同的模型但不同的权重在同一时间检测输入图像中的不同特性。

在面对一些具有线程操作的AI推理模型或子图时,虽然这些操作并不显得很可并行化,但仍然可以进行流水线处理,这在考虑通过网络执行流操作时可能会有益。

另一个例子是深度神经网络(DNN)中的逐层处理。简单地组织每个图像的层操作以最小化每个引擎的上下文切换可以提高吞吐量,同时允许后续的流水线操作稍后但仍然比纯顺序处理要早地切入。基于转型器的生成性AI网络提供了另一个好例子,注意和规范化步骤的交替使得可以对连续的识别任务进行流水线处理。

批量分区也是一种方法,支持在多个引擎上运行同一个AI推理模型,每个引擎由一个独立的传感器供食。这可能支持一台监控设备的多个图像传感器。并且最后,你也可以通过让不同的引擎运行不同的模型进行分区。这个策略尤其有用于语义分割,例如,对于自动驾驶而言,部分引擎可能会检测车道标线。其他引擎可能处理开放(可驾驶)的空间分割,而另一部分可能会检测物体(行人和其他车辆)。

在优化吞吐量和利用率方面有很多选择,但是你应该如何决定最佳的AI推理应用调优方法呢?这一架构规划步骤必须在模型编译和优化之前进行。这里,你需要在分区策略之间做权衡。

例如,一个子图可能先并行,然后进行一系列的操作,有时最好仅通过流水线处理,而不是并行和流水线处理的组合。每种情况下的最佳选择将取决于图,缓冲区大小,以及上下文切换中的延迟。在这里,支持实验是确定最佳实现的关键。

芯片品牌:英特尔,型号:Core i9,适用领域:视频编辑和游戏
芯片品牌:AMD,型号:Ryzen 9,适用领域:3D建模和渲染
芯片品牌:Nvidia,型号:GeForce RTX 2080,适用领域:高清游戏和VR
芯片品牌:Qualcomm,型号:Snapdragon 865,适用领域:移动设备
芯片品牌:Apple,型号:A14 Bionic,适用领域:手机和平板电脑
芯片品牌:华为,型号:麒麟990 5G,适用领域:5G手机
热门标签
热门文章
24亿美元砸下,长鑫存储打造上海先进封装工厂
2024-06-29
闲芯小叨:拜登给韩国芯片巨头开绿灯:在华工厂可暂时摆脱出口管制
2023-05-05
闲芯小叨:台积电欧洲拓展新战略:联手汽车电子巨头抢占市场
2023-05-05
供过于求的困境即将结束?半导体市场的明天大反弹
2023-04-27
闲芯:芯片纳米越小的好处有哪些
2022-02-16
独立自主!长江存储计划采用国产设备取代进口设备
2023-04-25
电子代工大厂纬创泰州厂将停产,百名员工受影响!
2023-04-24
AMD:从低谷重生,新产品引领翻盘之战?
2023-05-04
逆势而上:电子厂采购人员必读——联电公司近况一揽子解析
2023-04-27
"2024年内存价格显现反弹趋势"
2024-01-05
半导体行业2025年展望:重要趋势与预测
2025-01-04
半导体行业的产能预测:企业装傻扮猪吃老虎?反市场情绪或是转折信号!
2023-04-24
Netlist在官司中胜诉,三星要赔约4000亿韩元
2023-04-25
Arm惊人野心:要打造自己的芯片,但是否会损及公司信誉令人担忧
2023-04-24
闲芯:最先进的中国芯片是多少纳米
2022-02-16
Google竭力追赶英伟达在AI竞争中的领先地位,但命运多舛
2023-04-24
德州仪器2023年第一季度财报:营收下滑11%,盈利同比减少25%
2023-04-26
闲芯分享8399芯片的知识
2022-02-19
英特尔面临挑战:2023年第一季度个人计算业务收入预计大幅下滑
2023-04-26
三星LSI事业部行动处理器出货量增长15%超过联发科
2023-04-21
美光被中國禁售,美国竟然要求韩国不要替补市场缺口!
2023-04-24
闲芯小叨:NXP S32K系列需求回升,价格小涨
2023-11-07
马斯克的脑机接口植入人体,将科幻变为现实
2024-01-30
闲芯平台:芯片有哪些作用
2022-02-14
闲芯:2022年还会缺芯片吗
2022-02-19
闲芯:IC芯片的常见种类及主要用途
2022-02-22
标题:武汉敏声打造高端射频滤波器生产线,投资30亿推动产能提升
2024-01-09
闲芯小叨:美国再次对4家中国企业实行SDN制裁,限制财产权益和贷款
2023-04-20
探索电源管理芯片核心技术:BCD工艺的魅力之旅
2024-07-04
"欧洲芯片法案引领创新与供应链弹性:SEMI ISS Europe 2024探索洞见"
2024-01-17