AI生成技术的优化挑战 - 闲芯交易网
AI生成技术的优化挑战

一次最近的EE Times论坛针对AI生成应用进行了效率和灵活性的优化研讨。目前,AI生成硬件的制造商们正在致力于降低使用大型语言模型(LLMs)的成本,同时优化其效率和灵活性。

这项挑战源于LLMs参数的增长,这些参数的数量可以达到数十亿甚至万亿,SambaNova系统的产品高级副总裁马歇尔·乔伊在最近的EE Times谈论会上如此表示。因此,他们在内存中加入了三层架构以解决延迟,带宽和容量问题,并降低运行这类模型所需的规模和经济成本。

然而,LLMs体积的膨胀正带来另一个瓶颈,即接触度。乔伊表示,一旦模型参数达到万亿级别,因为硬件和运行LLMs的成本禁止,除了前10、20位财富公司之外,大部分人无法使用这样的模型。为了让更多人能够使用大型模型,SambaNova对经典的“专家混合”方法进行了调整,并改变了其名称。

SambaNova选择训练因精确度和任务关联度最强而被选择出的专家模型,然后将这些模型包含在一个万亿参数的“专家组合”模型中,这种模型可以在不牺牲前期学习经验的前提下接纳新数据,并且减低了计算延迟和训练,精调和推理的成本。

AI硬件和模型工作的副总裁,马特·马蒂纳表示,打破“模型架构由其训练硬件塑造”的反馈环可以提高效率。通过使用联网架构搜索和硬件循环,模型训练者可以在训练过程中决定他将使用何种硬件进行推理,该硬件的样子以及特性,从而找到适合最终推理机器的模型。

云原生处理器供应商Ampere Computing的首席产品官Jeff Wittich建议,在系统层面进行专门化最佳,因为这样做能够提供能够根据未来的变化进行调整的灵活方案。他还表示,与一种特定任务处理器紧密集成的通用CPU是一个好办法,而这一点会随着时间的推移得到实现。

芯片品牌与适用领域:

1. 英特尔:Core i5,适用于个人电脑
2. AMD:锐龙5,适用于游戏电脑
3. Nvidia:GeForce RTX 2080,适用于图像渲染与游戏
4. 苹果:M1,适用于Mac电脑
5. 华为:麒麟990,适用于智能手机
6. 高通:骁龙865,适用于高端智能手机
热门标签
热门文章
24亿美元砸下,长鑫存储打造上海先进封装工厂
2024-06-29
闲芯小叨:拜登给韩国芯片巨头开绿灯:在华工厂可暂时摆脱出口管制
2023-05-05
闲芯小叨:台积电欧洲拓展新战略:联手汽车电子巨头抢占市场
2023-05-05
供过于求的困境即将结束?半导体市场的明天大反弹
2023-04-27
闲芯:芯片纳米越小的好处有哪些
2022-02-16
独立自主!长江存储计划采用国产设备取代进口设备
2023-04-25
电子代工大厂纬创泰州厂将停产,百名员工受影响!
2023-04-24
AMD:从低谷重生,新产品引领翻盘之战?
2023-05-04
逆势而上:电子厂采购人员必读——联电公司近况一揽子解析
2023-04-27
"2024年内存价格显现反弹趋势"
2024-01-05
半导体行业2025年展望:重要趋势与预测
2025-01-04
半导体行业的产能预测:企业装傻扮猪吃老虎?反市场情绪或是转折信号!
2023-04-24
Netlist在官司中胜诉,三星要赔约4000亿韩元
2023-04-25
Arm惊人野心:要打造自己的芯片,但是否会损及公司信誉令人担忧
2023-04-24
闲芯:最先进的中国芯片是多少纳米
2022-02-16
Google竭力追赶英伟达在AI竞争中的领先地位,但命运多舛
2023-04-24
德州仪器2023年第一季度财报:营收下滑11%,盈利同比减少25%
2023-04-26
闲芯分享8399芯片的知识
2022-02-19
英特尔面临挑战:2023年第一季度个人计算业务收入预计大幅下滑
2023-04-26
三星LSI事业部行动处理器出货量增长15%超过联发科
2023-04-21
美光被中國禁售,美国竟然要求韩国不要替补市场缺口!
2023-04-24
闲芯小叨:NXP S32K系列需求回升,价格小涨
2023-11-07
马斯克的脑机接口植入人体,将科幻变为现实
2024-01-30
闲芯平台:芯片有哪些作用
2022-02-14
标题:武汉敏声打造高端射频滤波器生产线,投资30亿推动产能提升
2024-01-09
闲芯:IC芯片的常见种类及主要用途
2022-02-22
"欧洲芯片法案引领创新与供应链弹性:SEMI ISS Europe 2024探索洞见"
2024-01-17
闲芯:2022年还会缺芯片吗
2022-02-19
闲芯小叨:美国再次对4家中国企业实行SDN制裁,限制财产权益和贷款
2023-04-20
探索电源管理芯片核心技术:BCD工艺的魅力之旅
2024-07-04