Imagination 。首先 Te。完成文心chnologies 宣告首先完结百度文心大模型(ERNIE 4.5 开源版)在其。大模端侧GPU 。布置硬件上的首先端侧布置。适配完结后 ,完成文心开发者 。大模端侧可在搭载 Imagination GPU 的布置设备上完成高效本地 。 AI。首先推理,完成文心一起大幅下降推理本钱 ,大模端侧这一作用也标志着 Imagination GPU 在端侧 AI 推理场景中的布置技能抢先性。
Imagination高度优化软件栈完成高效本地AI推理 、首先下降本钱。完成文心
本次适配的大模端侧文心4.5模型为开源版别,具有强壮的 。智能 。问答。、文本生成 、语义了解和常识推理才能,广泛适用于移动设备、语音帮手 、。IoT。和教育硬件等资源受限终端 。在飞桨结构支撑下 ,Imagination GPU渠道展现出超卓的推理功能。
Imagination根据现有的GPU硬件顺利完结了本次文心大模型系列开源模型布置软件栈 ,并得到实践网络验证。一起 ,Imagination高度优化的核算软件栈对AI本地推理功能进行优化,该软件栈包括OpenCL核算库 ,编译器东西链,干流。编程。结构的参阅开发套件(Reference Kits) 。
其间参阅开发套件可帮忙开发者经过TVM将干流AI结构中的代码迁移至Imagination的软件栈。该套件根据Imagination优化的OpenCL核算库和图编译器 ,运用专属A。PI 。调用