模型API构AI推理超低延时重产品体会白山云发布大
白山云。科技。正式发布“大模型A。PI。”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大言语模型。依据白山全球边际云
...
白山云。超低I产科技。重构正式发布“大模型A。推理体PI 。白山布”产品 ,模型首发上线DeepSeek-R1-0528、超低I产DeepSeek-R1-0528-Qwen3-8B、重构Qwen3-32B-FP8等大言语模型 。推理体依据白山全球边际云架构优势,白山布打造超低延时、模型超安稳 、超低I产简略易用的重构API 。接口 。推理体服务,白山布下降大模型使用本钱和开发门槛,模型助力企业和个人用户快速敞开。AI。立异之旅。
专心边际推理,构建“云边端”算力协同新范式。
跟着多模态交互、多轮会话、Agen 。ti 。c AI自主决议计划等杂乱场景迸发,传统集中式数据 。中心。的算力供应形式下 ,用户面对网络时延的线性增加、算力本钱的指数上升,更低延时 、更优本钱的边际算力推理成为必需 。边际推理经过分布式算力下沉与。智能。调度,能够为高实时 、高隐私、高性价比场景供给要害支撑,驱动AI从集中式智能迈向“云-边-端”全域协同智能 。
聚集边际推理场景,白山云依据全球1700+边际节点构成的算力网络基座,于本年3月推出“边际算力云渠道”并继续完善晋级 ,掩盖从 。GPU。算力资源到MaaS模型服务的一站式AI算力基础设施,为用户供给高功能、低本钱的AI Infra解决方案 。
·模型服务:供给预构建 、开箱即用的LLM和多模态模型服务(连续上线),只需一行代码用户即可完结模型切换与集成;依据边际节点的就近推理,为用户带来<300ms的超低延时推理体会 。
·GPU算力服务:包括GPU容器、弹性容器 、裸金属三大产品