创新产品 > 2024 > 其它 > 正文
智算卡SC11 FP300
2024/9/30 12:42:00      关键字:     
智算加速卡SC11 FP300是面向云端智能应用的算力卡,可应用于大语言模型推理、文生图等应用场景,且高效适配市场上主流深度学习算法,实现音视频审核、音视频转码、结构化、行为分析等智能应用,为智慧城市、智慧交通、智慧能源、智慧金融、智慧电信、智慧工业等行业赋能。相对于国内外主流竞品,SC11提供更高效的推理成本和功耗成本。对比NV A6000、A40、A30、RTX4090等国外竞品,以及910B
企业名称:厦门算能科技有限公司

产品概况:

智算加速卡SC11 FP300相对于国内外主流竞品,SC11 FP300提供更高效的推理成本和功耗成本。对比NV A6000、A40、A30、RTX4090等国外竞品,以及910B等国内竞品在不同参数量的大语言模型推理场景下的价格和功耗。SC11 FP300在多数对比中均超越竞品。

关键技术指标:

该智算加速卡有如下特点:
●高性能
支持INT8/FP8/TF32/FP16/BF16/FP32精度
支持多芯多卡互联
高达256GB显存容量,超过1.1TB/s带宽
多路编解码能力
●低功耗
低电压技术
低功耗内存技术
●低成本
最佳带宽-容量-成本比例内存
先进封装、高冗余设计保证高良率

产品创新点:

1.低功耗大算力
整卡功耗300W,提供超过400TOPS INT8/FP8 定点算力,超过200TFLOPS FP16/BF16浮点算力,超过100TFLOPS TF32浮点算力,以及超过25TFLOPS FP32浮点算力,为智能训练和推理提供充沛的算力。
2.高效的多卡扩展
SC11 FP300通过SG-Link实现多卡高速互联,单台4U服务器可提供最大2TB显存空间,极大降低模型调优等开发成本。
同时通过板卡提供的网络扩展端口,可以使用通用交换机支持千卡集群。拓扑结构如下图所示。
3.更丰富的数据精度
针对智能普遍采用更低位宽数据格式来提升算力并降低对存储容量和存储带宽的需求,SC11在支持传统的FP32、FP16、BF16和INT8格式之外,加入了TF32、FP8、INT4、NF4等格式的支持。
4.云边端统一的软件工具链
为了减少模型移植和适配工作,加速客户模型无缝算力扩展,算能提供云边端统一的工具链。一个模型只移植一次,就可以在算能多个算力处理器平台运行。同时所有软件工具开源,免除客户后顾之忧。配合SC11提供的软件工具如下图所示。
5.有机融合RISC-V和智能计算
SC11内置RISC-V处理能力。针对个别算法中长尾算子无法快速完成移植的情况,内置的RISC-V可以快速编译生成算子,支持算法的全流程移植。
6.专用硬件加速单元加速创新引用
针对大数据量应用,例如亿级向量数据库查找、比对等操作,SC11内置排序、topK等专用加速单元,可以做亿级向量秒出结果。
7.支持多种量化算法降低推理部署成本
7.1强大的离线量化支持
SC11 SDK内置的TPU-MLIR编译器广泛支持绝大部分CV模型和LLM的PTQ(Post-Tr智能ning Quantization),提供per-channel和非对称量化选项。通过简单的一键操作,即可实现高精度和极致性能的推理,为用户提供便捷而强大的量化体验。
7.2更多量化算法
适配了 MQBench 平台,提供QAT(Quantization-Aware Tr智能ning)工具,支持多种量化算法,如lsq、adaround、qdrop、hawq,覆盖Yolo、ResNet等模型的QAT需求。
7.3支持LLM量化
适配GPTQ的量化算法,专门支持LLM模型的高效量化,支持W8A16、W4A16等混合精度模式,为自然语言处理等领域的模型提供定制优化。
7.4开源可扩展
量化算法与工具代码完全开源,可扩展支持自定义量化算法,并支持接入各种框架的量化后模型。
7.5内置安全引擎
针对安全类应用,SC11内置多种加解密引擎,支持安全计算。
支持随机数生成
支持多种对称加密
支持公钥加密算法

国内外市场推广情况:

SC11凭借其强大的智能处理能力和灵活的架构,能够适应多种前沿应用场景,尤其在生成式智能领域表现卓越。以下是SC11 FP300国内外市场的主要应用领域:
●生成式智能 (Gen智能) 推理:
支持大型语言模型和多模态智能模型的高效推理,为聊天机器人、内容生成和创意设计等应用提供强大的算力支持,实现快速响应和高质量输出。
●生成式智能 (Gen智能) 训练:
提供强劲的算力和多芯扩展能力支持大规模智能模型的训练过程,加速模型迭代和优化,助力企业和研究机构快速开发和部署先进的智能解决方案。
●视频智能处理:
在安防监控、智慧城市和直播平台等领域,SC11可实时处理多路高清视频流,执行目标检测、人脸识别和行为分析等任务,提升视频内容的智能化水平。
●车路云协同计算:
SC11在车路云协同系统中扮演着关键角色,通过强大的计算能力支持智能交通基础设施的高效运作。它能够实时处理来自车辆、道路传感器和云端的海量数据,实现交通流优化、事故预警和自动驾驶协同控制。这种协同计算模式不仅提高了交通安全性和效率,还为未来智慧城市的交通管理奠定了坚实的技术基础。
●HPC高性能计算:
通过强大的并行处理能力,SC11能够在科学计算、数据分析、金融模型和气候模拟等高性能计算场景中发挥关键作用,加速复杂问题的求解过程。
●智能驾驶控制器:
在自动驾驶和高级驾驶辅助系统中,SC11可以处理来自多个传感器的数据以及试试处理多种感知、决策类智能算法,实现路况分析、障碍物检测和路径规划等功能。
●机器人技术:
为工业机器人、服务机器人和协作机器人提供核心计算能力,实现环境感知、动作规划和人机交互等复杂任务。
●智能制造:
在工业环境中,SC11可用于生产线的实时质量控制、预测性维护和生产流程优化

微信扫描二维码,关注公众号。