zikele

zikele

人生如此自可乐

通过在IREE中启用RISC-V微内核支持来加速GenAI工作负载

2508.14899v1

中文标题#

通过在 IREE 中启用 RISC-V 微内核支持来加速 GenAI 工作负载

英文标题#

Accelerating GenAI Workloads by Enabling RISC-V Microkernel Support in IREE

中文摘要#

该项目使 IREE 支持 RISC-V 微内核,IREE 是一个基于 MLIR 的机器学习编译器和运行时。 该方法首先在 IREE 的传递管道中为 RISC-V64 目标启用 MLIR linalg 方言收缩操作到 linalg.mmt4d 操作的降低,然后开发了针对 RISC-V 的优化微内核。 与上游 IREE 和 Llama.cpp 相比,对 Llama-3.2-1B-Instruct 模型的性能增益进行了比较。

英文摘要#

This project enables RISC-V microkernel support in IREE, an MLIR-based machine learning compiler and runtime. The approach begins by enabling the lowering of MLIR linalg dialect contraction ops to linalg.mmt4d op for the RISC-V64 target within the IREE pass pipeline, followed by the development of optimized microkernels for RISC-V. The performance gains are compared with upstream IREE and Llama.cpp for the Llama-3.2-1B-Instruct model.

文章页面#

通过在 IREE 中启用 RISC-V 微内核支持来加速 GenAI 工作负载

PDF 获取#

查看中文 PDF - 2508.14899v1

智能达人抖店二维码

抖音扫码查看更多精彩内容

加载中...
此文章数据所有权由区块链加密技术和智能合约保障仅归创作者所有。