OpenHarmony-Risc-V上运行openBLAS中的benchmark

news2025/7/14 7:08:21

OpenHarmony-Risc-V上运行openBLAS中的benchmark


文章目录

  • OpenHarmony-Risc-V上运行openBLAS中的benchmark
  • 前言
  • 一、编译openBLAS
    • 1.源码下载
    • 2.工具链下载
    • 3.编译并安装openBLAS
  • 二、编译open BLAS中的benchmark
  • 三、上设备运行
  • 总结


前言

参考https://zhuanlan.zhihu.com/p/18825495043实现了在Risc-V架构设备上的OpenHarmony-5.0.0环境中运行openBlas的benchmark。


一、编译openBLAS

1.源码下载

自行扶墙或者使用github下载站。使用默认的develop分支。

git clone https://github.com/OpenMathLib/OpenBLAS.git

2.工具链下载

Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1

  • 获取玄铁支持rvv1.0的gcc工具链。
    参考原文中有一处描述错误,由于当时没仔细看,下载的是V2.10.2版本,该版本仅支持RISC-V Vector extension 0.7.1,导致编译OpenBLAS的x280时会有以下报错:
    在这里插入图片描述
    使用2.10.2版本编译open BLAS的C910V正常。
  • 解压后配置环境变量(以下命令根据自己环境对应的目录进行修改)

export PATH=/opt/liusai/github/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1/bin:$PATH

3.编译并安装openBLAS

  • 编译

cd OpenBLAS
make HOSTCC=gcc TARGET=x280 CC=riscv64-unknown-linux-gnu-gcc FC=riscv64-unknown-linux-gnu-gfortran

正常编译成功结算画面如下:
在这里插入图片描述
如产生编译错误,纠正后重新编译请使用“make clean”。

  • 安装

mkdir build
make PREFIX=./build install

产物如下:
在这里插入图片描述

二、编译open BLAS中的benchmark

以benchmark中的gemm.c为例

cd benchmark
…/…/…/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V3.0.1/bin/riscv64-unknown-linux-gnu-gcc gemm.c -o gemm_test_3.0.1 -I …/ -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall
…/…/…/Xuantie-900-gcc-linux-6.6.0-glibc-x86_64-V2.10.2/bin/riscv64-unknown-linux-gnu-gcc -o gemm_test_2.10.2 -I …/build/include -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall
/opt/liusai/musepaper-5.0.0/prebuilts/gcc/linux-x86/riscv64/spacemit-riscv-gcc/bin/riscv64-unknown-linux-gnu-gcc gemm.c -o gemm_test_spacemit -I …/ -L …/build/lib -lopenblas -lpthread -lgfortran -O2 -Wall

使用了三种工具链,编译出不同的gemm_test,可以在运行过程中进行比较。

三、上设备运行

使用的是进迭时空的musepaper,提前烧录OH-5.0.0版本。

  • 通过HDC将需要的文件拷至设备的/lib目录

hdc target mount
hdc file send .\openblas\spacemit\libpthread.so.0 /lib/
hdc file send .\openblas\ld-linux-riscv64-lp64d.so.1 /lib/
hdc file send .\openblas\gemm_test_3.0.1 /lib/
hdc file send .\openblas\libopenblas.so.0 /lib/
hdc file send .\openblas\libc.so.6 /lib/

注意:运行不同工具链编译的产物时,链接器ld-linux-riscv64-lp64d.so.1、libpthread.so.0、libc.so.6不可混用,否则会报错不可运行。这些均可以在工具链的安装目录中找到。

  • 配置环境变量

export LD_LIBRARY_PATH=/lib:$LD_LIBRARY_PATH

  • 运行

直接./gemm_test_3.0.1即可。

运行gemm_test_spacemit时有“./gemm_test_spacemit: /lib/libc.so.6: version ‘GLIBC_2.34’ not found (required by ./gemm_test_spacemit)”报错,请将对应工具链的libc.so.6拷贝至/lib下。
运行效果如下:
在这里插入图片描述


总结

  • 后续就是llama.cpp通过openBLAS提升运行效率。
  • ldd命令仅支持查看相同架构的可执行程序或者库文件,比如在X86_84的ubuntu环境中使用ldd查看risc-v架构的gemm_test会产生“not a dynamic executable”。
  • 使用patchelf命令也可以查看依赖。

patchelf gemm_test_spacemit --print-needed

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2338009.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HAL库通过FATFS和SDIO+DMA写入SD卡数据错误

HAL库F4版本 1.28.1 最近在使用HAL库配置SDIODMA并通过FATFS向SD卡写入数据,但是发现写入的数据经常有错误,不是少了一部分就是多了一部分,写入的数据为csv格式,通过循环向缓冲区写入"100100,12.345678\r\n"数据来观察问…

python-图片分割

图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,例如分割出物体、前景背景或特定的部分。在 Python 中,常用的图片分割方法包括传统的图像处理技术(例如阈值分割、区域生长等)和深度学习…

江湖路远,唯PUT可稳:Express 路由更新招式全解

前言 江湖传闻,后端开发如同修炼绝世武功:有人精通 POST 掌,横扫千军;有人修习 GET 指法,探查万象。而真正踏入高阶境界的高手,常常默默修炼一门冷门却威力极强的秘技,PUT 神功。 今日时机正好,你我相逢于码海江湖,不如来一场技术切磋,也许能悟出更新之道,功力再上…

MySQL:Join连接的原理

连接查询的执行过程: 确定第一个需要查询的表【驱动表】 选取代价最小的访问方法去执行单表查询语句 从驱动表每获取到一条记录,都需要到t2表中查找匹配的记录 两表连接查询需要查询一次t1表,两次t2表,在两表的连接查询中&…

2025.04.14【Table】| 生信数据表图技巧

Custom title A set of examples showing how to customize the titles of a table made with GT Custom footer How to customize the footer and the references section of a gt table 文章目录 Custom titleCustom footer 生信数据可视化:Table图表详解1. R语…

使用Trae CN分析项目架构

架构分析后的截图 A区是打开的项目、B区是源码区、C区是AI给出当前项目的架构分析结果。 如何用 Trae CN 快速学习 STM32 嵌入式项目架构 在嵌入式开发领域,快速理解现有项目的架构是一项关键技能。Trae CN 作为一款强大的分析工具,能帮助开发者高效剖…

浏览器缩放后 element ui组件偏移

一、需求:当body的有了zoom值之后,element ui相关的popper弹框(下拉框、日期选择框、分页组件)位置都会出现偏移问题 二、问题来源 popper弹框都会需要根据屏幕x,y的坐标来设置位置,但是有了zoom值之后,x,y…

FPGA学习——DE2-115开发板上设计波形发生器

1. 实验目的 掌握直接数字频率合成(DDS)技术的基本原理和应用。使用DE2-115开发板实现正弦波和方波的生成。使用SignalTap II嵌入式逻辑分析仪测试输出波形的离散数据。 2. 实验原理 DDS技术:通过相位累加器生成相位信息,结合波…

【springsecurity oauth2授权中心】简单案例跑通流程

项目被拆分开,需要一个授权中心使得每个项目都去授权中心登录获取用户权限。而单一项目里权限使用的是spring-security来控制的,每个controller方法上都有 PreAuthorize("hasAuthority(hello)") 注解来控制权限,想以最小的改动来实…

2025TGCTF Web WP复现

AAA 偷渡阴平 <?php$tgctf2025$_GET[tgctf2025];if(!preg_match("/0|1|[3-9]|\~|\|\|\#|\\$|\%|\^|\&|\*|\&#xff08;|\&#xff09;|\-|\|\|\{|\[|\]|\}|\:|\|\"|\,|\<|\.|\>|\/|\?|\\\\/i", $tgctf2025)){//hint&#xff1a;你可以对着键盘…

「GitHub热榜」AIGC系统源码:AI问答+绘画+PPT+音乐生成一站式

—零门槛搭建私有化AI内容工厂&#xff0c;源码开放商业落地指南 为什么全栈AIGC系统成为企业刚需&#xff1f; 1. 传统方案的致命缺陷 痛点 使用ChatGPTMidjourneyCanva 本全栈方案 工具割裂 需切换5平台 一个系统全搞定 成本 年费50万 一次部署永久免费 数据安全 …

【C++】 —— 笔试刷题day_19

一、小易的升级之路 题目解析 小易现在要打游戏&#xff0c;现在游戏角色的初始能力值为a&#xff0c;我们会遇到n个怪&#xff0c;这些怪物的防御值为b1、b2、b3...&#xff0c;如果我们的能力值要高于或者等于怪物的防御值&#xff0c;那我们的能力值就会加bi&#xff1b;如…

Kubernetes》》K8S》》Pod的健康检查

K8s概念总结 》》》Pod的生命周期阶段 Pod的生命周期可以简单描述&#xff1a;首先Pod被创建&#xff0c;紧接着Pod被调度到Node节点进行部署。 Pod是非常忠诚的&#xff0c;一旦被分配到Node节点后&#xff0c;就不会离开这个Node节点&#xff0c;直到它被删除&#xff0c;删除…

计算机视觉——基于使用 OpenCV 与 Python 实现相机标定畸变校正

概述 相机标定是一种旨在通过确定相机的内参&#xff08;焦距、光学中心、畸变系数&#xff09;和外参&#xff08;相机的位置和方向&#xff09;&#xff0c;提高图像在现实世界中的几何精度的过程。该过程可以纠正相机拍摄的图像中的畸变&#xff0c;使相机能够准确感知现实…

Python作业4 文本词云统计,生成词云

编写程序&#xff0c;统计两会政府工作报告热词频率&#xff0c;并生成词云。 2025两会政府工作报告 import jieba import wordcloud from collections import Counter import re# 读取文件 with open("gov.txt", "r", encoding"gbk") as f:t …

Jenkins 2.492.2 LTS 重置管理员密码

文章目录 1. Jenkins 关闭用户认证2. jenkins 修改密码 如果忘记了 Jenkins 的管理员密码的话&#xff0c;也不用担心&#xff0c;只要你有权限访问 Jenkins 的根目录&#xff0c;就可以轻松地重置密码。 1. Jenkins 关闭用户认证 // 查看 jenkins 家目录&#xff08;使用 doc…

【裁判文书网DES3数据解密】逆向分析

点击翻页&#xff0c;出现请求&#xff0c;可以看到请求参数有个ciphertext密文&#xff0c;响应数据也是密文 打上断点&#xff0c;点击翻页&#xff0c;断住 可以看到postData里面的ciphertext已经生成 往前跟栈&#xff0c;可以发现是var ciphertext cipher(); funct…

花园灌溉问题

#include <bits/stdc.h> using namespace std;// 设置最大行列数&#xff08;题目限制 n, m ≤ 100&#xff09; const int N 104;// 标记某个格子是否已经被水浇灌 bool used[N][N];// 队列&#xff0c;用于 BFS&#xff0c;存储当前水源的位置 queue<pair<int,i…

《AI大模型应知应会100篇》第22篇:系统提示词(System Prompt)设计与优化

第22篇&#xff1a;系统提示词(System Prompt)设计与优化 摘要 在大语言模型&#xff08;LLM&#xff09;应用中&#xff0c;系统提示词&#xff08;System Prompt&#xff09;是控制模型行为的核心工具之一。它不仅定义了模型的身份、角色和行为规范&#xff0c;还直接影响输…

Jsp技术入门指南【六】jsp脚本原理及隐式对象

Jsp技术入门指南【六】jsp脚本原理及隐式对象 前言一、JSP 脚本元素1.1 声明1.2 表达式1.3 脚本标签 二、JSP 的隐式对象是什么三、隐式对象详解outrequestsessionapplicationconfigexception 前言 在之前的博客中&#xff0c;我们已经介绍了JSP的环境搭建、编译文件查找以及生…