| Option | +Description | +
| -a | +显示简介。 | +
| -v | +收集更多详细信息,包括dmesg信息、系统日志、Kernel配置、中断信息、网络相关信息等,输出存储在当前路径下的config_logs_xxxx目录中,xxxx是日期,每项信息均以独立文件保存。 + | +
| -b |
+ 收集bios信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -l |
+ 收集第三方日志的详细信息,包括启动信息、中断信息和网络相关信息。
+ · 指定为0表示关闭,指定为1表示开启,默认关闭。 + |
+
| -m |
+ 收集内存信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -n |
+ 收集网卡信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -t |
+ 收集系统拓扑信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -o | +指定输出文件名称,默认存储在当前路径下。
+ · 不指定的话,文件名称默认是system。 |
+
| -os |
+ 收集操作系统信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -p |
+ 收集处理器信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -s |
+ 收集磁盘信息。
+ · 指定为0表示关闭,指定为1表示开启,默认开启。 + |
+
| -ptest | +统计CPU访存带宽/延迟、FLOPS、IPC 信息。该功能通过程序运行进行评估,耗时较长,默认关闭。 + | +
| Option | +Description | +
| -m <metric,...> | +指定待采集的metric,默认设置为'ipc'。
+ . 可以通过运行hpt collect --metric-list展示支持的所有metric。 + . 每个metric在不同平台的支持情况,请参考附录A.1章 + . 每个metric包含的指标具体含义,请参考附录A.2章 + + 1. 软件指标: + sw-event: PMU软件事件,包括缺页、上下文切换、CPU迁移等指标 + + 2. CPU 指标: + ipc: 包括CPU利用率, IPC等信息 + fp: 包括浮点指令比例、执行的浮点指令数等指标 + l1: L1D, L1I cache 相关指标 + l2: L2D , L2I cache相关指标 + tlb: TLB相关指标 + topdown: Frontend_Bound/Bad_Speculation/Retired/Backend_Bound/Otherthread的占比信息(在SMT场景,同时收集多core的topdown数据,可能会出现负值) + topdown-details: topdown level 1/2/3/4的细分指标信息.由于topdown-details使用的PMC事件较多,为了获得更准确的数据,建议将采集时间设置为10s以上。各个topdown-details指标具体含义,请参考附录A.3章 + + 3. L3 metric: + l3: L3 cache相关公式 + + 4. DF metric: + di: 跨die访问相关指标 + do: 跨die访问相关指标 + cm: cacheable访问内存的指标 + iom: non-cacheable访问内存的指标 + mem-bw: 访存带宽相关指标 + cs0-lat/cs1-lat/cs2-lat/cs3-lat/ccm0-lat/ccm1-lat/ccm2-lat/ccm3-lat/iom0-lat/iom1-lat/iom2-lat/iom3-lat/: 访存延时,配合-die/-cdd/-iod使用 + Note: + · 受DF counter个数限制,每次采集只能收集一个DF metric。 + |
+
| --metric-list | +展示hpt collect支持的所有metric类型 | +
| -c <core|ccx|die|skt=n> | +指定统计某个core/ccx/die/socket的数据。
+ Note: + . n从0开始计数。 + · 默认统计所有核的数据。 + · 统计L3事件时,不支持指定-c core。 + · 统计DF事件时,默认会统计整个系统的所有die,因此忽略-c的输入信息。 + · 指定-cmd或-p时,不支持指定-c参数。 |
+
| -a | +统计所有核。默认统计所有核。
+ Note: + · -a 和-c不可以同时使用。 + · 指定-cmd或-p时,不支持指定-a参数。 |
+
| -A <sys|skt|die|ccx|core> | +配合-a/-c使用,指定数据展示的粒度。按照core/ccx/die/socket/system进行展示。
+ Note: + · 指定-cmd或-p时,不支持指定-A参数。 |
+
| -i <config file> | +用户自定义待采集的core/L3/DF事件,输入格式参考config目录下的customized.xml。
+ Note: + · 不能与 -m参数一起使用。 |
+
| -I <interval> | +指定采样间隔,单位s,最小0.05s。默认采集5次后停止,可以通过-count参数设置采样次数。
+ Note: + · 不能与 -d参数一起使用。建议在采集topdown-details功能时,将该参数设置到10000以上。 + | -count <N> | +和-I参数一起使用,用于指定打印的次数。 | + +
| -d <duration> | +指定采样时间,单位s,默认15s。
+ Note: + · 不能与 -I参数一起使用。 + |
| -o <file name> | +指定输出文件名称,默认存储在当前路径下。 | +
| -csv | +设置以csv格式输出,如果用户没有指定-o <filename>,则默认存储在当前路径下的data.csv文件中。 | +
| -p <pid> | +指定进程pid。
+ Note: + · 不能与L3和DF相关的metric一起使用。 + · 不能与 -cmd参数一起使用。 + . 不能与-a/-c/-A参数一起使用。 |
+
| -die <die id> | +指定统计访问某个DIE节点内存时的时延。
+ Note: + · 只能和cs0-lat/ccm0-lat等时延类metric一起使用。和其他metric一起使用时将被忽略。 |
+
| -cmd <command line> | +统计指定命令运行时间内的性能数据。
+ Note: + . 不能与-a/-c/-A参数一起使用。 |
+
| Option | +Description | +
| -I <interval> | +指定采样间隔,默认每隔1s采集一次数据,可以使用-count指定输出次数。
+ Note: + · 默认收集系统所有进程的资源使用情况。 |
+
| -count <count> | +指定采样次数,默认采集5次。使用时必须配合-I使用。 | +
| -cpu | +指定收集CPU利用率相关参数。如果不指定-cpu/-mem/-io/-switch,默认收集cpu资源信息。 | +
| -mem | +指定收集内存相关参数。 | +
| -io | +指定收集存储IO相关参数。 | +
| -switch | +指定收集上下文切换相关参数。 | +
| -syscall | +指定收集系统调用执行情况。
+ Note: + · 只有指定pid或指定-cmd时可以使用。 + · interval * count时间后,展示系统调用执行情况。 + · 系统调用频繁的程序,使用-syscall会影响性能。 |
+
| -p <pid1,pid2,pid3...> | +指定收集系统调用执行情况。
+ Note: + · 统计指定pid进程的CPU/内存/存储IO的资源使用情况。 + · 若指定pid进程的运行时间小于interval,则无法收集到CPU/内存/存储IO的资源使用情况数据。 + · 若指定pid进程的运行时间小于interval * count,则进程运行结束后,停止采样。 |
+
| -cmd <command> | +统计指定命令进程的CPU/内存/存储IO的资源使用情况。
+ Note: + ·要求cmd是一个单进程应用,否则hpt只能统计到父进程的资源使用情况和syscall执行情况。 + · 若cmd的运行时间小于interval,则无法收集到CPU/内存/存储IO的资源使用情况数据。 + · 若cmd的运行时间小于interval * count,则cmd运行结束后,停止采样。 |
+
| -warmup <warmup_time> | +warmup_time时间后,再开始采集数据。单位s | +
| -o <filename> | +指定输出文件名称,默认存储到当前路径下。 | +
| Option | +Parameter | +Description | +
| -cpu | +UID | +任务的user id。 | +
| PID | +任务的process id。 | +|
| %usr | +任务在用户态执行时的CPU使用率(百分比)。 | +|
| %system | +任务在内核态执行时的CPU使用率(百分比)。 | +|
| %guest | +任务在虚拟机中执行时的CPU使用率(百分比)。 | +|
| %wait | +任务在处于等待状态时的CPU使用率(百分比)。 | +|
| %CPU | +任务的总CPU使用率(百分比)。 | +|
| CPU | +任务所在的CPU id。 | +|
| Command | +任务名称。 | +|
| -mem | +minflt/s | +每秒次缺页错误次数(minor page faults),这些缺页错误不需要从磁盘加载内存页。 | +majflt/s | +每秒主缺页错误次数(major page faults),这些缺页错误需要从磁盘加载内存页。 | + + +VSZ | +Virtual Size, 任务的虚拟内存使用量,单位是kB。 | + + +RSS | +Resident Set Size, 任务的长期内存使用量,单位是kB。 | + + +%MEM | +任务的内存使用率(百分比)。 | + +
| -io | +kB_rd/s | +任务每秒从磁盘读取的数据量,单位是kB。 | +
| kB_wr/s | +任务每秒向磁盘写入的数据量,单位是kB。 | +|
| kB_ccwr/s | +任务每秒取消向磁盘写入的数据量,单位是kB。 | +|
| iodelay | +Block I/O延迟,单位是时钟周期。 | +|
| -switch | +cswch/s | +任务每秒进行自愿上下文切换的次数。 | +
| nvcswch/s | +任务每秒进行非自愿上下文切换的次数。 | +
| Option | +Description | +
| -i <interface> | +指定需要监控的网口名称。 | +
| -o <filename> | +指定输出文件名称,默认存储到当前路径下。 | +
| Option | +Description | +
| Receive/Transmit Total | +网口收包总和。 | +
| Receive/Transmit Type | +将报文按照多播/广播/单播的统计划分。 | +
| Receive/Transmit Packet/Bytes | +具体队列的收发包统计。统计的时间窗口与具体的驱动和硬件实现相关,例如在driver加载/端口up后开始统计。 | +
| Hard Interrupt | +自系统启动以来硬中断统计次数,例如281下的CPU24(7)代表CPU24上发生了7次和网络相关的硬中断,硬中断号为281。 | +
| Soft Interrupt | +自系统启动依赖的软中断统计次数,例如NET_TX下的CPU0(6)代表CPU0下发生了6次NET_TX软中断。 | +
| Option | +Description | +
| -d <JAVA_HOME> | +指定JAVA_HOME的路径。
+ Note: + 如果不指定JAVA_HOME的话,会默认使用系统的JAVA_HOME。 + |
+
| -p <PID> | +统计指定进程的信息。 | +
| -c <COMMAND> | +指定要采集功能的命令,多个命令用;分隔开。
+ 以下列举常用的cmd: + · dashboard - 当前系统的实时数据面板,包含GC信息。 + · jvm - 查看当前JVM的信息。 + · thread - 查看当前JVM的线程堆栈信息。 + · memory - 查看JVM的内存信息。 + · profiler start - 开始采集应用热点。 + · profiler stop - 结束采集应用热点,默认生成CPU的火焰图,必须与profiler start搭配使用。 + Note: + 如果使用profiler start/profiler stop: + 1. 要求系统参数perf_event_paranoid<=2,可以通过"sysctl kernel.perf_event_paranoid=2"修改。 + 2. 如果采集时间太短,可能会没有数据,可适当拉长采集时间。 + |
+
| -s <SELECT> | +通过类名或JAR文件名选择目标进程。 | +
| Option | +Description | +
| -latency | +统计全系统所有进程或指定进程的调度时延数据。 | +
| -flame | +绘制系统冷火焰图(off-cpu火焰图),输出svg文件,默认输出文件名是offcpu.svg。
+ Note: + · -flame与-p不能同时使用。 + · -flame与-cmd不能同时使用。 |
+
| -d <duration> | +收集指定时间内,系统的调度信息,单位s,默认15s。 | +
| -s <show> | +指定latency数据展示的方式,默认-s 0,表示按command粒度展示数据,-s 1表示按pid粒度展示数据,-s 2表示按tid粒度展示数据。 | +
| -p <pid> | +hpt收集指定pid对应的进程的调度信息,可以指定多个进程,进程pid之间用逗号分开。
+ Note: + · -p与-cmd不能同时使用。 + · -p与-flame不能同时使用。 + |
+
| -warmup <warmup_time> | +warmup_time时间后,再开始采集数据,单位s。 | +
| -cmd <command> | +统计指定命令运行时间内,全系统所有进程/线程的调度信息。
+ Note: + · -cmd与-p不能同时使用。 + · -cmd与-flame不能同时使用。 + |
+
| -o <filename> | +将收集到的进程latency解析结果或冷火焰图存储到当前路径下的filename文件中,冷火焰图的命名为<filename>.svg。 | +
| Parameter | +Description | +
| pid/tid | +展示对应的进程ID/线程ID。 | +
| command | +展示对应的进程/线程名称。 | +
| on-cpu | +展示对应的进程/线程在CPU上运行的总时长,单位ms。 | +
| wait | +展示对应的进程/线程因为等待某些资源(例如锁、信号量、I/O操作),而没有被调度到CPU上的时间,单位ms。 | +
| blocked | +展示对应的进程/线程处于阻塞状态的时长,单位ms。 | +
| sleep | +展示对应的进程/线程处于休眠状态的时长,单位ms。 | +
| switch | +展示对应的进程/线程发生调度的总次数。 | +
| delay | +展示对应的进程/线程总调度时延,单位ms。 | +
| avg-delay | +展示对应的进程/线程平均调度时延,单位ms。 | +
| cpu-migration | +展示对应的进程/线程发生CPU切换的次数。 | +
| die-migration | +展示对应的进程/线程在die间切换的次数。 | +
| Option | +Description | +
| -u | +本次采样只收集用户态进程的热点函数。
+ Note: + · 默认收集内核态和用户态进程的热点函数。 |
+
| -k | +本次采样只收集内核态进程的热点函数。
+ Note: + · 默认收集内核态和用户态进程的热点函数。 |
+
| -f <frequency> | +设置采样频率,默认每秒采集4000次。 + |
| -c <core> | +设置采样的CPU list,支持同时采集多个CPU。默认采集整个系统的全部CPU。
+ Note: + · -c与-cmd / -p / -t 参数不能同时使用。 + |
| -a | +设置采集整个系统的热点函数,默认配置为-a。 | +
| -g | +收集采样的调用栈。 | +
| -e <event name> | +设置采样的事件。支持的event list如下:
+ ·cycles:基于cycles事件采样,收集程序中的热点函数 + ·cycles:p:基于IBS精准采样,收集程序中的热点函数 + ·insn:基于retired instruction事件采样 + ·insn:p:基于IBS精准采样,收集程序中retired instruction事件采样 + ·mem-access:分析远近端访存的热点函数 + ·cache: 基于icache/dcache access和icache/dcache miss的热点函数 + Note: + · 默认采集cycles事件。 |
+
| -flame | +绘制系统火焰图(on-cpu火焰图),输出svg文件,默认输出文件名是oncpu.svg。
+ Note: + · -flame必须与-g同时使用。 |
+
| -d <duration> | +收集指定时间内,系统的热点函数信息,单位s,默认15s。 | +
| -p <pid> | +收集指定pid对应的进程的热点函数信息,只能指定单个进程。
+ Note: + · -p与-cmd / -t / -c参数不能同时使用。 + |
+
| -t <tid> | +收集指定tid对应的线程的热点函数信息,只能指定单个线程。
+ Note: + · -t与-cmd / -p/ -c参数不能同时使用。 + |
+
| -warmup <warmup_time> | +warmup_time时间后,再开始采集数据,单位s。 | +
| -cmd <command> | +统计指定命令运行时间内,全系统所有进程/线程的热点信息。
+ Note: + · -cmd与-c / -p / -t参数不能同时使用。 + |
+
| -o <filename> | +将收集到的热点函数信息或火焰图存储到当前路径下的filename文件中,火焰图的命名为<filename>.svg。 | +
| Option | +Description | +
| -l | +展示系统的内存配置信息,包括系统上可用的NUMA节点数、各NUMA间的距离、各个NUMA节点的总内存大小、各个NUMA节点的可用内存大小。
+ Note: + · 参数-l优先级最高,当与其他参数混用时,会忽略其他参数,仅展示系统的内存配置信息。 + |
+
| -p <pid> | +收集指定pid对应进程的访存信息,只能指定单个进程。
+ Note: + · -p与-cmd不能同时使用。 + |
+
| -v | +展示每个进程中,各DIE CPU的访存情况。 | +
| -vv | +分析指定进程中访问内存行为的细节信息,如:各DIE CPU访问具体各DIE 内存的次数。 Note: + · -vv必须与-p同时使用。 + · -vv只能在开IBS的平台使用。 + |
+
| -c2c | +分析指定进程中发生伪共享的细节信息。
+ Note: + · -c2c必须与-p同时使用。 + · -c2c只能在开IBS的平台使用。 + |
+
| -n <num> | +设置hpt mem最多展示num个进程的访存情况,默认值为20。 | +
| -d <duration> | +收集指定时间内进程的访存信息,单位s,默认15s。 | +
| -cmd <command> | +统计指定命令运行时间内,全系统所有进程的访存信息。
+ Note: + · -cmd与-p参数不能同时使用。 + |
+
| -o <filename> | +将收集到的访存信息存储到当前路径下的filename文件中。 | +
| Option | +Parameter | +Description | +
| -v | +RMA(K) | +进程发生跨DIE访存的次数,单位是K。 | +
| LMA(K) | +进程发生本DIE访存的次数,单位是K。 | +|
| RMA/LMA | +进程发生跨DIE访存次数和本节点访存次数的比例。 | +|
| -vv | +memory access | +采样过程中收集到的进程发生访存的次数。 | +remote access | +采样过程中收集到的进程发生跨DIE访存的次数。 | + + +进程访存信息矩阵 | +矩阵的行描述进程访问的地址所在的DIE,列描述进程运行所在的DIE。 | + + +-c2c | +cacheline addr | +发生伪共享访问的cacheline地址。 | + + +cacheline offset | +发生伪共享访问的地址在cacheline中的偏移。 | + + +load & store | +本次采样过程中,CPU 读写内存的次数。 | + + +load hitm | +本次采样过程中,CPU 访问处于Modified状态的cacheline的次数。 | + +
| PMU unit | +metric | +海光1号 | +海光2号 | +C86-3G | +C86-4G | +
| CORE | +ipc | +Y | +Y | +Y | +Y | +
| fp | +|||||
| topdown | +|||||
| topdown-details | +|||||
| l1 | +|||||
| l2 | +|||||
| tlb | +|||||
| L3 | +l3 | +Y | +Y | +Y | +Y | +
| DF | +di | +Y | +Y | +Y | +748x系列只能收集跨socket间带宽,无法收集socket内跨die带宽 | +
| do | +|||||
| cm | +Y | +Y | +Y | +Y | +|
| iom | +|||||
| cs0-lat | +Y | +Y | +Y | +Y | +|
| cs1-lat | +|||||
| cs2-lat | +N | +N | +N | +Y | +|
| cs3-lat | +部分支持 除749x系列外的其他C86-4G平台均支持 |
+ ||||
| ccm0-lat | +Y | +Y | +Y | +Y | +|
| ccm1-lat | +|||||
| ccm2-lat | +N | +N | +N | +Y | +|
| ccm3-lat | +|||||
| iom0-lat | +Y | +Y | +Y | +Y | +|
| iom1-lat | +N | +N | +N | +Y | +|
| iom2-lat | +|||||
| iom3-lat | +|||||
| software-event | +sw-event | +和OS版本相关,要求OS版本高于Linux 2.6 | +|||
| metrics | +target | +description | +
| ipc | +cpu-freq | +采集过程中cpu平均频率 | +
| retired-insn | +retired指令数 | +|
| IPC | +Instructions Per Cycle (IPC),指的是平均每个CPU cycle完成指令数 | +|
| branch-miss-ratio | +分支预测错误的跳转指令在retired跳转指令中的占比 | +|
| branch-mpki | +branch miss per kilo instructions.平均每一千条指令中分支预测错误的跳转指令数 | +|
| fp | +MMX-ratio | +retired MMX指令在retired指令中的占比 | +
| SSE-ratio | +retired SSE指令在retired指令中的占比 | +|
| x87-ratio | +retired x87指令在retired指令中的占比 | +|
| fp-ratio | +retired 浮点指令在retired指令中的占比 | +|
| topdown | +frontend-bound | +由于前端没有提供足够的指令数引起的pipeline stall的占比 | +
| bad-speculation | +由于分支预测错误引起的pipeline stall的占比 | +|
| retired | +retired upos占比 | +|
| backend-bound | +后端引起的pipeline stall的占比 | +|
| other-thread | +由于逻辑核资源竞争引起的pipeline stall的占比 | +|
| topdown-details | +参考附录A.3 topdown-details指标含义介绍 | +|
| l1 | +l1-icache-access | +L1 Icache access次数 | +
| l1-icache-miss-ratio | +L1 Icache miss率 | +|
| l1-icache-mpki | +L1 Icache miss per kilo instructions.平均每一千条指令中L1 Icache miss次数 | +|
| l1-icache-bw | +L1 Icache 访问带宽 | +|
| l1-dcache-access | +L1 Dcache access次数 | +|
| l1-dcache-miss-ratio | +L1 Dcache miss率 | +|
| l1-dcache-mpki | +L1 Dcache miss per kilo instructions.平均每一千条指令中L1 Dcache miss次数 | +|
| l1-dcache-bw | +L1 Dcache 访问带宽 | +|
| l2 | +l2-icache-access | +L2 Icache access次数 | +
| l2-icache-miss-ratio | +L2 Icache miss率 | +|
| l2-icache-mpki | +L2 Icache miss per kilo instructions.平均每一千条指令中L2 Icache miss次数 | +|
| l2-icache-bw | +L2 Icache 访问带宽 | +|
| l2-dcache-access | +L2 Dcache access次数 | +|
| l2-dcache-miss-ratio | +L2 Dcache miss率 | +|
| l2-dcache-mpki | +L2 Dcache miss per kilo instructions.平均每一千条指令中L2 Dcache miss次数 | +|
| l2-dcache-bw | +L2 Dcache 访问带宽 | +|
| l2-prefetch | +L2硬件预取引入的access次数 | +|
| l2-prefetch-miss-ratio | +L2 硬件预取 miss率 | +|
| l2-prefetch-mpki | +L2 prefetch miss per kilo instructions.平均每一千条指令中L2 prefetch miss次数 | +|
| tlb | +l1-itlb-miss-ratio | +L1 ITLB miss率 | +
| l2-itlb-miss-ratio | +L2 ITLB miss率 | +|
| l1-dtlb-miss-ratio | +L1 DTLB miss率 | +|
| l2-dtlb-miss-ratio | +L1 DTLB miss率 | +|
| l3 | +l3-cache-access | +L3 cache access次数 | +
| l3-cache-miss | +L3 cache miss次数 | +|
| l3-cache-miss-ratio | +L3 cache miss率 | +|
| di | +die in bandwidth | +每个Die的内存被跨Die访问的带宽,C86-4G平台上还会收集内存被跨socket访问的带宽 | +
| do | +die out bandwidth | +每个Die的CPU或IO跨Die访问其他节点内存的带宽,C86-4G平台上还会收集跨socket访存的带宽 | +
| cm | +CS_RD | +每个内存通道收到的cacheable读请求数(rdblk请求) | +
| CS_WR | +每个内存通道收到的cacheable写请求数(vicblockfull请求) | +|
| TOTAL_BW | +每个Die的内存被cacheable访问的总带宽 | +|
| iom | +CS_Rd | +每个内存通道收到的non-cacheable读请求数 | +
| CS_Wr | +每个内存通道收到的non-cacheable写请求数 | +|
| TOTAL_BW_MIN/TOTAL_BW_AX | +每个Die的内存被non-cacheable访问的最小/最大总带宽。由于每次non-cacheable读写的数据可能是32Byte,也可能是64Byte,因此计算出带宽可能的最大值/最小值用于估算带宽 + | +|
| mem-bw | +read-requests | +读每个Die的内存的请求数 | +
| write-requests + | 写每个Die的内存的请求数 | +|
| min-mem-access-bw + | 每个Die的内存被访问的最小带宽。部分读请求每次读的数据可能是32Byte,也可能是64Byte,因此只给出访存带宽的最大最小值。(相当于cm统计的cacheable带宽和iom统计的non-cacheable带宽之和) | +|
| max-mem-access-bw + | 每个Die的内存被访问的最大带宽。部分读请求每次读的数据可能是32Byte,也可能是64Byte,因此只给出访存带宽的最大最小值。(相当于cm统计的cacheable带宽和iom统计的non-cacheable带宽之和) | +|
| cs0-lat/cs1-lat/cs2-lat/cs3-lat | +avg-cacheable-latency | +指定DIE上的CPU(-die参数指定) cacheable访问各个DIE内存的平均时延, 单位ns | +
| avg-non-cacheable-latency | +指定DIE上的CPU(-die参数指定) non-cacheable访问各个DIE内存的平均时延, 单位ns | +|
| total-rdblk-latency/total-rdsized-latency | +指定DIE上的CPU(-die参数指定) cacheable或non-cacheable访问各个DIE内存的所有请求的总时延,单位cycle | +|
| total-rdblk-requests/total-rdsized-requests | +指定DIE上的CPU(-die参数指定) cacheable或non-cacheable访问各个DIE内存的总请求数 | +|
| ccm0-lat/ccm1-lat/ ccm2-lat/ccm3-lat | +avg-cacheable-latency | +各个DIE上的CPU cacheable访问指定DIE内存(-die参数指定)的平均时延, 单位ns | +
| total-latency | +各个DIE上的CPU cacheable访问指定DIE内存(-die参数指定)的所有请求的总时延,单位cycle | +|
| total-requests | +各个DIE上的CPU cacheable访问指定DIE内存(-die参数指定)的总请求数 | +|
| iom0-lat/iom1-lat/ iom2-lat/iom3-lat | +avg-non-cacheable-latency | +各个DIE上的IO设备 non-cacheable访问指定DIE内存(-die参数指定)的平均时延, 单位ns | +
| total-rdsized-latency | +各个DIE上的IO设备 non-cacheable访问指定DIE内存(-die参数指定)的所有请求的总时延,单位cycle | +|
| total-rdsized-requests | +各个DIE上的IO设备 non-cacheable访问指定DIE内存(-die参数指定)的总请求数 | +|
| sw-event | +alignment-faults | +统计内存不对齐访问发生的次数 | +
| page-faults | +统计缺页错误发生的次数 | +|
| context-switches | +统计进程上下文切换发生的次数 | +|
| cpu-migrations | +统计进程在CPU间迁移发生的次数 | +|