LinuxLists.cc - [tip:x86/boot] [x86/acpi/boot] e2869bd7af: stress-ng.uprobe.ops_per

2023-01-30 09:53:43

Subject: [tip:x86/boot] [x86/acpi/boot] e2869bd7af: stress-ng.uprobe.ops_per_sec 29.4% improvement

Greeting,

FYI, we noticed a
commit: e2869bd7af608c3439 88429ceb1c2fe99644a01f ("x86/acpi/boot: Do not register processors that cannot be onlined for x2APIC")
el.org/cgit/linux/kernel/git/tip/tip.git">https://git.kernel.org/cgit/linux/kernel/git/tip/tip.git x86/boot
48 threads 2 sockets Intel(R) Xeon(R) CPU E5-2697 v2 @ 2.70GHz (Ivy Bridge-EP) with 112G memory
===============================================================
ernor/kconfig/nr_threads/rootfs/tbox_group/test/testcase/testtime:
86_64-rhel-8.3/100%/debian-11.1-x86_64-20220510.cgz/lkp-ivb-2ep1/uprobe/stress-ng/60s
s/head-object-list: Remove x86 from the list")
Do not register processors that cannot be onlined for x2APIC")
e2869bd7af608c343988429ceb1
---------------------------
%stddev
\
2598 stress-ng.time.system_time
+29.4% 281951 stress-ng.uprobe.ops
4611 stress-ng.uprobe.ops_per_sec
0.37 ? 2% mpstat.cpu.all.usr%
10907 meminfo.KernelStack
21099 meminfo.Percpu
-19.0% 152278 meminfo.VmallocUsed
740875 ?149% numa-meminfo.node0.FilePages
737664 ?149% numa-meminfo.node0.Unevictable
5058 ? 11% numa-meminfo.node1.KernelStack
185218 ?149% numa-vmstat.node0.nr_file_pages
184416 ?149% numa-vmstat.node0.nr_unevictable
184416 ?149% numa-vmstat.node0.nr_zone_unevictable
5058 ? 11% numa-vmstat.node1.nr_kernel_stack
10911 proc-vmstat.nr_kernel_stack
-3.3% 22529 proc-vmstat.nr_slab_reclaimable
-6.5% 25084 proc-vmstat.nr_slab_unreclaimable
-1.9% 290725 proc-vmstat.numa_hit
-1.3% 52059 proc-vmstat.numa_other
-2.9% 263567 proc-vmstat.pgfault
0.38 ? 12% sched_debug.cfs_rq:/.h_nr_running.stddev
16144 ? 6% sched_debug.cfs_rq:/.min_vruntime.stddev
0.35 ? 19% sched_debug.cfs_rq:/.nr_running.stddev
16151 ? 6% sched_debug.cfs_rq:/.spread0.stddev
-20.9% 227.68 ? 10% sched_debug.cfs_rq:/.util_est_enqueued.stddev
1285 ? 19% sched_debug.cpu.curr->pid.stddev
0.38 ? 12% sched_debug.cpu.nr_running.stddev
+8.9% 13802380 perf-stat.i.branch-misses
+16.3% 3176876 ? 4% perf-stat.i.cache-misses
+16.4% 27741896 perf-stat.i.cache-references
55528 ? 5% perf-stat.i.cycles-between-cache-misses
+23.4% 419908 ? 10% perf-stat.i.dTLB-store-misses
+13.0% 5.527e+08 perf-stat.i.dTLB-stores
30234 ? 3% perf-stat.i.iTLB-loads
-7.8% 221882 ? 5% perf-stat.i.instructions-per-iTLB-miss
+18.0% 615.09 ? 2% perf-stat.i.metric.K/sec
+33.7% 1184229 ? 4% perf-stat.i.node-load-misses
+33.1% 1328416 ? 4% perf-stat.i.node-loads
+32.0% 626649 ? 5% perf-stat.i.node-store-misses
+28.9% 839098 ? 4% perf-stat.i.node-stores
0.40 ? 2% perf-stat.overall.MPKI
93.35 perf-stat.overall.iTLB-load-miss-rate%
+8.8% 13570687 perf-stat.ps.branch-misses
+16.2% 3125339 ? 4% perf-stat.ps.cache-misses
+16.3% 27310650 perf-stat.ps.cache-references
+23.3% 413395 ? 10% perf-stat.ps.dTLB-store-misses
+13.0% 5.442e+08 perf-stat.ps.dTLB-stores
29754 ? 3% perf-stat.ps.iTLB-loads
+33.5% 1165539 ? 4% perf-stat.ps.node-load-misses
+33.0% 1307445 ? 4% perf-stat.ps.node-loads
+31.9% 616759 ? 5% perf-stat.ps.node-store-misses
+28.8% 825704 ? 4% perf-stat.ps.node-stores
1.23 perf-profile.calltrace.cycles-pp.trace_find_next_entry_inc.tracing_read_pipe.vfs_read.ksys_read.do_syscall_64
1.22 perf-profile.calltrace.cycles-pp.__find_next_entry.trace_find_next_entry_inc.tracing_read_pipe.vfs_read.ksys_read
1.02 ? 2% perf-profile.calltrace.cycles-pp.ring_buffer_empty_cpu.__find_next_entry.trace_find_next_entry_inc.tracing_read_pipe.vfs_read
0.55 ? 6% perf-profile.calltrace.cycles-pp.tracing_wait_pipe.tracing_read_pipe.vfs_read.ksys_read.do_syscall_64
0.57 perf-profile.calltrace.cycles-pp.trace_print_context.print_trace_fmt.tracing_read_pipe.vfs_read.ksys_read
0.59 ? 2% perf-profile.calltrace.cycles-pp.print_trace_fmt.tracing_read_pipe.vfs_read.ksys_read.do_syscall_64
0.08 perf-profile.children.cycles-pp._find_next_bit
1.23 perf-profile.children.cycles-pp.trace_find_next_entry_inc
1.23 perf-profile.children.cycles-pp.__find_next_entry
0.10 ? 5% perf-profile.children.cycles-pp.memcpy_erms
0.11 ? 6% perf-profile.children.cycles-pp.ring_buffer_empty
0.12 ? 4% perf-profile.children.cycles-pp.trace_print_lat_fmt
0.14 ? 6% perf-profile.children.cycles-pp.number
0.07 perf-profile.children.cycles-pp.trace_event_buffer_reserve
0.06 perf-profile.children.cycles-pp.trace_event_buffer_lock_reserve
0.18 ? 6% perf-profile.children.cycles-pp.print_uprobe_event
0.06 ? 6% perf-profile.children.cycles-pp.ring_buffer_peek
0.08 ? 8% perf-profile.children.cycles-pp.peek_next_entry
0.13 ? 12% perf-profile.children.cycles-pp.finish_wait
0.06 ? 7% perf-profile.children.cycles-pp.__select
0.20 ? 2% perf-profile.children.cycles-pp.format_decode
0.14 ? 7% perf-profile.children.cycles-pp.__uprobe_trace_func
0.05 perf-profile.children.cycles-pp.ring_buffer_lock_reserve
0.17 ? 8% perf-profile.children.cycles-pp.prepare_to_wait
0.05 ? 8% perf-profile.children.cycles-pp.rb_buffer_peek
0.05 ? 8% perf-profile.children.cycles-pp.trace_event_buffer_commit
0.20 ? 8% perf-profile.children.cycles-pp.handler_chain
0.20 ? 6% perf-profile.children.cycles-pp.uprobe_dispatcher
0.22 ? 6% perf-profile.children.cycles-pp.exit_to_user_mode_prepare
0.22 ? 5% perf-profile.children.cycles-pp.irqentry_exit_to_user_mode
0.21 ? 7% perf-profile.children.cycles-pp.exit_to_user_mode_loop
0.22 ? 6% perf-profile.children.cycles-pp.asm_exc_int3
0.21 ? 7% perf-profile.children.cycles-pp.uprobe_notify_resume
0.26 ? 3% perf-profile.children.cycles-pp.trace_empty
0.21 ? 6% perf-profile.children.cycles-pp.rb_set_head_page
0.23 ? 5% perf-profile.children.cycles-pp.__getpid
0.31 ? 8% perf-profile.children.cycles-pp._raw_spin_lock_irqsave
0.41 ? 6% perf-profile.children.cycles-pp.ring_buffer_wait
0.42 ? 4% perf-profile.children.cycles-pp.rb_per_cpu_empty
0.57 ? 2% perf-profile.children.cycles-pp.trace_print_context
0.61 perf-profile.children.cycles-pp.vsnprintf
0.59 ? 2% perf-profile.children.cycles-pp.print_trace_fmt
1.26 perf-profile.children.cycles-pp.ring_buffer_empty_cpu
0.62 perf-profile.children.cycles-pp.seq_buf_vprintf
0.47 ? 7% perf-profile.children.cycles-pp.native_queued_spin_lock_slowpath
0.66 perf-profile.children.cycles-pp.trace_seq_printf
0.55 ? 6% perf-profile.children.cycles-pp.tracing_wait_pipe
0.68 perf-profile.children.cycles-pp._raw_spin_lock
0.08 ? 5% perf-profile.self.cycles-pp._find_next_bit
0.28 perf-profile.self.cycles-pp.ring_buffer_empty_cpu
0.07 ? 11% perf-profile.self.cycles-pp.__find_next_entry
0.10 ? 5% perf-profile.self.cycles-pp.memcpy_erms
0.14 ? 3% perf-profile.self.cycles-pp.vsnprintf
0.12 ? 3% perf-profile.self.cycles-pp.number
0.17 ? 2% perf-profile.self.cycles-pp.format_decode
0.22 ? 3% perf-profile.self.cycles-pp.rb_per_cpu_empty
0.20 ? 8% perf-profile.self.cycles-pp.rb_set_head_page
0.51 perf-profile.self.cycles-pp._raw_spin_lock
0.47 ? 7% perf-profile.self.cycles-pp.native_queued_spin_lock_slowpath
href="https://github.com/intel/lkp-tests.git">https://github.com/intel/lkp-tests.git
# job file is attached in this email
--compatible job.yaml # generate the yaml file for lkp run
run generated-yaml-file
across any failure that blocks the test,
remove ~/.lkp and /lkp dir to run from a clean state.
estimated based on internal Intel analysis and are provided
purposes only. Any difference in system hardware or software
may affect actual performance.
om/intel/lkp-tests">https://github.com/intel/lkp-tests

Attachments:

(No filename) (11.55 kB)
config-6.2.0-rc3-00003-ge2869bd7af60 (163.03 kB)
job-script (7.87 kB)
job.yaml (5.42 kB)
reproduce (338.00 B)
Download all attachments