高性能计算
系统延迟等级(持续更新)
本文列举了不同技术操作的延迟时间,从亚纳秒级别的CPU寄存器访问,到毫秒级别的云网络往返延迟。举例包括访问不同层次的缓存、Linux系统调用、内存读取、磁盘操作...
OpenMp同步&互斥
OpenMP提供了多种同步和互斥机制,确保并行编程中的数据一致性和线程安全。常见的机制包括:critical用于保护临界区,atomic确保单一操作的原子性,b...
使用火焰图分析程序瓶颈
本文介绍了如何使用perf工具和FlameGraph生成火焰图,帮助分析程序性能瓶颈。通过记录CPU性能数据并使用FlameGraph脚本处理输出,可以生成SV...