FFmpeg 手写 AVX512 汇编代码性能提升最多 94 倍
开源多媒体编解码器项目 FFmpeg 的开发者通过手写实现优化了 AVX-512 指令集的汇编代码路径,加速 FFmpeg 多媒体处理库中的特定功能,相比标准实现,性能提升了 3-94 倍。手写汇编代码路径在视频行业是相当少见的。AVX-512 支持使用 512 位寄存器并行处理大量数据,一次操作能处理最多 16 个单精度 FLOPS 或 8 个双精度 FLOPS,它对视频和图像处理等计算密集型任务很有用。英特尔 12 到 14 代酷睿处理器禁用了 AVX-512 指令集,目前完整支持 AVX-512 的消费者 CPU 是 AMD 最近上市的 Ryzen 9000 系列处理器。
https://news.slashdot.org/story/24/11/04/2140206/ffmpeg-devs-boast-of-up-to-94x-performance-boost-after-implementing-handwritten-avx-512-assembly-code