(¿Asumo que te refieres a matriz-matriz en lugar de matriz-vector multiplicación?)
La multiplicación matricial-matricial es una operación interesante, una de las pocas que realmente puede acercarse a lograr el máximo rendimiento en los procesadores modernos. Sin embargo, la implementación de referencia (como la que se encuentra en netlib.org) funcionará con solo un pequeño porcentaje del pico. Entonces necesitas bloquear los bucles.
Como hay 3 bucles, ahora obtienes 6 bucles y, por lo tanto, muchas posibilidades.
Este tipo de cosas se conocen desde hace mucho tiempo y se ha investigado mucho. Le sugiero que vea el video incluido en la respuesta de Victor Eijkhout a ¿Qué hace que las bibliotecas de multiplicación de matrices como BLAS y ATLAS sean eficientes? para una buena discusión sobre cómo bloquear los bucles para el registro, el uso de L1, L2.
- ¿Cómo se debe revisar un libro?
- ¿Me puede recomendar algunos libros sobre diarios?
- ¿Cuáles son algunos libros que pueden ayudarme a entender la pobreza?
- ¿Qué libros representan mejor la cultura de Venezuela? ¿Cómo lo hacen tan bien?
- ¿Cómo se representa a los Estados Unidos en los libros de historia de su país?