transformers

mirror of https://github.com/huggingface/transformers.git synced 2025-07-13 17:48:22 +06:00

History

Theia Vogel e719b65c31 Fix `FbgemmFp8Linear` not preserving tensor shape (#33239 ) * add tests for linear shape behavior * fix linear shape behavior ended up adding the reshape at the end, after f8f8bf16_rowwise, because adding it directly after quantize_fp8_per_row caused f8f8bf16_rowwise to drop the seq_len dimension. (i.e., (17, 23, 1014) -> (17, 1024)) * save shape up front + comment	2024-09-11 13:26:44 +02:00
..
__init__.py	Add new quant method (#32047 )	2024-07-22 20:21:59 +02:00
test_fbgemm_fp8.py	Fix `FbgemmFp8Linear` not preserving tensor shape (#33239 )	2024-09-11 13:26:44 +02:00

Fix FbgemmFp8Linear not preserving tensor shape (#33239 )

* add tests for linear shape behavior

* fix linear shape behavior

ended up adding the reshape at the end, after f8f8bf16_rowwise, because adding
it directly after quantize_fp8_per_row caused f8f8bf16_rowwise to drop the
seq_len dimension. (i.e., (17, 23, 1014) -> (17, 1024))

* save shape up front + comment

2024-09-11 13:26:44 +02:00

__init__.py Add new quant method (#32047 ) 2024-07-22 20:21:59 +02:00

test_fbgemm_fp8.py Fix FbgemmFp8Linear not preserving tensor shape (#33239 ) 2024-09-11 13:26:44 +02:00