Fix new BNB test failures (#35345)

2025-08-01 02:31:11 +06:00 · 2025-01-02 05:24:52 -05:00 · 2025-01-02 05:24:52 -05:00 · 6b1e86fd4d
commit 6b1e86fd4d
parent 5b516b06c8
2 changed files with 7 additions and 2 deletions
--- a/tests/quantization/bnb/test_4bit.py
+++ b/tests/quantization/bnb/test_4bit.py
@ -172,7 +172,7 @@ class Bnb4BitTest(Base4bitTest):
        mem_fp16 = self.model_fp16.get_memory_footprint()
        mem_4bit = self.model_4bit.get_memory_footprint()
-        self.assertAlmostEqual(mem_fp16 / mem_4bit, self.EXPECTED_RELATIVE_DIFFERENCE)
+        self.assertAlmostEqual(mem_fp16 / mem_4bit, self.EXPECTED_RELATIVE_DIFFERENCE, delta=1e-5)
        linear = get_some_linear_layer(self.model_4bit)
        self.assertTrue(linear.weight.__class__ == Params4bit)
--- a/tests/quantization/bnb/test_mixed_int8.py
+++ b/tests/quantization/bnb/test_mixed_int8.py
@ -229,7 +229,7 @@ class MixedInt8Test(BaseMixedInt8Test):
        mem_fp16 = self.model_fp16.get_memory_footprint()
        mem_8bit = self.model_8bit.get_memory_footprint()
-        self.assertAlmostEqual(mem_fp16 / mem_8bit, self.EXPECTED_RELATIVE_DIFFERENCE)
+        self.assertAlmostEqual(mem_fp16 / mem_8bit, self.EXPECTED_RELATIVE_DIFFERENCE, delta=1e-5)
        self.assertTrue(get_some_linear_layer(self.model_8bit).weight.__class__ == Int8Params)
    def test_linear_are_8bit(self):
@ -938,8 +938,13 @@ class MixedInt8LlamaTest(MixedInt8Test):
    model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
    EXPECTED_RELATIVE_DIFFERENCE = 1.7869331026479096
    EXPECTED_OUTPUTS = set()
    # Expected on Intel XPU
    EXPECTED_OUTPUTS.add("Hello my name is John Smith and I am a software engineer. I")
    # Expected on NVIDIA T4
    EXPECTED_OUTPUTS.add("Hello my name is John and I am a software engineer. I have")
    def test_int8_from_pretrained(self):
        r"""
        Test whether loading a 8bit model from the Hub works as expected