v4.38.1

ArthurZucker released this 22 Feb 00:24

· 2496 commits to main since this release

a085774

Fix eager attention in Gemma!

TLDR:

-        attn_output = attn_output.reshape(bsz, q_len, self.hidden_size)
+        attn_output = attn_output.view(bsz, q_len, -1)

sanchit-gandhi

Assets 2