Rareș Baron

Karma: 15

Minor interpretability exploration #4: LayerNorm and the learning coefficient

Rareș Baron20 Mar 2025 16:18 UTC

4 points

0 comments1 min readLW link

Minor interpretability exploration #3: Extending superposition to different activation functions (loss landscape)

Rareș Baron14 Mar 2025 15:45 UTC

5 points

0 comments3 min readLW link

Minor interpretability exploration #2: Extending superposition to different activation functions

Rareș Baron6 Mar 2025 11:22 UTC

3 points

0 comments4 min readLW link

Minor interpretability exploration #1: Grokking of modular addition, subtraction, multiplication, for different activation functions

Rareș Baron26 Feb 2025 11:35 UTC

5 points

13 comments4 min readLW link