Evgenii Kortukov

Karma: 20

Aspiring AI safety researcher. Currently doing my PhD at Fraunhofer HHI in Berlin, focusing on LLM interpretability. Interested in the internal structure underlying safety-relevant behaviors in LLMs: prompt injections, jailbreaks, deception.

A Behavioural and Representational Evaluation of Goal-directedness in Language Model Agents

Gabriele Sarti, Raghu Arghal, ndalton, Fade Chen, Evgenii Kortukov, Calum McNamara, Angelos Nalmpantis, Moksh Nirvaan and Mario Giulianelli

5 Mar 2026 1:08 UTC

20 points

0 comments7 min readLW link

Modelling, Measuring, and Intervening on Goal-directed Behaviour in AI Systems

Mario Giulianelli, Raghu Arghal, Fade Chen, ndalton, Evgenii Kortukov, Calum McNamara, Angelos Nalmpantis, Moksh Nirvaan and Gabriele Sarti

31 Oct 2025 1:28 UTC

15 points

0 comments8 min readLW link