Raymond D

Karma: 675

ChatGPT can learn indirect control

Raymond D21 Mar 2024 21:11 UTC

212 points

23 comments1 min readLW link

Predictive model agents are sort of corrigible

Raymond D5 Jan 2024 14:05 UTC

35 points

6 comments3 min readLW link

Picking Mentors For Research Programmes

Raymond D10 Nov 2023 13:01 UTC

105 points

8 comments4 min readLW link

Goal-Direction for Simulated Agents

Raymond D12 Jul 2023 17:06 UTC

33 points

2 comments6 min readLW link

Language Models can be Utility-Maximising Agents

Raymond D1 Feb 2023 18:13 UTC

22 points

1 comment2 min readLW link

Taking Clones Seriously

Raymond D1 Dec 2021 17:29 UTC

58 points

45 comments2 min readLW link

Why Save The Drowning Child: Ethics Vs Theory

Raymond D16 Nov 2021 19:07 UTC

17 points

12 comments4 min readLW link

The Opt-Out Clause

Raymond D3 Nov 2021 22:02 UTC

38 points

49 comments1 min readLW link

30-ish focusing tips

Raymond D22 Oct 2021 19:38 UTC

21 points

4 comments6 min readLW link