DanielFilan

Karma: 8,775

Consider not donating under $100 to political candidates

DanielFilanMay 11, 2025, 3:20 AM

130 points

31 comments1 min readLW link

(danielfilan.com)

AXRP Episode 40 - Jason Gross on Compact Proofs and Interpretability

DanielFilanMar 28, 2025, 6:40 PM

23 points

0 comments89 min readLW link

AXRP Episode 38.8 - David Duvenaud on Sabotage Evaluations and the Post-AGI Future

DanielFilanMar 1, 2025, 1:20 AM

13 points

0 comments13 min readLW link

AXRP Episode 38.7 - Anthony Aguirre on the Future of Life Institute

DanielFilanFeb 9, 2025, 1:10 AM

10 points

0 comments12 min readLW link

AXRP Episode 38.6 - Joel Lehman on Positive Visions of AI

DanielFilanJan 24, 2025, 11:00 PM

10 points

0 comments9 min readLW link

AXRP Episode 38.5 - Adrià Garriga-Alonso on Detecting AI Scheming

DanielFilanJan 20, 2025, 12:40 AM

9 points

0 comments16 min readLW link

MATS mentor selection

DanielFilan and Ryan Kidd

Jan 10, 2025, 3:12 AM

44 points

12 comments6 min readLW link

AXRP Episode 38.4 - Shakeel Hashim on AI Journalism

DanielFilanJan 5, 2025, 12:20 AM

11 points

0 comments12 min readLW link

AXRP Episode 38.3 - Erik Jenner on Learned Look-Ahead

DanielFilanDec 12, 2024, 5:40 AM

20 points

0 comments16 min readLW link

AXRP Episode 39 - Evan Hubinger on Model Organisms of Misalignment

DanielFilanDec 1, 2024, 6:00 AM

41 points

0 comments67 min readLW link

AXRP Episode 38.2 - Jesse Hoogland on Singular Learning Theory

DanielFilanNov 27, 2024, 6:30 AM

34 points

0 comments10 min readLW link

AXRP Episode 38.1 - Alan Chan on Agent Infrastructure

DanielFilanNov 16, 2024, 11:30 PM

12 points

0 comments14 min readLW link

AXRP Episode 38.0 - Zhijing Jin on LLMs, Causality, and Multi-Agent Systems

DanielFilanNov 14, 2024, 7:00 AM

14 points

0 comments12 min readLW link

MATS AI Safety Strategy Curriculum v2

DanielFilan and Ryan Kidd

Oct 7, 2024, 10:44 PM

43 points

6 comments13 min readLW link

AXRP Episode 37 - Jaime Sevilla on Forecasting AI

DanielFilanOct 4, 2024, 9:00 PM

21 points

3 comments56 min readLW link

AXRP Episode 36 - Adam Shai and Paul Riechers on Computational Mechanics

DanielFilanSep 29, 2024, 5:50 AM

25 points

0 comments55 min readLW link

AXRP Episode 35 - Peter Hase on LLM Beliefs and Easy-to-Hard Generalization

DanielFilanAug 24, 2024, 10:30 PM

21 points

0 comments74 min readLW link

AXRP Episode 34 - AI Evaluations with Beth Barnes

DanielFilanJul 28, 2024, 3:30 AM

23 points

0 comments69 min readLW link

Why keep a diary, and why wish for large language models

DanielFilanJun 14, 2024, 4:10 PM

9 points

1 comment2 min readLW link

(danielfilan.com)

AXRP Episode 33 - RLHF Problems with Scott Emmons

DanielFilanJun 12, 2024, 3:30 AM

34 points

0 comments56 min readLW link