Anthropic于5月29日发布开源东西“思想追寻”(Circuit Tracer),思想追寻经过构建“归因图”以图形化方法展现AI大言语模型的源东语模决议计划进程。
该东西由Anthropic Fellows与Decode Research团队联合开发,西可型内支撑研讨者交互式探究模型内部机制,视化标示、部逻共享图表,思想追寻并调整参数验证假定 ,源东语模旨在提高AI的西可型内可解释性与安全性 。
现在 ,视化Circuit Tracer已作为开源库登陆GitHub
,部逻用户可经过Decode Research运营的思想追寻Neuronpedia渠道拜访交互前端。
Anthropic着重
,源东语模开源此类东西将加快社区对言语模型行为的西可型内了解
,补偿当时AI内部研讨滞后于功用开展的视化现状。
部逻