我们推出了一款新工具 Anthropic Interviewer,旨在帮助我们更好地利用 AI 理解人们的观点。在这篇研究博文中,我们将介绍这款工具,描述针对一部分专业人士进行的测试,并讨论我们的初步发现。我们还将探讨这一方向的未来工作,现在我们可以通过开发这款工具以及与创意人员、科学家和教师建立合作伙伴关系来探索这些工作。
从今天开始,您可能会在 Claude.ai 中看到一个弹窗,邀请您参与访谈。通过参与,您可以加入本文所述研究的下一阶段。
简介
如今,数百万人每天都在使用 AI。作为一家开发 AI 系统(如 Claude)的公司,我们不仅想知道人们如何以及为何使用 AI,还想了解 AI 对他们产生的影响。这部分是因为我们希望利用用户的反馈来开发更好的产品,但同时也因为理解人们与 AI 的互动是我们这个时代重大的社会学问题之一。
我们最近设计了一款工具,旨在在保护用户隐私的同时调查 AI 使用模式。它使我们能够分析整个经济中 AI 使用模式的变化。但是,该工具只能让我们了解 Claude 对话中发生的事情。那么对话之后呢?人们究竟如何使用 Claude 的输出?他们对此有何感受?他们如何想象 AI 在他们未来的角色?如果我们想要全面了解 AI 在人们生活中不断变化的角色,并以人为本进行模型开发,我们就需要直接询问人们。
这样一个项目需要我们进行数百次访谈。在这里,我们利用 AI 来帮助我们做到这一点。我们构建了一个名为 Anthropic Interviewer 的访谈工具。Anthropic Interviewer 由 Claude 提供支持,能够以前所未有的规模自动进行详细的访谈,并将结果反馈给人类研究人员进行分析。这是了解我们用户的需求和愿望,以及为分析 AI 的社会和经济影响收集数据的新的一步。
为了测试 Anthropic Interviewer,我们让它对 1,250 名专业人士——包括普通劳动力 (N=1,000)、科学家 (N=125) 和创意人员 (N=125)——进行了关于他们对 AI 看法的访谈。我们将公开发布这次初步测试的所有访谈数据(已征得参与者同意),供研究人员探索;我们在下面提供了我们自己的分析。简而言之,以下是我们发现的一些例子:
- 对 AI 角色的乐观态度:在我们的样本中,人们对 AI 在其工作中扮演的角色持乐观态度。大多数讨论的话题都表现出积极的情绪。然而,少数话题,如教育融合、艺术家被取代和安全问题,则伴随着更悲观的看法。
- 普通劳动力的策略:来自普通劳动力的人们希望保留定义其职业身份的任务,同时将常规工作委托给 AI。他们设想的未来是常规任务自动化,而他们的角色转变为监督 AI 系统。
- 创意人员的困境:尽管面临同行的评判和对未来的焦虑,创意人员仍在利用 AI 提高生产力。他们正在应对创意社区中使用 AI 的直接耻辱感,以及对经济取代和人类创意身份受到侵蚀的更深层担忧。
- 科学家的需求:科学家希望与 AI 建立伙伴关系,但目前还不能信任其进行核心研究。科学家一致表示希望 AI 能够生成假设和设计实验。但在目前,他们仅将实际使用限制在撰写手稿或调试分析代码等其他任务上。
方法
这项初步测试探讨了工作者如何将 AI 融入其专业实践,以及他们对其未来角色的感受。我们通过访谈产生定性数据,并辅以来自调查的定量数据,参与者在调查中回答了有关其行为和职业背景的问题。我们还有一个单独的 AI 分析工具读取访谈记录,并从非结构化数据中聚类出涌现的、总体的主题——例如,提及特定话题或在访谈中表达特定观点的参与者百分比。
参与者
我们使用 Anthropic Interviewer 对 1,250 名专业人士进行了访谈。我们打算让该工具采访普通的 Claude.ai 用户,但对于这次初步测试,我们寻找了在各行各业工作的参与者,并通过众包平台吸引他们(所有参与者都有除众包以外作为主要工作的职业)。
我们的 1,000 名参与者是从普通职业样本中招募的(即,我们没有从特定工作中选择参与者)。在该群体中,最大的子群体来自教育指导 (17%)、计算机和数学职业 (16%) 以及艺术、设计、娱乐和媒体 (14%)。
我们还招募了两个各 125 名参与者的专家样本。第一个来自创意职业:主要是作家和作者(占样本的 48%)和视觉艺术家(21%),还有一小部分电影制作人、设计师、音乐家和手工艺者。第二个来自科学界,包括物理学家 (9%)、化学家 (9%)、化学工程师 (7%) 和数据科学家 (6%),以及其他 50 多个不同科学学科的代表。
我们选择增加这两个专家子群体,是因为这些代表了 AI 的角色仍然存在争议且正在迅速发展的专业领域。我们假设创意人员和科学家会揭示出不同的 AI 采用模式和职业关注点。
所有参与者都提供了知情同意书,允许我们出于研究目的分析他们的访谈数据并公开发布文字记录。
Anthropic Interviewer 如何工作
Anthropic Interviewer 分三个阶段运作:规划、访谈和分析。下面,我们将依次描述每个阶段。
规划
在这个阶段,Anthropic Interviewer 会创建一个访谈量表,使其能够在成百上千次访谈中专注于相同的总体研究问题,但仍足够灵活以适应个别访谈中可能出现的变化和离题。
我们开发了一个系统提示词(System Prompt)——一套关于 AI 模型如何工作的总体指令——赋予 Anthropic Interviewer 其方法论。这就是我们纳入关于每个样本的假设以及创建访谈计划的最佳实践的地方(这是与我们的用户研究团队合作建立的)。
在系统提示词到位后,Anthropic Interviewer 利用其对我们研究目标的了解(见下文部分)生成具体问题和计划的对话流程。然后是一个审查阶段,人类研究人员与 Anthropic Interviewer 合作进行必要的编辑以最终确定计划。
访谈
然后,Anthropic Interviewer 按照其访谈计划进行实时、适应性的访谈。在这个阶段,我们包含了一个系统提示词,指示 Anthropic Interviewer 如何使用访谈的最佳实践。
由 Anthropic Interviewer 进行的访谈出现在 Claude.ai 上,每次与参与者的访谈持续约 10-15 分钟。
分析
访谈完成后,人类研究人员与 Anthropic Interviewer 合作分析文字记录。Anthropic Interviewer 的分析步骤将初始访谈计划作为输入,并输出研究问题的答案以及说明性的引文。在这个阶段,我们还使用了我们的自动化 AI 分析工具来识别涌现的主题并量化它们在参与者中的普遍程度。
研究目标
如上所述,Anthropic Interviewer 通过其系统提示词了解了研究目标,并以解决这些目标的方式进行访谈。请注意,在这项初步研究中,我们的主要意图是对 Anthropic Interviewer 进行实际测试;尽管如此,以下目标还是提供了我们由于下文分析的有趣数据。
每个子样本的主要研究目标如下:
- 普通劳动力:“了解个人如何将 AI 工具融入其专业工作流程,探索使用模式、任务偏好和互动风格,以深入了解工作场所背景下人类与 AI 之间不断演变的关系。”
- 创意人员:“了解创意专业人士目前如何将 AI 融入其创作过程,他们对 AI 影响其工作的体验,以及他们对 AI 与人类创造力未来关系的愿景。”
- 科学家:“了解 AI 系统如何融入科学家的日常研究工作流程,检查他们在科学过程不同阶段的当前使用模式、感知价值、信任水平和采用障碍。”
结果
下面我们讨论我们在访谈中发现的内容,并提供来自我们的调查和主题分析的定量数据。
AI 对普通劳动力的影响
总体而言,我们普通专业人士样本的成员将 AI 描述为对生产力的提升。在调查中,86% 的专业人士报告说 AI 节省了他们的时间,65% 的人表示他们对 AI 在其工作中扮演的角色感到满意。
出现的一个主题是工作场所动态如何影响 AI 的采用。69% 的专业人士提到在工作中使用 AI 工具可能带来的社会耻辱感——一位事实核查员告诉 Anthropic Interviewer:“一位同事最近说他们讨厌 AI,我什么也没说。我不告诉任何人我的流程,因为我知道很多人对 AI 的看法。”
虽然 41% 的受访者表示他们在工作中感到安全,并相信人类技能是不可替代的,但 55% 的人对 AI 对其未来的影响表示焦虑。在表达焦虑的人群中,25% 的人表示他们设定了围绕 AI 使用的界限(例如,一位教育工作者总是自己制定课程计划),而 25% 的人调整了他们的工作场所角色,承担额外的责任或追求更专业的任务。
使用 AI 的方法千差万别。一位数据质量经理特意选择了学习而非自动化:“我试着把它想成是学习一门外语——仅仅使用翻译应用程序并不能教给你任何东西,但拥有一位可以回答问题并根据你的需求进行定制的导师真的会有所帮助。”一位营销人员采取了灵活的方法:“我试图在保持强大细分市场的同时实现多元化。”一位口译员已经准备完全离开该领域:“我相信 AI 最终将取代大多数口译员……所以我已经在为职业转换做准备,可能是通过获得文凭并进入不同的行业。”值得注意的是,只有 8% 的专业人士表达了焦虑而没有任何明确的补救计划。
我们还对专业人士访谈中表现出的不同情绪强度进行了分类。不同的职业表现出非常一致的情绪特征,其特点是高水平的满意度。然而,这伴随着挫败感,表明专业人士在发现 AI 有用的同时也遇到了实施方面的重大挑战。
增强与自动化
在之前的分析中,我们将 AI 的用途分类为增强(AI 与用户协作完成任务)或自动化(AI 直接执行任务)。在 Anthropic Interviewer 数据中,65% 的参与者将 AI 的主要角色描述为增强;35% 的人将其描述为自动化。值得注意的是,这与我们对人们如何使用 Claude 的最新分析不同,后者显示出更加均匀的分配:47% 的任务涉及增强,49% 涉及自动化。这种差异可能有多种解释:
- Anthropic Interviewer 研究受访者与我们之前研究中的用户之间可能存在样本差异;
- 人们在 Claude 上的对话看起来可能比实际情况更具自动化性质——用户可能会在聊天结束后完善或调整 Claude 的输出;
- 参与者可能针对不同任务使用不同的 AI 提供商;
- 自我报告的互动风格可能与现实世界的使用情况不同;
- 专业人士可能认为他们的 AI 使用比他们的 Claude 对话模式所显示的更具协作性。
专业人士设想了一个增强和自动化并存的未来——日常行政任务的自动化与人类监督的维持。48% 的受访者考虑将其职业向专注于管理和监督 AI 系统而非执行直接技术工作的职位过渡。
“...如果我使用 AI 并提升我的技能,它可以为我在行政方面节省大量时间,这将使我腾出时间与人相处。”
一位牧师说:“...如果我使用 AI 并提升我的技能,它可以为我在行政方面节省大量时间,这将使我腾出时间与人相处”。他们还强调了“良好界限”的重要性,并避免变得“如此依赖 AI 以至于我无法离开[它]生活或做我被召唤去做的事情。”
一位通信专业人士说:“我相信我的大部分工作最终可能会被 AI 接管。我认为我的角色最终将集中在提示、监督、训练和质量控制模型上,而不是自己实际做这项工作”。目前被禁止在工作中使用 AI 的专业人士——例如一些律师、会计师和医疗保健工作者——预计政策变化将允许他们在未来动化许多任务。
AI 对创意职业的影响
我们的创意专业人士样本也报告说 AI 使他们更具生产力。97% 的人报告说 AI 节省了他们的时间,68% 的人说它提高了他们的工作质量。一位小说家解释说“我觉得我可以写得更快,因为研究不再那么令人畏惧”,而一位网络内容作者报告说他们“已经从每天能够制作 2,000 字的精美专业内容变为超过 5,000 字。”一位摄影师指出 AI 如何处理常规编辑任务——将周转时间从“12 周缩短到大约 3 周”——使他们能够“有意地进行我以前可能错过或没有时间进行的编辑和调整。”
与普通样本类似,70% 的创意人员提到试图管理围绕 AI 使用的同行评判。一位地图艺术家说:“我不希望我的品牌和商业形象与 AI 及其周围的耻辱感联系得太紧密。”
“由于 AI 的兴起,配音行业的某些部门实际上已经消亡。”
经济焦虑贯穿于创意人员的访谈中。一位配音演员表示:“由于 AI 的兴起,配音行业的某些部门实际上已经消亡,例如工业配音。”一位作曲家担心平台可能会“利用 AI 技术及其出版库[来]无限生成新音乐”,用廉价的替代品充斥市场,取代人类制作的音乐。另一位艺术家也表达了类似的担忧:“实际上,我担心我需要继续使用生成式 AI,甚至开始销售生成的内容,只是为了在市场上跟上步伐,以便谋生。”一位创意总监说:“我完全理解我的收益是另一位创意人员的损失。我以前必须每天支付 2,000 美元聘请的那位产品摄影师现在得不到我的业务了。”(请注意,Claude 不生成图像、视频或音乐——参与者表达的焦虑是关于整个 AI 领域的,并不特定于 Claude)。
所有 125 名参与者都提到希望保持对其创意输出的控制。然而,这一界限在实践中被证明是不稳定的:许多参与者承认 AI 驱动创意决策的时刻。一位艺术家承认:“AI 驱动了很大一部分概念;我只是试图引导它……60% 是 AI,40% 是我的想法”。一位音乐家说:“我不愿承认这一点,但在使用这个插件时,它拥有大部分控制权。”
各个学科表现出不同的情感特征:游戏开发者和视觉艺术家报告了高满意度,但也矛盾地伴随着较高的担忧。设计师表现出相反的模式,以挫败感为主,满意度明显较低。在所有学科中,信任度始终较低,表明人们对 AI 对创意工作的长期影响有着共同的不确定性。满意度和担忧之间的张力可能突显了创意专业人士的处境,他们既拥抱 AI 工具,又在努力应对对人类创造力未来的担忧。情感光谱的广泛分散证实,不同的创意职业通过非常不同的情感视角体验 AI 的整合。
AI 对科学工作的影响
我们对化学、物理、生物和计算领域研究人员的访谈发现,在许多情况下,AI 还无法处理其研究的核心要素,如假设生成和实验。科学家主要报告使用 AI 进行其他任务,如文献综述、编码和写作。这是 AI 公司(包括 Anthropic)正在努力改进其工具和能力的领域。
信任和可靠性问题是 79% 访谈中的主要障碍;当前 AI 系统的技术局限性出现在 27% 的访谈中。一位信息安全研究员指出:“如果我必须仔细检查并确认[AI]智能体给我的每一个细节,以确保没有错误,那这在很大程度上就违背了让智能体做这项工作的初衷。”一位数学家也表达了这种挫败感:“在我必须花时间验证 AI 输出之后,基本上最后花的时间是一样的。”一位化学工程师指出了对阿谀奉承(sycophancy)的担忧,解释说:“AI 倾向于迎合[用户]的情感,并根据他们提问的方式改变答案。这种不一致性往往使我对 AI 的回应持怀疑态度。”
大多数科学领域报告了高满意度,但挫败感模式各不相同:物理学家和数据科学家表现出较高的挫败感,而化学和机械工程师表现出的挫败感极小。这可能反映了计算领域与实验领域试图将 AI 整合到核心研究工作流程中的差异:需要现实世界互动的科学家可能还没有尝试在核心科学实验中使用 AI。各个领域的信任度相对较低,表明无论学科如何,可靠性问题普遍存在。与表达对 AI 影响高度关注的创意专业人士不同,科学家表现出的担忧水平相对较低。这与他们对 AI 完成假设生成和实验任务能力的失望相一致。
总体而言,科学家并不担心因 AI 导致的职位被取代。一些人指出了难以数字化的隐性知识,一位微生物学家解释说:“我研究过一种细菌菌株,当细胞达到特定颜色时,你必须启动各个步骤。颜色的差异必须亲眼看到才能理解,而且[说明]很少写在任何地方。”其他人强调了研究决策固有的类性质,一位生物工程师指出:“实验和研究也是……本质上取决于我”,并指出“研究过程的某些部分不幸就是与 AI 不兼容,即使它们是最容易自动化的部分,比如运行实验”。
外部约束也造成了 AI 替代的障碍——机密环境中的研究人员指出,“在组织允许我们使用代理框架,甚至大语言模型之前,必须制定许多以安全为导向的流程和‘注意事项’。”一位管理有限资源的机械工程师解释说,虽然“AI 善于提出实验设计”,但实际上“我的大部分研究都有预算/时间/样本限制,所以‘理想’的设计并不总是可行的。”尽管如此,监管合规性约束、对技能退化的担忧和成本障碍在访谈中被提及的比例均不到 10%。
“我很想要一个感觉像是有价值的研究伙伴的 AI……能够带来新东西的 AI。”
91% 的科学家表示希望在研究中获得更多 AI 协助,即使他们觉得目前的产品不符合要求。大约三分之一的人设想主要是在写作任务上获得协助,但大多数人希望在所有研究中获得支持:批评实验设计、访问科学数据库和运行分析。一个共同的愿望是希望 AI 能够产生新的科学想法。一位医学科学家说:“我希望 AI 能够……帮助生成或支持假设,或者寻找对人类来说并不显而易见的新颖互动/关系”。另一位同样表达了这种观点,他说:“我很想要一个感觉像是有价值的研究伙伴的 AI……能够带来新东西的 AI。”
展望未来
这项初步测试表明,Anthropic Interviewer 在规模化方面显示出前景——我们能够对 1,250 名专业人士进行访谈,了解他们对工作中 AI 的感受。如果采用传统的“人工”访谈方法,对这么多参与者进行研究将既昂贵又耗时。
但 Anthropic Interviewer 的意义不仅仅在于方法论:它从根本上改变了我们可以询问和回答关于 AI 在社会中角色的问题,以及关于任何主题的访谈如何在这个新规模上进行。我们要利用 Anthropic Interviewer 开展有意义的大规模研究,这仅仅是个开始。此前,我们只能深入了解人们如何在聊天窗口内使用 Claude。我们不知道人们对使用 AI 的感受,他们想改变与该技术互动的哪些方面,或者他们如何设想 AI 在其未来生活中的角色。
这项初步调查的结果为我们提供了超越经济指数工作的新见解,以了解人们如何在工作场所使用 AI。我们正在分享这些初步发现,以便与我们的经济顾问委员会和高等教育顾问委员会进行讨论。随着我们继续这项研究,我们将公开发布我们的试点结果,以及这些发现如何为我们未来的工作提供信息。
Anthropic Interviewer 是我们将人类声音置于 AI 模型开发对话中心的最新举措——这是我们通过集体宪法 AI 工作开始的,该工作收集了公众观点来塑造 Claude 的行为。这些对话可以帮助我们改 Claude 本身的性格和训练过程,并为 Anthropic 倡导和采用的未来政策提供信息。以下是我们为探索与特定社区的合作伙伴关系而采取的一些实际步骤,帮助我们根据他们的专业知识开发 AI:
- 创意人员:我们正在支持展览、研讨会和活动的开发,以了解 AI 如何增强创造力。我们与领先的文化机构(包括 LAS 艺术基金会、森美术馆和泰特美术馆)以及创意社区(如 Rhizome 和 Socratica)建立了合作伙伴关系。此外,我们正在与流行创意工具背后的公司合作,探索 Claude 如何通过模型上下文协议增强创意人员的工作。
- 科学家:我们正在与我们的 AI for Science 受让人合作,了解 AI 如何最好地服务于他们的研究。利用 Anthropic Interviewer,我们正在收集科学家对 AI 的看法以及他们对该计划的希望(我们还将使用我们的隐私保护分析工具来评估他们的 Claude 对话是否符合这些期望)。结合定量和定性数据将帮助我们既为科学家改进 Claude,又衡量我们拨款的影响。
- 教师:我们最近与美国教师联合会 (AFT) 合作,在 AI 能力日益增强的时代重塑教师培训。该计划旨在支持 40,000 名教师进行 AI 教育,并将他们的观点引入 AI 开发中。此外,我们预审了 Anthropic Interviewer 关于 AI 如何改变 Anthropic 软件工程的一些发现。分享关于我们自己工作场所转型的定性故事使我们在软件工程师和教师之间找到了许多共同点,把大家聚在一起集思广益,讨论我们真正想要什么样的 AI 引发的工作转型。
利用 Anthropic Interviewer,我们可以进行为特定政策提供信息的针对性研究、让不同社区参与 AI 对话的参与式研究,以及跟踪人类与 AI 之间不断演变关系的定期研究。
参与其中
我们将继续使用 Anthropic Interviewer 来更好地了解人们如何设想 AI 在其生活和工作中的角色。为此,我们正在启动一项公开试点访谈,探索哪些经验、价值观和需求驱动了人们对 AI 在其生活中未来角色的愿景。
准备好分享您的观点了吗?您可以点击此链接参与 10-15 分钟的访谈,参与这项研究。我们计划分析这项研究的匿名见解,作为我们社会影响研究的一部分,并发布一份关于这些数据见解的报告。有关这项研究的更多信息,请参阅下面的常见问题解答部分。
结论和局限性
我们对 1,250 名专业人士的访谈揭示了一个正在积极协调其与 AI 关系的劳动力群体。我们的参与者通常保留对其职业身份至关重要的任务,同时委托常规工作以获得生产力收益。尽管面临同行的耻辱感和经济焦虑,创意人员仍拥抱 AI 的效率,而科学家对委托给 AI 的研究任务仍保持选择性。
我们进行这项研究是为了了解 AI 对人们生活的影响,而不仅仅是聊天窗口中发生的事情。像所有定性分析一样,我们对这些访谈的解释反映了我们选择提出的问题以及我们在数据中寻找的模式。通过公开这个大规模访谈记录数据集,我们希望促进对人类与 AI 关系如何演变的集体理解。通过大规模部署 Anthropic Interviewer,我们可以建立人们对 AI 的体验与我们就如何开发 AI 之间的反馈循环——目标是建立反映公众观点和需求的 AI 系统。
局限性
我们对 Anthropic Interviewer 的初步使用有一些重要的局限性,影响了我们发现的范围和普遍性。我们的发现应被解释为 AI 对工作影响的早期信号,而不是对其对专业实践和身份的长期影响的明确结论。
- 选择偏差:由于参与者是通过众包平台参与的,我们研究中参与者的经历可能与普通劳动力的经历有很大不同,这使得回应偏向于对该主题更积极或更有经验的观点。
- 需求特征:参与者知道这是 AI 系统在就他们的 AI 使用情况进行访谈,这可能改变了他们参与的意愿,或者与人类访谈相比改变了他们给出的回答类型。
- 静态分析:我们捕捉到了专业人士当前 AI 使用和态度的快照,但有了这些数据,我们无法跟踪这些关系随时间的推移如何发展,或者最初的热情如何随着使用的延长而改变。
- 情感分析:由于 Anthropic Interview 是纯文本的,无法读取语调、面部表情或肢体语言,它可能会错过影响受访者陈述含义的情感线索。
- 自我报告与客观测量:我们在上面指出,参与者对其 AI 使用情况的描述可能与他们的实际做法不同(正如智能手机使用情况所发现的那样)。这可能是由于社会期许偏差、记忆不完善或围绕 AI 披露的不断演变的工作场所规范造成的。
- 研究人员解释:像所有定性研究一样,我们的分析反映了我们作为研究人员的兴趣和观点。虽然我们使用系统的方法来识别模式,但不同的研究人员可能会强调这些访谈的不同方面或得出替代结论。
- 全球普遍性:我们的样本主要反映了基于西方的工人,对 AI 的文化态度、工作场所动态和职业身份可能在全球背景下有很大差异。
- 非实验性研究:尽管许多参与者报告了生产力提高和质量改进,但我们无法确定 AI 使用是否直接导致了这些结果,或者其他因素在多大程度上做出了贡献。
贡献和致谢
Kunal Handa 领导了该项目,设计并构建了 Anthropic Interviewer 原型,执行了调查、访谈和数据分析,绘制了图表并撰写了博文。Michael Stern 领导了 Anthropic Interviewer 在 Claude.ai 中的实施,管理了项目时间表,并在整个过程中提供了反馈。Saffron Huang 领导了 Anthropic Interviewer 的公开试点。Jerry Hong 领导了 Anthropic Interviewer 的视觉设计,并为技术图表做出了贡献。Esin Durmus 为实验设计做出了贡献并提供了关键反馈。Miles McCain 共同领导了 Anthropic Interviewer 原型底层技术基础设施的实施。Grace Yun、AJ Alt 和 Thomas Millar 在 Claude.ai 中实施了 Anthropic Interviewer,为公开试点提供了必要的技术基础设施。Alex Tamkin 对项目的早期迭代提供了关键反馈。Jane Leibrock 为 Anthropic Interviewer 的所有方法论做出了贡献。Stuart Ritchie 为博文的框架和撰写做出了贡献。Deep Ganguli 提供了关键的研究指导、反馈和组织支持。所有作者在整个过程中提供了详细的指导和反馈。
此外,我们感谢 Sally Aldous, Drew Bent, Shan Carter, Jack Clark, Miriam Chaum, Jake Eaton, Matt Galivan, Savina Hawkins, Sarah Heck, Hanah Ho, Mo Julapalli, Matthew Kearney, Mike Krieger, Chelsea Larsson, Joel Lewenstein, Jennifer Martinez, Wes Mitchell, Jared Mueller, Christopher Nulty, Adam Pearce, Sarah Pollack, Ankur Rathi, Drew Roper, David Saunders, Kevin Troy, Molly Villagra, Brett Wittmershaus, and Casey Yamaguma 提供有益的想法、讨论、反馈和支持。我们还感谢 Matthew Conlen, Deb Roy, and Diyi Yang 的评论、讨论和反馈。
引用
如果您想引用这篇文章,可以使用以下 Bibtex 键:
@online{handa2025interviewer,
author = {Kunal Handa and Michael Stern and Saffron Huang and Jerry Hong and Esin Durmus and Miles McCain and Grace Yun and AJ Alt and Thomas Millar and Alex Tamkin and Jane Leibrock and Stuart Ritchie and Deep Ganguli},
title = {Introducing Anthropic Interviewer: What 1,250 professionals told us about working with AI},
date = {2025-12-04},
year = {2025},
url = {https://anthropic.com/research/anthropic-interviewer},
}附录
关于 Anthropic Interviewer 的参与者体验
访谈结束后,我们对参与者的访谈体验进行了调查。我们问:(1)您对这次对话有多满意?,(2)这次对话多好地捕捉到了您对 {该领域} 的想法?(均采用 1-7 李克特量表),以及(3)您会向他人推荐这种访谈形式吗?(是/否)。
我们发现参与者对 Anthropic Interviewer 的评价非常积极。97.6% 的参与者将其满度评为 5 分或更高,其中 49.6% 给出了最高评价。同样,96.96% 的人认为对话很好地捕捉了他们的想法(5-7 分)。99.12% 的参与者表示他们会向他人推荐这种访谈形式。
分享您的观点:常见问题解答
1. 我们如何参加这项研究?
从今天开始,如果您是早在两周前注册的 Free、Pro 或 Max Claude.ai 订阅者,您可能会在 Claude.ai 中看到一个弹窗,邀请您参与。您可以通过以下网址访问:https://claude.ai/interviewer。该研究将开放一周。
2. 这项研究会问我什么?
我们将使用 Anthropic Interviewer 询问您对 AI 在您生活中角色的愿景,哪些经历、价值观和需求塑造了这一点,以及什么可能会帮助或阻碍这一愿景。
3. 您将如何使用数据?
我们将分析这项研究的见解,作为我们社会影响研究的一部分,发布我们的发现,并利用这些发现以反映我们所学到的东西的方式改进我们的模型和服务。我们通过这项研究收集的数据将被视为反馈,并将根据我们的隐私政策进行处理。我们也可能在发布的发现中包含匿名的回应。
4. 为什么我在 Claude.ai 中看不到 Anthropic Interviewer 邀请?
访谈仅对 2 周前注册的现有 Claude.ai Free、Pro 和 Max 用户开放。
