仿制假加利福尼亚州结婚证,【telegram:十852 55367074】(WHATSApp:852 55367074)『真实办护照,可根据客户样本制版印刷』可加急 ,【telegram:+852 55367074】【WHATSApp:+852 55367074】『办理驾驶证、身份证、居留证、各种证明,发货速度快。』 联系我们【飞机\whatsapp 同号:+852 55367074】 原创 Cell Press CellPress细胞科学交叉学科 Interdisciplinary 2025年5月20日,浙江大学建筑工程学院智能交通研究所朱政研究员在Cell Press细胞出版社旗下期刊iScience上发表了一篇题为“Comparing AI and human decision-making mechanisms in daily collaborative experiments”的新研究。 研究对比了人类受试者、大语言模型(LLMs)受试者、强化学习(RL)受试者在多日通勤路径选择决策实验中的表现,揭示了人类与LLMs在日常多主体协同决策场景中决策机制及其表现的显著差异。 研究亮点 LLMs在多日通勤路径选择中可习得“类人”决策,但其表现亚于人类及RL; GPT-3.5受试者的多日决策偏向稳定,而GPT-4受试者多日决策波动显著; LLMs难以捕捉多主体协同决策场景中的彼此竞合关系,对决策结果的物理属性理解困难; RL决策机制与人类相仿,可实现最佳的系统通行效率。 论文简介 在当代社会的日常生活中,个体决策往往是在与群体相互依赖的条件下进行的。一方面,个体决策影响群体决策趋势,另一方面,群体决策结果会对个体未来的决策产生影响。这种复杂的多主体协同决策广泛存在于公共物品困境、股票交易、交通出行选择等场景。近年来,人工智能(AI)技术(如强化学习(RL)、大语言模型(LLMs))的迅速发展使其逐渐具备了针对复杂环境做出智慧决策的能力。随着通用人工智能(AGI)逐渐成为现实,其在多主体协同决策场景中的潜力也受到广泛关注。然而,现有研究普遍假设LLMs能够模拟人类的认知和决策机制,但至今没有充分证据证明该假设可适用于复杂(尤其多主体、重复)协同决策场景。为此,本研究聚焦于一个日常生活的典型场景——多日通勤路径选择,通过实验经济学方法,比较LLMs(GPT-3.5和GPT-4)受试者、人类受试者、强化学习(RL)受试者的决策能力,探索AI在多主体协同决策中的表现及局限性。 研究设计 为全面评估LLMs在多主体协同决策中的表现,作者设计了一项多日通勤路径选择实验。该实验模拟通勤者为期40天的路径选择过程,受试者们需要在一条单向道路交通网络中进行动态交互。网络包含两个起讫点对(OD1和OD2),共有15名用户(OD1有9人、OD2有6人),他们需在快速路与城市路之间选择通勤路径。快速路具备更短的基础通行时间,但对交通量变化更为敏感,属于典型的“高风险高回报”路线;城市路则较稳定但通行时间较长,属于“低风险低回报”路线。通勤者的每次选择会影响路网的拥堵状态,从而作用于下一次决策。理论分析表明,路交网络的最终状态倾向用户均衡(UE),即所有路径的通行时间相等,任何个体均无法通过改变路径减少其通行时间。本实验通过比较LLMs(GPT-3.5、GPT-4)、RL模型和人类受试者的表现,评估系统整体效率、收敛过程、个体路径切换动态及决策机制。试验采用了来自交通工程领域的成熟研究方法——多日通勤实验,该方法已被广泛验证,能够有效分析受试者的多日重复决策机制,为研究多主体协同决策提供了坚实的理论与实践基础。实验结果 系统层面表现 实验结果表明,LLMs受试者能够通过历史经验学习,实现一定程度的群体决策收敛。然而,与人类受试者及RL受试者相比,LLMs系统的整体通行效率较低,总通行时间显著高于其他受试群体。具体而言: 收敛速度:LLMs的收敛过程较慢,最终状态偏离用户均衡(UE)和系统最优(SO)。 系统稳定性:LLMs在日内和日间决策中表现出更高的不稳定性,GPT-4的路径切换频率较高,而GPT-3.5则倾向于维持现状。 个体层面表现 公平性:较人类与RL而言,LLMs受试者的通行时间分布更不均衡,公平性显著低于人类和RL。 风险偏好:LLMs相比人类与RL表现出更强的风险规避倾向。决策类型分析 基于前一日结果与后一日路径选择的关系可将受试者分为四类:天真型(遭遇拥堵即换路)、策略型(遭遇拥堵不换路)、惯性型(无视结果,一直不换路)、探险型(无视结果,一直换路)。GPT-3.5和GPT-4在决策类型结构上存在显著差异:GPT-3.5以惯性决策为主,GPT-4则包含更多天真型决策者。相比之下,人类和RL用户的决策类型分布更为均衡,这种多样性有助于提升系统协作性。研究启示与未来展望 本研究表明,LLMs在多主体协同决策中表现出一定的人类特性,但在协作能力、系统效率、公平性方面仍存在不足。其局限性主要包括: 多主体协作能力不足:在多OD复杂交通网络中,LLMs难以捕捉多主体协同决策情景中的彼此竞合关系,难以预测其他受试者的行为,缺乏全局优化的决策思想。 决策类型结构失衡:LLMs受试者决策类型分布过于单一,导致系统效率降低。 实物感知能力缺失:LLMs仅依赖文本输入,对决策结果的物理属性理解困难,难以形成全面的决策认知链。 未来研究可通过改进提示设计与会话记忆管理,增强LLMs对复杂社会动态协同决策的理解和处理能力。例如,通过设计精准提示,LLMs可更好地理解群体行为对系统结果的影响;通过改进记忆管理,LLMs可提取长期信息以识别潜在行为模式。 在日益复杂的社会环境中,LLMs作为辅助工具有望在交通、金融及多主体社会模拟领域发挥重要作用。然而,其广泛应用仍需解决协作能力、信息不对称及伦理问题,以推动人机协作进入新阶段。 作者介绍王凌昊 博士研究生 王凌昊,浙江大学智能交通研究所道路与交通工程博士在读。主要研究方向为交通运输领域的人机协同发展,结合人工智能技术的群体决策实验。 蒋哲远 博士研究生 蒋哲远,浙江大学智能交通研究所博士在读。研究智能化、协同化的城市快速路系统管控方法,融合AI与人机博弈优化技术,服务于城市交通效率提升、出行体验优化。胡晨珂 硕士研究生 胡晨珂,浙江大学智能交通研究所交通运输专业硕士在读。主要研究方向是交通碳减排政策设计、交通政策的心理助推效果。 赵俊 博士后研究员 赵俊,亚利桑那大学应用交通科学中心(CATS)博士后研究员。研究领域为出行行为研究、交通仿真和人机融合实验。朱政 研究员 朱政(通讯作者),浙江大学百人计划研究员,博士生导师,土木工程学系系主任助理、智能交通研究所所长助理,国家级青年人才。研究方向为交通运输人机共进:融合AI算法与多人决策实验,揭示人机决策机理,实现人与AI在交通系统中的协同进化。 陈喜群 教授 陈喜群(通讯作者),浙江大学长聘教授,博士生导师,智能交通研究所所长,智慧交通浙江省工程研究中心副主任。荣获自然科学基金优秀青年科学基金,中国科协“青年人才托举工程”、浙江省杰出青年基金、浙江省特聘专家等。汪子逸 博士 汪子逸,浙江大学应用心理学博士。现任浙江云通数达科技有限公司董事长,致力于通过大数据与人工智能技术提升城市交通运行效率。曾获2024年“数据要素×”大赛全国总决赛二等奖,2022年浙江省优秀博士论文,第七届浙大校友创新创业大赛总决赛三等奖等荣誉。研究方向为决策心理学、城市交通优化技术与应用等相关领域。 柳天明 博士研究生 柳天明,密西根大学土木与环境工程系在读博士生,师从殷亚峰教授。研究方向为交通大语言模型,交通系统管理优化,出行行为分析。何贵兵 教授 何贵兵,浙江大学心理与行为科学系教授。研究兴趣包括决策认知过程及其脑机制、人机协同决策、脑机智能与认知、心理健康与决策、智能组织管理等。 殷亚峰 教授 殷亚峰,密西根大学土木与环境工程系Donald Malloure系主任,工学院Donald Cleveland讲席教授。主要研究方向为交通系统的建模与优化。现担任Transportation Science领域主编,Transportation Research Part B: Methodological副主编,并曾任Transportation Research Part C: Emerging Technologies主编。曾获密西根大学门罗-布朗基金会教育卓越奖等多项奖励荣誉。 相关文章信息 论文原文刊载于Cell Press细胞出版社 旗下期刊iScience ▌论文标题: Comparing AI and human decision-making mechanisms in daily collaborative experiments ▌论文网址: https://www.sciencedirect.com/science/article/pii/S2589004225009721 ▌DOI: https://doi.org/10.1016/j.isci.2025.112711 iScience现已加入Cell Press MJS多刊审稿!(点击查看)的前身Cell Press Community Review模式于2021年推出。对于通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的作者,我们将提供稿件被多本期刊同时考虑的机会。超过80%通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的文章获得了至少一个或多个期刊的评审。 CellPress细胞出版社 悠拘尉橙掷挚焊肪探惫碳氐詹飞秘