阿兰·图灵在 1950 年代提出了最早的对 AI 的测试,人类评估者判断他们是在和人类还是与 AI 说话。如果 AI 能冒充人类,那么它就通过了图灵测试。
DeepMind 联合创始人 Mustafa Suleyman 在其新书中否定了传统的图灵测试,因为“它没有告诉我们系统能做什么或理解什么,是否建立了复杂的内心独白,或能在抽象的时间范围内进行规划”。
他提出了新的图灵测试,“让 AI 将 10 万美元的种子基金变成 100 万美元,以此衡量 AI 是否具有类人的智能”。AI 需要研究一个电商方案,制定产品计划,找到制造商和销售商品。他预测 AI 将在两年内实现这一目标:“我们不只关心机器能说什么,我们还关心它能做什么。”
新的图灵测试确实更加实用和有意义,因为它涉及到了 AI 的实际能力,而不仅仅是语言交互能力。这个测试涉及到了 AI 的规划和决策制定能力、商业智慧、风险管理等多个方面的能力,如果 AI 能够顺利实现这个目标,那么它将立即拥有商业智能基础,并且可以为我们提供更加广泛的帮助。但是,这个测试所涉及到的复杂性和难度也非常高,因为它要求 AI 具备高度的“人类智慧”。需要持续的技术逐步发展,以提高 AI 的智能水平和准确性,以赢得最终的成功。