70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型
MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,击败了LLaMA-65B,甚至与PaLM-540B相媲美。

谷歌研究科学家Ahmad Beirami表示,「几十年来,LLM对提示的响应方式一直如出一辙。MIT研究人员提出了将博弈论引入这一过程的新颖想法,开创了一个全新的范式,这有可能带来大量新的应用」。

游戏,不再单纯是衡量AI的标准。以往,通过机器学习在游戏竞赛中的表现,去判断某个AI系统是否取得成功。而这样的案例,比比皆是。

1997年,IBM深蓝计算机击败了国际象棋特级大师Garry Kasparov,创下了所谓的「思考机器」的里程碑。

19年后,谷歌DeepMind发明的AlphaGo,在围棋比赛中一举战胜李世石。五局比赛中获胜四局,揭示了人类在某些领域已不再独占鳌头。

不仅如此,AI还在跳棋、双人扑克,以及其他的「零和游戏」中超越了人类。与以往不同的是,MIT团队而是选择从另一个角度来看问题——用游戏去改进人工智能。对于AI研究人员来说,一款称为「Diplomacy」的游戏,提出了一个更大的挑战。