可以运行在手机上的大语言模型还是大语言模型吗 2024 Week 17 回顾

本周,微软和苹果分别开源了自己的模型 Phi3OpenELM。这两个模型都不大,在笔记本和手机这样的设备上运行起来也不费力,性能也还可以。

这种模型有了一个新分类:SLM——Small Language Model。

去年这个时候,谈论的还是 GPT-4,谈它的强大,以及难以复制。只过了一年,我们谈的是如何在本机运行一个模型,加上自己的文档来实现 RAG;谈的是如何使用多个 Agents 来解决复杂问题,谈的是如何在手机上运行一个小模型。

游戏和真实 2024 Week 16 回顾

显然,游戏是真实世界的模拟、抽象、模型。

游戏中的表现,往往能反映出玩家在现实中的一些特质,比如耐心、冷静、智慧、勇气等等。能组织一个魔兽世界公会的玩家,在现实中也许是一个很好的团队领导。在枪战游戏中瞄得快打得准的玩家,在现实中也许很适合做外科医生。常年在固定地点刷怪的十里坡剑神,也许很擅长做重复性工作。

Multi-Agents 是未来 2024 Week 14 回顾

去年 4 月我写了一篇文章 《AutoGPT 是一株幼苗》,讲刚出现的 AutoGPT。今年,Agents 成了热门词,人们发现用多个 Agents 一起工作,效果更好。

Multi-Agents 的基本思路是多个 Agents 相互讨论,把一个复杂问题分解成多个简单问题,然后通过沟通协作来解决。这样,每个 Agent 只需要专注于自己的部分,以及通过和其他 Agents 的交流来改进生成结果。