要开发 AI 人工智能算法,必不可少的就是大量的数据库,例如 OpenAI 旗下的 GPT-4,可能就使用了数以兆计的文本来训练。另一方面,作为信息提供方,如网络学术文章、社交新闻平台等也受到重视,像是 Reddit 近期就拟定要向 AI 开发商收费。不过这种不断喂养 AI 资料的做法并不会一直持续下去,OpenAI 总裁 Sam Altman 就表示,此类制造大型 AI 模型的时代已经结束。
这并不代表未来 AI 就不必接收新知,然而,Wired 援引 Altman 的说法,解释要扩大 AI 资料库,必会受到物理性限制,因为数据的上限取决于开发商能够建造出多大的数据中心,以及建造速度是否跟得上 AI 的发展。
另外 Altman 也说到,扩大模型规模所获得的成效已不如以往,但究竟 OpenAI 未来会以什么方式来继续训练 AI 仍不得而知。Wired 推测他们可能会运用一种名为强化学习的方法,搭配人类的回馈,借由人类决定 AI 答案是否合理的方式来提升模型品质。