Google I/O 2023 开发者大会也在 AI 领域发布许多重大突破,尤其是在基础模型方面,Google 推出新一代语言模型 PaLM 2。它不仅支持多种语言,还具备更强大的推理能力和程序编写能力。
PaLM 2 运用超过 100 种语言的多语资料训练而成,理解和产生文字的能力都大幅增强,还能将含有微妙细节的文本翻译成各种语言,像是不容易处理的俗谚、诗歌和谜语等等,同时也通过进阶语言能力测试,达到 Mastery 等级。
在逻辑推理上,PaLM 2 的资料数据整合了涵盖数学算式的科学研究论文、网页等,所以在逻辑、常识推理和数学方面的功能都有大幅提升。
加上 PaLM 2 使用了大量公开的自然语言及原始码资料进行预先训练,所以精通 Python 和 JavaScript 等常见程序语言,也有能力生成 Prolog、Fortran 和 Verilog 等其他语言编写专业程序。
一系列多元模型
PaLM 2 模型有不同的规模尺寸,能够更轻易的部署并应用在不同的使用需求情境。Google 将推出 Gecko、Otter、Bison 和 Unicorn 四种不同规模的 PaLM2 模型。其中,Gecko 是极为轻量,甚至可以在离线的移动设备上运作。这种多功能性代表 PaLM 2 可以进行微调,以更多方式支持整个产品类别,帮助更多使用者。
支持近 25 种 Google 产品
Google 也在开发者大会上发布 25 款由 PaLM 2 提供支持的新产品和功能,这些功能不仅 Google 许多内部团队已经在使用,消费者、开发者以及全世界不同规模大小的企业也都能体验。
新功能包括:PaLM 2 的多语言能力将加入 Bard 聊天机器人;结合 PaLM 2 技术, Workspace 的 Gmail 和 Google 文件能通过 AI 协助撰写,在 Google 试算表会进行整理,帮助快速完成工作。
由具有医学背景的健康研究团队应用医学知识进行训练的语言模型 Med-PaLM 2 ,能从各种密集复杂的医学内容中归纳出重点,并回答相关问题,在医疗知识方面已展现出顶尖性能。Google 表示 Med-PaLM 2 在美国医师执照考试达到「专家」等级,而且它支持多模态功能,结合 X 光和乳房摄影等各种信息,希望未来能改善治疗成果。Google 期望 Med-PaLM 2 能在 2023 年夏天开放给小部分的 Cloud 客户使用,藉此收集各方意见回馈。
还有一款针对安全性用途训练的 Sec-PaLM,未来采用 AI 来协助分析、解释可能造成威胁的指令码行为,并且能更精准地检测对使用者和组织确实有害的指令码,未来可通过 Google Cloud 使用。
Google 表示在 3 月时曾推出 PaLM API 的非公开预先发布版给少部分开发者试用。即日起,开发者可登记使用 PaLM 2,担心隐私的企业用户也可以通过 Vertex AI 中的模型。此外,生成式 AI 协作工具 Duet AI for Google Cloud 也采用 PaLM 2 技术,可帮助用户学习、建构并执行营运操作。
Gemini 模型开发中
Google 透露,自家开发的 AI 基础模型不只有 PaLM 2,还有一款 Gemini。 Gemini 是 Google 第一个从头即采取多模态开发的模型,在不同大小模型下都能提供良好性能,也能有效率地和其他工具、API 整合。Gemini 目前仍在训练阶段,但在处理多种型态的内容上,已展现出更优于先前模型的性能,一旦微调完成并通过安全性测试,Gemini 就会像 PaLM 2 一样,开始提供多样尺寸和速度的模型。