苹果详解基于用户数据的本地Apple Intelligence训练系统

苹果公司上月推迟了更个性化和强大的Siri功能的推出。为了将来更好地推进Apple Intelligence更新，有报道称强调了苹果在训练其人工智能模型的策略上所做的一个转变。

报告重点介绍了苹果机器学习研究网站上的一篇博客文章，解释了苹果通常如何使用合成数据来训练其人工智能模型。然而，这种策略存在局限性，例如合成数据很难”理解”诸如总结或写作工具之类的功能中的趋势，这些功能作用于较长的句子或整个电子邮件。

为了解决这一限制，苹果强调了一种新技术，该技术将很快开始使用，该技术将合成数据与少量最近的用户电子邮件进行比较，但不会损害用户隐私。

大致意思如下：

苹果为了改进其模型，需要生成大量涵盖常见主题的电子邮件。为了创建一个具有代表性的合成电子邮件集合，他们首先会创建大量关于各种主题的合成消息，例如“你明天上午 11:30 想一起打网球吗？”
苹果开放翻译API，开发者可将其集成至iOS应用

这个过程不涉及任何个人用户电子邮件的信息。然后，他们会为每条合成消息生成一个称为“嵌入”的表示，这个嵌入捕捉了消息的一些关键维度，例如语言、主题和长度。这些嵌入会被发送给少量选择加入设备分析的用户设备。

参与的设备会选择一小部分最近的用户电子邮件，并计算它们的嵌入。然后，每个设备会决定哪些合成嵌入与这些用户邮件样本最接近。通过使用差分隐私技术，苹果可以了解所有设备中最常被选择的合成嵌入，而不会知道任何特定设备上选择了哪个合成嵌入。

这些最常被选择的合成嵌入可以用于生成训练或测试数据，或者可以进行额外的管理步骤来进一步优化数据集。例如，如果关于打网球的消息是最热门的嵌入之一，那么可以通过将“网球”替换为“足球”或其他运动来生成类似的消息，并将其添加到下一轮管理的数据集中。这个过程使他们能够改进合成电子邮件的主题和语言，从而帮助他们训练模型在电子邮件摘要等功能中创建更好的文本输出，同时保护用户隐私。

苹果解释说，这些技术允许它”理解整体趋势，而不会了解任何个人的信息”。报道还指出，苹果将在未来的iOS 18.5和macOS 15.5测试版中推出这个新系统。

苹果服务订阅用户突破10亿大关，云存储和音乐流媒体占主导地位

苹果详解基于用户数据的本地Apple Intelligence训练系统

相关文章

最新发布

热门话题