评估预部署AI模型的可靠性

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。

然而,作为ChatGPT和DALL-E等强大人工智能工具的核心,这些模型有时可能会提供错误或误导性的信息。在一些安全至关重要的场景中,比如行人接近自动驾驶汽车时,这些错误可能会导致严重后果。

为了避免此类错误,麻省理工学院及其IBM沃森人工智能实验室的研究人员开发了一种技术,能够在将基础模型应用于特定任务之前评估其可靠性。

他们通过训练一组略有不同的基础模型来实现这一目标。接着,他们利用算法评估每个模型在相同测试数据点上的学习表示的一致性。如果表示一致,便意味着该模型是可靠的。

在与最先进的基线方法进行比较时,他们的技术在捕捉各种分类任务中基础模型的可靠性方面表现更佳。

这种技术可以帮助用户判断一个模型是否适合特定环境,而无需在现实世界的数据集上进行测试。这在某些情况下尤其有用,例如医疗保健环境中,由于隐私问题可能无法访问数据集。此外,该技术还可以根据可靠性分数对模型进行排序,帮助用户选择最适合其任务的模型。

“所有模型都有可能出错,但能够识别出何时出错的模型更具实用性。对于这些基础模型而言,量化不确定性或可靠性变得更加复杂,因为它们的抽象表示难以进行比较。我们的方法可以帮助量化模型在特定输入数据下的可靠性,”资深作者Navid Azizan表示,他是麻省理工学院机械工程系和数据、系统与社会研究所(IDSS)的助理教授,同时也是信息与决策系统实验室(LIDS)的成员。

他与第一作者Young-Jin Park(LIDS研究生)共同撰写了关于这项工作的论文,参与者还包括麻省理工学院-IBM沃森人工智能实验室的研究科学家王浩,以及Netflix的高级研究科学家谢尔文·阿德希尔。该论文将于人工智能不确定性会议上发表。

统计共识

传统的机器学习模型通常被训练来执行特定任务,通常会根据输入做出具体预测。例如,模型可能会判断某张图片中是猫还是狗。在这种情况下,评估可靠性可能仅需查看最终预测结果,判断模型是否正确。

然而,基础模型的工作方式有所不同。它们使用通用数据进行预训练,创建者并不清楚模型将应用于哪些具体下游任务。用户在训练完成后可以让模型适应自己的特定需求。

与传统机器学习模型不同,基础模型不会给出“猫”或“狗”这样的具体标签,而是基于输入数据生成抽象表示。

为了评估基础模型的可靠性,研究人员采用了一种集成方法,训练多个具有相似特征但略有不同的模型。

“我们的思路类似于计算共识。如果所有基础模型对数据集中的任何数据都给出一致的表示,那么我们可以认为该模型是可靠的,”Park表示。

但他们面临一个挑战:如何比较这些抽象表示?

他补充道:“这些模型输出的是一个由数字组成的向量,因此我们无法轻易比较它们。”

他们通过一种称为邻域一致性的概念来解决这个问题。

在他们的方法中,研究人员准备了一组可靠的参考点来测试模型集合。然后,他们对每个模型在其表示的测试点附近的参考点进行调查。

通过观察相邻点的一致性,他们能够估计模型的可靠性。

对齐表示

基础模型在所谓的表示空间中映射数据点。我们可以将这个空间视为一个球体。每个模型将相似的数据点映射到其球体的同一区域,因此猫的图像会集中在一个地方,而狗的图像则在另一个地方。

然而,每个模型在其领域内绘制的动物地图可能不同,因此当猫可能被分组在一个球体的南极时,另一个模型可能在北半球的某个位置绘制猫的地图。

研究人员使用邻近点作为锚来对齐这些球体,从而使表示具有可比性。如果一个数据点的邻居在多个表示中一致,那么我们可以对该点的模型输出的可靠性充满信心。

在对广泛的分类任务进行测试时,他们发现这种方法比基线方法更具一致性。此外,它不会因为挑战测试点而导致其他方法失效。

此外,他们的方法可以用于评估任何输入数据的可靠性,因此可以评估模型对特定类型个体(例如具有某些特征的患者)的效果。

王表示:“即使所有模型的整体性能处于平均水平,从个体的角度来看,你也会更倾向于选择最适合自己的模型。”

然而,一个限制在于他们必须训练一个大型基础模型的集合,这在计算上是昂贵的。未来,他们计划寻找更高效的方法来构建多个模型,或许可以通过对单个模型进行小扰动来实现。

本文来自作者[svs]投稿,不代表立场,如若转载,请注明出处:http://ibmjournal.com/post/5398.html

(150)

文章推荐

  • 四大菩萨代表什么意义?

      四大菩萨代表什么  在佛教中,四大菩萨分别是观音菩萨、文殊菩萨、普贤菩萨和地藏菩萨。它们代表着不同的意义和象征,对信徒们有着深远的影响。本文将深入探讨四大菩萨代表的含义,帮助读者更好地理解佛教文化。(图片来源网络,侵删)  观音菩萨代表慈悲与智慧。观音菩萨是慈悲之母,以无比的慈悲心和智慧

    2024年09月13日
    747
  • 加拿大政府为争议管道项目提供贷款担保

    ˂pclass="1884291c7bc42b25 description"˃加拿大政府为有争议的跨山输油管道项目提供了数十亿美元的新商业贷款担保,目前人们越来越担心成本超支。2018年,加拿大政府将这个从阿尔伯塔省延伸到太平洋沿岸的项目国有化。新的贷款担保总额高达30亿加元(

    2024年11月01日
    304
  • 冬虫夏草怎么吃 冬虫夏草的食用方法

    冬虫夏草怎么吃  冬虫夏草是一种珍贵的中药材,具有很高的营养价值和药用价值。那么,冬虫夏草怎么吃呢?通常有几种常见的食用方法。首先,可以将冬虫夏草泡水饮用。将适量的冬虫夏草放入温水中,浸泡30分钟后饮用,既能保留其营养成分,又能帮助身体吸收。其次,可以将冬虫夏草与鸡肉、鸽子等炖煮,制作成汤品。这

    2024年11月10日
    246
  • 未揭晓的手机(2a)特别版:一场生动的原色致敬

      本周,Nothing发布了Phone(2a)特别版,展现了其最新智能手机的独特色彩叙事。该版本忠实于品牌的透明和简约理念,采用了鲜艳的原色——红、黄、蓝,呈现出大胆的新设计。设计灵感Nothing的工业设计

    2024年11月24日
    182
  • 父母双双被控涉嫌8个月大婴儿死亡案

      新加坡:周二(9月3日),一名21岁的女子因其8个月大的儿子死亡而被起诉,而25岁的男孩父亲因未能保护婴儿而被指控。ChloeGanCiXuan和NeoJiaMing分别被控在第304C条下导致或允许家中14岁以下儿童死亡。他们被还

    2024年11月25日
    147
  • 威廉王子将赴新加坡宣布“地球摄影奖”气候项目

      威廉王子将在下个月前往新加坡,宣布他的地球摄影奖的获奖者,这是一个全球竞赛,旨在寻找气候变化挑战的解决方案。三年前,威廉设立了这个奖项,鼓励发明家和企业家开发对抗全球变暖的技术,减轻其对环境的影响。威廉王子在肯辛顿宫的办公室发表声明,选择在新加

    2024年11月27日
    145
  • 圣诞节前双职工可获两项福利,生育可领取420欧元的“婴儿津贴”

      今天,政府发布的预算中包含了针对双胞胎儿童的两项福利金以及新生儿的420欧元补助。英国财政部长杰克·钱伯斯(JackChambers)在今天下午确认,名为“婴儿激励计划”(BabyBoost)的政策将为新父母提供三倍的儿童福利金。自明

    2024年11月28日
    160
  • 菲律宾南部弥撒期间爆炸事件致至少4人遇难

      菲律宾官员透露,周日,菲律宾南部一座以穆斯林为主的城市发生了一起强烈爆炸,初步判断是炸弹引起的。爆炸发生在一场天主教弥撒期间,导致至少四人遇难,数十人受伤。国立棉兰老州立大学的安全主管塔哈·曼丹甘表示,爆炸发生时,学校的体育馆内正在进行晨间弥撒。爆炸瞬间引

    2024年12月03日
    110
  • CoC归档开始

      今天,候选资格证书(CoC)申报工作为期一周的准备工作已圆满完成,这标志着2025年5月12日全国及地方同步投票和棉兰老穆斯林邦萨摩罗自治区议会选举的竞选季节“非正式”启动。然而,选举管理委员会(Comelec)主席乔治·欧文·加西亚(GeorgeErw

    2024年12月05日
    66
  • VinFast在欧洲电动汽车行业的战略优势

      越南河内-媒体外展新闻专线-2024年9月6日-越南河内,地缘政治和生态充满不确定性的经济前景,VinFast,越南电动汽车制造商,是步宁以多元化战略谋求自身的成功。通过提供一系列产品并瞄准多个市场,该公司正在快速发展的汽车行业中创造独特的优势。地缘政治紧张局势给全球经济蒙上

    2024年12月12日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • svs
    svs 2024年12月01日

    我是的签约作者“svs”!

  • svs
    svs 2024年12月01日

    希望本篇文章《评估预部署AI模型的可靠性》能对你有所帮助!

  • svs
    svs 2024年12月01日

    本站[]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • svs
    svs 2024年12月01日

    本文概览:基础模型是由众多深度学习模型构成的,这些模型在大量通用的未标记数据上进行了预训练。它们能够被应用于多种任务,例如生成图像或解答客户咨询。...

    联系我们

    邮件:@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们