首页 / AI 日记:视觉智能的初步印象让我对未来充满期待

AI 日记:视觉智能的初步印象让我对未来充满期待

2024/11/21 07:36:41
苹果公司发布了其视觉智能技术的开发者测试版,该技术目前具有总结看到的文本、获取业务信息、识别文本中的日期和时间并在日历中打开相应时间等功能。测试中,视觉智能在识别常见产品如咖啡机、碳水机和椅子时表现良好,但在识别一些不太知名的艺术家作品时遇到了困难。苹果表示,该技术将不断学习和进步,未来有望实现更准确的图像识别。
AI 日记:视觉智能的初步印象让我对未来充满期待
我知道,这只是开发者测试版,如果苹果公司有任何问题,我将我的视觉智能的第一印象纯粹地放在其未来潜力的背景下。但我必须说,尝试它让我对那个未来感到兴奋。目前,实际的Apple Intelligence功能相对有限。在大多数情况下,你只能选择让ChatGPT向你描述你看到的内容,或者进行一次Google搜索……

实际的苹果智能部件

据我们所知,Apple Intelligence 直接执行以下几项功能:
  • Summarising text seen in the scene
  • Getting information on businesses, from Apple Maps
  • Recognizing dates and times in text, and opening Calendar for that slot
但是,对于物体识别,目前该功能似乎仅使用ChatGPT和Google。在我的有限经验中,Google的表现最为出色。使用Google和ChatGPT进行图像识别我通常会在按下按钮之前对大多数非平凡的购买进行深入的研究。我会阅读评论,向朋友寻求建议,并且通常会反复询问谷歌。所以我如果看到某样东西在使用,并且想了解更多信息,我需要具体说明:仅仅告诉我我在看一个紧凑型豆到杯咖啡机或类似设备可能不够。所以,视觉智能v0.1表现如何?我在家里周围测试了一些东西。首先,我使用了Sage Combi Wave 3-in-1,这是一个集微波炉、烤箱和空气炸锅于一体的组合电器。这款产品在美国由Breville品牌销售。Visual Intelligence立即将其识别出来(第一个匹配项,右上角)。它还显示了一款竞争对手的产品,但其余的顶级搜索结果都是正确的。
AI 日记:视觉智能的初步印象让我对未来充满期待
接下来是我的Sage Barista Touch咖啡机。VI在这里有些不确定,建议可能是这款或者同一品牌的更昂贵的Oracle Touch型号,但通过简单的判断就可以确定哪一个是正确的建议。(虽然它似乎提到了第三款型号,但那是一个照片标签错误的网站上的分类广告。)
AI 日记:视觉智能的初步印象让我对未来充满期待
Aarke Carbonater II 碳酸水机?没问题。
AI 日记:视觉智能的初步印象让我对未来充满期待
在使用Reidel O Wine Tumbler时,它表现得稍微有些困难,但这是可以原谅的,因为有很多仿制品。它主要只展示了原始版和直接复制版。
AI 日记:视觉智能的初步印象让我对未来充满期待
进入客厅后,它识别出这是埃ames Lounge Chair,并且由于它是毫米级的精确复制品,我原谅它无法将其与真实物品区分开来。
AI 日记:视觉智能的初步印象让我对未来充满期待
我在一些不太知名的(但不是完全未知的)艺术家的原创艺术作品上尝试过,但没有成功。然而,当它用于印刷品时,却能轻松识别出来。
AI 日记:视觉智能的初步印象让我对未来充满期待
使用我的Naim Mu-so时,它以为是第二代设备而不是第一代,但鉴于它们在视觉上完全相同,并且几乎所有的网络参考都是关于那款型号的,这完全是可以理解的。
AI 日记:视觉智能的初步印象让我对未来充满期待
我在家里的一系列其他科技产品上试了一下:
  • Original HomePod
  • Echo Dot
  • Philips Hue Switch
  • Netatmo Smart Doorbell
它完全正确。这是一次伟大的开始,还有很多事情等待我们去探索。我在尝试Ray-Ban Meta眼镜时第一次体验到AI驱动的图像识别技术,尽管这需要一些仔细的措辞和/或后续问题才能充分利用它们。视觉智能已经看起来比这更好了,而这种发展的速度让我感到非常兴奋。在多家公司在这一领域竞争的情况下,我认为我们将在很短的时间内看到巨大的进步。当然,AI技术难免会有尴尬的错误,就像所有AI技术一样,但这种技术的本质就是从每一次互动中学习。我不认为我们还需要很长时间就能做到像用iPhone指向商店或街头看到的任何产品,并立即获得平均星级评分和一个不错的AI评论总结。通常,是苹果公司告诉我们它迫不及待要看看我们用其新技术能做什么,但在这种情况下,情况恰恰相反。如果你有访问权限(在我的情况下花了 couple of weeks),你对 Visual Intelligence 的第一印象是什么?请在评论中分享你的想法,并查看 Fernando 的视频。