/ AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

2024. 11. 21. 오전 7:36:41
애플이 개발한 시각 인공지능 시스템 Visual Intelligence v0.1을 테스트한 결과, 이미지 인식과 객체 식별 능력이 제한적임을 확인했습니다. 특히, Google과 ChatGPT보다는 Google의 성능이 더 뛰어났습니다. 시각 인텔리전스는 미세 오븐, 오븐, 에어프라이어, 카페 머신, 스파이크 워터 머신, 스파이크 워터 머신, Eames Lounge Chair 등 다양한 제품을 정확하게 식별했습니다. 그러나 일부 제품에 대해서는 불확실함이 있었으며, 인쇄물에 대해서는 정확히 식별할 수 있었습니다. 이 시스템은 아직 개발 중이며, 향후 많은 개선이 기대됩니다.
AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

알겠습니다, 이것은 단순히 개발자 테스트 버전일 뿐이며, 애플이 누구든지 물어본다면 제 시각 인공지능의 초기 인상을 미래의 잠재력을 기반으로 제공한다는 점을 언급해야 합니다. 그러나 나는 그것을 시도해보니 그 미래에 대해 기대하게 되었습니다.

애플 인텔리전스 부분은 현재 상대적으로 제한적입니다. 대부분의 경우, ChatGPT에게 보고 있는 것을 설명해 주세요 또는 Google 검색…

실제의 Apple Intelligence 구성 요소

애플 인텔리전스는 몇 가지 기능을 직접 수행합니다.
  • Summarising text seen in the scene
  • Getting information on businesses, from Apple Maps
  • Recognizing dates and times in text, and opening Calendar for that slot
하지만 객체 인식에 대한 경우, 현재의 기능은 ChatGPT와 Google만을 사용한다고 보입니다. 제 한계된 경험에 따르면, Google이 훨씬 뛰어납니다.Google과 ChatGPT를 사용한 이미지 인식

나는 일반적으로 중요한 구매를 하기 전에 많이 조사한다. 리뷰를 읽고 친구에게 조언을 구하고, 일반적으로 Google을 최대한 많이 물어본다.

그런 경우, 특정 정보가 필요합니다. 나는 작은 빈-투-컵 커피 기계를 보고 싶다고 말해줄 때, 나는 그저 작은 빈-투-컵 커피 기계를 보고 있다는 것을 알려줄 거야.

그런데 Visual Intelligence v0.1은 어떻게 작동하나요? 제 집 주변에 몇 가지 것을 테스트했습니다.

첫 번째로 나온 것은 제 사기 콤비 웨이브 3인1입니다. 이는 미세 오븐, 오븐, 그리고 에어프라이어가 결합된 제품입니다. 이 제품은 미국에서 브레빌 브랜드로 판매됩니다. Visual Intelligence는 즉시 이를 식별했습니다(우측 상단에서 첫 번째 일치). 또한 경쟁 제품도 보여주었지만, 상위 검색 결과의 나머지 모두 올바르게 나타났습니다.
AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.
다음은 제 지혜의 바리스타 터치 커피 머신입니다. VI는 여기서 조금 더 불확실했으며, 이거나 동일 브랜드의 훨씬 비싼 오라클 터치 모델 중 하나일 수 있다고 제안했습니다. 그러나 두 가지 제안 중 어느 것이 올바른지 판단하는 데는 별 말이 필요하지 않습니다. (그러나 세 번째 모델이 혼동된 사진을 가진 사이트의 분류 광고로 보입니다.)
AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.
오르케이 카본에이터 II 스파이크 워터 머신? 문제가 없음.
AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

Reidel O Wine Tumbler와 약간 더 싸움을 했지만, 그건 이해할 수 있습니다. 그들은 많은 사본이 있기 때문입니다. 대부분 원본과 정확한 사본만 보여주었습니다.

AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.
거주 공간으로 이동하면 Eames Lounge Chair라고 식별했으며, 밀리미터 정확도의 복제품이기 때문에 실제 것과 구별할 수 없음을 사과하겠습니다.
AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

그런 방식으로 잘 알려진 아티스트가 아닌(하지만 잘 알려진 아티스트는 아님) 일부 원작에 적용해 보았지만 성공하지 않았습니다. 그러나 인쇄물에 대해서는 식별 문제 없이 잘 작동했습니다.

AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

나의 Naim Mu-so는 두 번째 세대 기기로 간주했지만, 그들이 외관적으로 동일하고 거의 모든 웹 참조가 해당 모델에 관한 것임을 고려하면 이해할 수 있습니다.

AI 일기: 시각 인텔리전스의 첫 인상을 통해 미래에 기대감을 갖게 되었습니다.

나는 집 주변의 여러 기술 제품에 시도해 보았습니다:

  • Original HomePod
  • Echo Dot
  • Philips Hue Switch
  • Netatmo Smart Doorbell
모든 것이 맞았습니다.

이것은 좋은 시작이며, 아직 더 많은 것이 있습니다.

제가 첫 번째로 AI 기반 이미지 인식 기술을 경험한 것은 Ray-Ban Meta 렌즈를 착용할 때였습니다. 그러나 그들은 최대한 활용하려면 신중한 표현이나 추가 질문이 필요했습니다.시각 인텔리전스가 이미 이렇게 발전하고 있으며, 그 개발 속도가 가장 흥미롭게 만듭니다. 여러 회사가 이 분야에서 경쟁하고 있음을 생각하면, 매우 짧은 시간 내에 많은 진전을 보일 것이라 생각합니다.물론이죠, 모든 AI 기술과 같이 부끄러운 실수가 있을 것입니다. 그러나 이 기술의 본질은 모든 상호작용에서 배우는 것입니다.아이폰을 임의의 상품에 가리키면 즉시 평균 별점과 신뢰할 수 있는 AI 리뷰 요약을 얻을 수 있을 것 같지 않나요? 보통은 애플이 우리에게 새로운 기술로 무엇을 할 수 있는지 보여주기를 기대하지만, 이번에는 반대로 우리에게 기대를 두고 있습니다.

접근이 있다면(내 경우 몇 주가 걸렸던 것), Visual Intelligence에 대한 당신의 첫 인상을 어떻게 생각하나요? 의견을 댓글에 공유하고 아래의 Fernando의 영상도 확인해 보세요.