ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • vol.009│웹 탐색, 멀티모달 창작, AI 자동 더빙 구축까지!
    뉴스레터 2024. 12. 12. 13:06
     안녕하세요!
    AI 트렌드 Bold Flick의 아홉번째 소식이에요!

     

     다들 바쁘게 지내시나요? 어느새 또 새로운 소식을 전해드릴 시간이 돌아왔어요! 이번 회차의 Bold Flick에서는 웹을 AI와 함께 탐색하는 코파일럿 비전부터, 한 장의 사진만으로 새로운 3D 세계를 펼쳐내는 혁신, 그리고 멀티모달 AI 플랫폼 Sora까지, 점점 더 풍부해지고 똑똑해지는 AI 기술들을 가득 담아왔어요!
     궁금하신가요? 그럼 지금 바로 새로운 AI 세상 속으로 발걸음을 옮겨볼까요? 🚀

    #Microsoft #Copilot Vison #마이크로소프트 #코파일럿 #엣지브라우저 #AI웹검색
    마이크로소프트의 코파일럿 비전 미국 출시!
    <웹 브라우징의 혁신, AI와 함께하는 지능형 탐색 도우미> by.VQZ
    ⓒ Microsot / Copilot Vision

     인터넷을 사용 할 때, AI가 사용자와 함께 화면을 보고 판단을 돕는다면 어떨까요? 마이크로소프트는 코파일럿 비전(Copilot Vision)이라는 새로운 기능을 통해, AI가 사용자와 함께 웹을 탐색할 수 있도록 만들어 출시했다는 소식이에요. 코파일럿 비전은 사용자가 Edge 브라우저에서 특정 웹페이지를 열면, 코파일럿 비전을 호출해 화면의 텍스트와 이미지를 분석하고, 즉각적인 정보 요약결정 지원을 제공한다고 해요.


     예를 들어, 논문을 작성하기 위해 자료를 조사한다고 가정해볼까요?
    코파일럿 비전은 관련 내용을 빠르게 스캔하고, 적합성을 판단할 수 있도록 사용자에게 핵심 정보를 전달합니다. 즉, 마치 두 번째 눈처럼 복잡한 웹 탐색 과정을 단순화해주는 것입니다.


     마이크로소프트는 개인정보 보호와 저작권을 최우선으로 한다고 밝혔어요. 코파일럿 비전 세션이 종료되면 모든 데이터가 삭제되며, 웹사이트 데이터는 모델 학습에 사용되지 않는다고해요. 이러한 접근은 사용자 신뢰를 강화하려는 마이크로소프트의 전략을 보여주는 부분이죠.

    ⓒ Microsot / Copilot Vision

     현재는 미국 내 Pro 구독자 일부만이 기능을 체험할 수 있으며, 마이크로소프트는 피드백을 반영해 점차 지원 웹사이트와 기능을 확대할 계획이라고 해요. 향후, 이 기술이 OneDrive, Excel 같은 마이크로소프트 생태계로 확장될 가능성도 있지만, 공식적으로 확인된 바는 아직 없어요.


     한편, 경쟁사들도 빠르게 발전 중입니다. 세일즈포스는 에이전트포스로 업무 자동화를 확대하고 있으며, 엔트로픽의 클로드는 데스크톱 환경에서 앱 실행과 양식 작성 같은 작업을 수행하는 기술들을 선보이고 있죠.


     이제는 AI가 함께 웹검색을 하며 생각을 나누는 날이 멀지 않았다는 생각이 듭니다. 하루 빨리 마이크로소프트의 코파일럿 비전이 한국에서도 서비스되기를 기대해 봅니다!

    #YouTube #AI더빙 #자동더빙

    YouTube AI 자동 더빙의 시대!

    <언어 장벽을 넘는 새로운 영상 시대> by.VQZ
    ⓒ YouTube Blog

     외국어 자막 없이도 전 세계 사람들과 유튜브에서 콘텐츠로 소통한다? 얼마전 인터프리터 소식에 이어 유튜브에서도 AI 기반 자동 더빙 기능이 대폭 확장되며, 콘텐츠를 제작하는 수백만 크리에이터들에게 문을 열었답니다.


     해당 기술은 영상의 원어에 따라 자동으로 더빙을 만들어줍니다. 예를 들어 영어로 제작된 영상이라면 프랑스어, 독일어, 힌디어, 이탈리아어, 스페인어, 인도네시아어, 일본어, 포르투갈어로 더빙됩니다. 반대로, 위 언어들로 제작된 영상은 영어로만 더빙이 가능하다고 해요.


     자동 더빙 영상은 업로드와 동시에 생성되지만, 크리에이터가 미리 확인하고 수정할 수 있는 옵션이 제공된다고 해요. 또한, 필요하면 더빙을 비공개로 설정하거나 삭제할 수도 있어요.

    made with Midjourney

     물론 아직은 완벽하지 않아요. 현재 더빙 음성이 자연스럽지 않다는 의견도 있지만, 유튜브는 "앞으로 감정, 억양, 주변 분위기까지 재현하는 수준으로 발전시킬 것"이라고 약속했어요. 그리고 아직 한국어 지원도 되지 않아 아쉬운 부분도 있죠.


     유튜브는 2023년 6월, 초기 테스트 단계에서 “수백 명의 크리에이터”와 함께 시작했는데요. 이제는 더 많은 유형의 콘텐츠로도 확장할 계획이라고 하니, 여러분이 제작하는 콘텐츠에도 곧 적용될 가능성이 있겠죠?


     앞으로 유튜브의 AI 더빙이 더 발전한다면 여러분의 콘텐츠, 여러분들이 즐길 콘텐츠들을 더 다양하고 폭넓게 즐기고 공유하는 기회가 머지 않았다는 생각이 듭니다! 

    #AI #ChatGPT #ChatGPT Pro #Sora

    OpenAI Sora: 차세대 AI 경험을 이끌 새로운 플랫폼

    <텍스트, 음성, 이미지까지 아우르는 통합형 AI 솔루션> by.D-Caf

     여러분, AI 기술이 나날이 발전하면서 이제는 텍스트뿐만 아니라 이미지, 음성 등 다양한 방식으로 소통하는 시대가 열리고 있어요. 이처럼 더 풍부한 데이터와 상황을 이해하고, 창의적으로 활용할 수 있는 능력을 갖춘 AI 플랫폼이 필요하다는 점, 느껴본 적 있으신가요? 바로 이런 니즈에 맞춰 OpenAI가 새로운 멀티모달 AI 솔루션, Sora를 선보였습니다. 텍스트, 이미지, 음성을 자유자재로 다루는 Sora, 과연 무엇이 달라졌을까요? 함께 살펴볼까요? 🚀

    Sora란 무엇인가요?

     Sora는 OpenAI가 새롭게 선보인 멀티모달(Multimodal) AI 플랫폼으로, 한 단계 발전한 인공지능 경험을 제공합니다. 기존 AI 모델들이 주로 텍스트 기반의 대화를 중심으로 발전해왔다면, Sora는 텍스트에 머무르지 않고 이미지, 음성까지 아우르는 통합형 AI를 목표로 해요.

    ⓒ Open AI / Sora

    Sora로 펼쳐지는 새로운 영상 세계

     Sora는 단순히 영상을 자르고 붙이는 수준에 머무르지 않아요. 예를 들어, 여러분이 고요한 도서관 장면을 우주선 내부로 순식간에 바꾸고, 이어서 그 우주선을 정글 속에 둔 다음, 마지막엔 그 정글을 다시 달 표면으로 변신시키는 일이 가능해집니다. 게다가 특정 장면에서 제일 인상적인 컷을 추출하고, 이를 자연스럽게 이어붙여 흐름을 깔끔히 정리하거나, 여러 개의 영상을 매끄럽게 섞어 하나로 합치는 것도 문제없어요. 마치 전문 편집자처럼 생각하는 AI가, 한 장면 한 장면 원하는 분위기로 재해석하고, 반복, 변환, 혼합을 통해 전혀 새로운 콘텐츠로 탄생시켜주는 거죠.

     여기에 더해 다양한 스타일 프리셋을 활용하면 종이 공예풍, 필름 누아르풍, 혹은 다른 독특한 비주얼 무드까지 손쉽게 적용할 수 있어요. 한마디로, “내가 상상하는 어떤 장면이든 Sora에게 말해주면, AI가 그 상상을 실제 영상으로 만들어준다”라고 해도 과언이 아닙니다.

    가격은 어떨까?

     앞서 ChatGPT 플랜을 예로 들면, ChatGPT Plus는 월 $20에 비교적 간단한 동영상 생성과 720p 해상도를 지원했고, ChatGPT Pro는 월 $200으로 최대 1080p 해상도에 20초 길이의 영상, 5개의 동시 작업 등 더욱 강화된 기능을 제공한다고 알려져 있습니다.

    왜 흥미를 가져야 할까?

    • 제로부터 시작하는 크리에이터도 OK: 전문 편집 기술이 없어도 AI의 도움으로 쉽게 멋진 장면을 만들 수 있어요.
    • 시간 절약: 일일이 장면 찾고, 자르고, 붙이고 하는 번거로운 작업은 AI가 대신 척척!
    • 무한한 창의력: “이 장면을 우주로 바꿔볼까?” “공간을 정글로 변환해볼까?” 같은 아이디어를 몇 번의 클릭과 명령어로 실현할 수 있다면, 제작 과정이 놀이처럼 느껴지지 않겠어요?

    앞으로가 더 기대되는 이유

     멀티모달 AI는 아직 시작 단계예요. 앞으로 고해상도, 더 긴 영상, 더 자연스러운 음성 변환 등 기능 향상은 계속될 거예요. 머지않아 Sora가 “스타일 제안→편집→최종 렌더링”까지 모든 과정을 AI 어시스턴트처럼 알아서 도와주는 날이 올지도 모르죠.
      
     Sora는 영상 제작을 훨씬 쉽고 창의적으로 바꿔주는 AI 솔루션이에요. 다양한 스타일 변환과 장면 재구성 능력을 갖춘 Sora는, 이제 누구나 손쉽게 상상을 현실로 만들 수 있는 시대가 열렸음을 알려주고 있어요. 영상 편집의 새로운 가능성을 직접 경험해보시겠어요? 손끝에서 펼쳐지는 영상 마법, 여러분도 그 매력에 빠져보세요! 😊
      
      
    오늘의 'Bold Flick'은 여기까지!

    다음 뉴스레터에서는 더욱 놀랍고 흥미로운 AI 소식으로 찾아뵐게요.
    언제나 Bold Flick을 사랑해주셔서 감사합니다! 💙

    궁금한 점이 있거나 더 알고 싶은 주제가 있다면 언제든 말씀해 주세요.

    여러분의 피드백이 저희에게 큰 힘이 된답니다!

    마음에 드셨다면 'Bold Flick' 뉴스레터 구독하러 가기!☝️
    © 2024 Bold Flick
    boldflick100@gmail.com
    수신거부 Unsubscribe
Designed by Tistory.