본문 바로가기
New Technology

생성형 인공지능 챗GPT 음성으로 사람과 대화가능~

by 트래블인베스트 2023. 9. 27.

생성형 인공지능(AI) 챗GPT가 사람과 음성으로 대화하고 이미지를 보고 질문에 답할 수 있게 진화했다.

챗GPT, 타 음성 AI 비서들과 달리 '대화 가능'

25일(현지시간) 오픈AI는 챗GPT가 '보고 듣고 말하는' 새로운 기능을 조만간 제공한다고 밝혔다.

'듣고 말하는 기능'은 이용자와 음성으로 질문과 답변을 주고받는 기능이다. 지금까지는 프롬프트를 통해 대화했다면 이제는 음성 대화가 가능해지는 것이다.

기존 아마존의 AI 비서인 알렉사(Alexa), 애플의 시리(Siri), 구글 어시스턴트(Google Assistant) 등과 비슷한 기능이다.

다만 이들 AI 비서가 주로 이용자의 음성 명령을 실행하는 데 초점이 맞춰져 있다면, 챗GPT는 대화가 가능하다.

이용자가 음성으로 질문을 하면 챗GPT가 이를 텍스트로 변환해 대규모 언어 모델(LLM)에 전달하고, 답변받아 다시 음성으로 변환해 말하는 방식이다.

챗GPT 음성은 5가지 형태로 제공될 예정이며, 이용자는 이 가운데 하나를 선택해 사용할 수 있다.

오픈AI는 향후 세계 최대 음원 스트리밍 서비스인 스포티파이와 협력해 목소리를 유지하면서 다른 언어로 번역이 가능하게 하는 방안도 검토하고 있다고 설명했다.

오픈AI는 이 기능을 2주 이내에 챗GPT 유료 구독자들에게 제공하고, 이후 모든 사람이 이용할 수 있도록 할 것이라고 전했다.

음성 기능은 IOS와 안드로이드 앱으로 제한된다.

https://n.news.naver.com/mnews/article/277/0005319885?sid=105

뉴스: OpenAI는 오늘 아침 새로운 음성 및 이미지 기능을 출시하기 시작했으며 매우 인상적이라고 발표했습니다.

 

ChatGPT에 이미지를 표시하고 이미지에 대해 채팅할 수 있습니다. 이전에 발표된 ChatGPT는 사용자가 제공한 프롬프트를 기반으로 이미지를 생성할 수도 있으며 채팅을 통해 편집할 수도 있습니다.

 

오늘 아침 OpenAI는 새로운 음성 기능을 시연했습니다. iOS 및 Android 앱(향후 2주에 걸쳐 출시 예정)에서 ChatGPT를 통해 음성 채팅을 할 수 있습니다. OpenAI는 오픈 소스 음성 인식 시스템인 Whisper를 사용하여 음성을 텍스트로 변환합니다. 제 경험상 거기가 제일 나은 것 같아요.

 

그러나 오늘 아침 데모에서는 내가 본 것보다 더 나은 새로운 텍스트 음성 변환 엔진을 보여주었습니다. 목소리는 사람의 목소리와 거의 구별이 불가능합니다.

 

샘플은 아래 동영상을 확인하세요.

 

OpenAI가 대기 시간 문제를 해결하고 ChatGPT를 통해 진정한 음성 채팅 대화를 가능하게 하는 한, 이는 대부분의 사람들이 AI를 사용하는 방식에 큰 도약이 될 수 있습니다. 사람들이 하루 종일 대화를 통해 ChatGPT와 간단히 대화할 수 있으므로 큰 영향을 미칠 수 있는 잠재력이 있습니다.

 

출시되면 직접 사용해 보고 싶습니다.

 

이 새로운 기능에 대해 또 누가 기대하고 있습니까?

'New Technology' 카테고리의 다른 글

비트코인 보유량 순위  (0) 2023.09.25
연내 비트코인 현물 ETF 출시?  (0) 2023.09.06
한국형 초거대 AI_하이퍼클로바X  (0) 2023.08.24
로보택시 시대 개막?  (0) 2023.08.11
상온 초전도체 개발 성공?  (0) 2023.08.02