구글 제미나이(Gemini) : 구글의 멀티모달 AI 모델

구글 제미나이 소개

구글 제미나이(Gemini)는 구글에서 개발한 대규모 언어모델(LLM)이며 멀티모달 AI모델이다. 2023년 5월 10일, Google I/O 2023에서 처음 개발이 공개가 된 제미나이는 2023년 12월 6일 온라인 기자 간담회를 통해 성능을 공개해 충격을 주고 있다.

 

※멀티모달이란?

멀티모달(Multi-Modal)은 여러 가지 형태와 의미로 컴퓨터와 대화하는 환경을 말한다. 멀티모달에서 모달은 모달리티(Modality)를 의미하는데 모달리티는 인터랙션 과정에서 사용되는 의사소통 채널이다. 여기서 인터랙션은 통신을 주고받는 형태 즉, 단방향의 통신이 아닌 양방향 통신을 말한다. 멀티모달을 이용하면 사람의 여러 신체부위에 컴퓨터를 연결하여 다양한 정보를 주고받을 수 있게 된다.

 

 

Gemini - Google DeepMind

Gemini is built from the ground up for multimodality — reasoning seamlessly across image, video, audio, and code.

deepmind.google

 

 

학습 데이터

학습 데이터는 구글의 다양한 서비스에서 수집한 것으로 알려져 있다. 예를 들어, 구글 검색, 구글 지도, 구글 드라이브 등에서 수집한 데이터를 활용하여 학습을 진행한 것으로 추측이 된다. 그리고 구글은 다양한 연구 기관과 협력하여 인공지능 분야에서 연구를 진행하고 있으며, 이 과정에서 수집한 데이터도 학습에 활용되었을 가능성이 있다.

 

특히나 유튜브의 방대한 데이터를 이용한다는 이야기도 나오고 있어 이처럼 구글은 자사의 플랫폼 덕분에 모델 학습을 위한 수많은 데이터들을 손쉽게 접근하고 개발할 수 있는 것으로 보인다.

 

 

 

특징

①대규모 언어모델(LLM) : 구글에서 개발한 대규모 언어모델(LLM)입니다. LLM이란 대규모 데이터 세트에서 얻은 지식을 기반으로 텍스트와 다양한 콘텐츠를 인식하고 요약, 번역, 예측, 생성할 수 있는 딥 러닝 알고리즘을 말한다.

 

②멀티모달 : 텍스트뿐만 아니라 이미지, 비디오 및 오디오를 원활하게 이해할 수 있는 다중 모드의 모델이다.

 

③강화학습 : 강화학습을 통해 제미나이의 성능은 시간이 지날수록 계속적으로 발전한다.

 

④GPT-4 능가 : GPT-4를 능가할 모델로 기대되고 있다. 매개변수는 이미 뛰어넘은 것으로 알려졌지만 아직까지 자세한 수치는 공개되지 않았다.

 

⑤다양한 형태의 데이터 처리 : 다중모달 특성 덕분에 동시에 다양한 형태의 데이터를 처리하고 생성할 수 있다.

 

기능

①텍스트 생성 : 제미나이는 텍스트의 다양한 형식을 생성할 수 있다. 예를 들어, 시, 소설, 코드, 대본, 음악 작품, 이메일, 편지 등을 사용자가 원하는 대로 자유롭게 생성 가능하다.

 

②언어 번역 : 제미나이는 100개 이상의 언어를 번역한다.

 

③질문 답변 : 질문이 개방형, 도전적이거나 이상하더라도 유익한 방식으로 답변할 수 있는 창의성까지 갖추었다.

 

④사기 탐지 : 해당 텍스트의 사기성을 감지해 내기 때문에 사실이 아닌 것들을 콕 집어내어 알려준다.

 

활용

제미나이는 아직 개발 중에 있지만 출시할 때 다양한 분야에서 활용될 것으로 예측하고 있다.

 

①교육 : 제미나이는 학생들이 새로운 것을 배우도록 도와줄 수 있다. 예를 들어, 학생들이 역사, 과학, 수학 등 다양한 주제에 대한 텍스트를 생성하거나 번역이 가능해서 교육과 관련하여 활용될 것이다.

 

②비즈니스 : 기업이 고객 서비스, 마케팅, 연구 개발 등을 개선하는 데 필요할 것이다. 예를 들어, 기업이 고객의 질문에 유익한 방식으로 답변하거나, 새로운 제품이나 서비스를 홍보하는 텍스트를 생성할 수 있을 것이다.

 

③엔터테인먼트 : 엔터테인먼트 분야에서 새로운 콘텐츠를 만드는 데 사용될 것으로 보인다. 예를 들어, 영화, TV 프로그램, 게임 등을 위한 스토리, 대본, 대사를 스스로 창의적으로 생성해 낸다.

 

영상

보고 있으면 입이 떡 벌어진다. 우리가 생각했던 것 이상의 것을 보여주기 때문이다. 어떤 말을 할 필요 없이 그냥 영상을 보는 걸 추천한다.

 

마무리

구글 제미나이는 인공 지능의 미래를 향한 중요한 진전이라고 생각한다. 다양한 분야에서 새로운 가능성을 열어줄 것으로 기대되는 제미나이는 인공지능 분야에서 새로운 지평을 열 것으로 기대되며, 개인적으로도 상당히 놀라운 경험을 했기 때문에 정식으로 출시 됐을 시 과연 어떤 파장을 일으킬지 궁금해진다.

 

 

 

 

하이퍼클로바 엑스 : 네이버에서 만든 비영어권에 특화된 초대규모 인공지능 서비스

1. 네이버의 하이퍼클로바 엑스 네이버가 100억개의 매개변수를 자랑하는 어마어마한 초대형 언어 모델인 하이퍼클로바 엑스를 공개했다. 하이퍼클로바 엑스는 ChatGPT의 성능과 비슷하지만 대신

ordinarypersons.tistory.com

 

플렉슬(Flexcil) : 아주 유용하게 쓰이는 디지털 필기 앱

1. 플렉슬 소개 플렉슬이라는 회사에서 만든 필기 애플리케이션이다. 안드로이드와 iOS 모두 지원하며, 앱은 무료로 다은 받아서 사용할 수 있지만, 스탠더드 버전을 이용하려면 결제를 따로 해

ordinarypersons.tistory.com