트렌드 모아보기/IT 트렌드

네이버 초대규모 AI 하이퍼클로바 공개, 누구나 AI 활용하는 시대 연다

식꿈 2021. 5. 25. 16:17

네이버가 초대규모 인공지능(AI) 하이퍼클로바를 공개하고 글로벌 AI 기술 리더로 발돋움하겠다는 계획을 25일 밝혔습니다.

 

온라인으로 열린 NAVER AI NOW 컨퍼런스에서

작년 10월 슈퍼컴퓨터 도입 이후 네이버 AI 기술의 성과와 앞으로의 방향성을 공개했는데요.

 

기존 한국어 AI의 패러다임을 바꾸는 하이퍼클로바를 통해서

사용자, SME, 클리에이터에게 새롭고 차별화된 경험을 선보이며 모두를 위한 AI 시대를 이끌어가겠다는 목표입니다.

 

인공지능(AI) 산업이 진화를 거듭하고 있습니다.

분야별 데이터 분석과 학습을 하는 기존 AI 모델을 넘어서

인간의 뇌처럼 스스로 종합적으로 추론하고 창작까지 가능한 초거대 AI 시대가 다가오고 있다는 분석입니다.

 

이미 글로벌 기업들은 초거대 AI 준비에 한창입니다.

대표적인 예가 바로 GPT-3인데 GPT-3는 현존하는 가장 뛰어난 초거대 AI 언어모델로

일론 머스크 테슬라 CEO가 주도해 설립한 오픈AI가 지난해 발표했습니다.

해당 AI는 방대한 데이터를 학습해 고차원적 추론 결과를 내놓을 수 있는 자연어처리 능력을 갖췄습니다.

 

이밖에도 아마존, 구글, 애플 등 주요 빅테크 기업들이 AI인프라 확보에 경쟁적으로 공격적인 투자를 이어가고 있습니다.

초거대 AI 기술 기반으로 클라우드, 금융, 자율주행, 헬스케어 등 다양한 산업 분야에 지배력을 강화하고 있는 셈입니다.


하이퍼클로바란?


하이퍼클로바는 네이버가 국내 기업 최초로 자체 개발한 초대규모 AI입니다.

 

정석근 네이버 CLOVA CIC 대표는 키노트에서 글로벌기술 대기업들은

대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다며

한국의 AI 기술이 글로벌 플랫포멩 종속되지 않기 위해서는

이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다며 개발 배경을 밝혔습니다.

 

하이퍼클로바는 OpenAI의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(매개변수) 규모로 개발 되었습니다.

AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록 AI는 더 많은 문제를 해결할 수 있게 됩니다.

 

하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한 세계에서 가장 큰 한국어 언어모델이기도 합니다.

영어가 학습 데이터의대부분을 차지하는 GPT-3와 달리 하이퍼클로바 학습 데이터는 한국어 비중이 97% 입니다.

영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써 AI 주권을 확보한다는 의미도 담고 있습니다.

 

이를 위해 네이버는 지난 10월 국내 기업 최초로 700 페타플롭(PF) 성능의 슈퍼 컴퓨터를 도입하며

대용량 데이터 처리를 위한 인프라를 갖췄습니다.

 

국내 최대 인터넷 플랫폼을 운영하며 쌓아온 대규모 데이터 처리 능력도 하이퍼클로버만의 중요한 경쟁력입니다.

네이버는 하이퍼클로바 개발을 위해 5600억개 토큰의 한국어 대용량 데이터를 구축했습니다.

슈퍼컴퓨터 인프라와 한국어 데이터 외에

네이버가 보유한 전세계 최고 수준의 AI 연구 개발 역량 역시 하이퍼클로바 자체 개발의 중요한 요소입니다.

네이버는 작년 한해 글로벌 Top AI 컨퍼런스에서 국내 기업 중 가장 많은 43개의 정규 논문을 발표하며 기술력을 인정 받았습니다.

 

또한 서울대학교와 서울대-네이버 초대규모 AI 연구센터를 설립하고

카이스트 AI 대학원과 카이스트-네이버 초창의적 AI 연구센터를 설립하는 등

긴밀하고 강력한 산학협력을 통해 AI 공동 연구에 더욱 박차를 가하고 있습니다.

 

네이버는 앞으로 한국어 외 다른 언어로 모델을 확장하고 언어뿐만 아니라

영상이나 이미지 등도 이해하는 멀티모달 AI로 하이퍼클로바를 계속해서 발전시켜나갈 계획입니다.

 


하이퍼클로바 상용화는?


하이퍼클로바는 AI 개발과 적용의 패러다임을 완전히 바꿔 일상 속에서 AI가 더욱 보편적으로 사용되도록 합니다.

기존에는 해결하고자 하는 문제별로 데이터를 확보하고 정제하여 모델을 개발했다면

하이퍼클로바는 하나의 빅 모델에 방대한 데이터를 학습시켜 다양한 문제에 적용할 수 있습니다.

이를 통해 AI를 더욱 효율적으로 개발할 수 있을 뿐만 아니라 AI의 확장성이 대폭 높아집니다.

 

네이버는 하이퍼클로바의 기술을 네이버 서비스에 적용해 사용자들에게 차별화된 경험을 제공할 예정입니다.

첫 사례로 지난 6일 검색 서비스에 하이퍼클로바를 적용해 사용자가 검색어를 잘못 입력하는 경우

올바른 단어로 전환해 검색해주거나 적절한 검색어를 추천해주는 기능을 선보인 바 있습니다.

네이버는 하이퍼클로바가 SME, 크리에이터, 스타트업 등 기술의 도움이 필요한 모두의 능력이 될 수 있도록 지원한다는 계획입니다.

간단한 설명과 예시를 제시하는 소수학습 방식으로 AI를 동작시킬 수 있기 때문에

AI 전문가가 아니어도 누구나 손쉽게 AI 서비스를 만들 수 있게 됩니다.

 

예를 들어 상품 판매에 도움이 되는 적절한 마케팅 문구를 AI가 자동으로 작성해주는 일,

공부해야 할 내용을 AI가 빠르게 요약하거나 모르는 내용을 질문했을 때 자연스럽게 답변해주는 일 등이 가능해집니다.

네이버는 향후 적극적인 사업 및 연구 협력을 통해 다양한 방식의 기술 제공을 계획하고 있습니다.

 

하이퍼클로바는 글을 곧잘 쓸 수 있기 때문에 창작자를 도와줄 다양한 예시 문장을 제안하거나

이미 써놓은 문장을 변환하는 등의 능력을 보여줄 수도 있습니다.

실제 네이버 쇼핑에 노출되는 상품 소개 문구를 적게 했을 때 노출 적합도 채택률이 99%에 달했다고 설명했는데

이는 실제로 조만간 스마트스토어에도 적용될 예정입니다.

 

그밖에도 정보 요약 측면에서도 하이퍼클로바가 요약한 문장이 기존 AI모델의 성능과 비교해

내용 적합도와 글의 자연스러움이 높은 수준임을 확인했다며 학습을 위한 데이터샛 자동생성 능력도

기존보다 대화 시나리오 구축 생산성이 10배 이상 개선될 것으로 기대하고 있습니다.

 

네이버는 기존에도 기술 플랫폼이라는 방향성 아래, 첨단 AI 기술로 사용자의 일상을 더욱 편리하게 바꾸고

SME의 비즈니스와 크리에이터의 활동에 가치를 더하기 위해 노력해왔습니다.

 

특히 코로나19 팬데믹 상황에서 클로바의 자연어처리, 음성 인식 및 합성 기술로 능동감시자 관리를 위한

클로바 케어콜 서비스를 내놓으며 방역 현장의 업무 효율화에 기여하기도 했습니다.

 

정석근 네이버 CLOVA CIC 대표는 더 짧은 시간과 더 적은 리소스를 사용해서

이전에 우리가 상상만 했던 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다며

하이퍼클로바를 통해 SME와 크리에이터를 포함해 AI 기술에 필요한 모두에게 새로운 경험을 제공할 것이라고 밝혔습니다.


다른 국내 기업들도 초거대 AI 구축 개발에 나서


네이버 외 국내 기업들도 본격적으로 초거대 AI 개발에 공을 들이고 있습니다.

 

LG의 AI 전담조직인 LG AI연구원은 지난 17일 향후 3년간 거대 AI 개발에 1억 달러 이상의 투자를 진행하겠다고 발표했습니다.

올해 하반기까지 GPT-3의 3배 수준인 6천억 개 파라미터를 갖춘 초거대 AI를 선보일 예정입니다.

또한 내년 상반기에는 조 단위 파라미터의 초거대 AI도 개발할 계획으로

글로벌 제조기업 중 이같은 규모의 AI 개발은 첫 사례가 될 전망입니다.

 

LG는 AI 기반으로 차세대 배터리, 고효율 발광 분야에서 신소재 발굴을 가속화할 계획입니다.

더 나아가 인간의 면역 체계를 활용한 신개념 암치료제인 항암 백신 개발과

더 친환경적인 플라스틱 소재 발굴에도 활용할 계획입니다.

 

KT 역시 카이스트와 AI·SW 기술 연구소를 대덕2연구센터에 공동설립하고 연내 공식 출범 시킬 계획입니다.

KT는 교수와 연구원, KT 직원 등 약 200명이 상주할 수 있는 연구 인프라 지원에 나섭니다.

SKT 역시 카카오, 국립국어원과 손잡고 GPT-3와 유사한 수준의 초거대 AI 모델 GLM을 연내 상용화할 계획입니다.

GLM은 1,500억개의 파라미터를 갖춘 거대 언어 모델로 개발될 예정입니다.

 

업계 관계자는 GPT-3가 오픈되고 나서 초거대 AI가 업계 트렌드로 자리잡고 있다며

굉장히 많은 기업들이 경쟁을 하고 있는 상황이지만 한국어 기반 자료가 부족한 상황이기에

국내 기업들이 자체적으로 초거대 AI를 개발하는게 중요하다고 설명했습니다.