Meta가 10일 ‘Meta의 AI 미디어 브리핑’ 행사를 개최하고, 오픈소스 대규모 언어모델인 ‘Llama(라마)’를 중심으로 한 AI 기술 및 오픈소스 접근 방식과 Meta 인공지능 연구소 FAIR(Fundamental AI Research)의 연구 내용을 발표했습니다.
이번 행사는 그간 Meta가 오픈소스 선두주자로서 걸어온 행보와 AI 기술 및 연구 성과를 공유하기 위해 마련됐습니다. 마노하 팔루리(Manohar Paluri) Meta 생성형 AI 부사장과 Meta FAIR 연구팀, 장광선 한국과학기술정보연구원(KISTI) 선임연구원이 발표자로 나선 가운데, ▲라마의 성과 및 오픈소스 접근 방식 ▲국내 라마 활용 사례 ▲FAIR의 최신 연구 내용 등이 소개됐습니다.
그간 라마의 성과 및 개방형 접근 방식
이날 첫 발표자로 나선 마노하 팔루리 부사장은 라마가 일궈낸 그간의 성과와 커뮤니티 주도의 혁신을 촉진하는 핵심 기술로서의 역할을 공유했습니다. Meta는 최근 발표한 Llama 3.2 모델을 포함해 총 4번의 성공적인 배포를 마쳤으며, AI 커뮤니티 내에서의 영향력을 키워나가고 있습니다. 구체적으로 현재까지 라마 모델은 4억 회 이상 다운로드되었으며, 이는 작년 대비 10배 증가한 수치라고 강조했습니다. 또한 라마 모델은 교육, 헬스케어 분야 등 스타트업부터 대기업까지 수많은 비즈니스에 다양한 용도로 활용되고 있으며, 라마로 파생된 AI 모델은 6만 5천 개 이상에 달한다고 전했습니다.
이어 팔루리 부사장은 이처럼 Meta가 오픈소스 접근 방식을 추구하는 이유로 개방형 생태계가 기술 혁신의 속도를 가속화하고, 안전성과 투명성을 높이는 데 기여할 수 있기 때문이라고 덧붙였습니다. 특히, 오픈소스 모델은 개발자로 하여금 본인만의 모델을 훈련하고, 미세 조정할 수 있도록 하며, 오랫동안 지속가능한 시스템을 구축할 수 있도록 돕는다고 설명했습니다. 팔루리 부사장은 “Meta의 장기적인 목표는 범용 인공지능(AGI)을 구축하고 이를 책임감 있게 오픈 소스로 공개해 모든 사람이 AI의 혜택을 누릴 수 있도록 하는 것”이라며, “AI 기술은 단순히 기업의 성장을 넘어, 사회와 경제에 큰 가치를 제공할 수 있다”고 전했습니다.
국내 라마 활용 사례 ‘과학기술정보 특화 대형언어모델, 고니’
장광선 선임연구원은 KISTI의 과학기술정보 특화 대형언어모델인 고니(KISTI Open Natural Intelligence, KONI)를 구축한 사례를 소개했습니다. 고니는 라마 모델을 기반으로 과학기술 데이터를 추가 학습했으며, 이를 통해 국내 연구기관과 공공기관에 특화된 과학기술정보 서비스를 제공하는 것을 목표로 하고 있습니다. 장 선임연구원은 라마의 오픈소스 특성과 비교적 적은 자원으로 보안성이 높은 모델을 구축할 수 있는 점을 고려해 선택했다고 설명했습니다. 고니는 ScienceON과 AccessON 등 KISTI의 주요 서비스에 적용될 예정이며, 향후 한전전력연구원과 농림식품기술기획평가원 등 타 공공기관에서도 활용될 계획입니다. 이를 통해 연구자들은 방대한 과학기술 데이터를 보다 효율적으로 요약하고 활용할 수 있으며, 관련 분야 전문가들은 최신 연구 동향을 쉽게 분석하고 필요한 정보를 빠르게 얻을 수 있게 될 전망입니다.
개방적이고 책임감있는 연구 앞장서는 Meta FAIR 연구소
마지막 발표자로 나선 니킬라 라비(Nikhila Ravi)와 후안 피노(Juan Pino) Meta FAIR 연구팀 리서치 엔지니어링 매니저는 FAIR 연구소에 대한 전반적인 소개와 함께, 연구팀에서 장기적으로 투자해오며 진행한 연구 결과들을 공유했습니다. 우선, 라비 연구원은 지난 10년 동안 FAIR 연구팀이 개방적이고 책임감 있는 연구의 길잡이 역할을 자처하며, 연구 결과를 투명하게 공개하고자 노력해왔다고 설명했습니다. 실제로 FAIR 연구팀은 현재까지 1,000개 이상의 오픈 소스 라이브러리, 모델 및 데이터 세트 등을 공개적으로 배포한 바가 있습니다.
또한, FAIR 연구팀이 실생활 속 문제를 해결하는 데 기여할 수 있는 기술 개발 및 연구에 집중해온 점을 밝히며 대표적인 기술인 Segment Anything 2(SAM 2) 모델을 공유했습니다. Sam 2는 이미지와 영상 속에서 실시간으로 물체를 인식하는 모델로, 기존에 이미지만 인식 가능했던 SAM의 업그레이드된 결과물입니다. 기존 모델 대비 3배 더 적은 시간으로 보다 높은 인식률을 보이며, 제로샷 일반화(zero shot generalization) 성능을 통해 생소한 물체도 쉽게 인식 가능합니다. 이를 통해 정밀한 물체 인식이 필수적인 해양 과학 및 의료 분야에 혁신적으로 활용될 수 있다고 전했습니다.
이어서 피노 연구원은 FAIR 연구팀의 주요 기술 중 Seamless M4T와 Audiobox를 소개했습니다. 먼저, SeamlessM4T는 음성과 텍스트를 넘나들며 즉각적인 번역을 제공함으로써 언어의 제약 없이 보다 효과적인 소통을 지원한다고 밝혔습니다. 현재 최대 100개의 언어에 대한 음성-텍스트, 음성-음성, 텍스트-음성, 텍스트-텍스트 번역을 수행할 수 있습니다. 마지막으로, 오디오 생성 모델인 Audiobox는 음성 및 텍스트 명령을 통해 특정 용도에 맞춤화된 음향 효과 또는 자연스러운 목소리를 제작할 수 있도록 돕는다고 설명했습니다.
마누하 팔루리 Meta 생성형 AI 부사장은 “Meta는 오픈 소스 분야에서 오랜 역사를 보유하고 있는 것은 물론, 계속해서 개방형 생태계를 넓혀가기 위해 다양한 이해관계자들과 협업하고 있다”라며, “앞으로도 Meta는 책임감 있는 AI 연구와 오픈소스 접근 방식을 통해 전 세계 모두가 최첨단 기술의 혜택을 누릴 수 있도록 적극 노력하겠다”라고 전했습니다.