고성능 컴퓨터의 초창기 시절, 주요 테크 기업들은 각사만의 폐쇄형 소스 버전 Unix 운영 체제 개발에 막대한 투자를 했습니다. 당시만 해도 다른 접근 방식으로는 고급 소프트웨어를 개발할 수 없다고 생각했습니다. 하지만 결국에는 오픈 소스인 Linux가 인기를 얻게 되었죠. 처음에는 개발자가 원하는 대로 코드를 수정할 수 있으면서도 더 저렴하단 점이 인기 요인이었는데, 시간이 지날수록 폐쇄형 Unix보다 발전했고, 더 안전하며, 더 많은 기능을 지원하는 광범위한 생태계를 갖추게 되었기 때문입니다. 오늘날 Linux는 클라우드 컴퓨팅과 대부분의 모바일 장치를 실행하는 운영 체제의 업계 표준 기반이 되었으며, 그 덕분에 우리 모두는 우수한 제품의 혜택을 누리고 있습니다.
저는 AI도 비슷한 방식으로 발전할 것이라 믿습니다. 현재 여러 테크 기업이 선도적인 폐쇄형 모델(closed model)을 개발하고 있으나, 오픈 소스는 그 격차를 빠르게 좁혀가고 있습니다. 작년에 Llama 2가 최첨단 모델들의 초기 버전과 견줄 정도였다면, 올해 공개된 Llama 3는 가장 진보된 모델들과 경쟁하며 일부 분야에서는 선두를 달리고 있습니다. 이러한 발전 속도로 미루어 짐작건대, 내년부터 출시될 새로운 Llama 모델들은 업계에서 가장 진보한 모델이 될 것이라 기대합니다. 물론 현재도 Llama는 개방성, 수정 가능성, 비용 효율성 측면에서 이미 선두를 달리고 있습니다.
오늘 Meta는 오픈 소스 AI가 업계 표준이 되는 미래를 향해 한 발짝 더 나아가려 합니다. Meta는 최초의 최첨단 오픈소스 AI 모델인 Llama 3.1 405B와 새롭게 개선된 Llama 3.1 70B 및 8B 모델을 공개합니다. 405B 모델은 폐쇄형 모델에 비해 비용 대비 우수한 성능을 자랑합니다. 또한 개방형 모델이라는 점에서 미세 조정(파인튜닝)과 소규모 모델로 경량화하는 데 가장 적합한 모델입니다.
이러한 뛰어난 성능의 오픈소스 모델을 출시하는 것 외에도 Meta는 생태계 전반의 성장을 위해 다양한 기업들과 협력하고 있습니다. Amazon, Databricks, NVIDIA는 개발자들이 자체 모델을 미세 조정하고 경량화할 수 있도록 지원하는 서비스 제품군을 출시하고 있습니다. Groq과 같은 혁신 기업들은 모든 새로운 모델을 위해 지연 시간이 짧고 비용이 저렴한 추론 서빙을 구축했으며, 해당 모델은 AWS, Azure, Google, Oracle 등을 포함한 모든 주요 클라우드 서비스에서 사용할 수 있습니다. Scale.AI, Dell, Deloitte 등의 기업의 경우, 기업들이 Llama를 도입하고 자체 데이터로 맞춤형 모델을 학습할 수 있도록 지원하고 있습니다. 커뮤니티가 성장하고 더 많은 기업이 새로운 서비스를 개발해나간다면, Llama가 업계 표준으로 자리 잡을 수 있고, AI 기술이 주는 혜택이 더 많은 사람에게 돌아갈 수 있을 것입니다.
Meta는 오픈 소스 AI에 전념하고 있습니다. 오픈 소스가 최고의 개발 스택이라고 믿는 이유와 왜 Meta가 Llama를 오픈 소스로 개방하는지, 그리고 오픈 소스 AI가 전 세계에 어떤 이점을 주며 왜 장기적인 지향점이 되어야 하는지 설명드리겠습니다.
오픈 소스 AI가 개발자에게 좋은 이유
전 세계의 개발자, CEO 및 정부 관계자들과 이야기를 나누다 보면 보통 다음과 같은 이야기를 듣게 됩니다.:
- 자체 모델을 훈련하고, 미세 조정하고, 경량화해야 합니다. 조직마다 각자 다른 필요 조건이 있고, 이는 각 조직의 특정한 데이터로 훈련되고 미세 조정된 다양한 크기의 모델로 대응하는 것이 최적입니다. 가령, 온디바이스 작업과 분류 작업에는 작은 모델이 필요하고, 그것보다 복잡한 작업에는 더 큰 모델이 필요합니다. 이제는 가장 진화한 Llama 모델들을 자체 데이터로 계속 훈련시킨 후, 각 조직에 최적화된 사이즈의 모델로 경량화시킬 수 있습니다. Meta나 외부에 조직의 데이터가 노출될 걱정도 없습니다.
- 폐쇄형 모델 제공 업체에 종속되지 않고 스스로 통제권을 갖고 싶습니다. 대다수 조직은 자신들이 운영하고 제어할 수 없는 모델에 의존하는 걸 원치 않습니다. 폐쇄형 모델 제공 업체가 모델, 혹은 사용 약관을 변경하거나, 심지어 서비스를 완전히 중단시킬 경우 영향을 받고 싶지 않고, 모델에 대한 독점권을 가진 단 하나의 클라우드 서비스에 종속되는 것도 원하지 않습니다. 반면 오픈 소스는 호환 가능한 도구 체인(toolchain)을 갖춘 광범위한 기업 생태계를 지원하므로, 도구 체인을 바꾸는 것이 쉽게 가능합니다.
- 데이터를 보호하고 싶습니다. 대부분의 조직은 보안이 필요한 민감한 데이터를 처리하는 만큼, 데이터를 클라우드 API를 통해 폐쇄형 모델에 보낼 수 없다고 합니다. 어떤 조직은 폐쇄형 모델 제공 업체를 신뢰하지 않기도 하죠. 오픈 소스는 원하는 곳에서 모델을 실행할 수 있게 함으로써 이러한 문제를 해결합니다. 그리고 오픈 소스 소프트웨어는 투명하게 개발되기 때문에 더 안전할 확률이 높다는 것은 이미 잘 알려져 있습니다.
- 효율적이고 경제적인 모델이 필요합니다. 개발자는 자신들의 인프라에서 Llama 3.1 405B 모델을 이용해 GPT-4o와 같은 폐쇄형 모델 대비 약 50% 저렴하게 추론 작업을 실행할 수 있습니다. 이는 사용자 대면은 물론 오프라인 추론 작업 모두에 해당합니다.
- 우리는 장기적으로 업계 표준이 될 생태계에 투자하고 싶습니다. 많은 사람들이 오픈 소스가 폐쇄형 모델보다 빠른 속도로 발전하고 있음을 체감하고 있으며, 이들은 장기적으로 자신들에게 가장 큰 이득을 주는 아키텍처를 기반으로 시스템을 구축하고자 합니다.
Meta가 오픈 소스 AI를 추구하는 이유
Meta의 비즈니스 모델은 사람들을 위한 최고의 경험과 서비스를 구축하는 것에 집중합니다. 이를 위해 우리는 항상 최고의 기술에 접근할 수 있어야 하며, 우리가 구축하는 것을 제한할 수 있는 경쟁사의 폐쇄적인 생태계에 갇혀서는 안됩니다.
Apple의 플랫폼에서 제약을 받으며 우리의 서비스를 구축했던 경험은 이러한 생각을 갖게 된 계기 중 하나가 되었습니다. 개발자에게 수수료를 부과한다거나, 자의적으로 적용되는 정책, 혁신적인 제품 출시의 제한 등, 최고의 제품을 만들 수 있는 능력이 있는 상황에서 이처럼 다른 기업들의 제약을 받지 않았더라면, Meta를 포함한 많은 기업들은 우리 모두를 위해 훨씬 더 나은 서비스를 제공할 수 있었을 것입니다. 이것이 제가 차세대 컴퓨팅을 위해서는 AI와 AR/VR 분야에 개방형 생태계가 구축되어야 한다고 강력하게 믿는 주요한 이유입니다.
사람들은 종종 제가 Llama를 오픈 소스화함으로써 기술적 우위를 포기하는 것이 걱정되진 않느냐고 묻지만, 이러한 염려는 다음과 같은 몇 가지 이유에서 큰 그림을 놓치고 있다고 생각합니다.:
첫째, 최고의 기술에 접근하고 장기적으로 폐쇄적인 생태계에 갇히지 않으려면, Llama는 도구, 효율성 개선, 실리콘 칩 최적화 및 기타 통합으로 구성된 완전한 생태계로 발전해야 합니다. 만약 우리 회사만 Llama를 사용한다면 이 생태계는 발전하지 못하고 폐쇄형 Unix의 변형들보다도 나은 성과를 거두지 못할 것입니다.
둘째, AI 개발 분야는 계속해서 치열하게 경쟁할 것입니다. 이는, 특정 모델을 오픈 소스화하는 것이 미래의 차세대 모델이 가져올 큰 이점을 포기하는 게 아니라는 것을 의미합니다. Llama가 업계 표준이 될 수 있는 방법은 앞으로도 세대를 거듭하며 경쟁력 있고, 효율적이며 개방적인 모델로 남는 것입니다.
셋째, Meta의 비즈니스 모델은 AI 모델에 대한 접근 권한을 판매하는 것이 아니라는 게 우리와 폐쇄형 모델 제공 업체를 구분하는 중요한 차이점입니다. 그렇기 때문에 폐쇄형 모델 제공 기업과 달리, Meta는 Llama를 오픈 소스로 공개해도 우리의 수익, 지속가능성, 연구 투자 능력이 저하되지 않습니다. (이는 몇몇 폐쇄형 제공 업체가 정부에 지속적으로 오픈소스 반대 로비를 하는 이유 중 하나입니다.)
마지막으로, Meta는 오랜 기간 오픈 소스 방식을 택해왔으며, 많은 성공 사례가 있습니다. Open Compute Project를 통해 우리의 서버, 네트워크, 데이터 센터 설계를 공개하고, 공급망이 우리의 설계를 표준으로 채택하도록 함으로써 수십억 달러를 절감한 바 있습니다. 또한 PyTorch, React 등 주요 도구를 오픈 소스화함으로써 이뤄진 생태계의 혁신을 통해 여러 혜택도 누리고 있습니다. 이러한 오픈 소스 접근 방식은 오랜 기간에 걸쳐 일관되게 효과를 가져다 주었습니다.
오픈 소스 AI가 모두에게 좋은 이유
저는 AI 분야의 긍정적인 미래를 위해 오픈 소스가 필요하다 믿습니다. AI는 그 어떤 현대 기술보다 인간의 생산성, 창의성, 삶의 질을 향상시키고, 경제 성장을 가속화하며 의학 및 과학 연구 발전을 이끌 잠재력을 가지고 있습니다. 오픈 소스는 전 세계의 더 많은 사람들이 AI로 인한 혜택과 기회를 누릴 수 있도록 하고, 소수의 기업에 권력이 집중되지 않도록 하며, 사회 전반에 걸쳐 기술이 보다 고르고 안전하게 사용될 수 있도록 합니다.
오픈 소스 AI 모델의 안전성에 대한 논의가 계속되고 있는 가운데, 저는 오픈 소스 형태의 AI가 다른 대안들보다 안전할 것이라고 봅니다. 각국의 정부도 오픈 소스가 사회를 더 번영시키고 안전하게 만든다는 점에서 오픈 소스를 지원하는 방향으로 결론을 내릴 것이라 생각합니다.
제게 있어서 안정성이란, 의도하지 않은 피해와 의도적인 피해라는 두 가지 종류의 피해로부터 사람들을 보호하는 것입니다. 의도하지 않은 피해는 AI 시스템의 본래 이용 목적과 달리 피해가 발생하는 경우를 말합니다. 예를 들어, 현대의 AI 모델은 무심코 잘못된 건강 조언을 제공할 수 있습니다. 어떤 이들은 더 먼 미래에, AI 모델이 의도치 않게 자가 복제를 하거나 지나치게 목표에 최적화돼 인류를 해칠 수 있다고 걱정하기도 합니다. 반면, 의도적인 피해는 악의적인 목적을 지닌 누군가가 해를 끼칠 목적으로 AI 모델을 사용하는 경우를 말합니다.
AI 시스템을 사용하는 수십억 명의 사람들에게 미칠 영향부터 인류에게 펼쳐칠 공상과학적인 대참사의 시나리오까지, 사람들이 AI에 대해 가진 대부분의 우려들은 의도하지 않은 피해에 속한다는 점에 주목할 필요가 있습니다. 오픈 소스 시스템은 더욱 투명하게 개발되고 더 많은 사람들이 들여다보고 연구할 수 있어, 의도하지 않은 피해의 측면에서 분명 더욱 안전합니다. 역사적으로도 오픈 소스 소프트웨어는 이러한 이유 때문에 더 안전했습니다. 마찬가지로, Llama 역시 Llama Guard(Llama 가드)와 같은 안전 시스템과 함께 사용하면 폐쇄형 모델보다 더 안전하고 안심할 수 있습니다. 이러한 이유로 오픈 소스 AI의 안전성에 관한 대부분의 논의는 의도적인 피해 예방에 초점을 맞춥니다.
Meta의 안전성 프로세스는 모델 출시 전 위험을 최소화하는 것을 목표로, 우리의 모델들이 유의미한 피해를 입힐 가능성이 있는지 평가하는 엄격한 테스트와 레드팀 테스트(red-teaming)를 거칩니다. 개방형 모델이기 때문에, 자체적인 테스트 외에, 누구나 직접 안전성을 검사해 볼 수도 있습니다. 다만 오픈 소스 모델들은 이미 인터넷에 공개된 정보로 훈련된다는 점을 염두에 두어야 합니다. 따라서 피해를 판단할 때, 어떤 모델이 초래할 수 있는 피해가 구글이나 다른 검색 결과에서 손쉽게 찾을 수 있는 정보보다 더 심각한지 고민하는 것에서 출발해야 합니다.
의도적인 피해를 판단할 때는, 개인이나 소규모 단체가 할 수 있는 행위와 국가처럼 막대한 자원을 갖춘 대규모 단체가 할 수 있는 행위를 구분하는 것이 도움이 됩니다.
미래에는 악의적 목적을 가진 개개인이 AI 모델의 지능을 사용해, 인터넷에 공개된 정보로부터 완전히 새로운 피해를 만들어낼 수도 있습니다. 그 시점에, AI 안전을 위한 핵심은 힘의 균형일 것입니다. 저는 AI가 널리 보급되어 대규모 단체가 악의적 동기를 지닌 개별 사용자를 견제할 수 있는 세상이 더욱 바람직하다고 생각합니다. 이는 Meta가 우리의 소셜 네트워크 보안을 관리해 온 방식과 동일합니다. 우리의 강력한 AI 시스템은, 우리보다 작은 규모의 AI 시스템을 사용하는 덜 정교한 이들의 악행과 위협을 식별하고 차단합니다. 더 큰 관점에서 보면, 대규모 AI를 활용하는 대형 기관들이 사회 전반의 보안과 안전성을 촉진할 것입니다. 오픈 소스를 통해 모든 사람이 비슷한 세대의 모델에 접근할 수 있는 한, 더 많은 컴퓨팅 자원을 갖춘 정부나 대형 기관들은 그들보다 컴퓨터 자원이 부족한 악의적인 개개인 또는 소규모 단체를 견제할 수 있을 것입니다.
다음 질문은 미국과 민주주의 국가들이 중국과 같은 막대한 자원을 지닌 국가의 위협에 어떻게 대응해야 하는가입니다. 미국의 장점은 탈중앙화와 개방형 혁신입니다. 일부는 중국이 접근하지 못하도록 우리 모델을 폐쇄해야 한다고 주장하지만, 저는 이러한 방식은 효과가 없으며 오히려 미국과 동맹국들에게 불이익을 줄 것이라고 생각합니다. 우리의 적들은 스파이 활동에 능하고, 손가락 크기만한 드라이브에 저장된 모델들을 비교적 쉽게 훔칠 수 있습니다. 또, 대부분의 기술 회사는 이런 행위를 더 어렵게 만드는 방식으로 운영되지 않습니다. 폐쇄형 모델만 존재하는 세상에서는 소수의 대기업과 지정학적 적들만이 최첨단 모델에 접근할 수 있고, 스타트업, 대학, 중소기업들은 이러한 기회를 놓치게 될 가능성이 높습니다. 또한 폐쇄적인 개발로 미국의 혁신을 제한한다면, 우리가 AI의 미래를 선도하지 못할 가능성이 높아집니다. 제가 생각하는 최선의 전략은 강력한 오픈 생태계를 구축하고 선도 기업들이 정부 및 동맹국과 긴밀히 협력해 최신 기술을 최대한 활용하며, 장기적으로 지속 가능한 우위를 선점하는 것입니다.
앞으로의 기회를 고려할 때, 오늘날 대부분의 선도 테크 기업과 과학 연구는 오픈 소스 소프트웨어를 기반으로 이루어졌다는 것을 기억해야 합니다. 우리가 함께 오픈 소스 AI에 투자한다면, 차세대 기업과 연구원들이 이를 잘 활용할 수 있을 것입니다. 여기에는 이제 막 시작한 스타트업뿐만 아니라, 자원이 부족해 최첨단 AI를 자체적으로 개발할 여력이 없는 대학과 나라들이 포함됩니다.
결론적으로 오픈 소스 AI는 모두에게 가장 큰 경제적 기회와 보안을 제공할 수 있는 최고의 기회입니다.
함께 구축해 봅시다
이전의 Llama 모델들은 Meta가 내부 목적을 위해 개발한 걸 외부에 공개한 것으로, 더 넓은 생태계 구축에는 그다지 초점을 두지 않았었습니다. 하지만 이번 Llama 3.1 출시는 새롭게 접근해 보려 합니다. 최대한 많은 개발자와 파트너가 Llama를 사용할 수 있도록 내부적으로 팀을 구성하고 있으며, 생태계 내 더 많은 기업들이 자사의 고객에게 고유한 기능을 제공할 수 있도록 적극적으로 파트너십을 구축하고 있습니다.
저는 Llama 3.1 출시가 대부분의 개발자들이 오픈 소스 모델을 우선적으로 사용하기 시작하는 업계의 변곡점이 될 것이라 믿으며, 앞으로 이러한 접근 방식이 더욱 확대될 것으로 예상합니다. 전 세계의 모든 이들이 AI가 가져올 혜택을 누릴 수 있도록 하는 이 여정에 여러분도 동참해 주시길 바랍니다.
현재 최신 모델들은 llama.meta.com에서 확인할 수 있습니다.