AI 어떤 것을 고를까? 비지니스를 향상시킬 가장 강력한 AI

AI에 대해 혼란스러우신가요? 비즈니스 생산성 향상을 위한 AI 활용 가이드
기술은 빠른 속도로 발전하고 있으며, 어떤 기술을 어떤 작업에 사용할지 파악하는 것은 까다로울 수 있습니다.

우리는 모두 최신 세대의 AI가 어떻게 사람들의 삶을 변화시키고, 기업의 생산성을 높이며, 심지어 해고로 이어지는지에 대한 뉴스를 접하고 있습니다. 하지만 이러한 정보의 홍수 속에서도 AI에 대한 가장 기본적인 질문에 답하는 데는 도움이 되지 않습니다: 어떤 것이 가장 좋은가?

그래서 저는 세계에서 가장 강력한 AI를 실제 문제에 적용하는 과정에 깊이 관여하고 있는 임원, 엔지니어, 연구원들에게 그들이 무엇을 배웠는지 알아보기 위해 설문조사를 실시했습니다.

그들의 답변은 저를 놀라게 했습니다. Google, OpenAI, Anthropic 및 Meta의 AI의 상대적인 강점과 약점에 대한 실용적인 조언이 많았습니다. 하지만 전반적인 메시지는 모든 작업에 가장 적합한 AI는 사용자와 작업 모두에 달려 있다는 것이었습니다. 또한 이들의 인사이트를 통해 전체 AI 분야가 나아갈 방향을 엿볼 수 있습니다.

6개월 전만 해도 그렇지 않았던 방식으로, 이제 기업들은 일부 연구자들이 '일반' 또는 인간과 유사한 AI로 가는 길목에 있다고 생각하는 제너레이티브 AI의 잠재적인 비용 절감과 생산성 향상을 수용하거나, 아니면 경쟁업체에 뒤처질 위험을 감수할 수 있습니다.

AI를 직원처럼 대하기

오늘날의 가장 강력한 AI는 개인 컴퓨터에서 구입하여 실행할 수 있는 것이 아닙니다. 클라우드를 통해서만 액세스할 수 있습니다. 따라서 문서, 이미지, 텍스트를 제공하여 쉽게 테스트할 수 있지만, 기업이 AI의 행동을 변경하는 데는 한계가 있습니다.

온타리오주 웨스턴 대학교의 최고 AI 책임자인 마크 데일리(Mark Daley)는 이러한 AI를 테스트하는 것은 기성 소프트웨어를 구입하는 것이 아니라 직원을 고용하는 것과 비슷하다고 말합니다.

"사람들은 챗봇이 즉시 작동할 것으로 기대하지만, 직원을 고용할 때와 마찬가지로 챗봇을 사용해보고 어떤 챗봇이 성과를 낼 수 있는지 확인하는 데 시간을 투자해야 합니다."라고 그는 덧붙입니다.

Daley는 OpenAI, Anthropic, Google 및 기업에만 모델을 제공하는 스타트업인 Cohere의 모델을 포함하여 모든 주요 대형 언어 모델에는 장단점이 있다는 사실을 발견했습니다. 어떤 것을 사용할지는 개인의 선호도와 당면한 작업에 따라 다르므로 여러 가지를 실험해 보는 것이 좋습니다.

ChatGPT를 구매했다고 해고된 사람은 아무도 없다.
다른 회사들이 OpenAI의 기능을 따라잡고 있는 것처럼 보이지만, 현재로서는 OpenAI의 모델이 다른 모든 모델을 판단하는 표준으로 남아 있습니다. 이번 주 초, Anthropic은 모든 벤치마크에서 표준 GPT-4를 능가하는 새로운 대규모 언어 모델인 Claude 3을 출시했습니다.

대기업의 AI 사용을 지원하는 Nomad Data의 최고 경영자인 Brad Schneider는 "우리는 OpenAI를 미친 듯이 사용하고 있습니다."라고 말합니다. Nomad Data는 법률 개요, 법원 소송, 보험금 청구서 등 방대한 문서 라이브러리 내에서 OpenAI를 사용하여 요약, 요약 및 검색을 수행합니다. 이 회사의 고객 중에는 인수를 앞둔 회사에 대한 수천 개의 문서를 소화하는 데 일주일밖에 주어지지 않는 사모펀드 회사도 포함됩니다.

슈나이더의 회사는 가장 성능이 뛰어난 대형 언어 모델을 모두 사용해 본 결과, 이러한 종류의 문서 처리 작업에 OpenAI만큼 좋은 것은 없다는 사실을 발견했습니다. 이전 버전의 앤트로픽의 클로드와 현재 버전의 구글 제미니는 모두 환각 (hallucination) 을 너무 자주 일으켰다고 그는 발견했습니다. (AI에서 '환각'은 챗봇이 잘못된 정보를 만들어내는 것을 가리키는 용어입니다.)

구글 수석 부사장 프라브하카르 라가반은 최근 환각은 모든 대규모 언어 모델에 공통적으로 나타나는 문제이지만 "지속적으로 개선하기 위해 노력하고 있는 부분"이라고 말했습니다. 앤트로픽의 다니엘라 아모데이 사장은 이러한 모델에서 환각률을 0으로 만드는 것은 "매우, 매우 어렵다"고 말했습니다. 이 회사는 최신 모델이 이전 모델보다 질문에 정확하게 답할 확률이 두 배 높으며, 모든 환각을 제거하면 모델이 정답을 맞출 수 있는 질문에 주저하게 될 수 있다고 말했습니다.

AI에 무엇이 중요한지 파악하기
과학적 검색 엔진인 Consensus의 최고 경영자 에릭 올슨은 정확성 외에도 속도와 비용이라는 두 가지 중요한 고려 사항이 있다고 말합니다.

검색 엔진에서 사용자는 몇 초 내에 응답을 기대합니다. Consensus는 검색 결과와 GPT-4에서 만든 과학 논문 요약을 결합하기 때문에 이러한 요약이 거의 즉각적으로 생성되어야 합니다.

올슨의 목적에 가장 적합한 모델은 일반 GPT-4의 경우 두 배나 긴 1.5초 이내에 사용자에게 응답을 제공할 수 있는 OpenAI의 GPT-4 '터보'뿐이라는 뜻입니다. 구글의 제미니와 앤트로픽의 클로드도 OpenAI의 모델보다 느리다고 그는 덧붙입니다.

하지만 이러한 성능에는 대가가 따릅니다. OpenAI와 경쟁사들은 비즈니스 사용자의 요청을 처리하기 위해 토큰, 즉 단어 단위로 시스템 사용료를 청구합니다.

슈나이더는 "누군가 질문 하나에 50달러가 드는 경우도 있습니다."라고 말합니다. 예를 들어 누군가 5,000개의 법률 문서 모음에 대한 특정 질문을 할 경우 OpenAI 시스템에 대한 호출 수가 수만 건에 달할 수 있기 때문에 이런 일이 발생할 수 있습니다.

Google의 강점: 규모
가장 유능한 대규모 언어 모델이라는 타이틀을 놓고 OpenAI와 Anthropic이 경합을 벌이는 동안, Google은 여러 벤치마크에서 뒤처져 왔습니다.

하지만 Google과 고객에게 한 가지 장점은 각 쿼리에서 방대한 양의 데이터를 수집할 수 있다는 점입니다. 이는 현재 OpenAI가 제공하지 않는 기능이며, Anthropic은 소수의 고객 그룹에게만 제공됩니다.

"Gemini 1.5는 백만 개의 컨텍스트 토큰을 허용하며, 이는 절대적인 게임 체인저입니다."라고 Daley는 말합니다. "교과서 10권 분량의 자료를 입력하면 완벽하지는 않지만 35초가 주어지면 사람이 할 수 있는 것보다 더 잘 합성할 수 있습니다."

하지만 Microsoft는 어떨까요?
Microsoft는 AI를 출시하는 데 있어 몇 가지 과제를 안고 있습니다. 첫 번째는 OpenAI와 제휴를 맺었음에도 불구하고 어떤 면에서는 OpenAI 서비스의 리셀러이며, 기업도 OpenAI에서 직접 구매할 수 있다는 점입니다.

명확히 말하면, Microsoft는 다양한 AI 모델을 위한 플랫폼을 제공하고 있으며, 이 플랫폼은 Azure 클라우드 서비스를 통해 제공됩니다. 예를 들어, Microsoft는 미스트랄과 파트너십을 맺고 메타의 오픈 소스 라마 모델을 제공합니다.

Microsoft의 AI 플랫폼 담당 부사장인 Eric Boyd는 "Azure AI를 통해 세계에서 가장 신뢰할 수 있는 클라우드 플랫폼에서 가장 포괄적인 고성능 개방형 및 프론티어 모델을 고객에게 제공하고 있습니다."라고 말합니다.

아마존의 클라우드 서비스도 비슷한 전략을 가지고 있으며, 아마존은 Anthropic과 파트너십을 맺었습니다.

OpenAI에 새로운 기능이 추가되면 해당 기능이 Microsoft의 해당 모델 버전에서 제공되기까지 의미 있는 지연이 발생한다고 슈나이더는 말합니다. 또한 Microsoft의 GPT 4 버전은 OpenAI와는 달리 용량에 제약이 있어 기업이 분당 구매할 수 있는 토큰 수가 더 엄격하게 제한되는 것으로 보인다고 그는 덧붙입니다.

많은 기업이 자체 AI를 구축할 것이다.
프라하에 본사를 둔 Rossum의 수석 AI 아키텍트인 Petr Baudis는 생성 AI의 많은 전문 애플리케이션의 경우, 기업은 자체적으로 AI를 구축하고 훈련시키거나 다른 사람에게 비용을 지불하여 이를 대신 수행할 수 있다고 말합니다. Rossum은 연구팀이 직접 구축한 다양한 AI를 사용하여 기업의 송장 처리를 자동화합니다.

대규모 언어 모델을 직접 학습시키는 것은 불가능한 작업처럼 들릴 수 있지만, Meta의 Llama와 같은 오픈 소스 모델이 빠르게 발전하면서 소규모 팀도 충분히 해낼 수 있는 일입니다.

이 기사를 위해 만난 모든 사람들은 빠르게 성능이 향상되고 있는 오픈 소스 대규모 언어 모델을 OpenAI 및 Google 모델에 액세스하는 비용의 일부로 운영할 수 있다고 말했습니다. 여기에는 몇 가지 이유가 있습니다. 첫 번째는 이러한 모델이 훨씬 더 작기 때문에 실행에 더 적은 전력이 필요하다는 것입니다. 두 번째는 회사의 자체 서버에서 실행할 수 있기 때문에 대형 AI 회사의 중간 단계와 마진을 없앴다는 것입니다.

맞춤형 오픈 소스 AI도 올바른 데이터로 학습하고 Rossum이 제공하는 송장 처리 서비스처럼 충분히 좁은 작업을 수행하도록 요청하면 대규모 언어 모델보다 뛰어난 성능을 발휘할 수 있습니다.

오늘 사실인 것이 내일은 사실이 아닐 수 있습니다.
제너레이티브 AI는 초기 인터넷 시절 이후 볼 수 없었던 속도로 진화하고 있는 기술입니다. 팀 규모가 작고 훨씬 최근에 설립되었음에도 불구하고 OpenAI 못지않은 능력을 갖춘 모델을 출시한 Anthropic은 대규모 언어 모델이 상품화될 수 있음을 시사합니다. 그 시점에서 중요한 것은 어느 회사가 가장 저렴한 가격으로 가장 빠른 응답을 제공할 수 있는지가 될 것입니다.

치열한 경쟁의 수혜자는 크고 작은 기업들이 될 것이며, 직원들의 생산성이 크게 향상될 수 있습니다. 이러한 이득은 동일한 지식 작업을 수행하기 위해 인간에게 지불하는 비용의 일부로 이루어질 것입니다. 화이트칼라 일자리의 미래에 미칠 영향은 분명하고도 걱정스러운 일입니다.

[출처: https://www.wsj.com/tech/ai/openai-google-meta-or-anthropic-a-guide-to-the-best-ai-for-your-business-fae402cc?mod=djemTECH]

저작자표시 비영리 변경금지 (새창열림)

아는 것 그 너머

AI 어떤 것을 고를까? 비지니스를 향상시킬 가장 강력한 AI

댓글

티스토리툴바