[미래기술25]구글 코드 3%는 AI가 썼다…창작 영역까지 도전
by김국배 기자
2022.08.12 00:56:18
"70년만에 과학적 개념서 사회 인프라로"
"그림 그리고, 시 쓰고…문장 쓰면 웹툰 완성"
네이버·카카오 ''초거대 AI'' 개발 박차
스타트업 50%, AI 윤리 지침 준수 미흡
스탠포드대, 링크드인서 AI 허위 생성 프로필 무더기 발견
[이데일리 김국배 기자] 오픈소스 플랫폼 ‘깃허브’는 지난해 6월 ‘코파일럿’이라는 코드 자동완성 도구를 공개했습니다. 예전에도 이런 도구가 없었던 것은 아니지만, 코파일럿은 차원이 다르다는 반응이 나왔습니다. 소셜미디어(SNS)에도 코파일럿을 찬양하는 글이 심심치 않게 올라올 정도입니다.
박은정 업스테이지 최고과학책임자(CSO)는 “이전까지 나온 도구들은 몇 글자를 입력하면 겨우 단어 하나를 완성해주는 수준에 불과했지만, 이제는 몇 단어를 입력하면 한 문단을 완성해주는 수준”이라며 “마치 에세이를 쓰기 위해 머릿속에 스토리 구상하고 첫 문장을 쓰면, 코파일럿이 첫 문단을 완성해주는 느낌”이라고 표현했습니다.
이뿐만이 아닙니다. 구글은 지난달 전체 코드(프로그램)의 3%를 자사의 코드 자동완성 도구가 쓰고 있다고 밝혔습니다. 박 CSO는 “과거에는 인간이 100% 코드를 썼다면 이제는 3%는 기계가 쓴다는 얘기”라고 했습니다.
최근 글로벌 컨설팅 기업 액센츄어는 “길찾기, 텍스트 변환, 얼굴 인식 등 일상생활의 많은 부분에서 개인들의 AI 의존도가 커지고 있다”며 “최근 AI가 70년만에 과학적 개념에서 사회 인프라로 진화했다”고 평가했습니다. 그만큼 일상 깊숙이 들어와 있다는 얘깁니다.
AI의 도전은 과연 어디까지 갈 수 있을까요? 여전히 한계는 있겠지만, AI 기술이 발전하면서 인간의 영역으로만 여겨졌던 창작 분야 곳곳에서도 활동 범위를 넓혀가고 있습니다.
카카오(035720)의 AI 계열사 카카오브레인은 AI 시인 ‘시아’가 쓴 53편의 시를 담은 시집 ‘시를 쓰는 이유’를 지난 8일 출간했습니다. 국내에서 AI 시인이 시집을 펴낸 건 이번이 처음입니다. 시극으로 만들어져 무대에도 오릅니다. 시아는 1만3000여 편의 시를 읽고 작법을 익혔다고 합니다. 앞서 2017년 중국에선 AI가 현대시 수천 편을 학습해 쓴 시집이 발간되기도 했습니다.
미술, 작곡 분야도 마찬가지입니다. AI 작곡가 ‘이봄’은 광주과학기술원(GIST)과 클래식부터 전자음악, 힙합, 트로트 등 다양한 장르의 음악을 작곡하고 있습니다. 카카오브레인이 작년 12월 내놓은 AI 화가 ‘민달라’는 사람이 작품 주제를 입력해주면, 그에 맞는 그림을 그립니다. 카카오는 지난 4월 민달라를 업그레이드시킨 ‘RQ-트랜스포머’를 공개했습니다.
LG(003550)가 구현한 AI 패션 아티스트 ‘틸다’는 디자이너 박윤희 씨와 협업해 미국 ‘뉴욕 패션위크’에서 200여 벌의 의상을 함께 선보였습니다. 틸다가 만든 이미지와 패턴을 기반으로 한 의상들입니다. AI 스타트업 툰스퀘어는 글로 쓴 문장을 만화로 바꿔주는 AI 웹툰 서비스 ‘투닝’을 운영 중입니다. 투닝은 그림을 전혀 못 그리는 사람도 자신이 원하는 스토리로 웹툰을 그릴 수 있도록 지원해줍니다. 회사 관계자는 “AI가 문장을 분석해 학교, 골목, 사무실 등 스토리와 어울리는 세세한 배경을 자동으로 생성하며 캐릭터와 대사까지 삽입한다”고 했습니다.
이런 기술 발전의 배경에는 초거대 AI의 등장이 있습니다. 초거대 AI란 파라미터(매개변수)가 엄청나게 많은 AI를 말합니다. 파라미터는 인간 뇌에서 뉴런을 연결해 정보를 학습하고, 기억하는 역할을 담당하는 시냅스와 유사합니다. 파라미터가 커질수록 AI 지능은 높아집니다.
국내외 기업들은 1조개 이상의 파라미터를 가진 초거대 AI 개발에 사활을 걸고 있습니다. 지난 2020년 등장해 초거대 AI 열풍을 불러온 GPT-3는 1750억개의 파라미터를 갖고 있습니다. 이후 등장한 네이버(035420) 초거대 AI ‘하이퍼클로바’의 파라미터 수는 2040억개로 GPT-3를 넘어섭니다. 한국어 데이터 학습량은 GPT-3의 6500배 이상이죠. 같은 해 카카오도 GPT-3의 한국어 특화 버전인 ‘KoGPT’를 공개했습니다. LG도 3000억개 파라미터를 가진 초거대 AI ‘엑사원’을 보유하고 있습니다. AI 아티스트 틸다를 구현한 바로 그 AI입니다.
초거대 AI는 다양한 서비스 분야로 적용되고 있습니다. ‘모두를 위한 AI’를 내걸고 있는 네이버는 하이퍼클로바를 전화 돌봄, 클로바 노트 서비스에 적용했습니다. AI가 혼자 사는 노인에게 전화를 걸어 안부를 묻게 한 것입니다. 쇼핑 리뷰를 분석해 자연스러운 한 문장으로 요약도 해줍니다. 선물을 할 경우 대상과 상황에 맞게 적절한 카드 메시지 문구를 추천합니다. 물론 카카오의 시 쓰는 AI에도 초거대 AI가 적용돼 있습니다.
넘어야 할 산도 많습니다. 일단 인간을 닮아가는 AI의 모습에 윤리적 문제가 제기됩니다. 미국 브루킹스 연구소가 AI 관련 스타트업 225곳을 대상으로 AI 윤리 인식·수용에 관한 설문조사를 해보니, 50% 이상이 사내 AI 윤리 지침을 마련했으나 준수는 미흡한 것으로 나타났습니다.
‘딥페이크’ 우려도 여전합니다. AI 기술의 진화로 딥페이크는 고도화되는 추세입니다. 미국 민간 연구 기관 스탠퍼드 인터넷 관측소는 최근 링크드인에서 AI 생성한 프로필을 사용한 사례를 1000건 이상 발견했다고 밝혔습니다. 이런 허위 프로필은 ‘진짜’와 구별하기 어려울 정도로 정교하지만, 눈이 몰려 있고 배경이 매우 흐리며 머리카락이 흐트러져 있는 공통점이 있다고 합니다.
링크드인은 작년 상반기에만 1500만 개에 달하는 가짜 계정을 제거했습니다. 스탠퍼드 인터넷 관측소는 “오늘날 AI가 생성한 가짜 프로필이 놀라운 일은 아니지만, 미래에 딥페이크가 초래할 혼돈을 알려주는 예시적 역할을 한다”고 지적했습니다. ‘신뢰 가능한 AI’도 꾸준히 제기돼온 요구입니다. IBM은 “AI를 신뢰하기 위해서는 AI가 제공하는 결론이나 제안이 편향되거나 조작되지 않았다는 것을 확신할 수 있어야 한다는 것”이라고 했습니다.