2021년 2월 SNS '클럽하우스'에 5명의 AI업게 최고 핫피플들이 등장하였습니다. 이 토론에서 인공지능 트렌드와 재미있는 인사이트들이 많아 요점을 정리해서 소개해 드리려고 합니다.

AI계의 핫피플
1) 안드레아 카르파티 : 테슬라의 자율주행을 만드는 인공지능 팀의 리더를 맡고 계십니다.
2) 저스틴 존슨 : 미시간대 교수이면서 페이스북 ai리서치 교환연구원으로 일하고 계신 분입니다.
3) 렉스 프리드먼 : MIT 교수이면서 AI 리서처이신데, 활발한 팟캐스트 활동을 하고 계시며, 100만 구독자를 갖고 있는 유튜버이시기도 합니다. 그리고 매년 '올해의 AI'를 정리해서 강의처럼 만들어 주시는 분입니다.
4) 러셀 캐플런 : 이 방의 관리자로 예전에 테슬라에서 일을 하셨고 스케일 AI 라는 회사를 창업하였습니다.
5) 리처드 소셔 : Salesforce에서 일을 했었고 "You.com"이라는 새로운 검색엔진을 창업하셨습니다.
인공지능 업계의 트렌드와 미래
1) Dall-E / CLIP 등 트랜스포머 기반의 멀티모달 모델의 참신함
Dall-E / CLIP 은 텍스트를 넣으면 그에 맞게 그림을 그려주는 인공지능으로, 시각적인 것과 텍스트가 같이 한 모델에 들어가는 멀티모달 모델입니다. 토론에서는 멀티모달 모델의 참신함에 대한 이야기들이 계속 나왔습니다.
2) 데이터가 왕이다
토론에서 가장 많이 나온 이야기는 데이터에 관한 이야기였습니다. 사람들도 이미 데이터의 중요성에 대해 알고 있지만, 데이터는 지금 생각하는 것 이상으로 더 중요하다는 것입니다. 따라서 정해진 데이터셋에서 어떤 구조를 만들지 고민하는 것보다, 이미 만들어진 구조에서 더 좋은 데이터셋을 구하는 것이 성능을 개선할 수 있는 효과적인 방법이라고 이야기하였습니다.
3) 데이터 큐레이션 도구, MLOps 는 갈수록 중요해진다
'데이터 큐레이션'은 머신 러닝에서 데이터의 활용 가치를 높이는 모든 활동을 하는 도구이며, 'MLOps'는 머신러닝에서 데이터를 이용하여 기계 학습 전체의 사이클을 관리하는 역할을 합니다. 실제로 머신러닝할 때 기계를 학습시키는 일의 비중보다 데이터를 관리하는 비중이 훨씬 큽니다. 따라서 갈수록 데이터를 다루는 역할이 더 중요해질 것이라는 이야기가 토론에서 많이 나왔습니다.
4) 트랜스포머가 딥러닝 영역을 통합하고 있다
딥러닝에서 다루는 데이터의 종류는 매우 다양한데, 몇 년 전만 해도 각 영역마다 주로 사용하는 딥러닝 구조가 정해져 있었습니다. 그러던 중, 트랜스포머가 새롭게 부상하면서 거의 모든 영역에서 문제를 잘 풀 수 있는 도구가 되었습니다. 즉, 트랜스포머가 딥러닝의 문제와 솔루션 영역을 통합하고 있다고 볼 수 있습니다.
5) 최근 하드웨어에서 병렬처리/최적화 할 수 있는 모델이 더 임팩트 있다
데이터 모델에 따라 하드웨어에서 처리되는 성능은 차이가 있기 마련이죠. 머신러닝으로 만드는 인공지능은 어마어마한 양의 계산을 해야하는데 하드웨어에 맞게 최적화가 되어 있으면 저렴한 하드웨어에서도 빠르게 처리될 수 있습니다. 날이 갈수록 데이터의 양은 많아지고 데이터의 중요성도 높아지기 때문에 최대한 빨리 데이터를 학습하고 실험을 많이 해 볼 수 있는 것이 중요하겠죠. 그러므로 정해진 하드웨어에서 많은 양을 빠르게 돌릴 수 있는, 병렬처리가 잘 되는 최적화된 데이터 모델들이 중요하다는 이야기를 했습니다.
6) 인공지능에서의 새로운 연구 개척 분야
6-1) 학습을 지속할 수 있는 모델
현재는 한가지 목적으로 학습 시킨 인공지능을 다른 목적으로 연달아 학습을 시키게 되면 앞에서 학습한 것을 잊어버리게 됩니다. 그러므로 이제는 앞서 학습한 것을 잊어버리지 않고 다음 것을 학습할 수 있는 인공지능을 만들어보자고 하였습니다.
6-2) 데이터 레이블링의 새로운 접근
지금은 기본적으로 기계에게 문제와 답을 함께 제시해주는 ‘지도 학습’을 진행하고 있습니다. 그런데 이 답을 사람이 직접 입력하고 있고, 이것을 ‘레이블링’이라고 합니다. 앞으로는 데이터를 더 많이 더 빨리 효율적으로 처리하기 위해 사람이 직접 하나하나 작업하는 것이 아닌 새로운 접근이 필요할 것이라고 이야기하고 있습니다.
6-3) Model-first 벤치마크 디자인
현재는 정해진 데이터셋으로 가장 좋은 성능을 내는 구조가 무엇인지 찾도록 벤치마크가 설계되어 있습니다. 그러나 최근에는 구조보다는 데이터가 더 중요하다고 생각하기 때문에 '구조를 먼저 정해놓고 이에 맞는 데이터셋을 찾도록 설계하는 것이 더 적합하지 않을까'라는 이야기를 많이 했습니다.
6-4) 거대 데이터 셋의 새로운 접근
이제는 지도학습 방식이 아닌 새로운 방식으로 학습시키는 방법들이 지속적으로 나오고 있는데, 그에 해당하는 거대 데이터 셋을 생성하는 새로운 접근과 표준들이 필요할 것이라는 이야기를 했습니다.
지금까지 AI계의 핫피플들이 2021년도에 나눈 대화 내용을 요약 정리해 보았습니다. '아크'에게 보다 자세한 설명을 듣고 싶은 분들은 [모아이] 채널에서 만나면 좋겠습니다.
'AI 이야기' 카테고리의 다른 글
AI의 아버지, 얀 르쿤 , "1년 반 전의 나는 틀렸다 (0) | 2022.11.23 |
---|---|
[AI 뉴스] 그림 그려주는 인공지능 DALL-E (2) | 2022.09.05 |
VITO CI/CD 변천사 두번째 - Container Orchestration (0) | 2022.08.31 |
[AI뉴스] 누구나 간편하게 딥페이크 영상 만들기 (0) | 2022.08.30 |
[AI뉴스] 2020년 AI 핫이슈 베스트 5 (0) | 2022.08.25 |
댓글