본문 바로가기
AI 이야기

[AI뉴스] 2021년, AI 핫피플들의 토론 - AI 업계의 트렌드와 미래는?

by VITO_AI 2022. 9. 1.

2021년 2월 SNS '클럽하우스'에 5명의 AI업게 최고 핫피플들이 등장하였습니다. 이 토론에서 인공지능 트렌드와 재미있는 인사이트들이 많아 요점을 정리해서 소개해 드리려고 합니다. 

 

 

 

 

 
​AI계의 핫피플

1) 안드레아 카르파티 : 테슬라의 자율주행을 만드는 인공지능 팀의 리더를 맡고 계십니다.

​2) 저스틴 존슨 : 미시간대 교수이면서 페이스북 ai리서치 교환연구원으로 일하고 계신 분입니다.

​3) 렉스 프리드먼 : MIT 교수이면서 AI 리서처이신데, 활발한 팟캐스트 활동을 하고 계시며, 100만 구독자를 갖고 있는 유튜버이시기도 합니다. 그리고 매년 '올해의 AI'를 정리해서 강의처럼 만들어 주시는 분입니다. 

​4) 러셀 캐플런 : 이 방의 관리자로 예전에 테슬라에서 일을 하셨고 스케일 AI 라는 회사를 창업하였습니다.

5) 리처드 소셔 : Salesforce에서 일을 했었고 "You.com"이라는 새로운 검색엔진을 창업하셨습니다.

 

 

 

 

 인공지능 업계의 트렌드와 미래

 

1) Dall-E / CLIP 등 트랜스포머 기반의 멀티모달 모델의 참신함

Dall-E / CLIP 은 텍스트를 넣으면 그에 맞게 그림을 그려주는 인공지능으로, 시각적인 것과 텍스트가 같이 한 모델에 들어가는 멀티모달 모델입니다. 토론에서는 멀티모달 모델의 참신함에 대한 이야기들이 계속 나왔습니다.

2) 데이터가 왕이다

​토론에서 가장 많이 나온 이야기는 데이터에 관한 이야기였습니다. 사람들도 이미 데이터의 중요성에 대해 알고 있지만, 데이터는 지금 생각하는 것 이상으로 더 중요하다는 것입니다. 따라서 정해진 데이터셋에서 어떤 구조를 만들지 고민하는 것보다, 이미 만들어진 구조에서 더 좋은 데이터셋을 구하는 것이 성능을 개선할 수 있는 효과적인 방법이라고 이야기하였습니다. 

3) 데이터 큐레이션 도구, MLOps 는 갈수록 중요해진다

​'데이터 큐레이션'은 머신 러닝에서 데이터의 활용 가치를 높이는 모든 활동을 하는 도구이며, 'MLOps'는 머신러닝에서 데이터를 이용하여 기계 학습 전체의 사이클을 관리하는 역할을 합니다. 실제로 머신러닝할 때 기계를 학습시키는 일의 비중보다 데이터를 관리하는 비중이 훨씬 큽니다. 따라서 갈수록 데이터를 다루는 역할이 더 중요해질 것이라는 이야기가 토론에서 많이 나왔습니다. 

​4) 트랜스포머가 딥러닝 영역을 통합하고 있다

딥러닝에서 다루는 데이터의 종류는 매우 다양한데, 몇 년 전만 해도 각 영역마다 주로 사용하는 딥러닝 구조가 정해져 있었습니다. 그러던 중, 트랜스포머가 새롭게 부상하면서 거의 모든 영역에서 문제를 잘 풀 수 있는 도구가 되었습니다. 즉, 트랜스포머가 딥러닝의 문제와 솔루션 영역을 통합하고 있다고 볼 수 있습니다. 

​5) 최근 하드웨어에서 병렬처리/최적화 할 수 있는 모델이 더 임팩트 있다

데이터 모델에 따라 하드웨어에서 처리되는 성능은 차이가 있기 마련이죠. 머신러닝으로 만드는 인공지능은 어마어마한 양의 계산을 해야하는데 하드웨어에 맞게 최적화가 되어 있으면 저렴한 하드웨어에서도 빠르게 처리될 수 있습니다. 날이 갈수록 데이터의 양은 많아지고 데이터의 중요성도 높아지기 때문에 최대한 빨리 데이터를 학습하고 실험을 많이 해 볼 수 있는 것이 중요하겠죠. 그러므로 정해진 하드웨어에서 많은 양을 빠르게 돌릴 수 있는, 병렬처리가 잘 되는 최적화된 데이터 모델들이 중요하다는 이야기를 했습니다.

​6) 인공지능에서의 새로운 연구 개척 분야

 

6-1) 학습을 지속할 수 있는 모델

현재는 한가지 목적으로 학습 시킨 인공지능을 다른 목적으로 연달아 학습을 시키게 되면 앞에서 학습한 것을 잊어버리게 됩니다. 그러므로 이제는 앞서 학습한 것을 잊어버리지 않고 다음 것을 학습할 수 있는 인공지능을 만들어보자고 하였습니다.

6-2) 데이터 레이블링의 새로운 접근

지금은 기본적으로 기계에게 문제와 답을 함께 제시해주는 ‘지도 학습’을 진행하고 있습니다. 그런데 이 답을 사람이 직접 입력하고 있고, 이것을 ‘레이블링’이라고 합니다. 앞으로는 데이터를 더 많이 더 빨리 효율적으로 처리하기 위해 사람이 직접 하나하나 작업하는 것이 아닌 새로운 접근이 필요할 것이라고 이야기하고 있습니다. 

 

6-3) Model-first 벤치마크 디자인

현재는 정해진 데이터셋으로 가장 좋은 성능을 내는 구조가 무엇인지 찾도록 벤치마크가 설계되어 있습니다. 그러나 최근에는 구조보다는 데이터가 더 중요하다고 생각하기 때문에 '구조를 먼저 정해놓고 이에 맞는 데이터셋을 찾도록 설계하는 것이 더 적합하지 않을까'라는 이야기를 많이 했습니다.

 

6-4) 거대 데이터 셋의 새로운 접근

이제는 지도학습 방식이 아닌 새로운 방식으로 학습시키는 방법들이 지속적으로 나오고 있는데, 그에 해당하는 거대 데이터 셋을 생성하는 새로운 접근과 표준들이 필요할 것이라는 이야기를 했습니다.

​지금까지 AI계의 핫피플들이 2021년도에 나눈 대화 내용을 요약 정리해 보았습니다. '아크'에게 보다 자세한 설명을 듣고 싶은 분들은 [모아이] 채널에서 만나면 좋겠습니다.

https://youtu.be/lWeEVvqOVZc

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

댓글