본문 바로가기

카테고리 없음

머신러닝의 부상

반응형

그리 오래되지 않은 과거에만 해도 컴퓨터 비전(Computer Vision)은 한 살배기 아기의 시각 능력을 따라잡을 수 없다는 말이 정설로 통했다. 오늘날 그 말은 더 이상 사실이 아니다. 이제 컴퓨터는 대부분의 성인만큼 물체나 장면을 잘 인식할 수 있다. 컴퓨터 조종 자율주행 차량이 평균적인 18세 청소년보다 안전하게 도로를 누빌 수 있는 세상이다. 더욱이 컴퓨터는 보는 방법이나 운전하는 방법을 지시받는 대신 경험을 통해 배우며 자연이 수백만 년 전에 택했던 방침을 따 른다. 이러한 진보를 가능케 하는 연료는 무한히 축적되는 데이터다. 데이터가 새로운 종류의 기름이고 학습 알고리즘이 원료 데이터에서 정보를 뽑아내는 정 유공장인 셈이다. 정보는 지식을 창출하는 데 쓰일 수 있고, 지식은 이해를 이끌어내며, 이해는 지혜의 바탕이 된다. 딥러닝이라는 멋진 신세계에 온 것을 환영 하는 바다.딥러닝은 수학과 컴퓨터공학, 신경과학에 뿌리를 두고 있는 머신러닝의 한 분야다. 딥러닝 네트워크는 아기들이 자신을 둘러싼 세상을 배워나가는 것과 같은 방식으로 데이터를 통해 학습한다. 생생한 눈으로 시작해 점차 새로운 환경을 탐색하는 데 필요한 기술을 습득해나가는 아기들처럼 말이다. 딥러닝의 기원은 인공지능을 창출하는 방법에 관한 두 가지 다른 시각이 경합을 벌이던 1950년대의 인공지능 태동 시점까지 거슬러 올라간다. 하나는 로직과 컴퓨터 프로 그램에 기초한 시각으로 수십 년 동안 인공지능 세계를 지배했으며, 다른 하나는 데이터로부터 직접 학습하는 방식에 기초한 시각으로 성숙 단계에 이르기까 지 그보다 더 오랜 시간이 걸렸다.오늘날의 기준으로 볼 때 컴퓨터가 보잘것없고 데이터 저장에 많은 비용이 들던 20세기에는 로직이 문제를 해결하는 효율적인 방법이었다. 숙련된 프로그 래머들이 각각의 문제에 대해 서로 다른 프로그램을 작성했고, 문제가 클수록 프로그램도 커졌다. 하지만 컴퓨터의 역량이 커지고 데이터가 풍부해진 오늘 날에는 학습 알고리즘을 사용해 문제를 해결하는 것이 더 빠르고 보다 정확하며 훨씬 효율적이다. 또한 동일한 학습 알고리즘이 서로 다른 문제를 해결하는 데 이용될 수 있다. 각각의 문제에 서로 다른 프로그램을 작성하는 것보다 훨씬 덜 노동집약적인 솔루션이 나온다는 뜻이다.

운전의 딥러닝

미국 국방부 산하 미국방위고등연구계획국(DARPA)이 2005년 200만 달러의 상금을 걸고 개최한 그랜드 챌린지 (Grand Challenge)의 우승은 스탠퍼드대학교의 서배스천 스런(Sebastian Thrun) 팀이 제작한 스탠리(Stanley)라는 자율주행 자동차에게 돌아갔다. 스런 팀은 스탠리에게 머신러닝을 통해 캘리포니아의 사막을 주행하는 방법을 가르쳤다. 총 132마일(약 212킬로미터)에 달하는 해당 코스에는 좁은 터널과 급커브가 산재했으며 한쪽은 낭떠러지이고 다른 한쪽 은 바위산으로 구성된 구불구불한 산악도로 비어보틀패스(Beer Bottle Pass)도 포함되어 있었다. 스런 팀은 컴퓨터 프로그램을 작성해 모든 우연성에 대비하는 전통적인 인공지능 접근법을 따르는 대신, 스탠리로 하여금 사막을 주행하며 스스로 학습하고 자체의 시각 센서와 거리 센서가 제공하는 입력 데이 터를 토대로 운전을 해나가도록 만들었다. 얼마 후 스런은 구글에 들어가 하이테크 프로젝트를 수행하는 비밀 실험실 구글 X를 조직하고 책임을 맡았다. 자율주행 자동차 기술을 더욱 발전시키는 게 주목적이었다. 이후 지금까지 구글의 자율주행 자동차가 샌프란시스코 베이에어리어 주변을 달린 거리는 도합 350만 마일(약 563만 킬로미터)에 달한다. 우버 (Uber)는 이미 일단의 자율주행 자동차를 피츠버그 지역에 배치한 상태다. 애플(Apple) 역시 자율주행 자동차 기술 개발에 뛰어들어 자사의 OS가 제어할 수 있 는 제품의 영역을 넓히고 있다. 휴대전화 시장에서 향유했던 전략적 침투의 성공을 재현하는 게 그들의 희망이다. 전통적인 자동차 제조사들도 장장 100년 동안 변화가 없었던 사업이 눈앞에서 변모하는 모습을 보며 자율주행 자동차 경쟁에 뛰어들고 있다. 제너럴모터스(General Motors, GM)는 무인 자동차 기술을 개 발하고 있는 실리콘밸리의 스타트업 크루즈오토메이션(Cruise Automation)에 10억 달러를 투자했고, 2017년 관련 연구 개발에 6,000만 달러를 추가로 투여했다. 인텔(Intel)은 2017년 자율주행 자동차용 센서 및 컴퓨터 비전 전문 개발사 모빌아이(Mobileye)를 153억 달러에 인수했다. 운송은 규모가 수조 달러에 달하 는 경제 부문이다. 판돈이 커질 수밖에 없다.자율주행 자동차는 곧 수백만에 달하는 트럭 및 택시 운전사들의 생계를 파괴할 전망이다. 결국 도시에서는 승용차를 소유할 필요가 없어질 것이다. 언제든 자율주행 자동차가 1분 안에 나타나 목적지에 안전하게 모셔다줄 테니까 말이다. 직접 주차할 필요도 없으니 금상첨화가 아닐 수 없다. 현재 일반적인 승용차 의 주행 시간은 4퍼센트에 불과하다. 이는 곧 차의 생애 중 96퍼센트의 시간 동안에는 어딘가에 주차해둬야 한다는 의미다. 자율주행 자동차가 상용화되고 도 시 밖에 주차되는 시대가 오면 현재 도시에서 주차장으로 쓰이는 방대한 면적이 보다 생산적인 목적으로 재활용될 것이다. 도시 계획가들은 이미 주차장을 공 원화하는 방안 등을 그려보고 있다. 3 자동차와 관련된 여러 다양한 비즈니스들도 영향을 받을 것이다. 보험사와 정비소가 대표적이다. 속도위반이나 불법주차 도 없어질 것이다. 음주운전이나 졸음운전으로 인한 사망 사고도 크게 줄어들 것이다. 출퇴근길에 운전하며 소비하는 시간도 다른 목적에 쓰일 것이다. 미 인구조사국에 따르면 2014년 1억 3,900만 명의 미국인이 근무일 출퇴근길에 쓰는 시간은 평균 52분이었다. 이는 연간 총 296억 시간에 해당하며 보다 나은 용도에 쓸 수 있었던 340만 년이라는, 인간 삶의 귀한 시간이다. 헤매는 일 없는 질서정연한 운행으로 고속도로의 수용 능력이 4배 정도 증가할 것이다. 그리고 운전대 없이 목적지를 찾아갈 수 있는 자율주행 차량이 일단 개발되어 널리 이용되면 차량 절도가 종식될 것이다. 자율주행 자동차가 상용화되기까지 물론 많은 규제와 법적 제약이 따르겠지만, 일단 그런 세상이 도래하면 우리는 완전히 신세계에서 살게 될 것이다. 트럭이 아마 지금부터 10년 정도 후에 가장 먼저 운전자 없는 차량으로 도로를 누빌 것이다. 택시는 15년 정도 후에 그렇게 될 것이고, 일반 승용차는 15년 후부터 20년 후 사이에 자율주행 차량으로 전환될 것이다.우리 사회에서 승용차가 갖는 우상적 지위는 우리가 상상할 수 없는 방식으로 바뀔 것이고, 새로운 차량 생태학이 부상할 것이다. 100여 년 전 자동차의 도 입으로 많은 새로운 산업과 직업이 창출되었듯 이미 자율주행 자동차를 둘러싸고 새로운 생태계가 급성장하고 있다. 구글의 자율주행 전문 자회사 웨이모 (Waymo)는 지난 8년간 10억 달러를 투자했으며 캘리포니아 중앙부의 대지구대에 91에이커(약 36만 8,000제곱미터, 약 11만 평)에 모조 도시를 건설해놓고 비밀 주 행 시험을 실시하고 있다. 자전거 운전자들과 차량 고장도 가상으로 설정해놓고 실험하는 것은 물론이다. 이들의 목표는 훈련 데이터를 확대해 이른바 극단적인 경우 (edge case)에 해당하는 특수 상황이나 특이 환경까지 포함시키는 것이다. 고속도로에서 발생하는 희귀 사건이 종종 사고를 유발한다. 자율주행 자동차 의 다른 점은 한 대가 희귀 사건을 경험하는 경우 학습 경험으로 그것을 다른 모든 자율주행 자동차들에 전파해 일종의 집단지성을 형성한다는 사실이다. 이 와 유사한 실험 시설 다수가 여타의 자율주행 자동차 회사들에 의해 건설되고 있다. 그에 따라 전에 존재하지 않았던 새로운 직업이 창출되고 있으며 차량을 인도하는 데 필요한 센서와 레이저를 위한 새로운 공급망도 생겨나고 있다.자율주행 자동차는 IT가 주도하는 경제체의 주요 변화 가운데 가장 눈에 띄는 징후일 뿐이다. 정보는 도시의 수도관을 흐르는 물처럼 인터넷을 통해 흐르며 구글과 아마존, 마이크로소프트 등이 운영하는 방대한 데이터센터에 축적된다. 이들 IT 기업들의 데이터센터는 엄청난 양의 전력을 필요로 하는 탓에 수력발 전소 근처에 위치해야 할 정도다. 또한 정보의 끝없이 이어지는 흐름에 많은 열이 발생해 냉각수를 쉽게 조달할 수 있는 강가에 위치해야 한다. 2013년 미국 내 데이터센터들은 도합 1,000만 메가와트를 소비했는데, 이는 대형 발전소 서른네 곳이 생산한 전력과 맞먹는 양이다. 하지만 현재 경제에 그보다 더 큰 영 향을 미치고 있는 것은 이들 정보가 사용되는 방식이다. 미가공 데이터에서 추출되는 정보는 사람들과 사물에 대한 지식으로 바뀌고 있다. 우리가 하는 일과 원하는 것, 우리가 어떤 사람인지에 대한 지식이 쌓이고 있다는 뜻이다. 그리고 갈수록 늘어나는 컴퓨터 구동 장치들이 이 지식을 사용해 우리와 구어로 대화 를 나누고 있다. 두뇌 외부에서 구체화되는 책의 수동적 지식과 달리 클라우드의 지식은 모든 사람의 삶에서 능동적 일부를 이루는 외부 정보가 되고 있다.