카테고리 없음

[팟캐스트] 렉스 프리드만 with 일론 머스크(자율주행만)

21c형Pilot 2021. 12. 29. 12:21

https://www.youtube.com/watch?v=DxREm3s1scA 

 

테슬라 자율주행과 관련된 일부 내용만 발췌

Q) 오토파일럿을 출시하고 지난 5~6년간 얻은 인사이트는 뭔가?                                                                    A) 자율주행이 생각보다 어려웠다. 쉽다고 생각했는데 어려웠다는 말이 아니라, 어렵다고 생각했지만 알고보니 훨씬 더 어려웠다. 요즘들어 생각하길, 자율주행을 해결하기 위해서는 인간이 운전을 하기 위해 눈(passive optical)과 신경(neural net)을 활용하는 행동들을 recreate해야 한다. 그것을 디지털 형태로 recreate해야 한다. 카메라에 더 진보된 뉴럴 넷을 적용시키는 것이다. 이것이 유일한 방법이다. 다른 방법은 없다고 본다.

 

Q) 그런데 내 질문은, 인간의 어떤 면(본성)을 기계에 적용(encode)해야 하는 것인데, 음 물론 인지(perception) 문제를 풀어야 겠지. 먼저 우리가 뭘 볼 수 있어야 하는지를 알아야 한다(인간이 운전할 때 뭘 보는가?). 최근에 안드레 카파시가 MIT에 와서 car door에 대해 이야기한 적 있는데, car door가 열려있다는 것이 무엇을 의미하는가, 그 온톨로지(ontology)가 바로 인지 문제인데, 이 중에 운전과 상관 있는 것이 무엇인지(특히 수많은 엣지 케이스들)의 문제도 있고, 또 운전 중에 얼마나 많은 '게임이론' 문제를 고려해야 하는지 즉, 운전 중에 우리의 행동은 다른 사람들에 행동에 큰 영향을 준다. 우리의 행동이 다른 사람들의 행동을 바꾸고 그 반대이기도 하다. (신호등이 없는 4 way 교차로 등)          A) (질문 마지막 내용에 대해)내 생각에 제어의 수수께끼는 어려운 부분이 아니다.

 

Q) 그럼 어려운 부분(beautiful complex problem)은 어디인가?                                                                     A) 정말 수 많은(freaking) s/w가 있다. 정말 많은 코드 라인이 있다. 정확한 벡터 스페이스를 만들기만 하면 제어 문제는 비디오 게임과 같다. GTA 사이버펑크 같은. 만약 정말 정확한 벡터 스페이스를 가지고 있다면. 제어 문제가 별 것 아니다(trivial)고 말하진 않겠지만 극복하기 어려운 이슈는 아니다. 정확한 벡터 스페이스를 만드는 것이 어려운 것이다

 

Q) 과거 수년간의 경험, 그리고 지금의 생각으로 미뤄볼 때 테슬라가 어떻게 Full self driving 문제를 풀 수 있을까, 테슬라가 레벨4 FSD를 달성하게 될 때는 언제인가?                                                                                    A) 꽤 잘 될 것 같고, 시점은 내년이다.(I mean it's looking quite likely that it will be next year.)


(약간 정적^^;;)

Q) 어떤 솔루션인가? 지금 FSD 베타 사용자들이 점점 더 나은 기능을 업데이트 받아서 결국에는 주행 중에 책을 읽을 수 있는 상황까지 되는건가?
A) 그렇다. 데이터를 보면 시스템 해제율(rate of disengagement)은 급속도로 낮아지고 있다. 그래서 내년 쯤에는 FSD의 사고 가능성이 평균적인 인간이 운전하는 것 보다 낮아질 것이다. 분명히 내년에는 그 정도 수준으로 올라갈 것이다.
물론 규제 당국에게 이를 설득해야 한다. 소비자에게도 설득해야 한다. It is okay to go 라고 말할 수 있기 위해서는 단지 평균적인 사람보다 낫다는 것이 아니라 2,3배 우수하다는 것을 보여야 한다.


Q) 최근에 FSD 10.6이 나왔고 10.7을 기다리고 있는데 아마 11이 언젠가 나올 텐데,
A) 11은 내년에 곧 나올 것이다. 뉴럴 네트워크 아키텍쳐에 대해 근본적인 rewrite에 해당한다. 물론 벡터 스페이스를 만드는 것도 완전히 rewrite하는 수준이 될 것이다.

Q) 10.7에서 숫자가 11로 뛰는 만큼 뭔가 획기적인 변화가 있다는 것인가?
A) 11은 싱글 스택을 사용할 것이다. 싱글 스택이 모든 것을 통제한다. 더 많은 기능을 제공할 것이고 아직은 알파 S/W 수준이다. 기본적으로 엄청난 C, C+ 코드가 필요한데, 많은 양의 C+ 코드를 없애고 뉴럴 넷으로 대체한다. 
그리고 안드레 카파시는 이 부분을 굉장히 강조한다. 'neural nets like kind of eating software'. 'less and less conventional software, more and more neural net'. 여전히 s/w 코딩은 중요하지만 방향성은 바뀔 필요가 있다. (more matrix base stuff, less heuristics based stuff)