아마도 당신이 놓친 구글의 인공 지능 발표.

바벨탑 (마틴 반 발켄 보르 치 [공개 도메인], 위키 미디어 공용을 통해)

면책 조항 : 저는 신경 네트워크 또는 기계 학습 전문가가 아닙니다. 이 기사를 처음 작성한 이후로, 나보다이 분야에 대해 더 많은 전문 지식을 가진 많은 사람들이 인상적이기는하지만 Google이 달성 한 것은 혁명적이 아니라 진화 적이라고 지적했습니다. 적어도 텍스트의 일부에서 의인화가 유죄라고 말하는 것은 공평합니다.

기사 내용을 변경하지 않은 채로 두었습니다. 나는 그 분야의 전문가들의 후속 의견과 내가했던 장의 반응을 비교하는 것이 흥미 롭기 때문입니다. 독자가 기사보다 독창적이고 정보에 대한 견해를 읽은 후 독자가 댓글을 찾아 보는 것이 좋습니다.

2016 년 말에 Google은 대부분의 사람들의 레이더에서 조용히 항해 한 기사를 게시했습니다. 작년에 읽은 기계 학습에 관한 가장 놀라운 기사 일 수 있기 때문에 부끄러운 일입니다.

보고 싶더라도 기분 나빠하지 마십시오. 이 기사는 대부분의 사람들이 탐색하고 있던 크리스마스 전의 서두와 경쟁하는 기사 일뿐만 아니라 Google의 다국어 신경 기계 번역 시스템을 사용한 기발한 헤드 라인 Zero-Shot Translation 아래에있는 Google의 리서치 블로그에 실려 있습니다.

이 소리는 반드시 비명을 지르지 않아야합니까? 특히, 프로젝트를 끝내고 선물을 사거나 가족 불화를 풀어야 할 때, 출현 달력은 초콜릿이 가득 찬 율리 데드 종말 시계처럼 크리스마스까지의 날을 끊임없이 카운트 다운합니다.

운 좋게도, 나는 당신을 빨리 데려 오기 위해 왔습니다. 여기 거래가 있습니다.

작년 9 월까지 Google Translate는 구문 기반 번역을 사용했습니다. 기본적으로 Lonely Planet 언어 안내서에서 핵심 단어와 구를 찾을 때와 동일한 작업을 수행했습니다. 프랑스어로 "모든 치즈를 가져와주세요. 넘어 질 때까지 멈추지 말아주세요"라는 내용의 페이지를 통해 어색하게 엄지 손가락을 올리는 것과 비교할 때 충분히 효과적이고 빠르고 엄청나게 빠릅니다. 그러나 뉘앙스가 부족합니다.

구문 기반 번역은 무딘 악기입니다. 지나 가기에 충분합니다. 그러나 언어 구조를 이해하지 않고 거의 동등한 단어와 구를 매핑하면 조잡한 결과 만 얻을 수 있습니다.

이 접근법은 또한 사용 가능한 어휘의 범위에 의해 제한됩니다. 구문 기반 번역은 인식 할 수없는 단어를 교육적으로 추측 할 수 없으며 새로운 입력을 통해 배울 수 없습니다.

Google이 번역 도구에 새로운 엔진 인 Google Neural Machine Translation system (GNMT)을 제공 한 9 월에 바뀌 었습니다. 이 새로운 엔진에는 신경망 및 머신 러닝과 같은 2016 년 최신 유행어가 모두 포함되어 있습니다.

짧은 버전은 Google Translate가 똑똑하다는 것입니다. 그것을 사용하는 사람들로부터 배울 수있는 능력을 개발했습니다. 다른 단어와 그 주변의 구의 맥락에 따라 구의 내용, 어조 및 의미에 대해 교육적인 추측을하는 방법을 배웠습니다. 그리고 여기 뇌가 폭발하게되어야 할 부분이 있습니다. 창조적입니다.

Google Translate는보다 효과적으로 번역 할 수 있도록 자체 언어를 개발했습니다.

더구나, 아무도 말하지 않았다. 코드화 되었기 때문에 언어 (또는 구글이 부르는 인터 링구아)를 개발하지 않았습니다. 소프트웨어가 번역 문제를 해결하는 가장 효율적인 방법이라고 시간이 지남에 따라 새로운 언어를 개발했습니다.

잠시 멈추고 그것에 대해 생각하십시오. 한 사람의 언어에서 다른 사람의 언어로 콘텐츠를 번역하도록 설계된 신경 컴퓨팅 시스템은 작업의 효율성을 높이기 위해 자체 내부 언어를 개발했습니다. 그렇게하도록 지시받지 않고. 몇 주 만에 (노트에이 단락의 수정 / 축소를 추가했습니다)

진행 상황을 이해하려면 제로 샷 변환 기능이 무엇인지 이해해야합니다. 원래 블로그 게시물의 Google Mike Schuster, Nikhil Thorat 및 Melvin Johnson은 다음과 같습니다.

일본어 ⇄ 영어 및 한국어 ⇄ 영어 예제를 사용하여 다국어 시스템을 학습한다고 가정 해 보겠습니다. 단일 GNMT 시스템과 동일한 크기의 다국어 시스템은 매개 변수를 공유하여이 네 가지 언어 쌍 사이를 변환합니다. 이러한 공유를 통해 시스템은 한 언어 쌍에서 다른 언어 쌍으로 "번역 지식"을 전송할 수 있습니다. 이러한 전이 학습과 다국어 간 번역의 필요성으로 인해 시스템은 모델링 능력을 더 잘 사용해야합니다.
이로 인해 우리는 다음과 같은 질문을했습니다. 이에 대한 예는 한국어 ⇄ 일본어 예제가 시스템에 표시되지 않은 한국어와 일본어 간 번역입니다. 인상적인 대답은 '그렇다'는 말이 없었지만 합리적인 한국어 reasonable 일본어 번역을 생성 할 수 있다는 점입니다.

여기에서 기존 구문 기반 접근 방식에 비해 Google의 새로운 신경 머신의 장점을 확인할 수 있습니다. GMNT는 명시 적으로 교육받지 않고 두 언어 간의 번역 방법을 배울 수 있습니다. 이것은 번역이 각 언어 쌍 사이에 단어와 문구를 매핑하기 위해 명시 적 사전에 의존하는 구문 기반 모델에서는 불가능합니다.

그리고 이것은 Google 엔지니어들을 놀라 울 정도로 놀라운 창조물 발견으로 이끌어줍니다.

제로 샷 번역의 성공은 또 다른 중요한 의문을 제기합니다. 시스템 학습은 언어와 상관없이 동일한 의미를 가진 문장이 유사한 방식으로 표현되는 공통 표현 (즉, "인터 링구아")입니까? 내부 네트워크 데이터의 3 차원 표현을 사용하여 가능한 모든 일본어, 한국어 및 영어 쌍 사이의 문장 세트를 번역하므로 시스템을 엿볼 수있었습니다.
단일 그룹 내에서, 우리는 같은 의미이지만 세 가지 다른 언어로 된 문장을 볼 수 있습니다. 이것은 네트워크가 단순히 문장 간 구문을 암기하는 것이 아니라 문장의 의미에 대해 무언가를 인코딩해야 함을 의미합니다. 우리는 이것을 네트워크에 존재하는 인테르 링구아의 표시로 해석합니다.

그래서 당신은 그것을 가지고 있습니다. 2016 년 마지막 몇 주 동안 전 세계의 주노들이 '지금은 최악의 해에 살고있는 기억'사고를 기록하기 시작하면서 Google 엔지니어들은 소프트웨어 엔지니어링 및 언어학에서 진정으로 놀라운 혁신을 기록했습니다.

그냥 알고 싶을 것 같아

실제로 무슨 일이 일어나고 있는지 이해하려면 여러 컴퓨터 과학과 언어학 학위가 필요할 것입니다. 여기 표면을 간신히 긁고 있습니다. 당신이 몇 학위를받을 시간이 있거나 (또는 ​​당신이 이미 그들을 가지고 있다면) 나에게 줄을 포기하고 나에게 설명하십시오. 천천히.

업데이트 1 : 흥분하게도, 적어도 인간 지능과 의사 결정에 대해 생각할 때까지 이것을 '지능형'시스템으로 과장했다고 말할 수 있습니다. 기사가 끝난 후 Chris McDonald의 의견을 읽고 더 냉정한 시각을 얻으십시오.

업데이트 2 : 신경망의 기능에 대한 전문가의 설명을 보려면 Nafrondel의 훌륭하고 자세한 답변을 읽어야합니다.