범죄자들이 AI를 사용하는 방법에 대한 기술적 인 관점

머신 러닝은 오늘날 기술에 사용되는 가장 흥미로운 새로운 기능 중 하나입니다. 그러나 의심 할 여지없이 논란의 여지가있다. 현재,이 논쟁은 초 지능 로봇이 인류를 극적으로 인수한다는 전망에서 비롯된 것이 아닙니다. 대신에, 이와 같은 강력한 기술은 좋은 의도를 가진 사람들에 의해 긍정적으로 사용될 수 있기 때문에 범죄자들에 의해 부정적으로 사용될 수 있기 때문입니다. 이 기사에서는 범죄자가 AI를 불법적으로 사용하는 방법과 같은 더 어두운면을 탐구하고 싶습니다.

컴퓨터가 휴리스틱 문제를 해결할 수 있기 전에는 많은 보안 시스템이 변경되지 않는 원리로 설계되었습니다. 컴퓨터가 암호를 추측하거나 그래픽 보안 문자를 읽거나 실제 트래픽이 어떻게 작동하는지 알 수 있다는 아이디어는 단순히 고려되지 않았습니다. 이제 우리는 AI에 의해 구식이 된 보안에 둘러싸여 있습니다.

보안 문자 및 이미지 분류

시스템은 사용자가 실제로 사람임을 확인해야하는 경우가 많습니다. 컴퓨터가 사람에게 제공하는 모든 기능을 컴퓨터 프로그램으로 활용하거나 시뮬레이션 할 수 있기 때문입니다. 페이스 북에 3 번 이상 로그인을 시도하면 페이스 북이 사람인지 확인하고 컴퓨터 프로그램이 초당 수백만 개의 암호를 입력하려고하지 않습니다. Facebook 및 많은 서비스가이를 수행하는 방식은 보안 문자 방법을 사용하는 것입니다.

몇 년 동안, 이들은 AI가 등장 할 때까지 인간과 프로그램을 성공적으로 분리했습니다. 이제 기본 컨볼 루션 신경망을 사용할 수 있는데, 여기에는 거대한 보안 문자 이미지 세트가 사용됩니다. 각 보안 문자에는 지정된 목표가 있으며, 전환을 훈련하면 향후 제안 된 보안 문자를 해결할 수 있습니다. 이것은 신경망의 기본 원칙이 필요한 모든 사소한 예입니다. 보안 문자를 우회 할 수있게되었으므로 무차별 대입 공격이 훨씬 더 가능해졌습니다. AI가 우회하는 것처럼 "버스가 포함 된 모든 사진 선택"유형의 보안 문자를 발견했을 수도 있습니다. Google은 매우 기본적이고 성공적인 기능으로 검색 엔진에 통합되어 있어도 Google에서 얼마나 뛰어난 물체 감지 기능을 제공하는지 알고 있습니다.

생성적인 적대적 네트워크가있는 비밀번호

다음과 같은 암호를 가진 사람은 거의 없습니다 : 5f2 # V0”P? oz3

우리 중 더 많은 사람들이 다음과 같은 암호를 가지고 있습니다 : Kronenbourg1664

그리고 우리 중 나머지는 다음과 같은 암호를 가지고 있습니다.

첫 번째 예제를 따르는 사람들이 사람이나 GTX 1080 GPU에 의해 추측되는 암호로부터 매우 안전합니다. 그러나 다른 모든 사람들은 취약합니다. 그렇다면이 암호를 어떻게 추측 할 수 있습니까? 가장 간단하게 사전을 사용하고 각 단어를 암호 입력에 적용 할 수 있습니다. 저의 마지막 예를 따르는 사람들 때문에 우리는 시도의 아주 적은 비율로 성공할 수 있습니다. 이 사람들 중 한 명이라면이 기사가 끝날 때까지 비밀번호를 변경할 것이라고 확신합니다.

이제 더 현대적이고 불길한 접근법 (AI를 사용하는 것)을 살펴 보겠습니다. 사전을 사용하는 대신 신경망을 사용하여 가능한 많은 암호 목록을 생성합니다. 이 목록은 인증 양식에 적용하는 데 사용됩니다. PassGAN : Password Guessing에 대한 딥 러닝 접근 방식에서 가져온 목록은 다음과 같습니다.

신경망에 익숙한 경우 (다음 몇 단락에서는 매우 중요합니다) 여전히 비정상적인 것처럼 보일 수 있습니다. 입력을 기반으로 항목을 단순히 예측하는 대신 데이터에서 학습 한 다음 생성기를 가르치면서 몇 가지 추가 예를 생성합니다. 이것은 두 개의 신경망이 사용되는 생성 적대 네트워크로 알려져 있습니다. 하나는 정확한 입력과 잘못된 입력을 구별하는 것이고, 그런 다음이를 통해 랜덤 노이즈를 통해 새로운 올바른 데이터를 생성합니다.

먼저 실제 사람 암호가 포함 된 기존 데이터 세트를 사용합니다. 이것들은 사람의 암호가 어떻게 보이는지를 보여줍니다 (몇 글자, 날짜, 난수, 이름 등).

둘째, 노이즈 생성기 (G)를 사용하여 (처음에는) 임의의 데이터를 출력합니다. 이 두 가지 가능한 입력 (가짜 및 실제 비밀번호)은 신경망 (또는 판별 기 D)의 입력입니다. 대상은 간단한 이진 출력으로 설계되었습니다. 이것은 훈련 과정에서 입력 된 암호가 가짜인지 실제인지를 신경망에 알려줍니다. 각 피드 포워드에서 생성 된 출력 값을 목표 값 (진실)과 비교 한 다음 다시 전파되어 오차 한계에 따라 가중치 값을 조정합니다. 임의의 입력 노이즈가 비밀번호 출력에 더 가깝게 최적화되기 시작하므로 생성기에도 영향을받습니다.

제너레이터가 변경되면 네트워크에 추가로 입력 된 노이즈는 암호처럼 보이는 문자열을 생성합니다. 따라서 몇 시간 동안 그대로두면 지능적으로 컴파일 된 암호 목록을 컴파일 할 수 있습니다.

피싱

피싱은 매우 일반적인 해킹 형태입니다. 잘 보이지 않지만 은행, 전화 서비스 또는 소셜 미디어 플랫폼이라고 주장하는 이메일을받은 적이 있습니까? PHP와 같은 백엔드 코드만으로 HTML을 조금만 알고있는 초보자 프로그래머라면이 기능을 사용할 수 있습니다. Facebook처럼 보이고 시각적으로 유사한 공식 언어를 사용하도록 시각적으로 설계된 전자 메일을 보내는 것이 포함됩니다. 업데이트, 보거나 변경해야한다고 주장하고 로그인 세부 정보를 요청합니다. 입력 한 내용이 무엇이든 범죄자의 서버로 전송됩니다. 어쨌든 AI는 어떻게 이런 일을합니까?

기계 학습은 플랫폼을 크롤링하고 언어의 모양과 의사 소통 방식을 학습 한 다음 특정 관측치에 따라 가짜 전자 메일을 대량으로 자동 발송하여 대량의 피싱을 향상시킬 수 있습니다. 그러나 이것이 유일한 방법은 아닙니다. 해커는 암호를 추측하기 위해 앞에서 설명한 것과 동일한 보안 주체를 사용하여 전자 메일 주소를 추측 할 수 있습니다. 수백만 개의 이메일 주소가 생성 될 수 있으며 기술적으로 다루기 힘든 사람들을 찾을 가능성이 높아집니다.

Gmail과 같은 많은 이메일 서비스에는 피싱 이메일을 탐지하는 고급 시스템이 있지만 머신 러닝을 사용하여 이러한 시스템에서 탐지되지 않는 이메일을 만들 수 있습니다. 교육 집합은 전자 메일 모음으로, 일부는 피싱 탐지로 인해 사용자에게 도달하지 못했으며 다른 일부는 성공했습니다. 신경망은 어떤 것이 잡히고 없는지를 이해함으로써 피싱이 어떻게 탐지되고 있는지를 배울 수 있습니다. 앞으로 피싱 탐지에 의해 포착되지 않은 규칙을 기반으로 전자 메일을 생성 할 수 있습니다. 여기를 참조하십시오.

결론

첫째, 이들은 세 가지 경우에 불과합니다. 걱정스럽게도 사기성 광고, 가짜 트래픽 시뮬레이션 등과 같은 다른 영역에는 더 많은 것이 있습니다. 그러나 저는 법적인 세계에서 AI를 사용하는 것이 범죄 세계보다 훨씬 크다고 생각합니다. 아이러니하게도 AI는 거리 정책에서 온라인 사기에 이르기까지 여러 가지 놀라운 방법으로 범죄 행위를 탐지하는 데 사용됩니다. 결론적으로, 생성적인 대적 네트워크가 추측 할 수 있다면 암호를 변경하십시오. 발신자 식별을 두 번 확인하지 않은 한 전송 된 링크를 따르지 마십시오. 마지막으로 법을 어기려면 이러한 기술을 직접 사용하지 마십시오!

— — — — — — — — — — — — —

초보자부터 고급 레벨까지의 자습서 및 가이드를 포함하여 OpenDataScience.com에서 더 많은 데이터 과학 기사를 읽으십시오! 여기에서 주간 뉴스 레터를 구독하고 매주 목요일마다 최신 뉴스를 받으십시오.