한줄 요약: 

짧은 요약(Abstract) :    
이번 장에서는 적대적 조작을 생성하기 위한 게임 이론 전략을 요약함

저자들은 적들이 데이터 분포에 작은 변화를 주입하여 딥러닝이 이후 데이터 분포를 잘못 분류하게 하는 것을 적대적 학습의 목표로 가정함

따라서 저자들의 적대적 딥러닝 과정의 이론적 목표는 입력 데이터의 조작이 학습자 결정 경계,  너무 많은 양성 레이블이 음성 레이블로 변한 지점에 도달했는지를 결정하는 것임

적대적 데이터는 적들이 딥러닝의 오분류 성능을 목표로 하는 스태켈버그 게임에서 최적의 공격 정책을 해결함으로써 생성됨

순차적 게임 이론 공식은 지능적 적과 딥러닝 모델 간의 상호 작용을 모델링하여  플레이어가 순차적 비협조 스태켈버그 게임을 해결함으로써 적대적 조작을 생성할  있음

확률적 게임 이론 공식을 사용하면 저자들은  플레이어 스태켈버그 게임을 적들의 확률적 지불 함수가 있는 다중 플레이어 스태켈버그 게임으로 확장할  있음

  게임 버전은 나쉬 균형을 통해 해결되는데, 이는 학습자나 적이 최적 전략에서 벗어날 유인이 없는 전략 쌍을 의미함

저자들은   다중 레이블 분류 작업을 위해 딥러닝에 설계된 데이터 무작위화 전략을 통해 변이적 지불 함수를 최적화하는 적들을 탐색할  있음

이러한 조사의 결과는 새로운 나쉬 균형으로 해결되는 변수   플레이어 순차적 스태켈버그 게임을 해결하는 알고리즘 설계임

적은 입력 데이터의 변이적 매개 변수를 조작하여 딥러닝의 학습 과정을 오도하여 원래 클래스 레이블을 대상 클래스 레이블로 잘못 분류하도록 

이상적인 변이적 적대적 조작은 딥러닝이 디코딩된 데이터를 잘못 레이블링하게 만드는  필요한 적대적 비용 함수의 인코딩된 데이터에 대한 최소 변경임

최적의 조작은 비볼록 최적 반응 전략에서의 확률적 극값 때문임

이러한 스태켈버그 게임 변형에 의해 생성된 적대적 데이터는 일회성 상호 작용이 아닌 분류기의 학습 과정과의 연속적인 상호 작용을 시뮬레이션함

합성곱 신경망(CNN) 학습 과정은 입력 데이터 수준과 생성된 데이터 수준에서 적에 의해 조작될  있음

저자들은   조작된 데이터에 대해 원래 딥러닝 모델을 재학습하여 게임 이론적 적들로부터 후속 성능 취약성에 대해 강력한 적대적 딥러닝 모델을 생성하게 

보안 요구 사항에 대해 설계된 머신 러닝이 포함된 사이버보안 애플리케이션에서 제공되는 게임 이론적 적대적 딥러닝 전략에 대한 대안적 가설이 제공됨

게임 이론적 해결 개념은 적대적 조작에 대한 후속 데이터에 강건한  뉴럴 네트워크를 이끌어냄

이러한 유망한 결과는 게임 이론적 모델링과 수학적 최적화를 기반으로  학습 알고리즘을 사용하여  안전한 딥러닝 모델을 구축하는 것이 훨씬  나은 접근 방법임을 시사함

Useful sentences :  
*   


Paper link
Lecture link


단어정리


4.1 Game Theoretical Learning Models

저자들은 게임 이론적 프레임워크를 사용하여 적대적 학습 알고리즘을 훈련하는 데에 이용되는 두 플레이어 순차 게임(또는 스태켈버그 게임)과 다중 플레이어 협력 게임의 아이디어를 적용함

이러한 게임에서 평형을 찾는 것은 고차원 최적화 문제를 해결하는 것과 동일함

결국 모델 성능은 계산상 효율적인 휴리스틱 검색 알고리즘을 기반으로 하는 확률적 최적화 방법으로 추정됨

목적 함수가 유계인 경우, 유전 알고리즘, 모의 담금질, 확률적 언덕 오르기와 같은 글로벌 최적화 방법이 하위 게임 완벽 평형에 이르는 수렴 기준을 찾기 위해 적용될 수 있음

Globerson 등은 게임 이론적 공식화를 가진 분류 알고리즘에 대해 논의함

제안된 알고리즘은 쿼드러틱 프로그래밍에 의해 최적화된 min-max 목적 함수에 따라 특성 삭제에 강함

Liu 등은 적과 데이터 마이너 간의 상호 작용을 두 플레이어 순차 스태켈버그 제로섬 게임으로 모델링하고, 각 플레이어에 대한 보상은 정규화된 손실 함수로 설계됨

적은 원본 훈련 데이터를 변형하기 위해 최적의 전략을 사용하여 반복적으로 데이터 마이너를 공격하고, 데이터 마이너는 적의 훈련 데이터 수정에 대한 관찰을 바탕으로 분류기를 재구축하여 독립적으로 반응함

이러한 게임은 적의 보상이 증가하지 않거나 최대 반복 횟수에 도달할 때까지 반복됨


4.1.1 Fundamentals of Game Theory

게임 이론은 방어자와 적의 행동을 방어 및 공격 전략 측면에서 모델링하는 수학적 도구를 제공함

게임 이론적 적대적 학습은 공격자가 분류기에 적응하는 데 드는 비용과 공격에서 얻는 이익 사이의 트레이드오프를 고려함

반면에 방어자가 올바른 공격 탐지의 이점과 잘못된 경보의 비용 사이의 트레이드오프를 만듦

적대적 학습에서 최적값은 방어자의 적대적 공격으로부터 손실을 줄이기 위해 필요한 적절한 전략을 결정할 수 있음

양측의 페이오프 함수 간의 전략적 상호 작용은 각 플레이어의 애플리케이션 시나리오의 상대적 순위를 기계 학습에서 예상되는 최종 결과 측면에서 반영함

보통 스태켈버그 게임은 계층적 경쟁이 있는 시장에서 합리적 에이전트를 가정하여 전략적 상호 작용을 모델링하는 데 사용됨

게임의 각 플레이어에 대한 전략 공간은 일반적으로 유계이고 볼록하다고 가정되며 해당 페이오프 함수는 미분 가능하다고 가정됨

게임의 모든 페이오프 함수에 대한 평형 해결책은 최적화 목적 함수의 해결책에 의해 결정됨

게임 이론은 경제학, 정치 이론, 진화 과학 및 군사 전략에서 응용됨


4.1.2 Game Theoretical Data Mining

Fayyad 등은 데이터베이스 내의 지식 발견(KDD)이라는 프레임워크를 정의하여 데이터 마이닝 알고리즘을 데이터 분석 활동과 통합함

KDD는 유용한 패턴을 데이터베이스에서 분석, 설계 및 발견하는 데 사용되는 데이터 마이닝 알고리즘을 활용하는 설계 과정임

KDD는 유용한 지식을 데이터에서 발견하는 전반적인 과정으로 정의됨

데이터 마이닝은 KDD 과정의 특정 단계에 특정 기계 학습 이론을 적용한 것으로 언급됨

KDD 과정의 맥락 없이 데이터 마이닝 알고리즘은 의미 없는 패턴을 발견할 수 있음

KDD 과정은 컴퓨터 과학의 여러 연구 분야에서 아이디어를 차용하는데, 이에는 기계 학습, 패턴 인식, 데이터베이스, 통계, 인공 지능, 전문가 시스템, 데이터 시각화 및 고성능 컴퓨팅이 포함됨

통합된 목표는 실제 세계 데이터 소스에서 얻은 복잡한 데이터셋의 맥락에서 저수준 데이터 모델에서 고수준 지식 패턴을 추출하는 것임

데이터 마이닝 알고리즘의 수학적 속성을 큰 데이터셋으로 확장하는 것은 주요 목표 중 하나임

KDD 시스템은 데이터 샘플링 및 모델링, 가설 평가 및 적대적 노이즈 프로세스 처리를 위한 통계 절차를 제공함

KDD 방법은 모델 추출에서 더 많은 검색을 사용하여 큰 데이터셋과 풍부한 데이터 구조의 맥락에서 작동함

KDD 목표는 학습 가설의 검증과 자율적 패턴 발견 사이를 구별함

발견 목표는 더 잘 알려진 예측 모델링 및 서술 분석으로 더 나뉨

예측 및 설명 작업의 상대적 중요성은 데이터 마이닝 애플리케이션마다 다름

응용 프로그램을 구현하기 위한 주요 데이터 마이닝 방법에는 선택, 추출, 분류, 회귀, 군집화, 연관, 요약, 최적화, 무작위화, 근사, 의존성 모델링 및 변화 감지가 포함됨

데이터 마이닝 알고리즘의 구성 요소로는 모델 표현, 기능, 모델 평가 기준, 모델 학습 알고리즘 및 모델 검색 방법이 식별됨


4.1.3 Cost-Sensitive Adversaries

Nelson 등은 분류기에 효율적으로 질문할 수 있는 적의 방법을 연구함

탐지되지 않은 적대적 예시는 훈련 특성 공간에서 다항식 수의 쿼리를 사용하여 적에게 최소 비용으로 제작됨

따라서 비용에 민감한 적은 탐지기의 멤버십 쿼리 응답을 관찰함으로써 부정적 레이블에 대한 탐지기의 맹점을 발견하고 탐지기의 의도된 성능에 최대한의 영향을 미치는 저비용 적대적 예시를 구성할 수 있음

적은 적은 쿼리로 저비용 부정적 사례를 찾는 문제를 근접 최적 회피 문제라고 함

대상 분류기는 볼록 유도 분류기라고 함

이러한 분류기에는 선형 분류기와 초구 결정 경계를 학습하는 이상 탐지기가 포함됨

분류기의 결정 경계를 역설계할 필요가 없음

쿼리 기반 최적화의 적대적 목표는 활발한 학습 분야와 비교할 수 있지만 유사하지는 않음

적의 유용성 개념은 적대적 비용 함수로 표현됨

Lanckriet 등은 분류기가 향후 데이터 포인트의 올바른 분류에 대한 오분류 확률을 최악의 경우 설정에서 분석함

결과적인 미니맥스 문제는 이진 분류 문제에서 쿼드러틱 프로그램으로 최적화된 두 클래스 간의 마할라노비스 거리의 최대값을 최소화하는 것으로 기하학적으로 해석됨

분류기의 강인함은 클래스의 평균과 공분산의 추정 오류에 정의됨

이는 서포트 벡터 머신과 같은 비선형 분류기와 경쟁력이 있음

이것은 분류기의 적대적 강인함을 측정하는 차별화된 접근 방식임


4.1.4 Adversarial Training Strategies

저자들은 게임 이론적 접근 방식을 통한 적대적 머신러닝에 주목하며, 특히 활동적인 적들로부터의 공격을 받는 사이버보안 애플리케이션에 초점을 맞춤

이러한 애플리케이션에는 침입 탐지, 은행 사기 탐지, 스팸 필터링, 맬웨어 탐지가 포함됨

해당 보안 게임은 학습 시스템과 지능적인 적 사이에서 형성되며, 양측 플레이어 모두 자신들의 페이오프를 극대화하는 최적의 응답 전략을 시도함

각 플레이어는 상대방의 전략 선택을 예측하여 최적의 전략을 결정함

이후 적대적 학습 과정은 적대적 조작에 의해 오도되기 쉽지 않은 강인한 분류기를 결과로 함

동시 게임과 순차 게임은 지능적인 적과 학습 시스템 사이의 전략적 상호 작용을 연구하는 가장 인기 있는 보안 게임임

스태켈버그 게임에서는 적이나 학습자 중 하나가 게임의 리더가 됨

이들은 베이지안 스태켈버그 게임과 같은 단일 리더 다중 팔로워 게임으로 확장될 수 있음


4.2 Game Theoretical Adversarial Learning

저자들의 연구는 적대적 환경에서의 학습 가능성과 강인성 사이의 교환 관계를 적대적 깊은 학습의 게임 이론적 접근 방식을 통해 탐구함

학습 가능성이란 분류자가 올바른 레이블을 예측할 수 있는 능력을 의미하며, 강인성은 노이즈가 있든 없든 예측이 동일하게 유지되는 성질을 의미함

관찰된 교환 관계는 학습 가능성이 증가하면 강인성이 감소하는 경향을 보임

주요 목표는 사이버 공간 보안 데이터 마이닝 문제에 적용 가능한 게임 이론적 적대적 깊은 학습 알고리즘의 개발임

저자들은 지도된 기계 학습의 결정 경계를 모델링하는 게임 이론적 지불 함수를 개발하며, 적대적 데이터 조작과 흑박스 학습자 최적화 사이의 시스템 이론적 의존성을 탐구함

이러한 강인한 최적화는 예측 게임에서 기계 학습의 강인성, 공정성, 설명 가능성 및 투명성에 대한 이론을 연구함

여기에서 저자들은 다중 레이블 분류 작업을 위해 설계된 딥러닝에 데이터 무작위화 전략을 통해 변이적 지불 함수를 최적화하는 적들을 탐구함

이러한 조사의 결과는 새로운 나쉬 균형을 통해 해결되는 변수 합 두 플레이어 순차적 스태켈버그 게임을 해결하는 알고리즘 설계임

적은 입력 데이터의 변이적 매개 변수를 조작하여 딥러닝의 학습 과정을 오도하여 원래 클래스 레이블을 대상 클래스 레이블로 잘못 분류하게 만듦

이상적인 변이적 적대적 조작은 딥러닝이 디코딩된 데이터를 잘못 레이블링하게 만드는 데 필요한 적대적 비용 함수의 인코딩된 데이터에 대한 최소 변경임

최적의 조작은 비볼록 최적 반응 전략에서의 확률적 극값 때문임

이러한 스태켈버그 게임 변형에 의해 생성된 적대적 데이터는 일회성 상호 작용이 아닌 분류기의 학습 과정과의 연속적인 상호 작용을 시뮬레이션함

합성곱 신경망(CNN)의 학습 과정은 입력 데이터 수준과 생성된 데이터 수준에서 적에 의해 조작될 수 있음

저자들은 그 후 조작된 데이터에 대해 원래 딥러닝 모델을 재학습하여 게임 이론적 적들로부터 후속 성능 취약성에 대해 강력한 적대적 딥러닝 모델을 생성함


4.2.1 Multilevel and Multi-stage Optimization in Game Theoretical Adversarial Learning

게임 이론적 적대적 학습에서의 다중 레벨 및 다단계 최적화는 경쟁 게임에 적합한 다중 레벨 최적화와 모든 플레이어가 동일한 페이오프를 받지만 우연의 플레이어가 있는 협력 게임에 적합한 다단계 최적화를 포함함

다중 레벨 최적화는 여러 단계, 여러 목표, 그리고 여러 의사 결정자를 가짐

이에 반해 다중 레벨 최적화는 의사 결정 문제 및 각 플레이어의 움직임을 최적화 문제의 해결책으로 결정하는 복잡성 클래스에 대한 모델을 일반화함

이러한 다단계 최적화의 실용적 응용은 정부 기관과 대기업의 계층적 의사 결정 시스템, 전기 네트워크 및 생물학적 시스템과 같은 제어 최적화 시스템을 포함함

다중 레벨 최적화 이론은 또한 게임 이론적 적대적 학습에서 프라이버시와 보안 사이, 적의 비용과 학습자의 비용 사이, 그리고 공격 시나리오와 방어 메커니즘 사이의 계산 자원 트레이드오프를 최적화의 이중성 공식화 측면에서 정량화할 수 있게 함


4.3 Game Theoretical Adversarial Deep Learning

저자들의 연구는 적대적 환경에서의 학습 가능성과 강인성 사이의 교환 관계를 적대적 깊은 학습의 게임 이론적 접근 방식을 통해 탐구함

학습 가능성이란 분류자가 올바른 레이블을 예측할 수 있는 능력을 의미하며, 강인성은 노이즈가 있든 없든 예측이 동일하게 유지되는 성질을 의미함

관찰된 교환 관계는 학습 가능성이 증가하면 강인성이 감소하는 경향을 보임

주요 목표는 사이버 공간 보안 데이터 마이닝 문제에 적용 가능한 게임 이론적 적대적 깊은 학습 알고리즘의 개발임

저자들은 지도된 기계 학습의 결정 경계를 모델링하는 게임 이론적 지불 함수를 개발하며, 적대적 데이터 조작과 흑박스 학습자 최적화 사이의 시스템 이론적 의존성을 탐구함

이러한 강인한 최적화는 예측 게임에서 기계 학습의 강인성, 공정성, 설명 가능성 및 투명성에 대한 이론을 연구함

여기에서 저자들은 다중 레이블 분류 작업을 위해 설계된 딥러닝에 데이터 무작위화 전략을 통해 변이적 지불 함수를 최적화하는 적들을 탐구함

이러한 조사의 결과는 새로운 나쉬 균형을 통해 해결되는 변수 합 두 플레이어 순차적 스태켈버그 게임을 해결하는 알고리즘 설계임

적은 입력 데이터의 변이적 매개 변수를 조작하여 딥러닝의 학습 과정을 오도하여 원래 클래스 레이블을 대상 클래스 레이블로 잘못 분류하게 만듦

이상적인 변이적 적대적 조작은 딥러닝이 디코딩된 데이터를 잘못 레이블링하게 만드는 데 필요한 적대적 비용 함수의 인코딩된 데이터에 대한 최소 변경임

최적의 조작은 비볼록 최적 반응 전략에서의 확률적 극값 때문임

이러한 스태켈버그 게임 변형에 의해 생성된 적대적 데이터는 일회성 상호 작용이 아닌 분류기의 학습 과정과의 연속적인 상호 작용을 시뮬레이션함

합성곱 신경망(CNN)의 학습 과정은 입력 데이터 수준과 생성된 데이터 수준에서 적에 의해 조작될 수 있음

저자들은 그 후 조작된 데이터에 대해 원래 딥러닝 모델을 재학습하여 게임 이론적 적들로부터 후속 성능 취약성에 대해 강력한 적대적 딥러닝 모델을 생성함


4.3.1 Overall Structure of Learning Model in Variational Game

변이적 게임에서의 학습 모델 전체 구조는 다음과 같음

저자들의 적대적 학습 과정에는 변이적 적이 포함된 감독 학습이 있는데, 이 과정의 최종 결과는 적대적 공격에 강인한 CNN 분류 모델인 CNNsecure(CNNs로 약칭)임

적대적 데이터는 분류기와 적 사이의 두 플레이어 스태켈버그 게임에서 생성됨

적은 인코딩된 훈련 데이터에서 적대적 조작을 찾기 위해 변이적 모델을 생성하며, 인코딩된 훈련 데이터의 모든 통계적 매개 변수는 모의 담금질(SA) 절차에 따라 검색됨

인코딩된 훈련 데이터 내의 모든 통계적 매개 변수에 대한 적대적 조작의 집계는 번갈아 최소 제곱(ALS) 절차에 따라 최적화됨

ALS 최적화는 적이 스태켈버그 게임에서 적대적 데이터 Xgen을 생성할 때마다 호출됨

Xgen은 공격을 받는 분류기에 대한 검증 데이터로 작용함

Xgen이 생성될 때마다 분류기는 자신의 훈련 가중치를 재최적화하여 자체를 업데이트함

학습자와 분류기의 최적 움직임 사이의 이러한 게임 이론적 상호 작용의 결과는 적의 페이오프인 payoffbest에 의해 정량화됨

적은 payoffbest가 증가하는 동안 분류기를 스태켈버그 게임에 참여시킴

payoffbest의 감소는 스태켈버그 게임에서 나쉬 균형 출구 조건에 도달했음을 나타냄

게임이 끝날 때 적은 가장 최근의 Xgen에서 최적의 적대적 조작을 가짐

이러한 조작은 훈련 데이터에 적용되어 공격받은 훈련 데이터를 얻게 됨

그런 다음 분류기의 학습 과정은 공격받은 데이터를 원래 훈련 데이터에 추가하여 저자들의 적대적 공격에 의해 최적으로 재훈련될 수 있도록 함

CNN 분류기가 원래 데이터 공간에서 훈련되는 동안 적은 인코딩된 데이터 공간에서 데이터 조작을 생성함

변이적 인코딩된 데이터 공간의 표현을 통해 적은 적대적 조작에 대한 생성 모델을 제안할 수 있음


4.3.2 The Differences between Our Method and GANs

저자들의 방법과 GANs(생성적 적대 신경망) 사이에는 몇 가지 큰 차이점이 있음

첫째, 모델 구성 측면에서 저자들의 변이적 스태켈버그 게임은 가변 합 문제를 구성하는 반면, GANs는 상수 합 게임을 구성함

둘째, 저자들의 방법에서는 적이 게임의 리더로 정의되는 반면, GAN에서는 생성자가 게임을 이끔

마지막으로, GANs는 주어진 데이터 분포의 기저에 있는 생성 모델을 발견하기 위한 공격 시나리오를 정의하는 반면, 저자들은 무작위 전략 공간에서 진화하는 공격 매개 변수로 적대적 지불 함수를 최적화하여 공격 시나리오를 정의함

모델 최적화 측면에서 GANs는 기울기 기반 최적화 알고리즘을 사용하여 볼록 최적화 문제를 해결하는 반면, 저자들은 모의 담금질 알고리즘을 사용하여 확률적 최적화 문제를 해결함

특히 저자들의 게임에서 나쉬 균형은 비볼록 최적화 문제를 해결함으로써 계산됨

최적화 결과 측면에서 가장 큰 차이점은 GAN의 목표가 나쉬 균형에서 원본 데이터 분포를 모방하는 생성 모델을 학습하는 것인 반면, 저자들의 방법은 원본의 진실된 데이터 분포가 아니라 원본 분포에 대한 조작을 최적의 적대적 조작으로 학습하는 것임

GAN의 판별자는 나쉬 균형에서 레이블 사이를 분류할 수 없지만, 저자들의 분류기는 적대적 조작에 강건하며 그 방어 성능은 errorPos(w)로 측정됨

저자들의 블랙박스 공격 시나리오에서 다양한 적대적 지불 함수와 적대적 비용 함수에 대한 제안은 학습 목표 함수와 해당 적대적 조작에 대한 다양한 나쉬 균형으로 이어짐

반면 GAN은 항상 훈련 데이터 분포로 수렴하려고 함


4.3.3 Comparisons of Game Theoretical Adversarial Deep Learning Models

저자들의 연구에서 게임 이론적 적대적 딥러닝은 훈련 단계와 테스트 단계에서 사이버 공간 보안 분류 문제에 적용됨

이러한 문제들은 적대적 학습 애플리케이션에서 특성 조작, 오분류 비용 및 분포적 강인성을 연구함

그 후 적대적 예제들은 딥러닝의 손실 함수들에 대한 실험을 통해 만들어짐

저자들의 연구에서 적대적 손실 함수들과 훈련 절차들은 사이버-물리 시스템 배치에서 딥러닝의 신뢰성 연구에 적용 가능함

그것들은 컴퓨터 최적화 및 통계적 추론 문제로서 사이버 공간 보안 안전 장치, 위험, 그리고 도전들을 시뮬레이션 할 수 있음

이러한 대규모 데이터에 대한 민감도 분석을 위해, 저자들은 구조화된 예측에서 미분류 추세에 따라 딥 뉴럴 네트워크 매개 변수를 조정하는 분석 검증 메트릭을 분석할 수 있음

이 목적을 위한 공통 검증 메트릭에는 혼동 행렬, 정밀도-재현율 곡선, ROC 곡선, 리프트 곡선 및 카파 통계가 포함됨

저자들은 또한 텐서와 그래프에 대한 개요 데이터 구조를 정의하여 적대적 기계 학습 특성을 도출할 수 있음

저자들의 관심사는 확률 분포 간의 유사성 검색 및 측정 학습을 지원하는 데이터 구조들임


4.3.4 Comparisons between Single Play Attacks and Multiple Play Attacks on Custom Loss

Functions 단일 플레이 공격과 다중 플레이 공격은 컴퓨터 비전, 자연어 처리 및 사이버 공간 보안에서 다차원 텍스트와 이미지 데이터, 시퀀스 데이터 및 공간 데이터에 존재함

이러한 문제들은 특성 조작, 오분류 비용 및 분포적 강인성을 맬웨어 분석, 개념 이동, 객체 탐지, 새로움 탐지, 이상 탐지, 이벤트 탐지, 불균형 분류, 분포 이동, 희귀 패턴 마이닝, 분포 외 예제 탐지, 구조화된 예측, 모티프 마이닝, 모델 오명세화 및 비정상적 특성 학습에서 연구함

저자들의 연구에서 게임 이론은 이러한 문제들에 대한 확률적 탐색 정책과 게임 이론적 최적값의 수렴 기준을 생성할 수 있으며, 사이버-물리 시스템의 계산 지능에서 필요한 대규모 강인한 최적화 알고리즘 설계에 적용 가능함

결과적으로 생성된 적대적 손실 함수와 훈련 절차는 딥러닝 배치 및 평가의 신뢰성 연구에 적용 가능함


4.3.5 Parallel Machines in Reduced Games

게임 이론적 적대적 딥러닝 모델 간의 비교에서는, 병렬 기계들이 축소된 게임에서 어떻게 활용되는지가 중점적으로 다루어짐

Cai 등은 두 플레이어 비영합 게임에서의 게임 이론적 평형을 논의하고, 이를 다중 플레이어 일반화로 확장함

민맥스 정리는 다중 플레이어 폴리매트릭스 제로섬 게임에 대해 증명됨

나쉬 평형은 선형 프로그래밍을 통해 찾아짐

폴리매트릭스 게임은 정점이 플레이어이고 관련 전략을 가지며, 간선은 두 플레이어 게임인 그래프로 정의됨

플레이어의 페이오프는 인접한 모든 게임에서의 페이오프의 합임

제로섬 폴리매트릭스 게임은 폐쇄된 페이오프 시스템을 나타냄

게임의 평형 전략은 모든 플레이어에 대한 후회 없는 플레이를 나타내는 맥스-민 전략임


4.4 Stochastic Games in Predictive Modeling

적대와 분류자 사이의 상호 작용은 스태켈버그 게임으로 모델링됨

여기에서 적의 역할은 정적인 데이터 생성기가 아니라 분류자를 회피하기 위한 고의적인 데이터 조작을 수행하는 지능적인 에이전트임

분류자 설계에서 적대적 회피를 고려하지 않으면 사기 탐지, 컴퓨터 침입 탐지, 웹 검색, 스팸 탐지 및 피싱 탐지 애플리케이션에서 보안 문제가 노출됨

분류자 가중치를 재학습하는 것은 적대적 공격이 재학습보다 저렴하고 빠르게 생성되기 때문에 강인한 분류에 대한 약한 해결책임

Li 등은 특성 교차 대체 공격을 제안하여 적대적 설정에서의 특성 축소의 한계를 이용하는 목적 지향적 적을 보여줌

적은 고정된 쿼리 예산과 고정된 비용 예산에 따라 분류자에게 쿼리할 수 있음

그런 다음 희소 정규화가 있는 적대적 회피 모델이 제시됨

분류자를 특성 공간이 아닌 특성 등가류에 기반하여 구성하는 것이 분류자의 회복력을 향상시키는 해결책으로 제안됨

또 다른 해결책은 분류자와 적 집단 간의 상호 작용에 대한 이중 레벨 스태켈버그 게임을 제안함

스태켈버그 게임은 제약 생성과 함께 혼합 정수 선형 프로그래밍을 통해 해결됨

Bianchi 등은 무작위 예측 문제에 대한 반복적인 게임을 제시함

순차적 예측의 문제는 정상 형태 게임에서 찾은 나쉬 평형의 프레임워크로 모델링됨

특정 민맥스 정리는 이플레이어 제로섬 게임을 분석하기 위해 논의됨

게임 이론적 학습 알고리즘을 분석하기 위해 실수 경계 프레임워크가 제공됨

Bruckner는 학습자가 예측 모델을 구축하고 적이 데이터 생성 과정을 제어하는 상호 작용을 모델링하기 위해 예측 게임을 제안함

예측 게임 프레임워크는 게임 이론적 플레이어의 이익, 행동, 지식 및 결정에 대한 명시적 모델을 허용함

그런 다음 나쉬 평형의 관점에서 예측 모델의 일반화 오류를 분석하여 비협력적인 이플레이어 정적 및 동적 스태켈버그 게임을 해


4.4.1 Computational Learning Theory Frameworks to Analyze Game Theoretical Learning Algorithms

컴퓨터 학습 이론 프레임워크를 게임 이론적 학습 알고리즘을 분석하는 데 사용함

Johnson 등은 조직, 경제 및 사회에서 “신뢰 게임”과 “투자 게임”을 사용하여 신뢰와 신뢰성의 행동 측정 분석을 수행함

신뢰가 증가하면 비용이 낮아져 효율성이 향상됨

신뢰할 수 있는 행동으로 인한 공유된 의지는 1인당 더 나은 경제 성과로 이어짐

집계된 신뢰는 효율적인 사법 시스템, 고품질 정부 관료제, 낮은 부패 및 더 큰 금융 발전으로 이어짐

다른 행동 모델에서는 공정성 선호도를 플레이어의 유틸리티에 통합함

이러한 이론에서는 기여가 불평등할 때 행동 차이에 대한 예측을 이끌어냄

신뢰 게임은 신뢰에 대한 긍정적인 수익률을 생산해야 하며, 이는 더 많은 교환을 용이하게 하는 복지 획득으로 간주됨

신뢰자는 상대방의 모든 가능한 행동에 반응하여 공정한 행동을 정의함

상대방은 적대적 환경에서 시뮬레이션된 상대방일 수 있음

모든 가능한 결과의 행동적 함의를 고려하는 과정은 플레이어의 게임 인식을 변경하고 데이터 기반 의사 결정으로 이어짐

플레이어 간의 익명성 보장이 제거되면 행동은 개인의 명성에 대한 우려, 과거 친절한 행동에 대한 상호 작용, 복수에 대한 두려움 등과 같은 요인에 의해 동기 부여됨

미래 교환 사이의 혜택 가능성은 상대방 플레이어의 행동으로부터 예상되는 페이오프 외에도 상대방에 대한 신뢰를 동기 부여함

신뢰와 신뢰성에 대한 기술통계는 신뢰 게임 페이오프의 보통 최소 제곱 회귀 사양을 따라 생성됨

이러한 평가 데이터에서 이상값과 적대적 분포는 매개변수 추정치에 큰 편향을 줌

적대적 조작 검사는 적대적 예시를 검증하여 신뢰 게임 페이오프를 지정하기 위해 시뮬레이션된 상대방과 인간 상대방을 구별해야 함

여기에서 게임 이론적 적대적 딥러닝 솔루션에서 발견된 적대적 강인함과 상호 작용 효과는 문화 내에 내재된 휴리스틱 의사 결정 전략과 엄지손가락의 규칙을 전략으로 신뢰하거나 불신하는 전략을 강화함


4.4.2 Game Theoretical Adversarial Deep Learning Algorithms in Information Warfare Applications

Pawlick 등은 유비쿼터스 및 웨어러블 컴퓨팅에서 사이버보안 및 개인 정보 보호를 위한 방어적 기만을 모델링하기 위해 게임 이론을 조사함

기만의 분류에는 혼란, 이동 대상 방어, 난독화, 혼합 허니-x, 공격자 참여가 포함됨

게임 이론 모델링을 위해 정보 구조, 에이전트 행동, 기만의 지속 시간을 분류함

기만 연구는 군사 애플리케이션, 심리학, 범죄학, 사이버보안, 경제 시장, 개인 정보 보호, 행동 과학 등에서 수행됨

이러한 기만은 사이버보안에서 한 당사자가 다른 당사자에게 알려지지 않은 정보를 가지고 있는 적대적 또는 전략적 상호 작용에서 일반적임

이러한 기만을 가진 공격 벡터는 사물 인터넷(IoT) 장치를 국내 사이버 무기로 전환할 잠재력을 가짐

사이버 공격은 전력망, 핵 원심분리기, 수문과 같은 중요 인프라에 물리적 영향을 줄 수 있게 고안될 수 있음

적들은 기만을 통해 정보 비대칭을 상쇄하는 정찰을 통해 타겟에 대한 정보를 얻음

게임 이론은 사이버보안 및 개인 정보 보호 게임에서 이러한 기만적 상호 작용을 합리적 에이전트 간의 전략적 충돌 및 협력으로 모델링함

각 플레이어는 다른 플레이어의 복지에 영향을 미치는 결정을 내림

게임 이론은 사이버 공간에서 방어적 기만의 본질적이고 이전 가능한 측면을 모델링할 수 있음

일회성 및 다중 상호 작용 게임은 각각 정적 및 동적 기만으로 이어짐

기만 기술에는 위장, 지연, 가짜, 위장, 허위 변명, 사회 공학이 포함됨

악의적 기만의 단계에는 커버 스토리 설계, 계획, 실행 및 모니터링이 포함됨

스태켈버그 게임, 나쉬 게임, 신호 게임은 두 플레이어 동적 상호 작용을 가진 가장 일반적인 게임 이론적 모델임

응용 분야에는 적대적 기계 학습, 침입 탐지 시스템, 통신 방해, 공항 보안이 포함됨


4.4.3 Game Theoretical Adversarial Deep Learning Algorithms in Cybersecurity Applications

사이버보안 애플리케이션에서 게임 이론적 적대적 딥러닝 알고리즘에 관한 저자들의 연구는 다음과 같이 진행됨

저자들의 게임 이론적 적대적 학습 프레임워크는 웹 및 모바일 앱에서 신뢰할 수 있는 기계 학습의 감지, 분류, 생성 및 최적화를 자동화할 수 있음

저자들의 적대적 조작에서 생성적 표현은 빅 데이터 애플리케이션 도메인에서 활성 및 수동 측정을 이용하는 보안 위협을 정량화할 수 있음

저자들은 게임 이론적 최적화 목적 함수에서 적의 악의적 활동을 모델링함

그런 다음 평형에서의 딥러닝 솔루션은 AI 플랫폼에서 사용 가능한 개인 정보의 정보 유출을 식별할 수 있음

딥러닝에서 손실 함수로 정보 유출을 모델링함으로써 적대적 설정을 게임 이론적 학습 프레임워크 내에서 공식화할 수 있음


4.5 Robust Game Theory in Adversarial Learning Games

게임 이론적 적대적 딥러닝 게임에서 강력한 게임 이론을 다룬 저자들의 연구는 다음과 같음

스태켈버그 게임에서 적대적 전략은 나쉬 균형을 정의하는 결정론적 문제 해결을 위해 모델링되고 해결됨

나쉬 균형의 해결 공간은 게임 플레이어의 수렴 기준에 대한 필요 및 충분 조건을 통해 표현됨

전형적인 수렴 기준에는 제로섬 게임 대 비제로섬 게임, 이플레이어 대 다중 플레이어 게임, 정적 게임 대 진화적 게임, 순차적 게임 대 연속 게임, 결정론적 게임 대 확률론적 게임이 포함됨

전형적인 플레이어 전략은 플레이어 쌍이 서로의 성능 기준을 알지 못하는 경우, 서로의 전략을 다른 속도로 계산하는 경우, 선형 및 비선형 지불 함수를 가지며 이는 불연속일 수도 있는 경우, 분산 제어 대 중앙 집중식 제어로 게임에 참여하는 경우를 고려함

이러한 게임에서 스태켈버그 전략과 나쉬 균형은 더 높은 차수의 행렬-리카티 미분 방정식 계수 행렬의 구조적 특성을 통해 분석됨

이러한 게임 이론적 지불 함수의 최적화는 비협력적 미분 게임에서 결정 문제로 자주 모델링되는 복잡한 최적화 이론 문제임

이러한 문제의 해결책은 파레토 최적, 나쉬 및 스태켈버그 균형 및 공동(협력적-경쟁적) 해결책으로 제시됨

리카티 미분 방정식은 또한 최적 제어 이론에서 미분 게임으로 분석됨

게임 이론적 플레이어가 제어 시스템의 상태를 관찰할 수 있다면, 나쉬 균형은 제어 시스템에 대한 오픈루프 해결책에 따라 계산됨

게임 이론적 플레이어가 피드백 전략을 고려할 수 없다면, 나쉬 균형은 제어 시스템에 대한 클로즈드루프 해결책에 따라 계산됨

동적 프로그래밍 원리는 게임 이론적 최적값을 찾는 계산 방법으로 사용됨

제어 시스템의 부분 미분 상태 방정식은 게임 이론적 상호 작용에서 확률론적 제어로 플레이어의 지불 함수에 추가될 수 있음

이때 게임 이론적 평형은 스태켈버그 리카티 미분 차이 및 대수 방정식을 해결하는 계수에 대한 필요 및 충분 조건에 의해 결정됨


4.5.1 Existence and Uniqueness of Game Theoretical Equilibrium Solutions

Nash 등의 원래 논문에서는 순수 전략을 가진 다인 게임에서 평형 솔루션 개념을 정의함

혼합 전략은 그 후 순수 전략에 대한 확률 분포가 됨

Nash 등은 연합 없이 비협조적 게임 이론을 논의함

각 플레이어는 다른 플레이어와의 커뮤니케이션 또는 협력 없이 독립적으로 행동함

그 후 평형 솔루션 개념은 두 플레이어 제로섬 게임에서의 것들을 일반화함

여러 솔루션 개념이 개발되어 게임 이론적 적대적 딥러닝에서 학습 가설을 만족시키는데, 이에는 기하학적 형태 솔루션과 평형 전략에 대한 모순 분석이 포함됨

적대적 지불 함수 사이의 전이성과 비교성도 실제 애플리케이션에서 게임 이론적 평형 솔루션을 대조하기 위한 탐구의 한 분야임

비협조적 게임의 동적 시스템은 협력 게임을 줄이기 위해 개발될 수 있으며, 협력 게임에서의 사전 플레이 협상이 비협조적 게임에서의 플레이가 되어 무한 게임에서 모든 플레이어의 지불을 설명함


4.5.2 Optimal Control Theory and Robust Game Theory

황 등은 사이버 물리적 및 인간 계층으로 분해 가능한 제어 시스템 설계를 위한 동적 게임을 묘사함

교차 계층 설계 문제는 중요 인프라에서 보안과 회복력 도전을 야기함

이러한 중요 인프라는 전기, 제조 및 교통과 같은 분야의 산업 제어 시스템에서 볼 수 있음

여기서 제어 시스템의 설계 관점은 물리적 계층에서 통합된 피드백 루프의 감지, 제어 및 식물 동역학을 취함

제어 설계 기법으로는 정보 불확실성, 물리적 교란 및 피드백 루프의 적대적 노이즈를 다루는 강인한 제어, 적응 제어 및 확률 제어가 있음

적대적 노이즈는 센서와 액추에이터 간의 통신 및 네트워킹 문제와 여러 분산 에이전트 간의 문제로 사이버 계층에서 볼 수 있음

반면에 인간 계층은 조정, 운영 계획 및 투자와 같은 감독 및 관리 문제에 관심이 있음

관리 문제에는 사회적 및 경제적 문제, 가격 책정 및 인센티브, 시장 규제 및 위험 분석이 포함됨

클라우드 활성화 자율 시스템에서 보안 서비스에 대한 서비스 계약은 게임 이론적 적대적 학습으로 설계된 유인 호환 공격 인식 사이버 보험 정책을 포함할 수 있음

적들은 제어 시스템의 공격 표면을 이용하여 자율 시스템, 예를 들어 자율 주행 차량의 제로 데이 취약점을 악용할 수 있음

게임 이론은 복잡한 시스템의 구성 요소 간의 전략적 상호 작용을 모델링하기 위한 프레임워크를 제공하여 적대적 환경에서 시스템 성능의 강인함, 보안 및 회복력 간의 트레이드오프를 정량화함

게임 이론적 프레임워크에서 안전하고 회복력 있는 제어 설계는 강인한 제어 설계에 대한 확장으로 간주됨

응용 분야에는 이기적 자율 시스템, 산업 제어 시스템을 위한 방어적 기만 게임, 사이버-물리 네트워크의 위험 관리가 포함됨

회복력 있는 제어 시스템의 목표는 적대적 공격과 시스템 고장으로 인해 강인함과 보안이 실패할 때 성능 보장 및 복구 메커니즘이 있는 것임

여기서 강인한 제어 시스템은 설계된 보안 기계 학습 패러다임으로 인해 불확실한 매개 변수와 교란을 견딜 수 있음

강인한 제어 시스템 설계에서 방어 메커니즘은 암호화, 탐지 솔루션 아키텍처 및 통신 프로토콜을 포함함


요약