본문 바로가기
과학의 발견

양자 컴퓨터는 숫자를 쓰는 데 도움이 된다

by pang-g 2022. 12. 16.

양자 회로와 쌍을 이루는 고전적인 신경망은 설득력 있게 손으로 쓴 것처럼 보이는 숫자를 생성한다.

 

양자 컴퓨터가 실용화되기 전에, 그들은 더 많은 큐비트, 더 낮은 오류율, 그리고 더 효과적인 오류 완화 전략이 필요할 것이다. 한편, 산업 및 학술 연구자들은 현재의 양자 컴퓨팅 능력이 어떻게 기존 컴퓨터의 문제 해결을 강화할 수 있는지를 조사하고 있다(예를 들어, "양자 컴퓨터 모델 화학 반응", Physics Today online, 2020년 9월 8일 참조). 양자 컴퓨팅 단계를 추가하면 어떤 종류의 작업이 이득이 될까? 양자 소프트웨어 회사인 Zapata Computing의 Alejandro Perdomo-Ortiz와 그의 동료들의 연구는 기계 학습의 과제가 유망한 후보일 수 있다는 새로운 증거를 제공한다.

신경망은 패턴을 인식하는 작업이 가장 많이 할당되지만 텍스트, 이미지, 음악, 비디오 등을 생성하는 데 사용하는 것을 목표로 하는 작업이 증가하고 있다. 소위 생성 신경망이라고 불리는 현재의 최고의 아키텍처는 생성기와 판별기 하위 네트워크를 사용하는 적대적 네트워크로 알려진 것이다. 생성기는 훈련 데이터를 모방하려고 하고, 판별기는 어떤 이미지가 네트워크에서 생성된 가짜이고 어떤 이미지가 실제 훈련 데이터인지 가려내려고 한다. 두 하위 네트워크가 서로를 능가하려고 노력함에 따라, 그들은 가짜를 생산하고 발견하는 데 더 능숙해진다. 적대적 네트워크에는 잠재적인 함정이 없는 것은 아니다. 그러한 장애물 중 하나는 모드 붕괴라고 불리는 현상이다. 예를 들어, 네트워크는 기계 학습의 일반적인 벤치마크 작업인 손으로 쓴 것과 설득력 있게 보이는 숫자를 생성하려고 노력하고 있습니다. 만약 판별기가 초기에 숫자 "0"을 실제로 간주하는 훈련을 약간 선호했다면, 생성기는 그 약점을 포착하고 0에서 9까지의 숫자의 전체 범위가 아닌 0만 출력할 수 있었다. 이러한 0의 품질과 해상도는 시간이 지남에 따라 향상될 것이지만, 네트워크는 진정으로 의도된 것을 수행하지 않을 것이다. 대안적으로, 네트워크는 꾸준히 개선되기보다는 훈련 과정에서 생산하는 것에서 계속해서 큰 차이를 보일 수 있다.
이러한 훈련 문제는 부분적으로 발전기에 공급되는 초기 확률 분포의 선택 때문이다. 양자 컴퓨터는 훈련 과정을 안정화하고 그러한 문제를 피할 수 있는 방법을 제공할 수 있다. 이 아이디어를 테스트하기 위해 페르도모 오르티즈와 그의 동료들은 고전적인 적대적 네트워크와 고전적인 양자 적대적 네트워크가 손으로 쓴 것처럼 보이는 숫자를 생성하는 것과 어떻게 일치하는지 비교했다. 두 시스템 모두 60,000개의 손으로 쓴 숫자의 표준 풀에서 훈련되었다.

고전-양자의 경우, 일반적인 생성기와 판별기 하위 네트워크 외에도 8비트 양자 회로는 판별기의 일부에서 어떤 노드가 작동하는지 측정하고 나타낸다. 그런 다음 각 훈련 라운드 전에 초기 확률 분포로 해당 정보가 생성기에 입력된다. 왜 양자 회로를 사용합니까? 주로 고전적인 네트워크가 자체적으로 훈련될 때 접근할 수 없는 확률 분포를 나타낼 수 있기 때문이다. 현재 양자 컴퓨터에서 사용할 수 있는 큐비트의 제한된 수에 대처하기 위해, 연구자들은 기존 회로에서는 불가능한 기능인 여러 베이스에서 큐비트의 상태를 측정했고, 이에 따라 각 큐비트에 저장될 수 있는 정보를 증가시켰다. 양자 지원 네트워크는 이미지에 표시된 설득력 있는 손으로 쓴 숫자를 생성하며, 눈으로 볼 때 고전적인 네트워크와 거의 비슷하게 보이지만, 약간 능가합니다. 양자 지원 구현의 경우 숫자의 품질과 다양성을 정량화하는 시작 점수는 고전적인 적대 네트워크의 경우 약 9.20점에 비해 약 9.36점으로 완벽한 10점에 가깝다.

양자 회로의 추가는 또한 훈련을 더 견고하게 만든다. 훈련 매개 변수가 불리할 때 시작 점수는 시간이 지남에 따라 많이 감소하지 않았다. 하지만 그것은 시간과 돈의 대가를 치르게 된다. 양자 회로는 자체 추가 단계에서 액세스하고 훈련해야 합니다. 그럼에도 불구하고, 그러한 단점들은 가치가 있거나 심지어 고전적인 컴퓨터가 합리적으로 다루기에는 너무 복잡한 데이터 세트에 필요할 것이다.

반응형

댓글