Google은 블로그에 "확산 모델을 사용하여 고화질 이미징 만들기"라는 내부 두뇌 팀의 연구를 게시했습니다. 이 기사에서 연구원들은 품질 저하 없이 디지털 이미지를 확장하는 데 있어 이룬 새로운 발전에 대해 설명합니다.
Google 브레인 팀은 품질 저하 없이 저해상도 사진을 상세한 고해상도 이미지로 변환하는 기계 학습 모델을 훈련했습니다. 전문가들은 이들의 현상이 오래된 가족사진 개선부터 의료영상 품질 향상까지 다양한 용도로 활용될 수 있을 것으로 보고 있다.
확산 모델의 개념은 2015년부터 Google에서 연구해 왔지만 최근까지 검색 대기업은 AI 훈련 방법의 또 다른 계열인 심층 생성 모델을 선호했습니다. 회사는 새로운 접근 방식의 결과가 기존 기술보다 현저히 우수하다는 것을 발견했습니다.
새로운 접근 방식은 SR3으로 지정되었습니다. Google은 SR3가 원본 저해상도 이미지를 기반으로 순수한 노이즈에서 고해상도 이미지를 생성하는 초고해상도 확산 모델이라고 말합니다. 모델은 순수한 노이즈만 남을 때까지 이미지에 노이즈가 점진적으로 추가되는 이미지 왜곡 과정에서 학습됩니다. 그런 다음 알고리즘은 프로세스를 반대로 하여 원래의 저해상도 사진에 따라 이미지에서 점차적으로 노이즈를 제거합니다.
SR3는 인물 사진과 자연 사진을 스케일링할 때 가장 잘 작동하는 것으로 나타났습니다. 이 알고리즘을 사용하면 인물 사진의 해상도를 최대 16배까지 높이면서 사실적인 이미지를 얻을 수 있습니다.
Google은 SR3이 얼마나 효과적인지 확신한 후 조건부 클래스 확산 모델인 CDM이라는 또 다른 접근 방식을 사용했습니다. CDM은 1,400만 개 이상의 고해상도 이미지가 포함된 ImageNet의 데이터에 대해 학습됩니다. CDM은 먼저 저해상도 이미지를 생성한 다음 SR3가 점진적으로 가능한 가장 높은 해상도로 증가하는 고해상도 이미지를 생성하는 계단식 접근 방식을 제안합니다. 구글에 따르면 32×32픽셀 해상도의 이미지는 눈에 띄는 손실 없이 256×256픽셀로 8배 확대할 수 있다. 64 × 64 픽셀의 해상도를 가진 사진은 1024 × 1024 픽셀의 해상도로 16배로 완전히 확대되었습니다.
AI 작업의 결과는 정말 인상적입니다. 최종 이미지는 사소한 결함에도 불구하고 정말 좋아 보이며 대부분의 사용자가 원본 이미지로 인식합니다.
2021-08-31 19:38:15
작가: Vitalii Babkin