주메뉴바로가기 본문바로가기

비즈한국 BIZ.HANKOOK

전체메뉴
HOME > Target@Biz > 아젠다

[사이언스] 컴퓨터도 못 하는 은하 분류 작업을 해낸 것은?

방대한 관측 데이터 분류 문제, 온라인 '집단지성'으로 해결

2019.07.03(Wed) 11:50:34

[비즈한국] 소개팅 자리에 가서 처음으로 상대방을 만나 인사를 나눈다. 아직 대화를 충분히 나누기 전, 두 사람은 서로의 외모와 옷차림새를 먼저 보게 된다. 단 1초도 안 되는 아주 짧은 순간 대략적인 ‘스캔’을 통해 상대의 외모, 패션 센스에 나름의 점수를 매긴다. 그리고 그 기본 점수를 바탕으로 대화를 통해 조금씩 점수를 채워나간다. 

 

천문학자들도 관측한 은하의 데이터를 처음 마주할 때 바로 이런 순간을 경험한다. 은하의 데이터를 처음 확인하는 순간 눈에 들어오는 것은 은하의 다양한 외모다. 따라서 관측 데이터를 손에 쥐고 가장 먼저 할 수 있는 분석은 은하의 외모에 따라 은하를 분류하는 일이다. 동물이나 암석을 연구하는 생물학자/지질학자들이 가장 먼저 그 동물/암석의 겉모습, 생김새에 따라 기본적인 분류 작업을 하는 것과 같다. 

 

이런 은하의 형태, 외모를 모폴로지(Morphology)라고 부른다. 은하를 관측하면 가장 먼저 하는 작업이 바로 그 은하들의 모폴로지에 따라 은하를 분류하는 작업이다. 

 

은하의 겉모습은 가장 먼저 파악할 수 있는 가장 기본적인 특징이다. 하지만 오늘날 천문학자들은 너무나 많은 데이터를 분석해야 한다. 이 많은 은하의 다양한 외모를 효율적이고 정확하게 평가할 방법은 없을까? 이미지=Zsolt Frei, Institute of Physics, Eötvös University, Budapest


20세기 초반까지만 해도 천문학자들은 우리 은하가 우주의 전부라고 생각했다. 하지만 천문학자 에드윈 허블(Edwin Hubble)은 가을 밤하늘에 보이는 뿌연 안드로메다 ‘성운’까지의 거리를 측정하면서 사실 안드로메다가 우리 은하에 속한 작은 가스 구름이 아니라 완전히 멀리 떨어져 있는 별개의 은하계라는 것을 처음 알아냈다. 

 

허블의 발견 이전까지는 은하를 의미하는 갤럭시(galaxy)라는 말이 단순히 우리 은하로 대변되는 우주 전체를 지칭하는 말이었다. 하지만 허블의 발견 이후 갤럭시라는 말은 이제 우리 은하를 포함해 우주 곳곳에 떠 있는 다양한 은하를 모두 아우르는 말로 의미가 바뀌었다. 이제 안드로메다는 성운이라고 부르지 않는다. 안드로메다은하라고 부른다. 허블의 발견과 함께 비로소 은하를 우주의 기본 단위로서 연구하는 은하 천문학이 시작된 것이다. 

 

이후 허블은 다양한 은하를 관측한 후 겉모습에 따라 분류하는 작업을 시작했다. 어떤 은하는 단순히 거대한 주먹밥처럼 별들이 둥글게 모여 있다. 이런 은하를 타원 은하(Elliptical galaxy)라고 부른다. 허블은 타원 은하들을 다시 그 모습이 둥근 정도에 따라 세부적으로 분류했다. 아주 동그란 타원 은하부터 조금 찌그러져 긴 타원 모양을 한 타원 은하로 나누었다. 타원 은하는 E로 표기하며 그 뒤에 타원 은하가 둥근 정도에 따라 0부터 7까지 숫자로 표현한다. 

 

어떤 은하들은 납작한 원반 형태로 별들이 모여 있다. 보통 이런 은하들은 원반상에 별들이 독특한 나선 형태의 패턴을 그리며 돌고 있다. 그래서 이런 은하들은 원반 은하(Disk galaxy) 또는 나선 은하(Spiral galaxy)라고 부른다. 

 

나선 은하들은 두 가지로 구분된다. 중심부에 뚜렷한 긴 막대 형태의 구조가 있으면 막대 나선 은하(Barred spiral galaxy)로 따로 분류한다. 허블은 나선 은하의 나선팔이 얼마나 팽팽하게 휘감겨 있는지 그 정도에 따라 세부적으로 분류했다. 나선팔이 아주 팽팽하게 안쪽으로 꼬여 있는 경우부터 비교적 느슨하게 풀려 있는 경우로 나누어 나선 은하와 막대 나선 은하를 더 나누었다. 

 

허블은 1926년 은하를 겉모습에 따라 분류한 일종의 가이드라인을 제시했다. 처음으로 은하들의 모폴로지에 따른 분류를 시도한 것이다. 허블의 분류에 따르면 아주 동그란 타원 은하(E0 은하)에서 시작해 서서히 모양이 찌그러지면서 가장 많이 찌그러진 타원 은하(E7)로 간다. 타원 은하를 넘어가면 너무 많이 찌그러져서 타원 은하라기에도 애매하고 그렇다고 뚜렷한 나선팔이 있는 것도 아니어서 나선 은하라 하기에도 애매한 은하(S0)를 만나게 된다. 이런 은하들은 렌즈형 은하(Lenticular galaxy)라고 부른다. 

 

허블이 제시한 기준에 따라 관측된 실제 은하의 이미지를 분류한 모습. 타원 은하에서 시작해 나선 은하와 막대 나선 은하로 나뉜다. 이러한 형태를 허블의 소리굽쇠 분류법이라고 한다. 이미지=Karen Masters, Sloan Digital Sky Survey

 

렌즈형 은하(S0)를 넘어가면 두 갈래로 갈라진다. 한쪽은 중심에 뚜렷한 막대 구조가 없는 일반적인 나선 은하(S)이고, 다른 한쪽은 중심에 뚜렷한 막대 구조가 보이는 막대 나선 은하(SB)다. 일반적인 나선 은하와 막대 나선 은하 모두 중심에서부터 나선팔이 휘감겨 있는 정도에 따라 세부적으로 나뉜다. 나선팔이 강하게 꼬여 있는 a타입에서 시작해 나선팔이 느슨해지면서 b, c, d타입으로 분류된다. 이외에 타원 은하도 나선 은하도 아닌, 애매모호한 이상한 모양을 한 작은 은하들은 불규칙 은하(Irregular galaxy)로 분류하기도 한다. 

 

이렇게 허블이 처음 제시한 은하들의 모폴로지에 따른 기본적인 분류를 보면 마치 한 갈래에서 시작해 두 갈래로 나뉘는 소리굽쇠와 같은 모양을 하고 있다. 그래서 허블이 처음 제시했던 은하들의 외모에 따른 이러한 분류 방식을 ‘허블의 소리굽쇠(Hubble‘s tuning fork)’ 또는 ‘허블 시퀀스(Hubble sequence)’라고 한다. 

 

재미있는 점은 단순히 겉모습만 보고 분류한 은하들이 외모 이외에도 아주 분명한 차이를 갖고 있다는 점이다. 관상가들이 사람들의 얼굴만 보고 그 사람의 인생을 파악하듯, 은하도 겉모습만 보고 은하의 대략적인 진화 역사를 추측할 수 있다. 

 

타원 은하들은 보통 나선 은하에 비해 더 나이가 많고 온도가 미지근한 별들을 더 많이 갖고 있다. 그래서 비교적 색깔이 붉다. 반면 나선 은하들은 타원 은하에 비해 새로운 별을 만들 수 있는 재료인 가스 물질이 아주 풍부하다. 여전히 활발하게 새로운 뜨겁고 무거운 어린 별들이 왕성하게 탄생한다. 그래서 나선 은하들은 온도가 더 높은 푸른빛을 많이 띤다. 

 

놀랍게도 은하들도 어떤 삶을 살아왔는지에 따라 외모가 달라진다. 따라서 은하들의 모폴로지를 분류했을 때 은하들의 형태가 타원에서 나선으로 또는 나선에서 타원으로 서서히 변화하는 것이 아닐까 의심하는 것은 당연하다. 

 

1926년 당시 허블은 자신이 그린 소리굽쇠 형태의 분류를 보고 은하들이 둥근 타원 은하의 모습으로 시작해 서서히 납작해지다가 나중에는 나선팔을 갖고 나선팔이 서서히 느슨하게 풀어지는 형태로 변화한다고 생각했다. 그래서 당시 천문학자들은 둥근 타원 은하가 은하 진화의 초반이라고 생각해서 조기형 은하(Early-type galaxy)라고 불렀고, 나선팔을 갖고 있는 나선 은하가 진화의 후반기의 모습이라고 생각해서 나선 은하를 만기형 은하(Late-type galaxy)라고 불렀다. 

 

사실 이러한 허블의 생각은 잘못되었다. 현재 우리가 알고 있는 은하들의 진화 방식에 따르면 은하들의 모폴로지는 주로 은하들끼리 격렬한 스킨십을 나눌 때 많이 벌어진다. 특히 거대한 나선 은하 두 개가 강하게 충돌하면 결국 각 은하가 갖고 있던 별들이 한데 모여서 하나의 거대한 은하로 병합한다. 각 나선 은하가 갖고 있던 나선팔의 형태는 모두 으스러지고 단순히 둥글게 뭉쳐 있는 커다란 타원 은하가 된다. 

 

허블의 초창기 기대와 달리 사실 은하는 독립적으로 혼자 진화(secular evolution)를 하는 경우보다는 다른 은하와의 다양한 상호작용을 통해 진화하는 경우가 더 많다. 특히 주로 나선 은하들이 충돌하고 병합하면서 타원 은하로 형태가 진화하는 경우를 많이 볼 수 있다. 이미지=Debra Meloy Elmegreen(Vassar College) et al., & the Hubble Heritage Team(AURA/STScI/NASA)

  

실제로 은하가 여러 개 모여 있는 은하단 환경을 확인해보면 중심부와 외곽에 있는 은하들의 외모가 확연히 다르다. 은하단 중심에는 은하들이 많이 모여 있어서 은하 밀도가 아주 높다. 은하들 간의 충돌도 빈번하게 벌어진다. 그래서 많은 은하단이 그 중심에 빈번한 충돌로 성장하면서 만들어진 아주 거대한 거대 타원 은하(Giant Elliptical galaxy)를 갖고 있다. 그리고 중심부 근처에는 작은 나선 은하들이 병합되어 만들어진 다양한 타원 은하들이 있다. 

 

반면 은하 밀도가 낮은 은하단 외곽으로 가면 아직 격렬한 병합과 충돌을 겪지 않고 잘 살아남아 있는 다양한 나선 은하들을 만날 수 있다. 실제로 은하들의 모폴로지에 따라 은하단 중심에서부터 멀어지면서 어떤 은하들이 주로 분포하는지를 비교해보면 은하단 중심부에는 타원 은하가 많고 외곽에는 나선 은하들이 많이 분포한다. 

 

그래프의 가로축은 은하단 환경에서의 은하 밀도를, 세로축은 은하들의 분포 수를 나타낸다. 붉은 선은 타원 은하의 분포, 파란 선은 나선 은하의 분포를 의미한다. 은하단 중심부로 가면서 은하 밀도가 올라가면 타원 은하의 빈도가 확연히 증가한다. 반대로 은하 밀도가 적은 은하단 외곽으로 나가면 나선 은하의 빈도가 증가하는 것을 확인할 수 있다. 출처=http://adsabs.harvard.edu/abs/1980ApJ...236..351D

 

은하들의 모폴로지는 허블의 생각과 정반대로 진화하는 셈이다. 마치 둥근 올챙이에 다리가 생겨서 개구리가 되는 것처럼 둥근 타원 은하에서 나선팔이 자라나서 나선 은하로 진화하는 것이 아니다. 그 반대로 나선 은하로 태어난 작고 가벼운 은하들이 서서히 덩치를 키워가다가 격렬한 병합과 충돌을 거치면 더 거대한 타원 은하로 진화하는 것이다. 그래서 엄밀하게 따지면 은하 천문학 태동기에 지어진 조기형/만기형 은하라는 명칭은 잘못되었다. 하지만 오래전부터 관용적으로 써오던 용어라 바꾸기가 쉽지 않다. 

 

그래서 오늘날의 천문학자들은 혼란을 피하기 위해 타원 은하는 아주 오래전 우주 초기에 만들어진 늙은 은하라는 뜻의 조기형 은하로, 나선 은하는 비교적 최근에 뒤늦게 만들어진 젊은 은하라는 뜻의 만기형 은하로 재해석해서 받아들이고 있다. 

 

이처럼 은하의 겉모습으로만 분류하는 모폴로지 연구는 단순히 은하의 생김새뿐 아니라 그렇게 되기까지 각 은하가 거쳤을 인생사를 추적할 수 있게 해준다. 은하들의 겉모습만 보고 분류한다는 것은 어찌 보면 아주 단순한 작업처럼 보이지만 은하들에 대한 기본적인 연구를 진행하기 위해 반드시 거쳐야 하는 아주 중요한 작업이다. 

 

그런데 아주 많은 망원경으로 우주 전역을 관측하면서 방대한 데이터가 쏟아지기 시작하자 천문학자들은 행복하지만 난감한 고민에 빠졌다. 은하들의 관측 데이터가 그리 많지 않던 초창기에는 천문학자들이 일일이 은하들의 모폴로지를 분류해도 충분했다. 하지만 이제는 한꺼번에 수십만, 수백만 개의 은하들을 다루어야 한다. 이 은하들을 천문학자 개인이 하나하나 다 확인해서 분류한다면 정말 눈이 빠져버릴지도 모른다. 

 

컴퓨터가 대신해주면 되지 않을까? 기계가 과일이나 동전을 자동으로 분류하는 것처럼 말이다. 하지만 안타깝게도 이는 어려운 문제다. 컴퓨터는 아직 사람만큼 분명하게 외모를 평가할 줄 모른다.[1][2] 

 

컴퓨터가 인간의 능력을 따라잡기에는 한참 먼 영역이 있다. 바로 이미지의 특징을 찾고 구분하는 능력이다. 컴퓨터에게 고양이 사진을 보여주고 분석을 시키면 컴퓨터는 그 사진 속 고양이의 털색이 정확히 어떤 색인지, 노란색과 하얀색이 정확히 몇 퍼센트로 섞여 있는지, 고양이의 크기는 정확히 몇 센티미터인지 등 다양한 수치를 알려줄 수 있다. 그러나 똑같이 노란 고양이 사진과 고양이 인형 사진을 보여주면 둘 중 어떤 것이 인형이고 어떤 것이 살아 있는 고양이인지 분간하지 못한다. 

 

숫자로 번역된 세상에만 익숙한 컴퓨터는 숫자로 쉽게 번역할 수 없는 이미지 데이터를 분간하는 능력이 아직 없다. 천문학 분야에서는 굉장히 치명적인 약점이다. 천문학 연구는 밤하늘을 관측하는 것에서 시작한다. 아무리 뛰어난 광학 기기로 선명하고 세밀한 이미지를 얻어도, 컴퓨터가 그 이미지를 정확하게 분석할 수 없다면 아무 의미가 없다. 

 

그렇다면 천문학자들은 어떻게 이 문제를 해결할 수 있을까? 이미지 문맹인 컴퓨터 때문에 고민하는 다른 분야가 개발한 해결 방안에서 힌트를 얻을 수 있다.[3] 

 

최근에는 인공지능의 머신 러닝 등 다양한 기술이 개발되면서 은하의 모폴로지에 따른 다양한 은하들의 물리량 차이를 확인하고 이를 기준으로 컴퓨터가 직접 은하를 분류하거나 아예 이미지 자체를 해석해서 인공지능으로 은하를 분류하는 시도가 이어지고 있다. 이미지=Greg Snyder & the Illustris Collaboration


최근 시뮬레이션 성능과 해상도가 아주 좋아지면서 실제 관측되는 것과 비슷한 수준으로 은하들의 세부적인 외모를 재현해내는 수준에 이르렀다. 최근 천문학자들은 이렇게 재현한 가상의 은하들로 컴퓨터 인공지능을 훈련시켜서 실제 은하 모폴로지를 분류하는 작업을 할 수 있도록 연습하고 있다. 이미지=Mark Vogelsberger(MIT)


컴퓨터가 읽지 못하는 오래된 문서의 글자를 사용자가 직접 (자신도 모르게) 번역해주는 캡차 프로그램. ​

  

컴퓨터는 밤하늘의 별뿐 아니라 고대 서적을 디지털 자료로 옮기는 작업에서도 제 역할을 하기 어렵다. 컴퓨터가 옛날 사람들이 잉크로 휘갈겨 쓴 울퉁불퉁한 글씨들을 쉽게 알아보지 못하기 때문이다. 이 문제를 해결하기 위해 컴퓨터 공학자 루이스 폰 안은 기발한 아이디어를 하나 냈다. 컴퓨터가 알아보지 못하는 글씨 이미지들을 직접 사람에게 물어보는 것. 캡차(CAPTCHA) 프로그램은 이렇게 개발되었다. 

 

우리가 어떤 사이트에 회원으로 가입하려면 회원 가입 과정에서 ‘자동 가입 방지’를 위해 이상하게 쓰인 글씨를 보고 입력창에 입력하게 된다. 고대 서적에서 발췌한 그 글씨 이미지는 컴퓨터가 읽지 못하는 것이다. 우리가 사이트에 회원 가입을 하는 잉여 시간이 고대 서적 연구를 위해 책을 디지털화하는 훌륭한 작업에 쓰이는 것이다. 

 

천문학자들 역시 캡차 프로그램과 비슷한 아이디어를 내놓았다. 그 대표적인 예가 바로 은하 동물원, 갤럭시 주(Galaxy Zoo) 프로젝트다.[4]

 

천문학자들이 갤럭시 주 프로젝트를 통해 분류한 은하들 중에서 영어 알파벳과 비슷한 모양을 한 은하들을 골라냈다. 메시지를 직접 그 알파벳에 맞는 은하로 옮겨주는 서비스를 제공한다. 이 이미지는 비즈한국(bizhankook)을 은하로 표현한 것. 누구나 직접 은하 메시지를 써볼 수 있다. 출처=http://writing.galaxyzoo.org/

  

천문학자들은 망원경으로 관측한 은하 이미지들을 온라인에 공유해 천문학에 관심 있는 불특정 다수의 사람들이 그 이미지를 직접 보고 분류할 수 있게 했다. 사람들은 이미지를 보며 각각의 은하가 원반 은하인지, 타원 은하인지 아니면 불규칙 은하인지 등을 구분하고 각 은하에 시각적인 독특한 특징이 있는지 등을 분석한다.

 

처음 갤럭시 주 프로젝트가 소개되었을 때, 많은 천문학자들은 회의적이었다. 훈련 받지 않은 비전공자들의 분류는 정확하지 않을 것이고, 지루한 분류 작업에 기꺼이 시간을 내는 이상한 사람은 아주 적을 것이라고 생각했다. 

 

그러나 세계 곳곳의 ‘잉여 킹’들의 참여로 갤럭시 주 프로젝트는 엄청난 성공을 거두고 있다. 누군가는 화장실에서, 누군가는 출퇴근길 버스 안에서 자신의 소중한 시간을 현대 천문학을 위해 기꺼이 쓰고 있다. 게다가 은하 분류 작업의 퀄리티를 분석한 결과, 오히려 천문학자들보다 의사나 화가들이 더 정확하게 은하를 분류한다는 흥미로운 통계 결과도 나왔다. 그들이 복잡하고 다양한 이미지를 보는 전문가여서인지도 모른다. 원기옥을 모으는 손오공이 “지구인들아 모두 힘을 줘!”를 외치듯, 갤럭시 주가 현대 천문학의 한 획을 긋게 된 이유도 사람들 덕분이다.[5][6] 

 

갤럭시 주 프로젝트를 확장해 주니버스 프로젝트 홈페이지 화면. 다양한 시민 과학자들의 도움을 받아 진행하고 있다. 들어가서 다양한 연구 프로젝트에 직접 참여해보자.

 

현재 갤럭시 주 프로젝트를 계승해서 더 다양한 분야의 과학 연구에 시민 과학자들의 도움을 받고 있다. 주니버스 프로젝트(https://www.zooniverse.org/projects)에서는 천문학뿐 아니라 생물학 지질학 등 다양한 분야의 연구 데이터를 누구나 직접 분류하고 확인할 수 있다. 어쩌면 과학자들이 미처 확인하지 못한 흥미로운 모습을 새로 발견하고 과학 교과서에 당신의 이름을 직접 남길 수 있을지도 모른다! 도전해보자! 

 

[1] https://iopscience.iop.org/article/10.1086/339036

[2] https://ui.adsabs.harvard.edu/abs/2019arXiv190402906L/abstract

[3] https://link.springer.com/article/10.1007/s10686-017-9524-7

[4] https://data.galaxyzoo.org/

[5] https://academic.oup.com/mnras/article/464/4/4176/2527878

[6] https://academic.oup.com/mnras/article/435/4/2835/1022913

 

필자 지웅배는? 고양이와 우주를 사랑한다. 어린 시절 ‘은하철도 999’를 보고 우주의 아름다움을 알리겠다는 꿈을 갖게 되었다. 현재 연세대학교 은하진화연구센터 및 근우주론연구실에서 은하들의 상호작용을 통한 진화를 연구하며, 강연과 집필 등 다양한 과학 커뮤니케이션 활동을 하고 있다. ‘썸 타는 천문대’, ‘하루 종일 우주 생각’, ‘별, 빛의 과학’ 등의 책을 썼다.

지웅배 과학칼럼니스트 writer@bizhankook.com


[핫클릭]

· [사이언스] 인류는 외계 생명체를 만날 수 있을까
· [사이언스] 무엇이 우리 우주를 춤추게 하는가
· [사이언스] 작거나 혹은 아주 크거나, 우주는 '극단적'이야
· [사이언스] 우주에도 '해파리'가 있다?!
· [사이언스] 100년 전 '상대성 이론' 검증하려 천문학자들이 한 일


<저작권자 ⓒ 비즈한국 무단전재 및 재배포 금지>