[사이언스] 제임스 웹 관측 데이터에 오류가 있다고? 팩트체크 해봤다!

[비즈한국] 얼마 전 제임스 웹 우주 망원경의 외계행성 직찍 이야기를 소개했다. 그런데 적지 않은 사람들이 뜻밖의 흥미로운 반응을 남겼다. “제임스 웹 관측이 잘못됐다는 발표가 있던데? 어떻게 되는 건가요? 이제 제임스 웹 망한 거 아닌가요?”

이건 또 무슨 신박한 헛소리인가. 사람들의 반응을 타고 거슬러 올라간 끝에 최근 일부 과학 유튜버들 사이에서 제임스 웹 관측 데이터에 문제가 있다는 식의 이야기가 흘러나오는 걸 발견했다. 대부분은 최근 ‘네이처 아스트로노미’에 게재된 한 논문을 인용한 것처럼 주장했지만, 논문 내용을 제대로 이해하고 콘텐츠를 만든 건지 심히 염려되는 이야기가 많았다.

결론부터 말하자면 제임스 웹의 관측 데이터에는 아무런 문제가 없다. 오히려 이 논문은 제임스 웹 데이터가 과할 정도로 퀄리티가 정밀하다고 이야기하고 있다. 적지 않은 사람들이 낚이고 호도당하고 있는 제임스 웹 관측 데이터와 관련된 헛소문에 대해 긴급 진단을 해보고자 한다.

최근 일부 유튜버와 커뮤니티를 통해 확산되고 있는 제임스 웹 데이터에 오류가 있다는 괴소문을 진단해본다.

일단 최근 제시된 논문의 주장을 제대로 이해하기 위해서는 천문학자들의 실제 관측 데이터를 다루는 과정이 어떻게 진행되는지 이해할 필요가 있다. 천문학에서 관측을 한다는 것, 그 관측 데이터를 분석한다는 건 정확히 무엇을 의미할까?

먼 천체에서 다양한 정보를 가진 빛이 날아온다. 하지만 그 빛이 날아오는 동안 다양한 방해요소를 거치게 된다. 시야를 가로막는 가스 구름과 지구의 대기권은 원래의 빛 정보를 일부 갉아먹는다. 심지어 망원경 광학 기기와 센서 자체의 한계로 인해서 망원경에 도달한 빛 정보 역시 100% 온전하게 보지 못한다. 그래서 천문학자들은 망원경 검출기에 최종적으로 도달한 제한된 일부 정보만 가지고 원래 천체에서 출발했을 때의 빛이 실제 어땠을지를 추정해야 한다. 천문학에서 관측 데이터를 다룬다는 것은 천체에서 망원경 검출기까지 빛이 날아오는 동안 발생한 여러 방해 요소와 손실을 고려해 거꾸로 원래 천체의 빛을 복원하는 과정이라 볼 수 있다.

특히 이런 과정은 단순히 빛을 모아서 전체 에너지를 측정하는 측광보다, 파장에 따른 에너지의 분포, 즉 스펙트럼을 비교하는 분광 관측에서 더 까다롭다. 그래서 보통 분광 관측은 측광에 비해 훨씬 시간과 비용이 많이 든다. 이는 제임스 웹에서도 마찬가지다. 그렇다고 해서 분광 관측을 포기할 수는 없다. 단순한 측광만으로는 확인하기 어려운 여러 화학 성분의 흔적을 자세하게 볼 수 있기 때문이다.

그런데 분광 관측에서 확인하는 스펙트럼은 동시에 다양한 변수의 영향을 받는다. 천체의 온도와 화학 성분의 종류, 함량뿐 아니라 그 천체가 얼마나 빠르게 움직이고 자전하는지, 중력이 얼마나 강한지 등 정말 셀 수 없이 많은 다양한 변수에 의해 결정되는 값이다. 즉 다중 변수(Multiple parameter)로 좌지우지되는 복잡한 함수의 결과라는 뜻이다.

천문학자들은 관측으로 확인할 수 있는 아주 제한된 데이터 포인트 몇 개만 가지고 원래 빛의 스펙트럼이 어떠했을지를 유추해야 한다. 게다가 한꺼번에 다양한 변수에 의해 결정되는 스펙트럼을 말이다. 그래서 천문학자들은 변수를 이리저리 모두 미세하게 바꿔보면서 다양한 스펙트럼 샘플들을 만든다. 그리고 관측된 데이터에 가장 잘 들어맞는 값을 찾는 방식으로 원래 빛의 모습을 유추한다.

다양한 온도, 화학 조성과 함량 등 여러 변수를 다양하게 맞춰놓고 여러 샘플을 만든다. 이를 실제 관측 데이터에 맞춰 비교하면서 통계적인 차이가 가장 적은 경우를 찾는다. 여러 변수로 결과가 달라지는 데이터에서 이 방법을 특히 많이 사용한다. 이를 카이스퀘어 테스트라고 부른다.

비유하자면 이렇다. 심시티 캐릭터를 취향에 맞게 바꾼다고 해보자. 피부색, 눈 크기, 눈썹 간격, 여러 변수를 이리저리 바꿔서 캐릭터를 하나 만들었다. 당신이 각 변수를 어떻게 조절했는지 전혀 모르는 친구가 이제 그 결과만 보고 각 변수의 값을 맞혀야 한다. 그런데 친구에게 캐릭터 이미지를 보내는 과정에서 일부 손실이 발생했다. 결국 친구는 일부 깨진 캐릭터 이미지만 보고 각 변수를 맞혀야 한다. 친구는 직접 변수 하나하나를 바꿔보면서 다양한 캐릭터 샘플을 만든다. 그렇게 만든 다양한 샘플을 당신이 보낸 깨진 이미지와 비교하면서 가장 차이가 적은 걸 찾아낸다. 천문학자들이 관측된 데이터를 보고 원래 천체의 전체 스펙트럼 형태를 유추하는 과정이 바로 이와 같다.

수학에서 관측 데이터와 샘플 데이터의 통계적인 차이를 카이스퀘어(chi-square, χ2)라고 부른다. 이 카이스퀘어 값을 최소화하는 사례가 정답에 근접한다고 볼 수 있다. 천문학뿐 아니라 다양한 데이터를 다루는 여러 과학 분야에서도 이 같은 방식으로 정답을 추정한다. 특히 많은 수의 변수에 의해서 결과가 달라지는 데이터일수록 더욱 정교한 분석 툴이 필요하다. 천문학에선 분광 관측으로 얻는 스펙트럼이 대표적이다.

제임스 웹은 별 앞을 가리고 지나간 외계행성의 대기권 성분을 분석한다. 그런데 이 별빛 스펙트럼은 아주 다양한 변수의 영향을 동시에 받는 복잡한 함수다. 사진=NASA, ESA, CSA, STScI, Joseph Olmsted(STScI)

제임스 웹은 별 앞으로 외계행성이 가리고 지나갈 때 그 외계행성의 대기권을 통과한 별빛을 관측한다. 이때 외계행성 대기권 성분에 의해 별빛의 스펙트럼에 흔적이 남는다. 제임스 웹은 이를 분석해서 외계행성 대기에 물이 있는지, 산소가 있는지, 생명이 살기 위해 필요한 성분들이 얼마나 많이 존재하는지를 분석한다. 그런데 이 스펙트럼은 앞서 이야기했듯 동시에 너무나 많은 변수에 의해 결정되다 보니 어떤 분석 툴로 분석하는지에 따라 조금씩 다른 결과가 도출될 수 있다. 어떤 툴은 천체의 온도를 정확히 유추하는 데 특화되어 상대적으로 화학 성분 함량이나 중력 등 다른 변수를 덜 정확하게 맞출 수 있다. 또 다른 툴은 화학 성분은 정확히 유추하지만 천체의 온도와 같은 다른 변수를 덜 정확하게 맞출 수 있다. 이는 지구상에 존재하는 모든 다중 변수 데이터를 분석할 때 발생하는 고질적인 문제다.

이번 ‘네이처 아스트로니미’에 게재된 논문이 주장하는 것은 제임스 웹의 관측 데이터를 현존하는 기존의 스펙트럼 분석 툴로 분석했을 때, 어떤 툴로 분석했는지에 따라 그 결과가 다르게 나올 수 있음을 지적하는 것이다. 그렇다면 제임스 웹의 데이터에서 왜 이런 문제가 발생하는 걸까?

아이러니하게도 제임스 웹의 관측 퀄리티가 압도적으로 뛰어나기 때문이다. 제임스 웹의 관측 데이터는 기존 망원경들의 관측 데이터와는 차원이 다른 수준이다. 그런데 최근까지 천문학자들은 기존에 쓰던 분석 툴을 사용해서 제임스 웹의 데이터를 분석했다. 바로 여기에서 문제가 발생한다.

기존 분석 툴은 제임스 웹 이전 기존 망원경들의 관측 데이터를 분석하기 위해 만들어졌다. 그래서 기존의 관측 데이터 수준에서는 별 무리 없이 좋은 분석 결과를 내놓았다. 하지만 제임스 웹의 관측 퀄리티는 압도적이다. 현존하는 분석 툴로는 제임스 웹이 보내온 고퀄리티의 관측 데이터를 온전하게 소화하지 못한다. 초고화질 그래픽으로 만든 게임을 브라운관 TV 모니터로 보는 것과 같다. 게임 자체가 아무리 고사양이라도 그 인풋을 제대로 렌더링해서 구현하는 모니터가 아니라면 결국 열화된 아웃풋을 볼 수밖에 없다. 어떤 모니터를 쓰는지에 따라 아웃풋 결과가 달라지기도 한다. 초고사양의 게임 화면을 온전하게 보려면 그에 걸맞은 초고사양 모니터가 필요하다. 제임스 웹의 관측 데이터를 기존 분석 툴로 분석하면 바로 이런 문제가 벌어지게 되는 셈이다.

이번 논문에서 주장하는 것은 제임스 웹의 관측 데이터가 잘못되었다는 게 아니다. 제임스 웹에겐 아무런 잘못이 없다. 오히려 너무 지나칠 정도로 뛰어나다. 그게 문제라면 문제일지도 모르겠다. 최근 일부 과학(?) 유튜버들 사이에서 이번 논문을 근거로 마치 제임스 웹 관측 데이터 자체에 무슨 문제가 있다는 식의 왜곡된 주장이 퍼지는 모습을 보며 많이 안타까웠다. 그들의 이야기만 들으면, 제임스 웹에 생각치 못한 하자가 있었고 그간 보내온 관측 데이터도 신빙성이 떨어진다는 식으로 오해하게 된다. 더 안타깝게도 실제 그렇게 오해하고 댓글을 다는 사람들도 적지 않은 듯하다.

제임스 웹은 다행히 별 일 없이 잘 관측을 이어가고 있다. 관측 데이터에도 아무런 이상이 없다. 단지 천문학자들이 이 새로운 고퀄리티 관측 데이터를 소화할 수 있는 더 개선된 소프트웨어를 개발할 일이 남았을 뿐이다. 새로운 하드웨어와 새로운 퀄리티의 데이터가 등장하면 그것을 소화할 새로운 소프트웨어 개발이 뒤따라야 한다. 최근 제임스 웹 데이터와 관련해 벌어진 소동은 과학 분야에서 흔하게 벌어지는 일이 반복된 것뿐이다. 사진=NASA, ESA, CSA, and STScI

논문에서 이 중요하고 흥미로운 내용을 제대로 읽었다면 절대 그렇게 오해할 수가 없다. 오히려 전공자라면, 또 제대로 읽은 사람이라면, “와! 얼마나 관측 데이터가 뛰어나면 이런 문제까지 생기는 거지? 분석 툴을 어떻게 개선해야 할까?” 이런 고민을 할 것이다. 하지만 제대로 읽지도 않고 단순히 논문의 제목만, 그리고 그 논문을 또 1차, 2차로 가공해서 선정적으로 보도하는 외신 기사만 겉핥기로 읽는다면 “와! 제임스 웹 관측 데이터 문제 생겼네? 제임스 웹 망했다! 천문학자들 거짓말 치던 거 다 들통났네!” 뭐 이런 식의 참 참담한 결론에 이르게 된다.

이번 스캔들을 계기로 한 번 더 부탁한다. 본인이 영향력이 있는 크리에이터라 자부한다면 적어도 제대로 조사하고 콘텐츠를 만들어주길 바란다. 전공자가 아니고 정확히 모르는 분야라면 그 분야에 대해 언급을 하지 말든가. 지식의 부재보다 더 나쁜 것은 잘못된 지식의 유입이다.

사실 최근 제임스 웹에겐 이것보다 어쩌면 더 치명적인 중요한 문제가 생겼다. 망원경의 광학 장비 중 하나인 적외선 분광장치 MIRIcam에 있는 주요 부품 하나가 작동을 멈춘 것이다. 대체 무슨 일이 벌어졌는지, 고장난 부품은 무슨 역할을 하는지 등은 다음 칼럼에서 자세히 이야기하겠다.

참고

https://www.nature.com/articles/s41550-022-01773-1?utm_medium=affiliate&utm_source=commission_junction&utm_campaign=CONR_PF018_ECOM_GL_PHSS_ALWYS_DEEPLINK&utm_content=textlink&utm_term=PID100052171&CJEVENT=26d3d6a03fc011ed827701dc0a18050f

https://arxiv.org/pdf/2209.07464.pdf

https://www.pnas.org/doi/10.1073/pnas.1304213111

https://iopscience.iop.org/article/10.3847/1538-3881/aae651

https://ui.adsabs.harvard.edu/abs/2018AAS...23112802D/abstract

https://repository.upenn.edu/cgi/viewcontent.cgi?article=5933&context=edissertations

필자 지웅배는? 고양이와 우주를 사랑한다. 어린 시절 ‘은하철도 999’를 보고 우주의 아름다움을 알리겠다는 꿈을 갖게 되었다. 현재 연세대학교 은하진화연구센터 및 근우주론연구실에서 은하들의 상호작용을 통한 진화를 연구하며, 강연과 집필 등 다양한 과학 커뮤니케이션 활동을 하고 있다. ‘썸 타는 천문대’, ‘하루 종일 우주 생각’, ‘별, 빛의 과학’ 등의 책을 썼다.

지웅배 과학칼럼니스트

galaxy.wb.zi@gmail.com

[핫클릭]

· [사이언스] 제임스 웹, 오리온성운에서 '우주의 점화'를 포착하다
· [사이언스] 제임스 웹이 외계행성의 인증샷을 '직찍'했다!
· [사이언스] 제임스 웹이 공개한 역대급 딥필드에 담긴 이상한 은하들
· [사이언스] 중력 상수가 시간과 위치에 따라 달라진다고?
· [사이언스] 표면을 볼 수 있는 유일한 별은 태양만이 아니다