Skip to main
신유진
소개글 MIT 데이터 시각화 전문 연구원을 거쳐 월스트리트저널과 워싱턴포스터에서 비주얼 저널리스트로 근무했습니다. 데이터 시각화를 좋아하고, 이를 새로운 방식의 이야기로 전달하는 비주얼 스토리텔링에 관심이 많습니다.
데이터 시각화 왜 안 읽힐까요?.. 혁신의 숲으로 분석해봤습니다
*이 글은 외부 필자인 신유진님의 기고입니다. 데이터의 양이 늘어나고 복잡해지면서, 데이터를 좀 더 쉽게 이해하고 인사이트를 발견하는 것의 필요성이 높아지고 있습니다. 이러한 이유로 데이터 시각화가 많이 활용되고 있는데요. 데이터가 시각화되어 전달되면 우리의 뇌는 빠른 속도로 많은 양의 정보를 처리할 수 있고, 데이터 테이블에 비해 트렌드나 패턴, 아웃라이어 등을 쉽게 파악할 수 있습니다. 하지만, 어떤 데이터 시각화는 좀처럼 정보를 파악하기가 쉽지 않습니다. 무엇이 차이를 가를까요? 다양한 데이터 시각화를 자료로 활용하고 있는 혁신의 숲은 스타트업의 투자유치, 고용현황, 재무 등의 데이터를 제공하고, 이를 분석해 스타트업의 성장을 예측하는 성장 분석 플랫폼입니다. (참조 - 혁신의 숲 홈페이지) (참조 - 혁신의숲은 어디서 데이터를 가져올까?) 각 기업에 대한 정보뿐 아니라 스타트업 전체의 생태계를 이해할 수 있도록 돕습니다. 이렇게 유용한 정보를 제공하고 있지만, 데이터 시각화를 통한 정보전달에서 아쉬운 점들이 보입니다. 이 글에서는 혁신의 숲에서 제공하는 3가지 주요 데이터 시각화를 살펴보고, 정보를 좀 더 쉽고 직관적으로 전달할 수 있도록 업데이트해 보았습니다. 1. 타임라인 아래의 시각화는 마켓컬리의 성장을 한눈에 볼 수 있는 타임라인 카테고리입니다. (참조 - 혁신의 숲 내 마켓컬리 분석 자료)
신유진
2023-05-18
성공적인 데이터 시각화를 돕는 4가지 기술
*이 글은 외부 필자인 신유진님의 기고입니다. 데이터 시각화는 데이터에서 발견한 정보를 시각적으로 이해할 수 있도록 그래픽 형태로 표현한 것을 말합니다. 이런 데이터 시각화는 언제부터 시작됐을까요? 정확한 시점을 알기는 어렵지만, 그 역사는 생각보다 많이 거슬러 올라갑니다. 우리에게 백의의 천사로 익숙한 나이팅게일은 간호사면서 통계학자였고, 무엇보다 데이터 시각화의 선구자였습니다. 그중 가장 유명한 시각화는 아래의 '로즈 다이어그램(Rose Diagram)'입니다. 1858년도에 만들어진 이 다이어그램은 당시 크림전쟁에서 사망한 병사들의 수와 그 원인을 보여줍니다. 사망 원인별로 면적이 붉은색(부상으로 인한 사망), 파란색(예방 가능한 질병), 검은색(그 외)으로 나누어집니다. 이 시각화를 통해 전염병 등의 예방 가능한 질병으로 인한 사망자 수가 많다는 것을 확인할 수 있죠. 그렇다면 오늘날의 데이터 시각화는 로즈 다이어그램과 어떤 부분이 다를까요? 이는 기술의 발전과 큰 연관이 있습니다.
신유진
2023-03-24
사진으로 정보를 시각화하는 4가지 방법
*이 글은 외부 필자인 신유진님의 기고입니다. 데이터는 맥락 속에서 의미를 가집니다. 데이터가 어떻게, 어떤 환경에서 수집됐는지 등 데이터에 대해 더 많이 알수록 데이터가 지닌 진짜 의미를 알 수 있습니다. 그래서 수치만을 보았을 때, 우리는 종종 이런 맥락을 놓치기도 합니다. 사진은 맥락을 전달하는 면에서 탁월합니다. 단지 '미세먼지 농도가 어떻다'는 정보에 더해, 미세먼지 농도에 따라 바뀌는 대기 모습을 사진으로 담아 수치가 가지는 의미를 보다 정확히 보여줍니다. 이렇듯, 사진은 순간을 담기도 하고, 형태나 색 등을 기록하기도 하며, 다른 사진들을 대조해서 새로운 정보를 깨닫게 하기도 합니다. 그럼 어떻게 사진을 이용해서 정보를 전달할 수 있을까요? 이 스토리에서는 사진을 이용해서 정보를 전달한 다양한 사례들을 살펴보고, 각각 어떤 방식으로 전달했는지 알아보려고 합니다. 1. 대비를 통해 맥락 전달하기 (1) 인도의 대기오염 2020년 뉴욕타임즈는 두 아이의 삶을 통해 인도의 대기오염 문제를 다루었습니다. (참조 - Who Gets Clean Air in New Delhi?) 세계에서 대기오염이 가장 심각한 도시인 인도의 뉴델리에서 두 아이는 각기 다른 환경에서 자라고 있습니다. 모누(Monu)와 아미야(Aamya)가 하루 24시간을 어떻게 보내는지 보여주고, 각각의 상황에서 노출되는 미세먼지 농도를 기록했습니다.
신유진
2023-02-22
코로나19 데이터 시각화로 살펴본 데이터 시각화의 5가지 유형
*이 글은 외부 필자인 신유진님의 기고입니다. 코로나19 시대, 그 어느 때보다 데이터가 중요한 역할을 했습니다. 코로나19에 대한 정보를 전달하고, 확진자 및 사망자 수를 기록하고, 의료체계 현황을 분석해 이를 바탕으로 보건정책을 마련하는 등 데이터는 코로나19 현황을 파악하고 해결책을 마련하는 데 큰 도움을 주었습니다. 데이터에서 발견된 정보들은 시각화를 통해 전달됐습니다. 아마 가장 많이 접한 시각화는 확진자 및 사망자 수의 증감을 보여주는 라인차트(Line chart)일 것 같습니다. 이 외에도 시뮬레이션, 증강 현실(AR), 3D 스토리텔링 등 다양한 시도가 이루어졌습니다. 이 스토리에서는 코로나19 데이터를 다룬 대표적인 데이터 시각화 사례들을 살펴보고 우리가 고민해봐야 할 부분은 무엇인지 이야기해보려고 합니다. 1. 익숙한 정보와의 비교 세계보건기구 (World Health Organization, 이하 WHO)가 코로나19에 대해 팬데믹을 선언했을 때만 해도 우리는 코로나19에 대해 아는 것이 많이 없었죠. 이 때문에 2020년 초반에는 코로나19에 대해 새롭게 알게 된 정보를 전달하기 위한 데이터 시각화가 많았습니다. 당시 저는 워싱턴 포스트의 그래픽 팀에서 비주얼 저널리스트로 재직하고 있었습니다. 데이터 시각화 등의 비주얼을 이용해서 스토리를 만드는 일을 했습니다. 코로나19 관련 브레인 스토밍이 이루어졌고, 다른 2명의 비주얼 저널리스트와 함께 코로나19가 다른 바이러스와 어떻게 다르게 확산되는지 알아보기로 했습니다. 제한된 인구 내에서 감염이 확산되는 시뮬레이션을 만들어 코로나19를 우리에게 다소 익숙한 홍역 및 에볼라 바이러스과 비교했습니다. 시뮬레이션은 캐나다 감염병 모델링 석학인 데이비드 피스만(David. Fisman) 토론토대 병역학 교수와의 소통을 바탕으로 개발됐습니다. 다음은 2020년 2월 19일 워싱턴 포스트 보도의 시뮬레이션에서 한순간을 캡쳐한 것입니다.
신유진
2023-01-30
1
;