활동소식

[후기] 변화를 위한 데이터·기술-캠프닷 2024

2024.11.05

공익활동과 데이터·기술을 결합해 새로운 변화를 추구하는 사람을 연결하는 네트워크 캠프, ‘변화를 위한 데이터·기술-캠프닷(dot)’이 지난해에 이어 올해도 개최되었습니다! 이번 캠프닷은 지리산포럼의 협력 프로그램으로 10월 2일 지리산 작은변화베이스캠프 들썩에서 진행되었는데요. 투명사회를 위한 정보공개센터와 슬러기시 해커스는 이날 오전에 AI에 관한 토론, 오후에는 다양한 워크숍과 IT 상담소를 마련하였습니다.


열린 토론 – AI 디깅

흔히 인공지능으로 번역되는 AI(Artificial Intelligence)는 인간의 지능을 모방하여 복잡한 문제를 해결하고 학습하는 기술을 이르는 용어입니다. 요새 많이들 활용하는 ‘챗GPT’와 같은 서비스는 그 중 인간적인 대화와 소통에 특화된 AI 모델입니다. 사용자가 사람과 대화하듯 자연스러운 언어로 무언가 요청하면 챗GPT는 대화의 맥락을 파악하고 사람처럼 대답을 돌려준다는 것이지요. 

커뮤니티 기반 전략컨설팅 그룹, 섀도우캐비닛(https://shadowcabinet.kr/)의 김희원 대표는 이 챗GPT를 소개하며 화두를 열었는데요, 이 서비스를 활용해 길고 복잡한 보고서를 요약하고, 그 내용을 바탕으로 성명문(심지어 ‘인스타그램 말투’가 적용된 버전도)과 국회의원에게 보낼 질의서를 수 분만에 만드는 모습은 격무에 시달리는 시민사회 활동가들의 마음을 뺏은 듯했습니다.

하지만 챗GPT와 같은 AI 모델에게는 문제점도 많았습니다. 개발자가 AI 모델을 어떤 데이터로 어떻게 학습시켰는지, AI 모델은 어떤 것을 근거로 답변하는 것인지 알 수 없다는 것이 큰 문제입니다. 이처럼 불투명하고 모호한 절차를 통해 생성된 결과에 대하여 서비스 제공자들이 책임을 지지 않으려는 것도 그렇고요.

챗GPT와 같은 AI 모델이 내놓는 결과물에는 오류들, 그럴싸한 가짜 정보들이 섞여 있는 경우도 적지 않기 때문에, 이 결과물을 항상 점검하는 과정을 거쳐야 할 필요가 있습니다. 그런데 이 오류가 너무 그럴싸하면 판별할 수 없겠지요.

자료조사나 기본적인 보고서를 작성하는 등 단순한 일에만 활용하면 되지, 라고 생각할 수도 있겠습니다. 그렇다는 것은 노동자의 업무를 대체한다는 것이지요. 게다가 이런 사소한 요청 하나하나에 많은 양의 에너지 자원이 쓰인다는 것도 문제입니다.

이어 정보인권연구소(https://idr.jinbo.net/) 장여경 상임이사는 AI가 형량, 시험 점수, 환경영향진단, 건강진단, 채용 등 인간사회의 의사결정과정에서 활용되며 야기하고 있는 문제적 상황들을 소개하였습니다. AI가 사회에 만연한 편견과 선입견을 학습하게 되는 것도 문제이지만, 그러한 학습 과정과 알고리즘(AI 모델이 따르도록 마련한 일련의 절차나 규칙)이 비공개되거나, 존재하지 않는다는 것은 더 큰 문제입니다. 이에 대한 법적 문제제기도 어려운 형편입니다. AI가 인격체가 아니기 때문에, AI의 혐오발언은 그저 학습된 데이터를 보여준 것이기 때문에, 수집된 데이터가 정보주체의 개인정보인지 입증할 수 없기 때문에……. 여러 모호함으로 손댈 수 없는 사이 AI는 마구잡이로 데이터를 먹으며 쑥쑥 자라고 있습니다.

편향된 가치관의 학습, 정보주체의 동의 없는 무단 학습, 그리고 그런 학습을 통한 결정이 우리들에게 영향을 끼치게 된다는 점이 현재 AI 기술의 독소적인 면이라 하겠습니다. 여러 디지털 기술이 그래왔듯, AI 기술도 하나의 업무적 도구로 널리 받아들여지게 된다면, 우리가 요구할 것은 그 기술 개발 과정의 투명성일 것입니다.


나만의 AI보좌관 만들기

이어 오후에는 시민활동가들에게 도움이 될 주제로 워크숍이 진행되었습니다. 섀도우캐비닛 김경미 대표는 대화형 AI인 챗GPT를 사용자의 필요에 맞게 학습시키고 조정하여, 마치 사용자를 ‘보좌’하는 것처럼 맞춤 활용할 수 있는 방법을 시연해 주셨습니다. 챗GPT에게 뭘 물어봐도 영 뜬구름 잡는 대답만 돌려받았던 경험, 챗GPT가 작성한 문서를 다시 한 땀 한 땀 적확한 표현으로 고쳐 쓰느라 시간을 더 쓴 경험이 있는 저로서는 흥미로운 강연이었습니다.

이런 ‘AI보좌관’을 만들기 위해서는 일단…… 유료 버전을 결제해야 합니다(아아… 방 안을 감싸던 아쉬움이 다시 되살아나는 것 같습니다). 그 후엔 크게 세 가지 작업이 필요합니다. 가장 먼저 해야할 일은 ‘맞춤형 지침(custom instruction)’을 설정해 두는 것입니다. 사용자가 무슨 일을 하는 사람인지, 챗GPT를 통해 어떤 목표를 달성하고자 하는지, 문체는 어때야 하는지 등의 지침을 입력해두면 챗GPT가 이를 가이드라인 삼아 응답하게 된다고 합니다. ‘나는 기후위기 문제를 다루는 환경단체 중견 활동가로서 성명서 쓰기를 목표로 한다’, ‘응답 내용의 출처를 제공한다’ 등의 지침을 입력해두면 챗GPT가 이에 걸맞게 응답을 돌려준다는 것이죠.

다음으로 필요한 작업은 챗GPT가 학습할 문서를 업로드하는 일입니다. 사용자가 써두었던 글들을 업로드하여 챗GPT가 그의 주제의식, 문체, 서술 방식 등을 학습하게 하면, 사용자처럼 일관된 문체와 어조로 응답할 수 있게 된다고 하네요. 사용자의 문서 외 참고 자료를 업로드하는 것도 또 다른 활용 방안 중 하나입니다. 워크샵에서는 예시로 법률 조항을 업로드하고 법적 검토가 필요한 문건에 대해 간단히 리뷰하도록 맡기는 방안이 소개되었네요. 

마지막으로는 챗GPT의 응답에 대해 피드백을 자주 돌려주는 것이 필요합니다. 사용자가 원하던 응답이었는지, 어떤 표현에 대해 수정이 필요한지 등을 대화하듯 피드백할수록 챗GPT의 응답이 사용자가 원하는 방식으로 조율된다고 하네요. 이러한 점 때문에 김경미 대표는 챗GPT가 신입 활동가보다는 중간 관리자나 선임 활동가들에게 더 유용한 도구일 것이라고 제안했습니다. 문서의 어떤 점이 미흡하여 보완이 필요한지, 그 보완의 방향성은 어때야 하는지의 눈썰미가 있는 사용자에게 더 적합하다는 것이죠.

김경미 대표는 챗GPT를 ‘초안 작성용’에 초점을 맞추어 활용할 것을 추천했습니다. 최종 공개용으로 사용하기엔 결국 사람이 다듬어야 할 부분들이 존재하고, 응답에 포함된 정보가 100% 신뢰할 만한 것인지 알 수 없는 등의 단점 때문이기도 하지만, 초안 작성용으로 적합한 장점 때문이기도 합니다. 바로, 작성이 매우 빠르게 이루어진다는 점입니다. 덕분에 사용자는 아이디어 정리하기, 초안 짜기와 같은 기초적인 ‘그림자 노동’에서 시간을 아끼고, 그 글을 발전시키는 다음 단계들에 노력을 더 쏟을 수 있게 됩니다.

이런 식으로 만들어진 맞춤형 프롬프트를 공유할 수 있다는 점이 저에겐 가장 솔깃한 활용 방안이었습니다. 우리가 좋은 질문과 자료를 학습시킴으로써 시민단체 활동가를 위한 챗GPT를 만들고 활용할 수 있다는 것이죠. 챗GPT 등 대화형 AI 응답의 신뢰성이 불확실한 지금, 김경미 대표는 “결국 누가 이 생태계에 좋은 자료를 계속 던지느냐도 중요한 배틀그라운드”라며 우리들이 좋은 자료를 학습시켜 두는 것이 이롭다고 조언하였습니다. AI가 업무에 불가결한 미래가 올 수밖에 없다면, AI를 활용하며 민주적이고 정의로운, 인권을 존중하고 공신력 있는 응답의 기반을 다져 놓는 것이 우리 활동가의 새로운 목표 중 하나가 될 수 있겠다는 생각을 했습니다.


와이파이 해킹하기

정보공개센터와  슬러기시 해커스에서 함께 활동하고 있는 후니는 [와이파이 해킹하기]라는 자극적인(?) 제목의 세션을 열었습니다. 이 신기한 제목에 이끌린 참가자들이 하나 둘 모여들었습니다.

[와이파이 해킹하기]는 말 그대로 와이파이를 해킹하는 모습을 직접 시연함으로써 일상 생활에서 흔히 사용하는 와이파이가 얼마나 해킹에 취약한지 알아보고, 해킹을 방지하기 위해 어떤 보안수칙을 지켜야하는지 살펴보는 시간이었습니다. 

후니는 ‘와이파이 너겟’이라는 장비를 이용하여 와이파이 패킷을 어떻게 하는지 시연했습니다. 누구나 인터넷을 통해 쉽게 구매할 수 있는 간단한 장비로 주변의 와이파이 신호를 스캔하고, 각 기기가 어떤 와이파이에 연결을 시도하고 있는지 SSID 목록을 확인할 수 있었습니다.

마찬가지로 쉽게 구할 수 있는 장비인 ‘와이파이 파인애플’은 가짜 액세스 포인트(AP)를 생성해서, 주변 디지털 기기의 와이파이 접속을 유도하는 장치입니다. 만약 누군가 와이파이 파인애플이 생성한 AP에 접속하면 해당 디지털 기기가 어떤 활동을 하고 있는지 모조리 확인이 가능합니다.

이 두 가지 장비가 결합되면 무서운 일이 벌어집니다. 어떤 해커가 ‘와이파이 너겟’과 ‘와이파이 파인애플’을 가지고 카페에 간다고 가정해봅시다. 해당 카페는 비밀번호가 걸려있지 않은 ‘Hello_Cafe’라는 공용 와이파이를 쓰고 있고, 카페 손님들이 와이파이를 사용하는 상황입니다. 와이파이 너겟은 주변의 디지털 기기들이 어떤 와이파이를 사용하고 있는지 목록을 확인할 수 있고, 와이파이 프로토콜의 취약점을 이용해 특정한 AP에 연결된 기기들의 연결을 강제로 끊는 디오스(DeAuth) 공격을 할 수 있습니다. 그렇게 되면 와이파이가 끊긴 손님들은 다시 ‘Hello_Cafe’에 다시 연결을 하려 들거에요. 그때 해커가 와이파이 파인애플의 가짜 AP 이름을 ‘Hello-Cafe’로 바꿔둔다면, 아무 생각 없이 카페 와이파이가 아닌 와이파이 파인애플의 AP로 접속하는 사람도 생기게 됩니다. 그 순간부터 해당 디지털 기기의 모든 활동 내용은 해커에게 흘러들어가게 됩니다. 메시지 내용, 들어간 웹사이트, 심지어 입력한 정보까지 모두!

후니는 공공장소의 무료 와이파이 사용을 조심해야 한다고 두번, 세번 강조했습니다. 특히 일부 프랜차이즈 카페는 와이파이를 사용하기 위해서 로그인 페이지에서 아이디와 비밀번호를 입력하도록 하고 있는데, 해커들이 프랜차이즈 카페처럼 AP설정하고, 진짜처럼 보이는 가짜 로그인 페이지를 만들어서 아이디와 비밀번호 등 개인정보를 한 순간에 훔칠 수 있다고 경고하기도 했습니다. 

와이파이 해킹보다 간단하고, 위험한 USB 해킹에 대한 경고도 이어졌습니다. 한 실험에서는 대학 강의실에 USB를 놓고 갔더니, 30-40%의 학생들이 그걸 자기 컴퓨터에 꽂았다고 합니다. 해킹 툴이 들어있는 USB는 컴퓨터에 꽂는 순간 바로 해킹으로 이어지니, USB 사용도 매우 주의해야한다고 이야기했습니다. 

일상 속에서 해킹을 예방하기 위한 예방수칙은 다음과 같습니다.

  • 공공 와이파이는 가능하면 사용하지 말자
  • 웹사이트 주소 앞에 ‘https://’가 있는지 꼭 확인하고, https가 아닌 http 주소 웹사이트는 되도록 접속을 피하라
  • 모르는 와이파이에 자동으로 연결되는 기능은 꺼두자
  • 은행 업무같이 중요한 일은 집이나 신뢰할 수 있는 와이파이에서만 이용하라
  • 폰이나 컴퓨터의 업데이트는 미루지 말고 항상 최신 버전으로 유지하라
  • 와이파이 비밀번호는 길고 복잡하게 만들어라

후니가 마지막으로 강조한 건 ‘작은 기술’의 힘입니다. 엄청난 기술이 아니더라도, 간단한 기술만으로도 해킹이 가능하고, 또 나를 지킬 수 있습니다. 내가 해커가 아니더라도, 해커가 어떻게 나의 정보를 노리는지 수법을 아는 것만으로도 해킹을 예방할 수 있다는 것입니다. 그런 의미에서 <와이파이 해킹하기>세션을 준비하기도 한 것이구요.

우리가 일상적으로 사용하는 디지털 기술이 어떤 원리로 작동하는지, 어떤 위험을 불러올 수 있는지 인식하고, 조금 불편하더라도 안전한 방향이 무엇인지 계속 고민하는 것이 디지털 세상의 위험으로부터 나를 지키는 지혜가 아닐까 생각하는 시간이었습니다.


비영리단체의 개인정보 처리와 보호에 관한 워크샵

이번 워크샵에서는 오병일 진보넷 대표가 개인정보의 개념 및 쟁점, 비영리 단체가 개인정보 처리자로서 정보를 어떻게 수집, 관리해야 하는지를 설명하고, 슬러기시 해커스의 개발자 갱이 자동적으로 개인정보를 삭제할 수 있는 오픈소스 툴을 직접 개발해 사용법을 소개했습니다. 

먼저 오병일 대표는 영리 목적의 기업뿐만 아니라, 회원관리나 상담 업무를 하는 비영리단체도 모두 개인정보 처리자에 해당하기 때문에, 개인정보를 제대로 수집하고 처리하는 것이 단체의 신뢰성에 매우 중요하다는 점을 짚어 주었습니다. 유출된 개인정보가 보이스피싱 등의 범죄에 악용될 수 있다는 점도 유의해야 하지만, 취업 과정에서 성별 정보 등 과도한 정보의 수집이 차별의 도구로 사용될 수 있는 등 개인정보 보호가 단순히 정보 보호를 넘어 인권의 문제와도 연결된다는 점을 강조했습니다.

그렇다면 개인정보란 정확히 어떤 정보를 지칭할까요? 이름이나 주민번호 같이 직접적으로 개인을 식별할 수 있는 정보뿐만 아니라, 다른 정보와 결합하여 개인을 식별할 수 있는 정보도 모두 개인정보에 해당한다고 합니다. 때문에 개인정보의 범위에 대해 쟁점들이 생기고 있는데, 예를 들어 자동차 번호판 정보에 대해 개인정보보호위원회는 최근 자동차 번호 자체는 개인정보가 아니라는 입장을 내놓았지만, 이는 매우 논쟁적인 결정이라고 합니다. 차량의 위치를 추적하고 동선을 파악할 수 있다는 점에서, 개인정보로 보아야 한다는 반론이 있는 것이죠.

또한 맞춤형 광고와 관련된 쿠키 정보도 뜨거운 논쟁거리입니다. 광고 사업자들은 이용자의 실명이나 연락처를 모르기 때문에 개인정보가 아니라고 주장하지만, 개인의 관심사와 행동 패턴을 추적하고 그에 따라 다른 광고를 보여준다는 점에 비추어보면 이 역시 개인정보에 해당합니다. 이런 사례들은 디지털 시대에 개인정보의 개념이 계속 확장되고 있음을 보여줍니다.

실무적인 측면에서는 개인정보 처리의 기본 원칙들을 배웠습니다. 개인 정보를 수집할 때에는 수집 목적을 명확히 하고, 보유 기간을 설정하며, 필요한 동의를 꼭 받아야 합니다. 특히 14세 미만 아동의 개인정보를 수집할 때는 반드시 법정대리인의 동의가 필요하다는 점도 중요한 내용이었습니다. 민감정보(정치적 견해, 건강정보, 성적 지향 등)는 별도의 동의가 필요하다는 점도 새롭게 알게 되었습니다.

강연 후반부에는 개발자 갱이 실제 활용할 수 있는 기술도구를 소개했습니다. 구글 앱스크립트를 활용해 개인정보 보유기간이 만료되면 자동으로 삭제되는 프로그램을 시연했는데, 대부분의 단체에서 다양한 신청/작성 폼에 구글 시트를 연동하여 개인정보를 관리하기 때문에 처음 설정만 해놓으면 매우 유용하고 광범위하게 사용할 수 있는 도구입니다.

마지막으로 개인정보 처리자에게는 법적으로 준수해야 할 사항들이 있는데요, 가장 중요한 것은 개인정보 처리방침을 공개해야 하고 정기적인 교육이 필요하다는 점이었습니다. 위반 시에는 벌금이나 과태료가 부과될 수 있기 때문에 각 단체에서 더욱 신경 써서 관리해야 할 필요가 있습니다. 

비영리단체에서도 회원정보나 후원자 정보, 각종 행사 참석자, 상담 기록 등 많은 개인정보를 다루기 때문에 실무를 하는 활동가와 조직의 책임자 모두 개인정보 보호에 대해 막연한 불안감이 있을 수 밖에 없는데요, 이번 강연을 통해, 시민사회 단체에서도 개인정보 관리 체계와 방침을 점검하고 개선해 나가야겠다는 필요성을 느꼈습니다.


젠더 데이터 디깅하기

늦은 오후엔 캠프닷 마지막 행사, ‘젠더 데이터 디깅’ 워크숍이 진행되었습니다. 어떤 수치들을 결정할 때에 성 고정관념이 반영되곤 한다는 점, 생각해 보신 적 있나요? 예컨대 80~85cm라는 싱크대의 높이는 우리나라 비장애 여성의 평균 신장이, 170cm라는 지하철 손잡이 높이는 우리나라 남성의 평균 신장이 반영된 결과물이었습니다. 어떤 성별, 어떤 신체조건의 사람이라도 싱크대와 지하철을 편히 이용할 수 있도록 시설과 가구의 수치를 다양화하는 데엔 성별에 관한 데이터가 필요합니다. 이처럼 데이터를 성별의 관점에서 바라보는 일, ‘젠더 데이터’를 생산하고 활용하는 일은 성평등한 의사결정을 위해 무척 중요합니다.

투명사회를 위한 정보공개센터 정진임 소장, 슬러기쉬 해커스 갱 개발, 오픈넷 오경미 연구원이 함께 꾸린 이 워크숍에서는 참가자들이 지역의 노년 여성 안전에 관한 젠더 데이터를 수집하고 그 생활 여건을 확인해보는 시간을 가졌습니다. ‘지역’, ‘여성’, ‘노인’ 분야가 교차하는 곳을 파고들어 데이터 공백을 함께 메우고 문제제기 해보는 활동이었는데요. 지역, 노년, 여성 문제에 관심 있는 기자, 생활 기술을 교육하는 기획자, 기술을 활용해보고 싶은 개발자, 캠프가 열리는 산내의 주민 등 진행자들만큼이나 다양한 영역의 참가자 분들이 함께 해주셔서 더욱 다채로운 활동이 되지 않았나 싶습니다.

데이터 수집의 첫 걸음은 역시 ‘검색’입니다. 네이버, 구글 등에서 제공하는 검색 엔진을 이용하면 뉴스와 통계 자료 등 여러 자료를 찾아볼 수 수 있죠. 정진임 소장은 이런 수많은 자료 중 유용한 데이터를 가려 뽑을 수 있는 팁으로 ‘검색 연산자’를 활용할 것을 귀띔해 주었습니다. 데이터 중 공신력 있는 공공기관의 문서나 통계 자료를 우선 얻고 싶으신 적 없으셨나요? 검색어 뒤에 ‘site:go.kr’를 추가하면 정부기관 사이트 검색 결과만을 얻을 수 있고, ‘filetype:pdf’를 추가하면 pdf로 된 문서 파일을 검색해낼 수 있답니다. site 검색 시 go.kr 외에 비영리단체를 나타내는 ‘or.kr’, 연구원을 나타내는 ‘re.kr’도 추천합니다. 엑셀 파일을 검색하고 싶다면 ‘filetype:xls’, 아래아한글 문서를 검색하고 싶다면 ‘hwp’를 검색하는 것도 방법이겠죠. 

정보공개센터가 단지 ‘구글링’하는 방법만 공유한 것은 아니죠. 데이터를 더 수월히 검색하고 활용할 수 있도록 정보공개센터가 만든 공공데이터 사이트 목록, 〈GO 데이터 액티비즘〉을 참여자에게 제공하였습니다. 또, 열린·시민 기술을 만드는 플랫폼 협동조합 ‘빠띠’가 만든 데이터 제보 프로그램 ‘물음표’를 소개드리기도 했는데요. 이 프로그램을 사용하면 공익데이터를 모으고 열람할 수 있도록 하는 플랫폼 ‘데이터트러스트’에 제보되는 식이랍니다.

이렇게 다양한 검색 방안을 갖추고 참여자들은 저마다 관심 있는 데이터를 발굴하기 시작했습니다. 그 결과 노년여성의 심리적(돌봄수혜), 신체적(건강), 공간적(주거), 경제적(빈곤) 안전에 관한 데이터가 한데 모였습니다. 결과물의 목록을 보는 것도 즐거웠지만, 더욱 즐거웠던 것은 워크숍 동안에 나눈 수다들이었습니다. 찾고 싶은 정보가 무엇인지 말하면 어디서 찾으면 좋을지 같이 궁리하고, 수치를 어떻게 해석하면 좋은지, 발굴한 데이터와 지역정책 및 예산 문제를 어떻게 연결시킬 수 있을지, 데이터 비공개는 무엇이 문제인지, 꼬리에 꼬리를 무는 수다가 이어졌거든요. 함께 데이터 액티비즘에 참여하며, 서로 데이터를 공유하고 아이디어와 노하우를 나누며 문제의식을 발전시킬 필요성을 느낀 순간이었습니다.

워크숍을 통해 노년 여성이 겪는 어려움들에 대한 연구, 시군구 별 노년 여성 현황 통계는 찾을 만했지만, 이들의 교차점에 있는 지역 노년 여성에 대한 연구, 그리고 읍면동 단위의 통계처럼 세밀하고 구체화된 정보들은 찾기 어렵다는 것을 알 수 있었습니다. 이에 관해 정진임 소장은 존재하는 데이터를 찾는 것만큼 부재하는 데이터를 알아차리는 것이 중요하다고 코멘트했는데요, 그를 통해 우리가 무엇이 필요하고, 무엇을 어디에 요구할 것인지 목표와 방향성을 잡을 수 있기 때문이겠죠.

마치며

사회 변화와 데이터/테크놀로지를 어떻게 연결할까 하는 고민으로 시작된 캠프닷, 이렇게 지리산포럼에서 2024년 행사를 마쳤습니다. 요즈음 가장 뜨거운 감자인 AI 기술은 어떤 점에서 문제적인지, 다가오는 AI 시대에 우리는 어떻게 대응해야 할지 열띤 토론부터 시작하여, 와이파이와 같이 우리가 일상적으로 사용하는 디지털 기술 이해하고 업무에 활용하는 방법, 데이터를 모으고 사회문제를 드러내는 노하우를 배울 수 있었던 뜻깊은 시간이 되었습니다. 내년에도 알찬 캠프닷 프로그램으로 돌아올 수 있도록, 저희도 노력하겠습니다!

by
    이리예, 김조은, 김예찬

정보공개센터는 정부지원 0%, 시민의 후원으로 활동합니다

후원하기