본문 바로가기

인공지능(AI)

인공지능 알고리즘의 편향성과 공정성 (2)

반응형

인공지능 편향은 어디에서 생기는가?

 이전 글에서 언급한 바와 같이, AI 모델과 그들의 예측은 훈련에 사용되는 데이터에 의해 크게 결정됩니다. 따라서, AI 시스템에서 가장 큰 편향의 원천은 그것이 훈련된 데이터입니다.

 

역사적 편향(Historical Bias)

 역사적 편향은 우리의 데이터에 스며든 현재 세계에 존재하는 편향입니다. 모델을 훈련하는 데 사용된 데이터가 더 이상 현재 현실을 반영하지 않을 때 발생합니다. 역사적 편향은 역사적으로 불리하거나 배제된 집단과 개인에게 나타나는 경향이 있습니다.

 예를 들어, 인공지능 시스템이 금융 부문에서 적격한 대출 신청자를 선정하는 임무를 맡았다고 가정 할 때, 모델이 훈련 받은 데이터에 기초하여, 그것은 남성 대 여성에 대한 특혜를 보여줄 수 있습니다. 이 편견은 인공지능 모델이 남성과 여성 사이의 큰 소득 차이를 포함한 과거 데이터에 대해 훈련 받은 것에서 비롯될 수 있습니다.

 

표현 편향(Representation Bias)

 표현 편향은 데이터 과학자들이 데이터 세트를 만들기 위해 모집단을 정의하고 표본을 추출하는 방법에서 발생합니다. 니콘의 예를 고려해보면 눈 깜빡임 감지 기능에 대한 얼굴 인식 훈련에 사용된 데이터는 주로 백인 특징을 가진 사람들을 기반으로 하여 아시아 사람들의 얼굴 특징을 감지하는 데 문제가 발생했습니다.

 

측정 편향(Measurement Bias)

 측정 편향은 훈련을 위해 수집된 데이터가 실제에서 수집된 데이터와 다를 때 발생합니다. 프로젝트의 데이터 레이블링 단계에서 일관성 없는 주석으로 인해 수집된 데이터가 부정확한 특징이나 레이블을 가진 경우에도 발생합니다.
 예를 들어, 의료 진단 시스템이 실제 증상이 아닌 의사 방문 횟수와 같은 대리 지표를 기반으로 질병 가능성을 예측하도록 훈련될 때 편향이 발생할 수 있습니다

 

평가 편향(Evaluation Bias)

 평가 편향은 모델 반복 및 평가 동안 발생합니다. 예를 들어, 모델을 유사한 작업을 수행하는 다른 모델과 비교하는 데 사용된 벤치마크 데이터가 모델이 제공할 모집단을 나타내지 않을 때 편향이 발생할 수 있습니다.
 예를 들어, 전국의 투표율을 예측하기 위해 기계 학습 모델을 구축하려고 한다고 가정합니다. 따라서 한 사람의 투표 여부를 예측하기 위해 연령, 직업, 소득 및 정치적 정렬과 같은 일련의 특징을 취합니다. 그러나 해당 지역의 사람들만을 대상으로 모델을 평가함으로써 해당 국가의 다른 지역은 제외하고 그들에게만 적합한 시스템을 의도치 않게 설계했습니다.

 

통합 편향(Aggregation Bias)

 통합 편향은 모델 구축 중에 서로 다른 그룹 또는 모집단이 부적절하게 결합되어 대다수에 대해서만 잘 수행되는 모델이 될 때 발생합니다. 즉, 하나의 단일 모델이 모든 그룹에 적합하지 않을 것으로 보입니다. 그럼에도 불구하고 과학자들은 데이터를 집계하여 단순화합니다.
 이러한 유형의 편견은 의료 응용 분야에서 가장 일반적으로 발생합니다. 예를 들어, 당뇨병을 진단하고 모니터링할 때 모델은 역사적으로 헤모글로빈 A1c (HbA1c) 수준을 사용하여 예측했습니다. 그러나 이러한 수준은 민족에 따라 복잡한 방식으로 다르며 모든 모집단에 대한 단일 모델은 편향을 보일 수밖에 없습니다. 따라서 데이터에 민족성을 특징으로 포함하거나 다른 민족 그룹에 대한 별도의 모델을 구축하여 시스템이 이러한 민족적 차이에 민감하도록 만드는 것이 중요합니다.
 의료 밖의 다른 예는 직원이 얼마나 오랫동안 회사에 근무했는지에 기초하여 급여 증가를 분석하는 것을 포함합니다. 예를 들어, 이 모델은 강한 상관관계를 보여줄 수 있습니다: 금융, 정보 기술, 그리고 교육에서 더 오래 일할수록, 더 많은 급여를 받습니다. 그러나 이것은 운동선수들이 아직 신체적인 정점에 있는 동안 그들의 경력 초기에 높은 급여를 받기 때문에 그렇지 않을 수 있지만, 그들이 경쟁하는 것을 멈추면서 감소합니다. 그러므로, 운동선수들을 다른 직업과 통합함으로써, 인공지능 알고리즘은 그들에게 편향될 수 있습니다.

반응형