본문 바로가기

전체 글

내시 균형, 죄수의 딜레마 내시 균형 Nash equilibrium 내시 균형(Nash equilibrium)은 게임 이론에서 경쟁자 대응에 따라 최선의 선택을 하면 서로가 자신의 선택을 바꾸지 않는 균형상태를 말한다. 상대방이 현재 전략을 유지한다는 전제 하에 나 자신도 현재 전략을 바꿀 유인이 없는 상태를 말하는 것으로 죄수의 딜레마(Prisoner's Dilemma)와 밀접한 관계가 있다. 게임이론에서 내시균형이란 두명이나 그 이상의 경기자들의 비협조적인 게임에서 각 경기자들이 다른 경기자들의 균형전략을 알고있다고 가정할 때 어떠한 경기자들도 자신의 전략을 바꾸지 않게 되는 비협조적인 게임에 관한 해결방식이다. 만약 각 경기자들이 자신의 전략을 고수하고 아무도 전략을 바꾸지 않는다면 현재의 전략선택은 내시균형에 부합하는 결과.. 더보기
혼동 행렬, 분류성능평가지표 혼동행렬 confusion matrix 혼동행렬(confusion matrix)은 기계학습분야, 특별히 통계분류(statistical classification)문제 분야에서 오류 행렬이라고도하며, 일반적으로 지도학습에서 알고리즘의 성능을 시각화 할 수 있는 표입니다. 비지도 학습에서는 일반적으로 일치 행렬(matching matrix)이라고합니다. 분류 모델을 학습하는 것의 목적은, 주어진 데이터를 의도에 맞게 잘 분류해내기 위한 것이다. 그렇다면 이러한 모델을 평가하는 기준이 필요할 것이다. 모델을 평가할때는 모델이 얼마나 정밀한지, 얼마나 실용적인 분류를 해내었는지, 얼마나 정확한 분류를 했는지를 평가해야 한다. 이러한 내용들을 모두 포함하고 있는 것이 Confusion Matrix이다. 먼저 모델.. 더보기
RFM 분석 RFM은 가치있는 고객을 추출해내어 이를 기준으로 고객을 분류할 수 있는 매우 간단하면서도 유용하게 사용될 수 있는 방법으로 알려져 있어 마케팅에서 가장 많이 사용되고 있는 분석방법 중 하나이다. RFM은 구매 가능성이 높은 고객을 선정하기 위한 데이터 분석방법으로서, 분석과정을 통해 데이터는 의미있는 정보로 전환된다. RFM은 Recency, Frequency, Monetary의 약자로 고객의 가치를 다음의 세 가지 기준에 의해 계산하고 있다. · Recency - 거래의 최근성: 고객이 얼마나 최근에 구입했는가? · Frequency - 거래빈도: 고객이 얼마나 빈번하게 우리 상품을 구입했나? · Monetary - 거래규모: 고객이 구입했던 총 금액은 어느 정도인가? ​ 모형 ​ · Scoring .. 더보기
집단 지성 집단 지성(集團知性, collective intelligence)이란 다수의 개체들이 서로 협력 혹은 경쟁을 통하여 얻게 되는 결과이다. 쉽게 말해서 집단적 능력을 말한다. 소수의 우수한 개체나 전문가의 능력보다 다양성과 독립성을 가진 집단의 통합된 지성이 올바른 결론에 가깝다는 주장이다. 월드와이드웹의 발전 방향인 웹 2.0의 핵심 키워드이다. 중지(衆智, 대중의 지혜), 집단지능, 협업지성, 공생적 지능이라고도 한다. 개요 ​ 집단적인 지적 능력을 통해 개체적으로는 미미하게 보이는 박테리아, 동물, 사람의 능력이 총의를 모으는 과정을 통한 결정 능력의 다양한 형태로 한 개체의 능력 범위를 넘어선 힘을 발휘할 수도 있다고 주장한다. 이 분야는 사회학, 경영학, 컴퓨터 공학 등에서 주로 연구 및 적용되다.. 더보기
주성분 분석 PCA(Principal component analysis) 통계학에서 주성분 분석(主成分分析, Principal component analysis; PCA)은 고차원의 데이터를 저차원의 데이터로 환원시키는 기법이다. 서로 연관 가능성이 있는 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간(주성분)의 표본으로 변환하기 위해 직교 변환을 사용한다. 주성분의 차원수는 원래 표본의 차원수보다 작거나 같다. 주성분 분석은 데이터를 한개의 축으로 사상시켰을 때 그 분산이 가장 커지는 축을 첫 번째 주성분, 두 번째로 커지는 축을 두 번째 주성분으로 놓이도록 새로운 좌표계로 데이터를 선형 변환한다. 이와 같이 표본의 차이를 가장 잘 나타내는 성분들로 분해함으로써 여러가지 응용이 가능하다. 이 변환은 첫째 주성분이 가장 큰 분산을 가지고, 이후의 주성분들은 이전의 주성.. 더보기
마르판 증후군 Marfan syndrome 마르판 증후군(Marfan syndrome, MFS)은 유전 질환의 하나로 결합 조직에 결함이 있는 증후군이다. 키가 매우 크고, 사지가 길며, 허파와 눈, 심장, 혈관 등에 이상이 나타나기도 한다. 1896년 이를 처음 보고한 프랑스의 소아과 의사 앙투안 마르팡의 이름을 따서 붙여졌다. 주로 장신 선수들에게 자주 일어나며, 심장 대동맥 파열로 인한 급사가 대부분이다. 전 농구 선수 한기범이 이 질병으로 2차례 수술을 받았고, 자신의 아버지와 친동생이 같은 병으로 죽었다고 언급했다. 키가 2m에 가까운 센터출신 2명의 후배농구선수들이 심장마비로 급사하고, 또 배구 선수 강두태와 김병선이 이 질병에 걸려 급사했다. 한기범은 김병선의 예를 들면서, 이 질병은 고통을 느끼기 전까지는 자신이 감지하기 어려운 병.. 더보기
기쿠치병 Kikuchi Disease 정의 기쿠치병은 림프절이 0.5~4cm 정도로 커지면서 염증과 통증이 동반되는 질환으로, 1972년 일본 의사 기쿠치에 의해 최초로 보고된 병입니다. 조직구 괴사성 림프절염으로도 불립니다. 주로 30세 이하의 젊은 동양 여성에게 많이 발생하며, 특히 한국과 일본에서 많이 발생했습니다. 남성보다 여성에게서 약 4배 정도 많이 발병합니다. 기쿠치병에 걸리면 흔히 목 부근의 림프절이 커집니다. 발열, 피로감, 발진이 동반되기도 합니다. 기쿠치병은 조직검사를 통해 진단할 수 있습니다. 다만 질병의 양상이 다양해 악성 림프종, 결핵, 전신성 홍반성 낭창(루프스)으로 오진될 수 있으므로 정확한 진단이 필요합니다. 원인 기쿠치병의 원인은 명확하게 밝혀지지 않았습니다. 바이러스 감염, 림프종, 자가면역 반응과 관련이 .. 더보기
천식 Asthma 천식(Asthma)은 알레르기 염증에 의해 기관지가 반복적으로 좁아지는 만성 호흡기 질환입니다. 기관지가 좁아져서 숨이 차고, 기침이 나며, 가슴에서 색색거리는 소리가 들리고, 가슴이 답답해지는 증상이 반복적으로 되풀이됩니다. 우리나라 성인 인구의 5% 정도가 천식을 앓는 것으로 알려져 있습니다. 최근 전 세계적으로 천식 환자 수가 증가하고 있습니다. 원인 1. 대기 알레르겐 1) 꽃가루 봄에는 수목, 여름에는 목초, 가을에는 잡초 화분이 날립니다. 화분은 바람에 의해 수 km씩 이동하므로 도시에서도 높은 분포를 보입니다. 2) 곰팡이 실외의 곰팡이는 종류에 따라 포자 형성 시기가 다르기는 하지만, 우리나라에서는 우기인 7, 8월에 분포가 절정에 달합니다. 집 안의 곰팡이는 습도가 높은 지하실, 창고, .. 더보기
준거집단 reference group 사회 집단의 유형은 사회 조직을 정의하는 다양한 집단역학에 기반을 둔 사회집단 내에서 식별되는 관계의 분류를 가리킨다. 준거집단(reference group)은 개인이 행동을 함에 있어 그 행동 방향에 결정적인 영향력을 갖는 집단규범을 갖춘 집단, 즉 개인이 판단을 내릴 수 없는 문제에 부딪혔을 경우 참고로 하여 그 판단의 근거로 삼는 가치기준 또는 이데올로기나 행동원리 같은 것을 갖춘 집단이다. 가령 어떤 개인이 투표를 함에 있어서 모신문의 의견에 따르는 경우 그 신문을 발행하는 신문사는 그 개인에게 있어 준거집단이 된다. 준거집단에는 두 가지 기능이 있다. 하나는 규범적 기능으로 개인이 집단이나 사회에서 용인되고 평가되는 행동을 하려 할 때 그 행동의 기준을 제공하는 기능이다. 또 하나는 비교적 기능.. 더보기
몬테카를로 방법 몬테카를로 방법(Monte Carlo method)은 난수를 이용하여 함수의 값을 확률적으로 계산하는 알고리즘을 부르는 용어이다. 수학이나 물리학 등에 자주 사용되며, 계산하려는 값이 닫힌 형식으로 표현되지 않거나 복잡한 경우에 근사적으로 계산할 때 사용된다. 스타니스와프 울람이 모나코의 유명한 도박의 도시 몬테카를로의 이름을 본따 명명하였다. 1930년 엔리코 페르미가 중성자의 특성을 연구하기 위해 이 방법을 사용한 것으로 유명하다. 맨해튼 계획의 시뮬레이션이나 수소폭탄의 개발에서도 핵심적인 역할을 담당하였다. 알고리즘의 반복과 큰 수의 계산이 관련되기 때문에 몬테카를로는 다양한 컴퓨터 모의 실험 기술을 사용하여 컴퓨터로 계산하는 것이 적합하다. Monte Carlo 방법(또는 Monte Carlo 실.. 더보기
탐욕 알고리즘 (Greedy algorithm) 탐욕 알고리즘은 최적해를 구하는 데에 사용되는 근사적인 방법으로, 여러 경우 중 하나를 결정해야 할 때마다 그 순간에 최적이라고 생각되는 것을 선택해 나가는 방식으로 진행하여 최종적인 해답에 도달한다. 순간마다 하는 선택은 그 순간에 대해 지역적으로는 최적이지만, 그 선택들을 계속 수집하여 최종적(전역적)인 해답을 만들었다고 해서, 그것이 최적이라는 보장은 없다. 하지만 탐욕알고리즘을 적용할 수 있는 문제들은 지역적으로 최적이면서 전역적으로 최적인 문제들이다. 탐욕 알고리즘이 잘 작동하는 문제는 대부분 탐욕스런 선택 조건(greedy choice property)과 최적 부분 구조 조건(optimal substructure)이라는 두 가지 조건이 만족된다. 탐욕스런 선택 조건은 앞의 선택이 이후의 선택에.. 더보기
지니 계수 지니계수 소득의 불평등 정도를 나타내는 가장 대표적인 소득분배지표입니다. 지니계수는 0에서 1사이의 수치로 표시되는데 소득분배가 완전평등한 경우가 0, 완전불평등한 경우가 1입니다. 지니계수는 로렌츠곡선을 이용하여 계산할 수 있습니다. 로렌츠곡선을 그리기 위해서는 소득이 낮은 사람부터 높은 사람 순으로 전체 인구를 나열하여 총인구를 100으로 설정하고 가로축은 인구누적비율로, 세로축은 이 사람들의 소득을 차례로 누적한 총소득을 100으로 하는 소득누적비율로 설정합니다. 그리고 인구누적비율과 해당소득누적비율을 연결한 선을 로렌츠곡선이라고 정의합니다. 그림에서 보면 사각형에서 대각선은 인구누적비율과 소득누적비율이 일치하는, 즉 모든 인구가 동일한 소득을 보유해 완전히 평등한 소득분배를 보여줍니다. 그러나 현.. 더보기