안녕하세요, @doctorbme 입니다. 오늘 살펴볼 연구는 수면제 처방(Sleep medication prescription) 과 임상적 의사결정(clinical decision making)에 대해서 어떠한 변수를 정의하고 활용하여, 실질적으로 처방이 어떻게 이루어지는가를 살펴보는 연구입니다.
논문 제목은 Predictive Modeling of Physician-Patient Dynamics That Influence Sleep Medication Prescriptions and Clinical Decision-Making와 같으며, Creative Commons 4.0 (CC-BY)가 걸려있어서 편하게 사용이 가능합니다.
Andrew L. Beam, Uri Kartoun, Jennifer K. Pai, Arnaub K. Chatterjee, Timothy P. Fitzgerald, Stanley Y. Shaw & Isaac S. Kohane, Predictive Modeling of Physician-Patient Dynamics That Influence Sleep Medication Prescriptions and Clinical Decision-Making, Scientific Reports volume 7, Article number: 42282 (2017)
doi:10.1038/srep42282
배경
이 논문에서는 의사-환자 역동(Physician-Patient dynamics)라는 다소 거창한 용어를 제시하고 있습니다. 어떠한 처방이 나가는 데에 의사의 성향과 환자의 성향이 같이 영향을 준다는 이야기이지요. 여기서 수면(sleep)을 선택한 이유는. 불면증(insomnia)과도 관련이 있고, 증상의 묘사가 적힌 임상 노트(clinicial note)를 통해 다양한 정보를 파악할 수 있으며, 불면증 자체도 간단하지는 않은 증상이자 질병이기 때문이라고 합니다.
이 연구에는 수면제로 좋은 효과를 보이지만 잠재적인 부작용을 나타낼 수 있는 졸피뎀(zolpidem)과, 항우울제에 속하지만 낮은 부작용으로 인해 (근거는 좀 더 빈약하지만) 수면 보조제로 쓰일 수 있는 트라조돈(trazodone)의 처방 패턴을 비교합니다. 이때 이러한 패턴은 1) 의사의 성향과 2) 환자의 에피소드적인 상황에 따라 변화할 수 있다고 합니다.
방법론
방법론은 크게 2가지를 사용합니다.
- 통계적인 분포 (혹은 확률)을 구해 의사의 처방 성향을 구성
- 자연어처리에서 쓰이는 Latent Dirichlet allocation(LDA)를 사용한 환자의 특성을 구성 (확률을 나타낸 변수)
위로 부터 도출한 2개 종류의 변수를 통해, Logistic Regression을 통해 zolpidem과 trazodone 중 어떤 약이 쓰일지에 대한 확률을 계산합니다.
데이터의 구성(Cohort selection)
- Massachusetts General Hospital (MGH)나 Brigham and Women’s Hospital (BWH)에서 진료를 받은 314,292 명의 환자들기록을 바탕으로 제2형 당뇨를 진단 받았거나, 랩 데이터에서 hbA1C>6.5% 혹은 혈당이 200 mg/dl 인 환자를 골라냅니다.
- 이 중 첫번째 수면제 처방이 존재하고, 이를 기준으로 12개월 이전까지 불면증으로 진단 받은 ICD-9 코드를 가지고 있는 환자나, 수면 장애를 가지고 있다고 임상 노트에 기록을 가지고 있는 환자를 골라냅니다.
- 여기서 특이할만한 점은, 애초에 순수하게 수면장애만을 가진 환자를 골라내는 것이 아니라 당뇨와 관련된 환자를 포함시키는 것인데요, 이는 당뇨병 환자가 다른 여러 질병을 같이 가질 수 있고 따라서 풍부한 임상 노트를 가지고 있을 것으로 기대하며, 이에 따라 진료를 보는 의사들도 다양하게 분포될 것을 기대하기 때문입니다. 다시 말하자면, 너무 균일한 (homogeneous) 그룹은 오히려 쓸만한 변수를 도출하기 어렵다는 뜻으로 해석될 수 있습니다.
- 따라서 504명의 임상 의사의 처방이 데이터셋에 포함됩니다.
논문의 그림1. 데이터셋(cohort)에 포함시키기 위한 (환자가 가져야할) 조건
의사의 처방 성향에 대한 변수 정의
이 연구에서 의사의 처방 성향에 대한 정의는 간단합니다.
i번째 의사에 대해서, 전체 수면제 처방 횟수(t+z) 에 대해, trazodone의 처방 횟수(t)의 비율을 구합니다. 이는 의사의 선호를 나타내며 p로 정의됩니다. 추후 Logistic Regression에서의 변수로 쓰입니다. 이 때 추가적으로 시간을 반영하여 특정 시점의 선호는, 과거의 선호만을 반영합니다.
논문의 그림3.
데이터셋에 포함된 의사들의 처방 선호를 나타냅니다. Trazodone만을 쓰는 의사들이 있어, 오른쪽 끝 부분에 peak가 하나 있습니다.
LDA를 통한 Topic modeling
환자의 증상을 기술하는 임상 노트에 관하여, LDA를 사용합니다. K=5 (토픽이 5개)일 때가 성능이 가장 좋았다고 하며, 그 중에서도 임상 노트를 통한 변수에서는 Topic 1만이 통계적으로 유의하게 관여하였습니다. 성능 평가를 할 때, Perplexity를 고려하지 않은 것은 의문입니다. 왠지 정답을 알고 평가한 느낌이 들기도 합니다.
논문의 표2.
여기서 Odds Ratio (승산비) 가 1 보다 크다는 의미는, 어떤 의사가 과거에 trazodone을 처방하는 (선호) 성향을 보였을 경우, 새로운 환자에 대해서 첫번째 수면제 처방을 trazodone으로 처방할 확률이 높다는 것을 의미합니다.
논문의 표2.
결국 trazodone이 처방될 확률은, 의사의 선호와 Topic 1에 의해 결정됩니다. (Topic 2~5까지는 유의하지 않다고 해석하여 제외됩니다.) 그러면 Topic 1이 무엇인지 한번 살펴보는 것이 필요합니다.
논문의 그림4. Topic 1에 대한 상위 20 여 개의 키워드를 나타냅니다.
이 Topic1의 구성 요소를 볼 때, 우울(depression)과 불안(anxiety)을 나타내는 토픽을 의미한다고 해석하고 있습니다. 즉, 의사들은 환자들이 우울이나 불안과 관련된 이야기를 풀어놓을 때 trazodone을 처방하는 확률을 증가시키는 영향을 미친다는 것입니다.
결론 및 제한점
- 이 연구는 기존 통계적 변수가 자연어처리와 결합할 때, 어떻게 상보적으로 성능을 높이느냐를 보여줍니다. (Topic 1만을 변수로 쓰고, 의사 선호를 변수로 쓰지 않는 경우 AUC=0.54 정도 밖에 되지 않음을 지적합니다. 따라서 데이터는 상보적으로 사용되어야 합니다.) 하지만 LDA를 쓰지 않는 경우에도 AUC=0.764이기 때문에 K=5인 LDA의 AUC=0.769보다 성능 차이가 유의미하게 향상되는지 보기 어렵습니다.
- 의사의 특성과 환자의 특성을 결합해서 보고자 하는 시도는 의미가 있습니다. 하지만 Topic 1이 너무 넓고 모호해서, 과연 환자의 특성을 세부적으로 구분하고 있는지는 사실 의문입니다.
하지만 그럼에도 불구하고, 의사의 특성을 정의하고, 환자의 특성을 정의한다음, 이를 연결해서 살펴보겠다는 관점은 앞으로도 시도되어야한다고 생각합니다. 의사의 특성이나 성향은 사실 연구에서 소외되는 측면이 있었기 때문에, 이를 제대로 정의하고 측정할 수 있는 연구는 인간으로서의 의사를 명확히 바라보는데에 도움을 줄 것이라 생각합니다.
졸피뎀 처방 받아 복용하곤 하는데,
자고 일어나면 뭔가 너무 멍한 시간이 오래 가요 점점 -_-;
제가 임상에서 쓰이는 수면제 처방에 관해서 말씀드리기에는 조금 조심스럽습니다만, 진정 작용이 있을 수도 있을 것 같습니다. 처방 해주신 의사 선생님께 한번 말씀드려보는 것은 어떠실지 권유드려봅니다. 아무래도 직접 대면하여 개인의 상태를 알고 처방해주시는 선생님들께서, 가장 잘 알고 계시고 적합한 방향으로 제안주시지 않을까 생각합니다.
자세한 답변 감사합니다! :)
처방자의 처방성향을 고려한 모델. 소개 감사합니다. 흥미롭게 읽었습니다. ^^
결국 의사와 환자의 역동을 고려해본다면, 의사의 성향도 환자의 성향과 마찬가지로 중요하게 생각되어야할 것 같습니다. 특히 의료 분야에 AI나 다른 기법들을 도입한다고 할지라도, 결국 환자분들이 대면해야하는 사람들이 의사 선생님들이라는 것을 생각해보면 그렇습니다. 흥미로운 글로 봐주셔서 감사합니다.
의사가 아니고 전문지식이 없다보니 글을 완전히 이해했다고 할 수는 없지만, 의사의 성향을 연구의 주제로 삼는다는 아이디어는 참 좋은 것 같습니다. 실제로 우리만 해도 병원마다 '주는 약만 주는' 사례가 참 많잖아요.ㅎㅎ
저도 이러한 성향을 반영할 수 있다는 점이 흥미로웠습니다. 진료를 볼 때에는 약속처방 이 존재하기도 하는데, 사실 이러한 처방은 가이드라인과 기존의 경험을 반영하여, 각기 상황에 맞게 적합하게 설계되었을 가능성이 높습니다. 물론 이러한 설계에 대한 자세한 요인을 고찰하는 것은 또 다른 연구 주제가 될 수도 있겠습니다.
따라서 이러한 의미에서 말씀 주신 '주는 약만 주는' 사례의 경우에는, 역시 이러한 사례가 긍정적인지 부정적인지에 대해 판단하기는 저로서는 조금 어렵습니다. 다만 연구해볼만한 가치는 있다고 생각합니다. 핵심적인 아이디어를 읽어주셔서 감사합니다.
어렵지만 차근히 읽어보고 갑니다.
오늘도 행복한 하루 보내세요
네. 감사합니다. 행복한 하루 되세요 :)
의학 진단 보조 AI를 구성할 때 전문의의 도움을 받을 수 밖에 없는데, 데이터셋을 제공하는 전문의의 특성이 AI에 반영될 수 있다는 것을 염두해야겠네요.
전문의의 성향이나 특성을 판단할 수 있는 통계 자료 및 기준으로써 본문의 내용이 매우 의미 깊다고 생각합니다. 좋은 글 감사합니다.
네. 맞습니다. 그래서 유명한 연구들의 경우에는, 데이터셋을 판단함에 있어서 같은 데이터에 대해 2명 이상의 전문의 선생님들을 배치하고, 일치와 불일치를 살펴봅니다. 추가로 다른 전문의 선생님들을 배치하여 검토하는 작업을 하기도 합니다.
연구의 내용이 다소 단순해보이기는 하지만, 환자와 의사의 특성을 모두 반영해야한다는 점에서 의미가 있다고 생각합니다. 내용이 다행히 잘 읽힌 것 같아서 뿌듯합니다. 감사합니다.
일반의학분야에도 처방 의견이 분분한데 정신과같은 애매한곳은 많이 영향받을거같네요
대부분의 증상이나 질병에 대해서는 어느정도 가이드라인이 확립되어 있습니다만, 종종 판단하기 애매하거나 복잡한 지점이 발생할 때가 있습니다. 결국 얼마나 상황을 종합적으로 판단할 수 있느냐 그리고 이러한 판단에 성향이 존재할 수 있다는 점이 중요한 것 같습니다.
또한 이러한 영향이 과연 어떠한 요인으로 구성되어 있고 실제 진료에 어떠한 식으로 작용하며, 긍정적인 부분을 촉진하고 아닌 부분을 개선할 수 있을 것이냐에 대한 것은 좀 더 고민해보아야할 연구 주제인 것 같다는 생각이 듭니다.
예전에 데인적이 있어서 규정집같은게 만들어졌다고 본거 같긴하네요. 제가 너무 대충쓴거같은데 환자의 증언외에도 검사나 증상으로 다른 근거를 확보할 수 있는 다른분야와다르게 정신과는 대부분 환자의 말로만 파악해야하다보니 해석하는 사람의 영향이 다른 분야보다 클거같다는 생각이었습니다.
추가적으로 말씀주시니 조금더 이야기해주신 바가 명확해졌습니다. 동의합니다. 정신건강의학과에서 마주하는 임상적 상황의 경우에 아무래도 다른 임상과에 비해서 환자의 언어적 소통/기술에 따라 판단할 수 있는 범위가 클 것으로 생각합니다. 결국 아무래도 해석하는 사람의 영향/주관이 개입할 수 있는 여지가 좀 더 넓을 것 같습니다. 연구를 해본다면 그만큼 재미있는 분석도 많이 나올 것 같기도 하고요 :)
졸피뎀, 닥터 하우스에서 많이 들어본 것 같습니다. 의학은 전문성 만큼이나 의사의 주관에 많이 의지하는 것 같습니다. 왓슨은 어떻게 판단할지 궁금해집니다.
졸피뎀은 흔하게 들어보실 수 있는 약물 중 하나라고 알고 있습니다. 우리나라도 닥터 하우스에서 나오는 사례처럼, 논의와 추론이 충분히 이루어질 수 있는 환경이 촉진된다면 좋을 것 같습니다. 주관이라는 개념은 사실 임상 현장에서는 조금 애매하게 보일수도 있는데, 개인적으로는 의사의 경험과 맥락을 고려한 (쉽게 판단하기 어려운 지점에서의) 결정이라는 측면에서 바라보고 있습니다. 이러한 측면에서 저는, 왓슨에 대해서는 사실 50:50 정도로 긍정과 부정에 대한 시선을 같이 가지고 있긴 합니다.