Cohenโ€™s Kappa: ํ‰๊ฐ€์ž ๊ฐ„ ์‹ ๋ขฐ๋„์˜ ์ฒ™๋„

๋ฐ์ดํ„ฐ ๋ผ๋ฒจ๋ง์ด๋‚˜ ์„ฑ๋Šฅ ํ‰๊ฐ€์—์„œ๋Š” ์—ฌ๋Ÿฌ ํ‰๊ฐ€์ž๊ฐ€ ๋‚ด๋ฆฐ ํŒ๋‹จ์ด ์–ผ๋งˆ๋‚˜ ์ผ๊ด€์ ์ธ์ง€๊ฐ€ ๊ฒฐ๊ณผ์˜ ์‹ ๋ขฐ์„ฑ์„ ์ขŒ์šฐํ•œ๋‹ค.

์ด๋•Œ ๋‹จ์ˆœํžˆ โ€œ๋‘˜์ด ์–ผ๋งˆ๋‚˜ ์ž์ฃผ ๊ฐ™์€ ๋‹ต์„ ํ–ˆ๋Š”๊ฐ€โ€ ๋งŒ ๋ณด๋Š” ๊ฒƒ์€ ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ๋‹ค. ์–ด๋–ค ๊ฒฝ์šฐ์—๋Š” ํ‰๊ฐ€์ž๋“ค์ด ์šฐ์—ฐํžˆ๋„ ๊ฐ™์€ ๋‹ต์„ ์„ ํƒํ•  ๊ฐ€๋Šฅ์„ฑ ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. Cohenโ€™s kappa๋Š” ๋ฐ”๋กœ ์ด ์šฐ์—ฐ ์ผ์น˜(chance agreement) ๋ฅผ ๋ณด์ •ํ•ด, ๋‘ ํ‰๊ฐ€์ž ๊ฐ„์˜ ์‹ค์ œ ์ผ์น˜๋„๋ฅผ ๋” ๊ณต์ •ํ•˜๊ฒŒ ์ธก์ •ํ•˜๋ ค๋Š” ์ง€ํ‘œ์ด๋‹ค.


1. ์™œ ๋‹จ์ˆœ ์ผ์น˜์œจ๋งŒ์œผ๋กœ๋Š” ๋ถ€์กฑํ•œ๊ฐ€?

๊ฐ€์žฅ ์ง๊ด€์ ์ธ ์ง€ํ‘œ๋Š” ๋‹จ์ˆœ ์ผ์น˜์œจ(percent agreement) ์ด๋‹ค.

  • ๊ด€์ฐฐ ์ผ์น˜์œจ (): ์ „์ฒด ํ•ญ๋ชฉ ์ค‘ ๋‘ ํ‰๊ฐ€์ž๊ฐ€ ์‹ค์ œ๋กœ ๊ฐ™์€ ํŒ์ •์„ ๋‚ด๋ฆฐ ๋น„์œจ
  • ์šฐ์—ฐ ์ผ์น˜์œจ (): ๊ฐ ํ‰๊ฐ€์ž๊ฐ€ ํ‰์†Œ ์ž์ฃผ ์“ฐ๋Š” ๋ฒ”์ฃผ ๋ถ„ํฌ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ์šฐ์—ฐํžˆ ๊ฐ™์€ ํŒ์ •์„ ํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋˜๋Š” ๋น„์œจ

์˜ˆ๋ฅผ ๋“ค์–ด, ๋‘ ํ‰๊ฐ€์ž๊ฐ€ ๋Œ€๋ถ€๋ถ„์˜ ํ•ญ๋ชฉ์— ๋Œ€ํ•ด ๊ฑฐ์˜ ํ•ญ์ƒ Pass๋ฅผ ์„ ํƒํ•œ๋‹ค๋ฉด, ํŠน๋ณ„ํ•œ ํ•ฉ์˜๊ฐ€ ์—†์–ด๋„ ๋‹จ์ˆœ ์ผ์น˜์œจ์€ ๋†’๊ฒŒ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฐ ๊ฒฝ์šฐ ๋‹จ์ˆœ ์ผ์น˜์œจ๋งŒ ๋ณด๋ฉด ์‹ค์ œ๋ณด๋‹ค ์ผ์น˜๋„๊ฐ€ ๋†’์•„ ๋ณด์ผ ์ˆ˜ ์žˆ๋‹ค.

Cohenโ€™s kappa๋Š” ์ด ์ฐจ์ด๋ฅผ ๋ฐ˜์˜ํ•ด ๋‹ค์Œ์ฒ˜๋Ÿผ ๊ณ„์‚ฐํ•œ๋‹ค.

ํ•ด์„์€ ์ง๊ด€์ ์œผ๋กœ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

  • : ์™„์ „ํ•œ ์ผ์น˜
  • : ์šฐ์—ฐ ์ˆ˜์ค€์˜ ์ผ์น˜
  • : ์šฐ์—ฐ๋ณด๋‹ค๋„ ๋ชปํ•œ ์ผ์น˜

์ฆ‰, ๋‹จ์ˆœ ์ผ์น˜์œจ์—์„œ ์šฐ์—ฐํžˆ ์ผ์–ด๋‚  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„์„ ์ œ์™ธํ•˜๊ณ  ๋‚จ๋Š” ์ผ์น˜๋„ ๋ฅผ ํ‘œ์ค€ํ™”ํ•œ ๊ฐ’์ด๋ผ ์ดํ•ดํ•˜๋ฉด ๋œ๋‹ค.


2. ๋‹จ๊ณ„๋ณ„ ๊ณ„์‚ฐ ์˜ˆ์‹œ (Step-by-Step)

์ดํ•ด๋ฅผ ๋•๊ธฐ ์œ„ํ•ด 50๊ฐœ์˜ ๋ฌธ์žฅ์„ ๋‘ ๋ช…์˜ ํ‰๊ฐ€์ž(A, B)๊ฐ€ Safe ๋˜๋Š” Unsafe๋กœ ๋ถ„๋ฅ˜ํ•œ ๊ฐ€์ƒ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ดํŽด๋ณธ๋‹ค.

1๋‹จ๊ณ„: ํ˜ผ๋™ ํ–‰๋ ฌ(Confusion Matrix) ์ž‘์„ฑ

B: SafeB: Unsafeํ•ฉ๊ณ„ (A)
A: Safe37340
A: Unsafe2810
ํ•ฉ๊ณ„ (B)391150

2๋‹จ๊ณ„: ๊ด€์ฐฐ ์ผ์น˜์œจ () ๊ณ„์‚ฐ

๋‘ ์‚ฌ๋žŒ์˜ ์˜๊ฒฌ์ด ์‹ค์ œ๋กœ ์ผ์น˜ํ•œ ๋น„์œจ์ด๋‹ค.

3๋‹จ๊ณ„: ์šฐ์—ฐ ์ผ์น˜์œจ () ๊ณ„์‚ฐ

๊ฐ ํ‰๊ฐ€์ž์˜ ์„ฑํ–ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ์šฐ์—ฐํžˆ ์ผ์น˜ํ•  ํ™•๋ฅ ์„ ๊ตฌํ•œ๋‹ค.

  • ๋‘˜ ๋‹ค Safe๋ผ๊ณ  ํ•  ํ™•๋ฅ  : (A๊ฐ€ Safe๋ผ ํ•  ํ™•๋ฅ  40/50) ร— (B๊ฐ€ Safe๋ผ ํ•  ํ™•๋ฅ  39/50) =
  • ๋‘˜ ๋‹ค Unsafe๋ผ๊ณ  ํ•  ํ™•๋ฅ  : (A๊ฐ€ Unsafe๋ผ ํ•  ํ™•๋ฅ  10/50) ร— (B๊ฐ€ Unsafe๋ผ ํ•  ํ™•๋ฅ  11/50) =
  • ์šฐ์—ฐ ์ผ์น˜์œจ () :

4๋‹จ๊ณ„: Kappa () ์‚ฐ์ถœ

ํ•ด์„: ๋‹จ์ˆœ ์ผ์น˜์œจ์€ 90% ๋กœ ๋งค์šฐ ๋†’์•„ ๋ณด์ด์ง€๋งŒ, ์‹ค์ œ ์นดํŒŒ ๊ฐ’์€ 0.698 ์ด๋‹ค. Landis & Koch ๊ธฐ์ค€์— ๋”ฐ๋ฅด๋ฉด Substantial(์ƒ๋‹นํ•จ) ์ˆ˜์ค€์˜ ์ผ์น˜๋„์ด๋ฉฐ, ์•ฝ 20% ์ •๋„๋Š” ์šฐ์—ฐ์˜ ์˜ํ–ฅ์ด ์žˆ์—ˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.


3. ์ผ์น˜๋„ ํ•ด์„ ๊ธฐ์ค€

์‹ค๋ฌด์™€ ๋…ผ๋ฌธ์—์„œ ์ž์ฃผ ์ธ์šฉ๋˜๋Š” ํ•ด์„ ๊ธฐ์ค€์€ Landis & Koch (1977) ์˜ ๊ตฌ๋ถ„์ด๋‹ค.

Kappa ๊ฐ’ ()ํ•ด์„
< 0.00Poor
0.00 โ€“ 0.20Slight
0.21 โ€“ 0.40Fair
0.41 โ€“ 0.60Moderate
0.61 โ€“ 0.80Substantial
0.81 โ€“ 1.00Almost Perfect

๋‹ค๋งŒ ์ด ํ‘œ๋Š” ์ ˆ๋Œ€ ๊ธฐ์ค€ ์ด๋ผ๊ธฐ๋ณด๋‹ค, ์–ด๋””๊นŒ์ง€๋‚˜ ์ž์ฃผ ์“ฐ์ด๋Š” ๊ด€ํ–‰์  ๊ฐ€์ด๋“œ๋ผ์ธ ์œผ๋กœ ๋ณด๋Š” ํŽธ์ด ์ข‹๋‹ค. ์‹ค์ œ ํ•ด์„์€ ๋ฐ์ดํ„ฐ์˜ ๋ถˆ๊ท ํ˜• ์ •๋„, ๋ผ๋ฒจ๋ง ๋‚œ์ด๋„, ์—ฐ๊ตฌ ๋ชฉ์ ๊นŒ์ง€ ํ•จ๊ป˜ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.


4. Cohenโ€™s Kappa์˜ ํ™•์žฅ๊ณผ ๋ณ€ํ˜•

ํ‰๊ฐ€ ์ƒํ™ฉ์ด ๋‹ฌ๋ผ์ง€๋ฉด ๊ฐ™์€ ์นดํŒŒ ๊ณ„์—ด์ด๋ผ๋„ ์ ์ ˆํ•œ ์ •์˜๊ฐ€ ๋‹ฌ๋ผ์ง„๋‹ค.

4.1 Cohenโ€™s Kappa

  • ํ‰๊ฐ€์ž 2๋ช…์ผ ๋•Œ ์‚ฌ์šฉ
  • ๋ช…๋ชฉํ˜•(Nominal) ๋ฒ”์ฃผ์— ์ ํ•ฉ
  • ์˜ˆ: Pass / Fail, Spam / Not Spam, Safe / Unsafe

4.2 Weighted Kappa

  • ์ˆœ์„œํ˜•(Ordinal) ๋ฒ”์ฃผ์ผ ๋•Œ ์‚ฌ์šฉ
  • ์˜ˆ: ๋งค์šฐ ๋‚˜์จ / ๋‚˜์จ / ๋ณดํ†ต / ์ข‹์Œ
  • ์ˆœ์„œํ˜• ๋ฐ์ดํ„ฐ์—์„œ๋Š” ๋ชจ๋“  ๋ถˆ์ผ์น˜๊ฐ€ ๊ฐ™์€ ํฌ๊ธฐ๊ฐ€ ์•„๋‹ˆ๋ฏ€๋กœ ๋ถˆ์ผ์น˜ ์ •๋„์— ๋”ฐ๋ผ ๊ฐ€์ค‘์น˜(weight) ๋ฅผ ๋ถ€์—ฌํ•œ๋‹ค.
  • ๋ณดํ†ต linear weighting ๋˜๋Š” quadratic weighting์ด ํ•จ๊ป˜ ์–ธ๊ธ‰๋œ๋‹ค.

์ฆ‰, ๋งค์šฐ ๋‚˜์จ vs ๋‚˜์จ์˜ ๋ถˆ์ผ์น˜๋Š” ๋งค์šฐ ๋‚˜์จ vs ์ข‹์Œ์˜ ๋ถˆ์ผ์น˜๋ณด๋‹ค ๋œ ์‹ฌ๊ฐํ•˜๋‹ค๊ณ  ๋ณด๋Š” ๋ฐฉ์‹์ด๋‹ค.

4.3 Fleissโ€™ Kappa

  • 3๋ช… ์ด์ƒ์˜ ํ‰๊ฐ€์ž์— ๋Œ€ํ•œ ๋ฒ”์ฃผํ˜• ์ผ์น˜๋„๋ฅผ ๋ณผ ๋•Œ ์ž์ฃผ ์‚ฌ์šฉ
  • ์‹ค๋ฌด์—์„œ๋Š” Cohenโ€™s kappa์˜ ๋‹คํ‰๊ฐ€์ž ๋ฒ„์ „์ฒ˜๋Ÿผ ํ•จ๊ป˜ ์†Œ๊ฐœ๋˜์ง€๋งŒ, ์—„๋ฐ€ํžˆ๋Š” ๋‹คํ‰๊ฐ€์ž ๋ฒ”์ฃผํ˜• ์ผ์น˜๋„๋ฅผ ์œ„ํ•œ ๋ณ„๋„ ๊ณ„์—ด ์ง€ํ‘œ๋กœ ๋ณด๋Š” ํŽธ์ด ๋” ์ •ํ™•ํ•˜๋‹ค.

5. ์ฃผ์˜ํ•ด์•ผ ํ•  ์ 

5.1 Kappa๋Š” ๋‹จ์ˆœ ์ผ์น˜์œจ๊ณผ ๋‹ค๋ฅด๋‹ค

๋†’์€ ๋‹จ์ˆœ ์ผ์น˜์œจ์ด ํ•ญ์ƒ ๋†’์€ kappa๋ฅผ ์˜๋ฏธํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค. ํŠน์ • ๋ฒ”์ฃผ์— ์‘๋‹ต์ด ๋ชฐ๋ ค ์žˆ์œผ๋ฉด ๊ด€์ฐฐ ์ผ์น˜์œจ์€ ๋†’์•„๋„ ์นดํŒŒ๋Š” ๋‚ฎ์•„์งˆ ์ˆ˜ ์žˆ๋‹ค.

5.2 ๋ถˆ๊ท ํ˜• ๋ฐ์ดํ„ฐ์—์„œ๋Š” ํ•ด์„์— ์ฃผ์˜ํ•ด์•ผ ํ•œ๋‹ค

ํŠน์ • ๋ฒ”์ฃผ๊ฐ€ ์ง€๋‚˜์น˜๊ฒŒ ๋งŽ์ด ๋“ฑ์žฅํ•˜๋ฉด prevalence problem์ด ์ƒ๊ธธ ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋Œ€๋ถ€๋ถ„์ด Pass์ธ ๋ฐ์ดํ„ฐ์—์„œ๋Š” ํ‰๊ฐ€์ž๋“ค์ด ๊ฑฐ์˜ ํ•ญ์ƒ ๊ฐ™์€ ๋‹ต์„ ํ•ด๋„ ์นดํŒŒ๊ฐ€ ๊ธฐ๋Œ€๋ณด๋‹ค ๋‚ฎ๊ฒŒ ๋‚˜์˜ฌ ์ˆ˜ ์žˆ๋‹ค.

5.3 ๋‚ฎ์€ ์นดํŒŒ๋Š” ๊ณง๋ฐ”๋กœ โ€œํ‰๊ฐ€์ž ๋ฌธ์ œโ€๋ฅผ ๋œปํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค

์นดํŒŒ๊ฐ€ ๋‚ฎ์€ ์ด์œ ๋Š” ๋‹ค์–‘ํ•˜๋‹ค.

  • ๊ฐ€์ด๋“œ๋ผ์ธ์ด ๋ชจํ˜ธํ•จ
  • ํ‰๊ฐ€์ž ํ›ˆ๋ จ ๋ถ€์กฑ
  • ์• ์ดˆ์— ์• ๋งคํ•œ ํƒœ์Šคํฌ
  • ๋ฒ”์ฃผ ๋ถˆ๊ท ํ˜•
  • ํ‰๊ฐ€์ž๋ณ„ ๋ฒ”์ฃผ ์‚ฌ์šฉ ์Šต๊ด€ ์ฐจ์ด

๋”ฐ๋ผ์„œ ๋‚ฎ์€ kappa๋Š” ์žฌ๊ฒ€ํ† ๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋Š” ์‹ ํ˜ธ๋กœ ๋ณด๋Š” ๊ฒƒ์ด ์ ์ ˆํ•˜๋‹ค.

5.4 ์นดํŒŒ๋Š” ์ƒ๊ด€๊ณ„์ˆ˜๊ฐ€ ์•„๋‹ˆ๋‹ค

๋‘ ํ‰๊ฐ€์ž๊ฐ€ ๋น„์Šทํ•œ ๊ฒฝํ–ฅ์„ ๋ณด์ธ๋‹ค๊ณ  ํ•ด์„œ ๋ฐ˜๋“œ์‹œ ๋†’์€ agreement๊ฐ€ ์žˆ๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. ์นดํŒŒ๋Š” ์ƒ๊ด€(correlation) ์ด ์•„๋‹ˆ๋ผ agreement ๋ฅผ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ์ด๋‹ค.


6. ์ƒ์„ฑ ๋ฐ์ดํ„ฐ ๊ฒ€์ˆ˜ ๊ด€์ ์—์„œ์˜ ์˜๋ฏธ

์ƒ์„ฑ ๋ฐ์ดํ„ฐ ๊ฒ€์ˆ˜์—์„œ๋Š” ๋ณดํ†ต ์ผ๋ถ€ ์ƒ˜ํ”Œ์„ ์‚ฌ๋žŒ์ด ํ‰๊ฐ€ํ•˜๊ฒŒ ๋œ๋‹ค. ์ด๋•Œ ์นดํŒŒ๋Š” ๋‹ค์Œ ์งˆ๋ฌธ์— ๋‹ตํ•œ๋‹ค.

๊ฐ™์€ ์ƒ˜ํ”Œ์„ ๋ณธ ๋‘ ํ‰๊ฐ€์ž์˜ ํŒ๋‹จ์ด, ์šฐ์—ฐ ์ด์ƒ์˜ ์ˆ˜์ค€์œผ๋กœ ์ผ๊ด€์ ์ธ๊ฐ€?

์˜ˆ๋ฅผ ๋“ค์–ด:

  • ์‘๋‹ต์ด ์ •์ฑ… ์œ„๋ฐ˜์ธ์ง€ ์•„๋‹Œ์ง€
  • ์ƒ์„ฑ ๊ฒฐ๊ณผ๊ฐ€ ์‚ฌ์‹ค์ ์œผ๋กœ ๋งž๋Š”์ง€ ์•„๋‹Œ์ง€
  • ๋‹ต๋ณ€ ํ’ˆ์งˆ์ด ์ข‹์Œ / ๋ณดํ†ต / ๋‚˜์จ ์ค‘ ์–ด๋””์ธ์ง€

๊ฐ™์€ ํ•ญ๋ชฉ์„ ๋‘ ํ‰๊ฐ€์ž๊ฐ€ ๋…๋ฆฝ์ ์œผ๋กœ ํ‰๊ฐ€ํ–ˆ์„ ๋•Œ, ์นดํŒŒ๊ฐ€ ์ถฉ๋ถ„ํžˆ ๋†’๋‹ค๋ฉด ๊ฒ€์ˆ˜ ๊ธฐ์ค€์ด ๋น„๊ต์  ์•ˆ์ •์ ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.


7. ํ•จ๊ป˜ ๋ณด๋ฉด ์ข‹์€ ๋Œ€์•ˆ ์ง€ํ‘œ

  • Krippendorffโ€™s Alpha
    • ๊ฒฐ์ธก๊ฐ’์ด ์žˆ๊ฑฐ๋‚˜, ํ‰๊ฐ€์ž ์ˆ˜๊ฐ€ ๊ณ ์ •๋˜์ง€ ์•Š๊ฑฐ๋‚˜, ๋‹ค์–‘ํ•œ ์ฒ™๋„(๋ช…๋ชฉ/์ˆœ์„œ/๊ตฌ๊ฐ„)๋ฅผ ๋‹ค๋ฃจ๊ณ  ์‹ถ์„ ๋•Œ ๋” ์œ ์—ฐํ•˜๊ฒŒ ์‚ฌ์šฉ
  • ICC (Intraclass Correlation Coefficient)
    • ์—ฐ์†ํ˜• ๋˜๋Š” ์ ์ˆ˜ํ˜• ๋ฐ์ดํ„ฐ์—์„œ ํ‰๊ฐ€์ž ๊ฐ„ ์ผ์น˜๋„๋ฅผ ๋ณผ ๋•Œ ์ž์ฃผ ์‚ฌ์šฉ

์ฆ‰, ์นดํŒŒ๋Š” ๋งค์šฐ ์œ ์šฉํ•˜์ง€๋งŒ ๋ชจ๋“  ์œ ํ˜•์˜ ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋งŒ๋Šฅ ํ•ด๋ฒ•์€ ์•„๋‹ˆ๋‹ค.


8. ์ •๋ฆฌ

Cohenโ€™s kappa๋Š” ๋‘ ํ‰๊ฐ€์ž์˜ ๋ฒ”์ฃผํ˜• ํŒ๋‹จ์ด ์–ผ๋งˆ๋‚˜ ์ผ๊ด€์ ์ธ์ง€๋ฅผ, ์šฐ์—ฐ ์ผ์น˜๋ฅผ ๋ณด์ •ํ•ด์„œ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ์ด๋‹ค.

ํ•ต์‹ฌ์€ ๋‹ค์Œ ๋‘ ๊ฐ€์ง€์ด๋‹ค.

  1. ๋‹จ์ˆœ ์ผ์น˜์œจ๋ณด๋‹ค ๋” ์—„๊ฒฉํ•œ agreement ์ง€ํ‘œ๋ผ๋Š” ์ 
  2. ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์™€ ํ‰๊ฐ€ ์„ค๊ณ„์— ๋”ฐ๋ผ ๊ฐ’์ด ํฌ๊ฒŒ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๋งฅ๋ฝ ์†์—์„œ ํ•ด์„ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ 

๋”ฐ๋ผ์„œ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ ๊ฒ€์ˆ˜, ๋ผ๋ฒจ๋ง ํ’ˆ์งˆ ํ‰๊ฐ€, ์‚ฌ๋žŒ ํ‰๊ฐ€ ๊ธฐ๋ฐ˜ ๋ฒค์น˜๋งˆํฌ ์„ค๊ณ„์—์„œ ์นดํŒŒ๋Š” ๋งค์šฐ ์œ ์šฉํ•˜์ง€๋งŒ ํ•ญ์ƒ ๋ฒ”์ฃผ ๋ถˆ๊ท ํ˜•, ์ฒ™๋„ ์œ ํ˜•, ํ‰๊ฐ€์ž ์ˆ˜๋ฅผ ํ•จ๊ป˜ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.


โ“Key Concepts to Clarify

  • Krippendorffโ€™s Alpha: ๊ฒฐ์ธก์น˜๋‚˜ ๋‹ค์–‘ํ•œ ์ฒ™๋„๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ๋” ์œ ์—ฐํ•œ ์ผ์น˜๋„ ์ง€ํ‘œ
  • ICC: ์—ฐ์†ํ˜•/์ ์ˆ˜ํ˜• ๋ฐ์ดํ„ฐ์—์„œ์˜ ํ‰๊ฐ€์ž ๊ฐ„ ์ผ์น˜๋„ ์ง€ํ‘œ
  • Weighted Kappa: ์ˆœ์„œํ˜• ๋ฒ”์ฃผ์—์„œ ๋ถˆ์ผ์น˜ ์ •๋„์— ์ฐจ๋“ฑ์„ ๋‘๋Š” ์นดํŒŒ
  • Prevalence Problem: ๋ฒ”์ฃผ ๋ถˆ๊ท ํ˜• ๋•Œ๋ฌธ์— ๋‹จ์ˆœ ์ผ์น˜์œจ๊ณผ ์นดํŒŒ๊ฐ€ ์–ด๊ธ‹๋‚  ์ˆ˜ ์žˆ๋Š” ํ˜„์ƒ

๐Ÿ“Ž References

๐Ÿ“‘ Core Theory & Foundation

๐Ÿ“ Interpretation & Guidelines

โš ๏ธ Limitations & Advanced Topics

๐Ÿ’ป Implementation Tools

  • Scikit-learn: cohen_kappa_score: Python์„ ์ด์šฉํ•œ Cohenโ€™s Kappa ๋ฐ Weighted Kappa ๊ตฌํ˜„ API.
  • Statsmodels: fleiss_kappa: ๋‹ค์ˆ˜ ํ‰๊ฐ€์ž ์ผ์น˜๋„(Fleissโ€™ Kappa) ๊ณ„์‚ฐ์„ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๊ฐ€์ด๋“œ.