๐Ÿ“‚ ๋ฐ์ดํ„ฐ์…‹ ๋…ธํŠธ

1. ๋ฐ์ดํ„ฐ์…‹ ์ •๋ณด

๐Ÿ’ก Tip: ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ ์›๋ณธ ์ถœ์ฒ˜์˜ ๋งํฌ๋ฅผ ํ•จ๊ป˜ ๊ธฐ๋กํ•˜์„ธ์š”.

  • ์„ค๋ช…:
    • ๋ถ€์ • ์ œ์•ฝ ์กฐ๊ฑด(Negative Constraints)์ด ํฌํ•จ๋œ ์ฟผ๋ฆฌ์— ๋Œ€ํ•ด Dense Retriever๋“ค์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ๋Œ€์ฒ˜ํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ์…‹. (์˜ˆ: โ€œX์— ๋Œ€ํ•œ ๋ฌธ์„œ๋ฅผ ์ฐพ๋˜ Y๋Š” ์ œ์™ธํ•ด๋ผโ€)
    • ์œ„ํ‚คํ”ผ๋””์•„(Wikipedia) ๋คํ”„๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ์œผ๋ฉฐ, GPT-4o๋ฅผ ์ด์šฉํ•ด Positive/Negative ๋ฌธ์„œ ์Œ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ณต์žกํ•œ ๋…ผ๋ฆฌ ์ฟผ๋ฆฌ๋ฅผ ์ƒ์„ฑํ•จ.
    • ๋…ผ๋ฆฌ์‹ ๊ธฐ๋ฐ˜์œผ๋กœ ํฌ๊ฒŒ 3๊ฐ€์ง€ ์œ ํ˜•์˜ ์ฟผ๋ฆฌ๋ฅผ ํฌํ•จํ•จ:
      1. : ์ง‘ํ•ฉ A์—์„œ ๋ถ€๋ถ„์ง‘ํ•ฉ a๋ฅผ ์ œ์™ธ.
      2. : A(a ์ œ์™ธ) ๋˜๋Š” B.
      3. : A(a ์ œ์™ธ) ๋˜๋Š” B(b ์ œ์™ธ).
    • GitHub ์ €์žฅ์†Œ
  • ๋ผ์ด์„ ์Šค: ๋ช…์‹œ์  ๋ผ์ด์„ ์Šค ํ™•์ธ ํ•„์š”

โš ๏ธ ์ฃผ์˜: ๋ผ์ด์„ ์Šค๋ฅผ ํ™•์ธํ•˜์—ฌ ์ƒ์—…์  ์‚ฌ์šฉ์ด ๊ฐ€๋Šฅํ•œ์ง€ ๋ฐ˜๋“œ์‹œ ํ™•์ธํ•˜์„ธ์š”.


2. ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ

๐Ÿ’ก Tip: ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ ์…‹ ์˜ˆ์‹œ ์Šคํฌ๋ฆฐ์ƒท์„ ์ถ”๊ฐ€ํ•˜์„ธ์š”.

  • ํŠน์ง•:
    • ์ •๋ณด ๊ฒ€์ƒ‰(IR)์„ ์œ„ํ•œ ์งˆ์˜(Query)์™€ ๋ฌธ์„œ(Document)์˜ ์Œ์œผ๋กœ ๊ตฌ์„ฑ๋จ.
    • ๊ฐ ์ฟผ๋ฆฌ๋งˆ๋‹ค Positive(์กฐ๊ฑด ์ถฉ์กฑ), Negative(์กฐ๊ฑด ์œ„๋ฐ˜), Irrelevant(๋ฌด๊ด€ํ•จ) ๋ฌธ์„œ๋“ค์ด ํฌํ•จ๋˜์–ด ์žˆ์Œ.
    • ๋‹จ์ˆœํ•œ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ(Semantic Similarity)์„ ๋„˜์–ด 1์ฐจ ๋…ผ๋ฆฌ(First-Order Logic, FOL) ๊ธฐ๋ฐ˜์˜ ๋…ผ๋ฆฌ์  ์ผ๊ด€์„ฑ ๊ฒ€์ฆ ๋Šฅ๋ ฅ์„ ํ…Œ์ŠคํŠธํ•จ.
    • ์ƒ˜ํ”Œ ์ˆ˜:
      • ์ด 366๊ฐœ ์งˆ์˜
        • : 136๊ฐœ
        • : 123๊ฐœ
        • : 107๊ฐœ

3. ๊ตฌ์ถ• ๋ฐฉ์‹

  • ์ธ๊ฐ„ ์ฃผ์„ ๊ธฐ๋ฐ˜(human-annotated)์œผ๋กœ ๊ตฌ์„ฑ๋˜์—ˆ๋‹ค.
  • ๋…ผ๋ฌธ ๋ถ€๋ก ๊ธฐ์ค€์œผ๋กœ, ๊ฒฝํ—˜ ์žˆ๋Š” annotator 3๋ช…์ด Wikipedia passage๋ฅผ ์„ ๋ณ„ํ–ˆ๋‹ค.
  • ์ดํ›„ GPT-4o๋ฅผ ์‚ฌ์šฉํ•ด positive/negative ๋ฌธ์„œ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์งˆ์˜๋ฅผ ์ƒ์„ฑํ–ˆ๋‹ค.

4. ํƒœ์Šคํฌ ๋ฐ ํ™œ์šฉ

  • ์ฃผ์š” ํƒœ์Šคํฌ: Information-Retrieval , Logical-Reasoning
  • ํ™œ์šฉ ๋ชฉ์ : ๊ธฐ์กด dense retriever๊ฐ€ negative constraint๋ฅผ ํฌํ•จํ•œ ์งˆ์˜์—์„œ ์–ผ๋งˆ๋‚˜ ์ทจ์•ฝํ•œ์ง€ ํ‰๊ฐ€ํ•˜๊ณ , ๊ทธ๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ๋ณด์™„ํ•˜๋Š” retrieval / reranking ๊ธฐ๋ฒ•์„ ๋น„๊ตํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.
  • ๊ด€๋ จ ๋ฐฉ๋ฒ•: ์ถœ์ฒ˜ ๋…ผ๋ฌธ์—์„œ๋Š” NS-IR์„ ์ œ์•ˆํ•ด FOL ๊ธฐ๋ฐ˜ ๋…ผ๋ฆฌ ์ผ๊ด€์„ฑ์„ ๋ฆฌ๋žญํ‚น์— ๋ฐ˜์˜ํ•œ๋‹ค.