TL;DR
- ๋ถ์ ์ ์ฝ ์กฐ๊ฑด(Negative constraints)์ ํฌํจํ๋ ๋ณต์กํ ์ฟผ๋ฆฌ์ ๋ํ ์ ๋ณด ๊ฒ์(IR) ์์คํ ์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ .
- โA์ ๋ํด์ ์ฐพ๋, a๋ ์ ์ธํด ์คโ์ ๊ฐ์ ๋ ผ๋ฆฌ์ ์ผ๊ด์ฑ์ ํ ์คํธ.
๐ ๋ฐ์ดํฐ์ ๋ ธํธ
1. ๋ฐ์ดํฐ์ ์ ๋ณด
๐ก Tip: ๊ฐ๋ฅํ ๊ฒฝ์ฐ ์๋ณธ ์ถ์ฒ์ ๋งํฌ๋ฅผ ํจ๊ป ๊ธฐ๋กํ์ธ์.
- ์ค๋ช
:
- ๋ถ์ ์ ์ฝ ์กฐ๊ฑด(Negative Constraints)์ด ํฌํจ๋ ์ฟผ๋ฆฌ์ ๋ํด Dense Retriever๋ค์ด ์ผ๋ง๋ ์ ๋์ฒํ๋์ง ํ๊ฐํ๊ธฐ ์ํ ๋ฐ์ดํฐ์ . (์: โX์ ๋ํ ๋ฌธ์๋ฅผ ์ฐพ๋ Y๋ ์ ์ธํด๋ผโ)
- ์ํคํผ๋์(Wikipedia) ๋คํ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ถ๋์์ผ๋ฉฐ, GPT-4o๋ฅผ ์ด์ฉํด Positive/Negative ๋ฌธ์ ์์ ๊ธฐ๋ฐ์ผ๋ก ๋ณต์กํ ๋ ผ๋ฆฌ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํจ.
- ๋
ผ๋ฆฌ์ ๊ธฐ๋ฐ์ผ๋ก ํฌ๊ฒ 3๊ฐ์ง ์ ํ์ ์ฟผ๋ฆฌ๋ฅผ ํฌํจํจ:
- : ์งํฉ A์์ ๋ถ๋ถ์งํฉ a๋ฅผ ์ ์ธ.
- : A(a ์ ์ธ) ๋๋ B.
- : A(a ์ ์ธ) ๋๋ B(b ์ ์ธ).
- GitHub ์ ์ฅ์
- ๋ผ์ด์ ์ค: ๋ช ์์ ๋ผ์ด์ ์ค ํ์ธ ํ์
โ ๏ธ ์ฃผ์: ๋ผ์ด์ ์ค๋ฅผ ํ์ธํ์ฌ ์์ ์ ์ฌ์ฉ์ด ๊ฐ๋ฅํ์ง ๋ฐ๋์ ํ์ธํ์ธ์.
2. ๋ฐ์ดํฐ ๊ตฌ์กฐ

๐ก Tip: ๊ฐ๋ฅํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ์ ์์ ์คํฌ๋ฆฐ์ท์ ์ถ๊ฐํ์ธ์.
- ํน์ง:
- ์ ๋ณด ๊ฒ์(IR)์ ์ํ ์ง์(Query)์ ๋ฌธ์(Document)์ ์์ผ๋ก ๊ตฌ์ฑ๋จ.
- ๊ฐ ์ฟผ๋ฆฌ๋ง๋ค Positive(์กฐ๊ฑด ์ถฉ์กฑ), Negative(์กฐ๊ฑด ์๋ฐ), Irrelevant(๋ฌด๊ดํจ) ๋ฌธ์๋ค์ด ํฌํจ๋์ด ์์.
- ๋จ์ํ ์๋ฏธ์ ์ ์ฌ์ฑ(Semantic Similarity)์ ๋์ด 1์ฐจ ๋ ผ๋ฆฌ(First-Order Logic, FOL) ๊ธฐ๋ฐ์ ๋ ผ๋ฆฌ์ ์ผ๊ด์ฑ ๊ฒ์ฆ ๋ฅ๋ ฅ์ ํ ์คํธํจ.
- ์ํ ์:
- ์ด 366๊ฐ ์ง์
- : 136๊ฐ
- : 123๊ฐ
- : 107๊ฐ
- ์ด 366๊ฐ ์ง์
3. ๊ตฌ์ถ ๋ฐฉ์
- ์ธ๊ฐ ์ฃผ์ ๊ธฐ๋ฐ(human-annotated)์ผ๋ก ๊ตฌ์ฑ๋์๋ค.
- ๋ ผ๋ฌธ ๋ถ๋ก ๊ธฐ์ค์ผ๋ก, ๊ฒฝํ ์๋ annotator 3๋ช ์ด Wikipedia passage๋ฅผ ์ ๋ณํ๋ค.
- ์ดํ GPT-4o๋ฅผ ์ฌ์ฉํด positive/negative ๋ฌธ์๋ฅผ ๋ฐํ์ผ๋ก ์ง์๋ฅผ ์์ฑํ๋ค.
4. ํ์คํฌ ๋ฐ ํ์ฉ
- ์ฃผ์ ํ์คํฌ: Information-Retrieval , Logical-Reasoning
- ํ์ฉ ๋ชฉ์ : ๊ธฐ์กด dense retriever๊ฐ negative constraint๋ฅผ ํฌํจํ ์ง์์์ ์ผ๋ง๋ ์ทจ์ฝํ์ง ํ๊ฐํ๊ณ , ๊ทธ๋ฌํ ํ๊ณ๋ฅผ ๋ณด์ํ๋ retrieval / reranking ๊ธฐ๋ฒ์ ๋น๊ตํ๋ ๋ฐ ์ฌ์ฉ๋๋ค.
- ๊ด๋ จ ๋ฐฉ๋ฒ: ์ถ์ฒ ๋ ผ๋ฌธ์์๋ NS-IR์ ์ ์ํด FOL ๊ธฐ๋ฐ ๋ ผ๋ฆฌ ์ผ๊ด์ฑ์ ๋ฆฌ๋ญํน์ ๋ฐ์ํ๋ค.
Discussion
Comments
๋๊ธ์ ์น์ธ ํ ๊ณต๊ฐ๋ฉ๋๋ค.