TL;DR
- Neuro-Symbolic IR์ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ ๋ณด ๊ฒ์์ ๊ธฐํธ์ ํํ์ ๊ฒฐํฉํด, ๊ธฐ์กด dense retrieval์ด ์ ๋ค๋ฃจ์ง ๋ชปํ๋ negation, Boolean logic, multi-condition query ๊ฐ์ ๊ตฌ์กฐ์ ์ง์๋ฅผ ๋ ์ ํํ๊ฒ ์ฒ๋ฆฌํ๋ ค๋ ์ ๋ณด ๊ฒ์์ ์ฐ๊ตฌ ๋ฐฉํฅ
๐ง Neuro-Symbolic Information Retrieval (NS-IR)
Neuro-Symbolic IR์ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ์ ๋ณด ๊ฒ์(neural IR)์ ๊ฐ์ ๊ณผ ๊ธฐํธ์ ํํ(symbolic representation)์ ๊ฐ์ ์ ๊ฒฐํฉํ ์ ๊ทผ์ด๋ค. ์ง์์ ๋ฌธ์๋ฅผ ๋จ์ํ ์๋ฏธ์ ์ ์ฌ์ฑ๋ง์ผ๋ก ๋น๊ตํ๋ ๋ฐ์ ๋ฒ์ด๋, ์ฌ์ฉ์๊ฐ ๋ช ์ํ ๋ ผ๋ฆฌ์ ์กฐ๊ฑด๊ณผ ์ง์ ๊ตฌ์กฐ๋ฅผ ๊ฒ์ ๊ณผ์ ์ ๋ฐ์ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
๊ธฐ์กด dense retrieval์ ์ง์์ ๋ฌธ์๋ฅผ ๋ฒกํฐ๋ก ์๋ฒ ๋ฉํ์ฌ ์๋ฏธ์ ์ ์ฌ์ฑ์ ๊ณ์ฐํ๋ ๋ฐ ๊ฐ์ ์ด ์๋ค. ๊ทธ๋ฌ๋ NOT, AND, OR, ๋ค์ค ์ ์ฝ ์กฐ๊ฑด์ฒ๋ผ ๋ช
์์ ์ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง ์ง์๋ฅผ ์ถฉ๋ถํ ๋ฐ์ํ์ง ๋ชปํ ์ ์๋ค. ์ฆ, ์๋ฏธ์ ์ผ๋ก ๋น์ทํ ๋ฌธ์๋ฅผ ์ ์ฐพ๋ ๋ฅ๋ ฅ๊ณผ ๋ณ๊ฐ๋ก, ์ง์ ์์ ํฌํจ๋ ๋ถ์ ์กฐ๊ฑด์ด๋ ๊ฒฐํฉ ์กฐ๊ฑด์ ์ ๊ตํ๊ฒ ์ฒ๋ฆฌํ๋ ๊ณผ์ ์์ ํ๊ณ๊ฐ ๋๋ฌ๋๋ค.
Neuro-Symbolic IR์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ์ง์๋ฅผ ๋จ์ํ ๋ฌธ์์ด์ด ์๋๋ผ ๊ตฌ์กฐํ ๋ ํํ ์ผ๋ก ๋ค๋ฃฌ๋ค. ์ฌ๊ธฐ์ ์ฌ์ฉ๋๋ ๊ธฐํธ์ ํํ์ ํ๋๋ก ๊ณ ์ ๋์ง ์์ผ๋ฉฐ, ๊ฒฝ์ฐ์ ๋ฐ๋ผ 1์ฐจ ๋ ผ๋ฆฌ(FOL), logic rules, grammar/AST ๊ธฐ๋ฐ ํํ ๋ฑ์ด ์ฌ์ฉ๋๋ค. ํต์ฌ์ ๊ฒ์ ์์คํ ์ด ์ง์์ ๊ตฌ์กฐ๋ฅผ ๋ ๋ช ์์ ์ผ๋ก ํด์ํ๊ณ , ๋ฌธ์๊ฐ ๊ทธ ๊ตฌ์กฐ์ ์กฐ๊ฑด์ ์ผ๋ง๋ ๋ถํฉํ๋์ง๋ฅผ ๊ฒ์/ํํฐ๋ง/๋ฆฌ๋ญํน ๊ณผ์ ์ ๋ฐ์ํ๋ค๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด FOL ๊ธฐ๋ฐ ์ ๊ทผ์์๋ ๋ค์๊ณผ ๊ฐ์ ์ง์๋ฅผ ์๊ฐํ ์ ์๋ค.
- ์์ ์ง์: โํ๊ตญ์ AI ํ์ฌ๋ฅผ ์ฐพ์์ค. ๋จ, ๋ค์ด๋ฒ๋ ์ ์ธํ๊ณ .โ
- ์์์ ์์ํ: ์ด ํํ์ ํต์ฌ์ โAIโ, โํ๊ตญโ, โ๋ค์ด๋ฒโ๋ผ๋ ํค์๋์ ๋จ์ ์ถํ ์ฌ๋ถ๊ฐ ์๋๋ผ ํ๊ตญ์ AI ํ์ฌ์ด๋ฉด์ ๋์์ ๋ค์ด๋ฒ๋ ์๋ ๋์์ ์ฐพ๋๋ก ์ง์์ ๊ตฌ์กฐ๋ฅผ ๋ช ์ํ๋ค๋ ๋ฐ ์๋ค. ์์คํ ์ ์๋ฐํ ์ํ์ ์ฆ๋ช ์ ์ํํ๊ธฐ๋ณด๋ค๋, ๋ช ์๋ ๊ตฌ์กฐ์ ์กฐ๊ฑด์ ๋์กฐํ์ฌ ํ๋ณด ๋ฌธ์์ ๋ ผ๋ฆฌ์ ์ ํฉ์ฑ๊ณผ ์กฐ๊ฑด ์ผ๊ด์ฑ์ ์ ๋ฐํ๊ฒ ํ๊ฐํ๋ค.
๊ฒฐ๋ก ์ ์ผ๋ก Neuro-Symbolic IR์ ๋ฒกํฐ ๊ฒ์์ ๋์ฒดํ๋ ๊ฐ๋ ์ด ์๋๋ผ ๋ฒกํฐ ๊ธฐ๋ฐ ์๋ฏธ ๋งค์นญ ์์ ๊ธฐํธ์ ๊ตฌ์กฐ๋ฅผ ์ถ๊ฐํ๋ ๋ณด์์ ๋ฐฉ์ ์ผ๋ก ์ดํดํ ์ ์๋ค. ์ด๋ ๋ณต์กํ ๊ตฌ์กฐ์ ์ง์๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ ๊ฒฝ๋ง(neural) ๋ฐฉ๋ฒ๊ณผ ๊ธฐํธ(symbolic) ๋ฐฉ๋ฒ์ ๊ฒฐํฉํ๋ ์ ๋ณด ๊ฒ์์ ์ฐ๊ตฌ ํจ๋ฌ๋ค์ ์ผ๋ก ๋ณผ ์ ์๋ค.
๐ Related Notes
๐ References
-
- NS-IR ๊ฐ๋ ์ ์ง์ ์ ์ผ๋ก ๋ค๋ฃจ๋ ํต์ฌ ๋ ผ๋ฌธ์ด๋ค. negative-constraint query๋ฅผ ๋์์ผ๋ก FOL ๊ธฐ๋ฐ ๋ ผ๋ฆฌ ์ผ๊ด์ฑ์ retrieval/reranking์ ๋ฐ์ํ๋ ์ ๊ทผ๊ณผ NegConstraint ๋ฐ์ดํฐ์ ์ ์ ์.
-
Zhang et al. (2025). Neuro-Symbolic Query Compiler.
- neuro-symbolic retrieval์ด ๊ผญ FOL๋ง์ ๋ปํ์ง๋ ์๋๋ค๋ ์ ์ ๋ณด์ฌ์ฃผ๋ ๋ ผ๋ฌธ์ด๋ค. ์ง์๋ฅผ grammar/AST ๊ธฐ๋ฐ ๊ตฌ์กฐ๋ก ๋ณํํด ๋ณต์กํ ์ง์๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉํฅ์ ์ ์ํ๋ค.
-
Sun et al. (2024). Logic Rules as Explanations for Legal Case Retrieval.
- ๋ฒ๋ฅ ๊ฒ์ ๋๋ฉ์ธ์์ logic rules๋ฅผ retrieval์ ๊ฒฐํฉํ ์ฌ๋ก๋ค. symbolic structure๊ฐ ์ค์ ๊ฒ์ ๋ฌธ์ ์ ์ด๋ป๊ฒ ์ฐ์ผ ์ ์๋์ง ๋ณด์ฌ์ค๋ค.
-
Weller et al. (2024). NevIR: Negation in Neural Information Retrieval.
- neural IR์ด negation์ ์ผ๋ง๋ ์ ์ฒ๋ฆฌํ๋์ง ํ๊ฐํ ๋ํ ๋ฒค์น๋งํฌ ๋ ผ๋ฌธ์ด๋ค. NS-IR ๊ฐ์ ์ ๊ทผ์ด ์ ํ์ํ์ง ๋ฐฐ๊ฒฝ ๊ทผ๊ฑฐ๋ก ์ฐ๊ธฐ ์ข๋ค.
-
Zhang et al. (2024). BoolQuestions: Does Dense Retrieval Understand Boolean Logic in Language?
- dense retrieval์ด Boolean logic์ ์ผ๋ง๋ ์ดํดํ๋์ง ๋ถ์ํ ๋ ผ๋ฌธ์ด๋ค. AND/OR/NOT ๊ฐ์ ๊ตฌ์กฐ์ ์ง์์ ํ๊ณ๋ฅผ ์ค๋ช ํ ๋ ์ ์ฉํ๋ค.
-
Lu et al. (2025). MultiConIR: Towards Multi-Condition Information Retrieval.
- ๋ค์ค ์กฐ๊ฑด ์ง์๋ฅผ ๋์์ผ๋ก ํ ์ ๋ณด ๊ฒ์ ๋ฒค์น๋งํฌ ๋ ผ๋ฌธ์ด๋ค. ์กฐ๊ฑด ์๊ฐ ๋์ด๋ ์๋ก ๊ธฐ์กด retrieval ๋ชจ๋ธ์ด ์ด๋ ค์์ ๊ฒช๋๋ค๋ ์ ์ ๋ณด์ฌ์ค๋ค.
Discussion
Comments
๋๊ธ์ ์น์ธ ํ ๊ณต๊ฐ๋ฉ๋๋ค.