๐ชด ๋์งํธ ๊ฐ๋
Search
๊ฒ์
๋คํฌ ๋ชจ๋
๋ผ์ดํธ ๋ชจ๋
ํ์๊ธฐ
ํ๊ทธ: NLP
2๊ฑด์ ํญ๋ชฉ
2026๋ 3์ 22์ผ
Policy Gradient๋ฅผ ์ฒ์๋ถํฐ ์ดํดํ๊ธฐ
LLM
NLP
Reinforcement-Learning
RLHF
2026๋ 3์ 22์ผ
K-HALU
Dataset
Benchmark
NLP
Factuality
LLM
Hallucination