πŸ“‚ 데이터셋 λ…ΈνŠΈ


1. 데이터셋 정보

πŸ’‘ Tip: κ°€λŠ₯ν•œ 경우 원본 좜처의 링크λ₯Ό ν•¨κ»˜ κΈ°λ‘ν•˜μ„Έμš”.

  • μ„€λͺ…:
    • ν™˜κ° μ—¬λΆ€ νŒλ³„ λŠ₯λ ₯을 ν‰κ°€ν•˜κΈ° μœ„ν•œ 벀치마크 데이터셋.
    • ν•΄λ‹Ή 데이터셋은 λ¬Έν™”, 경제, 역사, 세계, 의료, μ‚¬νšŒ, κΈ°μˆ μ— ν•΄λ‹Ήν•˜λŠ” 7κ°€μ§€ λ„λ©”μΈμ˜ 지문을 λ°”νƒ•μœΌλ‘œ 사싀에 ν•΄λ‹Ήν•˜λŠ” λ‚΄μš©κ³Ό ν™˜κ°μ— ν•΄λ‹Ήν•˜λŠ” λ‚΄μš©μ„ ν¬ν•¨ν•œ 5개의 μ„ νƒμ§€λ‘œ ꡬ성됨. 각 μƒ˜ν”Œμ€ 사싀 λ˜λŠ” ν™˜κ°μ— ν•΄λ‹Ήν•˜λŠ” 선택지λ₯Ό μ£Όμ–΄μ§„ μ§€μ‹œμ— λ”°λΌμ„œ μ„ λ³„ν•˜μ—¬ μ •λ‹΅μœΌλ‘œ μ˜ˆμΈ‘ν•˜λ„λ‘ ꡬ성. μ •λ‹΅μ˜ 경우 5개 μ„ νƒμ§€μ˜ λ ˆμ΄λΈ” 인덱슀λ₯Ό λ‚˜νƒ€λ‚΄λ„λ‘ 리슀트 ν˜•νƒœλ‘œ ν‘œν˜„λ˜μ–΄ 있으며, 볡수의 정닡을 ν—ˆμš©ν•¨.
    • λ‹€μŒ 두가지 μΈμŠ€νŠΈλŸ­μ…˜μœΌλ‘œ ꡬ성
      • ν™˜κ° λ¬Έμž₯을 κ³ λ₯΄λŠ” μΈμŠ€νŠΈλŸ­μ…˜: μ£Όμ–΄μ§„ λ¬Έμ„œμ˜ λ‚΄μš©κ³Ό λ‹€λ₯΄κ±°λ‚˜ λΆˆν™•μ‹€ν•œ ν™˜κ° λ¬Έμž₯을 κ³ λ₯΄μ‹œμ˜€. 단, ν™˜κ° λ¬Έμž₯은 μ—¬λŸ¬ 개 μ‘΄μž¬ν•  수 μžˆλ‹€.
      • μ •λ‹΅ λ¬Έμž₯을 κ³ λ₯΄λŠ” μΈμŠ€νŠΈλŸ­μ…˜: μ£Όμ–΄μ§„ λ¬Έμ„œλ₯Ό 톡해 νŒŒμ•…ν•  수 μžˆλŠ” λ‚΄μš©μ— ν•΄λ‹Ήν•˜λŠ” λ¬Έμž₯을 μ„ νƒν•˜μ‹œμ˜€. 단, μ •λ‹΅ λ¬Έμž₯은 μ—¬λŸ¬ 개 μ‘΄μž¬ν•  수 μžˆλ‹€.
    • https://github.com/J-Seo/K-HALU
    • https://www.aihub.or.kr/aihubdata/data/view.do?&aihubDataSe=extrldata&dataSetSn=71872
  • λΌμ΄μ„ μŠ€: ν•œκ΅­μ •λ³΄ν™”μ§„ν₯원(NIA)의 데이터 이용 μ •μ±… 및 등둝 절차λ₯Ό μ€€μˆ˜(AI-HUB)

⚠️ 주의: λΌμ΄μ„ μŠ€λ₯Ό ν™•μΈν•˜μ—¬ 상업적 μ‚¬μš©μ΄ κ°€λŠ₯ν•œμ§€ λ°˜λ“œμ‹œ ν™•μΈν•˜μ„Έμš”.


2. 데이터 ꡬ쑰

πŸ’‘ Tip: κ°€λŠ₯ν•œ 경우 데이터 μ…‹ μ˜ˆμ‹œ μŠ€ν¬λ¦°μƒ·μ„ μΆ”κ°€ν•˜μ„Έμš”.

  • νŠΉμ§•:
    • Multiple Choice Instruction 데이터셋
    • λ‹€μ–‘ν•œ 도메인을 λ°”νƒ•μœΌλ‘œ 벀치마크 ꡬ성
  • μƒ˜ν”Œ 수: 2k

3. νƒœμŠ€ν¬ 및 ν™œμš©

  • μ£Όμš” νƒœμŠ€ν¬: Factuality Hallucination
  • 벀치마크 μ„±λŠ₯: [λͺ¨λΈ μ„±λŠ₯ (μžˆλ‹€λ©΄)]

Reference