(3) tompson sampling 알고리즘1 Multi-Armed Bandit (MAB) Multi-Armed Bandit 문제는 기계학습과 알고리즘에서 자주 사용되는 개념으로,특히 '최적화'와 '탐험 vs 활용' (exploration vs exploitation)에 관한 문제를 다룰 때 유용합니다.이름에서 알 수 있드시 여러 개의 팔이 있는 도박기계(슬롯머신)에서 나온 비유로,간단히 말하면 어떤 선택지를 고를 때 각 선택이 줄 수 있는 이득을 최대화하는 방법을 찾아가는 것을 목표로 합니다. MAB의 기본 개념 이해하기MAB 문제를 '사탕기계 문제'로 비유해보겠습니다.여러분은 여러 개의 캔디 머신을 가지고 있고, 각 머신에 돈을 넣으면 맛있는 캔디가 나옵니다.그러나 각 캔디 머신은 주는 캔디의 양이나 맛이 조금씩 다릅니다.어떤 머신은 더 많은 캔디를 줄 수 있고, 어떤 머신은 조금 줄수도 .. 2024. 11. 13. 이전 1 다음