본문 바로가기

Data Science/Algorithm21

RAG (Retrieval-Augmented Generation) RAG는 Retrieval Augmented Generation의 약자로, 검색과 생성을 결합한 자연어 처리 접근 방식입니다.이는 대규모 언어 모델(LLM)과 검색 시스템을 통합하여 높은 정확도와 콘텍스트 의존적 결과를 생성합니다. RAG는 왜 사용하는가?대규모 언어모델(LLM)만을 사용하여 생성하는 방식은 답변의 정확도의 한계가 있어 이를 보완하고 보다 정확하고 신뢰성 높은 결과를 제공하기 위함입니다. 조금 더 구체적으로 이야기해보면,LLM의 지식은 고정적이기 때문에 최신 정보나 특정 도메인 데이터에 대한 답변이 부정확하거나 불가능할 수 있습니다.그리고 LLM 하면 함께 등장했던 환각(hallucination) 문제도 존재하기 때문에,답변 생성을 요청할 때 질문과 관련된 문서들을 포함시켜서 질문하게 되.. 2024. 11. 16.
최소 자승법 (Least Squares Method) 개념최소자승법은 데이터를 가장 잘 설명할 수 있는 직선(또는 곡선)을 찾는 방법입니다. 예를 들어,어떤 가계에서 일주일 동안 하루하루 아이스크림이 몇 개나 팔렸는지 기록이 있다고 생각해 봅시다.이 데이터를 보면 어떤 날은 많이 팔리고, 어떤 날은 조금 팔리고 해서 숫자가 들쭉날쭉 할 텐데요. 이 아이스크림 판매량이전반적으로 증가하는지, 감소하는지, 또는 그냥 비슷하게 유지되는지 알고 싶은 경우최소 자승법을 사용하면 데이터를 가장 잘 설명할 수 있는 "최적의 직선"을 찾을 수 있습니다. 파란색 점은 각 요일의 실제 아이스크림 판매량을 나타내고,빨간색 선은 최소 자승법을 통해 구한 "최적의 직선"입니다.그래서 그래프를 해석하면 아이스크림 판매량이 전반적으로 증가하고 있다고 봐도 될 거 같죠? 세부내용x가 날.. 2024. 11. 15.
Contextual Bandit & LinUCB Contextual Bandit은 주로 추천 시스템, 광고 배치, A/B 테스트와 같은 문제에서 사용되는강화 학습 (또는 온라인 학습) 알고리즘으로시스템은 사용자 또는 상황에 맞는 최적의 활동을 선택할 수 있습니다. Contextual Bandit이전 글(링크)에서 설명드렸던 MAB에서 파생된 개념입니다. 다중 슬롯머신 문제는 여러 슬롯머신 중 하나를 선택해 최적의 보상을 얻는 것을 목표로 하는 문제입니다.하지만 Contextual Bandit에서는 선택할 때 상황에 대한 정보가 추가됩니다. 예를 들어 날씨가 더운 날에는 아이스크림 가게가 인기가 있고, 추운 날에는 핫초고 가계가 인기 있을 수 있는 것처럼요. Agent는 주어진 컨텍스트를 통해 각각의 행동을 선택하며,각 행동은 보상(Reward)을 가지.. 2024. 11. 14.
Multi-Armed Bandit (MAB) Multi-Armed Bandit 문제는 기계학습과 알고리즘에서 자주 사용되는 개념으로,특히 '최적화'와 '탐험 vs 활용' (exploration vs exploitation)에 관한 문제를 다룰 때 유용합니다.이름에서 알 수 있드시 여러 개의 팔이 있는 도박기계(슬롯머신)에서 나온 비유로,간단히 말하면 어떤 선택지를 고를 때 각 선택이 줄 수 있는 이득을 최대화하는 방법을 찾아가는 것을 목표로 합니다. MAB의 기본 개념 이해하기MAB 문제를 '사탕기계 문제'로 비유해보겠습니다.여러분은 여러 개의 캔디 머신을 가지고 있고, 각 머신에 돈을 넣으면 맛있는 캔디가 나옵니다.그러나 각 캔디 머신은 주는 캔디의 양이나 맛이 조금씩 다릅니다.어떤 머신은 더 많은 캔디를 줄 수 있고, 어떤 머신은 조금 줄수도 .. 2024. 11. 13.