AI ์์ด์ ํธ์ ํต์ฌ ๊ฐ๋ 20๊ฐ์ง: ๋ฌธ์ ์ ํด๊ฒฐ์ฑ ์ผ๋ก ๋ฐฐ์ฐ๋ ์ค์ ๊ฐ์ด๋

AI ์์ด์ ํธ๋ ๋จ์ํ ์ฑ๋ด์ ๋์ด ๋ณต์กํ ์์ ์ ์์จ์ ์ผ๋ก ์ํํ๋ ์์คํ ์ผ๋ก ์งํํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ด ๊ณผ์ ์์ ์๋ง์ ๊ธฐ์ ์ ๋์ ๊ณผ์ ๋ค์ด ์กด์ฌํฉ๋๋ค.
์ด ๊ธ์์๋ AI ์์ด์ ํธ๊ฐ ์ง๋ฉดํ๋ 20๊ฐ์ง ํต์ฌ ๋ฌธ์ ์ ๊ทธ ํด๊ฒฐ์ฑ ์ ํ๋์ฉ ํ์ด๊ฐ๋ฉฐ, ์ค์ ๊ธฐ์ ์ฌ๋ก์ ํจ๊ป ์ค๋ช ํ๊ฒ ์ต๋๋ค.
ํด๋น ๋ฌธํญ์ Tom Yeh ๊ต์๋์ Agentic AI Problem Set์ ๋ฐํ์ผ๋ก ์ ์๋์์ต๋๋ค.
-
Agent Loop: ํผ๋๋ฐฑ ์์ด ๋งน๋ชฉ์ ์ผ๋ก ํ๋ํ๋ ๋ฌธ์
๋ฌธ์ ์ํฉ
๋์ ๊ฐ๊ณ 10์ด ๋์ ์ด์ ํ๋ค๊ณ ์์ํด ๋ณด์ธ์. ์ฒ์์๋ ๋๋ฐ๋ก ๊ฐ ์ ์๊ฒ ์ง๋ง, ์คํฐ์ด๋ง์ ์์ ํ ์๊ฐ์ ํผ๋๋ฐฑ์ด ์๊ธฐ ๋๋ฌธ์ ๊ณง ๋๋ก๋ฅผ ๋ฒ์ด๋๊ฒ ๋ ๊ฒ์ ๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, ๊ฐ ๋จ๊ณ์ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ์ง ์๊ณ ์ผ๋ จ์ ๋จ๊ณ๋ฅผ ์คํํ๊ธฐ๋ง ํ๋ ์์ด์ ํธ(โopen loopโ)๋ ์ด๋ค ๋จ๊ณ์์ ์กฐ๊ธ๋ง ์๋ชป๋์ด๋ ์คํจํ๊ฒ ๋ฉ๋๋ค.
ํด๊ฒฐ์ฑ
Agent Loop๋ ๋ชจ๋ ํ๋ ํ์ โํ์ธโ ๋จ๊ณ๋ฅผ ๋์ ํฉ๋๋ค:
- Observe (๊ด์ฐฐ): ํ์ฌ ์ํ๋ฅผ ๋ด ๋๋ค.
- Think (์๊ฐ): ๊ด์ฐฐ์ ๋ฐํ์ผ๋ก ๋ค์์ ๋ฌด์์ ํ ์ง ๊ฒฐ์ ํฉ๋๋ค.
- Act (ํ๋): ํ๋์ ์คํํฉ๋๋ค.
- Repeat (๋ฐ๋ณต): 1๋จ๊ณ๋ก ๋์๊ฐ๋๋ค.
์ด ์ฃผ๊ธฐ๋ฅผ ํตํด ์์ด์ ํธ๋ ์์์น ๋ชปํ ์ค๋ฅ(์: โํ์ผ์ ์ฐพ์ ์ ์์โ -> โ๋ค๋ฅธ ํ์ผ๋ช ์ผ๋ก ์๋โ)๋ฅผ ์ฒ๋ฆฌํ๊ณ ๋์ ์ธ ํ๊ฒฝ์ ์ ์ํ ์ ์์ต๋๋ค.
์ค์ ์ฌ๋ก: Amazon์ ๋ด๋ถ ์ฝ๋ฉ ์์ด์ ํธ
Amazon ์์ง๋์ด๋ค์ ์ฝ๋ ๋ฆฌ๋ทฐ๋ ์์คํ ์ ๊ทธ๋ ์ด๋์ ๊ฐ์ ์์ ์ ๋ด๋ถ AI ์์ด์ ํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ด ์์ด์ ํธ๋ค์ ์ฝ๋๋ฅผ ํ ๋ฒ ์์ฑํ๊ณ ๋๋ด๋ ๊ฒ์ด ์๋๋ผ, ์ฝ๋๋ฅผ ์คํํ๊ณ ์ปดํ์ผ๋ฌ ์ค๋ฅ๋ ํ ์คํธ ์คํจ๋ฅผ ๊ด์ฐฐํ ๋ค์, ๋น๋๊ฐ ํต๊ณผํ ๋๊น์ง ์์ ์ ์ค์๋ฅผ ์์ ํ๋ ๋ฃจํ๋ฅผ ๋ฐ๋ณตํ์ฌ ๊ฐ๋ฐ์์ ์๊ณ ๋ฅผ ํฌ๊ฒ ์ค์ฌ์ค๋๋ค.
-
Graph of Thought: ์ฌ๋ฌ ์ถ๋ก ๋ถ๊ธฐ๋ฅผ ์ฐ๊ฒฐํ๋ ๋ฐฉ๋ฒ
๋ฌธ์ ์ํฉ
ํ์ค์ ์ธ โChain of Thoughtโ ์ถ๋ก ์ ์ ํ์ ์ ๋๋ค: A -> B -> C. ๋ง์ฝ ์์ด์ ํธ๊ฐ ๊ฒฝ๋ก A์ ํต์ฐฐ๋ ฅ(์: โ์ฉ์์๋ ๋ฐ๋์ ์์๋คโ)๊ณผ ๊ฒฝ๋ก B์ ํต์ฐฐ๋ ฅ(์: โ์ด์ธ ํ๊ธฐ๋ ํ๋ฆฌ์์๋ง ํ๋งค๋๋คโ)์ ๊ฒฐํฉํด์ผ ํ๋ค๋ฉด, ์ ํ์ ์ธ ์ฒด์ธ์ ์ด ์์ด๋์ด๋ค์ ๋ช ์์ ์ผ๋ก ๋์ง์ด๋ณด๊ณ ๋ณํฉํ์ง ์๋ ํ ์ฐ๊ฒฐ ๊ณ ๋ฆฌ๋ฅผ ๋์น ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
Graph of Thought (GoT)๋ ์ถ๋ก ์ ์ ์ด ์๋ ๋คํธ์ํฌ(๊ทธ๋ํ)๋ก ๋ชจ๋ธ๋งํฉ๋๋ค:
- Nodes (๋ ธ๋): ์๊ฐ ๋๋ ์ ๋ณด ์ํ
- Edges (์ฃ์ง): ์ฐ๊ฒฐ ๋๋ ์์กด์ฑ
์ด๋ฅผ ํตํด ์์ด์ ํธ๋ ๋ค์์ ์ํํ ์ ์์ต๋๋ค:
- Aggregate (์ง๊ณ): ์ธ ๊ฐ์ง ๋ค๋ฅธ ๋ธ๋ ์ธ์คํ ๋ฐ ๋ถ๊ธฐ์ ๊ฒฐ๊ณผ๋ฅผ ํ๋์ ์ต์ ์ ์๋ฃจ์ ์ผ๋ก ๊ฒฐํฉ
- Loop (๋ฃจํ): ์๋ก์ด ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์ด์ ์๊ฐ์ผ๋ก ๋๋์๊ฐ
- Branch (๋ถ๊ธฐ): ์ฌ๋ฌ ๊ฐ๋ฅ์ฑ์ ๋ณ๋ ฌ๋ก ํ์ํ ๋ค์ ์ฑ๊ณต์ ์ธ ๊ฒ๋ค์ ๋ณํฉ
์ด๋ ๋ง์น ํ์ฌ๊ฐ ๋ฒฝ์ ์ฌ์ง๋ค์ ๋ถ์ด๊ณ ์ค๋ก ์ฐ๊ฒฐํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
์ค์ ์ฌ๋ก: ์ ์ฝ ์ ์ฝ ๊ฐ๋ฐ
๋ณต์กํ ์ ์ฝ ๊ฐ๋ฐ ๊ณผ์ ์์ ์ฐ๊ตฌ์๋ค์ ๋ถ์ ์๋ฌผํ, ์์ ์ํ ์ด๋ ฅ, ํํ ์ ์กฐ ์ ์ฝ ์กฐ๊ฑด์ ํต์ฐฐ๋ ฅ์ ์ฐ๊ฒฐํด์ผ ํฉ๋๋ค. Graph of Thought ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ๋ฉด AI ์์ด์ ํธ๊ฐ ์ด๋ฌํ ๋ณ๊ฐ์ ๊ณผํ ์์ญ์ ๋ณ๋ ฌ๋ก ํ์ํ ๋ค์, ์๋ฌผํ์ ์ผ๋ก ํจ๊ณผ์ ์ด๊ณ ์์ ํ๋ฉฐ ๋์์ ์ ์กฐ ๊ฐ๋ฅํ ์ฝ๋ฌผ ํ๋ณด๋ฅผ ์ ์ํ ์ ์์ต๋๋ค.
-
Orchestration: ๋๊ตฌ์ ๋ฐ์ดํฐ์ ๋๊ธฐํ ๋ฌธ์
๋ฌธ์ ์ํฉ
์์ด์ ํธ๊ฐ ๋ณต์กํด์ง์ ๋ฐ๋ผ ์ฌ๋ฌ ๋๊ตฌ(๊ฒ์, ๊ณ์ฐ๊ธฐ, ๋ฐ์ดํฐ๋ฒ ์ด์ค)๋ฅผ ์ฌ์ฉํ๊ฒ ๋ฉ๋๋ค. ๊ด๋ฆฌ์๊ฐ ์์ผ๋ฉด ๋ฐ์ดํฐ๊ฐ ์์ค๋ฉ๋๋ค. ๊ฒ์ ๋๊ตฌ์ ์ถ๋ ฅ์ด ๊ณ์ฐ๊ธฐ์ ๋ง๋ ํ์์ด ์๋๊ฑฐ๋, ๊ณ์ฐ์ด ๋๋๊ธฐ๋ ์ ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ ๋ฐ์ดํธ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
Orchestration์ ์์คํ ์ โ๊ตํต ๊ด์ ์ฌโ ๋๋ โ์งํ์โ์ ๋๋ค:
- Data Flow (๋ฐ์ดํฐ ํ๋ฆ): 1๋จ๊ณ์ ์ถ๋ ฅ์ 2๋จ๊ณ์ ์ ๋ ฅ์ผ๋ก ์ ๋ฌ
- Error Handling (์ค๋ฅ ์ฒ๋ฆฌ): ์คํจํ ๋จ๊ณ๋ฅผ ์ฌ์๋ํ๊ฑฐ๋ ์ฌ์ฉ์์๊ฒ ์๋ฆผ
- State Management (์ํ ๊ด๋ฆฌ): ๋ฌด์์ด ์๋ฃ๋์๊ณ ๋ฌด์์ด ๋จ์๋์ง ์ถ์
์ด๋ ๋๊ตฌ๋ค์ โ๊ตํฅ๊ณกโ์ด ์์์ด ์๋๋ผ ์กฐํ๋ฅผ ์ด๋ฃจ๋๋ก ๋ณด์ฅํฉ๋๋ค.
์ค์ ์ฌ๋ก: Moveworks์ IT ์ง์
Moveworks๋ ์ง์ IT ํฐ์ผ์ ํด๊ฒฐํ๊ธฐ ์ํด ์ค์ผ์คํธ๋ ์ด์ ์์ง์ ์ฌ์ฉํฉ๋๋ค. ์ฌ์ฉ์๊ฐ โ์ํํธ์จ์ด ์ก์ธ์ค๊ฐ ํ์ํดโ๋ผ๊ณ ๋งํ๋ฉด, ์ค์ผ์คํธ๋ ์ดํฐ๋ ์ฌ๋ฌ ์ ๋ฌธ ์์ด์ ํธ๋ฅผ ์กฐ์ ํฉ๋๋ค. ํ๋๋ ์ฌ์ฉ์์ ์ ์์ ํ์ธํ๊ณ , ๋ค๋ฅธ ํ๋๋ ์ฌ๊ณ ์์คํ ์์ ๋ผ์ด์ ์ค ๊ฐ์ฉ์ฑ์ ํ์ธํ๋ฉฐ, ์ธ ๋ฒ์งธ๋ API๋ฅผ ํตํด ์ก์ธ์ค๋ฅผ ํ๋ก๋น์ ๋ํฉ๋๋ค.
-
Model Control Protocol (MCP): ์ผ๊ด๋ ๋๊ตฌ ์ ๊ทผ ํ์ค
๋ฌธ์ ์ํฉ
์์ด์ ํธ๋ฅผ Google Drive์ ์ฐ๊ฒฐํ๋ ค๋ฉด ํน์ ์ฝ๋๋ฅผ ์์ฑํด์ผ ํฉ๋๋ค. Slack์ ์ฐ๊ฒฐํ๋ ค๋ฉด ๋ค๋ฅธ ์ฝ๋๋ฅผ ์์ฑํด์ผ ํฉ๋๋ค. ๋ก์ปฌ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ฐ๊ฒฐํ๋ ค๋ฉด ๋ ๋ค๋ฅธ ์ฝ๋๊ฐ ํ์ํฉ๋๋ค. ์ด๋ฌํ โ์คํ๊ฒํฐ ํตํฉโ์ ์ ์ง ๊ด๋ฆฌํ๊ธฐ ์ด๋ ต๊ณ ๋ณด์์ ์ทจ์ฝํฉ๋๋ค.
ํด๊ฒฐ์ฑ
MCP๋ AI๋ฅผ ์ํ USB์ ๊ฐ์ ํ์ค์ ๋๋ค:
- Universal Standard (๋ณดํธ์ ํ์ค): ์ด๋ค ์์ด์ ํธ๋ ์ด๋ค ๋ฐ์ดํฐ ์์ค๋ ๋๊ตฌ์๋ ๋ํํ ์ ์๋ ๋จ์ผ ๋ฐฉ์์ ์ ์
- Security (๋ณด์): ๊ถํ(์: โ์ฝ๊ธฐ ์ ์ฉโ ์ก์ธ์ค)์ ์ํ ์ผ๊ด๋ ๊ณ์ธต ์ ๊ณต
- Portability (์ด์์ฑ): Claude์์ GPT-4๋ก ์ ํํ๋๋ผ๋ ๋๊ตฌ ํตํฉ์ ๋ค์ ์์ฑํ ํ์ ์์
์ค์ ์ฌ๋ก: Block (๊ตฌ Square)
Block์ Snowflake, Jira, Slack์ ํฌํจํ ๋ด๋ถ ์์ง๋์ด๋ง ๋๊ตฌ์ MCP๋ฅผ ํตํฉํ์ต๋๋ค. ๊ฐ ๋๊ตฌ๋ง๋ค ์ปค์คํ ์ฑ๋ด์ ๋ง๋๋ ๋์ , MCP๋ฅผ ์ฌ์ฉํ์ฌ ์ด ๋ชจ๋ ์์คํ ์ ์์ ํ๊ฒ ์ก์ธ์คํ๋ ๋จ์ผ ๋ด๋ถ ์์ด์ ํธ(โGooseโ)๋ฅผ ๊ตฌ์ถํ์ต๋๋ค.
-
Graph RAG: ๋ฌธ์ ๊ฐ ๊ด๊ณ ์ถ๋ก ํ๊ธฐ
๋ฌธ์ ์ํฉ
ํ์ค RAG๋ ํค์๋ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ๋ฌธ์๋ฅผ ๊ฒ์ํฉ๋๋ค. ๋ฌธ์ A๊ฐ โํ๋ก์ ํธ Xโ๋ฅผ ์ธ๊ธํ๊ณ ๋ฌธ์ B๊ฐ โํ๋ก์ ํธ X๊ฐ ์ง์ฐ๋์๋คโ๊ณ ์ธ๊ธํ์ง๋ง, ๋ ๋ฌธ์ ๋ชจ๋ โ์ง์ฐ ์์ธโ์ ์ธ๊ธํ์ง ์๋๋ค๋ฉด, ํ์ค RAG๋ ์ฐ๊ฒฐ ๊ณ ๋ฆฌ๋ฅผ ๋์น ์ ์์ต๋๋ค. ์ ๋ค์ ๋ณด์ง๋ง ์ ๋ค์ ์ฐ๊ฒฐํ๋ ์ ์ ๋ณด์ง ๋ชปํ๋ ๊ฒ์ ๋๋ค.
ํด๊ฒฐ์ฑ
Graph RAG๋ ๊ฒ์ ์ ์ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์กฐํํ๊ธฐ ์ํด Knowledge Graph๋ฅผ ์ฌ์ฉํฉ๋๋ค:
- Entities (๊ฐ์ฒด): ์ฌ๋, ์ฅ์, ๊ฐ๋ (๋ ธ๋)
- Relationships (๊ด๊ณ): โ๊ทผ๋ฌด์ฒโ, โ์์นโ, โ์์ธโ (์ฃ์ง)
์ง๋ฌธ์ ํ๋ฉด ๊ทธ๋ํ๋ฅผ ์ํํฉ๋๋ค. โ์ง์ฐ๋ ๋ณด๊ณ ์๋ฅผ ์์ฑํ ์ฌ๋์ ๊ด๋ฆฌ์๋ ๋๊ตฌ์ธ๊ฐ?โ์ ๊ฐ์ด ๋ต์ด ์ธ ๊ฐ์ ๋ค๋ฅธ ๋ฌธ์์ ๊ฑธ์ณ ์๋๋ผ๋ โ๋ฉํฐ ํ(multi-hop)โ ์ถ๋ก ์ด ๊ฐ๋ฅํฉ๋๋ค.
์ค์ ์ฌ๋ก: LinkedIn ๊ณ ๊ฐ ์ง์
LinkedIn์ ๋ฒกํฐ ๊ฒ์๊ณผ ๊ณผ๊ฑฐ ๋ฌธ์ ํฐ์ผ์ ์ง์ ๊ทธ๋ํ๋ฅผ ๊ฒฐํฉํ Graph RAG ์์คํ ์ ๊ตฌํํ์ต๋๋ค. ๊ณ ๊ฐ์ด ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ณด๊ณ ํ ๋, ์์คํ ์ ๊ทธ๋ํ๋ฅผ ์ํํ์ฌ ๊ด๋ จ๋ ํ์ ๋ฌธ์ , ๊ทผ๋ณธ ์์ธ, ๊ณผ๊ฑฐ์ ์ฑ๊ณต์ ์ธ ํด๊ฒฐ ๊ฒฝ๋ก๋ฅผ ์ฐพ์๋ ๋๋ค.
-
LLM Agent: ์๋ก์ด ์ง์์ฌํญ์ ๋ํ ์ผ๋ฐํ
๋ฌธ์ ์ํฉ
๊ตฌ์ โ์ฑ๋ดโ์ด๋ ์คํฌ๋ฆฝํธ๋ ์๊ฒฉํ if-then ๊ท์น์ ๋ฐ๋ฆ ๋๋ค. โํ๋ถ ๋ดโ์๊ฒ โ์ด ๋ฌผ๊ฑด์ด ๊ณ ์ฅ ๋์ ๋ฐํํ๊ณ ์ถ์ดโ๋ผ๊ณ ํ๋ฉด ์๋ํฉ๋๋ค. ํ์ง๋ง โ์ด๊ฑธ ์๋๋ฐ ์ฐ์ฐ์กฐ๊ฐ ๋ฌ์ด, ์ด๋ป๊ฒ ํด์ผ ํด?โ๋ผ๊ณ ๋ฌผ์ผ๋ฉด, ๊ท์น ๊ธฐ๋ฐ ๋ด์ โ์ฐ์ฐ์กฐ๊ฐ(shattered)โ์ ๋ํ ๊ท์น์ด ์์ผ๋ฉด ์คํจํ ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
LLM Agent๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๋๋๋ก ์ฌ์ฉํฉ๋๋ค:
- Reasoning (์ถ๋ก ): โ์ฐ์ฐ์กฐ๊ฐโ์ด โ๊ณ ์ฅโ๊ณผ โ๋ฐํโ์ ์๋ฏธํ๋ค๋ ๊ฒ์ ์ดํด
- Adaptability (์ ์์ฑ): ์์์ ์ฌ์ฉํ์ฌ ์ด์ ์ ๋ณธ ์ ์๋ ์ง์์ฌํญ์ ์ฒ๋ฆฌ
- Tool Use (๋๊ตฌ ์ฌ์ฉ): ๋จ์ํ ํค์๋ ๋งค์นญ์ด ์๋๋ผ ์ดํด๋ฅผ ๋ฐํ์ผ๋ก ์ ์ฉํ ๊ท์น์ด๋ ๋๊ตฌ๋ฅผ ๊ฒฐ์
์ค์ ์ฌ๋ก: Tidio Lyro
Tidio์ ๊ณ ๊ฐ ์ง์ ์์ด์ ํธ์ธ Lyro๋ LLM์ ์ฌ์ฉํ์ฌ ๊ณ ๊ฐ ๋ฌธ์์ ์ต๋ 70%๋ฅผ ์๋์ผ๋ก ํด๊ฒฐํฉ๋๋ค. ์ ํํ ํค์๋๊ฐ ํ์ํ๋ ๊ตฌ์ ์ฑ๋ด๊ณผ ๋ฌ๋ฆฌ, Lyro๋ ๋ณต์กํ๊ณ ์์ ์ ์ธ ์ง๋ฌธ์ ์ดํดํ๊ณ ํ์ฌ์ ์ง์ ๋ฌธ์๋ฅผ ์ถ๋ก ํ์ฌ ์์ฐ์ค๋ฝ๊ณ ์ ํํ ๋ต๋ณ์ ์ ๊ณตํฉ๋๋ค.
-
Safety Guardrails: ๊ฒฝ๊ณ๋ฅผ ์งํค๋ ์์ ์ฅ์น
๋ฌธ์ ์ํฉ
์์จ ์์ด์ ํธ๋ ๊ฐ๋ ฅํ ์์ง๊ณผ ๊ฐ์ต๋๋ค. โ๋ถํ์ํ ํ์ผ ์ญ์ โ๋ฅผ ์ง์ํ๋ฉด, ์ด์ ์ฒด์ ํ์ผ์ โ๋ถํ์โํ๋ค๊ณ ํ๋จํ์ฌ ์ญ์ ํ ์๋ ์์ต๋๋ค. ์๋ ค์ฃผ์ง ์๋ ํ ๋ฌด์์ด โ๊ธ์ง ๊ตฌ์ญโ์ธ์ง ๋ณธ์ง์ ์ผ๋ก ์์ง ๋ชปํฉ๋๋ค.
ํด๊ฒฐ์ฑ
Guardrails๋ ๋ณผ๋ง์ โ๋ฒํผโ๋ ๋์ดํฐ์ โ์ธํ๋ฆฌโ์ ๊ฐ์ต๋๋ค:
- Input Rails (์ ๋ ฅ ๋ ์ผ): ์์ด์ ํธ๊ฐ ์ ์์ ์ธ ํ๋กฌํํธ(์: โ์ด์ ์ ๋ชจ๋ ์ง์ ๋ฌด์โ)๋ฅผ ์ฒ๋ฆฌํ์ง ๋ชปํ๊ฒ ํจ
- Output Rails (์ถ๋ ฅ ๋ ์ผ): ์์ด์ ํธ๊ฐ ๋ถ์พํ ๋ง์ ํ์ง ๋ชปํ๊ฒ ํจ
- Action Rails (ํ๋ ๋ ์ผ): ์์ด์ ํธ๊ฐ ์ฌ๋์ ์น์ธ ์์ด ์ํํ ๋๊ตฌ(์:
delete_database)๋ฅผ ํธ์ถํ์ง ๋ชปํ๊ฒ ํจ
์ค์ ์ฌ๋ก: Microsoft Azure AI Content Safety
Azure OpenAI Service๋ฅผ ์ฌ์ฉํ๋ ๊ธฐ์ ๋ค์ ํ์ฅ ์๋๋ PII ์ ์ถ์ ์๋์ผ๋ก ๊ฐ์งํ๊ณ ์ฐจ๋จํ๊ธฐ ์ํด ๊ฐ๋๋ ์ผ์ ๊ตฌํํฉ๋๋ค. ์ํ ์ฑ๋ด์ LLM์ด ๋์์ด ๋๊ณ ์ถ์ด์ ๊ณ ๊ฐ์ ์ ์ฒด ์ ์ฉ์นด๋ ๋ฒํธ๋ฅผ ํ์ธํด ์ฃผ๋ ค๊ณ ํ๋๋ผ๋, ์ด๋ฅผ ์ ๋ ์ถ๋ ฅํ์ง ๋ชปํ๋๋ก ์๊ฒฉํ๊ฒ ์ฐจ๋จํฉ๋๋ค.
-
Critic: ์ถ๋ ฅ ํ์ง ํฅ์์ ์ํ ํ๋จ์
๋ฌธ์ ์ํฉ
์์ด์ ํธ์๊ฒ โ์๋ฅผ ์จ์คโ๋ผ๊ณ ํ๋ฉด ์๋ฅผ ์ธ ๊ฒ์ ๋๋ค. ํ์ง๋ง ๊ทธ๊ฒ ์ข์ ์์ผ๊น์? ์ง๋๋ฒ ๊ฒ๋ณด๋ค ๋ ๋์ ์์ผ๊น์? ํ์ค ์์ด์ ํธ๋ ํ์ง์ด๋ ํน์ ์คํ์ผ ์ ํธ๋๋ฅผ ์ต์ ํํ๊ธฐ๋ณด๋ค๋ ๋จ์ํ ์์ ์ ์๋ฃํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
ํด๊ฒฐ์ฑ
Critic์ ์ถ๋ ฅ์ ํ๋จํ๋ ๋ณ๋์ ์ญํ ๋๋ ๋ชจ๋ธ์ ๋๋ค:
- Evaluation (ํ๊ฐ): โ์ด ์๋ ๋ผ์์ ๋ง์ง๋ง ์ด์จ์ด ์ ๋ง์.โ
- Feedback (ํผ๋๋ฐฑ): ์์ฑ๊ธฐ(Generator)์๊ฒ ๊ตฌ์ฒด์ ์ธ ํผ๋๋ฐฑ์ ์ค
- Iterative Improvement (๋ฐ๋ณต์ ๊ฐ์ ): ์์ฑ๊ธฐ๋ ์ด ํผ๋๋ฐฑ์ ์ฌ์ฉํ์ฌ ๋ ๋์ ๋ฒ์ ์ ์์ฑ
์ด๋ โํ๋ ๊ฒโ๊ณผ โํ๋จํ๋ ๊ฒโ์ ๋ถ๋ฆฌํ์ฌ ๋ ๋์ ํ์ง์ ๊ฒฐ๊ณผ๋ฅผ ์ด๋์ด๋ ๋๋ค.
์ค์ ์ฌ๋ก: ์๋ํ๋ ์ฝ๋ ๋ฆฌ๋ทฐ ์์คํ
์ํํธ์จ์ด ๊ฐ๋ฐ์์ โCoder Agentโ๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํจ์๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. ๋ณ๋์ โCritic Agentโ๋ ๋ณด์ ์ทจ์ฝ์ , ์คํ์ผ ๊ฐ์ด๋ ์๋ฐ, ํจ์จ์ฑ์ ์ํด ์ฝ๋๋ฅผ ๊ฒํ ํฉ๋๋ค. ๋ง์ฝ ์์ ํ์ง ์์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ค๋ฉด ์ฝ๋๋ฅผ ๊ฑฐ๋ถํ๊ณ , ์ฌ๋์ด ๋ณด๊ธฐ ์ ์ ๋ค์ ์์ฑํ๋๋ก ๊ฐ์ ํฉ๋๋ค.
-
Plan-and-Execute: ๊ณํ ํ ์คํ
๋ฌธ์ ์ํฉ
์์ด์ ํธ์๊ฒ โAI์ ์ญ์ฌ๋ฅผ ์กฐ์ฌํ๊ณ ๋ณด๊ณ ์๋ฅผ ์์ฑํดโ๋ผ๊ณ ํ๋ฉด, ๋ฐ์ํ ์์ด์ ํธ๋ ์ฆ์ โAI ์ญ์ฌโ๋ฅผ ๊ฒ์ํ๊ธฐ ์์ํ๊ณ , ์ํคํผ๋์ ๋งํฌ์ ์ ์ ์ด ํ๋ ค ์์ฑํ ์์ฝ์ ์์ฑํ ์ ์์ต๋๋ค. ์ด๋ ์ฒญ์ฌ์ง ์์ด ์ง์ ์ง๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํด๊ฒฐ์ฑ
Plan-and-Execute ํจํด์ ์ด๋ค ํ๋์ ํ๊ธฐ ์ ์ โ๊ณํ ๋จ๊ณโ๋ฅผ ๊ฐ์ ํฉ๋๋ค:
- Plan (๊ณํ): โ1๋จ๊ณ: 1950-1980๋ ๊ฒ์. 2๋จ๊ณ: 1980-2000๋ ๊ฒ์. 3๋จ๊ณ: ๋ณด๊ณ ์ ๊ฐ์ ์์ฑ. 4๋จ๊ณ: ์์ฑ.โ
- Execute (์คํ): ๊ณํ์ ์๊ฒฉํ๊ฒ ๋ฐ๋ฆ
์ด๋ โ์ผ์ฒํฌ๋ก ๋น ์ง๋ ๊ฒ(rabbit holes)โ์ ์ค์ด๊ณ ์ฌ์ฉ์ ์์ฒญ์ ๋ชจ๋ ๋ถ๋ถ์ด ์ฒ๋ฆฌ๋๋๋ก ๋ณด์ฅํฉ๋๋ค.
์ค์ ์ฌ๋ก: ๋ฒ๋ฅ ๊ณ์ฝ ๊ฒํ
๋กํ์ด AI๋ฅผ ์ฌ์ฉํ์ฌ 100ํ์ด์ง ๋ถ๋์ ํฉ๋ณ ๊ณ์ฝ์๋ฅผ ๊ฒํ ํ ๋, ์์ด์ ํธ๋ 1ํ์ด์ง๋ถํฐ ์ฝ๊ธฐ ์์ํ์ง ์์ต๋๋ค. ๋จผ์ ๊ณํ์ ์ธ์๋๋ค: โ1. ๋ชจ๋ ๋ฉด์ฑ ์กฐํญ ์๋ณ. 2. ํ์ค ์ฑ ์ ํ๋์ ์ํธ ์ฐธ์กฐ. 3. ํธ์ฐจ ํ์. 4. ์ํ ์์ฝ.โ ์ด๋ฌํ ๊ตฌ์กฐ์ ์ ๊ทผ ๋ฐฉ์์ ์ค์ํ ์น์ ์ ๊ฑด๋๋ฐ์ง ์๋๋ก ๋ณด์ฅํฉ๋๋ค.
-
RAG: ๊ฐ์ธ ๋ฐ์ดํฐ๋ก ์ถ๋ก ๊ฐํํ๊ธฐ
๋ฌธ์ ์ํฉ
LLM์ ๊ณต๊ฐ ์ธํฐ๋ท ๋ฐ์ดํฐ๋ก ํ๋ จ๋์์ต๋๋ค. ๋ํต๋ น์ด ๋๊ตฌ์ธ์ง๋ ์์ง๋ง, ํ์ฌ์ โ3๋ถ๊ธฐ ๋งค์ถ ๋ณด๊ณ ์โ๋ ๊ฐ์ธ์ ์ธ โํ์๋กโ์ ๋ชจ๋ฆ ๋๋ค. ์ด์ ๋ํด ๋ฌผ์ด๋ณด๋ฉด ๋ชจ๋ธ์ โ๋ชจ๋ฅธ๋คโ๊ณ ํ๊ฑฐ๋ ํ๊ฐ(hallucinate)์ ์ผ์ผํฌ ๊ฒ์ ๋๋ค.
ํด๊ฒฐ์ฑ
RAG (Retrieval-Augmented Generation)๋ ๋ชจ๋ธ์๊ฒ โ์คํ ๋ถโ ์ํ์ ๋ณด๊ฒ ํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค:
- Retrieve (๊ฒ์): ์์คํ ์ ๊ฐ์ธ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ํน์ ๋ฌธ์๋ฅผ ์ฐพ์
- Augment (์ฆ๊ฐ): ์ด ํ ์คํธ๋ฅผ ํ๋กฌํํธ์ ๋ถ์ฌ๋ฃ์
- Generate (์์ฑ): ๋ชจ๋ธ์ ๊ทธ ํ ์คํธ๋ฅผ ์ฌ์ฉํ์ฌ ์ง๋ฌธ์ ๋ตํจ
์ด๋ ๋ชจ๋ธ์ ์ผ๋ฐ์ ์ธ ์ง๋ฅ๊ณผ ์ฌ์ฉ์์ ํน์ ์ง์ ์ฌ์ด์ ๊ฒฉ์ฐจ๋ฅผ ํด์ํฉ๋๋ค.
์ค์ ์ฌ๋ก: Morgan Stanley
Morgan Stanley๋ ์ฌ๋ฌด ๊ณ ๋ฌธ๋ค์ด ์ํ์ ๋ฐฉ๋ํ ์ฐ๊ตฌ ๋ณด๊ณ ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ฆ์ ์ก์ธ์คํ ์ ์๋๋ก RAG ๊ธฐ๋ฐ์ ๋ด๋ถ AI ๋น์๋ฅผ ๊ตฌ์ถํ์ต๋๋ค. ์์ฒ ๊ฐ์ PDF๋ฅผ ์๋์ผ๋ก ๊ฒ์ํ๋ ๋์ , ๊ณ ๋ฌธ์ โ๋ฐ๋์ฒด ์ฐ์ ์ ๋ํ ์ฐ๋ฆฌ์ ์ ๋ง์ ๋ฌด์์ธ๊ฐ?โ๋ผ๊ณ ๋ฌผ์ ์ ์๊ณ , ์์คํ ์ ๊ด๋ จ ๋ด๋ถ ๋ถ์์ ๊ฒ์ํ์ฌ ์์ฝ๋ ๋ต๋ณ์ ์์ฑํฉ๋๋ค.
-
Function Calling: ์ ํจํ ๋๊ตฌ ํธ์ถ ์์ฑํ๊ธฐ
๋ฌธ์ ์ํฉ
LLM์ โ5์ 10์ ํฉ์ ๊ณ์ฐํ ๊ฒโ๋ผ๊ณ ๋งํ ์ ์์ต๋๋ค. ์ด๋ ์ฌ๋์ด ์ฝ์ ์๋ ์์ง๋ง ์ปดํจํฐ ํ๋ก๊ทธ๋จ์ ์ด ๋ฌธ์ฅ์ ์คํํ ์ ์์ต๋๋ค. ์ปดํจํฐ๋ add(5, 10)์ด ํ์ํฉ๋๋ค. ์๊ฒฉํ ํ์์ด ์์ผ๋ฉด ์์ด์ ํธ์ ์๋๊ฐ ๋ฒ์ญ ๊ณผ์ ์์ ์์ค๋ฉ๋๋ค.
ํด๊ฒฐ์ฑ
Function Calling์ ๋ชจ๋ธ์ด ํน์ ์คํค๋ง์ ์ผ์นํ๋ ๊ตฌ์กฐํ๋ ํ์(JSON ๋ฑ)์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ถ๋ ฅํ๋๋ก ๊ฐ์ ํฉ๋๋ค:
- Schema (์คํค๋ง):
function add(a: int, b: int)๋ฅผ ์ ์ - Output (์ถ๋ ฅ): ๋ชจ๋ธ์
{"name": "add", "arguments": {"a": 5, "b": 10}}๋ฅผ ์์ฑ - Execution (์คํ): ์์คํ ์ ์ด JSON์ ํ์ฑํ๊ณ ์ฝ๋๋ฅผ ์์ ์ ์ผ๋ก ์คํ
์ค์ ์ฌ๋ก: HubSpot CRM ํตํฉ
HubSpot์ ์ฌ์ฉ์๊ฐ ์ฑํ
์ ํตํด CRM๊ณผ ์ํธ ์์ฉํ ์ ์๋๋ก Function Calling์ ์ฌ์ฉํฉ๋๋ค. ์ฌ์ฉ์๊ฐ โjohn@example.com์ John Doe์ ๋ํ ์ ์ฐ๋ฝ์ฒ๋ฅผ ๋ง๋ค์ด์คโ๋ผ๊ณ ๋งํ๋ฉด, LLM์ ๊ตฌ์กฐํ๋ ํจ์ ํธ์ถ create_contact(name="John Doe", email="john@example.com")์ ์์ฑํ์ฌ ๋ฐฑ์๋ ์์คํ
์ด ์ค์ ๋ก ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์
๋ฐ์ดํธํฉ๋๋ค.
-
Reflection: ๊ฐ์ ์ค์ ๋ฐ๋ณต ๋ฐฉ์ง
๋ฌธ์ ์ํฉ
๊ด๊ธฐ๋ ๊ฐ์ ์ผ์ ๋ฐ๋ณตํ๋ฉด์ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ํ๋ ๊ฒ์ ๋๋ค. ๋จ์ํ ์์ด์ ํธ๋ ์ํ๊ฐ ์์ต๋๋ค(stateless). ์ํ ๋ฌธ์ ๋ฅผ ํ ๋ฒ ํ๋ฆฌ๋ฉด, ์คํจํ๋ค๋ ๊ฒ์ โ๋ชจ๋ฅด๊ธฐโ ๋๋ฌธ์ ๋ ๋ฒ์งธ์๋ ๋๊ฐ์ ๋ฐฉ์์ผ๋ก ์คํจํ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค.
ํด๊ฒฐ์ฑ
Reflection์ โSelf-Review(์๊ธฐ ๊ฒํ )โ ๋จ๊ณ๋ฅผ ์ถ๊ฐํฉ๋๋ค:
- Attempt (์๋): ์์ด์ ํธ๊ฐ ๋ฌธ์ ํด๊ฒฐ์ ์๋
- Critique (๋นํ): ์์ด์ ํธ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ด: โ์ ๊น, ๋ต์ด ์์์ธ๋ฐ ์์์ฌ์ผ ํด.โ
- Retry (์ฌ์๋): ์์ด์ ํธ๋ ๋ฐ๊ฒฌ๋ ์ค๋ฅ๋ฅผ ์์ ํ๋๋ก ๋ช ์์ ์ผ๋ก ์ง์๋ฐ์ ๋ค์ ์๋
์ด๋ โ๋ฉ์ฒญํโ ๋ฃจํ๋ฅผ โํ์ตํ๋โ ๋ฃจํ๋ก ๋ฐ๊ฟ๋๋ค.
์ค์ ์ฌ๋ก: Writer ํ๋ซํผ
Writer๋ ์ฝํ ์ธ ์์ฑ ์ํฌํ๋ก์ฐ์์ Reflection์ ์ฌ์ฉํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ํน์ ๋ธ๋๋ ๊ฐ์ด๋๋ผ์ธ(์: โ์๋ํ ๊ธ์งโ)์ ๋ฐ๋ผ์ผ ํ๋ ๋ธ๋ก๊ทธ ๊ฒ์๋ฌผ์ ์์ฒญํ๋ฉด, ์์ด์ ํธ๊ฐ ์ด์์ ์์ฑํ ๋ค์ โReflectorโ ๋จ๊ณ๊ฐ ๊ฐ์ด๋๋ผ์ธ์ ๋ํด ์ด์์ ํ์ธํฉ๋๋ค. ์๋ํ๊ฐ ๋ฐ๊ฒฌ๋๋ฉด, ์ฌ์ฉ์์๊ฒ ๋ณด์ฌ์ฃผ๊ธฐ ์ ์ ํด๋น ๋ฌธ์ฅ์ ๋ค์ ์์ฑํ๋๋ก ์ง์ํฉ๋๋ค.
-
ReAct (Reason & Act): ํฌ๋ช ํ ์ถ๋ก ๊ณผ์
๋ฌธ์ ์ํฉ
์์ด์ ํธ๊ฐ ๋จ์ํ โโAppleโ ๊ฒ์โ์ ์ถ๋ ฅํ๋ค๋ฉด, ์ ๊ทธ๋ฐ์ง ์ ์ ์์ต๋๋ค. ๊ณผ์ผ์ ์ฐพ๋ ๊ฑธ๊น์, ์๋๋ฉด ํ์ฌ๋ฅผ ์ฐพ๋ ๊ฑธ๊น์? ์ค์๋ฅผ ํ๋๋ผ๋ โ์ฌ๊ณ ๊ณผ์ โ์ด ๋ชจ๋ธ์ ์ ๊ฒฝ๋ง ๊ฐ์ค์น ์์ ์จ๊ฒจ์ ธ ์๊ธฐ ๋๋ฌธ์ ๋๋ฒ๊น ํ ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
ReAct๋ ๋ชจ๋ธ์ด ๋ชจ๋ โAction(ํ๋)โ ์ ์ โThought(์๊ฐ)โ๋ฅผ ์ถ๋ ฅํ๋๋ก ๊ฐ์ ํฉ๋๋ค:
- Thought: โ์ฌ์ฉ์๊ฐ ์ฃผ๊ฐ์ ๋ํด ๋ฌผ์์ผ๋ฏ๋ก โAppleโ์ AAPL ํ์ฌ๋ฅผ ์๋ฏธํ๋ค.โ
- Action:
search_stock("AAPL")
์ด๋ ์์ด์ ํธ์ ํ๋์ ํฌ๋ช ํ๊ณ ํด์ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๋ฉฐ ๋ ผ๋ฆฌ์ ๋น์ฝ์ด ๋ฐ์ํ ๊ฐ๋ฅ์ฑ์ ์ค์ ๋๋ค.
์ค์ ์ฌ๋ก: ์ฌ์ด๋ฒ ๋ณด์ ์ํ ์ฌ๋ฅ
๋ณด์ ๋ถ์๊ฐ๋ ReAct ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ์ฌ์ฉํ์ฌ ๊ฒฝ๊ณ ๋ฅผ ์กฐ์ฌํฉ๋๋ค. ๋จ์ํ ์คํฌ๋ฆฝํธ๋ฅผ ์คํํ๋ ๋์ , ์์ด์ ํธ๋ ์ถ๋ก ์ ๊ธฐ๋กํฉ๋๋ค: โThought: IP ์ฃผ์๊ฐ ์๋ ค์ง ์
์ฑ ๋ธ๋ก์์ ์๋ค. ๋ด๋ถ ์ฅ์น๊ฐ ์ด IP์ ํต์ ํ๋์ง ํ์ธํด์ผ ํ๋ค. Action: query_firewall_logs(ip).โ ์ด ๊ฐ์ฌ ์ถ์ (audit trail)์ ๊ท์ ์ค์์ ๋์ค์ ์ธ๊ฐ ๋ถ์๊ฐ๊ฐ ์ฌ๊ฑด์ ์ดํดํ๋ ๋ฐ ๋งค์ฐ ์ค์ํฉ๋๋ค.
-
Chain of Thought (CoT): ๋จ๊ณ๋ณ ์ถ๋ก
๋ฌธ์ ์ํฉ
LLM์ ๊ณ์ฐ์ ํ์ง ์๊ณ ๋ต์ ๋งํ๋ ค๋ ํ์๊ณผ ๊ฐ์ต๋๋ค. โ์ฌ๊ณผ 3๊ฐ๊ฐ ์๋๋ฐ 2๊ฐ๋ฅผ ๋ ์ฌ๊ณ 1๊ฐ๋ฅผ ๋จน์ผ๋ฉด ๋ช ๊ฐ๊ฐ ๋จ์ง?โ๋ผ๊ณ ๋ฌผ์ผ๋ฉด, ๋ชจ๋ธ์ ์ซ์ 3๊ณผ 2๋ฅผ ๋ณด๊ณ โ5โ๋ผ๊ณ ์ถ์ธกํ ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
Chain of Thought๋ ๋ชจ๋ธ์ด โํ์ด ๊ณผ์ โ์ ๋ณด์ฌ์ฃผ๋๋ก ๊ฐ์ ํฉ๋๋ค:
- Prompt: โ๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ณด์.โ
- Output: โ3๊ฐ๋ก ์์. 2๊ฐ ๊ตฌ๋งค -> 3+2=5. 1๊ฐ ๋จน์ -> 5-1=4. ๋ต์ 4.โ
์ค๊ฐ ๋จ๊ณ๋ฅผ ์์ฑํจ์ผ๋ก์จ ๋ชจ๋ธ์ ์ต์ข ๋ต๋ณ์ ๊ทผ๊ฑฐ๋ฅผ ๋ ผ๋ฆฌ์ ๋๊ฒ ๋์ด ๊ณ์ฐ ๋ฐ ์ถ๋ก ์ค๋ฅ๋ฅผ ํฌ๊ฒ ์ค์ ๋๋ค.
์ค์ ์ฌ๋ก: ์ฌ๋ฌด ์์ธก
์ํ์ AI ์์ด์ ํธ์๊ฒ โ1~3๋ถ๊ธฐ ์ถ์ธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก 4๋ถ๊ธฐ ์์ต์ ์ถ์ ํด์คโ๋ผ๊ณ ์์ฒญํ ๋, Chain of Thought๋ฅผ ์ฌ์ฉํ์ฌ ๋จ๊ณ๋ฅผ ๋ช ์์ ์ผ๋ก ๋์ดํฉ๋๋ค: โ1. 1๋ถ๊ธฐ์์ 3๋ถ๊ธฐ๊น์ง์ ํ๊ท ์ฑ์ฅ๋ฅ ๊ณ์ฐ. 2. 4๋ถ๊ธฐ์ ๊ณ์ ์ ์์ธ ์๋ณ. 3. 3๋ถ๊ธฐ ์์น์ ์ฑ์ฅ๋ฅ ์ ์ฉ. 4. ๊ณ์ ์ฑ ์กฐ์ .โ ์ด๋ฅผ ํตํด ์ต์ข ์์น๊ฐ ์ฌ๋์ด ๊ฒ์ฆํ ์ ์๋ ๋ ผ๋ฆฌ์ ๊ณผ์ ์์ ๋์ถ๋์์์ ๋ณด์ฅํฉ๋๋ค.
-
Context Selection: ํจ์จ์ ์ธ ์ปจํ ์คํธ ๊ด๋ฆฌ
๋ฌธ์ ์ํฉ
LLM์ ์ ํ๋ โContext Windowโ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. ํ๋์ ํน์ ์ง๋ฌธ์ ๋ตํ๊ธฐ ์ํด 500ํ์ด์ง์ง๋ฆฌ ์ฑ ์ ์ฒด๋ฅผ ํ๋กฌํํธ์ ์์๋ถ์ผ๋ฉด, ๋ชจ๋ธ์ ์๋๋นํ๊ณ ๋น์ฉ์ ์ฆ๊ฐํ๋ฉฐ ์ ํ๋๋ ๋จ์ด์ง๋๋ค(โLost in the Middleโ ํ์).
ํด๊ฒฐ์ฑ
Context Selection์ โ์ง์ ๊ฐ๋ณ๊ฒ ์ธ๋โ ๊ธฐ์ ์ ๋๋ค:
- Filter (ํํฐ): ๊ฒ์์ด๋ ์๋ฒ ๋ฉ์ ์ฌ์ฉํ์ฌ 500ํ์ด์ง ์ค ๊ฐ์ฅ ๊ด๋ จ์ฑ์ด ๋์ 3ํ์ด์ง๋ง ์ฐพ์
- Inject (์ฃผ์ ): ๊ทธ 3ํ์ด์ง๋ง ํ๋กฌํํธ์ ๋ฃ์
- Result (๊ฒฐ๊ณผ): ๋ชจ๋ธ์ ์ฃผ์ ์ฐ๋ง ์์ด ์ฌ๋ฐ๋ฅธ ์ ๋ณด์ ์ง์ค
์ค์ ์ฌ๋ก: DoorDash ๊ณ ๊ฐ ์ง์
์ง์ ์์ด์ ํธ๊ฐ ํน์ ์ฃผ๋ฌธ์ ๋ํ ์ง๋ฌธ์ ๋ตํด์ผ ํ ๋, ๊ณ ๊ฐ์ 5๋ ์น ์ฃผ๋ฌธ ๋ด์ญ ์ ์ฒด๋ฅผ ๋ก๋ํ์ง ์์ต๋๋ค. ์์คํ ์ Context Selection์ ์ฌ์ฉํ์ฌ ํ์ฌ ํ์ฑ ์ฃผ๋ฌธ๊ณผ ์ต๊ทผ 3๊ฑด์ ์ํธ ์์ฉ์ ๋ํ ๋ฐ์ดํฐ๋ง ๊ฒ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด LLM์ 2019๋ ์ ํผ์ ์ฃผ๋ฌธ์ ์ฃผ์๋ฅผ ๋บ๊ธฐ์ง ์๊ณ โ๋๋ฝ๋ ํญ๋ชฉโ ๋ถ๋ง์ ํด๊ฒฐํ๋ ๋ฐ ํ์ํ ์ ๋ณด๋ง ์ ํํ๊ฒ ํ๋ณดํ ์ ์์ต๋๋ค.
-
Semantic Memory: ์ง์๋๋ ์ ๋ฌธ ์ง์
๋ฌธ์ ์ํฉ
์ค๋ ์์ด์ ํธ์๊ฒ โ์ฐ๋ฆฌ ํ์ฌ ์์์ ํ๋์๊ณผ ํฐ์์ด์ผโ๋ผ๊ณ ๊ฐ๋ฅด์น๊ณ , ๋ด์ผ ์๋ก์ด ์ธ์ ์ ์์ํ๋ฉด ํ์ค ์์ด์ ํธ๋ ๋ชจ๋ ๊ฒ์ ์์ด๋ฒ๋ฆฝ๋๋ค. ์ด๋ ๋งค์ผ ์๋ก์ด ์ง์์ ๊ณ ์ฉํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํด๊ฒฐ์ฑ
Semantic Memory๋ ์ง์์ ์๊ตฌ์ ์ผ๋ก ์ง์๋๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค(์ฃผ๋ก ๋ฒกํฐ ๊ธฐ๋ฐ)์ ์ ์ฅํฉ๋๋ค:
- Storage (์ ์ฅ): โํ์ฌ ์์: ํ๋์, ํฐ์โ์ด ์ ์ฅ๋จ
- Retrieval (๊ฒ์): โ๋ก๊ณ ๋ ์ด๋ป๊ฒ ์๊ฒจ์ผ ํด?โ๋ผ๊ณ ๋ฌผ์ผ๋ฉด, ์์ด์ ํธ๋ ๊ธฐ์ต์ ๊ฒ์ํ์ฌ ์์ ์ ๋ณด๋ฅผ ์ฐพ์
- Result (๊ฒฐ๊ณผ): ์์ด์ ํธ๋ ๋ ๋ง์ ์ง์์ ์ถ์ ํจ์ ๋ฐ๋ผ ์๊ฐ์ด ์ง๋ ์๋ก โ๋ ๋๋ํดโ์ง
์ค์ ์ฌ๋ก: Bell Canada
Bell์ ๋ด๋ถ โKnowledge Assistantโ๋ฅผ ๊ตฌ๋ํ๊ธฐ ์ํด Semantic Memory๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์์ฒ ํ์ด์ง์ ๊ธฐ์ ๋งค๋ด์ผ, HR ์ ์ฑ , ์ค์น ๊ฐ์ด๋๋ฅผ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ธ๋ฑ์ฑํ์ต๋๋ค. ํ์ฅ ๊ธฐ์ ์๊ฐ โ๋ชจ๋ธ X์ ๊ด ๋คํธ์ํฌ ํฐ๋ฏธ๋์ ์ด๋ป๊ฒ ์ฌ์ค์ ํด?โ๋ผ๊ณ ๋ฌผ์ผ๋ฉด, ์์ด์ ํธ๋ ๊ทธ ๋งค๋ด์ผ์ด 5๋ ์ ์ ์ ๋ก๋๋์๋๋ผ๋ ์ฅ๊ธฐ ๊ธฐ์ต์์ ์ ํํ ์ ์ฐจ๋ฅผ ๊ฒ์ํฉ๋๋ค.
-
Tool Use: ๋งํ๋ ๊ฒ์์ ํ๋ํ๋ ๊ฒ์ผ๋ก
๋ฌธ์ ์ํฉ
โ1๋จ๊ณ: ์ค๋ธ์ ์ผ์ธ์โ๋ผ๊ณ ๋งํ๋ โ์๋ฆฌ ๋์ฐ๋ฏธโ๋ ๋์์ด ๋ฉ๋๋ค. ํ์ง๋ง โ์ค๋ธ์ ์ผ์ผ ํฉ๋๋คโ๋ผ๊ณ ๋งํ๋ โ์ค๋งํธ ํ ์์ด์ ํธโ๋ ์ง์ฆ๋ฉ๋๋ค. ๋น์ ์ ์์ด์ ํธ๊ฐ ์ง์ ํ๊ธฐ๋ฅผ ์ํฉ๋๋ค. ํ ์คํธ ์ ์ฉ ๋ชจ๋ธ์ ์์ ์์ ๊ฐํ ์์ต๋๋ค. ๋งํ ์๋ ์์ง๋ง ๋ง์ง ์๋ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
Tool Use๋ ์์ด์ ํธ์๊ฒ โ์โ์ ์ค๋๋ค:
- Capability (๋ฅ๋ ฅ): ์์ด์ ํธ๋
turn_on_oven()ํจ์๋ฅผ ๊ฐ์ง๊ณ ์์ - Action (ํ๋): ํ ์คํธ๋ฅผ ์ถ๋ ฅํ๋ ๋์ , ํด๋น ํจ์๋ฅผ ํธ๋ฆฌ๊ฑฐํ๋ ๋ช ๋ น์ ์ถ๋ ฅ
- Result (๊ฒฐ๊ณผ): ์ค๋ธ์ด ์ค์ ๋ก ์ผ์ง
์ค์ ์ฌ๋ก: Klarna ๊ณ ๊ฐ ์๋น์ค
Klarna์ AI ์์ด์ ํธ๋ ์ฌ์ฉ์์๊ฒ โ์ฑ์์ ์ฒญ๊ตฌ์๋ฅผ ํ์ธํ ์ ์์ต๋๋คโ๋ผ๊ณ ๋ง๋ง ํ์ง ์์ต๋๋ค. ์ฑํ ๋ด์์ ์ง์ ์ฒญ๊ตฌ์ ์ธ๋ถ ์ ๋ณด๋ฅผ ๋ถ๋ฌ์ค๊ฑฐ๋, ์ง๋ถ ๊ธฐํ์ ์ฐ์ฅํ๊ฑฐ๋, ํ๋ถ ์ ์ฐจ๋ฅผ ์์ํ ์ ์๋ ๋๊ตฌ์ ์ก์ธ์คํ์ฌ ์ฌ๋์ ๊ฐ์ ์์ด ์ฌ์ฉ์์ ๋ฌธ์ ๋ฅผ ์ฒ์๋ถํฐ ๋๊น์ง ํด๊ฒฐํฉ๋๋ค.
-
Episodic Memory: ๋ํ ๋งฅ๋ฝ ๊ธฐ์ตํ๊ธฐ
๋ฌธ์ ์ํฉ
LLM์ ๊ณ ์ ๋ ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋ํ๊ฐ ๊ธธ์ด์ง๋ฉด ์๋ถ๋ถ์ด ์๋ ค ๋๊ฐ๋๋ค. ์ฒ์์ โ๋ด ์ด๋ฆ์ Tom์ด์ผโ๋ผ๊ณ ๋งํ๋๋ผ๋, 20๋ถ ํ์ ์์ด์ ํธ๊ฐ โ๋๊ตฌ์ธ์?โ๋ผ๊ณ ๋ฌผ์ ์ ์์ต๋๋ค.
ํด๊ฒฐ์ฑ
Episodic Memory๋ ์ธ์ ์ ์ผ๊ธฐ๋ ๋ก๊ทธ์ ๊ฐ์ต๋๋ค:
- Recording (๊ธฐ๋ก): ์ฃผ์ ์ด๋ฒคํธ๋ฅผ ์ ์ฅ: โ์ฌ์ฉ์๊ฐ ์ค์ 10์์ ์ด๋ฆ์ด Tom์ด๋ผ๊ณ ๋งํจ.โ
- Recall (ํ์): ๋ต๋ณํ๊ธฐ ์ ์ ์์ด์ ํธ๋ ์ผ๊ธฐ๋ฅผ ํ์ธ
- Result (๊ฒฐ๊ณผ): โ์ด๋ฆ์ด Tom์ด๋ผ๊ณ ํ์ จ๋ ๊ฒ์ ๊ธฐ์ตํฉ๋๋ค.โ
์ค์ ์ฌ๋ก: ๊ฐ์ธํ๋ ์ผํ ๋์ฐ๋ฏธ
๊ณ ๊ฐ์ด ์์์ผ์ ์ผํ ๋ด๊ณผ ์ฑํ ํ๋ฉฐ โ๋ฑ์ฐํ๋ฅผ ์ฐพ๊ณ ์์ดโ๋ผ๊ณ ๋งํ๊ณ , ๊ธ์์ผ์ ๋ค์ ์์ โ๊ทธ๊ฑฐ 10์ฌ์ด์ฆ ์์ด?โ๋ผ๊ณ ๋ฌผ์ผ๋ฉด, ์์ด์ ํธ๋ Episodic Memory๋ฅผ ์ฌ์ฉํ์ฌ โ๊ทธ๊ฑฐโ๊ฐ ์ด์ ์ ๋ ผ์๋ ๋ฑ์ฐํ๋ฅผ ์๋ฏธํ๋ค๋ ๊ฒ์ ๊ธฐ์ตํด๋ด์ด ์ผํ ๊ฒฝํ์ ๋งค๋๋ฝ๊ฒ ์ด์ด๊ฐ๋๋ค.
-
Delegation: ์์ ๋ถ๋ด์ผ๋ก ๋ณ๋ชฉ ํด์
๋ฌธ์ ์ํฉ
ํ๋์ โ์ํผ ์์ด์ ํธโ๊ฐ ์ฝ๋ ์์ฑ, ๋ก๊ณ ๋์์ธ, ๋ง์ผํ ๋ฌธ๊ตฌ ์์ฑ์ ๋์์ ํ๋ ค๊ณ ํ๋ฉด ํผ๋์ค๋ฌ์ํ๊ฑฐ๋ ์ปจํ ์คํธ ๊ณต๊ฐ์ด ๋ถ์กฑํด์ง ๊ฒ์ ๋๋ค. ์ด๋ CEO๊ฐ ํ์ฌ์ ๋ชจ๋ ์ผ์ ํ๋ ค๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํด๊ฒฐ์ฑ
Delegation์ ์ ๋ฌด๋ฅผ ๋๋๋๋ค:
- Manager (๊ด๋ฆฌ์): โ์ฝ๋, ์ฑ์ ๋ง๋ค์ด. ๋์์ด๋, ๋ก๊ณ ๋ฅผ ๋ง๋ค์ด.โ
- Workers (์์ ์): ์ฝ๋์ ๋์์ด๋๋ ๊ฐ์์ ์ ๋ฌด์ ์ง์คํ์ฌ ๋ณ๋ ฌ๋ก ์์
- Result (๊ฒฐ๊ณผ): ๊ฐ ์์ด์ ํธ๊ฐ ์ ๋ฌธํ๋์ด ์๊ธฐ ๋๋ฌธ์ ์คํ ์๋๊ฐ ๋น ๋ฅด๊ณ ํ์ง์ด ๋์
์ค์ ์ฌ๋ก: HR ์จ๋ณด๋ฉ ์๋ํ
โ์จ๋ณด๋ฉ ์ค์ผ์คํธ๋ ์ดํฐโ ์์ด์ ํธ๋ ์ ๋ฌธ ํ์ ์์ด์ ํธ์๊ฒ ์์ ์ ์์ํฉ๋๋ค. โIT ์์ด์ ํธโ์๊ฒ ๋ ธํธ๋ถ๊ณผ ์ด๋ฉ์ผ์ ํ๋ก๋น์ ๋ํ๋๋ก ์ง์ํ๊ณ , โ๊ธ์ฌ ์์ด์ ํธโ์๊ฒ ์ํ ์ธ๋ถ ์ ๋ณด๋ฅผ ์ค์ ํ๋๋ก ํ๋ฉฐ, โ๊ต์ก ์์ด์ ํธโ์๊ฒ ์ค๋ฆฌ์ํ ์ด์ ์ธ์ ์ ์์ฝํ๋๋ก ํฉ๋๋ค. ์ด ํ์ ์์ด์ ํธ๋ค์ ๋ณ๋ ฌ๋ก ์์ ํ์ฌ ์ ๊ท ์ ์ฌ์๊ฐ ์ฒซ๋ ๊น์ง ์๋ฒฝํ๊ฒ ์ค๋น๋๋๋ก ๋ณด์ฅํฉ๋๋ค.
-
Tree of Thought: ๋ค์ํ ๊ฐ๋ฅ์ฑ ํ์
๋ฌธ์ ์ํฉ
ํ์ค ์์ด์ ํธ๋ โํ์์ (Greedy)โ์ ๋๋ค. ์ข์ ๋ณด์ด๋ ์ฒซ ๋ฒ์งธ ๋จ์ด๋ฅผ ์ ํํฉ๋๋ค. โ์ ๊น, ๋ด๊ฐ ์ด ๋ง์ ํ๋ฉด ๋์ค์ ๊ณค๋ํด์ง ํ ๋ฐโ๋ผ๊ณ ๋ฉ์ถฐ์ ์๊ฐํ์ง ์์ต๋๋ค. ๋ฐ๋ก ๋ค์ ์๋ง ๋ณด๊ณ ์ฒด์ค๋ฅผ ๋๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํด๊ฒฐ์ฑ
Tree of Thought๋ ์์ด์ ํธ๊ฐ ๋ฏธ๋๋ฅผ ์๋ฎฌ๋ ์ด์ ํ ์ ์๊ฒ ํด์ค๋๋ค:
- Branching (๋ถ๊ธฐ): โA๋ฅผ ํ๋ฉด X๊ฐ ๋ฐ์ํด. B๋ฅผ ํ๋ฉด Y๊ฐ ๋ฐ์ํด.โ
- Evaluation (ํ๊ฐ): โY๋ ๋๋น ๋ณด์ฌ. X๊ฐ ์ข์ ๋ณด์ฌ. A๋ฅผ ์ ํํ ๋.โ
- Result (๊ฒฐ๊ณผ): ๋ง๋ค๋ฅธ ๊ณจ๋ชฉ์ ํผํ๋ ๋ ๋๋ํ๊ณ ์ ๋ต์ ์ธ ๊ฒฐ์
์ค์ ์ฌ๋ก: ๊ณต๊ธ๋ง ๋ฌผ๋ฅ
์ด์ก ๊ฒฝ๋ก๊ฐ ๋งํ์ ๋(์: ์์์ฆ ์ดํ), ๋ฌผ๋ฅ AI๋ Tree of Thought๋ฅผ ์ฌ์ฉํ์ฌ ๋์์ ํ์ํฉ๋๋ค. โ๋ถ๊ธฐ A: ํญ๊ณต ํ๋ฌผ(๋น ๋ฅด์ง๋ง ๋น์). ๋ถ๊ธฐ B: ์ํ๋ฆฌ์นด ์ฐํ(๋๋ฆฌ์ง๋ง ์ ๋ ด). ๋ถ๊ธฐ C: ๋๊ธฐ.โ ์ธ๊ฐ ๊ด๋ฆฌ์์๊ฒ ์ต์ ์ ์ ๋ต์ ์ถ์ฒํ๊ธฐ ์ ์ ๊ฐ ์ ํ์ด ๋ฐฐ์ก ์๊ฐ, ๋น์ฉ, ์ฐฝ๊ณ ์ฌ๊ณ ์์ค์ ๋ฏธ์น๋ ๋ค์ด์คํธ๋ฆผ ํจ๊ณผ๋ฅผ ์๋ฎฌ๋ ์ด์ ํฉ๋๋ค.
๋ง๋ฌด๋ฆฌ: AI ์์ด์ ํธ ์ค๊ณ์ ํต์ฌ ์์น
์ง๊ธ๊น์ง ์ดํด๋ณธ 20๊ฐ์ง ๊ฐ๋ ์ ์ ๋ฆฌํ๋ฉด, AI ์์ด์ ํธ ์ค๊ณ์ ํต์ฌ ์์น์ ๋ค์๊ณผ ๊ฐ์ด ๋์ถํ ์ ์์ต๋๋ค:
1. ํผ๋๋ฐฑ ๋ฃจํ์ ์ค์์ฑ
Agent Loop, Reflection, Critic ํจํด์ ๋ชจ๋ โํ์ธ-์์ โ ์ฌ์ดํด์ ์ค์์ฑ์ ๊ฐ์กฐํฉ๋๋ค. ๋งน๋ชฉ์ ์ธ ์คํ๋ณด๋ค ์ง์์ ์ธ ํผ๋๋ฐฑ์ด ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ญ๋๋ค.
2. ๊ตฌ์กฐํ๋ ์ถ๋ก
Chain of Thought, ReAct, Plan-and-Execute๋ ์์ด์ ํธ๊ฐ โ์๊ฐํ๋ ๊ณผ์ โ์ ๋ช ์์ ์ผ๋ก ๋๋ฌ๋ด๋๋ก ํฉ๋๋ค. ์ด๋ ๋๋ฒ๊น ์ ์ฝ๊ฒ ํ๊ณ , ์ ๋ขฐ์ฑ์ ๋์ด๋ฉฐ, ์ค๋ฅ๋ฅผ ์ค์ ๋๋ค.
3. ๋น์ ํ์ ํ์
Graph of Thought, Tree of Thought๋ ๋จ์ํ ์ ํ ์ถ๋ก ์ ๋์ด ๋ค์ํ ๊ฐ๋ฅ์ฑ์ ํ์ํ๊ณ ์ต์ ์ ๊ฒฝ๋ก๋ฅผ ์ฐพ๋ ์ ๋ต์ ๋๋ค.
4. ๊ธฐ์ต๊ณผ ๋งฅ๋ฝ ๊ด๋ฆฌ
RAG, Semantic Memory, Episodic Memory, Context Selection์ ๋ชจ๋ โ์ฌ๋ฐ๋ฅธ ์ ๋ณด๋ฅผ ์ฌ๋ฐ๋ฅธ ๋์โ ์ ๊ณตํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค.
5. ์คํ ๋ฅ๋ ฅ
Tool Use, Function Calling์ ์์ด์ ํธ๋ฅผ โ๋งํ๋ ์กด์ฌโ์์ โํ๋ํ๋ ์กด์ฌโ๋ก ์ ํ์ํต๋๋ค.
6. ์์ ๊ณผ ํต์
Safety Guardrails, MCP๋ ๊ฐ๋ ฅํ ์์ด์ ํธ๊ฐ ์์ ํ๊ณ ์์ธก ๊ฐ๋ฅํ๊ฒ ์๋ํ๋๋ก ๋ณด์ฅํฉ๋๋ค.
7. ํ์ ๊ณผ ๋ถ์ฐ
Orchestration, Delegation์ ๋ณต์กํ ์์ ์ ์ฌ๋ฌ ์ ๋ฌธํ๋ ์์ด์ ํธ๋ก ๋๋์ด ํจ์จ์ฑ๊ณผ ํ์ง์ ๋์ ๋๋ค.
AI ์์ด์ ํธ ๊ธฐ์ ์ ๋น ๋ฅด๊ฒ ๋ฐ์ ํ๊ณ ์์ผ๋ฉฐ, ์ด๋ฌํ ๊ฐ๋ ๋ค์ ์ค์ ๊ธฐ์ ํ๊ฒฝ์์ ์ด๋ฏธ ํ์ฉ๋๊ณ ์์ต๋๋ค. ์ด ๊ธ์ด AI ์์ด์ ํธ์ ํต์ฌ ๊ฐ๋ ์ ์ดํดํ๋ ๋ฐ ๋์์ด ๋์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.