Adaptation of Agentic AI
- Authors: Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei Han
- Paper: https://arxiv.org/pdf/2512.16301
- Affiliation: Caltech, Georgia Tech, Harvard Univ., Northwestern Univ., Princeton, Stanford Univ., TAMU, UC Berkeley, UIUC, UW, Unity, University of California San Diego
- Published: December 18, 2025
TL; DR
agentic AI ์ฐ๊ตฌ์์ adaptation์ด๋ผ๋ ๊ฐ๋
์ด ํผ์ฉ๋์ด์๊ณ , ์ฒด๊ณ์ ์ธ ์์คํ
์์ค ์ค๊ณ ๋ฐ ๋น๊ต๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๊ธฐ ์ํด adaptation ๋์(agent vs tool)๊ณผ adaptation์ ์ ๋ํ๋ ์ ํธ๋ฅผ ๊ตฌ๋ถํ๋ ๋ถ๋ฅ ์ฒด๊ณ ์ ์









Background
Agentic AI์์ adaptation์ด๋ผ๋ ํํ์ ๋จ๋ฐ
- LLM fine-tuning, prompt update, memory ์์ , retriever ๋ณ๊ฒฝ, search ์ ๋ต ๊ฐ์ , sub-agent ํ์ต, โฆ
- adaptation์ ๋์๋ ๋ค๋ฅด๊ณ signal๋ ๋ค๋ฅด๊ณ , system ๋ฆฌ์คํฌ, ๋น์ฉ ๋ชจ๋ ๋ค๋ฆ โ ๋๋ฌด ๋ค๋ฅธ ๊ฒ๋ค์ ๊ฐ์ ํํ ์๋์ ๋น๊ตํ๊ณ ์์
Problem States
Adaptation์ (1) ๋ฌด์(agent vs. tool)์ ๋ฐ๊พธ๋๊ฐ (2) ์ด๋ค ์ ํธ(execution vs. output)๋ก ๋ฐ๊พธ๋๊ฐ์ ์ํด ๊ตฌ๋ถํด์ผ ํ๋ค.
Suggestions
2by2 quadrant; ์ด๋ค ์ฐ๊ตฌ๊ฐ ์ด๋ค adaption์ ํ๊นํ๋๊ฐ?
- ์ ์๋์ : Agent / Tool
- ์ ํธ:
A1(agent์ ๋ํด) Tool execution : ํ์ค ํผ๋๋ฐฑ ๊ธฐ๋ฐ agent ํ์ตA2(agent์ ๋ํด) Agent output : ์๊ธฐ ์ถ๋ ฅ ๊ธฐ๋ฐ agent ํ์ตT1(tool์ ๋ํด) Agent-agonistic : agent์ ๋ฌด๊ดํ ๋๊ตฌ ๊ฐ์T2(tool์ ๋ํด) Agent supervised : agent ํ๋์ supervision ์ ํธ๋ก ์ฐ๋ ๋๊ตฌ adaptation
Effects
- ์ด ํ๋ ์์ ์ ์ฉํ๋ฉด ๊ธฐ์กด ์ฐ๊ตฌ์ ๋น๊ต๊ฐ ๋ฌด์๋ฏธํด์ง
- e.g.
- ์ด agent๋ tool-use๊ฐ ๋ฐ์ด๋๋ค โ agent adaption์ธ๊ฐ? tool adaptation์ธ๊ฐ?
- memory๋ฅผ ์ ๋ฐ์ดํธํ๋ ์ฑ๋ฅ์ด ์ค๋ฅธ๋ค โ agent๊ฐ ๋ฐ๋๊ฑด๊ฐ, tool(memory module)์ด ๋ฐ๋๊ฑด๊ฐ?
- execution feedback์ผ๋ก ํ์ตํ๋ค โ agent๋ฅผ? retriever(search module)๋ฅผ?
- e.g.
- ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์
- Hybrid / co-adaptation: agent 1๊ฐ๊ฐ ๋ชจ๋ adaptation์ ๋ถ๋ดํ๊ฑฐ๋ (๋น์ฉ, ๋ถ์์ ์ฑ, โฆ) tool-only adaptation(๋ฎ์ ํํ๋ ฅ)๋ณด๋ค๋ agent์ tool์ ์ญํ ๋ถ๋ด์ ์ฃผ์ ์ค๊ณ๋ณ์๋ก ์ค์ ํค์ผ ํ๋ค.
- T2 (Agent-supervised Tool Adaptation) : memory update, retriever tuning, search sub-agent, planner refinement์ ์๋์ ์ผ๋ก ์ ๋ ดํ๊ณ online/continual์ ์ ํฉํ๋ฉด์ ์๋์ ์ผ๋ก Safety ํต์ ๋ ์ฌ์ โ ์ค์ ์์คํ ์ T2๋ฅผ ์ค์ฌ์ผ๋ก ์ปค์ง ๊ฒ
Personal note. ์๋ฒ ์ดํ์ดํผ๋ผ ๋ด์ฉ์ ์ฌ๊ตฌ์ฑํ๋ ๊ฒ์ ํฐ ์๋ฏธ๋ ์์ ๊ฒ ๊ฐ์์, ์ ๊ฐ agent/tool-use ๊ด๋ จ ์ฐ๊ตฌ ์งํํ๋ฉด์ ์๊ฐํด๋ณผ๋งํ๋ ์ง์ ์งง๊ฒ ์ ๋ฆฌํด๋ด ๋๋ค. ์ ์๋ค์ ์ค์ง์ ์ผ๋ก T2,๊ทธ๋ฌ๋๊น agent๋ ๊ณ ์ ํ๊ณ agent์ output์ผ๋ก tool์ adaptationํด์ผํ๋ค๋ ์ ์ฅ์ ๋ฐ์ด์ฃผ๊ณ ์๋ค๊ณ ๋๊ผ๊ณ , ์ ์ญ์ ์ ์๋ค๊ณผ ๊ฐ์ ์๊ฐ์ผ๋ก memory๋ฅผ ์ฐ๊ตฌํ๊ณ ์๊ธฐ๋ ํ์ง๋ง, memory๋ฅผ tool๋ก ๋ฌถ์ด๋ ๋ ์ง(T2) ๋ ์กฐ๊ธ ๊ณ ๋ฏผํด๋ณผ ์ฌ์ง๊ฐ ์๋ ๊ฒ ๊ฐ์์.
- ์์คํ ์์ adaptation์ ์ฑ ์์ ์ด๋์ ์๋๊ฐ? agent? tool? memory?
- adaptation์ด online์ธ๊ฐ, offline์ธ๊ฐ? ๋น์ฉ์ด๋ ์์ ์ฑ์ ๊ฐ๋นํ ์ ์๋๊ฐ?
- rollback์ ๊ฐ๋ฅ์ฑ์ด ์๋๊ฐ?
- agent adaptation์ ์๋์ ์ผ๋ก ์ด๋ ต๊ณ , tool adaptation์ ์ฌ์ธ ๋ฏ
Comment. ๋ญ๊ฐ ์ฌ๋ฌ๊ฐ์ง๊ฐ ๋จ๋ฐ๋๊ณ ์ ๋๋ก ์ ์๋ ๋์ง ์์ ๊ด๋ จ ์ฐ๊ตฌ์ ์ ๋ฆฌ๊ฐ ์ด๋ ค์ ๋ ๋ถ๋ถ๋ค์ด ์ด๋ฌํ ๋ฅ์ ํ์ดํผ๋ค์ด ๋์ค๋ฉด์ ์ด๋์ ๋ ์ ๋ฆฌ๊ฐ ๋์ด๊ฐ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ ๋ฆฌ๊ฐ ๋์ด๊ฐ๋ค๋ ๊ฒ์ ํ๋๊ฐ ๊ณ ์ธ๋ฌผ์ด ๋์ด๊ฐ๋ค๋ ์๋ฏธ์ด๊ธฐ๋ ํด์ ๋ ๊ณ ์ฐฉํ๋๊ธฐ ์ ์ ์๋ฏธ ์๋ ์ฐ๊ตฌ๋ฅผ ํด๋ณด๋๊ฒ ์ค์ํ ๊ฒ ๊ฐ์ต๋๋ค.