전체 글
-
[Paper Tasting] ChatGPT로 SW 회사를 만들 수 있다고?Paper Tasting 2023. 9. 19. 22:46
Motive: AI가 서로 협업하여 복잡한 과정을 거쳐야 할 수 있는 일을 하게 만드는 것은 AI를 연구하는 이들에게 꿈과 같은 일이다. ChatGPT로 대표되는 LLM은 이런 지적 능력을 보여주었고, 이 지적 능력을 한단계 더 끌어 올리는 연구가 활발히 이루어 지고 있다. 이를 가능하게 하는 ChatGPT를 이용한 Role Playing의 방법을 이 논문이 보여주고 있다. 논문 제목: [2023] Communicative Agents for Software Development Arxiv 주소: https://arxiv.org/abs/2307.07924 주요 내용 및 평가 앞서 소개한 LLM의 성능을 높이는 방법의 종합판격인 논문. 다양한 역할을 분담한 LLM Agent의 집단(ChatDev)을 만들고..
-
[Paper Tasting] LLM Agent들이 협력하여 일하게 만들기 위한 노하우는?Paper Tasting 2023. 9. 19. 22:45
논문 제목: [2023] CAMEL: Communicative Agents for "Mind" Exploration of Large Scale Language Model Society Arxiv 주소: https://arxiv.org/abs/2303.17760 주요 내용 이 논문은 LLM Agent가 사람이 원하는 일을 제대로 수행하도록 만들기 위해 복수의 LLM Agent를 정의(예를 들어 Python programmer와 사용자)하고 이들이 서로 주거니 받거니 대화하면서 일을 진척시켜 나가도록 하는 방법을 제안하고 있다. 이 논문에서는 LLM Agent에게 일을 시키기 위해 사람과 LLM Agent의 중간에 사람의 요구조건에 살을 붙여서 구체화해 주는 Task specifier를 만들어 사용하고 있다..
-
[Paper Tasting] LLM Agent에게도 훈수쟁이가 필요하다Paper Tasting 2023. 9. 19. 22:44
논문 제목: [2023] Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration Arxiv 주소: https://arxiv.org/abs/2307.05300 주요 내용 및 평가 사람이 LLM Agent에게 일을 시키고 그 결과를 바로 보고 받기 보다는 다양한 전문가 또는 평가자(고객 등)의 Persona를 가진 LLM Agent들의 피드백을 받아 개선하는 과정을 거치면 더 양질의 결과를 얻을 수 있다는 것을 보인 논문 피드백을 받는 과정에서 Hallunication이 줄어들거나 부족한 내용이 보충되는 효과를 얻을 수 있다. LLM의 결과를 좀 더 개선해..
-
[Paper Tasting] LLM Agent를 강화학습할 수 있다?Paper Tasting 2023. 9. 19. 22:44
논문 제목: [2023] Reflexion: Language Agents with Verbal Reinforcement Learning Arxiv 주소: https://arxiv.org/abs/2303.11366 주요 내용 및 평가 이 논문은 LLM Agent의 행동을 교정하는 Verbal Reinforcement Learning 방법을 제안하고 있다. 내용을 뜯어보면 LLM을 이용하여 LLM Agent의 행동에 대해 Feedback을 주어 교정하는 방식이라 새롭게 느껴질 수 있지 않지만 이 과정을 강화학습 Framework로 설명하고 있는 점이 흥미로운 포인트 Reflection을 통해 LLM Agent의 행동 교정에 필요한 Reward를 언어로 표현하고 이를 Prompt로 제공함으로써 LLM Agen..
-
[Paper Tasting] ChatGPT에 수족을 달아서 Power Up!Paper Tasting 2023. 9. 19. 22:43
논문 제목: [2023] ReAct: Synergizing Reasoning and Acting in Language Models Arxiv주소: https://arxiv.org/abs/2210.03629 주요 내용 및 평가 논문 제목(ReAct)에서 드러난 것처럼 LLM의 Reasoning에 Acting을 결합하여 Reasoning의 성능을 올릴 수 있음을 보여준 논문. 실행(Acting)을 통해 수집된 추가 정보로 LLM Agent가 좀 더 정확한 Reasoning 및 의사 결정을 하도록 했다고 이해하면 된다. 이 논문에서는 외부 환경인 wikipedia로부터 Reasoning에 필요한 추가 정보를 수집하는 것을 Acting으로 하였다. Reasoing, action, observation을 번갈아..
-
[Paper Tasting] ChatGPT로 상황 변화에 따라 유연하게 대응할 수 있는 Planner를 만들고 싶다면Paper Tasting 2023. 9. 19. 22:43
논문 제목: [2023] AdaPlanner: Adaptive Planning from Feedback with Language Models Arxiv 주소: https://arxiv.org/abs/2305.16653 주요 내용 및 평가 ChatGPT와 같은 LLM으로 Hallucination을 줄이고 상황 변화에 따라 계획을 변경할 수 있는 Planner를 만드는 방법을 제안하고 있다. 이 논문의 핵심 방법은 환경의 변화를 주기적으로 체크하여 초기 Planning시 계획했던 상황과 차이가 발생할 경우 차이가 발생한 시점부터 계획을 다시 수립하고, 상황이 계획된 범위 내에 있으면 좀 더 최적의 action으로 수정하는 방식으로 Planning을 최적화한다. 이 과정을 잘 수행하기 위해 아래와 같은 기교..
-
Paper Tasting 카테고리에 대해Paper Tasting 2023. 9. 19. 22:42
저는 인공지능으로 가치를 창출하는 일을 업으로 하고 있는 사람입니다. 좀 더 구체적으로는 인간의 의사 결정 과정을 대신해주거나 도와주는 역할을 하는 Agent기술에 대해 연구하고 있습니다. 주된 방법으로는 강화학습을 사용하고 있으며, ChatGPT로인해 촉진된 Large Language Model(LLM)의 가능성을 보고 최근에는 LLM을 Agent에 활용하는 방법에 대해 연구하고 있습니다. 좀 더 구체적인 적용 분야로는 게임과 금융쪽을 탐색하고 있습니다. 게임에서 살아 숨쉬며 함께 감정을 교감할 수 있는 NPC동료, 게임 상황을 지능적으로 판단하여 끊임없는 재미를 주는 AI Director 등에 관심을 가지고 있습니다. 더불어 금융 분야, 특히 주식 매매라는 행위를 AI가 대신하는 분야에 관심을 가지고..
-
[Paper Tasting] 딥러닝을 주식 투자에 어떤 식으로 활용할 수 있나Paper Tasting 2023. 9. 19. 22:39
논문 제목: [2022] Deep learning in the stock market-a systematic survey of practice, backtesting, and application Acess Link: https://link.springer.com/article/10.1007/s10462-022-10226-0 이 논문이 대답하고 있는 핵심 질문 딥러닝을 주식 투자에 어떤 식으로 활용할 수 있나 주요 내용 및 평가 제목 그대로 주식 시장에 딥러닝을 적용하는 주요 논문들을 조사하여 소개하고, 어떤 문제들이 있고, 어떤식으로 문제를 해결하려고 했는지를 소개하고 있다. 특히 이 분야의 연구들이 현실에 적용되기 위해서 해결해야 할 이슈에 대해 설명을 하고 있다. 이미 데이터를 확보하고 문제를 풀고..