세계 최고의 인공지능 연구소 OpenAI에서 최근 복잡한 질문에 대화식으로 답하는 ChatGPT라는 AI를 선보였다.
사용자가 질문을 할 때 무엇을 의미하는지 배우도록 훈련된 모델이 인간 수준의 응답을 제공함으로써
구글 검색 엔진을 대체할 수 있다는 혁명적인 기술이 나온 것이다.
What? 그렇다면 ChatGPT란 무엇인가?
2016년 전 세계를 놀라게 했던 구글의 딥마인드에서 개발한 인공지능 바둑 프로그램
알파고(AlphaGo)는 컴퓨터 비전 분야 인공지능 모델이라면,
챗GPT (ChatGPT)는 자연 언어 처리 분야
인공지능 모델이다.
한마디로 ChatGPT는 대형 언어 모델 (Large Language Model, LLM)
인공지능 챗봇이라고 볼 수 있다.
인공지능 분야에 종사하거나 관련 연구하는 분이라면 자연 언어 모델이 익숙하겠지만
인공지능을 모르는 사람이라면
무척이나 생소할 것이다.
간단하게 말하면 자연어 처리 (Natural Language Processing, NLP)는 인공지능의 한 분야로서
머신러닝이나 딥러닝을 사용하여 텍스트와 데이터를 처리하고 해석하는 분야이다.
일상 속에서 쉽게 생각해 볼 수 있는 자연어 처리 기반 인공지능이 적용된 사례는
파파고나 구글 번역과 같은 언어 번역기, Apple의 Siri 같은 스마트 어시스턴트 등이 있다.
이메일 스팸을 걸러내 주는 필터링 또한 NLP를 처음 적용한 가장 기본적인 사례로 알아두면 좋을 듯하다.
아무튼 이 정도만 알아도 자연 언어 모델이 무엇인지 가볍게 이해하고 갈 수 있을 것 같다.
다시 돌아와서 ChatGPT는 대규모 인공지능 모델인 'GPT-3.5' 언어 기술을 사용하여 사용자와 실시간으로 대화가 가능하도록
훈련된 자연 언어 처리 모델로, 다양한 소스를 바탕으로 방대한 텍스트 데이터를 학습했다고 한다.
How? 누가 만들었지?
ChatGPT를 만든 오픈AI (OpenAI)는 투자자 알트만 CEO와 일론 머스크 등 공동 창업가들이
인류에게 이익을 주는 것을 목표로 설립된
인공지능 회사이다.
현재는 마이크로소프트가 1조 원가량 투자하여
마이크로소프트에 인수되었다 해도 과언이 아닌 것 같다..
앞서 마이크로소프트, 메타 등 IT기업들이 이미 인공지능 챗봇을 출시했지만,
차별 및 혐오 발언으로 이슈가 되면서 큰 성공을 거두진 못했다.
이러한 이슈를 해결하기 위해, 오픈AI는 언어가 기업의 콘텐츠 정책에 위배되는지
여부를 결정하도록 훈련된 인공지능 기반 조정 시스템인 '모더레이션 API (Moderation API)'를 사용하였다.
이러한 시스템을 사용하여 안전하지 않거나 불법적인 정보가 통과되는 것을 차단하고 있으나,
여전히 100% 정확도를 가지고 있지 않나 결함이 있다고 한다.
How does ChatGPT work?
위 그림은 오픈AI에서 공개한 ChatGPT의 동작 원리 (How does ChatGPT work)이다.
먼저 기존 GPT와 비슷한 방식의 GPT-3.5를 학습시킨 후, 사람(labeler)에게
- 주어진 질문에 대한 답변을 대신 써라
- 생성된 답변 여러 개의 랭킹을 매겨라
이러한 두 가지의 라벨링으로 두 종류의 데이터를 생성한 후에 강화학습 알고리즘을 사용하였다.
보기에는 엄청 간단한 학습 과정처럼 보이지만, 실사용화를 위한 성능 증가를 달성해 낼
라지 스케일의 데이터를 생성하려면 방대한 리소스가 투입되어야 하고,
모델 최적화를 위한 오픈AI의 강화학습 알고리즘 연구 노하우가 잘 적용되어 이러한 혁신적인 기술이 나왔다고 생각이 든다.
오픈AI 블로그에서 제공한 ChatGPT 사용
예시를 보면
- 프로그래밍 서포터 ("코드 에러 좀 수정해 줘")
- 브레인스토밍 ("누군가의 집을 침입하는 방법")
- 간단하게 설명 or 요약 ("페르마의 소정리에 대해 요약해 줘")
- 콘텐츠 생성 ("이웃에게 자기 소개하는 짧은 말 써줘")
등 사용자가 원하는 답변을
실시간으로 제공하고 있다.
현재 ChatGPT는 출시 5일 만에 100만 명의 사용자를 달성할 정도로 엄청난 화제성으로
인공지능의 혁신적인 기술을 선보였으나, 앞서 말했듯이 ChatGPT가 제공하는 내용은 부정확한 경우가 종종 발생하여
안정된 상용화를 위해서는 최적화 과정이 더욱 필요할 것으로 보인다.
사용자가 명확한 디렉션을 ChatGPT에게 전달한다면 다양한 방도로 충분히 유용하게 사용할 수 있기 때문에
나 또한 종종 활용할 것 같다.
현재 ChatGPT는 무료 서비스로
누구나 이용할 수 있지만,
월 20달러 구독료로 더 빠른 응답 시간과 더 많은 양의 텍스트를 처리할 수 있는 향상된 성능 가진
ChatGPT Plus 유료 서비스를
제공할 예정이라고 한다.
아직 ChatGPT를 안 써본 사람들이 있다면 무료 서비스를 제공할 때
한 번 사용해 보길 바란다.
https://openai.com/blog/chatgpt/
ChatGPT: Optimizing Language Models for Dialogue
We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its mistakes, challenge incorrect premises, and reject inappropriate requests. ChatGPT is
openai.com