이번 포스트는 Chat-GPT에 이어 Google에서 출시한 Bard를 사용해 본 결과에 대해 리뷰해보고자 합니다.
Google Bard는 2023년 03월 21일에 공개 출시되었습니다. 초반에는 미국과 영국에서만 출시되었지만, 최근 5월 초경에 전 세계 180여 개국에 전면 공개하였는데요. 영어에 이어 한국어를 두 번째로 지원하겠다고 밝혔는데 점차 지원 언어를 늘려갈 계획이라고 합니다.
Char-GPT 출시에 따른 대항마인 것 같은데 이러한 Bard의 성능은 어떠한지, Chat-GPT와의 차이점은 무엇인지에 대해 간략하게 다뤄보도록 하겠습니다.
그전에 혹시 아직 Chat-GPT가 무엇인지 잘 모르시는 분들은 다음 포스트를 참고하면 좋을 것 같습니다.
그럼 본격적으로 시작해보도록 하겠습니다!
About Bard
Bard는 최신 대규모 언어 모델 ‘PaLM2’를 탑재한 대화형 인공지능으로 5300억 개 Parameter를 가지고 만들어졌다고 합니다. 100개가 넘는 언어를 지원하며 과학/수학 추론을 넘어 20여 개의 개발 언어로 코딩 작업도 수행할 수 있다고 합니다.
표면상으로는 LaMDA는 GPT-3와 같은 Transformer 아키텍처를 기반으로 하지만 LaMDA는 대화형 문맥에서 더욱 자연스러운 응답을 생성하기 위해 몇 가지 기술적인 개선이 이루어졌다고 합니다. 예를 들어, LaMDA는 일반적인 문맥을 넘어선 전문적인 지식을 이해하고 활용할 수 있으며 대화에서 자주 사용되는 상징적인 단어나 어구, 즉 특정한 문화나 지역에서 흔히 사용되는 언어적 요소들을 이해할 수 있습니다. 더욱이, LaMDA는 이미지, 비디오 등의 다양한 매체를 포함한 다양한 매체에서 발생한 다양한 정보를 이해하고 그 정보를 대화에 활용할 수 있다고 합니다.
내부 구조에 대해서는 구체적으로 공개되어 있진 않다고 하는데, 구체적인 내부 구조를 제외하고 표면적인 내용이 2022년도에 논문으로 발표되긴했습니다. LaMDA : Language Models for Dialog Applications라는 논문인데 그 내용이 그대로 Bard에 적용되었는지는 알 수 없지만 말이죠. 아마 아니겠죠...? ㅎㅎ
Dataset 구성
Bard 자신이 소개하기로는, Dataset은 Web에서 수집되었으며 책, 기사, 블로그/소셜 미디어 게시물, 코드 및 기타 텍스트 소스를 포함하고 있다고 합니다. 출처는 공개적으로 알려줄 수 없다고 언급하는 부분에 있어서는 Chat-GPT보다 논란을 만들지 않으려는 의지가 보였습니다. ㅎㅎ
Chat-GPT의 최대 약점은 Dataset의 최신화가 진행되지 않았다는 점이었는데요. Bard는 이에 비해 비교적 최신의 Dataset을 활용하고 있습니다.
Bard 사용 후기
우선 Chat-GPT보다 답변을 반환하는 속도가 조금은 빠르게 느껴질 수 있을 것 같습니다. Chat-GPT는 문장이 생성되는 과정(?)이 나오는 반면, Bard는 결과를 한 번에 보여주기 때문이죠. 다만 결과적으로는 비슷한 시간 동안에 반환하는 것 같긴 합니다. 출력 방식에 따른 차이이기에…ㅎ
자신에 대해 소개하라는 문장을 영어와 한국어로 질문했을 때의 답변은 다음과 같습니다.
원초적인 답변을 제시하며 두 언어 간의 답변의 차이는 크게 없습니다. 내부 구조에 대해 자세히 설명해달라고 했을 때, Bard는 상당히 짧게 답변해 줍니다. 나름 해당 부분에 대해 자세히 알려달라고 해도 다음과 같은 내용만 반복해서 말하는 경향이 있습니다.
“대규모 언어 모델이며 방대한 텍스트 및 코드 데이터로 훈련되어 있다. 내부 언어 모델로는 Google AI의 대화형 AI 또는 Chatbot이라고 하는 대규모 언어 모델 제품군인 LaMDA(Language Model for Dialogue Application)를 사용한다. 이는 Transformer Architecture를 기반으로 하고 수십 억 개의 매개 변수로 이루어져 있다.”
단호박이죠...??ㅋㅋ
Bard와 Chat-GPT의 차이점이 뭐냐고 Bard와 Chat-GPT에게 각각 질문하면 다음과 같은 답변을 반환합니다.
표면적인 내용은 비슷합니다. 다만, Bard는 Google 검색에 의해 답변을 제공하며 최신의 데이터를 반영하고 있다고 자부하더군요.
여담으로, 사실에 입각한 답변인지는 모르겠지만 각 모델이 반환한 답변 속에 GPT-3.5보다 LaMDA가 더 Parameter가 작은 것 같다는 판단을 할 수 있는 내용이 나왔었는데요. 성능과 Parameter수가 완전히 비례하는 것은 아니지만, Bard가 Chat-GPT에 비해 성능이 떨어질 수도 있다는 합리적인 의심을 뒷받침하는 근거 중 하나가 될 수도 있겠다는 생각이 갑자기 들었습니다. 하하...
본론으로 돌아와서, 이전에 Chat-GPT에게 물어보았지만 정확한 답변을 제공하지 못했던 수학 문제를 Bard에게 물어보았습니다.
역시나 이상한 답변을 내놓습니다. 다른 답안을 생성할 때 3개의 리스트를 확인해볼확인해 볼 수 있는데, 그 답안들 역시 이상한 답변들입니다. 다만, Chat-GPT에 비해 답변들을 리스트의 형태로 확인해 볼 수 있다는 점은 개인적으로 좋은 것 같다는 생각이 들었습니다. (학습 데이터를 생성할 때의 Fomat을 따라 User에게도 비슷하게 제공해 주는 점은 좋아 보이더군요.)
문장 생성 부분을 진행해보았습니다. 주제와 문장의 형식 등을 지정해 주고 생성을 요청하면 다음과 같은 답변을 내놓습니다.
요청하는 부분에 대해서는 잘 반영되고 있는 편입니다. 그러나 몇 가지 키워드만 반영되었을 뿐, 소설의 내용과 대본의 내용이 완벽하게 일치하지는 않습니다. 일치하지 않는 부분은 무시하고 요청한 이야기와 관련된 몇 가지 질문을 추가적으로 해보았습니다. 결과는 다음과 같습니다.
대화를 해보면 느끼겠지만 내용의 퀄리티는 Case By Case이고 무엇보다 대화 자체가 된다는 점은 분명한 것 같습니다.
대화 부분은 이 정도로 마무리하고 코드 생성 부분을 수행해보았습니다. 결과는 다음과 같습니다.
실제 코드 실행은 해보지 않아서 모르겠지만, 생성한 코드가 원래 원하던 방향으로 작성되진 않았습니다. 구체적인 요구 사항을 작성해야 원하는 결과를 얻을 수 있을 것으로 예상되긴 합니다. 다만, 위 질문 사항으로 보았을 때는 Chat-GPT가 Bard보다는 더 낫지 않았나 싶은 생각이 들었습니다.
Bard의 두드러진 특징은 간혹, 출처를 반환할 때가 있다는 점입니다. 실제 Code 사용에 대한 주의점을 항상 언급하고 있다. 그만큼 Chat-GPT의 논란 문제를 어느 정도 인식한 결과가 아닐까 싶습니다.
지금까지, Bard에게 몇 가지 요청만 해보았지만 전반적으로 느낀 것은 답변이 간략화되어 있다는 점이었습니다. Chat-GPT는 내용을 늘어뜨리는 경향이 있는데 Bard는 단답식으로 답변을 하려고 합니다. 해당 특징에 있어 장/단점은 있겠지만 Chat-GPT를 처음 사용했을 때와 Bard를 처음 사용했을 때의 감흥은 Chat-GPT 쪽이 더 높지 않았나 싶습니다. 실제로 성능 측면에서도 Chat-GPT가 Bard를 앞선다고 느껴졌습니다. Dataset의 최신화(?)를 제외하고는 Bard를 굳이 사용해야 하는 필요성은 없어 보였습니다.
Bard가 어떤 식으로 업데이트를 해나갈지, 업데이트로 인해 성능이 더 좋아질 지에 따라 Chat-GPT를 이길지 도태될지 결정될 것 같다는 생각이 들었습니다.
다만, Bard나 Chat-GPT 모두 사용자에게 편리함을 주는 부분에 있어서는 큰 반론은 없지 않을까 싶습니다. 실제 제 경우도 새로운 어떤 작업을 시작할 때 AI들이 반환한 답변을 Reference로 사용하고는 하기 때문이죠.ㅎ
검색 시간을 극단적으로 줄여주는 효과는 분명 있다고 생각합니다.
이렇게 이번 포스트는 여기서 마무리하도록 하겠습니다.
점점 고도화된 대화형 AI들이 여기저기서 출시되고 있는데 그들중 누가 남게 될까요...? ㅎㅎ
'Technology > Research' 카테고리의 다른 글
[AI] ChatGPT 사용 및 원리 (0) | 2023.02.10 |
---|---|
[AI] Multi Modal에 대한 정의 및 예시 (0) | 2023.01.10 |
[Sound Spleeter] Deep Learning 기반 악기 소리 분리 기술 (0) | 2023.01.05 |
댓글