앤트로픽 연구팀, 5개 대형 언어 모델서 확인
아첨 답변 가능성 상존·사용자 판단 혼란 초래
AI 기술 기업 관련 문제 해결 노력 시급 지적도
바카라 토토 사이트(AI)은 오픈AI의 대형 언어 모델 챗GPT 출시 이후 전 세계 산업 분야에서 널리 활용되고 있다. 더욱이 최근에는 정치 분야에서까지 바카라 토토 사이트의 활용이 본격화되는 추세를 보이고 있다.
하지만 산업 분야에서 각종 부작용을 초래하고 있는 것처럼 정치 분야에서 사용되는 바카라 토토 사이트도 문제점을 속속 드러내고 있다. 바카라 토토 사이트 챗봇이 정치적인 문제에 있어 객관성이 부족하며 좌파 편향적인 양상을 나타낸다거나 사용자의 입맛에 맞는 허위 정보를 유포해 정확한 판단을 방해한다는 지적이 나오는 것이 대표적인 예다.
◆사용자가 원하는 답변 제공…AI 부작용 점차 증가 추세
이처럼 정치 분야에서 바카라 토토 사이트 사용에 따른 부작용이 제기되고 있는 가운데 이러한 부작용은 바카라 토토 사이트 대형 언어 모델(LLM)이 진실한 결과물을 만들어내는 대신 사용자가 듣고 싶은 답변을 말하는, 즉 아첨하는 경향을 갖고 있는데 기인하고 있다는 흥미로운 연구 결과가 발표돼 주목을 받고 있다.
해외 블록체인 전문 매체 코인텔레그래프(Cointelegraph)는 미국의 생성형 바카라 토토 사이트 기업 앤트로픽(Anthropic)의 5개의 바카라 토토 사이트 대형 언어 모델을 대상으로 실시한 연구 결과를 인용해 가장 일반적인 학습 패러다임 중 하나를 기반으로 구축된 바카라 토토 사이트 대형 언어 모델은 진실을 담은 결과물을 생성하는 대신 사람들에게 그들이 듣고 싶은 것을 말하는 경향을 가지고 있다고 밝혔다.
앤트로픽 연구팀은 대형 언어 모델의 심리학에 대해 깊이 파고든 최초의 연구들 중 하나에서 인간과 바카라 토토 사이트은 둘 다 모두 적어도 일정 시간 동안은 진실된 결과물보다 이른바 아첨하는 반응을 선호한다고 언급했다.
앤트로픽 연구팀은 연구 논문에서 “구체적으로 우리는 이러한 바카라 토토 사이트 비서들이 사용자들에게 질문을 받을 때 실수를 자주 잘못 인정하고 예측 가능한 편향된 피드백을 제공하고 사용자가 저지른 오류를 모방한다는 것을 증명할 수 있다”며 “이러한 경험적 발견들의 일관성은 아첨이 실제로 ‘인간 피드백을 통한 학습 강화(RLHF)’ 모델이 훈련되는 방식의 속성일 수 있음을 시사하고 있다”고 밝혔다.
앤트로픽 연구팀은 연구 논문은 가장 강력한 바카라 토토 사이트 모델조차도 조사를 하는 기간 동안 사용자를 현혹시키는 아첨하는 언어로 프롬프트를 표현하며 바카라 토토 사이트 출력에 미묘하게 영향을 미칠 수 있었다는 사실을 확인했다.
◆현재 해결 방법 전무…AI 기술 기업 문제 해결 노력 필요
이는 아마도 프롬프트가 표현된 방식으로 인해 바카라 토토 사이트이 아첨의 명백한 사례로 보이는 사실이 아닌 거짓 대답을 ‘환각’으로 받아들이는 것으로 추측되고 있다.
환각은 바카라 토토 사이트 모델이 학습 데이터에 있는 정보에 근거하여 나타나지 않는 높은 수준의 신뢰도로 결과물을 출력 생성하는 경향을 말한다.
이러한 문제는 대형 언어 모델 연구에 그대로 스며들어 있으며 그 결과는 오픈AI의 챗GPT 및 앤트로픽(Anthropic)의 클로드(Claude)와 같은 모델 등에서도 드러나고 있다.
또한 바카라 토토 사이트의 출력에 동의하지 않는 사용자가 모델이 최소한의 프롬프트로 정답을 오답으로 변경할 때 즉각적인 아첨의 언어를 유발할 수 있는 예도 있는 것으로 드러났다.
궁극적으로 앤트로픽 연구팀은 대형 언어 모델이 훈련되는 방식 때문에 이러한 문제가 발생할 수 있다고 결론을 내렸다. 소셜 미디어 및 인터넷 포럼 게시물과 같이 다양한 정확도의 정보로 가득 찬 데이터 세트를 사용하기 때문에 정렬은 종종 ‘인간 피드백을 통한 학습 강화’라고 불리는 기술을 통해 이루어지기 때문이다.
‘인간 피드백을 통한 학습 강화’ 패러다임에서 인간은 선호도를 조정하기 위해 모델과 상호 작용한다. 예를 들어 컴퓨터가 개인적으로 식별 가능한 정보 또는 위험한 잘못된 정보와 같은 잠재적으로 유해한 산출물의 출력을 요청할 수 있는 프롬프트에 응답하는 방법을 다이얼링할 때 유용하다.
하지만 안타깝게도 앤트로픽 연구팀의 연구에서 실증적으로 보여주듯이 사용자 선호도를 조정하기 위한 목적으로 만들어진 인간과 바카라 토토 사이트 모델은 모두 적어도 무시할 수 없는 부분에서 진실한 답변보다 아첨하는 답변을 선호하는 경향이 있다.
현재까지 이 문제에 대한 해결책은 없는 것으로 보인다는 것이 연구팀의 결론이다. 따라서 연구팀은 이 작업이 ‘도움 없이 비전문가의 인적 평가를 사용하는 것을 넘어서는 훈련 방법의 개발’에 동기를 부여해야 한다고 제안했다.
학계와 전문가들은 이러한 연구 결과와 관련해 바카라 토토 사이트이 특히 정치 분야 또는 학술 분야에서 사용자가 원하는 아첨하는 답변 또는 허위 정보를 생성해 낼 경우 정확한 판단을 방해하고 혼란을 초래하는 등 산업 분야에서 드러난 바카라 토토 사이트의 부작용 이상으로 심각한 문제를 야기할 수 있을 것으로 판단하고 있다.
따라서 학계와 전문가들은 인공지능 기술 기업들이 현재와 같이 학계와 관련 단체 등의 부작용 해결 요구를 도외시하고 매출 증대를 위한 영업활동에만 매진할 것이 아니라 인공지능의 사용을 통해 발생할 수 있는 각종 문제점의 해결을 위한 기술 개발에 시급한 노력을 기울여야 할 것이라고 지적하고 있다. [뉴스바카라 토토 사이트]