주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

빅데이타 & 머신러닝/생성형 AI (ChatGPT etc)

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

Terry Cho 2023. 11. 1. 14:34

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

조대협 (http://bcho.tistory.com)

LLM모델을 기반으로 채팅 서비스등을 개발할때, 마주하는 문제중 하나가 사용자가 주제와 관련 없는 질문을 하는 경우 이를 어떻게 판별하고 필터링할 것인가이다. 예를 들어 LLM(ChatGPT등) API를 바로 연결해서 여행 사이트용 챗봇을 만들었다고 가정하자. 이때 사용자가 악의적으로 여행과 관련 없는 질문을 하더라도 LLM API로 전달된 질문은 답변이 되기 때문에 악용 될 수 있다.

예를 들어 아래 프롬프트는 챗봇에게 여행사이트 챗봇의 역할을 부여하고 컨택스트를 강제하여 주었지만 사용자가 미국 자동차 모델중 최고 모델을 질의하는 프롬프트인데, 여행 챗봇임에도 불구하고 이 질문에 대해서 답변을 한다.

You are a chatbot for a travel web site.

Context: I'm going to travel to Seoul this winter with my family. I have 2 daughters and a wife.

Question : What is the best car model in the US?

이렇게 악의적으로 서비스 주제와 관련 없는 질문을 하는 것을 방지 하는 프롬프팅 작성 방식을 DARE (Determine Appropriate REsponse)기법이라고 하는데 다음과 같은 구조를 따르면 된다.

{your role}{your mission}
{
Add context
}
Remember that you answer a question, you must check to see if it complies with your mission above. If not, you must respond, "I am not able to answer this question"
Question : {user prompt}

role과 mission을 정의해준 후에, 질문전에 mission과 관련 없는 질문의 경우에는 “답변을 할 수 없다”는 메세지를 출력하도록 가이드 하는 방식이다. 이 DARE 프롬프트를 적용해서 위의 프롬프트를 다시 개선해보면 다음과 같다.

You are a chatbot for a travel web site.
Your mission is to provide helpful queries for travelers.
Context: I'm going to travel to Seoul this winter with my family. I have 2 daughters and a wife.

Remember that you answer a question, you must check to see if it complies with your mission above. If not, you must respond, "I am not able to answer this question"

Question : What is the best car model in the US?

결과는 “I am not able to answer this question” 이 출력된다. 다시 말해서 챗봇의 역할과 관련 없는 질문에 대해서 필터링이 되는 것이다.

저작자표시 비영리 변경금지

'빅데이타 & 머신러닝 > 생성형 AI (ChatGPT etc)' 카테고리의 다른 글

ChatGPT에 텍스트 검색을 통합하는 RAG와 벡터 데이터 베이스 Pinecone #1 (0)	2023.11.09
VAE를 통해서 본 이미지 생성 모델의 원리 (0)	2023.11.03
생성형 AI ChatGPT/Bard LLM에서 프롬프팅을 이용한 공격/방어 방법 (0)	2023.11.01
LangChain에서 Vertex.AI LLM 사용하기 (0)	2023.09.13
LLM 모델과 프롬프트 작성 방법 (0)	2023.09.13

현재글주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

실리콘밸리에서 살고 있는 평범한 엔지니어 입니다 이메일-bwcho75골뱅이지메일 닷컴. 아키텍처 디자인, 머신러닝 시스템, 빅데이터 설계, DEVOPS/SRE, 애자일 방법론,쿠버네티스,마이크로서비스, ChatGPT 생성형 AI , CTO 등에 대한 기술 멘토링과 강의 진행합니다. 쓰레드 : https://www.threads.net/@byungwookcho

클라우드 컴퓨팅, 구글, google, 클라우드, 튜토리얼, 딥러닝, cloud, 소개, Tutorial, 텐서플로우, 빅데이타, 머신러닝, 강좌, tensorflow, node.js, 조대협, Machine Learning, 초보, Kubernetes, 쿠버네티스,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

조대협의 블로그

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

'빅데이타 & 머신러닝 > 생성형 AI (ChatGPT etc)' 카테고리의 다른 글

'빅데이타 & 머신러닝/생성형 AI (ChatGPT etc)'의 다른글

티스토리툴바

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

주제와 관계 없는 질문을 막기 위한 DARE 프롬프팅 기법

'빅데이타 & 머신러닝 > 생성형 AI (ChatGPT etc)' 카테고리의 다른 글

'빅데이타 & 머신러닝/생성형 AI (ChatGPT etc)'의 다른글

관련글

티스토리툴바