대규모 언어 모델(Large Language Models, LLMs)의 등장은 요리 예술을 포함한 여러 창의적 분야에서 가능성을 보여주었다. 그러나 많은 LLM은 특히 특정 문화적 요구를 충족하도록 레시피를 각색하라는 과제를 받았을 때, 원하는 수준의 요리 창의성을 제공하는 데 여전히 어려움을 겪는다. 본 연구는 한 음식 문화의 요소를 다른 음식에 적용하는 ‘요리 전이(cuisine transfer)’를 중심으로 LLM의 요리 창의성을 평가하고자 한다. 우리는 다양한 LLM을 사용하여 문화적으로 각색된 레시피를 생성하고 평가하며, 그 평가 결과를 LLM 및 인간의 판단과 비교한다. 또한 우리는 요리 전이 과제에서 LLM의 레시피 생성 능력을 평가하기 위해 ASH(authenticity, sensitivity, harmony) 벤치마크를 도입하여, 요리 분야에서의 문화적 정확성과 창의성을 측정한다. 연구 결과는 요리 분야에서 LLM의 생성 및 평가 역량 모두에 대한 핵심적 통찰을 제공하며, 레시피 창조에서 문화적 뉘앙스를 이해하고 적용하는 데 있어의 강점과 한계를 부각한다. 본 프로젝트에서 사용한 코드와 데이터셋은 \\url{http://github.com/dmis-lab/CulinaryASH}에서 공개적으로 제공될 예정이다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.