스테이블 디퓨전 프롬프트 마스터 가이드로 완벽한 AI 이미지 생성하기

효과적인 스테이블 디퓨전 프롬프트 작성 방법

스테이블 디퓨전은 최근 창작자들 사이에서 각광받고 있는 AI 기반의 이미지 생성 도구로, 이 도구를 사용하면 창작자는 자신의 상상을 현실로 구현할 수 있는 힘을 갖게 됩니다. 그러나 많은 이들이 놓치는 중요한 점이 하나 있죠. 바로 효과적인 프롬프트를 작성하는 방법입니다. 프롬프트는 AI에게 정확히 원하는 이미지를 생성하도록 지시하는 지침으로, 이는 마치 요리할 때 좋은 레시피를 따르는 것과 비슷합니다.

잘 작성된 프롬프트는 보다 나은 이미지 생성을 보장하는데, 오늘 이 글에서는 이렇게 더 나은 이미지를 생성하는 프롬프트를 작성하기 위해 필요한 기술과 팁을 다루려고 합니다. 스테이블 디퓨전을 위한 프롬프트는 피사체의 선택에서부터 스타일, 색상, 조명에 이르기까지, 세심한 부분까지 고려하여 작성해주어야 하는 만큼, 여러분이 원하는 바로 그 이미지를 얻을 수 있도록 어떻게 프롬프트를 작성해야 하는지에 대해 알아보도록 하겟습니다.

프롬프트의 힘

스테이블 디퓨전의 가장 중요한 특성 중 하나는, 단순한 텍스트에서 복잡하고 창의적인 이미지를 생성할 수 있는 능력입니다. 예를 들어, “해질 무렵의 고속도로에서 달리는 빨간 스포츠카”라는 프롬프트를 입력하면, 스테이블 디퓨전은 이 설명을 바탕으로, 이전에 존재하지 않았던 완전히 새로운 이미지를 만들어냅니다. 이 과정에서 AI는 이미지의 구성 요소뿐만 아니라 그 색상, 조명, 그리고 감성까지도 포착하여 디지털 캔버스에 구현합니다.

Red sports car running on the highway at dusk

이런 기능은 특히 맞춤 이미지를 필요로 하는 디자이너, 예술가, 마케터에게 소중한 자원이 되죠. 이렇게 스테이블 디퓨전을 활용하면, 사용자는 자신만의 독특한 비전을 정확하게 실현할 수 있으며, 이는 고유한 브랜드 이미지를 만드는 데도 중요한 역할을 합니다. 또한, 이 기술은 예술 교육에도 혁신을 가져다 줄 수 있으며, 학생들이 다양한 예술 스타일과 기법을 실험해보는 데 이상적인 도구가 될 수 있습니다. 예를 들어, 엠마 왓슨을 인상파 화가 고흐 스타일로 그려내는 것은 어떨까요?

Vincent van Gogh-style, Emma Watson in a lavender field, bold brushstrokes, rich colors, impasto texture, capturing serenity and depth, dynamic and emotive

단어와 픽셀의 상관관계만으로 이러한 이미지를 생성할 수 있습니다. 게다가 예술적인 스타일과 얼굴, 그림자 등을 정확하게 표현하고, 이런 요소들을 미학적으로 섞어 이미지를 생성하는 것이죠. 이처럼 스테이블 디퓨전은 단순한 이미지 생성 도구를 넘어서, 창의적인 표현과 디지털 예술의 새로운 가능성을 탐구하는 데 필수적인 역할을 할 수 있습니다.

프롬프트 작성의 기술

프롬프트를 작성할 때 각 구성 요소를 얼마나 세밀하게 기술하느냐가 이미지의 품질을 결정짓는 중요한 요소입니다. 예를 들어, 피사체를 구체적으로 기술하는 것은 AI에게 정확한 시각적 정보를 제공하여 원하는 결과물을 얻기 위한 첫걸음입니다. 즉, 피사체의 설명이 포괄적이고 상세할수록, 생성된 이미지는 더욱 리얼리즘과 예술성을 갖추게 되는 것이죠. 높은 품질의 구체적인 이미지를 생성하고 싶다면, 프롬프트에 다음과 같은 내용을 포함하는 것이 좋습니다.

  • 피사체 또는 주제(필수)
  • 사진, 그림 등 이미지의 종류
  • 스타일
  • 예술가
  • 웹사이트
  • 해상도
  • 색상
  • 조명
  • 추가적인 세부사항

1. 피사체

피사체 또는 주제의 가능한 한 자세하게 기술하는 것이 좋습니다. 영어로 기술해야 하는데, 구글의 번역을 이용해도 되고, ChatGPT를 사용해서 프롬프트를 생성해도 됩니다.

Young woman, pastel green dress, rustic window, reading, serene ambiance

2. 이미지 종류

이미지 종류는 어떨까요? 이미지의 종류와 스타일을 명시하는 것은 프롬프트의 방향을 정하는 데 중요합니다. 예를 들어 “디지털 페인팅”이라는 단어를 추가함으로써, AI는 기존의 사진적 요소를 넘어서 예술적 가치가 강조된 작품을 창조 할 것입니다. 다음과 같은 이미지 종류를 넣어서 테스트해보세요.

  • Digital Painting
  • Photograph
  • Oil Painting
Digital painting of a young woman, pastel green dress, rustic window, reading, serene ambiance

어떤가요? “Digital Painting”을 추가하는 것 만으로도, 사실적인 사진에서 디지털적인 화풍으로 바뀌게 됩니다.

3. 다른 항목들

다른 항목들도 추가해 볼까요? 아래와 같이 조금 더 세밀하게 설정해보겠습니다.

  • 예술가: by Stanley Artgerm Lau
  • 웹사이트: artstation
  • 해상도: 8k
  • 색상: vivid
  • 조명: cinematic lighting
  • 기타: extremely detailed, ornate

이제 위의 설정을 모두 반영해서 만든 프롬프트Tales of Digital Life라는 모델을 사용해서 이미지를 생성해보겠습니다.

Young woman, azure dress, seated by an old oak window, engrossed in a novel, Artgerm Lau inspired, Artstation quality, 8k resolution, vivid colors, cinematic lighting, extremely detailed and ornate

이렇게, 이미지에 예술가의 스타일, 웹사이트, 해상도, 색상, 조명 등을 추가하는 것은 AI에게 더욱 구체적인 창작 방향을 제시합니다. 예술가의 특정 스타일을 명시하면, AI는 그 스타일을 모방하여 특유의 느낌을 이미지에 반영하게 됩니다. 특히, 해상도, 색상, 조명은 이미지의 시각적 품질을 극대화하여, 보는 이의 시각적 경험을 풍부하게 만듭니다.

하지만 스테이블 디퓨전은 모델에 따라서도 조금은 다른 특성을 보입니다. 만약 위의 프롬프트를 사용하면서 DreamShaper라는 모델을 사용한다면, 조금 더 디지털 이미지에 가까운 이미지를 생성하게 됩니다.

DreamShaper는 디지털 이미지에 강한 모델이기 때문이죠. 때문에 Digital painting 스타일의 이미지를 생성하고 싶다면 DreamShaper 모델을 사용하는 것이 더 나은 선택이 될 수 있습니다. 이처럼 모델에 따라 어떤 이미지를 더 잘 표현하는지가 달라지는 만큼, 스테이블 디퓨전의 모델에 대해서는 자세히 알아둘 필요가 있습니다.

이렇게 각 요소에 대한 상세한 설명과 모델은 프롬프트가 실제로 이미지를 생성할 때 중요한 역할을 하며, AI가 사용자의 의도에 맞는 절묘한 이미지를 생성하도록 돕습니다.

프롬프트 최적화 전략

프롬프트를 작성하는 과정에서 정밀하고 구체적인 설명의 중요성을 간과해서는 안 됩니다. 피사체에 대한 자세한 설명은 AI가 정확한 이미지를 생성하는 데 결정적인 역할을 하기 때문이죠. 예를 들어, “젊은 여성이 서점 안에서 고전 소설을 읽고 있으며, 주변에는 옛날 목재 서가가 가득 차 있습니다”라는 설명은 AI에게 매우 구체적인 시각적 컨텍스트를 제공합니다.

가중치를 조절하는 기법을 활용하여 특정 요소를 더욱 강조할 수도 있습니다. 예를 들어, 이미지에서 색상의 강조를 원한다면 “(vivid colors)”처럼 괄호를 사용하여 이를 표현할 수 있는 것이죠. 이런 세심한 조절은 이미지의 세부적인 특성을 더욱 부각시키는 데 도움을 줍니다.

또한, 프롬프트 작성 시, 다양한 스타일과 요소를 실험적으로 결합해 보는 것도 중요합니다. 예술가의 이름이나 특정 스타일을 결합함으로써, AI는 그 영향을 받아 독창적인 결과물을 생성할 수 있습니다. 하지만, 예술가의 이름을 사용할 때는 그 효과가 매우 강력하기 때문에 신중해야 합니다. 이런 과정을 통해 사용자는 자신만의 독특한 시각적 언어를 개발하고, AI 이미지 생성의 가능성을 더욱 확장할 수 있습니다. 다음은 좋은 프롬프트를 만들기 위한 몇 가지 팁입니다:

  • 피사체에 대한 설명은 가능한 자세하고 구체적으로 기술하기
  • 가중치를 높일 때는 괄호 사용하기
  • 이미지의 종류와 예술가의 일관성 유지하기
  • 예술가의 이름은 이미지의 스타일에 매우 강한 영향을 미치는 만큼 신중하게 사용하기
  • 여러가지 스타일을 섞어가며 테스트하기
  • 다양한 인공지능 이미지 공유사이트에서 마음에 드는 이미지를 찾아보고, 프롬프트 연구하기
(8k, best quality, masterpiece:1.2),(best quality:1.0), (ultra highres:1.0), watercolor, a beautiful woman, shoulder, hair ribbons, by agnes cecile, half body portrait, extremely luminous bright design, pastel colors, (ink:1.3), autumn lights

이미지의 다양성을 높이는 키워드들

AI를 활용한 이미지 창작에서 스타일과 조명의 올바른 선택은 이미지에 생동감과 깊이를 부여하는 결정적 요소입니다. 예를 들어, Pop-art 스타일은 생생한 색상과 높은 대비를 통해 독특하고 인상적인 비주얼을 창출하며, 이는 시각적으로 강렬한 메시지를 전달하는 데 매우 효과적입니다. 반면, Hyperrealistic 스타일은 해상도와 세부 표현을 극대화하여 사진처럼 리얼리티를 추구합니다, 이는 특히 사람이나 자연의 정밀한 묘사가 필요할 때 유용하죠.

조명 역시 이미지의 분위기를 크게 좌우하는 요소입니다. Volumetric lighting은 공간에 입체감을 추가하고, Crepuscular rays는 특정 장면에 신비로움이나 영적인 느낌을 부여할 수 있습니다. 이와 같이 조명을 조절함으로써, AI는 더욱 복잡하고 아름다운 이미지를 생성할 수 있으며, 이는 사용자에게 강한 인상을 남길 수 있습니다.

이런 스타일과 조명의 결합은 AI 이미지 생성의 가능성을 무한하게 확장하며, 창작자는 자신의 창의적인 비전을 현실화할 수 있는 무기가 됩니다.

주요 키워드 목록

1. 이미지 종류
  • Portrait: 얼굴이나 상반신을 중심으로 한 인물 사진이나 그림
  • Digital Painting: 디지털 도구를 사용해 만든 예술적인 이미지
  • Concept Art: 영화, 비디오 게임, 애니메이션 등에서 아이디어를 시각화하기 위해 사용되는 예술적 설계 도안
  • Ultra Realistic Illustration: 현실과 거의 구별할 수 없을 정도로 상세하고 사실적인 일러스트레이션
  • Underwater Portrait: 수중에서 촬영된 인물 사진, 특히 머리카락이 물속에서 떠 있는 모습을 포함해 신비로운 분위기를 연출
  • Underwater Steampunk: 스팀펑크 스타일의 요소를 포함하여 물속 세계를 표현한 이미지
  • Landscape: 자연 풍경이나 도시 풍경을 포착한 사진이나 그림
  • Abstract Art: 형태나 구체적인 대상을 표현하지 않고 색상, 형태, 선을 사용해 감정이나 개념을 표현하는 예술 작품
  • Still Life: 정물화로 일상의 사물을 배열해 그린 그림이나 사진
  • Surrealism: 초현실주의로 현실과는 동떨어진, 꿈이나 상상의 세계를 표현한 예술 작품
  • Hair floating: 수중 포트레이트에서 많이 사용되는 표현으로, 물속에서 머리카락이 자연스럽게 떠다니는 모습
Underwater digital painting of a young woman, hair floating, lovely, happy, 8k, extremely detailed, ornate, cinematic lighting.
2. 스타일
  • Hyperrealistic: 해상도가 높아지고, 더 정교한 세부 표현 연출
  • Pop Art: 팝아트 스타일
  • Post-Impressionism: 후기 인상주의
  • Cubism: 큐비즘
  • Surrealism: 초현실주의
  • Impressionism: 인상주의
  • High Renaissance: 르네상스 전성기
  • Baroque: 바로크
  • Surrealism: 초현실주의
  • Abstract Expressionism: 추상 표현주의
  • Symbolism: 상징주의
  • Art Nouveau: 아르누보
  • Fauvism: 야수주의
  • Modernism: 모더니즘
  • Surrealism: 초현실주의
  • Magical Realism: 마법적 리얼리즘
  • Abstract Art: 추상 예술
  • American Modernism: 미국 모더니즘
  • Expressionism: 표현주의
  • Impressionism: 인상주의

[생성 이미지]

Art Nouveau street, capturing the romantic ambiance of the era. Sunlight casts enchanting shadows on the winding alleys as they don elegant attire and hats, while the photo exudes a retro charm with intricate details reminiscent of a bygone era.
3. 예술가
  • Vincent van Gogh: 후기 인상주의
  • Pablo Picasso: 큐비즘, 초현실주의
  • Claude Monet: 인상주의
  • Leonardo da Vinci: 르네상스 전성기
  • Michelangelo Buonarroti: 르네상스 전성기
  • Rembrandt van Rijn: 네덜란드 황금시대, 바로크
  • Johannes Vermeer: 네덜란드 황금시대
  • Salvador Dali: 초현실주의
  • Jackson Pollock: 추상 표현주의
  • Andy Warhol: 팝 아트
  • Gustav Klimt: 상징주의, 아르누보
  • Henri Matisse: 야수주의, 모더니즘
  • Frida Kahlo: 초현실주의, 마법적 리얼리즘
  • Wassily Kandinsky: 추상 예술
  • Georgia O’Keeffe: 미국 모더니즘
  • Edvard Munch: 상징주의, 표현주의
  • Mark Rothko: 추상 표현주의
  • Edgar Degas: 인상주의
  • Peter Paul Rubens: 바로크
  • Caravaggio: 바로크
A young woman adorned with flower motifs in a graphic inspired by the style of Alphonse Mucha. Intricate linework and decorative elements bring the artwork to life, capturing the elegance and grace of the Art Nouveau era
4. 웹사이트

이미지 공유 사이트 별로 독특한 스타일이 있어 스타일을 지정하는 데 유용합니다.

  • Pixiv: 일본 애니 스타일
  • Pixabay: 상업적 사진 판매 사이트
  • Artstation: 현대 일러스트레이션, 판타지
  • Flickr: 사진 애호가들과 전문가들이 고품질의 사진을 공유
  • Pinterest: 다양한 아이디어와 영감을 공유하는 사이트
  • Instagram: 이미지와 비디오를 중심으로 한 소셜 미디어 플랫폼
  • Imgur: 주로 짧은 형태의 엔터테인먼트 이미지나 짤방 중심의 플랫폼
  • 500px: 전문 사진작가들을 위한 플랫폼으로, 높은 품질의 사진 작품을 공유하고 판매하는 사이트
  • DeviantArt: 예술가들과 디자이너들이 자신의 창작물을 공유하고 판매할 수 있는 사이트
  • Unsplash: 고품질의 무료 스톡 사진을 제공하는 사이트
Fantasy digital painting of a young sorceress with a shimmering silver robe, studying ancient spells beside a crystal window overlooking a mystical forest, inspired by Stanley Artgerm Lau, showcased on Artstation, rendered in 8k, exquisitely detailed, with ornate magical artifacts, cinematic lighting, and vivid colors.
5. 해상도

높은 해상도 관련 키워드를 입력하면 이미지의 품질이 좋아지는 경향이 있습니다.

  • unreal engine: 매우 사실적이고, 섬세한 3D 그래픽
  • sharp focus: 해상도가 향상됨
  • 8k: 해상도가 증가하며, 이미지가 좀더 카메라로 찍은듯 사실적이 됨
  • vray: 물건이나, 풍경, 건물등에 아주 효과적인 3D 랜더링
  • High Resolution: 이미지와 비디오의 세밀한 디테일을 향상시키는 높은 해상도
  • 4K UHD: 초고해상도로 이미지와 비디오의 선명도 극대화
  • HDR(High Dynamic Range): 색상과 명암의 범위를 넓혀 더욱 실제 같은 이미지 제공
  • Ray Tracing: 광원 추적 기술을 사용하여 사실적인 이미지 및 비디오 렌더링
  • H.265(HEVC): 고해상도 비디오를 효율적으로 압축하고 전송하는 코덱
  • Super Resolution: 인공지능을 사용하여 저해상도 이미지를 고해상도로 변환
  • Cinema 4D: 고급 3D 모델링, 애니메이션 및 렌더링 기능을 제공하는 소프트웨어
  • Maya: 복잡한 3D 모델링 및 애니메이션을 위한 전문가용 소프트웨어
  • Digital Zoom: 디지털 확대를 통해 이미지의 일부를 확대하여 해상도를 향상
  • Anti-aliasing: 이미지에서 계단 현상을 줄이고 부드러운 가장자리를 생성하는 기술
Ultra-realistic 3D rendering of a seasoned explorer in a detailed, ancient library using Unreal Engine, rendered in 8K, using V-Ray for intricate textures on books and woodwork. The scene showcases HDR for rich contrasts, Ray Tracing for lifelike lighting, and high-resolution details like ornate carvings and fabric patterns, presented in cinematic style, vivid and sharp focus.
6. 색상
  • iridescent gold: 빛의 각도에 따라 변하는 효과를 가진 금색
  • Iridescent: 빛의 각도에 따라 색상이 변하는 무지개 같은 효과를 가진 색
  • Vivid: 매우 밝고 선명한 색상으로 원색에 가까운 강렬한 인상을 줌
  • vintage: 빈티지한 스타일의 색상
  • Pastel: 부드럽고 희미한 색조의 연한 색상
  • Neon: 매우 밝고 형광색의 강렬한 색상
  • Matte: 광택이 없고 무광의 표면을 가진 색상
  • Saturated: 색상이 깊고 진하게 표현되는, 높은 채도의 색
  • Earthy: 자연에서 찾을 수 있는 흙, 진흙, 돌 등을 연상시키는 색상
  • Metallic: 금속 같은 광택을 지닌 색상
  • Opaque: 불투명한 색상으로, 빛을 통과시키지 않는 강렬한 커버를 제공
  • Translucent: 반투명한 색상으로, 빛을 일부 통과시키면서 부드러운 느낌을 줌
Fantasy portrait of a mage with an iridescent gold cloak and translucent wings, reading ancient scripts in a neon-lit, vintage library. The image, inspired by Stanley Artgerm Lau and showcased on Artstation, features an 8k resolution with extremely detailed and ornate elements. The scene is enriched with vivid, saturated colors and matte finishes, creating a dramatic contrast with earthy, metallic textures under cinematic lighting.
7. 조명
  • Volumetric Lighting: 공간을 통과하는 빛의 흐름을 시각화하여 풍부하고 입체적인 조명 효과를 나타냄
  • Rim Lighting: 피사체의 윤곽에 조명을 비추어 윤곽이 도드라지게 하는 조명 기법
  • Back Light: 피사체 뒤에서 조명을 비추어 역광 효과를 만드는 기법으로, 피사체의 형태와 질감을 강조함
  • Crepuscular Rays: 구름이나 다른 물체를 통해 빛이 쏟아져 내리는 듯한 시각적 효과로, 종종 ‘신의 빛’이라고도 불림
  • Key Light: 주 조명. 씬의 가장 중요한 조명으로, 피사체의 주된 형태와 질감을 드러냄
  • Fill Light: 보조 조명으로, 키 라이트로 인해 발생하는 그림자를 완화하는 데 사용됨
  • Ambient Light: 주변 조명으로, 씬 전체의 기본 밝기를 조절하는 데 사용되며, 자연스러운 느낌을 제공함
  • Spotlight: 특정 부위를 강조하기 위해 좁은 범위에 집중적으로 비추는 조명
  • Diffused Light: 부드러운 조명으로, 빛을 퍼트려 부드럽고 균일한 조명 효과를 만듦
  • Accent Light: 강조 조명으로, 특정 피사체나 객체를 부각시키기 위해 사용되는 조명
Dramatic digital painting of a young violinist in a light blue dress, playing in an abandoned cathedral. The scene utilizes volumetric lighting to enhance the ethereal atmosphere, with rim lighting highlighting her silhouette. Back light creates a striking backlight effect, accentuating her form against the dim interior. Crepuscular rays filter through stained glass, adding a divine touch. Key light defines her features, while fill light softens shadows. Ambient light sets a subtle mood, with spotlight focusing on her and the violin. Diffused light ensures overall softness, and accent light emphasizes intricate details of her dress and the violin, all rendered in 8k by Stanley Artgerm Lau on Artstation, showcasing ornate and vivid cinematic effects.
8. 기타 세부 사항
  • dramatic: 얼굴의 감정 표현이 증가하며, 생동감이 높아짐
  • Expressive: 감정 표현이 강조된, 표정이나 몸짓에서 감정이 잘 드러남
  • Vibrant: 생동감 있고, 에너지가 넘침
  • Intense: 강렬한, 극적인 분위기를 조성함
  • Emotive: 감정적인 반응을 자극함
  • low angle shot: 하방 촬영 기법
  • Under Shot: 하방에서 위로 향하는 카메라 각도
  • Upward Angle: 상승하는 시각 효과를 제공하는 촬영 각도
  • Heroic Perspective: 주인공을 더욱 위엄 있고 강력하게 보이게 하는 촬영 기법
  • Ground Level: 지면 수준에서의 촬영, 하단 시점
  • psychedelic: 사이키델릭 조명으로 왜곡이 있는 선명한 색을 표현
  • Trippy: 환각적인, 마음을 사로잡는 비주얼
  • Kaleidoscopic: 만화경 같은 다채로운 색과 패턴
  • Distorted: 왜곡된, 일반적인 형태나 선에서 벗어난
  • Vivid Colors: 선명하고 강렬한 색상
Stunning digital portrait of a graceful dancer on a rooftop at twilight, captured from a low angle to create a heroic perspective. Her pose is expressive and dynamic, illuminated by psychedelic and trippy lighting that casts vivid, kaleidoscopic colors around her. Her intense, emotive expression captures the vibrant energy of the moment. The image, crafted by Stanley Artgerm Lau on Artstation in 8k, features dramatic, cinematic lighting and beautifully distorted elements for a surreal, enchanting effect.

프롬프트 조정

효율적인 AI 이미지 창작을 위한 반복적 접근

프롬프트를 통한 AI 이미지 생성 과정에서는 반복적인 조정과 실험이 필수적입니다. 이런 반복 접근 방식은 단순히 이미지를 생성하는 것에 그치지 않고, 생성된 이미지를 분석하며 부족한 점을 개선해 나가는 과정을 포함합니다. 초기에는 기본적인 프롬프트로 여러 이미지를 생성해보고, 이를 통해 얻은 피드백을 바탕으로 세부적인 요소를 조정하며 점차 원하는 결과에 근접할 수 있습니다.

이 과정에서 중요한 것은 효과적인 키워드의 사용과 구체적인 지시입니다. 예를 들어, 초기 이미지가 원하는 스타일이나 표현을 제대로 캡처하지 못했다면, 스타일, 조명, 해상도 등을 더욱 구체적으로 명시하는 것이 필요한 것이죠. AI는 제공된 키워드에 매우 민감하게 반응하기 때문에, 정확하고 명확한 지시가 중요합니다.

또한, GPT와 같은 AI 프롬프트 생성 도구를 활용하면, 언어의 장벽을 극복하고 더욱 정교한 프롬프트를 작성하는 데 도움이 될 수 있습니다. 이런 도구는 사용자의 기본적인 아이디어를 받아 풍부하고 다양한 표현으로 확장해 주고, 효과적인 이미지 생성에 큰 도움이 됩니다.

부정적 프롬프트 활용법

AI 이미지 생성 과정에서 부정적 프롬프트 사용은 생성된 이미지의 오류를 최소화하는데 중요한 역할을 합니다. 부정적 프롬프트는 AI에게 원하지 않는 요소를 명시적으로 배제하도록 지시하는 기술로, 예를 들어, “poorly drawn hands”“deformed”와 같은 표현은 AI가 불규칙하거나 비현실적인 신체 부위를 생성하지 않도록 방지하며, 이를 통해 이미지의 전반적인 품질과 리얼리즘을 향상시킬 수 있습니다.

이런 기법은 특히 포트폴리오, 광고 또는 예술 작품과 같이 높은 품질의 이미지가 필요한 상황에서 유용한데, AI에 의해 생성된 이미지에서 눈에 띄는 실수를 줄이는 것은 최종 결과물의 전문성을 보장하는 데 큰 도움이 됩니다. 예를 들어, “EasyNegative”와 같은 키워드는 팔이 2개 달린다는 등 해부학적으로 말이 안되는 경우를 없애는 텍스트 인버전(임베딩)으로, 이를 포함시키면, AI가 자동적으로 해부학적 오류를 방지하고, 더욱 정교한 이미지를 생성하게 됩니다. 다음은 일반적으로 사용되는 부정적 프롬프트입니다:

부정적 프롬프트를 추가한 이미지
Negative Prompt
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face, b&w, watermark EasyNegative

프롬프트의 기술적 응용

프롬프트 작성에서 키워드의 가치가 동일하지 않다는 사실을 이해하는 것은 성공적인 AI 이미지 생성에 중요한 요소입니다. 일부 키워드, 특히 유명 인물의 이름이나 예술가의 스타일은 이미지에 큰 영향을 미치는데, 이런 키워드는 자체적으로 강력한 시각적 연상을 유발하며, 그 결과로 AI는 해당 요소를 이미지에 중점적으로 반영합니다.

하지만, 프롬프트의 유연성을 극대화하기 위해서는 키워드의 가치를 조정할 수 있는 기능이 필수적입니다. AUTOMATIC1111과 같은 도구에서는 사용자가 특정 키워드의 가중치를 조절하여 그 중요도를 인위적으로 변경할 수 있습니다. 이는 프롬프트에서 특정 특성을 강조하거나 완화하는 데 사용될 수 있으며, 결과적으로 보다 정밀하고 의도에 맞는 이미지를 생성할 수 있게 해주는데, 이런 기술적 접근은 특히 복잡한 시각적 구성이 필요한 프로젝트에서 유용하며, 창작자가 원하는 정확한 분위기나 스타일을 재현하는 데 큰 도움을 줍니다.

1. 키워드 가중치 활용하기

키워드 가중치의 조정은 이미지 생성 과정에서 특정 요소의 표현력을 증감시키는 효과적인 방법입니다. 이를 통해 사용자는 특정 테마나 요소가 이미지에 더 많이 나타나거나 덜 나타나도록 섬세하게 조절할 수 있습니다. 예를 들어, 아래의 프롬프트에서 ‘dog’ 키워드의 가중치를 증가시키면, 생성되는 이미지에서 개의 수나 뚜렷함이 증가하는 경향을 보이고, 반대로 가중치를 감소시키면 개가 이미지에서 더 적게 등장하거나 더 미묘하게 표현됩니다.

dog, autumn in paris, ornate, beautiful, atmosphere, vibe, mist, smoke, fire, chimney, rain, wet, pristine, puddles, melting, dripping, snow, creek, lush, ice, bridge, forest, roses, flowers, by stanley artgerm lau, greg rutkowski, thomas kindkade, alphonse mucha, loish, norman rockwell.

2. 괄호와 대괄호로 미세 조정하기

괄호와 대괄호를 사용하여 키워드 가중치를 미세 조정하는 기법은 창작자가 이미지의 세부적인 특성을 보다 섬세하게 제어할 수 있게 합니다. 이런 기법을 활용함으로써, 키워드에 약간의 가중치를 추가하거나 감소시켜 이미지의 콘텐츠 밸런스를 조정할 수 있습니다. 예를 들어, “(dog)”를 사용하면 ‘dog’ 키워드에 약간의 가중치를 부여하여, 이미지에서 개의 표현이 살짝 강조됩니다. 반면, “[dog]”를 사용하면 개의 비중을 다소 줄여, 다른 요소가 더 돋보이게 할 수 있습니다.

  • (keyword): 1.1배
  • ((keyword)): 1.21배
  • (((keyword))): 1.33배
  • [keyword]: 0.9배
  • [[keyword]]: 0.81배
  • [[[keyword]]]: 0.73배

3. 프롬프트 스케줄링

프롬프트 스케줄링은 두 개의 키워드를 시간적으로 섞어서 사용하는 고급 기법으로, 이를 통해 생성 과정에서 한 키워드에서 다른 키워드로 점진적으로 전환되게 할 수 있습니다. 두개의 키워드를 섞어서 사용하는 이 기법은 프롬프트 스케줄링이라고 하며 문법은 아래와 같습니다.

[keyword1 : keyword2 : factor]

이 방법은 이미지 생성에서 창의적이고 독특한 결과를 얻는데 매우 유용합니다. 예를 들어, “Oil painting portrait of [Angelina Jolie: Scarlett Johansson: 0.2]” 프롬프트를 사용할 경우, 두 인물의 특징이 섞인 이미지가 생성됩니다. 단, 첫번째에 등장하는 키워드가 전체적인 분위기를 결정하기 때문에 키워드의 순서를 바꾸면 다른 결과가 나타나게 됩니다.

Oil painting portrait of [Angelina Jolie : Scarlett Johansson : 0.2]
Oil painting portrait of [Scarlett Johansson : Angelina Jolie : 0.2]

4. 페이스 블렌딩

AI를 활용하면 유명인의 얼굴을 섞어 새로운 이미지를 만들어내는 것과 같은 작업도 가능합니다. 예를 들어, 아래와 같은 프롬프트 스케줄링의 경우 두 인물의 특성을 조합함으로써, 각각의 독특한 특성이 하나의 이미지에서 어우러지게 하는 극적인 시각적 효과를 만들어냅니다.

19.jpg&source=photo realistic portrait of [Emma Watson: Natalie #IMG src=/2024/04/stable-diffusion-prompt-master-Portman: 0.6]

아래는 위 프롬프트Dreamlike Photoreal 2.0 모델을 이용하여, 조금 더 세밀한 프롬프트와 부정적 프롬프트를 추가하여 생성한 이미지입니다.

[생성 이미지]

photo realistic portrait of [Emma Watson: Natalie Portman: 0.6], exquisitely rendered, stunning artistry, grace, enigmatic aura, rim lighting, Meticulous attention, masterful brushwork
Negative Prompt
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face, b&w  watermark, EasyNegative

이런 프롬프트 기법은 각 인물의 고유한 아름다움과 특성을 유지하면서도, 새로운 특성을 창조해 내는데 탁월한 효과를 만듭니다. 이 과정에서 중요한 것은 정밀하게 조정된 프롬프트와 부정적 프롬프트의 조화입니다. 즉, 예술적인 디테일과 정교한 조명 기술을 사용하여 각 얼굴의 미묘한 뉘앙스를 포착하고, 부정적 프롬프트를 통해 원치 않는 요소를 제거함으로써, 완성도 높은 작품을 만들어 낼 수 있는 것입니다. 이런 방식으로, AI는 단순한 도구를 넘어서 창작의 핵심 파트너로서의 역할을 수행할 수 있습니다.

5. 프롬프트 길이의 이해와 활용

프롬프트의 토큰화는 AI 이미지 생성에서 중요한 요소로, 프롬프트의 길이와 품질에 직접적인 영향을 미칩니다. 스테이블 디퓨전 모델과 같은 AI 시스템은 프롬프트를 토큰으로 변환하여 처리합니다. 토큰은 단어 또는 단어 조각으로, 모델이 이해할 수 있는 숫자 형태의 데이터로 변환된 것입니다. 이 과정에서 각 단어는 하나 또는 여러 개의 토큰으로 나뉠 수 있으며, 특히 모델이 알지 못하는 단어를 만났을 때 아는 단어가 될 때가지 분할이 되어 토큰의 갯수는 더욱 늘어날 수 있습니다.

스테이블 디퓨전 모델의 경우, 토큰의 수에 제한이 있기 때문에, 긴 프롬프트는 여러 부분으로 나뉘어 처리됩니다. 각 부분은 독립적으로 처리된 후 최종 이미지 생성 전에 합쳐지는데, 이는 사용자가 아주 긴 설명을 포함하는 복잡한 이미지를 요구할 때 유용하며, 프롬프트를 효과적으로 구성함으로써 더 정확하고 세밀한 이미지 생성이 가능해집니다.

마치며

스테이블 디퓨전을 활용한 AI 이미지 생성은 무한한 창의적 가능성을 제공합니다. 이 기술을 최대한 활용하려면, 효과적인 프롬프트 작성법을 이해하는 것이 필수적죠. 프롬프트 작성에 있어 중요한 요소로는 키워드의 선정, 가중치 조정, 키워드 블렌딩, 그리고 프롬프트 길이의 최적화 등이 있습니다. 이런 기법을 통해 사용자는 AI에 더욱 정밀하고 구체적인 지시를 할 수 있으며, 이는 최종 이미지의 품질과 창의성에 직접적인 영향을 미칩니다.

특히, 키워드의 선택과 조정은 이미지에 원하는 요소를 강조하거나 배제함으로써 더욱 풍부하고 상세한 결과를 얻을 수 있게 합니다. 부정적 프롬프트를 잘 활용하면, 원치 않는 요소를 효과적으로 제거하여 이미지의 전문성을 높일 수 있고, 프롬프트 스케줄링과 키워드 블렌딩은 두 개의 다른 이미지 또는 특성을 결합하여 독특한 시각적 표현을 가능하게 합니다.

이런 프롬프트 작성 기법들은 단순히 이미지를 생성하는 도구를 넘어, 창작자의 손에 강력한 예술적 수단을 제공합니다. 스테이블 디퓨전의 활용은 예술, 광고, 디자인 등 다양한 분야에서 새로운 창의적 경계를 넓히는 데 기여하며, AI 기술이 인간의 상상력을 어떻게 확장시킬 수 있는지를 명확히 보여줍니다. 따라서, 스테이블 디퓨전을 위한 프롬프트 작성 기법은 단순한 기술적 실행을 넘어, 창의적 사고와 예술적 표현의 새로운 형태를 탐구하는 과정이라고 할 수 있습니다.

https://www.internetmap.kr/entry/Stable-diffusion-Prompt-introduction

답글 남기기