-
2024.12.04 미드저니취미로 midjourney 써보기 2024. 12. 4. 16:52
일단 미드저니 공부공부~!
(참고자료: 유투브 초인쌤의 미드저니 마스터하기 #5~#6)
1. midjourney 홈페이지에 공개된 사진과 prompt 명령어를 복사하여 일부 수정 후 이미지 생성
retro old comic style, romeo & juliet, mid-renaissance era, standing in front of the castle, expression aggrieved and tearful, 8k
2. 이미지2 중 여자, 남자 얼굴에 네모표시 하여 일부 이미지 수정
-> 선글라스 착용하기를 요청함
retro old comic style, romeo & juliet, mid-renaissance era, standing in front of the castle, expression aggrieved and tearful, wearing sunglasses --s 250 --v 6.1 - Variations (Region)
-> 음...수정 요청부분을 여자,남자 얼굴 부위로 한정시켰더니
1 선글라스 추가. 2 여자헤어스타일 변화. 3 남자 헤어스타일 및 턱수염 변화 정도가 나타남.
해당 결과를 보면서 fine-tuning이 생각보다 힘들것으로 예상됨.
내가 생각하는 미묘한 차이를 명령어에 잘 작성하고 반영되어야 하는데 생각보다 쉽지 않음.
결국 나중가서는 내가 포토샵까지 배워서 내가 원하는대로 마무리 수정을 하지 않을까 싶다:)
3. 1번의 이미지2 와 galaxy 사진을 합성하되 /blend를 사용하지 않고 /imagine prompt로 두이미지의 주소를 복사하여 합성하기
이미지1 이미지2 결과 -> 두사진을 합쳤다니 남자 인물이 삭제되고, 왼쪽에 기둥이 삭제됨.
대신 뒷배경에 성이 여러 모양으로 다양하게 표현되며, 여자 인물도 약간 변형되어 표현됨.
특히, 하늘 배경부분에서 galaxy가 나타남으로써 두 이미지가 합성되었다고 결과물을 생성하였으나
결과적으로는...... 내 생각에는 70점자리 아닌가 싶음.
galaxy를 잘 나타내기 위해 주요인물 1명을 삭제했으나 첫 사진의 명령어에는 romeo & juliet이 있었기 때문에 결과물에 만족감이 높지 않음. 다만, 단순히 두 그림을 합성해달라고 했기 때문일지도 모른다는 생각이 듦. 차라리 새로 명령어를 짜서 만드는게 나을수도?
4. 1번의 이미지2의 upscaled(creative)
retro old comic style, romeo & juliet, mid-renaissance era, standing in front of the castle, expression aggrieved and tearful, 8k --s 250 --v 6.1 - Upscaled (Creative)
기존 이미지 upscaled(creative) ->원본을 확대해서 보았는데도... 왜 비슷해보이지?
retro old comic style이여서 그런가;; 허허허허
**midjourney 홈페이지에 나와있는 prompt 명령어**
유투브 강의 보고 내가 따라해보고 정리함, 느낀점도 포함함:)
5. 사진 비율 설정 --ar (가로비율):(세로비율)
이때 숫자는 정수로 나타내야 함!
street snapshot, cartoon style, bright background, wanders --ar 3:1 --s 250
6. --chaos 또는 --c (10~100)
좀더 랜덤한 그림을 생성하고 싶을때 사용함. 이때 숫자가 높을수록 더 랜덤해짐.
street snapshot, cartoon style, bright background, wanders --ar 3:1 --c 50 --s 250
7. --quality 또는 --q (소수점?)
1을 기준으로 .25나 .5 등으로 표현함. 좀더 심플하고 간단하게 나타내고 싶을때 사용함.
street snapshot, cartoon style, bright background, wanders --ar 3:1 --quality .5 --s 250
8. --style raw
미학적이게 예쁜, 디테일한 기본스타일 보다는 명령어에 좀 더 충실하게 나타내고싶을때 사용함.
street snapshot, cartoon style, bright background, wanders --ar 3:1 --style raw --s 25
기본스타일 --style raw ->유투브 강의 예시로는 명령어에 icon style일때 기본스타일과 --styleraw 두개의 차이가 뚜렷함.
내가 준 명령어에서는 cartoon style임을 감안할때, 위에 심플하게 표현하는 quality와 좀더 비슷함.
기본스타일과 비교하였을 땐 좀더 cartoon style이 반영된 것처럼 느껴짐.
이 명령어는 만화/그림체 보다는 다른 쪽에 쓰는것이 더 유용할 것으로 생각됨.
유투브 강의처럼 icon과 같이 목적이 뚜렷할때 쓰는 것이 더 유용할 것 같음:)
9. --stylize 또는 --s
low stylization: prompt에 충실한 이미지 생성되지만 예술성이 떨어짐
high stylization: 예술성이 높지만 prompt 명령어에 충실하지 않을 수 있음
기본값 100, 0~1000
10. --tile
타일 버전으로 이미지 생성, 저장 후 seamless ~~에서 타일버전 사진을 이어붙이면
뭔가 연속적인 이미지가 나타남.
->이건 뭔가... 상업적인 이미지를 활용할때 쓰일 수 있을거 같음.
내가 표현하고 싶은것에는 큰 도움이 안될듯
11. --video
해당 명령어를 추가해서 이미지를 생성한 뒤 반으 추가하기에서 봉투 이모티콘을 클릭하면 다이렉트 메세지가 도착함.
위 이미지가 생성되는 비디오를 다운할 수 있음.
12. --weird 또는 --w (숫자)
chaos는 생성되는 이미지의 다양성을 증가하는 것임.
weird는 일반적인 아름다움/미적 기준을 벗어나 기발하고 독특한, 예상치못한 이미지를 얻을 수 있음.
기본값 0, 0~1000 설정가능. 숫자가 커질수록 더 독특해질수 있음.
street snapshot, cartoon style, bright background, wanders --ar 3:1 --w 500 --s 250
기본 chaos 50 weird 500 ->물론 명령어 뒤에 숫자(강도)가 다르긴 하지만 chaos와 weird가 다르게 표현되긴 함.
길 스냅촬영본에 카툰스타일이지만 chaos에서는 색감, 낮/밤, 나무, 건물이나 차 등 정말 다양하게 표현되었다면
weird에서는 도리어 색감이나 구도는 비슷해졌으나 기본과 비교했을때 뭔가 좀더 일관적으로 핑크빛의 유럽풍처럼 표현되었다. 이게 일반적인 아름다움을 벗어난 것인지는 모르겠으나 도리어 비슷한 분위기의 4컷이 나와 진부하고 지루하게 느껴졌다.
그래서 다시한번 재생성(repeat)을 요청해보았다.
weird 500 (1차) weird 500 (2차) ->아주살짝 구도가 바뀐것 같다.
1차의 너무 핑크핑크 풍의 비슷한 느낌이었다면 2차는 그래도 2번째 컷으로부터 좀더 다른 느낌을 받을 수 있었다.
결국 재생성(repeat)이라 전반적으로 모두 비슷한 느낌의 다른 사진이 생성되었다.
내가 원하는 느낌이 뭔지 명확히 알고, 명확히 표현하고, 명확히 반복/수정하는게 젤 좋지만 젤 어렵겠지:)
13. --sref (그림 주소값) ->실제 사용시 괄호는 지워야함!
참고할 이미지 스타일을 prompt 명령어가 아닌 이미지 주소를 직접 입력함.
여러개 가능 --sref (urIA) (urIB) (urIC)
각각의 이미지마다 가중치 다르게 설정 가능 -sref (urIA::2) (urIB::3) (urIC::5)
기본 명령
lovely kitty참조 이미지 결과 ->반전! 나는 basic($10/month)라서 /settings에서 remix mode를 사용할 수 없음.
즉, 엄청 긴 prompt명령어를 입력 후 이에 대한 이미지를 참고하여 재생성을 요구할때
현재 버전에서는 명령어를 직접 입력하거나 복붙하는 방법밖에 없음!
그다음 단계에서는 remix mode를 사용하여 기존 prompt 명령어를 유지한채 sref를 추가할 수 있음! 뚜둥!
->음,,,,, 결과가 참조이미지의 배경만 빌리고 그 가운데 주인공으로 lovely kitty가 반영된 것처럼 보인다.
신기하고 재밌는 것은, 기본명령에서는 kitty의 얼굴에 초점을 두었다면 참조 이미지를 반영한 결과에서는 kitty의 전신/앉아있는 자세가 반영되었다. 아마 참조이미지의 자세로부터 차용된 것 같다.
->만약 여기 결과물에서 kitty를 왕으로 만들고 싶다면(왕관씌우기?) 어떻게 해야할까?
king kitty, authority, wearing golden crown --sref (주소값)
참조 이미지 결과(1차) 결과(2차) ->ㅋㅋㅋㅋㅋ 참조이미지에서 거의 금색 왕관만 씌어진 결과물이 탄생했다.
앉아있는 구조에서 거의 얼굴위주의 구조로 바뀌었고, 근엄한(?) 권위있는(?) 듯한 느낌으로 authority를 써보았는데 이건 거의 반영이 안된거같다. 그리고 king kitty에 집중되어 배경이 약해졌으며, 약해진 배경이 언듯 보기엔 동양적인 느낌보다 서양적인 느낌이 강해진 것 같다. 와... 이건 ㅋㅋㅋㅋ 너무한거같아서 재생성을 해보았는데;; 별반 다를게 없다.
에잇.... 내가 생각하는 이미지를 명령어로 표현하는것이 겁나 어렵네:)
->가중치를 각각 넣을 경우 뚜둥!
kitty --sref (이미지1주소값)::1 (이미지2주소값)::4
이미지1 이미지2 결과 ->이미지1 : 이미지2 = 1:4 비율로 가중치를 넣었더니
전반적인 색감(colorful fluoresence)는 이미지1에서 차용된것 같고, 그림이미지(retro old comic style)은 이미지2에서 차용된것 같다. 또한 명령어인 kitty를 충실하게 반영하여 고양이가 가운데 오도록 한 것 같다.
이 기능은 내가 잘쓴다면(?) 추후 활용도가 높을 것 같다.
14. --cref (그림 주소값)
--cw (0~100): 0으로 설정할 경우 얼굴은 그대로, 옷이나 헤어스타일만 변경할 때 유용함.
100으로 설정할 경우 얼굴 뿐만 아니라 옷, 헤어스타일 모두 변경. (기본값은 100)
fashion show runway --cref (주소값)
참고할 이미지 결과 (cw 100) 결과 (cw 0) ->midjourney 홈페이지에 요정(fairy)를 검색해서 임의의 이미지를 인용하여 fashion show runway로 이미지를 생성 요청했더니
기본값 cw 100이 반영된 결과는 요정이 패션쇼를 하는 듯한 모습이 나왔다. 다만 요정의 특징 중 하나인 등에 달린 날개는 제외되었으나 주변에 나비를 통해 날개를 간접적으로 표현하였고 전반적인 보라색이 유지되었다. 그리고 모두 얼굴이 표함된 정면이 아닌 뒷모습의 패션쇼가 강조되어 나타났다.
반면, cw 0으로 옷과 헤어스타일을 변경하였을 경우 요정의 느낌은 사라지고 화려한 현실적인 패션쇼의 모습이 강조되었다. 이때 이전과의 차이점으로 얼굴이 포함된 정면의 모습이 2컷이나 나왔다. 그리고 요정의 보라색 색감은 한컷에서만 강조되었고 나머지는 패션쇼 자체에 집중되어 옷/헤어가 변경된 것을 볼 수 있다. 즉, 나비나 날개, 요정 등의 요소가 완전히 배제되고 인물의 얼굴이나 이미지만 반영된 패션쇼 이미지가 생성되었다.
캐릭터 참조 명령어와 가중치는 추후 내가 생각하는 이미지에 아주 많이 활용하지 않을까 싶다.
15. --cref와 --sref 같이 사용해보기
fashion show runway --cref (주소값) --cw 0 --sref (주소값)
cref 그림 (cw 0) sref 그림 결과 ->위에 요정과 같으 패션쇼 느낌일 줄 알았는데 sref 덕분에 요정 느낌은 사라지고 캐릭터가 요정스러운 느낌이 살짝 첨가되었다. 그리고 sref 그림의 색감이 듬뿍 담겨 주요 캐릭터에는 검정 테두리로 명확하게 표현하고 색감이 주황/노랑/초록/파랑/보라 등 알록달록 조화롭게 나타났다. 즉, 기존 캐릭터의 보라색이 담겨져 있기는 하나 전반적인 색감은 sref로 반영되었다.
->sref로부터 해당 결과를 기대(?)하지는 않았지만 내 취향이며 내맘에 드는 결과물이 나왔다. 또한 명령어도 단순하게 'fashion show runway'이지만 두가지 관점에서 4컷이 나왔다. 다양하게 표현하려면 chaos를 넣어야겠지:) 독특하고 예상에서 벗어난 사진을 원한다면 weird를 넣어봐야겠지? 해볼까?ㅋㅋㅋ
->4컷 중 하나의 그림을 선택하여 /imagine prompt (이미지 주소값) --w 500 으로 하면 아래와 같이 오류가 나네;;
->그럼 그냥 명령어를 그대로 써야겠다! cref와 sref는 위 그림(요정, 새그림)과 동일하다.
fashion show runway --cref (주소값) --cw 0 --sref (주소값) --weird 500 fashion show runway --cref (주소값) --cw 0 --sref (주소값) --chaos 70 -> weird 500: 캐릭터의 얼굴은 요정 얼굴과 비슷하며, 패션쇼와 옷이 아주 다양하게 표현되었다. 또한 색감은 sref를 기반으로 알록달록이지만 빨강/노랑 위주가 활용되어 요정의 보라색 색감이 거의 사라진 것을 볼 수 있다. 그리고 이번 4컷의 특징은 패션쇼의 구도가 더 다양하게 나타났다. 뒷모습 컷이 2컷 나타났지만 배경이나 인물의 거리감을 보았을때 거의 다르다고 느껴진다.
오오오오오 신기하다:)
-> chaos 70: sref를 충실하게 반영한 1컷과 2컷, cref를 충실하게 반영한 인물의 외모나 느낌이 두드러진다. 특히 기존 cref의 아름다움이 거의 그대로 보존된 느낌을 준다. weird는 확실히 기존 이미지 2개의 아름다움을 벗어났다면, chaos는 분명하게 기존 이미지 2개를 충실하게 반영하면서 의상이나 헤어 모두 현대적이고(명령어에 쓰진 않았지만) 색감도 조화롭게 반영되었다.
16. 전반적인 느낌
프로그램을 사용하면서 내가 생각하는 이미지/그림/결과물...이 있는가... 명확한가... 확실한가.... 이게 맞는가... 무엇일까를 계속 생각하게 된다. 공개된 자료가 많고, 여러 사진을 합치거나, 반영 비중을 바꾸거나, 일부를 수정하면서 과연 내가 생각하는 방향으로 가는게 맞는지 끊임없이 고민해야 한다. 왜냐하면 프로그램을 사용하면 사용할수록 참조하는 이미지가 많으면서 내 생각이 희석되는것도 있고, AI가 제공하는 이미지가 내가 처음에 생각한 이미지와 다르지만 좋을경우 내가 끌려갈 수 있다. 결국 무엇이 맞는(?) 답인지 모르고 방향없이 정처없이 떠돌아 다닐수도 있을거 같다.
'취미로 midjourney 써보기' 카테고리의 다른 글
[midjourney] 2024.12.12 미드저니 홈페이지 퍼오기 (0) 2024.12.12 2024.12.10 미드저니 (2) 2024.12.10 2024.12.09 미드저니 (1) 2024.12.09 2024.12.06 미드저니(1) (0) 2024.12.06 2024.12.03 미드저니 (0) 2024.12.03