오늘의 작업
배경
근처 운동사업체에서 2호점 오픈준비중 현수막을 만들어달라고 하셨다.
인간 움직임의 안정성 있는 모션 구현에 중점을 두는 곳이라서, 그 내용을 현수막에 담으려고 했다.
처음엔 사진으로 촬영하자고 할까? 하다가, 마음을 바꿔서 이번엔 AI로 생성을 해보았다.
왠지 할 수 있을 것 같아.
간단하게 적용한 순서를 적어놓는다.
작업요약
목표:
(1차) 촬영하지 않고도 특정 스타일을 추구하며 그에 상응하는 이미지 생성하기.
(2차) 동일인/동일한 스타일을 견지하며, 연결성을 가지고 특정 움직임의 시퀀스를 스틸로 구현하기. (즉 이어찍기 한 것처럼 만들기)
결과:
1차의 목표는 Gemini가 큰 무리 없이 적용함
2차의 목표는 Gemini는 어려워했고, 이런 상황을 설명하여 Perplexity를 통해 완성함 (엔진 지정 안함, gpt로 했겠지..)
접근방법:
“기획의도+출력목표+사용배경+충분한 레퍼런스”의 loop
괜찮은 코드가 나오면 중간저장하듯 거기서 멈추고, 카피하여 신규세션으로 넘기기.. 피로도 관리 중요해보임.
작업로그
제미니
gem1) “프롬프트 엔지니어링부터 네 입맛에 맞추도록 직접 하거라”
Gemini 를 사용해서는 회사에서 업무 요청하듯 기본적인 얼개를 갖춘 작업지시서와 레퍼런스 이미지를 함께 넣고 좋은 프롬프트 생성을 요청함.

그럼 이런식으로 답이 온다

작업지시서 2탄인 셈. 이걸 웹앱으로 띄워서 아래처럼 제너레이트 버튼을 눌러가며 이미지 발생.
gem2) 파인튜닝. 1장/1컷에는 강하다.
예시사진을 주고 사진 앵글값 등을 적확히 넣어가며 스타일 오류등을 함께 고침. 에디션을 더 뾰족하게 만듦.
1장일 때엔 사진이 꽤 괜찮게 나왔다.




Gemini 통해서 추출한 작업지시서 사례 (마지막 스쾃 정면 모습)
```Generate a single photorealistic, black and white image of a Teenage Male, performing a Bodyweight Squat in a perfect, sustained posture, viewed from the front.
**Image Description:**
The image should capture the teenage male holding the squat position at the lowest point, facing directly towards the camera. His thighs should be parallel to the ground, or slightly below. His back should be straight (neutral spine), chest up, and head facing forward. Knees should be tracking in line with his feet, which are approximately shoulder-width apart and can be pointing slightly outwards or straight ahead. Arms can be extended forward for balance or held in front of the chest. The image should clearly show correct squat form from a frontal perspective.
**Crucial Specifications for the Image:**
* **Subject & Pose:** The Teenage Male must exhibit anatomically correct, precise, and natural exercise form for a squat, as described above, viewed from the front. The posture should be unawkward and clearly demonstrate the targeted bodyweight movement.
* **View & Framing:** Consistent, strict front view. Full body shot, ensuring the entire figure is visible and centered.
* **Camera Angle & Perspective:** Eye-level camera angle, capturing the subject directly from the front. The overall composition should be clear and balanced.
* **Style & Aesthetics:** Black and white (monochrome) photography. The image must be highly photorealistic.
* **Clarity & Sharpness:** Extremely high clarity, sharpness, and definition. While a subtle artistic, hyper-real, or illustrative quality due to the high sharpness is acceptable, the final output must look like a photograph of a real person, not a drawing or cartoon.
* **Background:** Absolutely plain, seamless, clean, and uniform white background. The subject should be perfectly isolated with no shadows or environmental details on the background.
* **Lighting:** Bright, even, clear studio lighting, ensuring good definition from the front. The lighting should create good contrast and clearly define the subject's form.
* **No Equipment/Tools:** Strictly bodyweight exercise. No dumbbells, barbells, resistance bands, mats, benches, or any other exercise equipment should be visible in the image. The focus is on pure, unassisted human movement.
* **Focus:** The image should focus on the static, correct posture rather than implying motion.
* **Consistency (if multiple images were requested, but here for single image quality):** The subject's appearance (simple athletic attire appropriate for a teenager, consistent hairstyle, physique) should be clear and well-defined.
* **Resolution & Quality:** High resolution, print-quality output. The detail should be sufficient for a large format banner print (target: capable of being clear at 5000 pixels on the long edge, 300 DPI).
* **Negative Prompts (Equally Important):** No color, no props, no gym equipment, no distracting background elements, no text, no watermarks, no awkward or incorrect poses, no motion blur, no side view, no angled view.
**Reference Image Guidance:** The aesthetic (clarity, sharpness, subject isolation, lighting style) should be heavily inspired by the provided example image of the baseball player (Fernando Tatis Jr.), but translated to a Teenage Male performing the Bodyweight Squat from a front view, in black and white on a plain white background.```
문제라면, 자꾸 캔버스에서 호출오류가 나는 거였다. 대체로 API 키 문제였다. 간헐적이거나 몰려서 이런 반응이 나오는 걸 보면, 너무 많이 호출하는 상황일 수도 있다.

gem3) 시퀀스화의 어려움
클라이언트 회신이 왔다. 1개 운동에 대해 3개로 나누어 시퀀스 제작하는 의견이었다.
1장에 구현하든, 3장에 나누어 각각의 컷을 만들든, Gemini는 이 지점에서 헤맸다.
전혀 시퀀스로 나아가질 못했다.

퍼플렉서티
전혀 기대 안하고, 프롬프트 교정해달라거나, 아니면 검색해달라고 올린 건데… 엄청난 성능을 보여주었다(?)
Perp1) 제미니 쓰기 전에 리서치 차원에서 툴 추천 요청 → 실망..
음..

Perp2) 제미니에게서 얻은 인사이트를 중심으로 작업지시서를 매우 짧게 써서 올림.

그리고 퍼플렉서티는 내가 원하는 그림을 바로 만들어주었다. (스타일 정보는 따로 안넣음)

Perp3) perp2를 반복하며, 추론과정 안에서 좋은 지시사항을 카피하여 응용.
show thinking 참고하여 복붙.
첫 두줄은 퍼플렉서티의 문구이고, 아래 스타일 정의는 제미나이의 것이다.
그리고 정확히 내가 원하는 스타일과 내용으로 출력하였다.

Gem & Perp
젤 중요한 컷을 확보하였으므로 이제 네일링에 들어갔다. 어디까지 할 수 있을까?
G&P1) Perp가 참고용으로 찾은 일러스트와, Perp가 만든 이미지를 레퍼런스로 Gem에게 제공

G&P2) 이를 Gem에게 feeding할 작업지시서로 변경요청함



배경&목표 → 이미지 핵심 요구사항 (주요내용은 인물, 구도/시점, 스타일, 배경 및 조명, 악세서리, 강조사항) → 레퍼런스 이미지 제공 → 목표 이미지별 각각의 프롬프트 생성 → 당부사항)
G&P3) 이 지시서를 Perplexity로 평가함 → 잘 짜여진 요인분석 (재활용/응용 대상)
목표/맥락, 세부 요구사항, 레퍼런스 이미지제공, 영문, 핵심/제약사항에 대한 강조를 효과적인 이유로 지적.

G&P4) Gem’s 코드의 추론은 건드리지 않고, 이미지 프롬프팅의 이슈만 Perp에 교정요청하여 개선 (이걸 매우 잘함)

팁도 내가 원하던대로 실용적으로 돌아옴.

그리고 이를 적용한 Gemini 는 내가 원하는 그림을 뽑아냄.
여기서 어려운 점은 미드웨이일 때에 gemini가 구체적으로 지도하지 않으면 헤맨다는 점이었다.


운동화는 잡았는데 양말이 미묘하게 다른 문제가 있다. 이건 길이와 컬러를 균일하게 잡는 설정값을 넣었다. 파라미터 수정을 자연어 처리로 하는 것 뿐.. 세부설정에 대한 피로도는 여전하다. 내가 집요한 부분이 있어서 똑같이 나올 때까지 바꾸고 또 바꾸는 과정의 반복이 있다. 이걸 주의해야할듯.
즉, 직전의 사진과 비슷하게, 라는 말이 그닥 제미니에게 와닿지는 않는듯하다.
그냥 다 파람값으로 입력해주는 게 맘편하다. 완벽하게 같지는 않지만, 비슷하게 유지되도록 시퀀스를 제작..
시퀀스화 성공..!



재밌었다.. 어떻게 다뤄야할지 어느정도 감을 잡았다. 끝~
